Wikibooks:Elenchi generati offline

Wikibooks, manuali e libri di testo liberi.

Questa pagina serve per coordinare gli elenchi di pagine da generare offline a partire da una copia del database di it.wikibooks. Lo stesso server di download consente di prelevare aggiornamenti periodici degli archivi (detti dump) di tutti i progetti Wikimedia.

Nota per chi vuole generare degli elenchi: A volte le tabelle dei link contengono diversi errori, per cui è consigliabile ricostruirle. Le istruzioni per farlo si trovano in fondo a questa pagina.

Indice

[modifica] Esempio

Per chi volesse cimentarsi col DB, ecco qualche semplice istruzione relativa a MediaWiki 1.5.

# portarsi nella cartella maintenance di mediawiki
cd /var/www/htdocs/mediawiki/maintenance/
# scaricare l'ultimo dump
wget http://download.wikipedia.org/wikibooks/it/pages_current.xml.bz2       
# importare i dati
# questa operazione può durare un po' di tempo
bunzip2 pages_current.xml.bz2 | php importDump.php

Note:

  • Lo script di importazione importDump.php è molto lento. Si consiglia l'uso dell'applicazione Java MWDumper che è sensibilmente più veloce.
  • Alcune delle descrizioni negli elenchi che seguono sono obsolete. A partire dalla versione 1.5 di MediaWiki la tabella cur non esiste più, i dati delle voci sono distribuiti nelle tre tabelle page, revision e text.

Ecco come ottenere, con una query MySQL, il testo di una voce partendo dal titolo della stessa:

SELECT old_text FROM text
  JOIN revision ON old_id=rev_text_id
  JOIN page ON rev_page=page_id
  WHERE page_title LIKE 'Pagina_principale'
  AND page_namespace LIKE 0;

Ecco invece come ottenere i nomi (già attivi come Wikilink) delle pagine (di tutti i namespace) che rispondono ad una espressione regolare:

SELECT CONCAT("# [[{{subst:#if:{{subst:ns:", page_namespace, "}}|{{subst:ns:", page_namespace, "}}:}}", page_title, "]]") FROM page
  JOIN revision ON page_id=rev_page
  JOIN text ON rev_text_id=old_id
  WHERE old_text REGEXP "miaregex"
  ORDER BY page_title;

[modifica] Richieste

  • Se vuoi fare una richiesta scrivi qui.

[modifica] Elenchi

Gli elenchi vanno in sottopagine di questa pagina. Si dovrebbe sempre inserire la query con cui si è ottenuto l'elenco nell'intestazione della pagina, per consentire agli altri utenti:

  • di aggiornare periodicamente i dati
  • di controllare la correttezza del metodo
  • di sviluppare altri elenchi simili.

Si consiglia di eliminare man mano le pagine sistemate dagli elenchi, in modo da semplificare la collaborazione.

  1. Accentate HTML
  2. Center
  3. Copertine
  4. Discussioni anonime scadute
  5. Discussioni sole
  6. Immagini senza testo alternativo
  7. Libri
  8. Libri senza alfabetico
  9. Libri senza avanzamento
  10. Libri senza copertina
  11. Manuali template
  12. Perché
  13. Redirect orfani
  14. Tag font
  15. Tag sostituibili
  16. Titoli con due punti

[modifica] Ricostruire la tabella dei link

Per ricostruire la tabella dei link, basta usare lo script refreshLinks.php (dopo aver installato MediaWiki e aver importato il dump, chiaramente).

cd /var/www/htdocs/mediawiki/maintenance/
php refreshLinks.php

Si può riavviare lo script dopo un'interruzione con

php refreshLinks.php - - <numero>

dove <numero> è l'ultima ID segnalata dallo script prima dell'interruzione.

[modifica] Voci correlate

Strumenti personali