Wikibooks:Elenchi generati offline: differenze tra le versioni

Wikibooks, manuali e libri di testo liberi.
Contenuto cancellato Contenuto aggiunto
Lp (discussione | contributi)
→‎Varie: + Voci anonime intonse
Lp (discussione | contributi)
→‎Varie: +Pagine anonime intonse
Riga 142: Riga 142:


; [[/Voci anonime intonse]] : Ovvero, voci che sono state create da un utente anonimo (indirizzo IP) e non sono mai state modificate. Aggiornato al '''7 maggio 2006'''. --[[Utente:Lp|Lp]] [[Discussioni utente:Lp|↤]] <small>18:22, 10 mag 2006 (CEST)</small>
; [[/Voci anonime intonse]] : Ovvero, voci che sono state create da un utente anonimo (indirizzo IP) e non sono mai state modificate. Aggiornato al '''7 maggio 2006'''. --[[Utente:Lp|Lp]] [[Discussioni utente:Lp|↤]] <small>18:22, 10 mag 2006 (CEST)</small>

; [[/Pagine anonime intonse]] : Come sopra, ma nei namespace diversi da quello principale. Aggiornato al '''7 maggio 2006'''. --[[Utente:Lp|Lp]] [[Discussioni utente:Lp|↤]] <small>01:32, 11 mag 2006 (CEST)</small>


==Ricostruire la tabella dei link==
==Ricostruire la tabella dei link==

Versione delle 00:32, 11 mag 2006

Questa pagina serve per coordinare gli elenchi di pagine da generare offline a partire da una copia del database di it.wiki. Lo stesso server di download consente di prelevare aggiornamenti periodici degli archivi (detti dump) di tutti i progetti Wikimedia.

Nota per chi vuole generare degli elenchi: A volte le tabelle dei link contengono diversi errori, per cui è consigliabile ricostruirle. Le istruzioni per farlo si trovano in fondo a questa pagina.

Esempio

Per chi volesse cimentarsi col DB, ecco qualche semplice istruzione relativa a MediaWiki 1.5.

# portarsi nella cartella maintenance di mediawiki
cd /var/www/htdocs/mediawiki/maintenance/
# scaricare l'ultimo dump
wget http://download.wikipedia.org/wikipedia/it/pages_current.xml.bz2       
# importare i dati
# questa operazione dura 2.5 ore su un P3 600MHz a 512MB di RAM
bunzip2 pages_current.xml.bz2 | php importDump.php

Note:

  • Lo script di importazione importDump.php è molto lento. Si consiglia l'uso dell'applicazione Java MWDumper che è sensibilmente più veloce.
  • Alcune delle descrizioni negli elenchi che seguono sono obsolete. A partire dalla versione 1.5 di MediaWiki la tabella cur non esiste più, i dati delle voci sono distribuiti nella tre tabelle page, revision e text.

Ecco come ottenere, con una serie di query MySQL, il testo di una voce partendo dal titolo della stessa:

 # test effettuato su 20051211_pages_current.xml
 SELECT page_id FROM page WHERE page_title='Zugzwang';    # trovare l'id della voce Zugzwang
 SELECT rev_text_id FROM revision WHERE rev_page='20233'; # trovare l'ultima revisione
 SELECT old_text FROM text WHERE old_id='20893';          # ottenere il testo

Ecco invece come ottenere i nomi (già attivi come Wikilink) delle pagine che rispondono ad una espressione regolare:

SELECT CONCAT("# [[", page_title, "]]") FROM page
  JOIN revision ON page_id=rev_page
  JOIN text ON rev_text_id=old_id
  WHERE old_text REGEXP "^[Ee]spressione[_ ][Rr]egolare$"
  ORDER BY page_title;

Richieste

Vedi Wikipedia:Elenchi generati offline/Richieste.

Elenchi

Gli elenchi vanno in sottopagine di questa pagina. Si dovrebbe sempre inserire il metodo con cui si è ottenuto l'elenco nell'intestazione della pagina, per consentire agli altri utenti:

  • di aggiornare periodicamente i dati
  • di controllare la correttezza del metodo
  • di sviluppare altri elenchi simili.

Si consiglia di eliminare man mano le pagine sistemate dagli elenchi, in modo da semplificare la collaborazione.

Accessibilità

Indicazioni sull'uso di questi elenchi si trovano anche nella pagina Wikipedia:Accessibilità del contenuto.

Immagini senza testo alternativo
vedasi la sezione Wikipedia:Accessibilità del contenuto#Immagini. Dump del 11 dicembre 2005
pagine con intere righe in grassetto
questo può indicare: 1. uso esagerato del grassetto, 2. uso improprio del grassetto (''') al posto delle intestazioni (==, === o ====). Dump del 12 settembre --lucha ☮ & ♥ 01:23, Set 18, 2005 (CEST)
/Intestazioni errate
Pagine in cui la gerarchia delle intestazioni non inizia con == o con salti nella gerarchia. Attualmente (e momentaneamente) vuoto
/Tag font
pagine del namespace principale in cui viene usato il tag <font>. Dump del 12 settembre --lucha ☮ & ♥ 01:23, Set 18, 2005 (CEST)

Collegamenti esterni

/Collegamenti esterni
Raccolta di vari elenchi
/Collegamenti esterni errati
attualmente vuoto, Alfio
Diciture diverse da "Collegamenti esterni"
dump del 21/04/2005 Unriccio 22:29, Apr 24, 2005 (CEST)

Comuni

Disambigua

/Disambigue non orfane
Le pagine di disambiguazione dovrebbero essere in massima parte orfane, vedi spiegazione in testa alla lista. Dump del 6 aprile 2005 --“Ricordati di me!”
/Disambigua orfane
Questa lista serve per eliminare le disambigue dalla pagina speciale Speciale:Lonelypages. Dump del 6 aprile 2005 --“Ricordati di me!”

Discussioni

/Discussioni orfane
discussioni non affiancate da una voce (cioè da un redirect o niente del tutto)
/Discussioni utenti anonimi
discussioni che appartengono ad utenti anomini che sono state modificate l'ultima volta una certa data (tipicamente 1 mese prima di generare l'elenco).

Immagini

/Immagini senza pagina di descrizione
(presenti su it.wiki, non quelle da commons!), dump del 23/06/05 da [me] --“Ricordati…” 23:37, Lug 14, 2005 (CEST)
/immagini senza tag
dump del 23/06/05 da [1] -- Paginazero - Ø 14:40, Giu 27, 2005 (CEST)
Raggruppate per utente: /immagini senza tag/A-K - /immagini senza tag/L-R - /immagini senza tag/S-Z dump del 23/06/05 da [2]
Stemmi orfani
dump del 23/06/05 da [3]
Stemmi non scaricati dal sito che ce li concede
dump del 09/02/05
/stemmi commons
per botolatori gentili.
/Immagini_con_stesso_nome_su_commons
dump dell 11/09/2005 (it) e 16/09/2005 (commons)
/Immagini_non_categorizzate
dump del 13/12/05
/Immagini per licenza
statistiche sul numero di immagini per licenza. dump del 13/12/05
/Immagini unverified
elenco di immagini segnalate come unverified.

Immagini orfane

Interwiki

/Proposte interwiki en
Articoli grossi senza interwiki alla wikipedia inglese
dump del 09/02/05 --lukius 14:03, Mar 10, 2005 (UTC)

Link

/Link a sezioni inesistenti
/Link a template (solo inclusioni)

Redirect

/Redirect ad articoli inesistenti
lista vuota (dump del 24/04/2006)
/Link autoreferenziali
cioè link a un redirect che riporta alla stessa pagina. Dump del 24 aprile 2006 con tabella dei link ricostruita --Sbìsolo 14:50, 25 apr 2006 (CEST)[rispondi]
/Doppi redirect
Redirect che puntano ad altri redirect. Lista vuota. Dump del 24 Aprile 2006. --Sbìsolo 14:52, 25 apr 2006 (CEST)[rispondi]
/Redirect che vorrebbero puntare ad una sezione
cosa che il software non permette. Dump del 24 aprile 2006
/Voci con più redirect
Da verificare (limitato alle prime 200). Dump del 7 maggio 2006 --Lp 17:38, 10 mag 2006 (CEST)[rispondi]

Stub

Stub per categoria e grandezza
dump del 9 febbraio 2005 --lukius 09:58, Mar 10, 2005 (UTC)
/Stub non categorizzati
Ovvero articoli che hanno solo la categoria assegnata dal template Stub. Dump del 09/03/05. --lukius 15:12, Mar 20, 2005 (UTC)

Questi due vanno usati cum grano salis:

/Stub che non sono veramente stub
Ovvero stub che però sono abbastanza lunghini. (dump del 23/06/2005)
/Stub che non lo sono ma dovrebbero esserlo
Ovvero articoli troppo corti. (dump del 23/06/2005)

Categorie

/Biografie non correttamente indicizzate
TierrayLibertad chiede un elenco delle voci che sono categorizzate come [[Categoria:Biografie]] senza la parte "|Cognome, nome"
/Stub biografia non categorizzati
TierrayLibertad chiede un elenco delle pagine contenenti il tag {{stub bio}} ma non presenti in [[Categoria:Biografie]]
/Articoli brevi non aiutati
Ovvero, articoli brevi che non sono inclusi nella Categoria:da aiutare
/Articoli non categorizzati
articoli che non appartengono a nessuna categoria; attualmente vuoto.
/Categorie affollate
categorie con 400 o più elementi (valore arbitrario, modificabile)
/Categorie solitarie
categorie con 3 o meno elementi (valore arbitrario, modificabile)
/Categorie ricorsive
categorie che appartengono a sé stesse

Varie

Cioè roba che per ora non so dove mettere.

/Entities
Pagine che contengono una o più delle seguenti entity: &agrave; &egrave; &eacute; &igrave; &ograve; &ugrave;. Dump del 12/10/05. Attualmente Vuoto. --lucha ☮ & ♥ 23:33, ott 23, 2005 (CEST)
/Tag sostituibili
Pagine che contengono tag come <p>, <b>, <i>, <u>, sostituibili con le controparti in wikisintassi (e per il <u>?). Dump del 12/10/05 --lucha ☮ & ♥ 23:22, ott 21, 2005 (CEST)
/stemmi commons
Lista degli stemmi che sono stati caricati su commons e ora sono doppi (quindi da cancellare). La lista per ora è vuota, creo la pagina in modo che possa essere alimentata dal botolatore... --Civvì 14:05, Ago 24, 2005 (CEST)
/Pagine orfane
dump del 13/12/05
/Center
dump del 13/12/05, è la lista delle immagini contenti almeno un tag "center" (vedi Wikipedia:Bot/Richieste). --Paginazero - Ø 17:11, 6 gen 2006 (CET)[rispondi]
/Link_rossi_astronomia_e_astrofisica
Lista dei link rossi più frequenti in Categoria:Astronomia e Astrofisica e sottocategorie. Dump 13/12/05
/Quantaltro
Elenco di articoli che contengono l'espressione quant'altro. 13/12/05
/False sottopagine
Dump dei titoli delle voci contententi il carattere "/" al 6 aprile 2006, con la possibile "voce base" (troncata prima del /). Da pulire a mano. --Lp 22:16, 8 apr 2006 (CEST)[rispondi]
/Suffisso -asi
elenco delle voci il cui titolo finisca con il suffisso "-asi" che non compaiono nella Categoria:Enzimi (richiesta di McGonnell). Visto il numero ridotto delle voci e i tanti "falsi positivi" ho fatto solo l'elenco aggiornato al 6 aprile 2006 di tutte le voci con "asi" finale o seguito da spazio, si fa prima ad analizzarlo a mano. --Lp 16:05, 10 apr 2006 (CEST)[rispondi]
/Titoli con apostrofi
elenco delle voci con il carattere nel titolo. Da controllare che la voce principale sia quella con titolo corrispondente ma inseribile da tastiera (carattere ' ), riportata accanto, quindi rendere orfano e cancellare il redirect con il titolo sbagliato. Aggiornato al 6 aprile 2006. --Lp 21:25, 16 apr 2006 (CEST)[rispondi]
/Titoli lunghi
Elenco delle voci con lunghezza del titolo superiore a 50 caratteri. Da verificare (caso per caso o per argomento) se si tratti di titoli corretti o in contrasto con le convenzioni di nomenclatura. Aggiornato al 6 aprile 2006. --Lp 21:25, 16 apr 2006 (CEST)[rispondi]
/Voci anonime intonse
Ovvero, voci che sono state create da un utente anonimo (indirizzo IP) e non sono mai state modificate. Aggiornato al 7 maggio 2006. --Lp 18:22, 10 mag 2006 (CEST)[rispondi]
/Pagine anonime intonse
Come sopra, ma nei namespace diversi da quello principale. Aggiornato al 7 maggio 2006. --Lp 01:32, 11 mag 2006 (CEST)[rispondi]

Ricostruire la tabella dei link

Per ricostruire la tabella dei link, basta usare lo script refreshLinks.php (dopo aver installato MediaWiki e aver importato il dump, chiaramente).

cd /var/www/htdocs/mediawiki/maintenance/
php refreshLinks.php

Si può riavviare lo script dopo un'interruzione con

php refreshLinks.php - - <numero>

dove <numero> è l'ultima ID segnalata dallo script prima dell'interruzione.

Voci correlate