Algebra 1/Statistica/Statistica Descrittiva: differenze tra le versioni

Wikibooks, manuali e libri di testo liberi.
Contenuto cancellato Contenuto aggiunto
Riga 108: Riga 108:
| Si può concludere che la classe è formata per il <math>56\%</math> da femmine e per il <math>44\%</math> da maschi.
| Si può concludere che la classe è formata per il <math>56\%</math> da femmine e per il <math>44\%</math> da maschi.
|}
|}

{| style="background:white;width:95%;margin:auto;border:1px solid #EBEBEB;padding:20px 10px 20px 10px;" align=center
|-
|<b style="color: #926158">Esempio</b>: Supponiamo che i voti elencati di seguito siano quelli riportati in matematica a fine trimestre dagli alunni della tua classe: 5, 4, 6, 8, 8, 7, 7, 6, 5, 5, 6, 7.

Per poter effettuare una lettura più agevole si costruisce una tabella in cui vengono riportati sulla prima colonna i singoli valori rilevati (le modalità del carattere) in ordine crescente, nella seconda la frequenza assoluta, cioè quante volte compare quel determinato voto, nella terza la frequenza relativa e nella quarta quella percentuale (che si ottiene moltiplicando per 100 la frequenza relativa):
|-
|
{| style="border-top:1px solid black; border-bottom:1px solid black;text-align:left; background:white;" align="center" width="90%" border="0" cellspacing="0"
|-
! style="border-bottom:1px solid black;" | Voto riportato
! style="border-bottom:1px solid black;" align="center"| Frequenza assoluta
! style="border-bottom:1px solid black;" align="center"| Frequenza relativa
! style="border-bottom:1px solid black;" align="center"| Frequenza percentuale
|-
| <math>4</math>
|align="center"| <math>1</math>
|align="center"| <math>1/12={0,083}</math>
|align="center"| <math>{8,30}\%</math>
|-
| <math>5</math>
|align="center"| <math>3</math>
|align="center"| <math>3/12={0,25}</math>
|align="center"| <math>{25,00}\%</math>
|-
| <math>6</math>
|align="center"| <math>3</math>
|align="center"| <math>3/12={0,25}</math>
|align="center"| <math>{25,00}\%</math>
|-
| <math>7</math>
|align="center"| <math>3</math>
|align="center"| <math>3/12={0,25}</math>
|align="center"| <math>{25,00}\%</math>
|-
| <math>8</math>
|align="center"| <math>2</math>
|align="center"| <math>2/12={0,167}</math>
|align="center"| <math>{16,70}\%</math>
|-
| '''Totale'''
|align="center"| <math>12</math>
|align="center"| <math>12/12=1</math>
|align="center"| <math>100\%</math>
|}
|}

{| style="background:white;width:95%;margin:auto;border:1px solid #EBEBEB;padding:20px 10px 20px 10px;" align=center
|-
|<b style="color: #926158">Esempio</b>: Misurando l’altezza di un gruppo di cani di razza pastore italiano si sono ottenute le seguenti misure in cm:
|-
|
{| align="center" width="95%"
|align="center"| <math>{57,1}</math>
|align="center"| <math>{60,8}</math>
|align="center"| <math>{60,7}</math>
|align="center"| <math>{56,2}</math>
|align="center"| <math>{59,5}</math>
|align="center"| <math>{62,4}</math>
|align="center"| <math>{56,1}</math>
|align="center"| <math>{61,2}</math>
|align="center"| <math>{54,5}</math>
|align="center"| <math>{64,5}</math>
|align="center"| <math>{57,5}</math>
|align="center"| <math>{58,3}</math>
|align="center"| <math>{55,2}</math>
|-
|align="center"| <math>{58,7}</math>
|align="center"| <math>{57,2}</math>
|align="center"| <math>{56,1}</math>
|align="center"| <math>{58,9}</math>
|align="center"| <math>{57,7}</math>
|align="center"| <math>{53,2}</math>
|align="center"| <math>{59,2}</math>
|align="center"| <math>{58,9}</math>
|align="center"| <math>{54,5}</math>
|align="center"| <math>{55,3}</math>
|align="center"| <math>{62,1}</math>
|align="center"| <math>{59,0}</math>
|align="center"| <math>{58,3}</math>
|-
|align="center"| <math>{61,3}</math>
|align="center"| <math>{60,1}</math>
|align="center"| <math>{56,4}</math>
|align="center"| <math>{60,2}</math>
|align="center"| <math>{61,7}</math>
|align="center"| <math>{57,3}</math>
|align="center"| <math>{58,3}</math>
|align="center"| <math>{59,5}</math>
|align="center"| <math>{62,6}</math>
|align="center"| <math>{59,4}</math>
|align="center"| <math>{58,3}</math>
|align="center"| <math>{59,4}</math>
|align="center"| <math>{59,4}</math>
|-
|align="center"| <math>{59,3}</math>
|align="center"| <math>{57,6}</math>
|align="center"| <math>{60,0}</math>
|align="center"| <math>{60,7}</math>
|align="center"| <math>{56,7}</math>
|align="center"| <math>{61,1}</math>
|align="center"| <math>{59,8}</math>
|align="center"| <math>{55,3}</math>
|align="center"| <math>{63,9}</math>
|align="center"| <math>{58,0}</math>
|align="center"| <math>{55,2}</math>
|align="center"| <math>{54,9}</math>
|align="center"| <math>{53,8}</math>
|}
|-
| Il carattere indagato nella popolazione cani pastore italiano è di tipo quantitativo continuo; con questo tipo di dati è praticamente impossibile calcolare le frequenze se le altezze non si raggruppano in classi.

Vediamo come procedere: osservando i dati ottenuti si nota che il valore minore è <math>{53,8}</math> mentre il valore maggiore è <math>{64,7}</math>. Possiamo allora suddividere i dati in gruppi partendo da <math>[cm]{53,0}</math> fino a <math>[cm]{65,0}</math>, formando classi di ampiezza <math>1 \text{cm}</math> e ottenendo la seguente tabella:
|-
|
{| style="border-top:1px solid black; border-bottom:1px solid black;text-align:left; background:white;" align="center" width="95%" border="0" cellspacing="0"
|-
! style="border-bottom:1px solid black;" align=center | Classe (cm)
! style="border-bottom:1px solid black;" align=center | Frequenza assoluta
! style="border-bottom:1px solid black;" align=center | Frequenza percent.
! style="border-bottom:1px solid black;" align=center | Classe (cm)
! style="border-bottom:1px solid black;" align=center | Frequenza assoluta
! style="border-bottom:1px solid black;" align=center | Frequenza percent.
|-
| <math>{53,0}-{53,9}</math>
| align=center | <math>2</math>
| <math>{3,85}\%</math>
| <math>{59,0}-{59,9}</math>
| align=center | <math>9</math>
| <math>{17,31}\%</math>
|-
| <math>{54,0}-{54,9}</math>
| align=center | <math>3</math>
| <math>{5,77}\%</math>
| <math>{60,0}-{60,9}</math>
| align=center | <math>6</math>
| <math>{11,54}\%</math>
|-
| <math>{55,0}-{55,9}</math>
| align=center | <math>4</math>
| <math>{7,69}\%</math>
| <math>{61,0}-{61,9}</math>
| align=center | <math>4</math>
| <math>{7,69}\%</math>
|-
| <math>{56,0}-{56,9}</math>
| align=center | <math>5</math>
| <math>{9,61}\%</math>
| <math>{62,0}-{62,9}</math>
| align=center | <math>3</math>
| <math>{5,77}\%</math>
|-
| <math>{57,0}-{57,9}</math>
| align=center | <math>6</math>
| <math>{11,54}\%</math>
| <math>{63,0}-{63,9}</math>
| align=center | <math>1</math>
| <math>{1,92}\%</math>
|-
| <math>{58,0}-{58,9}</math>
| align=center | <math>8</math>
| <math>{15,38}\%</math>
| <math>{64,0}-{64,9}</math>
| align=center | <math>1</math>
| <math>{1,92}\%</math>
|}

|}

Riassumendo

[[File:Algebra1 stt fig001 rias.svg|center|Dalla popolazione statistica ai caratteri]]

=== Rappresentazione grafica ===

Versione delle 17:50, 13 giu 2016

Indice del libro

Indagine statistica

Il termine statistica significa scienza dello stato. Questo termine venne usato per la prima volta nel secolo per indicare lo studio dei dati utili al governo degli stati prevalentemente relativi a fenomeni di carattere demografico (nascite, morti, ecc.). Negli anni, la statistica si è estesa ai campi più disparati: fisica, psicologia, ricerca di mercato, indici di gradimento, sondaggi, meteorologia, …È nata essenzialmente con lo scopo di descrivere i fenomeni (statistica descrittiva), successivamente è divenuta uno strumento utile anche per fare previsioni (statistica inferenziale). A grandi linee si può definire come la scienza che si occupa della raccolta e dell’analisi dei dati relativi ad un certo gruppo di persone, animali o oggetti al fine di descrivere in maniera sintetica un fenomeno che li riguarda e fare eventualmente previsioni sul suo andamento futuro.

Ad esempio, la statistica cerca di rispondere a domande del tipo:

  • quanta acqua sarà necessaria in Italia fra 3 anni?
  • quanta corrente elettrica sarà necessaria per il fabbisogno nazionale fra 5 anni?
  • quale sarà il tasso di disoccupazione nazionale fra 1 anno?

Definizione: L’insieme di elementi oggetto dell’indagine statistica è detta popolazione o universo, mentre ciascun elemento della popolazione è detto unità statistica.


Sono esempi di popolazione statistica gli abitanti di una città in un certo anno, i prezzi di un determinato bene, le temperature massime registrate in una giornata in un particolare luogo, i ciclomotori circolanti in Italia, gli alunni di una scuola.

Definizione: Per ogni unità statistica si possono studiare una o più caratteristiche ed ognuna di tali caratteristiche costituisce un carattere della popolazione oggetto di indagine. I caratteri possono essere di tipo qualitativo o quantitativo. Si definisce modalità del carattere indagato ciascuno dei diversi modi in cui esso può presentarsi.


Sono esempi di carattere qualitativo il colore degli occhi, il colore dei capelli, il tipo di scuola frequentato, il gradimento di un certo programma televisivo. Le modalità di un carattere qualitativo sono espresse mediante nomi o aggettivi. I caratteri qualitativi sono a loro volta suddivisi in ordinabili, cioè può essere definita una relazione di ordine tra essi (per ogni coppia di elementi si può stabilire quale dei due è il primo e quale il secondo – es. il tipo di scuola frequentato è ordinabile a partire dalla scuola dell’infanzia fino alla laurea, il gradimento di un programma televisivo è ordinabile a partire dalla completa mancanza di gradimento fino al gradimento massimo) e non ordinabili o sconnessi (es. colore degli occhi, colore dei capelli).

Sono invece caratteri quantitativi l’età, l’altezza, il numero di auto prodotte da una fabbrica, …, ovvero le modalità di un carattere quantitativo sono espresse mediante numeri. I caratteri quantitativi possono essere di tipo discreto, quando assumono solo valori puntuali, oppure di tipo continuo, quando possono assumere tutti gli infiniti valori compresi in un determinato intervallo. Sono esempi di caratteri quantitativi discreti il numero di figli in una famiglia, i pezzi prodotti in una catena di montaggio; sono esempi di caratteri quantitativi continui l’altezza di una persona, il peso di una persona, la lunghezza di un fiume.

L’indagine statistica può riguardare l’intera popolazione (in tal caso si parla di censimento) oppure solo una sua parte (in tal caso si parla di indagine a campione). Supponiamo di voler effettuare un’indagine relativa alle persone che fumano in Italia. Il fenomeno collettivo in esame è il fumo, la popolazione di riferimento è costituita dalla popolazione italiana in età adulta, l’unità statistica è rappresentata da ogni cittadino oggetto dell’indagine, i caratteri oggetto dell’indagine possono essere “fumatore/non fumatore”, “numero di sigarette fumate”, che cosa si fuma (es. pipa, sigaro, sigaretta). Data l’elevata numerosità della popolazione di riferimento la tipologia di indagine preferibile è quella a campione.

A sua volta, l’indagine a campione può essere effettuata su un campione casuale, quando si scelgono a caso i campioni all’interno della popolazione o su un campione stratificato, quando si suddivide la popolazione in classi o strati senza specifici criteri e per ogni strato si prende a caso un campione.

Fasi di un’indagine statistica

Definizione: Dato un carattere oggetto di rilevazione, si definisce frequenza il numero delle unità statistiche su cui una sua modalità si presenta.


Affinché un’indagine statistica sia rigorosa (e quindi garantisca un’elevata affidabilità) è necessario che sia strutturata secondo le seguenti fasi:

  1. Studio del problema e impostazione dell’indagine statistica. Si individua in maniera precisa lo scopo della ricerca, il fenomeno sul quale indagare, la popolazione statistica di riferimento, le singole unità statistiche ed il carattere, o caratteri, oggetto di indagine.
  2. Rilevazione dei dati statistici. La rilevazione non è altro che la raccolta dei dati statistici riguardanti ogni elemento della popolazione e relativi al fenomeno che si vuole analizzare. La rilevazione può avvenire secondo diverse modalità:
    rilevazione diretta o globale
    viene eseguita direttamente su tutte le unità statistiche che formano la popolazione;
    rilevazione indiretta o parziale
    eseguita solo su una parte della popolazione. Si deve scegliere in tal caso un sottoinsieme della popolazione, detto campione, che deve essere rappresentativo della popolazione di riferimento, ovvero deve essere il più possibile eterogeneo rispetto alle caratteristiche della popolazione e contenere al suo interno un numero non troppo ristretto di unità.
  3. Spoglio delle schede e tabulazione. Contemporaneamente o successivamente al rilevamento, i dati raccolti vengono ordinati, suddivisi in classi omogenee e riassunti tramite tabelle dette tabelle statistiche.
  4. Rappresentazione dei dati statistici. La rappresentazione può avvenire attraverso diversi tipi di grafico:
    diagramma cartesiano
    rappresentazione nel piano cartesiano dei valori della variabile sull’asse orizzontale e delle relative frequenze sull’asse verticale;
    ideogramma
    si rappresenta un certo numero di dati con un simbolo;
    diagramma a barre o a colonne
    grafico composto da segmenti o barre (orizzontali o verticali) proporzionali alle frequenze;
    areogramma
    grafico a forma di cerchio composto da settori circolari con aree direttamente proporzionali alle frequenze;
    istogramma
    grafico composto da rettangoli aventi area proporzionale alla frequenza.
  5. Elaborazione dei dati. Con specifici algoritmi di calcolo, vengono elaborati i dati tabulati al fine di costruire opportuni indici di sintesi.
  6. Interpretazione dei risultati. Attraverso i grafici e gli indici è possibile descrivere le caratteristiche peculiari del fenomeno analizzato.

Analizziamo in dettaglio le singole fasi che seguono la raccolta dei dati.

Spoglio delle schede e tabulazione

Dopo aver raccolto i dati per ciascuna modalità del carattere o per ciascuna classe individuata si deve determinare:

  • la frequenza assoluta, cioè il numero di volte con cui si presenta una modalità del carattere indagato;
  • la frequenza relativa, cioè il rapporto tra la frequenza assoluta e il numero totale dei casi presi in esame;
  • la frequenza percentuale, cioè la frequenza relativa moltiplicata per 100.

Si compila poi una tabella di frequenza che sintetizza la raccolta dei dati, come nell’esempio seguente.

Esempio: La tabella seguente fornisce la distribuzione di frequenze assolute degli alunni di una classe rispetto al carattere sesso.
Sesso Femmine Maschi Totale
Numero di alunni 15 12 27
Per costruirla, si è operata la classificazione della popolazione degli alunni della classe rispetto ad un determinato carattere (il sesso), sono state individuate le modalità con cui questo si è manifestato (femmina, maschio) ed è stato effettuato il conteggio delle unità in corrispondenza di ciascuna modalità (frequenza assoluta). Dalle frequenze assolute si ricavano le frequenze relative: alunni su sono femmine: la frazione è di femmine sul totale degli alunni. Quindi Dall’operazione diviso otteniamo (approssimando a due cifre decimali) che è la frequenza relativa. La frazione può essere espressa in forma percentuale: equivale a dire su ed è consuetudine scriverlo in forma percentuale . Tale valore è la frequenza percentuale.

Ripetendo lo stesso procedimento per i maschi si ottiene la seguente tabella delle frequenze:

Sesso Frequenza assoluta Frequenza relativa Frequenza percentuale
Femmine
Maschi
Si può concludere che la classe è formata per il da femmine e per il da maschi.
Esempio: Supponiamo che i voti elencati di seguito siano quelli riportati in matematica a fine trimestre dagli alunni della tua classe: 5, 4, 6, 8, 8, 7, 7, 6, 5, 5, 6, 7.

Per poter effettuare una lettura più agevole si costruisce una tabella in cui vengono riportati sulla prima colonna i singoli valori rilevati (le modalità del carattere) in ordine crescente, nella seconda la frequenza assoluta, cioè quante volte compare quel determinato voto, nella terza la frequenza relativa e nella quarta quella percentuale (che si ottiene moltiplicando per 100 la frequenza relativa):

Voto riportato Frequenza assoluta Frequenza relativa Frequenza percentuale
Totale
Esempio: Misurando l’altezza di un gruppo di cani di razza pastore italiano si sono ottenute le seguenti misure in cm:
Il carattere indagato nella popolazione cani pastore italiano è di tipo quantitativo continuo; con questo tipo di dati è praticamente impossibile calcolare le frequenze se le altezze non si raggruppano in classi.

Vediamo come procedere: osservando i dati ottenuti si nota che il valore minore è mentre il valore maggiore è . Possiamo allora suddividere i dati in gruppi partendo da fino a , formando classi di ampiezza e ottenendo la seguente tabella:

Classe (cm) Frequenza assoluta Frequenza percent. Classe (cm) Frequenza assoluta Frequenza percent.

Riassumendo

Dalla popolazione statistica ai caratteri
Dalla popolazione statistica ai caratteri

Rappresentazione grafica