Qualche considerazione sull'interpretazione di dati statistici - C. Rinaldelli

  • PDF

campionestatisticaGiornali, riviste, televisione e altri mezzi di comunicazione presentano - ormai quasi quotidianamente - dati, numeri, cifre o statistiche riguardanti i fenomeni più svariati e diversi attori sono ipso facto pronti a commentarle, quanto più esse siano considerate rilevanti in un determinato ambito. Qualche considerazione in merito. Una corretta interpretazione delle statistiche non può prescindere dalla conoscenza dei vari aspetti della metodologia con cui le statistiche sono state prodotte, soprattutto quando queste siano di rilevante importanza per la società, l’economia, ecc. ecc. o quando le statistiche siano destinate ad essere uno strumento di policy.

Evidenziamo uno di questi aspetti, quello campionario. Le statistiche sono spesso stimate da indagini campionarie (o a campione); il campione è il sottoinsieme della popolazione di interesse - che non può, in genere per motivi economici o organizzativi, essere intervistata/rilevata per intero – su cui è eseguita la rilevazione e calcolata la statistica di interesse. La peculiarità delle indagini campionarie risiede nel fatto che si vuole comunque ricostruire il comportamento della popolazione da cui è stato estratto il campione. In sostanza, è vero che si esegue la rilevazione su meno unità nella popolazione di interesse ma con l’intento di far valere i risultati per l’intera popolazione e quindi anche per le unità che non sono state rilevate. Ciò è fattibile se la selezione del campione - dall’intera popolazione - avviene attraverso opportuni metodi che afferiscono alla teoria dei campioni.

La natura campionaria di molte statistiche dovrebbe indurre una forte attenzione nel loro commento. Facciamo un esempio: stimiamo la percentuale di studenti che nel corso degli ultimi tre mesi è stato a teatro almeno una volta. Selezioniamo un campione di 50 studenti dai 1.000 iscritti nell’istituto scolastico di nostro interesse e stimiamo che il 20% degli studenti è stato a teatro almeno una volta. E’ evidente che, con le medesime regole probabilistiche, si sarebbero potuti estrarre tanti diversi campioni di 50 studenti dai 1.000 iscritti, con cui si sarebbero ottenute – quasi certamente- percentuali diverse, ad es. il 19%, il 22% ecc. ecc. Ciò è dovuto alla natura probabilistica della metodologia utilizzata e sta a significare che la nostra statistica – la percentuale di studenti - varia all’interno di un intervallo di valori al variare del campione selezionabile.

Questo aspetto è sicuramente di rilievo, quando le rilevazioni sono ripetute nel tempo e i risultati ottenuti – a tempi diversi - sono commentati in termini di aumento/diminuzione. Tornando all’esempio, ipotizziamo di eseguire la rilevazione nell’anno successivo sempre su un campione di studenti e di stimare che il 24% degli studenti è stato a teatro almeno una volta. Poiché 24% è maggiore di 20%, possiamo affermare che c’è stato – da un anno al successivo - un aumento degli studenti che vanno a teatro? Non immediatamente; infatti, la differenza tra i due valori – 20% e 24% - potrebbe non essere dovuta ad una reale variazione del fenomeno studiato (studenti che vanno a teatro) ma bensì imputabile esclusivamente ai meccanismi probabilistici di cui sopra. Per verificare se la variazione tra le due percentuali sia realmente imputabile a un variazione del fenomeno interessato, è possibile usare una serie di tecniche statistiche deputate a questo scopo.

Concludendo, è importante che il fruitore di statistiche sia consapevole dei vari aspetti della metodologia utilizzata per la loro costruzione; questo ovviamente comporta che il fornitore delle statistiche documenti in maniera trasparente il processo usato per ottenerle.


rinaldelliClaudia Rinaldelli

Primo ricercatore

Istat, Roma

BIBLIOGRAFIA

Castellano V., Herzel A. (1971) (a cura di F. Gori) Elementi di teoria dei campioni, Ilardi.

Cochran W.G. (1977) Sampling Techniques, 3rd ed. New York: Wiley.

Kish L. (1995) Survey sampling. New York: Wiley