Statistica

E’ il ramo della matematica 
che ha per oggetto i metodi per
 
raccogliere, organizzare e analizzare un insieme di dati, 
talvolta influenzati da svariate cause.

Attenti ai tranelli:

Dietro ogni studio importante ci sono dati di qualità 
che rendono possibile l'analisi. 
E dietro ogni studio scadente... beh, continuate a leggere. 

 

La statistica fornisce validi metodi per raccogliere, correlare e analizzare dati di natura economica, politica, sociale, psicologica, biologica e fisica.

L'attività dello statistico non si limita alla mera raccolta e tabulazione dei dati, ma consiste principalmente nella loro interpretazione.

Lo sviluppo della teoria delle probabilità ha ampliato il campo d'azione delle applicazioni della statistica.

La teoria delle probabilità interviene poi ancora per verificare la verosimiglianza delle conclusioni tratte con metodi statistici, e per indicare il tipo e il numero d’informazioni necessarie all'analisi di un particolare problema.

Metodi statistici
Le "materie prime" della statistica sono i dati numerici ottenuti dalla misurazione o dal conteggio degli oggetti in analisi.

Naturalmente esistono criteri e precauzioni da seguire nella fase di raccolta dei dati, in modo che sia garantita la completezza e l'accuratezza delle informazioni che se ne possono trarre. Il primo problema che si presenta allo statistico è quali e quanti dati raccogliere.
In realtà, il problema del rilevatore, che vuole ottenere una stima accurata e completa della
popolazione, così come quello del fisico, che vuole contare il numero di collisioni al secondo tra le molecole di un gas, è quello di decidere la natura precisa di ciò che si deve contare.
In altre parole, è un problema complesso, in statistica, determinare un
campione rappresentativo di tutta la "popolazione", cioè dell'insieme sul quale deve essere svolto lo studio statistico.

Presentazione dei dati
I dati statistici raccolti devono essere ordinati, tabulati e presentati in modo da permetterne un'analisi interpretativa immediata e significativa.

I dati di una tabella di distribuzione delle frequenze possono essere rappresentati graficamente in un istogramma delle frequenze, oppure con un tratto di curva continuo.
L'istogramma consiste in una serie di rettangoli con base uguale alla misura degli intervalli e altezza proporzionale alla frequenza del relativo intervallo. Unendo i punti medi degli intervalli di un istogramma delle frequenze cumulative si ottiene una curva continua.

Valori medi
La misura significativa usata più spesso è la semplice media aritmetica, che viene simboleggiata con x, ed è data dalla somma dei singoli dati divisa per il loro numero n.

La mediana e la moda sono altre due misure dell'indice di posizione.
Per calcolare la mediana bisogna dapprima riordinare i valori x in ordine numerico; se n è dispari, essa è il valore centrale di x; se n è pari, è la media delle due x centrali. La moda invece è il valore di x che ricorre più frequentemente.

Variabilità
I dati raccolti possono mostrare la tendenza a raggrupparsi intorno a un solo valore, che in genere coincide con il valore medio, oppure possono essere "sparpagliati" su tutto l'intervallo dei valori possibili.

L'indice di variabilità di una distribuzione fornisce allora una indicazione sul "grado di sparpagliamento", o sull'entità con la quale i dati, o una frazione di essi, si discostano dal valore medio. Una misura della variabilità consiste nella valutazione della differenza tra due dati percentili, solitamente il 25° e il 75°.
La
deviazione standard è una conveniente misura della variabilità delle differenze percentili. Se la deviazione standard è piccola, le misure sono tutte ben raggruppate intorno al valore medio; se invece è grande, significa che le misure sono tutte sparpagliate.

Correlazione
Quando due fenomeni di natura fisica, biologica o sociale subiscono delle variazioni proporzionali e simultanee a causa di fattori esterni identici, si dice che i due fenomeni sono positivamente correlati; se uno dei due aumenta nella stessa proporzione in cui l'altro diminuisce, i due fenomeni si dicono negativamente correlati.

Il grado di correlazione si valuta calcolando un coefficiente di correlazione ai dati dei due fenomeni. A una correlazione positiva perfetta tra le due variabili corrisponde un coefficiente +1; a una correlazione negativa perfetta corrisponde il coefficiente -1; mentre una totale assenza di correlazione è rappresentata dal coefficiente 0.

Modelli matematici
Un modello matematico è un'idealizzazione matematica di un fenomeno fisico, biologico o sociale, che si traduce in un sistema, una proposizione, una formula o un'equazione matematica.

Così, un dado ideale, perfettamente equilibrato, che possa essere lanciato in modo assolutamente casuale, rappresenta un modello matematico per un dado fisico reale. La probabilità che in un numero n di lanci di un dado matematico il numero 6 esca k volte è data dal numero di combinazioni di n oggetti presi k alla volta. Si può allora mettere alla prova la "bontà" di un dado reale lanciandolo più volte e confrontando i risultati sperimentali con quelli del modello di dado ideale.

Teoria delle probabilità
Ramo della matematica che si occupa di misurare o determinare quantitativamente la probabilità che un evento o un esperimento abbia un certo risultato.

La teoria delle probabilità si basa sullo studio delle permutazioni e combinazioni, e costituisce il fondamento della statistica.
Nei problemi più semplici che si studiano nell'ambito di questa teoria si chiede di determinare la probabilità che si ottenga un certo risultato, in un evento che contempli un numero finito di altre possibili soluzioni.
Se il numero di risultati possibili è
n, e f il numero di risultati favorevoli, la probabilità che si abbia un esito favorevole è data da f/n.
Problemi più complicati sono quelli in cui i singoli eventi possibili non hanno uguali probabilità.

 

Spesso si dice che è possibile “mentire con le statistiche”. Io dico invece che alla base degli errori statistici più grossolani ci sono le bugie raccontate dai dati. In molti casi l'analisi statistica è giusta, ma i dati su cui si basano i calcoli sono falsi o inadeguati. Ecco alcuni esempi comuni di come “se entra spazzatura esce spazzatura”.

Selezione Si racconta che Pauline Kael, storica critica cinematografica del New Yorker, commentò cosi la rielezione di Richard Nixon: “Nixon non può aver vinto, non conosco nessuno che l'ha votato”. Molto probabilmente la citazione è falsa, ma è un perfetto esempio di come un campione scelto male (in questo caso, gli amici progressisti della Kael) possa offrire un quadro fuorviantc di un bacino più allargato (gli elettori statunitensi).

E introduce la domanda che dovremmo sempre farci: come abbiamo scelto il campione o i campioni che stiamo analizzando? Se tutti quelli che compongono la popolazione oggetto dell'analisi non hanno la stessa possibilità di finire nel campione, i risultati forniti dal campione saranno sempre discutibili.

Un rito delle campagne presidenziali statunitensi è lo Straw Poll dell’Iowa, in cui i candidati alle primarie repubblicane si presentano nella cittadina di Ames nell'agosto dell'anno precedente alle presidenziali per attirare gli elettori, che pagano trenta dollari per partecipare a questo sondaggio sulle primarie. Lo Straw Poll dell'Iowa non ci dice molto su chi sarà il candidato repubblicano alle presidenziali (ha anticipato solo tre delle ultime cinque nomination repubblicane). Perché? Perché gli abitanti dell'Iowa che pagano trenta dollari allo Straw Poll sono diversi dagli altri cittadini dello stato che votano repubblicano. E i repubblicani dell'Iowa, a loro volta, sono diversi dagli elettori repubblicani nel resto del paese.

La distorsione dovuta alla selezione (selection bias) può manifestarsi in molti altri modi. Un sondaggio sui consumatori in un aeroporto sarà influenzato dal fatto che chi viaggia in aereo molto probabilmente è più ricco della media. Un sondaggio in una stazione di servizio sull'autostrada avrà il problema opposto. Entrambi i sondaggi saranno influenzati dal fatto che una persona disposta a rispondere a un questionario è probabilmente molto diversa da un'altra che preferisce non essere disturbata. Se chiedete a cento persone in un luogo pubblico di sottoporsi a un breve questionario e sessanta accettano di rispondere, è probabile che le sessanta persone siano significativamente diverse dalle quaranta che non vi hanno degnato di uno sguardo.

Pubblicazione I risultati positivi hanno più probabilità di essere pubblicati di quelli negativi, che possono compromettere un'analisi.

Immaginiamo di avere appena concluso un rigoroso studio longitudinale in cui abbiamo stabilito che giocare ai videogiochi non aiuta a prevenire il cancro al colon. Abbiamo seguito un campione rappresentativo di centomila statunitensi per vent'anni: l'incidenza del cancro al colon nei soggetti che giocano ai videogiochi è più o meno la stessa rispetto a quella di chi non gioca. Diamo per assodato che la nostra metodologia sia inappuntabile.

Quale prestigiosa rivista medica pubblicherà i risultati della nostra ricerca? Nessuna, per due motivi. Primo, non ci sono solidi motivi scientifici per ritenere che giocare ai videogiochi abbia un impatto sul cancro al colon, perciò non si capisce perché lo studio sia stato fatto. Secondo, il fatto che qualcosa non aiuti a prevenire il cancro non è una scoperta particolarmente interessante. In fin dei conti la maggior parte delle cose non aiuta a prevenire il cancro. Le evidenze negative non sono molto seducenti, in medicina e in altri campi.

La conseguenza è che si tende a distorcere la ricerca che vediamo (o che non vediamo). Supponiamo che un altro ricercatore faccia uno studio longitudinale diverso e scopra che la gente che passa un sacco di tempo a giocare ai videogiochi è effettivamente meno soggetta al cancro al colon. Questo sì che è interessante. È esattamente il tipo di scoperta che cattura l'attenzione delle riviste di medicina, della stampa popolare, dei blogger e delle aziende di videogiochi (che metterebbero sui loro prodotti una bella etichetta per spiegare che i videogiochi fanno bene alla salute). Nel giro di qualche tempo le mamme iperprotettìve di tutto il mondo comincerebbero a “proteggere” i figli dal cancro strappandogli i libri dalle mani e costringendoli a giocare ai videogiochi.

Ovviamente, un concetto ricorrente in statistica è che le cose insolite ogni tanto succedono, per una mera questione di probabilità. Su cento studi è probabile che ce ne sia uno che dà risultati totalmente assurdi: per esempio, una correlazione statistica tra i videogiochi e l'incidenza del cancro al colon. Il problema è che i 99 studi che non rilevano alcun collegamento tra i videogiochi e il cancro al colon non saranno pubblicati perché non sono interessanti. L'unico che evidenzia un collegamento statistico, invece, sarà pubblicato e avrà grande risonanza.

Questa distorsione non nasce dagli studi in sé ma dalla parzialità delle informazioni che arrivano al pubblico. Consultando la letteratura scientifica sui videogiochi e il cancro si troverebbe un solo studio, e quell'unico studio dice che giocare ai videogiochi aiuta a prevenire il cancro. In realtà, 99 studi su 100 non hanno evidenziato alcun collegamento.

Ricordo La memoria è affascinante, anche se non sempre è una fonte affidabile di dati. Il nostro impulso naturale è quello di leggere il presente come una logica conseguenza di quello che è successo nel passato. Il problema è che i nostri ricordi si rivelano “sistematicamente fragili” quando proviamo a spiegare un esito particolarmente positivo o negativo nel presente.

Prendiamo per esempio uno studio sul rapporto tra la dieta e il cancro. Nel 1993 un ricercatore di Harvard ha compilato un data set (una raccolta di dati su soggetti diversi o sullo stesso soggetto in tempi diversi) dall'osservazione di due gruppi di donne della stessa età: il primo gruppo era composto da donne con un tumore al seno, il secondo da volontarie a cui non era stata diagnosticata la malattia. Le partecipanti di entrambi i gruppi erano state interrogate sulle loro precedenti abitudini alimentari. I risultati erano chiari: in percentuali significativamente più alte, le donne malate di cancro avevano seguito diete ricche di grassi quando erano più giovani.

In realtà, però, lo studio non voleva analizzare come la dieta incide sulla probabilità di ammalarsi di cancro. Il vero obiettivo era verificare come la consapevolezza di avere un tumore influenza i ricordi delle donne sulle loro abitudini alimentari passate. Tutte le donne dello studio si erano già sottoposte a un test sull'alimentazione anni prima che ad alcune di loro fosse diagnosticato il cancro. Ebbene, le donne che avevano il cancro ricordavano una dieta molto più ricca di grassi di quella che avevano seguito davvero. Le partecipanti sane invece no.

Ecco come il New York Times ha descritto la natura insidiosa di questa distorsione: “La diagnosi del cancro al seno non ha cambiato solo il presente e il futuro delle donne, ha alterato anche il passato. Le donne malate di cancro hanno (inconsciamente) deciso che la causa probabile della loro malattia fosse una dieta ricca di grassi e (inconsciamente) si sono ricordate una dieta ricca di grassi. Si tratta di un processo tristemente familiare per chi conosce questa malattia e sa quanto sia stigmatizzata: le donne dello studio, come migliaia di altre prima di loro, hanno cercato una causa nei loro ricordi e hanno finito per evocarla nella loro memoria”.

La distorsione del ricordo (recall bias) è uno dei motivi per cui gli studi longitudinali sono spesso preferiti a quelli trasversali. In uno studio longitudinale i dati sono raccolti in modo diacronico: si chiede a un volontario cosa pensa della scuola quando ha cinque anni; poi, tredici anni dopo, si chiama lo stesso soggetto e si verifica se ha lasciato le scuole superiori. In uno studio trasversale, in cui tutti i dati sono raccolti in un momento preciso, dovremmo chiedere al diciottenne che ha lasciato le superiori cosa pensava della scuola quando aveva cinque anni, Il dato è per sua natura meno affidabile,

Sopravvissuto Supponiamo che in una scuola superiore i voti di un gruppo di studenti crescano di anno in anno. Il secondo anno i voti sono più alti rispetto al primo, il terzo anno continuano a salire e il quarto sono ancora più alti. Diamo per scontato che non ci sia nessun imbroglio né un uso “creativo” delle statistiche descrittive. Ogni anno questi studenti fanno meglio dell'anno precedente secondo tutti i parametri: media, mediana, percentuale di promossi.

A questo punto cosa fate? (a) Proponete il preside della scuola come preside dell'anno oppure (b) chiedete di vedere altri dati? Io dico (b). Sento puzza di distorsione di sopravvivenza (survivorship bias), che entra in scena quando alcuni o molti fattori sono eliminati dal campione, modificando la composizione dei fattori rimasti e influenzando i risultati dell'analisi. Supponiamo che il preside sia un incapace. Gli studenti non imparano niente e ogni anno la metà abbandona gli studi. In questo caso è molto probabile che i voti complessivi degli studenti salgano, anche se a livello individuale nessuno è migliorato.

Se ipotizziamo che gli studenti peggiori (quelli con i voti più bassi) siano quelli con la maggiore probabilità di abbandono, allora la media dei voti dei superstiti aumenta costantemente a mano a mano che aumentano gli abbandoni (se in una stanza ci sono individui di diversa altezza, far uscire quelli più bassi fa salire l'altezza media, anche se nessuno è diventato più alto).

L'utilizzatore sano Le persone che assumono regolarmente vitamine hanno più probabilità di essere sane, perché sono il tipo di persone che assume regolarmente vitamine! Che le vitamine abbiano un effetto o meno è un problema a parte.

Facciamo un esperimento. Supponiamo che il ministero della salute raccomandi a tutti i genitori di far indossare ai loro figli un pigiama viola prima di metterli a letto, perché secondo una certa teoria questo aiuta a stimolare lo sviluppo del cervello. Vent'anni dopo, uno studio longitudinale conferma che il fatto di aver indossato il pigiama viola è fortemente correlato con il successo nella vita. Scopriamo, per esempio, che il 98 per cento delle matricole di Harvard ha indossato un pigiama viola da bambino (e alcuni continuano a indossarlo), contro appena il 3 per cento dei detenuti del sistema carcerario del Massachusetts.

Ovviamente il pigiama viola non c'entra niente: c'entra il fatto di aver avuto dei genitori che mettono ai figli il pigiama viola. Anche quando si cerca di tenere sotto controllo fattori come l'educazione in casa, restano comunque differenze non osservabili tra i genitori che considerano importante mettere il pigiama viola ai figli e quelli a cui invece non importa niente. Come spiega Gary Tauber, esperto di salute del New York Times: “In parole povere, il problema è che le persone che si preoccupano scrupolosamente di fare attività salutari (per esempio prendere un farmaco nei modi consigliati o seguire una dieta equilibrata) sono fondamentalmente diverse dalle altre”.

Questo effetto può inquinare qualsiasi studio che cerchi di misurare la reale efficacia di attività considerate salutari, come fare esercizio o mangiare il cavolo riccio. Crediamo di confrontare gli effetti di due diete: “cavolo riccio” contro “non cavolo riccio”. In realtà, se il gruppo sperimentale e il gruppo di controllo non sono selezionati secondo criteri casuali, stiamo confrontando le diete di due diversi tipi di persone. Abbiamo un gruppo sperimentale diverso dal gruppo di controllo per due aspetti, invece che per uno solo.

Se la statistica è un lavoro investigativo, i dati sono gli indizi. Mia moglie ha insegnato per un anno in una scuola superiore nelle campagne del New Hampshire. Uno dei suoi alunni è stato arrestato per furto con scasso in una ferramenta. La polizia è riuscita a risolvere il caso perché (1) aveva appena nevicato e c'erano delle tracce sulla neve che portavano dalla ferramenta alla casa dell'alunno; (2) in casa sua sono stati ritrovati gli attrezzi rubati. Avere buoni indizi aiuta. Come avere buoni dati. Ma prima bisogna procurarseli, ed è molto più difficile di quel che sembra.

L'AUTORE
Charles Wheelan è un giornalista statunitense.
Questo articolo è un estratto del suo ultimo libro,
Naked statistics.
Pubblicato su:
Internazionale 1040; 28 febbraio 2014

Torno a Casa