Sapevate che più si riduce il numero delle colonie di api, più aumenta il numero degli arresti per possesso di marijuana? No? Eppure il grafico parla chiaro:
E non è inquietante il fatto che il numero degli annegamenti dovuti a una caduta in una piscina è correlato al numero di film all'anno nei quali ha recitato Nicolas Cage? Anche qui, il grafico è eloquente:
I dati sono reali: li ha raccolti e rappresentati graficamente Tyler Vigen, presso Tylervigen.com. Ma questi grafici non hanno lo scopo di sminuire la statistica o di insinuare che si può mentire facilmente e in modo molto convincente usando un grafico e scegliendo i dati opportuni: servono a ricordare che una correlazione non vuol dire nulla se non c'è anche un meccanismo di causa ed effetto che leghi le serie di dati.
Per esempio, all'inizio del secolo scorso i tumori ai polmoni, che prima erano rarissimi, stavano aumentando enormemente e non si sapeva perché. Ma nel 1929 il medico tedesco Fritz Lickint pubblicò il primo studio che indicava una forte correlazione fra fumo e tumore ai polmoni e suggerì che era sensato condurre studi ulteriori per verificare che ci fosse davvero un legame di causa ed effetto e non si trattasse di una correlazione spuria.
Le statistiche grafiche, insomma, sono uno strumento potente per far emergere fenomeni che altrimenti resterebbero sepolti nei numeri, e l'informatica è un alleato molto efficiente in questo campo; ma ci vuole l'intelligenza umana, abbinata alla conoscenza del mondo reale, per decidere se la correlazione fra due variabili è semplice coincidenza o se c'è davvero un legame di causa.
Altrimenti dovremmo concludere che il consumo di formaggio causa la morte per intrappolamento fra le lenzuola, come si evince da questo grafico:
Nessun commento:
Posta un commento
Se vuoi commentare tramite Disqus (consigliato), vai alla versione per schermi grandi. I commenti immessi qui potrebbero non comparire su Disqus.