mercoledì 15 aprile 2020

COVID19: chi è più credibile sui numeri?

Ormai sappiamo tutti che i dati non sono corretti in nessun paese, in particolare quello dei contagiati totali, ma anche gli altri non scherzano.
I motivi sono vari.
C'è chi ha problemi materiali nel raccoglierli, chi ha commesso errori metodologici, chi ancora confonde COVID19 con altre patologie, chi li manipola, ecc.
E in molti casi un misto di tutti questi motivi.

Ma c'è una domanda interessante da porsi: c'è un modo di vedere quali numeri sono più affidabili e quali meno? Quale paese, che sia per bravura, onestà o fortuna, è più credibile?

Sì, c'è.
E quel metodo è guardare le proiezioni degli istituti di ricerca specializzati.
Ma come, direte voi, le proiezioni riguardano i numeri futuri, non quelli passati!

Bene, seguitemi.
Intanto premetto che uso come esempio le proiezioni dello Institute for Health Metrics and Evaluation della University of Washington.
Non so, ovviamente, se sono le migliori in assoluto, ma sono molto consigliate da esperti su entrambi i lati dell'oceano e l'istituto ha un'ottima nomea.

Veniamo al punto.
Perché le proiezioni ci dicono qualcosa sulla credibilità dei dati raccolti materialmente?
Allora, la prima cosa da dire è che le incertezze sulle proiezioni sono inevitabili: primo proprio per la non correttezza dei dati e secondo perché la diffusione del virus può sempre venire modificata da nuove variabili (scelte politiche, scelte mediche, ecc.).
Queste ultime ovviamente non hanno un legame (non matematico almeno) con la precisione dei dati.
Queste proiezioni sono fatte usando algoritmi complessi, ma al di là della complessità il punto per noi importante è che in questi algoritmi ci sono anche delle costanti e queste costanti sono (o derivano da) i dati già noti.
Perché tutti sappiamo che i dati di tutti i paesi sono imprecisi, il creatore dell'algoritmo non ha potuto mettere nella sua formula costanti secche per i dati di partenza, ma ha dovuto usare un intervallo di valori.
E in base a questo intervallo di valori poi l'algoritmo ti propone un intervallo di incertezza sulle cifre previste, sulle proiezioni.

Più ampio è questo intervallo di incertezza, più incerti sono i dati di partenza. Quindi meno credibili.

Prendiamo le proiezioni dell'IHME (l'istituto di cui sopra).
Userò come paragone quattro paesi importanti e significativi, ma voi potete divertirvi a guardare anche gli altri paesi qui.

Stati Uniti


Germania



Italia




Spagna



Notate le incertezze piccole di Italia e Spagna (soprattutto Italia)?
E quelle enormi di Germania e Stati Uniti? 

Cosa significa questo?

Che chi ha creato l'algoritmo ritiene concretamente i dati italiani e spagnoli attuali più affidabili di quelli statunitensi e tedeschi.
Quelle incertezze sulle proiezioni dimostrano che per USA e Germania ha usato un intervallo di partenza molto più ampio che per Italia e Spagna.


Per chi volesse informarsi sui modelli usati dallo IHME, potete trovare articolo e file vari qui.

Saluti,

Mauro.

Nessun commento:

Posta un commento