Post in evidenza

Covid-19 la nostra app è sempre attuale

  Con l'assidua collaborazione  Marco Mingione  e  Pierfrancesco Alaimo Di Loro  abbiamo creato uno strumento web interattivo che consen...

mercoledì 13 maggio 2020

Gli intervalli di confidenza sono importanti.


Chiunque segua un corso base di statistica impara cosa sia un intervallo di confidenza. Per chi non lo sapesse è un intervallo di valori plausibili (con una fissata probabilità) che si ottengono quando si stima qualcosa con un modello/metodo statistico.

Questi intervalli rivestono un ruolo estremamente importante nella comprensione di qualsiasi fenomeno si stia studiando in modo statistico. Ci parlano di rischio. Infatti, considerano la quantità di informazione disponibile (dimensione del campione) e la variazione potenziale della stima nella popolazione di riferimento. Così ci dicono in quale intervallo può cadere la risposta reale. Sono dunque come un grosso cartello di allerta messo sopra qualsiasi stima, avvertendo di trattare con cautela il numero singolo prodotto dalla stima (puntuale). Dicono "attenzione, non puoi essere più preciso di così, la realtà osservata (o predetta) si muove da un minimo di x ad un massimo di y”.

Se dovete prendere una decisione sulla base di una qualche stima, guardare quanto è grande questo intervallo, sapere qual è il livello di confidenza (e quindi il suo complemento, l'errore), diventa fondamentale.

Pensiamo un momento a quali sono le implicazioni dell'ignorare un intervallo di confidenza (non lo considero o non lo calcolo proprio). Sono un decisore pubblico, ottengo un numero da un modello (statistico o meno), ad esempio il numero di ricoveri in terapia intensiva a seguito di covid19 per il giorno dopo, e sulla base di quel numero devo decidere se correre ad aprire nuovi posti letto o prendere un altro provvedimento cautelativo. Ho solo un numero, magari non molto alto, mi fido di chi lo ha prodotto e quindi assumo sia preciso. Tutto a posto vado a dormire sereno.  Poi a metà mattina mi chiama il primario dell'ospedale cittadino più importante dicendo che non sa più dove mettere i casi da terapia intensiva... ups. Se invece di quell'unico numero mi fosse arrivato un intervallo di valori, che mi dice con probabilità molto alta (99%) che l'intervallo tra x e y conterrà il vero numero di ricoveri, ed y è maggiore della capacità delle mie terapie intensive, io corro a prendere provvedimenti, perché il rischio di trovarmi con le terapie intensive sature è molto alto.



Ma anche in situazioni meno drammatiche, se devo prendere una decisione sulla base di stime, modelli numerici e/o simulazioni assortite, avere modo di valutarne l'affidabilità con un qualche sistema, meglio se un intervallo, mi permetterà di salvarmi in migliaia di situazioni.

Nessun commento:

Posta un commento