Post in evidenza

Covid-19 la nostra app è sempre attuale

  Con l'assidua collaborazione  Marco Mingione  e  Pierfrancesco Alaimo Di Loro  abbiamo creato uno strumento web interattivo che consen...

sabato 28 novembre 2020

Open Letter

 Since the beginning of the pandemic, the Italian Statistical Society (SIS) has repeatedly offered its expertise to help decision-makers and scientists to manage and study the situation. The former never listened. Yet, hundreds of scientific works have shown how such skills were essential in understanding and predicting events related to the pandemic.


In light of this premise, the SIS invites all civil society to sign the following open letter. To sign go here



Fight against COVID-19: high-quality data is needed for analysis and adequate skills to analyze it


The emergency due to the COVID-19 pandemic has highlighted the fundamental importance of the availability of reliable data and high skills in analyzing them to allow us to understand the pandemic, predict its evolution, prepare tools for both health policy and economic policy to face it, and evaluate the effects of the choices made.

It is increasingly evident that it is vital to offer competent support for a data collection inspired by quality criteria. We need to integrate available information using statistical criteria that protect this quality. And it is even more evident that, alongside the collection of high-quality data, there is a need to reclaim space for the scientific skills necessary to analyze them.


Why accessible data

To a large extent, the data necessary to construct adequate information are already collected by government agencies and bodies. Still, they are not made available to the scientific community. Confidentiality issues, and further unknown considerations, turn raw data into inaccessible information.

Currently, the available data are collected with the declared purpose of surveillance. Still, suppose the quality, the comparability between geographical areas, and the fundamental defining aspects are not guaranteed. In that case, any analysis of these data will be limited to monitoring the status quo, producing more projections than predictions. To study the epidemic's progress in detail, information is needed as detailed as possible to follow the individual pathways of contagion and clinical evolution.

On an aggregate level, the figures updated daily by the Civil Protection are available to all. We recognize and much appreciate the enormous work of data collection and dissemination carried out by this Agency. However, we note how, at this point in the evolution of the pandemic, what has been made available by the Civil Protection is no longer sufficient to make the government's decision-making mechanism and the scientific understanding of the evolution of the pandemic itself transparent.

In particular, based on this data, it is not possible to carry out some crucial activities.

Reproduce the quantitative bases of institutional decisions. This emerged in all evidence as regards the recent division of the country into three zones. How indicators are defined and constructed, and the criteria for determining final decisions must be transparent. The disaggregated data with which these indicators are fed must be made available. Only in this way can the scientific community be able to evaluate the methodologies used.

Ex-post assessment, quantitatively and rigorously, of the effects of decisions. An example of fundamental importance in this area is the choice of whether or not to close schools. Many researchers are trying to give a rigorous evaluation of the "school" effect; however, numerous scientific research on the subject does not yet provide shared conclusions. They are all based on aggregate data analysis.

Understanding still obscure aspects of the phenomenon. The Italian scientific world is rich in skills that could usefully investigate essential elements of the phenomenon based on disaggregated data in collaboration with the institutions and agencies involved in managing the epidemiological crisis.


Why adequate skills

Statistical skills are currently in high demand and very difficult to find around the world. They have become increasingly exclusive and rare given the ever-increasing demand, reinforced by the current COVID-19 emergency. For example, Pfizer, a pharmaceutical company at the forefront of vaccine development and distribution, will only share its data in research groups where a biostatistician conducts the analyzes. In Italy, the data currently collected in the wake of the emergency is affected by many problems and high variability. Therefore, they need, even more than other biomedical data, specific skills to correctly deal with elements of confounding, imbalance, and high variability. All these aspects cannot be managed correctly without having advanced statistical skills.

Timely and effective, methodologically reliable, and shared answers are obtained when the right skills are involved in collecting and validating data and the same analysis. The scientific process requires numerous steps, in each of which specific skills are necessary for a correct construction of the information tools.

Definition of the problem. First of all, it is essential to define what needs to be observed to answer the questions of containment, monitoring, and forecasting of the epidemic and its impact in the social and economic sphere. Diversified skills are needed in this process. Highly multidisciplinary teams, within which scientists from different areas can interact, are necessary to address all aspects of the problem. In this phase, on the one hand, the primary data required for the analyzes must be defined and, on the other, the construction and implementation of harmonization protocols between the different data sources.

Management of databases. Specific computer and statistical skills are required to construct and manage data archives with massive flows of information. The data must not only be stored/saved but, above all, validated quickly to give timely answers and to ensure public access.

Information analysis. In this phase, the ability to define and develop models capable of grasping the underlying characteristics of the phenomenon of interest, highlighting potential causal relationships, defining specific estimation procedures for unknown quantities and indicators, and building predictions that take into account the uncertainty that accompanies each estimate.

Sharing of information. Different analysis models need to be compared, for example, in terms of predictive ability, interpretability, and robustness. To this end, it is desirable to establish periodic meetings, at least twice a week, between the researchers who develop the models and the institutions that could use them, openly and transparently, to share the best solutions.

Dissemination of information. We are supporters of access to data by the entire scientific community. Accepting this request would allow greater transparency on the part of politics. It would enable civil society to obtain reliable and certifiable information. However, accessibility must be accompanied by an incisive and growing promotion of quantitative culture in all areas, starting with communication operators and political decision-makers.


It should be noted that this document asks for access to detailed data, and this access is not new to the national information system. In fact, on matters of an economic nature, the information is available in great detail. This point allows interested parties to analyze and process any type of issues (for example, data produced by ISTAT, Bank of Italy, Chambers of Commerce).

It should be strongly emphasized how the right skills are fundamental for analyzing such a complex phenomenon as the COVID-19 pandemic. The enormous variability observed at global, national, and regional levels must be incorporated into the assessments that lead to political and economic decisions. Knowing how to distinguish between association and causal relationships concerning observations and variables included in the analysis models is fundamental to avoid decisions based on random variations and/or spurious effects.



Il Manifesto

 

Ci siamo, è il momento di agire!
Si discute di dati accessibili ai ricercatori e di competenze specifiche necessarie all’analisi dei dati e al supporto delle decisioni politiche.
Gli statistici ci sono, ci sono sempre stati. La Società Italiana di Statistica è in prima fila per la promozione delle competenze, centrali per un’analisi corretta dei dati, competenze che solo chi ha veramente studiato statistica ha. Un manifesto, un ribadire la centralità dei dati e delle competenze, in un momento storico in cui è difficile districarsi tra analisti dei dati improvvisati e sciamani della comunicazione scientifica. Non è un lavoro per tutti, la SIS lo ribadisce chiaramente e, oltre a chiedere trasparenza, rivendica il ruolo della Statistica e del profilo dello statistico come scienziato.

Per firmare andate qui e di seguito trovate il testo della lettera aperta.



Lotta al COVID-19: sono necessari dati di alta qualità per le analisi e competenze adeguate per analizzarli

L’emergenza dovuta alla pandemia da COVID-19 ha messo in luce l’importanza fondamentale della disponibilità di dati affidabili e di competenze elevate nell’analizzarli per permettere di comprendere la pandemia, prevederne l’evoluzione, approntare strumenti sia di politica sanitaria che di politica economica per affrontarla e valutare gli effetti delle scelte effettuate.
È sempre più evidente come sia fortemente necessario offrire un supporto competente per una raccolta di dati ispirata a criteri di qualità ed integrare informazioni disponibili sulla base di criteri statistici che tutelino tale qualità. Ed è ancor più evidente come, accanto alla raccolta di dati di alta qualità, occorra reclamare spazio per le competenze scientifiche necessarie per analizzarli.

Perché dati accessibili

In larga misura i dati necessari alla costruzione di informazioni efficaci vengono già raccolti da Enti e Agenzie governative, ma non sono resi disponibili alla comunità scientifica. Problemi di riservatezza, e ulteriori considerazioni non note, trasformano i dati grezzi in informazioni non accessibili.
Attualmente i dati disponibili sono raccolti con il dichiarato scopo di sorveglianza, ma se non ne viene garantita la qualità, la confrontabilità tra aree geografiche e gli aspetti definitori fondamentali, qualsiasi analisi di tali dati si limiterà ad un monitoraggio dello status quo che produrrà proiezioni più che previsioni. Per studiare in dettaglio l’andamento dell’epidemia occorrono informazioni il più possibile dettagliate, che permettano di seguire i percorsi individuali di contagio e di evoluzione clinica.
A livello aggregato, sono disponibili a tutti le grandezze aggiornate giornalmente dalla Protezione Civile. Riconosciamo e apprezziamo molto l’enorme lavoro di raccolta e diffusione dei dati compiuto da questa Agenzia. Notiamo però come, a questo punto dell’evoluzione della pandemia, quanto reso disponibile dalla Protezione Civile non sia più sufficiente per rendere trasparente il meccanismo decisionale del governo e la comprensione scientifica dell’evoluzione della pandemia stessa.

In particolare, sulla base di questi dati non è possibile svolgere alcune attività cruciali.
Riprodurre le basi quantitative delle decisioni istituzionali. Questo è emerso in tutta evidenza per ciò che riguarda la recente suddivisione del Paese in tre zone. Devono essere trasparenti le modalità con cui vengono definiti e costruiti indicatori e i criteri per determinare le decisioni finali. È fondamentale che i dati disaggregati con cui questi indicatori vengono alimentati siano resi disponibili. Solo così la comunità scientifica può essere messa in grado di valutare le metodologie usate.
Valutare ex-post, in modo quantitativo e rigoroso, gli effetti delle decisioni. Un esempio di fondamentale importanza in questo ambito è la scelta della chiusura o meno delle scuole. Molti ricercatori stanno tentando di dare una valutazione rigorosa dell'effetto “scuola”, tuttavia le numerose ricerche scientifiche sul tema non forniscono ancora conclusioni condivise, essendo tutte basate sull'analisi dati aggregati.
Comprendere aspetti ancora oscuri del fenomeno. Il mondo scientifico italiano è ricco di competenze che potrebbero utilmente investigare aspetti importanti del fenomeno sulla base dei dati disaggregati, in collaborazione con le Istituzioni e le Agenzie coinvolte nella gestione della crisi epidemiologica.

Perché competenze adeguate

Le competenze statistiche sono attualmente molto richieste e molto difficili da trovare in tutto il mondo. Sono diventate sempre più esclusive e rare data la richiesta in continuo aumento, rinforzata dall’attuale emergenza COVID-19. Ad esempio, la Pfizer, società farmaceutica in prima linea per lo sviluppo e la distribuzione del vaccino, condividerà i propri dati solo in gruppi di ricerca in cui sia un biostatistico a condurre le analisi. In Italia, i dati raccolti attualmente, sull’onda dell’emergenza, sono affetti da molti problemi e da un’elevata variabilità. Hanno dunque bisogno, ancora più di altri dati biomedici, di competenze specifiche che permettano di trattare correttamente elementi di confondimento, sbilanciamento ed alta variabilità. Tutti questi aspetti non possono essere gestiti correttamente se non avendo competenze avanzate di statistica.
Risposte tempestive ed efficaci, metodologicamente solide e condivise si ottengono nel momento in cui le giuste competenze sono coinvolte nella raccolta e validazione dei dati e nell’analisi degli stessi. Il processo scientifico richiede numerosi passaggi, in ciascuno dei quali competenze specifiche sono necessarie per una corretta costruzione degli strumenti informativi.
Definizione del problema. In primo luogo, è fondamentale definire cosa occorre osservare per rispondere alle domande di contenimento, monitoraggio e previsione dell’epidemia e del suo impatto in ambito sociale ed economico. In questo processo occorrono competenze diversificate. Gruppi altamente multidisciplinari, al cui interno possano interagire scienziati di aree diverse, sono necessari per affrontare tutti gli aspetti del problema. In questa fase si devono da un lato definire i dati di base necessari alle analisi e dall’altro costruire ed implementare protocolli di armonizzazione tra le diverse fonti di dati.
Gestione delle basi dati. Competenze specifiche di tipo informatico e statistico sono necessarie per la costruzione e gestione di archivi dati con grandi flussi di informazione. I dati non vanno solo memorizzati/salvati, ma soprattutto validati in tempi rapidi per dare risposte tempestive e per garantirne l’accesso pubblico. 
Analisi dell’informazione. In questa fase diventa fondamentale la capacità di definire e sviluppare modelli capaci di cogliere le caratteristiche di fondo del fenomeno di interesse, che permettano di evidenziare potenziali relazioni causali, di definire specifiche procedure di stima per quantità non note ed indicatori, e di costruire previsioni che tengano conto dell’incertezza che accompagna ogni stima.
Condivisione dell’informazione. È necessario confrontare diversi modelli di analisi, ad esempio in termini di capacità predittiva, interpretabilità e robustezza. A tal fine è auspicabile istituire momenti di confronto periodico, a periodicità almeno bisettimanale, fra i ricercatori che sviluppano i modelli e le istituzioni che li potrebbero impiegare, in modo aperto e trasparente, al fine di condividere le migliori soluzioni.
Diffusione dell’informazione. Siamo sostenitori dell’accesso ai dati da parte di tutta la comunità scientifica. L’accogliere tale richiesta permetterebbe una maggiore trasparenza da parte della politica e consentirebbe alla società civile di ottenere informazioni affidabili e certificabili. L’accessibilità va però accompagnata da una incisiva e crescente promozione della cultura quantitativa in tutti gli ambiti, a partire dagli operatori della comunicazione e dai decisori politici.

È da notare che in questo documento si chiede l’accesso a dati dettagliati, e questo accesso non è cosa nuova per il sistema informativo nazionale. Infatti, su argomenti di natura economica, le informazioni sono reperibili al massimo dettaglio consentendo, a chi interessato, di condurre analisi ed elaborazioni di qualsiasi genere (ad esempio, i dati prodotti da ISTAT, Banca d’Italia, Camere di Commercio).
Va sottolineato con forza quanto le giuste competenze siano fondamentali per l’analisi di un fenomeno tanto complesso come la pandemia di COVID-19. L’enorme variabilità osservata a livello globale, nazionale e regionale, deve essere incorporata nelle valutazioni che conducono alle decisioni politiche ed economiche. Saper distinguere tra associazione e relazioni causali con riferimento a osservazioni e variabili incluse nei modelli di analisi è di fondamentale importanza al fine di evitare decisioni basate su variazioni casuali e/o effetti spuri.

sabato 21 novembre 2020

Science, Statistics and Democracy

 This beautiful monologue by Alessia Ciarrocchi at #propagandalive gave us the starting point for a reflection. The Science of which Alessia Ciarrocchi tells us, the one that embodies democratic values, was born a few centuries ago when Galilei revolutionized how we looked at nature. Galilei formalizes something that moved in the thought of his time: the scientific method.

Since then, studying reality has followed a rigorous path based on the observation of a phenomenon, the formulation of a possible explanation of the same, which must then be validated by collecting (appropriately) observations and analyzing the results of the observation (experiment). From these results, it is decided whether to accept, reject, or partially modify the explanation given and then start again with the same procedure.

In this description of the scientific method, it is immediately apparent where Statistics enters. It is the pillar of this research path: In part, it enters into the definition of the mathematical model that describes the initial explanation, provides the methods for designing the observation, and the correct techniques to analyze the result in the light of the formalization given by the mathematical model initial.

Statistics is not a specific science understood as a homogeneous body of knowledge of a field of reality. Still, it represents the methodological foundation of the whole of Science, and for this reason, its role becomes central today. Statistics allows the quantitative verification of political decisions, allows for dismantling the hoaxes, in short, allows the control of democratic values, especially now, at the time of the "data society."



Scienza, statistica e democrazia

Questo bel monologo di Alessia Ciarrocchi a #propagandalive ci ha dato lo spunto per una riflessione. La Scienza di cui ci parla Alessia Ciarrocchi, quella che incarna i valori democratici, nasce alcuni secoli fa, quando Galilei rivoluziona il modo con il quale si guardava la natura. Galilei formalizza qualcosa che si muoveva nel pensiero del suo tempo: il metodo scientifico.
Da allora studiare la realtà segue un percorso rigoroso che si fonda sull'osservazione di un fenomeno, la formulazione di una possibile spiegazione dello stesso, che poi và validata raccogliendo (opportunamente) osservazioni ed analizzando i risultati dell'osservazione (esperimento). Da questi risultati si decide se accettare, rigettare o modificare parzialmente la spiegazione data e poi ripartire con lo stesso procedimento.
In questa descrizione del metodo scientifico si vede subito dove entra la Statistica. E' il pilastro di questo percorso di ricerca: In parte entra nella definizione del modello matematico che descrive la spiegazione di partenza, fornisce i metodi per la progettazione dell'osservazione e le tecniche corrette per analizzare il risultato alla luce della formalizzazione data dal modello matematico iniziale.
La Statistica non è una scienza specifica intesa come corpo omogeneo di conoscenze di un campo delle realtà, ma rappresenta il fondamento metodologico della Scienza tutta, e per questo il suo ruolo diventa centrale oggi. La Statistica permette la verifica quantitativa delle decisioni politiche, permette di smontare le bufale, insomma permette il controllo dei valori democratici, soprattutto ora, al tempo della “società dei dati”. 



mercoledì 18 novembre 2020

Data, decision makers and statistics

 As StatGroup-19, we always had a goal: to not lose our temper. Ok, we didn't make it. Last night we lost it!

----------

In the   17/11/2020  episode DiMartedì broadcast, yet another approximate and, in some ways, tragicomic debate on the "data" of COVID19 took place. This time, we went very far, bringing the discussion on the methodological reasons behind using some indicators (such as Rt) to define the Italian regions' levels of epidemiological criticality. To discuss the issue, journalists and experts (no data experts). The debate was characterized by a complete absence of statistical culture, thus becoming "comical" at times for those who know the subject. At times it was "tragic" because it brought to light, even more, the cultural chasm that is engulfing everyone from decision-makers to commentators in this very delicate moment for the country. The absence of quantitative culture and numerical illiteracy are genuinely a social emergency, now amplified by the need to make decisions based on numerical scientific evidence.

But let's get to the evening theater:


Prologue: the eternal contradiction. In the common imagination, it is recognized that statistics is a fundamental tool for explaining and predicting the behavior of complex phenomena, such as an epidemic. Being statistics a subject of study in many university courses, it is also true that everyone thinks they know it. Therefore it is often considered unnecessary to involve the community, the people, who are dedicated to studying it professionally. This is also true when dealing with issues at the highest levels of criticality. Knowing some basic notions of Statistics does not make statisticians or data analysis experts. Just as knowing how to drive a car does not make Formula 1 drivers.

Act (of faith). The debate runs off quickly. The journalist Damilano tackles the issue and asks Professor Richeldi (pulmonologist and member of the CTS, ed) to explain the reasons behind the choice of "parameters and if that index over which we all squirm (Rt, ed) is still realistic. " Professor Richeldi's reply will become an eternal citation in every Statistics course, in memory of how often decisions are made without having an appropriate statistical culture. Turning to the journalist, he reveals: "it is good that we understand each other; I don't know if you knew about the Rt index last year? I personally didn't […] now if we do not trust and if we do not entrust the experts with a direction, in this country, in my opinion, we will hardly jump out". Then pressed by Floris on the quality of the data and the role of Merler (defined by the conductor as "super professor"), he closes with an epic ending: "the super professor has in his hands the data evaluating their quality,  and reliability, and how they are inserted in a multiparametric parameter (! ed) ". Here is the mirror of the moment, meaningless words used to justify unclear choices, relying on faith, faith in a single person, the only one in possession of the data.


Epilogue: Rt. So it's no good at all. Relying on experts is fine but taking a leap of faith towards what a single expert, that has been chosen as the sole repository of the statistical truth on the COVID issue claims is not acceptable from a scientific point of view. The approximation with which such an important topic as that of the scientific reasons behind the use of indicators is approached and discussed cannot pass. In this situation, some commentators also fail to understand the relevant role of statistics experts, even in the public debate. On Rt, we must be able to discuss. First of all, Rt cannot be calculated. It can be estimated that it can be given a statistical approximation accompanied by a level of uncertainty. As an estimate, it is based on a procedure (model), and different methods will provide different estimates, with different uncertainty assessments. In this context, the act of faith cannot be done. It should be explained and clarified why this indicator should be used and why the assumptions made are the best possible, as well as guaranteeing their empirical verifiability.

Conclusion. Unfortunately, it is more and more frequent to attend debates on relevant issues from a decisional perspective in which statistics are present, except to realize that the only ones absent are the statisticians. Not knowing/wanting to recognize the scientific importance of their role in studying complex phenomena, in the management of critical issues, and in decision-making processes is extremely serious. Statistics is the methodological essence on which all scientific research rests, both in the experimental and social fields. It has the same role that Philosophy has for science. It is its theoretical and conceptual foundation: research without statistics would be blind. We must therefore understand and accept that in the (also) public debate on methodological issues, the only ones who can explain and clarify doubts to decision-makers and citizens are the statisticians.




Dati, decisori e Statistica

Se c'è una cosa che come StatGroup-19 ci siamo sempre riproposti è di non perdere la pazienza. Ebbene sì, non ce l'abbiamo fatta, ieri sera la pazienza l'abbiamo persa persino noi!
---
Nella puntata del 17/11/2020 della trasmissione
DiMartedì
è andato in scena l'ennesimo dibattito approssimativo e, per certi versi, tragicomico sui “dati” di COVID19. Questa volta si è andati molto in là, portando la discussione sulle ragioni metodologiche dietro l'uso di alcuni indicatori (come Rt) per definire i livelli di criticità epidemiologica delle varie regioni italiane. Per discutere del tema, giornalisti ed esperti (non esperti di dati). Il dibattito è stato caratterizzato da una completa assenza di cultura statistica, diventando quindi “comico” a tratti per chi conosce la materia. A tratti è stato “tragico” perché ha messo ancor più in luce la voragine culturale che sta inghiottendo tutti da decisori a commentatori, in questo momento così delicato per il Paese. L'assenza di cultura quantitativa e l’analfabetismo numerico sono davvero un'emergenza sociale, oggi amplificata dalla necessità di prendere decisioni sulla base di evidenze scientifiche di tipo numerico.
Ma veniamo al teatrino serale:
Prologo: l'eterna contraddizione. Nell'immaginario comune, è riconosciuto che la Statistica sia uno strumento fondamentale per spiegare e prevedere il comportamento di fenomeni complessi, come un'epidemia ad esempio. Essendo materia di studio in tanti percorsi universitari, è altresì vero che un po’ tutti pensano di conoscerla e quindi spesso si ritiene non necessario coinvolgere la comunità, le persone, che per professione si dedica al suo studio. Questo anche quando si affrontano questioni ai massimi livelli di criticità. Conoscere alcune nozioni basilari di Statistica, non rende statistici o esperti di analisi di dati. Così come il saper guidare una macchina non rende piloti di formula 1.
Atto (di fede). Il dibattito corre via velocemente, quando il giornalista Damilano affronta il tema e chiede al professor Richeldi (pneumologo e membro del CTS, ndr) di spiegare le ragioni dietro la scelta dei “parametri e se quell'indice su cui tutti ci accapigliamo (Rt, ndr) sia ancora realistico”. La replica del professor Richeldi è da citazione eterna in ogni corso di Statistica, a memoria di come spesso si prendano decisioni senza aver una cultura statistica appropriata. Rivolgendosi al giornalista, rivela: “è bene che noi ci intendiamo, non so se lei sapeva dell'indice Rt l'anno scorso? io personalmente no […] ora se non ci fidiamo e se non affidiamo agli esperti una regia, in questo paese secondo me difficilmente ne saltiamo fuori”. Incalzato poi da Floris sulla qualità dei dati e il ruolo di Merler (definito dal conduttore "superprofessore") chiude con un finale epico: “il superprofessore si trova nelle mani dei dati di cui valuta la qualità, l'attendibilità e l'affidabilità e come vengono inseriti in un parametro multiparametrico (! ndr)”. Ecco lo specchio del momento, parole senza senso, usate per giustificare scelte non chiare, affidandosi alla fede, la fede in una singola persona, l’unico in possesso dei dati.
Epilogo: Rt. Così non va bene per nulla. Affidarsi agli esperti va bene ma fare un atto di fede verso ciò che sostiene un solo esperto scelto come unico depositario della verità statistica sulla questione COVID non è accettabile da un punto di vista scientifico. L'approssimazione con cui viene affrontato e discusso un tema di tale rilevanza come quello delle ragioni scientifiche dietro l'uso di indicatori non può passare in questo modo. E qui c’è anche la responsabilità di alcuni commentatori che non riescono a capire il ruolo rilevante di chi è davvero esperto di Statistica, anche nel dibattito pubblico. Su Rt si deve poter discutere. Prima di tutto Rt non si può calcolare, al massimo si può stimare, ovvero se ne può dare una approssimazione statistica accompagnata da un livello di incertezza. In quanto stima, si basa su una procedura (modello) e procedure diverse daranno stime diverse, con valutazioni dell’incertezza diverse. In questo quadro l'atto di fede non si può fare. Va spiegato e chiarito bene perché si debba usare tale indicatore e perché le assunzioni fatte siano le migliori possibili, oltre che garantirne la verificabilità empirica.
Conclusione. Purtroppo, è sempre più frequente assistere a dibattiti su questioni rilevanti dal punto di vista decisionale in cui sia presente la Statistica, salvo accorgersi che gli unici assenti sono proprio gli statistici. Il non saper/voler riconoscere l'importanza scientifica del loro ruolo nello studio di fenomeni complessi, nella gestione di criticità e nei processi decisionali è estremamente grave. La Statistica è l'essenza metodologica su cui poggia tutta la ricerca scientifica, sia in ambito sperimentale che in quello sociale, ha lo stesso ruolo che la Filosofia ha per la Scienza, è il suo fondamento teorico e concettuale: la ricerca senza la Statistica sarebbe cieca. Si deve allora comprendere ed accettare che nel dibattito (anche) pubblico su questioni di metodo gli unici che possano spiegare e chiarire i dubbi a decisori e cittadini sono proprio gli statistici.



martedì 3 novembre 2020

Covid-19 la nostra app è sempre attuale

 



Con l'assidua collaborazione Marco Mingione e Pierfrancesco Alaimo Di Loro abbiamo creato uno strumento web interattivo che consente la visualizzazione e l'elaborazione dei dati con i modelli che abbiamo sviluppato in queste settimane. La app aggiorna in automatico i dati ogni giorno, e mostra una serie di analisi descrittive e basate su modelli, con la possibilità per l'utente di personalizzare alcune scelte.
Siete curiosi di sapere cosa sta accadendo nella vostra Regione? Volete farvi un'idea confrontando i dati di diverse Regioni? E' vero che la situazione migliora? Andate al link
selezionate l'indicatore che vi interessa, se volete guardare i valori assoluti o le variazioni, e la regione per cui volete le informazioni. Avrete una descrizione dell'epidemia, attraverso diversi grafici che consentiranno di farvi un'idea.
Non vi accontentate solo di avere una descrizione della situazione ad oggi? Siete curiosi di conoscere cosa accadrà domani?
La scheda "Modello" vi consente di visualizzare, oltre che l'andamento di ciascun indicatore, alcune stime e previsioni.

Infine, nella scheda "Previsione terapie intensive" vengono mostrate le previsioni per l'occupazione delle terapie intensive, per regione, ed è possibile visualizzare le statistiche sulla bontà delle previsioni per i giorni precedenti.

Fate uso di un'informazione ottenuta rigorosamente. Bando alle bufale!

lunedì 19 ottobre 2020

Let's make it "relative"

 








In the last few days, with the observed incidence's continuous increase, we witness a "confrontation" competition. There is a strong need among journalists and commentators to reference the first phase of the epidemic to relate what we are observing today. In many televised debates, comparisons between absolute numbers are presented, which, in general, make very little sense. These comparisons try to relate the current phase with the critical stage of the highs of late March and early April. In our opinion (and not only ours), this attempted comparison is not valid at all. In the first phase of the epidemic, cases of positive SARS-Cov-2 were intercepted through "diagnosis." In contrast, today, they are mainly found through "screening" and tracing.

Comparisons must always be made in relative terms, where the adjective "relative" is used to indicate that the quantities to be compared must be considered in "relation" (related) to the procedure from which they are derived. For example, comparing cases of COVID-19 only makes sense if these refer to the number of tampons used. But not all swabs, only those used to find new cases (the situation where 1 swab = 1 person). This is to check the differences between a diagnostic and a screening strategy.

The need to analyze relative data, or relationships between connected quantities, such as odds, proportions, rates, risks, odds, and all further processing, has always been a central theme of our posts and public interventions. In this sense, if we want to find some connection between the first wave and the current phase, we should start from the relationship between positive cases observed and swabs carried out.

In the graph, we reported this relationship, relative to the total swabs (in red) and the swabs for test only (in blue, excluding the control swabs to verify negativization to the virus). Recall that the data reported only the total swabs in the first phase of the epidemic, with no separation between test swabs and control swabs. The "red" ratio, although not correct from a statistical point of view, is still informative of the trend of the epidemic. It represents a lower limit to the "blue" ratio, which estimates the "positive rate."

Analyzing these two relationships' dynamics, the only similarity that can be guessed is between the initial phase of late February-early March and the current one. This seems to indicate that we are at the beginning of a second phase. Therefore any comparison with the maxima of the first wave is really inconsistent on a statistical level.

We are then in an initial phase of acceleration of the infection, but still manageable. Some restrictive measures can be though for specific commercial or leisure activities. Yet, they are far more sustainable than a new generalized closure (which may be the only "final weapon" if this rise does not stop). After all, in general, to citizens, it is required very little: wear a mask, respect the physical distance, wash your hands often. We can do it. Just try seriously.

Relativizziamo

 



Negli ultimi giorni, con il crescere continuo dell'incidenza osservata, assistiamo ad una gara al "confronto". Fra giornalisti e commentatori è forte la necessità di trovare un riferimento alla prima fase dell'epidemia con cui rapportare quello che stiamo osservando oggi. In molti dibattiti televisivi vengono presentati confronti tra dati assoluti che, in generale, hanno davvero poco senso. Questi confronti provano a mettere in relazione la fase attuale con la fase critica dei massimi di fine marzo e inizio aprile, cosa che, a nostro parere (e non solo), non è per nulla valida. Nella prima fase dell'epidemia, i casi di positività al SARS-Cov-2 venivano intercettati tramite "diagnosi" mentre oggi sono intercettati prevalentemente attraverso "screening" e tracciamento.

I confronti devono essere sempre fatti in termini relativi, dove l'aggettivo "relativo" è usato per indicare che le grandezze da confrontare devono essere considerate in "relazione" (rapportate) con la procedura da cui sono derivate. Ad esempio confrontare casi di COVID-19 ha senso solo se questi sono riferiti al numero di tamponi utilizzati. Ma non tutti i tamponi, solo quelli usati per trovare nuovi casi (situazione in cui 1 tampone = 1 persona). Questo serve proprio a controllare le differenze fra una strategia diagnostica e una di screening.

La necessità di analizzare dati relativi, ovvero rapporti fra grandezze tra loro connesse, come quote, proporzioni, tassi, rischi, odds e tutte le loro ulteriori elaborazioni, è stato da sempre un tema centrale dei nostri post e interventi pubblici. In tal senso, se si vuole trovare qualche connessione fra la prima onda e la fase attuale, si dovrebbe partire proprio dal rapporto fra casi positivi osservati e tamponi effettuati.

Nel grafico abbiamo riportato questo rapporto, relativamente ai tamponi totali (in rosso) e ai tamponi per solo test (in blu, escludendo i tamponi di controllo per verificare la negativizzazione al virus). Ricordiamo che nella prima fase dell'epidemia, i dati riportavano solo i tamponi totali, senza scorporo fra tamponi di test e tamponi di controllo. In ogni caso, il rapporto "rosso", nonostante non sia corretto dal punto di vista statistico, è pur sempre informativo della tendenza dell'epidemia poiché rappresenta un limite inferiore al rapporto "blu", che è una stima del "tasso di positività".

Analizzando l'andamento dinamico di questi due rapporti, è chiaro che forse l'unica similitudine che si può intuire è tra la fase iniziale di fine febbraio-inizio marzo e quella attuale. Questo sembra indicare che ci troviamo all'inizio di una seconda fase e dunque ogni confronto con i massimi della prima onda è davvero inconsistente sul piano statistico.

Siamo allora in una fase iniziale di accelerazione del contagio, ma ancora gestibile. Alcune misure restrittive possono essere pesanti per specifiche attività commerciali o del tempo libero, ma sono di gran lunga più sostenibili di una nuova chiusura generalizzata (che rischia di essere l'unica "arma finale" se non si ferma questa risalita) e dopotutto, ai cittadini in generale si richiede davvero poco: portare una mascherina, rispettare il distanziamento fisico, lavarsi spesso le mani. Possiamo farcela, basta provarci sul serio.


lunedì 12 ottobre 2020

Syndemic

 Covid-19: beyond the epidemiological aspect, there is a social aspect. On September 26, on #Lancet, one of the most prestigious and reliable scientific journals, there was a discussion about a part often overlooked in the various analyzes on Covid-19 (https://doi.org/10.1016/S0140-6736(20)32000 -6): is it really a pandemic? We usually take it for granted, but it could be a syndemic (a word unknown to most) in reality. Syndemic is defined by Merril Singer in the 1990s, "syndemic or synergistic epidemic is the aggregation of two or more concurrent or sequential epidemics or disease clusters in a population with biological interactions, which exacerbate the prognosis and burden of disease."

Covid-19 could be just that. It rarely kills on its own; it does so more often in conjunction with other diseases, ailments, and in any case, overt or hidden health problems. Most of these secondary diseases are, in large part, related to people's social status. Horton, in the #Lancet discussion, adds: "The syndemic nature of the threat we face means that a more nuanced approach is needed if we are to protect the health of our communities. [...] a syndemic approach reveals biological and social interactions that are important for prognosis, treatment, and health policy.

Covid-19 is not just a viral disease; it is the litmus test of social diseases. Italy leaves no one behind, whether you are no-mask or no-vax, health care is public and will treat you, regardless of class. Let's not forget it….

 

From here



Sindemia

 Covid-19: oltre l’aspetto epidemiologico, c’è un aspetto sociale. Il 26 settembre scorso, su #Lancet, rivista scientifica tra le più prestigiose e affidabili, si discuteva di un aspetto spesso tralasciato nelle varie analisi sul Covid-19 (https://doi.org/10.1016/S0140-6736(20)32000-6): è davvero una pandemia? Spesso lo diamo per scontato, ma in realtà potrebbe essere una sindemia (parola sconosciuta ai più). La sindemia è definita da Merril Singer negli anni novanta del secolo scorso, “Un'epidemia sindemica o sinergica è l'aggregazione di due o più epidemie o gruppi di malattie simultanei o sequenziali in una popolazione con interazioni biologiche, che esacerbano la prognosi e il carico della malattia.” Il covid-19 potrebbe essere proprio questo. Raramente uccide da solo, lo fa più spesso in concomitanza con altre malattie, disturbi e comunque problemi di salute palesi o nascosti. La maggior parte di queste malattie secondarie sono, in larga parte, legate allo status sociale delle persone. Horton, nella discussione su #Lancet, aggiunge: “La natura sindemica della minaccia che affrontiamo richiede un approccio più sfumato se vogliamo proteggere la salute delle nostre comunità. […] un approccio sindemico porta con sé interazioni biologiche e sociali che sono importanti per la prognosi, il trattamento e la politica sanitaria.”

Il Covid-19 non è solo una malattia virale, è la cartina tornasole delle malattie sociali. L’Italia non lascia indietro nessuno, sia che siate no-mask o no-vax, la sanità è pubblica e vi curerà, a prescindere dal ceto. Non ce lo dimentichiamo….


presa da qui

giovedì 8 ottobre 2020

Keep calm and wear the mask

 







These days, we witness reasonably substantial growth in the number of cases of COVID-19 (and in the positive rate) throughout Italy. Some regions are definitely on alert (Campania); others are only on alert (Lazio, Sardinia, Liguria, for example).

However, this situation must be distinguished from what happened in March-April, when there was, as now, more than 3000 daily positives.

 In the most dramatic days, the policy of tampons was very different. We only had tampons for the symptomatic, often severe, and we could not look for the asymptomatic. Today it is very different, practically everyone gets tampons, and we add, fortunately. We have gone from 30,000 tampons at the end of March to about 130,000 today. We have been monitoring the positivity rate for weeks now, which is the ratio between posts and the number of people tested. Today we are at 6.5%, definitely up. This allows us to understand how much COVID-19 is present in the population, always remembering that, fortunately, asymptomatics are about 90% of positive test cases. A large number of swabs, an effective screening policy allow us to protect the most fragile and prevent intensive care clogging's catastrophic effect.

How can we contribute, by doing our part, to avoid the spread without control of the epidemic? Here too, it is not complicated; there are a few very simple points:

1. Wearing masks and often washing our hands 2. Avoiding gatherings and keeping distance if there are many of us 3. Isolating those who are positive even if asymptomatic 4. Often airing the rooms where we spend time, from the office to the classroom, the workshop, the bedroom, etc.

In Italy, a great help can come from the use of the app #Immuni !

We wonder if it is indispensable to use the bugbear of a new lockdown, feeding uncertainties and fears in the population. The goal must be to raise awareness and inform people. Frightening them doesn't help them understand what needs to be done. The country is still doing well. Everyone (or almost everyone) is rowing on the same side. The health system is strengthening and providing quick and effective responses. So just be careful and follow the few rules, those of common sense, that we have given ourselves and, in part, have imposed on us. Then there is the economy, and yes, that is at least as scary as the epidemic. We cannot afford a new generalized closure; it is evident, we must be aware of it. And then just put the mask (correctly). The situation is serious, but it takes very little to remain open and competitive.


Niente Panico e mettiamo le mascherine

 



In questi giorni stiamo assistendo ad una crescita, abbastanza importante, del numero di casi di covid-19 (e del tasso di positività) in tutta Italia. Alcune regioni sono decisamente in allarme (Campania), altre sono solo in allerta (Lazio, Sardegna, Liguria ad esempio). 

Questa situazione va però distinta da quello che è successo a –marzo-aprile, quando si avevano, come ora, anche più di 3000 positivi giorno. 
 La politica dei tamponi, nei giorni più drammatici, era molto diversa, si facevano tamponi solo ai sintomatici, per lo più gravi, e non avevamo la capacità di cercare gli asintomatici. Oggi è ben diverso, si fanno tamponi praticamente a tutti  e aggiungiamo, per fortuna. Siamo passati dai 30000 tamponi di fine Marzo ai 130000 circa di oggi. Sono ormai settimane che monitoriamo il tasso di positività, cioè il rapporto tra postivi e numero di persone testate. Oggi siamo al 6.5%, decisamente in rialzo. Questo ci permette di capire quanto il COVID-19 sia presente  nella popolazione, ricordando sempre che, per fortuna, gli asintomatici sono circa il 90% dei casi positivi al test. Un numero elevato di tamponi, un’efficace politica di screening ci consente di proteggere i più fragili e prevenire l'effetto catastrofico dell'intasamento delle terapie intensive. 
Come possiamo contribuire, facendo la nostra parte, ad evitare la diffusione senza controllo dell’epidemia? Anche qui la cosa non è complicata, ci sono pochi punti semplicissimi: 
1. Indossando le mascherine e lavando spesso le mani 2. Evitando gli assembramenti e mantenendo le distanze se siamo in molti 3. Isolando chi risulta positivo anche se asintomatico  4. Arieggiando spesso i locali in cui passiamo del tempo, dall'ufficio, alla classe, all'officina, alla stanza da letto ecc.


Un grande aiuto può darlo l'uso dell'app #Immuni non dimentichiamolo!

Ci chiediamo allora se sia davvero necessario usare lo spauracchio di un nuovo lockdown, alimentando incertezze e paure nella popolazione. L’obiettivo deve essere sensibilizzare e informare le persone. Spaventarle non aiuta a capire cosa c'è da fare. Il Paese sta tenendo bene ancora, tutti (o quasi) remiamo dalla stessa parte, il sistema sanitario si sta rafforzando e fornisce risposte rapide ed efficaci. Quindi basta fare attenzione e seguire le poche regole, quelle del buonsenso, che ci siamo dati e, in parte, ci hanno imposto. Poi c'è l'economia e sì quella fa paura almeno quanto l’epidemia. Non possiamo permetterci una nuova chiusura generalizzata, è evidente, bisogna esserne consapevoli. E allora basta mettere (correttamente) la mascherina. La situazione è seria, ma basta davvero poco per restare aperti e competitivi. 





venerdì 2 ottobre 2020

Evolution of a WHO indicator: the cumulative incidence rate at 14 days

 


The 14-day incidence rate per 100,000 inhabitants is the official indicator through which  WHO evaluates the speed of the spread of the Covid-19 epidemic in the various countries of the world.
In general, the incidence is the number of new cases observed. It can be daily, monthly, etc. In this case, W.H.O. considers the new cases observed in the last two weeks and expresses them per 100,000 inhabitants, thus removing the population size effect. Being represented in units of time (14 days), this ratio is called "rate," as it describes the variation in the number of new cases as time varies.
The graph shows this speed indicator's trend from the beginning of the epidemic to today for 30 countries: when the indicator grows, the epidemic accelerates. When it decreases, the epidemic slows down.
At the moment, the ranking of these 30 countries is as follows.



Italy occupies the 13th position with 39 new cases every two weeks per 100,000 inhabitants. The worst situation is that of Israel, with the speed indicator equal to 883.
---
NB: the zeros in the ranking are approximations of decimal values




Andamento di un indicatore dell'OMS: il tasso di incidenza cumulata a 14 giorni

 


Il tasso di incidenza a 14 giorni per 100.000 abitanti è l'indicatore ufficiale con cui l'OMS valuta la velocità di diffusione dell'epidemia di Covid-19 nei vari paesi del mondo.
In generale, l'incidenza è il numero di nuovi casi osservati. Può essere giornaliera, mensile, ecc. In questo caso l'OMS considera i nuovi casi osservati nelle ultime due settimane, e li esprime per 100.000 abitanti togliendo così l'effetto della dimensione della popolazione. Essendo espresso in unità di tempo (14 giorni) questo rapporto è detto "tasso" poichè espireme la variazione del numero dei nuovi casi al variare del tempo
Nel grafico è riportato l'andamento di questo indicatore di velocità da inizio epidemia ad oggi per 30 paesi: quando l'indicatore sale, l'epidemia accellera, quando invece scende l'epidemia rallenta.
Al momento la graduatoria di questi 30 paesi è la seguente

L'Italia occupa la 13° posizione con 39 nuovi casi ogni due settimane per 100.000 abitanti. La situazione peggiore è quella di Israele con l'indicatore di velocità pari a 883.
---
NB: gli zeri nella graduatoria sono approssimazioni di valori decimali





giovedì 24 settembre 2020

Comunicating science during the pandemic


(photo from here)

Every time we write a post about Covid-19, there is a question that invariably guides us: "How do we explain the epidemic so that even without technical education, people can be aware of what is happening?". Indeed, there is much more behind this question. There is the relationship between scientific communication, often technical and cold, and mass communication, driven by feelings and fears. Scientific journals are the place to communicate science. Impactful scientific work,  a study that shakes the scientific community, has a high degree of reliability and, generally, requires a lot of time, a lot of work, and a lot of data.

Newspapers, blogs, social networks, on the other hand, are the main places to communicate with the mass (the mass media). Obviously, the mass media cannot wait for the times of science. Mass communication is "fast" and, at times, driven by the desire for the "scoop," the sensational. In a normal situation, the two ways of communicating don't often integrate.

This epidemic has brought the two worlds closer together: the scientific scoop's sensational and research have pervaded scientific journals. Scientific research's solidity and rationality have made its way into communicators who had never dealt with science. However, this is not necessarily a good thing.

Many high-profile scientific journals have stolen the way of communicating from the mass media. They give ample space to "intellectual exercises" on COVID (in "who has the longest model" style), based on uncertain hypotheses,  on very few data and models approximate. Science, not the Daily Unknown, is full of them. In another era, scientific journals would have rejected all these intellectual exercises as inconsistent without batting an eye. At a time like this, giving space to poorly constructed studies without clear premises on the validity of the data and methods is an irresponsible act. The exploitation of these works is around the corner. We must be aware of it. The mass media do not have the skills to judge whether one research is valid or not. Somehow, they trust scientific communication, even if they do not always fully understand it. A communication distortion was, therefore, created.

From this distortion, a new mission is born, which is ours, but also of many other scientists (see the end of the post): to communicate concepts, models, results, which simultaneously have the same scientific solidity of well-done research and the typical immediacy of the phenomena that shake the masses. Communicating science through mass media is not trivial. Excellent examples are (some in Italian and some in English):

- https://barbaragallavotti.wordpress.com

- http://www.mathisintheair

- http://maddmaths.simai.eu/

     https://cattiviscienziati.com/

-      https://www.isi-web.org/index.php/news-featured/20229-statisticians-react-to-the-news-every-week

    https://statmodeling.stat.columbia.edu/


all blogs that take the space and time to explain things well.

Scientific communication on social media is still a very young and inconsistent creature; it does not have a well-defined identity. We are trying to give it one, starting with warning against the "ad hoc" manipulative sensationalism and elaborations that sometimes come together (see Sweden's case, a failure and not a panacea).

Let's not forget the responsibility that all of us communicators (of science and the masses) have. Better a little less media visibility and good research than an approximation and the search for the scoop to impress, sometimes upset (terrify) the masses. We reiterate that we do not cheer for science. We are not sellers of opinions, "science is not democratic"; it is competence, and this is what must be valued and defended.



 



Comunicare la scienza in tempi di pandemia

 


(foto presa da qui ))


Ogni volta che scriviamo un post, c’è una domanda che immancabilmente ci guida: “Come facciamo a spiegare l’epidemia in modo che anche senza istruzione tecnica si abbia coscienza di cosa sta accadendo?”. In realtà, c’è molto di più dietro questa domanda, c’è il rapporto tra comunicazione scientifica, spesso tecnica e fredda, e comunicazione di massa, guidata da sentimenti e paure. Le riviste scientifiche sono il luogo per comunicare scienza. Un lavoro scientifico di impatto, un lavoro che scuote la comunità scientifica, ha un elevato grado di affidabilità e, generalmente, richiede molto tempo, molto lavoro e molti dati.

I giornali, i blog, i social network, invece, sono i principali luoghi per comunicare con la massa (i mass-media). Ovviamente, i mass-media non possono aspettare i tempi della scienza. La comunicazione di massa è "veloce" e, a volte, guidata dal desiderio dello "scoop", del sensazionale. In una situazione normale, i due modi di comunicare non si integrano spesso.
Questa epidemia ha avvicinato i due mondi: la sensazionalità e la ricerca dello scoop scientifico ha pervaso le riviste scientifiche, la solidità e razionalità delle ricerche scientifiche ha fatto breccia nei comunicatori che non si erano mai occupati di scienza. Non è detto che questo, però, sia un bene.
Molte riviste scientifiche di alto profilo hanno rubato il modo di comunicare dai mass-media e danno ampio spazio ad “esercizi intellettuali” sul covid (in stile “chi ha il modello più lungo”), basati su ipotesi incerte, su pochissimi dati e modelli approssimativi. Science, non il Corriere dei Piccoli, ne è pieno. In un’altra epoca le riviste scientifiche avrebbero rifiutato come inconsistenti tutti questi esercizi intellettuali senza battere ciglio. In un momento come questo dare spazio a studi mal costruiti, senza chiare premesse sulla validità dei dati e dei metodi è un atto irresponsabile. La strumentalizzazione di questi lavori è dietro l'angolo, bisogna esserne consapevoli, perché i mass-media non hanno le competenze di giudicare se una ricerca sia valida o meno; in un certo senso, si fidano della comunicazione scientifica, seppur non la comprendano sempre fino in fondo. Si è creata quindi una distorsione comunicativa.
Da questa distorsione nasce una nuova missione, che è la nostra, ma anche di tanti altri scienziati (vedi la fine del post): comunicare concetti, modelli, risultati, che abbiano simultaneamente la stessa solidità scientifica delle ricerche ben fatte e l’immediatezza tipica dei fenomeni che scuotono le masse. Comunicare scienza tramite i mass-media non è banale. Ottimi esempi sono
tutti blog che si prendono lo spazio e il tempo per spiegare bene le cose.
La comunicazione scientifica sui social è ancora una creatura giovanissima e capricciosa, non ha un'identità ben definita. Stiamo provando a dargliene una, cominciando dal mettere in guardia contro i sensazionalismi e le elaborazioni "ad hoc", manipolative, che a volte si incontrano (vedete il caso della Svezia, un fallimento e non una panacea).
Non dimentichiamo la responsabilità che tutti noi comunicatori (di scienza e di massa) abbiamo. Meglio un po’ di visibilità mediatica in meno e una buona ricerca, che l’approssimazione e la ricerca dello scoop per impressionare, a volte turbare (terrorizzare), le masse. Ribadiamo che non si fa il tifo per la scienza, non siamo venditori di opinioni, “la scienza non è democratica”, è competenza ed è questa che va valorizzata e difesa.