Alcune possibili anomalie nelle analisi con MADE
MADE utilizza i dati pubblicati della Protezione Civile sul suo sito in Internet. I dati sono raccolti dal Ministero della Salute su invio delle diverse Regioni. È normale che una pubblicazione di dati “quasi in diretta” possa contenere delle imperfezioni anche perché questo sistema informativo è stato organizzato all’improvviso e sicuramente i vari enti sono stati più coinvolti nei problemi assistenziali che in quelli statistici. Peraltro, invece, mai come in questa situazione i dati hanno determinato le scelte politiche relative alle misure preventive e di contenimento. Mai ci saremmo aspettati solo pochi mesi fa, ad esempio, che la magistratura si occupasse di verificare la correttezza dei dati trasmessi e pubblicati come sta succedendo per la Regione Lombardia e per la Regione Sicilia.
Al di là della qualità di questi dati, non possiamo però non ringraziare tutti gli operatori di questo lavoro di documentazione e il Ministero della Salute e la Protezione Civile per aver reso possibile la pubblicazione dei dati notificati in giornata, o per lo meno nel giorno precedente, ogni sera. Ci rendiamo conto che i meccanismi di rilevazione, notifica, raccolta, trasmissione, pubblicazione subiscono delle variazioni intra settimanali costanti, ma è naturale che questo avvenga dato che gli addetti a questo sistema per lo più non lavorano durante i fine settimana.
Al di là però di questa ciclicità, che MADE risolve per lo più proponendo delle medie mobili settimanali e offrendo un’analisi dell’andamento epidemico con un modello di ciclo trend, ci sono delle anomalie più importanti che derivano dalle rettifiche che le Regioni segnalano rispetto ai dati precedentemente trasmessi.
Nel file qui allegato [discordanze presenti nei dati pubblicati dalla Protezione Civile.xlsx] si riportano i dati trasmessi giornalmente dalla Protezione Civile con alcuni nostri controlli di corrispondenza tra le diverse frequenze. Si può vedere innanzitutto come il totale dei positivi “attivi” corrisponda sempre alla somma del totale dei ricoverati più il totale dei confinati in isolamento domiciliare. Questo non significa che i dati siano di per sé esatti ma solo che il totale dei positivi attivi è sempre calcolato come somma e quindi corrisponde.
Diverso è il problema della corrispondenza dei dati di prevalenza come somma algebrica delle diverse incidenze: le variazioni giornaliere della prevalenza di positivi attivi dovrebbero dipendere dall’addizione dei nuovi positivi e dalla sottrazione dei deceduti e dei negativizzati. Per lo più i calcoli tornano, talvolta con piccole rettifiche anche segnalate dalle note introdotte nei files della Protezione Civile. Le piccole discordanze (<100) non modificano per lo più il significato dei risultati delle analisi e nel file allegato sono segnalate con colore giallo (in azzurro le esatte corrispondenze).
Vi sono però anche discordanze importanti segnalate in arancio se >100 e <1000 e in rosso se >= 1000, e sono le seguenti correzioni relative alle variazioni della precedente prevalenza di positivi:
Data | Variazione | Data | Variazione |
---|---|---|---|
19 giugno 2020 | +399 | 10 marzo 2021 | +134 |
24 giugno 2020 | -387 | 21 marzo 2021 | +114 |
18 dicembre 2020 | +2.591 | 22 marzo 2021 | -10.655 |
23 dicembre 2020 | +614 | 1° aprile 2021 | +234 |
Chiariamo nuovamente che facciamo questa comunicazione solo per aiutare ad interpretare alcune anomalie che possono evidenziarsi nelle analisi ed invece apprezziamo lo sforzo del Ministero che correggere i dati conseguentemente alle notifiche ricevute.