Identifying the Italian provinces with increased mortality during COVID-19 epidemics using the data made available by the Italian National Institute of Statistics. A methodological challenge
OBIETTIVI: identificare le province italiane con eccesso di mortalità durante l’epidemia di COVID-19 usando i dati resi disponibili dall’Istat nel mese di aprile, che includevano solo i comuni per i quali fosse stato riscontrato, a partire dal 1° marzo, un incremento della mortalità pari ad almeno il 20% rispetto al quinquennio precedente. Al rilascio dei dati era molto importante identificare le province con eccesso di mortalità, ma l’inferenza basata sull’aggregazione dei dati a livello provinciale non poteva considerarsi valida.
DISEGNO: approccio basato sulle permutazioni per identificare le province italiane con eccesso di mortalità durante il primo mese dell’epidemia di COVID-19, usando i dati resi disponibili dall’Istat e tenendo conto dei criteri di selezione dei comuni.
SETTING E PARTECIPANTI: il numero di decessi per tutte le cause è disponibile dal primo gennaio per gli anni 2015-2020; i dati sono stratificati per comune, sesso e categoria d’età. Il terzo aggiornamento dei dati rilasciato dall’Istat (R3) include 1.686 comuni italiani con eccesso di mortalità e il 40% della popolazione italiana. I risultati sono confrontati con quelli ottenibili per lo stesso periodo con il quinto aggiornamento (R5), reso disponibile a giugno, dove la selezione dei comuni non è basata sull’eccesso di mortalità e che include più del 90% della popolazione italiana. R5 è stato considerato come gold standard.
PRINCIPALI MISURE DI OUTCOME: eccesso di mortalità nelle province italiane nel periodo tra il 1° marzo e il 4 aprile; rischio relativo (RR); p-value di permutazione; rischio relativo aggiustato; copertura della popolazione.
RISULTATI: i risultati di questo studio si basano su due statistiche test e identificano, rispettivamente 17 e 33 province (su 103) con eccesso di mortalità, controllando l’errore di primo tipo per la famiglia di test a livello 0,05. La maggior parte delle province è localizzata nelle regioni Lombardia, Emilia-Romagna, Piemonte, Liguria, Marche e Toscana, dove è stato identificato il maggior numero di casi di COVID-19. Il confronto con i dati di R5 dimostra che tutte le province identificate avevano un aumento di mortalità, pari ad almeno il 25% per 31/34 province identificate. Il RR aggiustato diminuisce considerevolmente la distorsione degli RR di R3, in media sottostimando leggermente i RR di R5 (sottostimando i RR elevati e sovrastimando quelli bassi).
CONCLUSIONI: questo lavoro costituisce, a conoscenza degli autori, il primo tentativo di aggregazione dei dati Istat a livello provinciale con il fine di ottenere un’inferenza valida e generalizzabile. Questo metodo basato sulle permutazioni costituisce un approccio utilizzabile per tenere conto del bias di selezione e può essere utilizzato per altri dati con problemi simili.