Lettere
11/09/2020

Suggerimenti per analizzare i dati della pandemia da Covid-19 in Italia

, , ,

Negli ultimi mesi abbiamo ricevuto diverse informazioni discordanti in merito ai dati che si riferiscono alla pandemia da Covid-19. È molto difficile definire un chiaro andamento temporale dei nuovi casi affetti da Covid-19. Ciò è particolarmente evidente per i dati epidemiologici che riguardano la Lombardia se tali dati vengono analizzati razionalmente, tralasciando interpretazioni guidate dall’inevitabile emotività del momento. Ogni giorno siamo subissati da molteplici messaggi, ma l’eterogeneità dei dati su cui si basano e la possibilità di trarne false conclusioni costituiscono un rischio reale.
Vorremmo, pertanto, sottolineare alcuni semplici concetti relativi al disegno degli studi clinici.
In primo luogo, sarebbe fuorviante confrontare i numeri assoluti dei nuovi casi affetti da Covid-19, rilevati in giorni successivi, a causa dell’eterogeneità dei casi diagnosticati da un giorno all’altro. Infatti, sarebbe necessario definire con precisione le caratteristiche cliniche dei campioni su cui vengono riscontrati i nuovi casi positivi e, soprattutto, comunicare anche il valore dei denominatori su cui gli indicatori vengono calcolati.
In secondo luogo, confrontare le percentuali dei nuovi casi affetti da Covid-19 con le precedenti non sarebbe corretto se i campioni di soggetti su cui vengono effettuati i test differissero per rilevanti caratteristiche cliniche.
In terzo luogo, le linee guida per la somministrazione dei test diagnostici, che documentano l’infezione da Covid-19, hanno subito diverse modifiche a partire dal giorno in cui è stato identificato il primo paziente italiano e vengono costantemente aggiornate.
Con il passare del tempo, si sono resi disponibili nuovi test diagnostici, ma le due più importanti caratteristiche per valutarne il grado di affidabilità, cioè sensibilità e specificità, non sono sempre disponibili. Di conseguenza, non è possibile stabilire il numero dei falsi positivi, dei falsi negativi e i valori predittivi.
Infine, nessun modello statistico e predittivo può compensare la scarsa qualità del dato; pertanto, questi modelli potrebbero fallire nella predizione nel caso analizzassero dati di scarsa qualità.
Al momento, gli unici dati attendibili riguardano il numero di nuovi casi ospedalizzati e il numero dei nuovi accessi alle terapie intensive, ma è solo la punta di un iceberg. Poiché i test diagnostici vengono somministrati solo ai soggetti sintomatici, non conosciamo la proporzione dei soggetti asintomatici né quella dei soggetti che mostrano sintomi lievi di infezione.
Per poter eseguire predizioni corrette, dovremmo poter utilizzare analisi statistiche robuste che analizzino dati di alta qualità e dovremmo sorvegliare gli esiti in un arco temporale piuttosto lungo, in quanto pochi giorni di osservazione non sarebbero sufficienti.
Oggi, a tre mesi dall’inizio dell’epidemia in Italia, si può forse affermare che lo screening (test sierologici associati a tampone nasofaringeo) su campioni rappresentativi della popolazione generale e il follow-up attivo dei soggetti esaminati avrebbero potuto fornire un quadro epidemico più preciso, permettendo di stimare la reale prevalenza dell’infezione e le diverse fasi di malattia. D’altra parte, una politica simile, su vasta scala, è stata assunta dalla regione Veneto, che verosimilmente fornirà anche informazioni per la previsione delle necessità sanitarie future e per la conseguente organizzazione dei servizi, fra i quali la sorveglianza sul territorio, che riveste un’importanza fondamentale.
Ci auguriamo che queste poche e semplici considerazioni possano essere di aiuto ai decisori politici per poter prendere i provvedimenti più appropriati in ambito sanitario, suffragati da dati di alta qualità e da analisi statistiche robuste.

Conflitti di interesse dichiarati: nessuno.
Data di sottomissione: 30 marzo 2020.

Approfondisci su epiprev.it Vai all'articolo su epiprev.it Versione Google AMP