https://epiprev.it/5500

<iframe id="epiFrame1755644773" frameborder="0" style="min-height: 580px; width: 100%; max-width: 480px" src="https://epiprev.it/blog/come-sta-la-sanita/lincertezza-delle-definizioni-e-delle-frequenze/embed"></iframe>

BLOG Come sta la sanità? 6 minuti di lettura

Il blog di Cesare Cislaghi

08/03/2021 17:56

Malattie Trasmissibili

Foto di Gerd Altmann da Pixabay

https://epiprev.it/documenti/get_image.php?img=files/2021/cislaghi/immagini/incertezza-01.jpg

L’incertezza delle definizioni e delle frequenze

Cesare Cislaghi¹

Affiliazioni

Epi-economista

Uno dei problemi ricorrenti in statistica e forse ancor più in epidemiologia sono le definizioni delle entità che si misurano o si enumerano e da cui spesso dipende l’andamento delle frequenze degli eventi considerasti. Talvolta nelle definizioni si è sostenuti da una norma stabilita da una “agenzia” alla quale ci si dovrebbe riferire, sia questa governativa o accademica, ma spesso anche non la si segue.

Nel far statistica sugli eventi dell’epidemia da Covid-19 i principali problemi di definizione sono i seguenti: Chi è infetto e chi no? Come definiamo i “casi”? e chi non è caso non è sicuramente infetto? Chi è sintomatico? Per quali sintomi? E qual è la sicurezza della relazione tra sintomi e contagio? E gli asintomatici con sintomi non da Covid-19 sono sintomatici? Chi sono i decessi da Covid-19? E siamo sicuri che riconosciamo tutti e solo i casi di decessi dovuti al Covid-19?

Il problema della definizione delle diverse entità possono comportare anche gravi distorsioni nelle statistiche: L’incidenza è calcolata sulle diagnosi e non sappiamo quanto queste siano complete; la quota dei sintomatici per lo più ha solo una base soggettiva anamnestica; il calcolo della letalità dipende sia dalla correttezza della definizione della causa di decesso sia dalla completezza del denominatore costituito dal totale dei casi diagnosticati. Esaminiamo qualcuno di questi problemi.

Quanti infetti sono riconosciuti come casi?

La prima definizione di caso è stata data dalla circolare 2392 del 27 gennaio 2020 che distingueva i cassi sospetti, probabili e confermati. Per caso confermato si intendeva “Una persona con conferma di laboratorio effettuata [solo] presso il laboratorio di riferimento dell’Istituto Superiore di Sanità per infezione da 2019-nCoV, indipendentemente dai segni e dai sintomi clinici.” La definizione poi si è subito allargata (circolare n. 7922 Circolare Ministero Salute 9 marzo 2020) anche alle conferme effettuate presso i laboratori Regionali di Riferimento che rispondano ai criteri indicati alla circolare.

In questa prima fase dell’epidemia la disponibilità dei test molecolari era quindi molto limitata e venivano effettuati solo sui malati con grave sintomatologia che si presentavano presso un ospedale. Un trattamento più organico dell’argomento lo si trova nel rapporto ISS COVID-19 n. 49/2020 (ad esempio nella versione 8 giugno 2020) che da anche le definizioni di “contatto” e di “decesso” da Covid-19.

Infine nella circolare 705 dell’8 gennaio 2021 si pongono vari criteri clinici, radiologici, epidemiologici e di laboratorio utili alla definizione di caso, confermando però che caso confermato è solo “Una persona che soddisfi il criterio di laboratorio” ( ed tra questi sono stati inseriti anche i test antigenici rapidi) e che ai fini della sorveglianza nazionale Covid-19 (sia flusso casi individuali coordinato da ISS che quello aggregato, coordinato da Ministero della Salute) dovranno essere segnalati solo i casi classificati come confermati secondo la nuova definizione.

In conclusione dal punto di vista delle statistiche del Ministero, i casi sono i soggetti con un test confermato positivo. Queste definizioni garantiscono la pressoche assenza di falsi positivi nella classificazione dei contagi ma lasciano ovviamente del tutto aperto il problema più grave, quello dei falsi negativi, cioè quanti soggetti infetti ci sono de ciorcolano senza che siano stati diagnosticati?

Una prima valutazione potrebbe ricavarsi dall’Indagine Istat/Ministero sulla prevalenza sierologica svoltasi da 25 maggio al 15 luglio 2020 e da cui sono state stimate in Italia un numero di 1.482.377 persone con IgG positive al Covid-19, cioè pari al 2,47% della popolazione. In una data intermedia, il 20 giugno, i casi accertati dall’inizio dell’epidemia con tampone molecolare positivo, risultavano essere 238.275, cioè lo 0,40% degli italiani. Quindi per ogni positivo diagnosticato sono stati trovati 6,22 sieropositivi. Questa quota di contagiati non diagnosticati risente però certamente della scarsa quantità di tamponi eseguiti durante tutta la prima ondata dell’epidemia.

Una seconda stima può esser fatta attraverso lo screening con test antigenico svoltasi a Bolzano dal 20 al 22 novembre 2020. Su 536.667 residenti hanno aderito allo screening 350.848, cioè il 65,4% e di costoro sono risultati positivi 3.619, cioè l’1,03%. Il 20 luglio in provincia di Bolzano la prevalenza di positivi attivi diagnosticati era di 11.511, cioè il 2,15%. Possiamo allora stimare che la prevalenza globale di infetti fosse del 3,18% e che i non diagnosticati fossero il 32,4%, cioè ogni tre infetti uno non era stato diagnosticato.

Questa stima è importante quando si voglia poi stimare ad esempio la percentuale di infetti che vengono ricoverati o che muoiono, ma sarebbe anche importante avere delle stime accettabili di infetti per classi di età. L’indagine Istat da delle prevalente di sieropositivi non molto diverse tra le diverse classi di età. La prevalenza sarebbe identica per genere e solo leggermente più elevata nella classe di età 50-59. Oggi si osserva un aumento di incidenza di contagi nei minori ma non si può essere del tutto certi che questo sia un aumento reale di infetti o solo un aumento di casi diagnosticati anche come conseguenza delle notizie diffuse al riguardo o anche alla maggior prevalenza di banali patologie stagionali “a frigore”, usuali nei bambini nei mesi invernali, che potrebbero aver fatto aumentare i sospetti e quindi anche le pratiche diagnostiche con tampone. L’incidenza per età pubblicata dall’Istituto superiore di Sanità, infatti, sembra raccontare una realtà molto diversa e che fa sospettare che la bassa incidenza nei più giovani possa essere, almeno in parte, frutto di un basso tasso di accesso ai tamponi, magari aumentato nelle ultime settimane; sarebbe importante capirlo ma ahimè non sembra ci siano nei dati disponibili, gli estremi per risolvere il quesito! In conclusione non sappiamo, ahimè, neppure con stime grossolane, quanti potrebbero essere gli infetti non diagnosticati, né per età né totali, e questa incertezza si riversa sulle stime di molto degli indicatori che calcoliamo per valutare l’andamento dell’epidemia.

Qual è il rapporto tra sintomatici e asintomatici?

Un’altra incertezza riguarda poi il rapporto tra sintomatici e asintomatici. Nel rapporto dell’ISS sopra citato, viene riportato l’andamento dello stato clinico degli infetti diagnosticati qui a fianco riportato. Guardando l’ultimo giorno descritto, il 15/2, si vede come gli asintomatici siano più della metà degli infetti diagnosticati e se si aggiungono i pauci sintomatici si arriva ai tre quarti. Ma quali sono i sintomi? E sono sintomi generici o specifici? Il Ministero "ricorda" che i Centers for Disease Control and prevention statunitensi hanno identificato i seguenti sintomi come tipici dell’infezione COVID-19: febbre, tosse, dispnea, brividi, tremore, dolori muscolari, cefalea, mal di gola, perdita acuta di olfatto e gusto. Mi sembra evidente che molti sintomi sono comuni a tante banali disturbi e quindi quando la sintomatologia è lieve non è cosi certo che sia da attribuire al contagio da Covid-19 tranne forse per la perdita acuta di olfatto e gusto. Va anche osservato che molti dei sintomi sono anamnestici ed auto dichiarati e soprattutto per nessuno è sempre agevole ricordare a quale giorno esattamente risalga la loro insorgenza.

Appare allora molto incerto il calcolo di qualsiasi indicatore, come l’R_t, che venga calcolato sull’informazione della data di inizio sintomi escludendo quindi la metà o i tre quarti dei contagi diagnosticati.

La codifica della causa del decesso

L’Istat e l’ISS hanno compilato un Rapporto approfondito riguardante la codifica delle cause di morte da Covid-19.

È probabile che i decessi accaduti in ospedale abbiano una certificazione e conseguente codifica corretta ed omogenea; molto diversa probabilmente è la situazione per i decessi avvenuti a domicilio soprattutto per le persone molto anziane con un decorso magari acuto dell’esito. Anche in questo caso ci saranno forse più falsi negativi che falsi positivi. Ma il problema del calcolo dell’incidenza forse non sta tanto nel numeratore quanto nel denominatore.

L’incertezza sulla misura della letalità è infatti una delle tante incertezze dell’epidemiologia delle infezioni da Covid-19. Si distingue solitamente il CFR (Case Fatality ratio) dall’ìIFR (Infect Fatality Ratio). La stima del CFR in questi giorni di inizio 2021 oscilla tra il 2,5% e il 3,5% mentre in. letteratura le stime dell’IFR vanno dallo 0,5% all’1,25%. Ciò significa che se queste stime fossero “vere” i nostri calcoli della letalità la sovra stimerebbero dalle 2 alle 7 volte! Come a dire che non ci azzeccano.

Che auspicare, allora?

Sarebbe allora necessario che da una parte le definizioni delle condizioni riguardanti i contagi siano più chiare e vincolanti, che poi si possa valutarne l’applicazione da parte degli operatori e che inoltre per alcuni aspetti si abbiano delle stime di riferimento, magari ottenute con indagini campionarie, anche limitate, ma capaci di orientare l’interpretazione degli andamenti costruiti sui dati che provengono dalle attività assistenziali del SSN.

Per realizzare ciò che qui si auspica sarebbe buona cosa che a livello dei gruppi di lavoro ministeriali e inter regionali chiamassero anche gli epidemiologi esterni alle istituzioni del SSN ma attenti e propositivi; la loro collaborazione, se necessario anche critica, potrebbe aiutare a migliorare l’attuale sistema di lettura e di predisposizione delle misure necessarie di contenimento.

08/03/2021 Visite

Commenti: 1

1. Certezza e frequenza del dato. La questione della mortalità COVID19 e dell’eccesso di quella totale.

Eugenio Paci - 15/03/2021 12:17

L’epidemiologia si basa sul dato e il dato è costruito in base a definizioni e classificazioni condivise scientificamente e internazionalmente, come ci ricorda il blog di Cesare Cislaghi.

Avviare, a partire da questo aspetto, la riflessione sulla pandemia COVID19 a un anno dall’inizio della pandemia (Marzo 2020), quando i dati ufficiali COVID19 raggiungono i 100.000 decessi è un utile suggerimento. In questi stessi giorni, il rapporto ISS-ISTAT ci fornisce anche i dati di mortalità totale per l’anno 2020, dove l’eccesso di mortalità totale rispetto al 2015-19 è valutato a 6 cifre già alla fine dell’anno 2020 (N=108.178 da Marzo a Dicembre, i casi ufficiali COVID19 erano stimati 75.891). Dai dati derivano significati e interpretazioni dei risultati che definiscono le narrative della pandemia COVID19. In una pandemia dove siamo stati giornalmente aggiornati con dati e parametri e tutti noi siamo soggetti a algoritmi presentati come tavolozze di colori, la necessità di comprendere le ragioni di questa discrepanza tra fonti informative è evidente. Tuttavia, essa non è sufficientemente raccontata e conosciuta.

Due premesse, solo apparentemente tecniche. La prima riguarda il rapporto tra l’epidemiologia e il tempo. Le decisioni di policy di quest’anno sono state molto influenzate dai dati, dai modelli (come quello di Ferguson e altri) e dalle narrative sull’epidemie (come quella di Thomas Pueyo, sul martello e la danza). Gli epidemiologi sono sempre stati abituati a lavorare su tempi medio-lunghi, almeno in Italia, due anni al minimo, per avere le statistiche di mortalità totale. Spesso si sentiva dire: a che servono i risultati rapidi, i dati prodotti in fretta? Oggi questo non è più vero. Il prodotto epidemiologico, l’interpretazione dei dati rapida, ha molto influenzato le policy e le decisioni. La seconda riguarda l’universalità del dato. Anche qui, quante volte ci si è confrontati sulla scelta tra registri di popolazione o ospedalieri, stime basate su campioni o su popolazione totale. Lo sviluppo del rapporto dati/comunicazione che si è avuto con questa pandemia ci ha offerto dati globali, aggiornati ogni giorno su siti web e immediatamente promossi sui principali giornali e media mondiali con grafici accattivanti. I dati disponibili hanno scatenato la produzione di elaborazioni statistiche ogni giorno, discusse da profani ed esperti di ogni settore sui media e sui social. Nessuno, in questo anno, ha pensato di limitarsi, nel documentare la pandemia, a studi di campioni. Quando si è provato a fare indagini campionarie, come la survey sulla immunità acquisita, hanno avuto scarsissimo impatto. Dati e comunicazione epidemiologica sono cambiati totalmente, forse in maniera irreversibile, e ognuno vuole il suo dato, l’epidemia nella sua Provincia, magari nel suo Comune e comunque per il suo Paese. Conseguenza di tutto questo è stata anche la nuova stagione delle pubblicazioni, con i preprint, che hanno permesso una discussione rapida dei risultati scientifici, nel bene e nel male.

Rapidi e globali, che piaccia o meno.

In questa situazione, la validità del dato di cui ci parla Cislaghi nel suo blog deve, con molti altri fattori, considerare il tempo. I dati sono, in quest’epoca, sempre preliminari, instabili, in attesa di registrazione, come specificato in ogni grafico. Il sistema informativo rapido è esigente perché connesso alla comunicazione e alle decisioni. Dobbiamo capire cosa è necessario fare per migliorare in corso d’opera la tempistica, ma senza penalizzare in futuro la validità e qualità. Cislaghi approfondisce la definizione di caso, che certamente ha condizionato molto l’interpretazione della pandemia e la sua narrativa. Io qui mi concentro sulla mortalità per COVID19, che è molto condizionata da come il caso di infezione è definito e riflette le molte incertezze da lui ben descritte.

La risposta alla questione classificatoria di decesso data dal WHO nell’Aprile 2020 è stata pragmatica e, a mio avviso, chiara. E’ spiegata nelle linee guida WHO. In parte, è divenuta un pò più complessa recentemente, ma quella dell’Aprile 2020 è una solida base. In termini operazionali è presentata nella codifica ICD. Sono evidenti le implicazioni che queste classificazioni hanno in rapporto all’uso di software di codifica automatica, la cui implementazione da parte di ISTAT è stata, negli anni, assai lenta. Su questo aspetto, che non è solo tecnico ma vitale per la sanità pubblica, sarebbe interessante conoscere l’esperienza e il parere di chi ha lavorato in questi mesi sui sistemi rapidi di mortalità, come EUROMOMO, ma anche di chi si occupa di sistemi informativi e in particolare di mortalità. La attribuzione dicotomica fatta da Office of National Statistics per il Regno Unito (ONS-UK) a COVID19 con i termini due to COVID19 se nel certificato è la causa underlying o quella ad Involving COVID19 quando il termine COVID19 compare comunque tra le cause di morte, in qualsiasi posizione, ha una sua logica. Include i casi clinici anche se può, forse, ad attenta revisione portare a qualche sovrastima. E’ trattabile facilmente dalla codifica automatica. Non include comunque i decessi che possiamo chiamare falsi negativi, quelli per esempio nelle case di riposo dove, in presenza di molte comorbidità, non si era, nella prima fase, ipotizzata la presenza di COVID19.

In breve, la semplificazione può aver sacrificato la validità (rivedibile) al tempo di produzione del dato rapido (che però è essenziale per la policy).

Al momento, considerando l’eccesso totale di mortalità generale rispetto agli anni 2015-19, i casi due to COVID19 sono stati stimati come l’85% del totale Involving COVID19, cioè dei casi con la citazione in qualsiasi zona del certificato. L’errore è considerato limitato, e questo è sicuramente più vero nelle successive ondate, quando il numero di test molecolari per il virus è molto aumentato. Le stime inglesi sono aggiornate settimanalmente, Public Health England analizza in dettaglio la mortalità in eccesso settimanalmente fornendo una analisi tecnica assai approfondita ma anche discutibile. Sarebbero necessari approfondimenti metodologici per capire meglio queste nuove misure che si stanno proponendo a livello internazionale e che si basano su regole da considerare improvvisate e non pienamente condivise. L’importante però è che ONS -UK e altri centri di epidemiologia e statistica le stanno producendo.

Tra questi dati, è assai importante il luogo di morte, che ha dimostrato l’ importante eccesso di mortalità totale, l’ epidemia nascosta, che si è verificata nella prima ondata nelle case di riposo. In Gran Bretagna oggi si pubblicano dati settimanali dei residenti in home care. Un monitoraggio costante, certamente particolarmente utile per valutare la vaccinazione in questi soggetti per lo più anziani e con multicronicità.

Da questa esperienza discende la necessità urgente di (RI)COSTRUZIONE dei sistemi informativi nazionali per la salute, la sanità e il welfare, con una ottica universalistica, integrata e nazionale. Questo non potrà che partire dal riconoscere la grave insufficienza dei sistemi informativi e di monitoraggio stand-alone come sono quelli tipici delle patologie infettive, che vengono attivati per singole patologie e che hanno portato, in assenza di informazioni complementari, a non vedere una larga fetta della epidemia COVID19, circa il 30%, quasi 35000 decessi, di quelli totali in eccesso e in larga parte attribuibili in larga parte a COVID19. In un recente webinar Italiano su RSA e COVID19, organizzato da INSH/Univ.SantAnna/ISqua, nella sessione epidemiologica che ho introdotto presentando la realtà Italiana, la Dottsssa Comas Herrera, che ha organizzato un grande Network internazionale per lo studio dell’impatto epidemico sulle home care, ha riportato dati su 22 paesi con una stima complessiva che valuta nel 40% il contributo delle case di riposo all’ eccesso totale di mortalità totale, e larga parte di questi decessi non erano tra quelli ufficialmente COVID19.

Una questione dolorosa e grave per tanti aspetti, ma che finora, soprattutto in Italia, è stata affrontata soprattutto dalla magistratura. ISS e ISTAT hanno pubblicato il dato di mortalità totale 2020, suddiviso per aree territoriali e in tre periodi temporali. Ci sono i dati per età/sesso, che confermano stime di altri paesi, ma non vengono presentati i dati per luogo morte, che pure sono presenti nei certificati di morte. In Italia gli unici dati disponibili su base di popolazione, almeno a mia conoscenza, sono quelli dell’Unità Operativa di Epidemiologia di ATS Milano pubblicati nel Maggio 2020, che ho discusso nella mia introduzione al webinar. La stima era di circa un 30-40% dei decessi attribuibili a decessi in casa di riposo. Dati preliminari, ancora in attesa di conferma. Ma che rimarranno pressoché unici e che non si accompagnano, almeno per ora, a valutazioni durante la seconda ondata (da Ottobre 2020 a Gennaio 2021). Pochi dati, aneddotici, sono stati per ora comunicati per dimostrare, in qualche area, l’impatto della vaccinazione.

E’difficile capire perché non si pubblichino i dati sul luogo di morte. E ‘opportuno ricordare che il Governatore Cuomo, a New York, tra i primi a usare il sistema rapido di mortalità e a dichiarare il grande tributo dei decessi in casa di riposo, è oggetto di una indagine giudiziaria per aver nascosto informazioni che pure esistevano. Sarebbe utile sapere se queste informazioni esistano o no, e che venissero comunque detti i loro limiti e messi comunque a disposizione, seppure incompleti, insieme agli altri dati. Sarebbe veramente un disastro se ancora una volta il rilascio di queste informazioni dovesse venire per l’azione della magistratura.

Lascia un commento...Inserisci qui il tuo commento...