Manca qualcosa: cosa c’è di sbagliato nell’usare l’età alla diagnosi/decesso o la latenza nei casi
In base ai libri di testo che fondano il paradigma (nell’accezione di Kuhn)1 al quale si adegua una determinata disciplina scientifica, si può dire che l’epidemiologia, diversamente dallamedicina, si rivolge alla popolazione nel suo insieme. AlfredoMorabia identifica in questo population thinking uno dei tratti distintivi dell’epidemiologia.2 Rodolfo Saracci osserva che l’epidemiologo svolge una funzione diagnostica (in senso lato, comprendente anche eziologia e prognosi) per la salute di una comunità, come ilmedico fa per l’individuo.3 Olli S.Miettinen in un suo recente libro definisce l’epidemiologia semplicemente «medicina di comunità».4 La distinzione storica tra interesse verso la comunità e interesse per l’individuo è ancora presente nel testo di Brian MacMahon e Tom Pugh,5 ma non più nel libro di Miettinen del 1985, dove si parla di «funzione di occorrenza».6 Ciò sposta l’accento sulla stima dei parametri di un modello probabilistico sostanzialmente di tipo eziologico, ma non solo. L’epidemiologia moderna si pone più come metodologia per la ricerca in medicina, sia osservazionale sia sperimentale e clinica, e perde quel connotato di «popolazione» che rimane più confinato al campo igienistico. In questo passaggio, la difficoltà è essenzialmente inferenziale: per stimare l’effetto causale di un intervento non c’è altra possibilità se non ricorrere allo studio di un gruppo di soggetti; quindi si può stimare solo l’effetto causale medio, non quello di un singolo individuo. I rischi che studiamo sono quantificati solo a partire da dati di popolazione anche quando applicati al singolo. Per raggiungere i suoi scopi, negli ultimi decenni l’epidemiologia ha sviluppato metodi propri ben definiti,2 che si basano sulle misure della frequenza di malattia in una popolazione: tasso, rischio, odds, incidenza, prevalenza.2,7,8 Tali misure sono il risultato della divisione tra un numeratore (il numero di casi di malattia) e un denominatore, eventualmente costituito da un campione, come i controlli in uno studio caso-controllo.9,10 Il denominatore di cui si parla è essenzialmente il tempo di osservazione dei soggetti (tempo-persona). Trascurare tali tempi e basarsi solo sul numeratore (casi) pregiudica quasi sempre qualsiasi tipo di analisi e inferenza, portando a una serie di errori di interpretazione. Fanno eccezione a questa regola gli studi case-only, utilizzabili per obiettivi particolari e sotto specifiche condizioni relative alla popolazione, nei quali i denominatori sono implicitamente presenti, e gli studi case-crossover, in cui i casi stessi forniscono il denominatore.7,10 Fare epidemiologia implica tenersi ancorati a concetti e metodi ben definiti, ancorché in continua evoluzione. Sono pertanto da salutare con favore iniziative come quella recentemente proposta dall’International Journal of Epidemiology, che ha lanciato una nuova sezione chiamata The education corner con lo scopo di fornire «aggiornamenti e rassegne concisi di concetti e metodi epidemiologici».11 Infatti, in alcune situazioni può capitare di scordare i principi basilari e di farsi guidare (fuori strada) dal buon senso.12 In questa rubrica si intendono segnalare le insidie metodologiche insite nell’analizzare i soli casi di malattia, in assenza di adeguati denominatori. In particolare, si riportano alcuni esempi di fallacia riguardanti l’uso dell’età alla diagnosi (o alla morte) di una certa malattia e l’uso della latenza, misurate in una serie di casi senza denominatore. Infine, si discute dei motivi per cui bisogna evitare questo modo di procedere. Ulteriori esempi sono pubblicati come materiali aggiuntivi sul sito di E&P (http://www.epiprev.it).
Fallacia nell’uso dell’età alla diagnosi/decesso
Esempio 1 Fumo e tumore polmonare Negli anni Sessanta un patologo inglese sostenne che il fumo non causava tumore polmonare sulla base del fatto che l’età alla diagnosi in una serie di casi era simile tra fumatori e non fumatori.13 Argomentava inoltre che il nickel e il cromo non erano cause di tumore polmonare sulla base di analoghi calcoli sull’età media al decesso.
Esempio 2 Fumo e tumore polmonare (esperienza personale) In un recente studio caso-controllomulticentrico internazionale sul tumore polmonare veniva paragonata l’età alla diagnosi tra fumatori ed ex-fumatori nei soli casi affetti da tumore: dato che tra i maschi l’età media alla diagnosi degli attuali fumatori (62 anni) era inferiore a quella degli ex-fumatori (66 anni), gli autori concludevano che cessare di fumare apportava un guadagno di anni di vita. Dopo molte insistenze da parte di uno dei coautori, questa osservazione è stata (fortunatamente) omessa dall’articolo finale. _
Esempio 3 Diossina e linfomi (esperienza personale) Alcuni anni fa un comitato di cittadini dell’area di Seveso, dove nel 1976 una parte del territorio era stata contaminata da diossina a seguito di un incidente in un impianto chimico, contattò l’Unità di epidemiologia della Clinica del lavoro di Milano per segnalare che l’età alla diagnosi di linfoma in una delle zone più inquinate da diossina, in una serie di casi da loro identificata, era inferiore a quella dei casi dell’area meno inquinata. Secondo il comitato, questo avrebbe dimostrato un anticipo della malattia attribuibile all’esposizione a diossina.
Esempio 4 Malattia di Parkinson e solventi In uno studio retrospettivo su 990 pazienti affetti da malattia di Parkinson, definito «di coorte» (sic), fu effettuato un campionamento di 188 pazienti esposti a solventi idrocarburici, definiti «casi» (sic), e 188 non esposti, detti «controlli» (sic). Uno dei risultati principali fu che i pazienti esposti avevano una minore età all’insorgenza della malattia (55,2 anni) rispetto ai non esposti (58,6 anni). Si concludeva che «lavori che implicano l’uso di solventi idrocarburici costituiscono un fattore di rischio per l’esordio precoce della malattia di Parkinson».14
Esempio 5 Mortalità tra i radiologi In uno studio il cui obiettivo era verificare la ridotta longevità dei radiologi, data la continua esposizione a bassi dosaggi di radiazioni ionizzanti, si confrontò l’età media alla morte di tutti i medici statunitensi deceduti nel periodo 1930-1954. L’età media dei radiologi era 60,5 anni, quella dei medici mai esposti a radiazioni era di 65,7 anni. L’autore concludeva che «i radiologi muoiono in media 5 anni prima dei medici che non hanno alcun contatto noto con le radiazioni».15
Esempio 6 SIDS In uno studio sulle cause della sudden infant death syndrome (SIDS) venne confrontata l’età media al decesso di 30 casi che solitamente dormivano nel letto dei genitori (9,1 settimane) con quella di 54 casi che non dormivano con essi (12,7 settimane). Sulla base di questa differenza gli autori concludevano che «il dormire nel letto dei genitori è fortemente associato a una minore età al decesso » e che «alcune morti da SIDS sono in relazione con questa abitudine».16
Fallacia nell’uso della latenza
Esempio 7 Mesotelioma e carico polmonare di amianto All’interno del Registro dei mesoteliomi tedesco fu valutata la latenza (cioè il tempo dalla prima esposizione) nei soggetti affetti da mesotelioma maligno. In quelli con elevate concentrazioni di amianto a livello polmonare i periodi di latenza erano mediamente più brevi. Gli autori concludevano che «dosi cumulative più alte di asbesto causano uno sviluppo precoce dei mesoteliomi».17
Esempio 8 Mesotelioma e settore industriale Nell’analisi dei soggetti affetti da mesotelioma maligno dell’Australian Mesothelioma Surveillance Program (1979- 1985) e dell’Australian Mesothelioma Register (1986-1995) si mise in relazione la latenza con l’intensità dell’esposizione.18 L’abstract riportava: «...più recentemente, è stato osservato un maggior numero di casi nelle industrie utilizzanti asbesto, come l’edilizia, e tra lavoratori quali idraulici, macchinisti e meccanici d’auto. Tali incrementi potrebbero riflettere la maggiore latenza degli effetti dovuti a esposizioni intermittenti e meno gravi in questi gruppi di lavoratori ».
Esempio 9 Mesotelioma, settore industriale e tipo di esposizione Analizzando la casistica del Registro nazionale dei mesoteliomi (ReNaM) relativa al periodo 1993-2001, gli autori indicavano come risultato anomalo una più lunga latenza (46,3 anni dopo aggiustamento per età) per il settore cantieristico navale (caratterizzato da elevate esposizioni ad amianto) in confronto con altri settori, come l’industria del cementoamianto (42,3 anni) e l’edilizia (43,7 anni). Spiegavano il dato considerando l’occorrenza di malattie concorrenti, come l’asbestosi e il cancro polmonare da amianto nel gruppo con i più alti livelli di esposizione.19Analoghe considerazioni sul settore lavorativo sono riportate in un recente rapporto ISPESL.20 Nello stesso articolo, a commento di un altro risultato apparentemente strano, ossia una ancora più breve latenza media (41,4 anni) per esposizioni avvenute nel tempo libero (presumibilmente a livelli molto inferiori a quelle riscontrabili in ambito occupazionale), si notava che, benché queste attività siano svolte a casa e per periodi di tempo limitati, sono esercitate senza le dovute protezioni, presenti invece nei luoghi di lavoro.
(Ulteriori esempi sono pubblicati come materiali aggiuntivi, scarica il PDF in questa pagina in alto a destra).
Perché l’età alla diagnosi o al decesso nei soli casi non va usata (esempi 1-6)
Nel suo libro Epidemiology. An introduction,12 Kenneth Rothman, commentando un articolo apparso sul Boston Globe, contestava che non si può inferire che fare il direttore d’orchestra è salutare (come sosteneva l’autore del pezzo) sulla base del fatto che l’età media alla morte dei direttori d’orchestra è elevata. Per affermare questo occorrerebbe confrontare il rischio di morte tra i direttori di orchestra con un gruppo di persone che hanno raggiunto la stessa età dei direttori di orchestra. Rothman continuava con un altro esempio: anche se sapessimo che l’età media alla morte dei bambini della scuola materna è di 4 anni e quella dei militari 28 anni continueremmo a pensare che frequentare la caserma è più rischioso che frequentare l’asilo. Per Rothman, quando si prende in considerazione l’età media alla morte si considerano solo coloro che muoiono e si ignorano tutti quelli che sopravvivono. Di conseguenza, l’età media al decesso non riflette il rischio di morte, ma solo una caratteristica di coloro che muoiono. Negli esempi 1-6 sopra riportati l’errore consisteva quindi nel trarre deduzioni su rischi di o su aspetti biologici di malattie studiando i soli casi di malattia (o morte), senza considerare le caratteristiche della popolazione da cui provenivano. Secondo Rothman, il buon senso è talvolta fuorviante, mentre l’adesione ai principi base dell’epidemiologia aiuta a evitare simili trappole. Nel caso dell’esempio 4 i ricercatori si rivolsero alla Unità di epidemiologia della Clinica del lavoro diMilano per un parere sullo studio in fase di scrittura dell’articolo. Furono loro fatti presenti i vari errori formali nella definizione dello studio e dei soggetti inclusi, ma soprattutto il rischio di inferire relazioni causa-effetto studiando solo i casi. I consigli non furono però accolti: l’articolo uscì senza sostanziali correzioni, ebbe anzi un certo impatto mediatico ed è ancora oggi citato in vari siti Internet come uno degli studi che ha mostrato una relazione tra malattia di Parkinson e solventi. L’esempio 5, riportato nel libro di Theodore Colton nel capitolo «Fallacie nel ragionamento numerico», è un ulteriore esempio di fallacia dovuta alla mancanza di denominatori, cioè della distribuzione per età nella popolazione.15 Con questi dati, commentava Colton, non si dimostra nulla, poiché manca la variabile chiave, la distribuzione di tutti i radiologi e di tutti gli altri medici. Essendo la radiologia a quei tempi una specialità relativamente nuova, un deficit di medici più vecchi era atteso. Andando più indietro nel tempo, Pike e Doll nel 1965 rispondevano al patologo citato nell’esempio 1 notando che l’età alla diagnosi di tumore polmonare «senza alcun riferimento alla distribuzione per età della popolazione a cui i pazienti appartengono non ha significato ».21 Essi rimarcavano la profonda differenza tra uno studio osservazionale sui soli casi di malattia nell’uomo e uno studio sperimentale nell’animale: in questo caso una popolazione (coorte) di animali viene esposta a un cancerogeno, la maggior parte di essi si ammala e muore e quindi l’età dell’animale all’insorgenza del tumore può avere senso ed essere di interesse biologico. L’esempio 6 è riportato come dimostrazione di errore di ragionamento sulle cause da Noel Weiss nel suo recente Exercises in epidemiology.22 L’autore sottolinea che il fatto di far dormire il lattante con i genitori potrebbe essere un fenomeno legato all’età: più piccolo è il neonato, più è facile che i genitori lo accolgano nel proprio letto. Se ciò è vero, questa abitudine non avrebbe alcun significato eziologico, a nessuna età. Ancora una volta, il problema è lamancanza di informazioni sul denominatore (tutti i bambini e non solo i casi di SIDS).
Perché la latenza nei soli casi non va usata (esempi 7-9)
Se si sostituisce la variabile «latenza» alle variabili «età alla diagnosi» o «età alla morte» diviene chiara l’analogia e il problema che deriva dal trarre inferenze basandosi solo sui casi di mesotelioma. La relazione tra latenza ed età è molto stretta: Età alla diagnosi/decesso = data diagnosi/decesso – data di nascita Latenza = data diagnosi/decesso – data di inizio esposizione ad amianto L’esplicitazione della formula per la latenza suggerisce di guardare alla latenza partendo da sinistra sulla scala temporale (cioè dall’ultimo termine a destra nella formula). Diventa così intuitivo che una più breve latenza non deriva da un anticipo di malattia, ma più plausibilmente dal fatto che i malati con latenza più breve hanno semplicemente iniziato a essere esposti ad amianto in anni più recenti. I lavoratori (tutti i lavoratori, e di conseguenza i lavoratori affetti da patologia) occupati in aziende “più antiche” avranno ovviamente tempi dalla prima esposizione più lunghi di tutti i lavoratori (e dei malati) occupati in aziende aperte più di recente. Questo non ha niente a che vedere con la biologia del cancro, ma piuttosto con pregresse dinamiche socioeconomiche nell’intera popolazione di un certo territorio. Allo stesso modo, non è legittimo inferire modelli biologici e/o livelli espositivi confrontando le latenze in base al tipo di esposizione (occupazionale, familiare, ambientale, nel tempo libero) o al settore industriale. Spiegazioni alternative più semplici e logiche degli anomali risultati citati20,21 sono da ricercare nelle differenze tra tipo/settori di esposizione nell’anno di prima esposizione ad amianto nella popolazione che ha generato i casi. La natura di popolazione di molti registri di malattia (e quindi il fatto che la casistica da essi raccolta è virtualmente completa) induce a volte a dimenticare che si registrano solo casi (numeratore), mentre il denominatore è disponibile solo per alcune variabili demografiche, importanti ma limitate, quali genere, età, luogo di nascita e residenza. Per altre variabili (per esempio il settore industriale), non sono in genere disponibili adeguati denominatori. Non essendo possibile per alcune variabili calcolare il tasso, non è possibile di conseguenza valutare il rapporto tra tassi e quindi, in senso lato, il rischio relativo in funzione di tali variabili. Un esempio di approccio corretto consiste nel valutare i rischi cancerogeni occupazionali sfruttando i dati dei registri tumori all’interno di un disegno di tipo caso-controllo.23 Per completezza, notiamo che la latenza trarre valide inferenze perché manca qualcosa. Infatti, è a tutti ben nota la differenza tra uno studio sui soli casi e uno studio caso-controllo, in cui la funzione essenziale dei controlli non è quella di fornire un gruppo di confronto (magari comparabile, come a volte si sente ancora oggi dire secondo un obsoleto ed errato punto di vista), ma invece quella di fornire il denominatore per il calcolo degli odds di malattia,4,6,7,9,10 definiti «pseudo-rate»7 o «quasi-rate».4 Va ribadito che valide inferenze possono esser tratte solo all’interno di studi di popolazione adeguatamente progettati, non limitandosi al calcolo delle statistiche su una serie di casi.
Ringraziamenti. Si ringrazia Rodolfo Saracci per l’utile discussione avvenuta in occasione del Primo modulo del Master universitario di II livello in epidemiologia, ospitato dall’Università degli studi di Torino, e per avere segnalato gli articoli di Passey (1962) e di Pike e Doll (1965).