Stima dell’incidenza del carcinoma mammario attraverso il flusso dei ricoveri ospedalieri: confronto con i dati dei Registri tumori
Introduzione
I Registri tumori (RT) hanno rappresentato per un consistente periodo l’unica fonte in grado di fornire dati di incidenza su base di popolazione delle neoplasie, evitando le distorsioni da selezione altrimenti presenti in analoghe valutazioni costruite su casistiche cliniche o su archivi gestionali.1,2 In Italia, negli ultimi decenni, il sistema sanitario si è progressivamente dotato di flussi informativi amministrativi il cui miglioramento, in termini di copertura e accuratezza, ne ha progressivamente incoraggiato l’utilizzazione anche ai fini valutativi epidemiologici e clinici. I Registri tumori hanno essi stessi tratto notevole beneficio da questo processo di informatizzazione, che ha facilitato la ricognizione dei casi incidenti altrimenti affidata ad attività manuali (reperimento e consultazione delle cartelle cliniche, diagnosi microscopiche e certificati di decesso).3 Ciò ha nel contempo portato a una generale riflessione critica sul ruolo dei Registri tumori, sia per le nuove prospettive di studio aperte da questa informatizzazione, sia nel senso della riconsiderazione dell’efficienza (costo/beneficio) dell’attività dei Registri, soprattutto sul terreno della tempistica di produzione e della qualità dei dati.4 L’incidenza delle neoplasie maligne è materia da tempo non più limitata ad approcci descrittivi, ma ormai accettata a pieno titolo tra gli indicatori fondamentali per studi di rischio oncologico e impatto delle procedure di diagnosi e terapie a livello regionale e nazionale.5-7 Si è quindi inevitabilmente prospettata la possibilità che i sistemi informativi sanitari correnti, opportunamente interrogati, siano ormai da soli in grado di garantire le informazioni tradizionalmente fornite dai Registri,8,9 a livelli di qualità accettabili, con drastica riduzione dei tempi di produzione, più agevole estensione a gran parte o a tutto il territorio nazionale10,11 e possibilità di allargamento a patologie non oncologiche di interesse.12 Indagini di questo genere, in parte eterogenee nei metodi e nelle finalità, sono presenti in letteratura e recentemente hanno documentato inevitabili discrepanze, soprattutto in termini di accuratezza, tra gli algoritmi basati sui dati di dimissione ospedaliera e l’incidenza tradizionalmente individuata dai Registri tumori, con ricadute più o meno consistenti sulla stima dell’incidenza o sulla possibilità di utilizzare i dati ai fini di programmazione o verifica delle politiche sanitarie. Il presente studio si propone di confrontare, in termini di accuratezza e affidabilità, i dati di incidenza ottenuti attraverso un algoritmo di estrazione di dati applicato al flusso informativo delle schede di dimissione ospedaliera (SDO) rispetto alle casistiche dei Registri tumori, soprattutto nella prospettiva di utilizzazione di queste fonti nella programmazione dei percorsi di prevenzione e di assistenza dei pazienti oncologici. Le neoplasie della mammella femminile, scelte per questo raffronto, identificano una patologia a marcata tracciabilità da parte degli archivi informatizzati delle SDO in virtù di un percorso clinico omogeneo che prevede un’alta percentuale di ricoveri per intervento chirurgico; esse appaiono quindi in grado di fornire elementi di riflessione critica nelle condizioni di migliore performance delle tecniche di elaborazione automatica.
Tabella 1. Algoritmo SDO, criteri di estrazione dei casi.
Table 1. SDO Algorithm, case-eligibility criteria.
Metodi
Lo studio è stato condotto sulla popolazione di tre regioni italiane (Emilia-Romagna, Toscana e Veneto) coperta dall’attività di Registri tumori. Dalle schede di dimissione ospedaliera dei pazienti residenti nelle aree in studio sono stati estratti i casi incidenti nel corso di un anno solare (2003 per il Veneto, 2004 per Emilia-Romagna e Toscana), definiti sulla base di un ricovero con diagnosi di dimissione principale o secondaria di neoplasia mammaria e contestuale intervento chirurgico principale o secondario correlato (tabella 1). Tale casistica è stata successivamente confrontata con l’analogo archivio prodotto dal pool dei Registri, con approfondimenti nel contesto delle singole regioni. Tra i casi incidenti dei Registri sono stati inclusi, in deroga alle regole internazionali,13 anche i tumori bilaterali e monolaterali successivi al primo, sincroni o metacroni e i carcinomi in situ. La fonte del Registro è stata considerata gold standard per la valutazione di specificità e sensibilità dell’algoritmo SDO, in quanto essa stessa costruita sul flusso informativo dei ricoveri e integrata con le fonti indipendenti delle diagnosi istocitopatologiche e dei flussi di mortalità oltre ad approfondimenti diretti sulle cartelle cliniche. Sono stati quindi confronta-ti sia i tassi grezzi globali di incidenza dei due metodi, sia le corrispondenze e discordanze dei singoli casi attraverso un linkage individuale con valutazione della sensibilità (% dei casi identificati dall’algoritmo SDO sul totale degli incidenti RT) e valore predittivo positivo del flusso SDO (PPV, % dei casi confermati dal RT tra gli identificati dall’algoritmo SDO). Dal gruppo dei casi discordanti sono stati successivamente scorporati quelli non riconducibili al medesimo anno di incidenza per motivi legati alla fisiologica latenza tra la prima diagnosi (data di incidenza del RT) e l’intervento chirurgico segnalato dalla SDO; in questo sottogruppo sono stati compresi i casi con SDO nell’anno in studio e data di incidenza RT nell’ultimo trimestre dell’anno precedente e i casi con incidenza RT nell’anno e SDO entro i tre mesi dell’anno successivo. I casi discordanti finali (al netto della latenza temporale) sono stati successivamente analizzati in ordine alla loro natura (“falsi positivi” e casi non intercettati dalla SDO) e al motivo della discrepanza rispetto ai dati in possesso del Registro. Tra i casi di tumore invasivo incidenti secondo la fonte RT e non individuati dall’algoritmo SDO è stato inoltre condotto un approfondimento sui tassi età specifici e sulla sopravvivenza a 12 e 36 mesi per l’intero pool e limitatamente a 30 mesi per il dettaglio delle singole aree, utilizzando per quest’ultima analisi il metodo attuariale (SPSS v. 8.0; SPSS Inc, Chicago IL) calcolato dalla data di incidenza del primo tumore mammario invasivo, con esclusione dei casi segnalati dal solo certificato di morte (DCO).
Tabella 2. Confronti tra i tassi di incidenza.
Table 2. Comparisons between incidence rates.
Table 3. Discordant cases.
Table 3. Discordant cases.
Sulla casistica di Toscana e Veneto è stata infine condotta una rivalutazione della concordanza non considerando le SDO di casi “prevalenti” secondo le regole internazionali (precedenti ricoveri per tumore mammario almeno nei 5 anni precedenti l’indagine). Gli intervalli di confidenza (IC) dei tassi di incidenza sono stati calcolati secondo la distribuzione di Poisson, mentre per la sensibilità/PPV dell’algoritmo e per la sopravvivenza sono stati utilizzati rispettivamente l’intervallo binomiale esatto e quello approssimato secondo la distribuzione normale.more mammario almeno nei 5 anni precedenti l’indagine). Gli intervalli di confidenza (IC) dei tassi di incidenza sono stati calcolati secondo la distribuzione di Poisson, mentre per la sensibilità/PPV dell’algoritmo e per la sopravvivenza sono stati utilizzati rispettivamente l’intervallo binomiale esatto e quello approssimato secondo la distribuzione normale.
Risultati
Nel periodo e nelle tre regioni in esame (6.294.202 donne re-sidenti,14 di cui il 49,7% in carico agli RT per complessivi 3.125.425 anni/persona) i Registri tumori hanno segnalato 6.079 nuovi casi di neoplasie mammarie, con un tasso grezzo di 194,5 x 100.000 residenti. La sola fonte SDO ha evidenziato complessivamente 6.000 casi con un tasso di 192,0 x 100.000. In ciascuna regione e nel complesso del pool i tassi ottenuti attraverso i due metodi non hanno mostrato significative differenze (tabella 2). Dall’integrazione (linkage) RT/SDO si è osservato però come soltanto 5.038 casi siano stati condivisi dai due flussi, con una sensibilità dell’algoritmo SDO dell’82,9% (IC 95% 81,9-83,8) e un PPV dell’84,0% (IC 95% 83,0-84,9). I casi con reale discrepanza tra fonte SDO e RT, al netto cioè dei discordanti per registrazioni nei trimestri a cavaliere tra l’anno precedente e successivo, sono risultati in totale 1.378, divisi tra casi segnalati dalla fonte SDO in assenza di neoplasie mammarie secondo il RT (596 casi, 9,9% della intera casistica SDO), casi recuperati dalla fonte SDO e precedentemente persi dal RT (34 casi, 0,6% della casistica SDO) e casi incidenti per il RT e non segnalati dalla SDO (748 casi, 12,3% della casistica RT). Limitatamente alla fascia di età dai 45 ai 74 anni la percentuale di casi persi alla SDO (331 casi) è risultata dell’8,2%. Tra i casi discordanti (tabella 3), il dettaglio dei 596 casi «falsi positivi SDO» segnala un 71,5% di casi incidenti in anni precedenti (prevalenti con interventi su recidive), il 19,5% di errate segnalazioni (tumori benigni o altre lesioni), un 7% di errori nella compilazione della SDO (anagrafici, codifiche) e una piccola residua quota (12 casi, 2%) senza sufficienti evidenze e ancora in corso di accertamento da parte degli RT. I 748 casi incidenti secondo gli RT e “persi” dalla sola rilevazione SDO comprendono, con alcune differenze tra le diverse aree, casi con SDO assente o non attribuibile (36,6%), SDO oltre il primo trimestre dell’anno successivo (1,9%), SDO errate (identificativi, codifiche: 26,5%), casi recuperati dal certificato di morte dall’RT (5,7%), casi generalmente non eligibili per intervento chirurgico o con indicazione di lesione benigna/incerta (29,3%). Si tratta peraltro di casi di cui gli RT possiedono conferma microscopica nell’86,4% dei casi (65,9% istopatologica, 20,5% citopatologica) a fronte di circa il 95% della casistica nazionale (91% istologica, 4% citologica).15 Il confronto tra la casistica incidente globale del carcinoma mammario nelle aree e nel periodo considerato e le lesioni non rilevate dall’algoritmo SDO mostra inoltre un comportamento differente per quanto riguarda l’incidenza per classi di età, con una più marcata rappresentazione proporzionale nelle età avanzate dei casi “persi” (figura 1). Considerando infine il comportamento clinico di queste ultime neoplasie, l’analisi dei tumori invasivi evidenzia una sopravvivenza a 12 e 30 mesi dalla diagnosi rispettivamente del 79,7% e del 64,9%, contro il 96,2 e l’89,8% della casistica generale, con dati omogenei tra le diverse regioni in studio (tabella 4). Lo svantaggio in termini prognostici appare uniformemente distribuito in tutto il periodo di follow up considerato e con differenze statisticamente significative a 36 mesi fra pool (88,8%), casi persi alla SDO di tutte le età (62,0%) e nella fascia 45-74 anni (71,9%; figura 2). L’esclusione dalla casistica SDO nell’anno in studio dei casi con analogo ricovero e intervento per neoplasia mammaria negli anni precedenti effettuato a scopo esplorativo in due regioni (Toscana e Veneto), ha evidenziato una notevole diminuzione (di oltre il 50%) dei casi «falsi positivi SDO» a fronte però di un aumento (dell’11% circa) della quota dei casi incidenti (fonte RT) non rilevata dall’algoritmo (tabella 5).
Tabella 4. Sopravvivenza totale e dei pazienti persi alla rilevazione SDO per Regione.
Table 4. Survival of all cases and of those lost by SDO algorithm, by Region .
Tabella 5. Implicazioni dell’inclusione/esclusione delle SDO con segnalazioni precedenti in Toscana e Veneto.
Table 5. Effects of Inclusion/exclusion 3,012 185.5 2,800 172.4 of HDD with respect to pre-existing (178,9-192,2)
Figura 1. Incidenza età specifica (tassi x 100.000).
Figure 1. Age-specific incidence (rates x 100,000).
Discussione
Lo studio ha preso in considerazione la casistica incidente in tre regioni italiane caratterizzate da una buona copertura da parte dei Registri tumori e conseguentemente da un gran numero di casi incidenti di tumori maligni della mammella femminile, nell’intento di valutare le performance di un sistema di valutazione dell’incidenza basato sul solo flusso delle SDO nelle migliori condizioni potenziali (patologia diffusa, buona tracciabilità). La metodologia adottata per l’estrazione dei dati segue criteri già documentati in letteratura.16 Preliminarmente a considerazioni di merito sui dati, occorre evidenziare alcune caratteristiche intrinseche del flusso SDO che identifica strutturalmente una serie di prestazioni sanitarie, a fronte di un Registro tumori che rappresenta invece un archivio di patologie. La fonte SDO è necessaria a un Registro di neoplasie, ma non è automaticamente riconducibile a esso: il trattamento di tumori multipli o multicentrici può essere effettuato infatti nell’ambito dello stesso ricovero (e generare una sola segnalazione), così come interventi in tempi diversi su di un’unica lesione possono generare più documenti. Non è inoltre possibile desumere con sicurezza, soprattutto negli organi pari, molteplicità tumorali sulla base di codici di interventi chirurgici bilaterali, per l’assenza di un appaia-mento intervento-lesione non previsto dalla procedura, né è generalmente consentito dalla codifica della patologia (ICD9 CM). Ne consegue l’impossibilità di abbinamento univoco tra ricovero e patologia con l’accuratezza richiesta da una rilevazione di incidenza: le stesse procedure di record linkage risentono inevitabilmente di queste discrepanze. La trasformazione di una serie di prestazioni in una sequenza di lesioni richiede perciò procedure di approfondimento anche su altre fonti (come la diagnostica anatomo-patologica), che rientrano di fatto nei tradizionali e più onerosi schemi di lavoro di un Registro tumori. Diversamente da altri approcci sulla fonte SDO presenti in letteratura che considerano soltanto il primo ricovero con intervento per tumore, analogamente alle regole internazionali seguite dai Registri, il presente studio ha considerato anche i tumori mammari successivi al primo, mono/ bilaterali, sincroni o metacroni e le lesioni in situ.
La maggiore complessità di questo approccio appare più accurata nel documentare una possibile molteplicità di tumori che, ancorché esclusi dalle casistiche ufficiali di incidenza, costituiscono comunque ulteriori patologie per le pazienti e un carico assistenziale aggiuntivo per l’organizzazione sanitaria. Date queste premesse, un primo risultato evidenzia una buona corrispondenza delle stime di incidenza del «metodo SDO» rispetto ai dati RT, complessivamente e nel dettaglio delle singole realtà territoriali, migliore di altre esperienze italiane.17 Si tratta tuttavia solo di una concordanza apparente tra due casistiche notevolmente diverse, realizzata in virtù della sommatoria di discordanze di segno opposto. In realtà l’algoritmo SDO appare gravato da una bassa specificità che porta all’arruolamento di un casistica in cui, all’approfondimento anatomo-patologico e clinico, quasi un caso su dieci non risulta essere una neoplasia mammaria. Ai fini dello studio dei percorsi diagnostici e terapeutici un secondo e più grave problema è rappresentato dal mancato reperimento di una consistente serie di lesioni, analogamente a quanto riportato in altri contributi presenti in letteratura. La sensibilità e il PPV dell’algoritmo (82,9% e 84,0%) sono risultati infatti non troppo dissimili da quanto riscontrato da altri autori, in particolare in Italia (Piemonte) da Baldi et al. (76,7% e 92,6%), in Francia da Ganry et al. (85% e 97% per le donne con prima diagnosi di ospedalizzazione, 94% e 78% con seconda diagnosi) e negli Stati Uniti da Warren et al. (62% e 88%).9,16,18 L’analisi supplementare in due regioni escludendo le segnalazioni SDO di pazienti con diagnosi principale di tumore mammario in anni anteriori a quello in studio è stata condotta per consentire un ulteriore approfondimento comparativo con la letteratura, orientato a un maggior controllo di eventuali casi “prevalenti”. Fermo restando il rischio di escludere possibili casi incidenti sulla base di precedenti SDO errate (accertate in quote non trascurabili nella casistica in studio), questo metodo offre una migliore specificità (con dimezzamento dei casi “falsi positivi” per miglior controllo dei prevalenti) pagata però con un’ulteriore perdita di sensibilità (aumento dei casi “persi alla SDO” di oltre l’11%). La conseguenza più critica nell’uso del solo algoritmo SDO è rappresentata in sostanza dalla perdita selettiva di tumori in pazienti anziane e a peggiore prognosi, per l’impossibilità del-l’algoritmo di intercettare donne non trattate chirurgicamente per problemi di età, gravità del quadro clinico o stadio della malattia alla diagnosi, ma anche per incompleta o errata compilazione delle SDO o per approfondimenti diagnostici conclusi successivamente alla dimissione ospedaliera. Ciò appare chiaramente attraverso l’analisi della sopravvivenza osservata a breve-medio termine. La prognosi peggiore generalmente osservata tra le pazienti non individuate dall’algoritmo SDO è confermata anche nel gruppo tra i 45 e i 74 anni di età, di particolare interesse, per lo studio dell’impatto dei programmi di screening. Questa classe di età mostra infatti livelli intermedi e significativamente differenti rispetto sia all’intero gruppo di «persi SDO», sia ai valori espressi dall’intera casistica incidente dei Registri tumori.
Figure 2. Sopravvivenza globale dei casi incidenti, per categoria.
Figure 2. Overall survival of incident cases, by category.
Conclusioni
A fronte delle potenziali premesse a suo favore (economia e pronta disponibilità dei dati rispetto alla latenza e al maggior lavoro dei Registri), l’algoritmo di intercettazione dei casi dal solo flusso SDO non sembra soddisfare i criteri di accuratezza richiesti dall’esigenza di identificare coorti di pazienti incidenti per approfondirne i percorsi diagnostico-assistenziali, ovvero ciò che rappresenta attualmente il contributo più importante dei Registri tumori. L’uso della sola fonte SDO, se da un lato può stimare tassi di incidenza fortuitamente concordanti con quelli prodotti dai RT, dall’altro presenta di fatto consistenti problemi di specificità, sensibilità e distorsione che ne vanificano l’uso ai fini di sanità pubblica, soprattutto orientata alla valutazione di terapie e follow up. I problemi osservati sulle neoplasie mammarie, patologie di chiara definizione e ad alta tracciabilità, fanno inoltre prevedere ben più gravi difficoltà per altri tipi di tumore in cui l’identificazione dell’incidenza comprende una più alta quota di casi da definire attraverso attente analisi integrate e retrospettive, spesso non supportate da livelli diagnostici isto-citopatologici o che non prevedono ricoveri ospedalieri. La “lentezza” dei Registri tumori, più volte evidenziata, è del resto in gran parte dovuta proprio alla necessità dell’integrazione di più fonti (anagrafiche, anatomo-patologiche, cliniche, di mortalità), operazione oggi ancora gravata da problemi di standardizzazione e codifica condivisa dei dati, superabili solo al prezzo di un rilevante lavoro manuale.19,20 La documentazione delle schede di dimissione ospedaliera, insieme agli altri flussi informativi sanitari, rappresenta invece un formidabile strumento di indagine in una logica di mutua integrazione, particolarmente in patologie complesse o all’interno di programmi articolati. Gli screening oncologici rappresentano, tra gli altri, l’esempio tipico della necessità di approfondimento multidisciplinare a cui l’attività di registrazione può rispondere in maniera soddisfacente solo integrando l’enorme potenziale informativo che già oggi gli archivi sani-tari correnti offrono in termini di ricoveri, assistenza ambulatoriale e domiciliare, prescrizioni farmaceutiche, diagnosi anatomo-patologiche, strumentali e molto altro ancora. In questo senso, nel sistema informativo sanitario italiano, tutti gi sforzi per migliorare l’integrabilità dei vari flussi informativi già esistenti appaiono ragionevolmente più produttivi rispetto a interventi di interrogazione “spinta” di una sola fonte. L’esperienza quotidiana dei Registri tumori può in questo senso rappresentare un contributo garantendo già in questa logica, e attraverso l’unione delle diverse fonti, la copertura di tutta la storia clinica dei pazienti (dalla diagnosi alla terapia con percorsi, tempi e modalità): se ciò è condizionato da tempi necessariamente non brevissimi, i Registri sono d’altro canto in grado di fronteggiare richieste tempestive di stime geografiche o temporali con l’affidabilità che deriva loro dalle robuste serie storiche ormai disponibili, validate a livello internazionale. Ulteriori sforzi in questo senso saranno probabilmente da prevedere per permettere a questo patrimonio, ancora in larga parte inesplorato, di divenire strumento ordinario di programmazione razionale di tutto l’approccio preventivo e clinico in oncologia.
Conflitti di interesse: nessuno.
Bibliografia
- Wagner G. Hystory of cancer registration. In: Jensen OM, Parkin DM, Maclennan R, Muir CS, Skeet RG (eds). Cancer registration: principles and practice. Lyon, IARC Sc. Publ. N. 95, 1991.
- Storm HH. Cancer registries in epidemiological research. Cancer Causes Control 1996; 7: 299-301.
- Ferretti S, Giacomin A. Tecniche di registrazione dei tumori, Milano, Inferenze, 2008.
- Zanetti R, Rosso S. Riuscirà l’epidemiologia a salvare i registri tumori? Epidemiol Prev 2002; 26(4): 198-202.
- Terracini B, Zanetti R. A short history of pathology registries, with emphasis on cancer registries. Soz Praventivemed 2003; 48(1): 3-10.
- Parkin DM. The role of the registries in cancer control. Int J Clin Oncol 2008; 13: 102-11.
- Parkin DM. The evolution of population-based cancer registry. Nat Rev Cancer 2006; 6: 603-12.
- Rostgaard K, Holst H, Mouridsen H et al. Do clinical databases render population-baser cancer registries obsolete? The example of breast cancer in Denmark. Cancer Causes Control 2000; 11; 669-74.
- Ganry O, Taleb A, Peng J et al. Evaluation of an algorithm to identify incident breast cancer cases using DRGs data. Eur J Cancer Prev 2003; 12; 295-99.
- Bolzan M, Conte G. Evaluation in terms of annual incidence rate of lung cancer within the ULSS of the Veneto region (Italy) from hospital discharge data (years 1980-1982). Tumori 1988; 74(6): 697-704.
- Brackley ME, Penning MJ, Lesperance ML. In the absence of cancer registry data, is it sensible to assess incidence using hospitalk separation records? Int J Equity Health 2006; 5: 12.
- Simonato L, Baldi I, Balzi D et al. Obiettivi, strumenti e metodi per un utilizzo epidemiologico di archivi sanitari elettronici correnti in diverse aree italiane. Epidemiol Prev 2008; 32(3): 5-14.
- Fritz A, Percy C, Jack A et al. International Classification of Diseases for Oncology, 3rd edition. Geneva, World Health Organization, 2000.
- Statistiche demografiche ISTAT (www.demo.istat.it).
- AIRTUM Working Group. I tumori in Italia, rapporto 2006: incidenza, mortalità e stime. Epidemiol Prev 2006; 30(1 suppl 2): 62-63.
- Baldi I, Vicari P, Di Cuonzo D et al. A high positive predictive value algorithm using hospital administrative identified incident cases. J Clin Epidemiol 2008; 61(4): 373-79.
- Simonato L, Canova C, Corrao G et al. Ricerca e sviluppo di algoritmi: la definizione di alcune patologie neoplastiche. Epidemiol Prev 2008; 32(3 suppl): 94-96.
- Warren JL, Feuer E, Potosky AL et al. Use of Medicare hospital and physician data to assess breast cancer incidence. Med Care 1999; 37: 445-56.
- Bray F, Parkin DM. Evaluation of data quality in the cancer registry: principles and methods part I: comparability, validity and timeliness. Eur J Cancer 2009; 45: 747-55.
- Parkin DM, Bray F. Evaluation of data quality in the cancer registry: principles and methods part II: completeness. Eur J Cancer 2009; 45: 756-64.