Abstract

Objective: the study evaluates the accuracy of an algorithm based on hospital discharge data (HDD) in order to estimate breast cancer incidence in three italian regions (Emilia-Romagna, Toscana and Veneto) covered by cancer registries (CR). The evolution of computer-based information systems in health organization suggests automatic processing of HDD as a possible alternative to the time-consuming methods of CR. The study intends to verify whether HDD quickly provides reliable cancer incidence estimates for diagnosis and therapy evaluations.
Design and setting:
an algorithm based on discharge diagnosis and surgical therapy of hospitalized breast cancer patients was developed in order to provide breast cancer incidence. Results were compared with the corresponding incidence data of cancer registries. The accuracy of the automatic method was also verified by a direct record-linkage between HDD output and registries’ files. The overall survival of cases lost to “HDD method” was analyzed.
Results:
in the period covered by the study (3,125,425 person/year) CR enrolled 6,079 incident cases, compared to 6,000 cases recorded through the HDD flow. Incidence rates of the two methods (CR 194.5; HDD 192.0 x 100.000) showed no statistical differences. However, matched cases by the two methods were only 5,038. The sensitivity of the HDD algorithm was 82.9% and its predictive positive value (PPV) was 84.0%. False positive cases were 9.9%. On the other hand, 12.3% CR incident cases were not identified by the algorithm: these were mainly made up of older women, not eligible for surgical therapy. Their three-years survival was 62.0% vs 88.8% of the whole incidence group.
Conclusion: HDD flow performance was similar to observations reported in the literature. The agreement between HDD and CR incidence rates is a result of a cross effect of both sensitivity and specificity limitations of the HDD algorithm. This can seriously impair the reliability of the latter method with regard to the evaluation of diagnostic and therapeutic strategies in cohort studies (i.e. the most effective approach to health setting in oncology).

 Keywords: , ,

Riassunto

Obiettivo: questo studio si è posto l’obiettivo di valutare l’accuratezza di un algoritmo basato sulle schede di dimissione ospedaliera (SDO) nella stima dell’incidenza del carcinoma mammario femminile in tre regioni italiane (Emilia-Romagna, Toscana e Veneto). Lo sviluppo e l’evoluzione di flussi sanitari informatizzati come quello delle SDO propone infatti questa possibile alternativa al più oneroso modello di funzionamento dei Registri tumori (RT) allo scopo di ottenere in tempi più rapidi una stima dell’incidenza delle neoplasie, anche al fine della valutazione di impatto delle procedure terapeutiche.
Disegno e setting:
nelle aree coperte da Registri tumori di tre regioni italiane (Emilia-Romagna, Toscana e Veneto) è stata valutata la performance di un algoritmo di estrazione dei casi incidenti dei tumori della mammella femminile basato sulla diagnosi alla dimissione e sulla contestuale terapia chirurgica. La stima dell’incidenza così ottenuta è stata confrontata con i corrispondenti tassi di incidenza dei Registri tumori. L’accuratezza dell’algoritmo SDO è stata inoltre verificata attraverso l’appaiamento dei casi SDO con l’archivio di Registro pertinente e attraverso l’analisi di sopravvivenza dei casi sfuggiti al modello.
Risultati:
nel periodo di osservazione gli RT coinvolti hanno registrato 6.079 casi incidenti a fronte di 3.125.425 anni/persona. Il flusso SDO ha contestualmente individuato 6.000 casi. I tassi di incidenza dei due metodi (RT 194,5; SDO 192,0 x 100.000) non hanno mostrato differenze significative. I casi effettivamente concordanti sono però risultati 5.038, con una sensibilità e un valore predittivo positivo dell’algoritmo SDO pari rispettivamente a 82,9% e 84,0%, una quota di “alsi positivi del 9,9% e una quota di casi non intercettati pari al 12,3% dell’incidenza RT. Questi ultimi sono prevalentemente casi non trattati chirurgicamente, a prognosi peggiore (sopravvivenza a 3 anni pari al 62,0% contro l’88,8% della casistica generale) e con una più alta quota proporzionale di pazienti anziane.
Conclusioni: le stime ottenute dall’algoritmo SDO risultano non molto dissimili dai dati già noti della letteratura. In realtà la concordanza dell’algoritmo con i dati degli RT nella stima globale dell’incidenza appare come la risultante dell’effetto crociato di carenze di sensibilità e specificità dell’algoritmo nel-l’individuazione dei casi. Ciò compromette l’affidabilità di questo modello nella valutazione di impatto dei percorsi clinico-assistenziali nell’ottica di uno studio longitudinale su coorti di pazienti oncologici, che rappresenta oggi la prospettiva più promettente per la programmazione sanitaria.

 Parole chiave: , ,

 20/10/2009   12/01/2021      Visite