BLOG Discutiamone! minuti di lettura
; Salute
Gli open data sono realmente open?

Quando ho cominciato a frullare dei dati sanitari era il 1970 presso l'Istituto di Biometria e Statistica Sanitaria della facoltà di Medicina e Chirurgia dell'Università degli Studi di Milano, avevamo chiesto all'Inam e all'Istat di darci i nastri con le registrazioni dei dati di ricovero e con i dati di mortalità. Allora erano pubblicate su degli annuari solo delle tabelle molto sintetiche che li riassumevano e che per lo più non davano delle informazioni utilizzabili sia per la programmazione sanitaria sia per la ricerca epidemiologica, e i dati ci furono tutti forniti come record personali su nastri magnetici.
Usando questi nastri con le tecnologie di allora, ad esempio le schede perforate e il linguaggio Fortran, riuscimmo a pubblicare i primi Atlanti di Mortalità orientati soprattutto alle patologie tumorali. Ma poi ci si accorse che creando e pubblicando solo tabelle e grafici si fornivano informazioni rilevanti, ma molte altre che si sarebbero potute ricavare rimanevano sotterrate dalle nostre scelte di elaborazione. Così creammo un Atlante informatico di Mortalità che funzionava in rete ed era costruito con linguaggio SAS e che permetteva praticamente di fare quasi tutte le elaborazioni che un utente avesse voluto ottenere. Ci preoccupammo molto del rispetto della legge sulla privacy e tutte le verifiche fatte anche dal Ministero della Salute ne confermarono l'adeguatezza. A questo seguì in Regione Lombardia un Atlante dei Ricoveri Ospedalieri sviluppato insieme a Carlo Zocchetti e che per diversi anni fu disponibile sul sito della Regione Lombardia.
Poi successero varie cose, quasi contemporanee: la normativa sulla privacy, le norme che indicano alle amministrazioni di dare l'accesso a degli Open Data e la chiusura, non motivata, dei due sistemi, prima descritti, che avevamo costruito anche con l'uso di importanti risorse pubbliche.
In Italia, la normativa principale sugli Open Data è il Decreto Legislativo n. 36/2006, pesantemente modificato dal D.Lgs. n. 200/2021 in recepimento della direttiva UE 2019/1024. Questa legge impone alle pubbliche amministrazioni di pubblicare dati aperti, accessibili, in formato elaborabile e gratuitamente o a costi marginali. Ultimamente l’UE ha emanato in aggiunta alla direttiva relativa agli open data un regolamento che, nel punto 11 della premessa e all'articolo 2, chiarisce subito che le amministrazioni non hanno l'obbligo ma solo la facoltà di "aprire i dati" agli utenti o a un gruppo di loro.
Premessa, punto 11: Il presente regolamento non dovrebbe introdurre l'obbligo di consentire il riutilizzo dei dati detenuti da enti pubblici. In particolare, ciascuno Stato membro dovrebbe pertanto poter decidere se i dati sono resi accessibili per il riutilizzo, anche in termini di finalità e portata di tale accesso.
Articolo 2. Il presente regolamento non crea, per gli enti pubblici, alcun obbligo di consentire il riutilizzo dei dati, né esenta gli enti pubblici dai loro obblighi di riservatezza ai sensi del diritto dell'Unione o nazionale.
E questo puntualizza subito che nessuno ha il "diritto" di utilizzare comunque i dati originali di cui una amministrazione è titolare, ma invece stabilisce i "doveri" dell'amministrazione che intende aprire i suoi dati agli utenti. Tra questi doveri innanzitutto c'è il rispetto della riservatezza e della privacy, ma purtroppo il concetto di trasparenza non è così ben definito e permette di far accedere solo a dati pre-modificati o solo addirittura aggregati.
Peraltro viene definito nel regolamento l'«altruismo dei dati»: cioè
la condivisione volontaria di dati sulla base del consenso accordato dagli interessati al trattamento dei dati personali che li riguardano, o sulle autorizzazioni di altri titolari dei dati volte a consentire l'uso dei loro dati non personali, senza la richiesta o la ricezione di un compenso che vada oltre la compensazione dei costi sostenuti per mettere a disposizione i propri dati, per obiettivi di interesse generale, stabiliti nel diritto nazionale, ove applicabile, quali l'assistenza sanitaria, la lotta ai cambiamenti climatici, il miglioramento della mobilità, l'agevolazione dell'elaborazione, della produzione e della divulgazione di statistiche ufficiali, il miglioramento della fornitura dei servizi pubblici, l'elaborazione delle politiche pubbliche o la ricerca scientifica nell'interesse generale.
Ma un altro regolamento, quello relativo alla privacy, (Regolamento UE 2016/679 del 27 aprile 2016) all'articolo 4 precisa che:
Il trattamento dei dati personali dovrebbe essere al servizio dell'uomo. Il diritto alla protezione dei dati di carattere personale non è una prerogativa assoluta, ma va considerato alla luce della sua funzione sociale e va contemperato con altri diritti fondamentali, in ossequio al principio di proporzionalità.
Ma allora perché non "contemperare" il rispetto della privacy con il rispetto della libera ricerca epidemiologica?
Non è forse allora che il rispetto della privacy sia una buona scusa e che invece si ha paura dei possibili esiti della ricerca epidemiologica? Mi trovavo in Argentina a Cordoba, e parlando con il locale Ministro della sanità gli avevo offerto di realizzare un Atlante della mortalità per tumori. I dati c'erano, lui mi ringraziò ma non accettò la mia collaborazione gratuita dicendomi: «abbiamo già tanti problemi e non vogliamo che questo Atlante ce ne crei di più!».
La maggior parte degli amministratori pubblici ha "paura" di avere dei problemi in più e perciò preferisce acconsentire solo a degli Open Data pre-elaborati e controllati che non dicano di più di ciò che l'amministrazione già sa. E così, spesso gli Open Data seppur appropriati a livello di comunicazione e di partecipazione della popolazione, non dicono però per lo più nulla di utile a chi vuol capirne di più in senso epidemiologico.
Se il problema fosse solo quello del rispetto della privacy, allora come molte delle informazioni personali sanitarie sono disponibili a chi, facendo parte delle amministrazioni, le raccoglie e le elabora al fine della gestione e del governo della sanità, sarebbe possibile far sì che anche i ricercatori potessero accedervi facendo una sorta di "giuramento di riservatezza" in conseguenza del quale una eventuale trasgressione portasse a una sanzione molto grave e all’esclusione definitiva da ulteriori accessi ai dati.
Ricordo negli anni Settanta di essere stato coinvolto da un collega, professore di ginecologia, in una ricerca caso controllo su eventuali conseguenze di alcune pratiche contraccettive: i casi erano delle studentesse universitarie che usavano specifici contraccettivi e i controlli erano studentesse che non avevano rapporti completi e che alla visita ginecologica erano risultate vergini. Al pensiero oggi del fatto che i dati contenessero persino nome e cognome delle studentesse viene da non crederci, ma ciò che è rassicurante è che nessuno di noi che analizzavamo i dati mai avrebbe pensato di leggere i nominativi, neppure senza aver intenzioni poco rispettose. Insomma, perché non permettere ai ricercatori seri, disposti a far giuramento, di elaborare i dati sanitari personali, meglio se senza nomi e cognomi, per far ricerche utili alla salute pubblica? Ad un rischio minimo di violazione individuale della privacy si contrappone infatti un interesse ben socialmente maggiore di conoscenza e di promozione della salute.
Ci sono molti Open Data che riguardano la sanità, e anche banche dati, ma gli Open Data disponibili in rete sono spesso di scarso interesse e utilità per un epidemiologo che voglia capirne di più dello stato di salute della popolazione ed oltretutto quasi sempre per nulla aggiornati. Anche le banche dati disponibili contengono solo indicatori o dati originali, ma con diverse variabili censurate per motivi di riservatezza.
Vedansi i dati sul sito del Ministero della Salute, e tra questi, ad esempio, quelli relativi ai ricoveri ospedalieri che sono, nel 2026, dati dei ricoveri del 2022 e soprattutto non divisi per diagnosi di dimissione.
Anche gli Open Data dell'ISS non hanno grande interesse per l'analisi epidemiologica. Più interessanti quelli inseriti nella sezione banche dati o quelli relativi alla pandemia Covid.
Gli Open Data del MEF che riguardano gli aspetti economici e di contabilità del SSN sono i seguenti.
La fonte maggiore di dati sanitari rimane certamente quella dell'Istat che comunque rilascia dei file con alcune variabili trasformate che, se forse da una parte proteggono la privacy, dall'altra riducono le possibilità di analisi complete. Tra queste, ad esempio:
L'Istat riporta analisi interessanti relative a sanità e salute e permette di accedere a database internazionali, come ad esempio quello di Health for all che contiene molti indicatori. Tra i micro dati disponibili alcuni sono pubblici, altri riservati a ricercatori registrati; anche questi però non contengono completamente tutte le informazioni originali.
Insomma, vediamo come si possa veramente far sì che tutti i dati siano realmente open per chi fa seriamente ricerca soprattutto in campo epidemiologico! La magistratura, giustamente, deve avere libero accesso a tutte le informazioni perché deve poter valutare appieno le realtà indagate senza limiti. La ricerca epidemiologica dovrebbe essere una sorta di "magistratura della salute", vincolata alla segretezza dei dati che consulta, ma libera di analizzare tutte le informazioni disponibili ai fine della protezione della salute degli individui e della comunità.
Parole chiave: salute
