Epidemiologi(a): quale futuro? Il Convegno AIE di Primavera
Il gruppo AIE giovani e il gruppo Epidemiologia&Precariato, in collaborazione con l’Istituto superiore di sanità (ISS) e l’Associazione italiana di epidemiologia (AIE), hanno organizzato il Convegno AIE di primavera, che si è tenuto a Roma presso l’ISS il 26 e 27 marzo scorsi.
In consonanza con il titolo Epidemiologi(a): quale futuro?, sono stati affrontati due argomenti rilevanti per la sanità pubblica dei prossimi anni: la situazione e le prospettive del precariato nei servizi territoriali, negli enti di ricerca e nelle università, e la disponibilità di nuove fonti e nuove tipologie di dati. I due argomenti, apparentemente scollegati, sono in realtà connessi da un denominatore comune, poiché da loro dipende il futuro della ricerca epidemiologica, costituita da persone e da dati.
Epidemiologia occupazionale 2.0
L’organizzazione della prima giornata è stata affidata al gruppo Epidemiologia&Precariato, che ha deciso di esaminare la questione del precariato nella ricerca e nella sanità pubblica italiana. L’esito dell’incontro è stato la proposta di un position paper che raccoglierà le voci provenienti dell’AIE riguardo a questo tema: un ulteriore passo del percorso iniziato nell’ottobre 2016 con la costituzione del gruppo Epidemiologia&Precariato.
I big data: dalle persone ai dati
Non è possibile parlare di futuro della ricerca senza interessarsi ai nuovi strumenti per osservare i fenomeni, generare ipotesi e stabilire potenziali inferenze causali. Questo fil rouge ha spalancato le porte alla seconda giornata del Convegno, accendendo i riflettori sul tema dei big data.
Negli ultimi anni, capita spesso di sentirne parlare: per alcuni si tratta di un rivoluzionario approccio all’epidemiologia, per altri si tratta di un’operazione di marketing. Una definizione chiara di cosa siano i big data rimane ancora sfuggente e spesso i ricercatori che ne sentono parlare provano una sensazione che oscilla tra interesse e scetticismo.
Il gruppo AIE giovani ha provato a dare la sua interpretazione, esordendo con il gioco a premi “OK, IL BIG DATA È GIUSTO”: a tutti i partecipanti è stato chiesto di mettere alla prova le loro conoscenze in materia di big data e Pokemon. Si, avete letto bene! Riproponendo il quiz disponibile al sito https://pixelastic.github.io/pokemonorbigdata/, sono state affrontate manche ad autoeliminazione in cui è stato dimostrato che saper distinguere il nome di un provider di big data da quello di un Pokemon non è cosa semplice e che, nonostante tutto, numerosi epidemiologi si intendono di… Pokemon!
A fare chiarezza sono intervenuti tre relatori che hanno fornito una panoramica generale sulla natura dei big data, sui loro utilizzi e sulle questioni che suscitano. Il primo passo è stato declinare questo mondo astratto in un contesto reale, grazie alla lettera V. Infatti, i big data sono definibili a livello globale con le 5 V: volume, velocità, varietà, viralità e variabilità.
Tuttavia, questo non basta per darne una definizione univoca, poiché in parte queste peculiarità sono condivise con altre fonti attualmente disponibili, alimentando così la confusione nel discernere tra grandi moli di dati e big data stessi. Oltre alle 5 V, i big data possono essere considerati come la materializzazione dell’internet of things, una realtà virtuale in cui gli oggetti del mondo informatizzato pervadono e si interconnettono con le molteplici tecnologie di comunicazione esistenti.1
Si è poi proseguito ripercorrendo le esperienze dirette dei tre relatori. In particolare, si è messo in evidenza come i big data possano essere utilizzati in numerosi campi, dalle multinazionali, come Uber che sfrutta queste potenzialità per brevettare la guida automatica, a realtà sanitarie locali, come l’ospedale pediatrico “Bambino Gesù” di Roma che ha messo a punto una metodologia per prevedere le epidemie influenzali. Tuttavia, se un piatto della bilancia contiene potenzialità enormi, l’altro porta altrettante questioni da dirimere. Un esempio ci è stato fornito dal recente scandalo di Cambridge Analytica, che partendo dall’utilizzo di dati personali (non solo anagrafici, ma anche post o tweet sui principali social network) ha pilotato le scelte elettorali negli Stati Uniti. Anche il problema della rappresentatività della popolazione non permette di sostituire queste fonti con quelle tradizionali.
Questa contrapposizione è emersa anche in un acceso dibattito tra i partecipanti del Convegno, che hanno espresso le loro nette posizioni sul tema. Gli epidemiologi sono divisi in due fazioni: una che si schiera completamente a favore, l’altra assolutamente contro. È emersa in maniera molto forte la figura dell’epidemiologo come metodologo, per evitare che siano i dati a guidare i ricercatori o i ricercatori a guidare i dati. La necessità di protocolli a priori chiari e dettagliati è indispensabile per poter dare a questa nuova disciplina la corretta applicazione.
Per esempio, si può stimare il livello socioeconomico di un quartiere sulla base dei modelli delle macchine parcheggiate per strada? È possibile valutare la diffusione dei farmaci biosimilari utilizzando twitter? C’è la possibilità di prevedere l’insorgenza di un tumore o di un’altra patologia maligna soltanto dalle parole ricercate sui principali motori di ricerca?
Forse, come spesso accade, in media stat virtus e il compito dei futuri epidemiologi sarà di accogliere e comprendere tutte le potenzialità di questi dati e integrarli con le fonti più usuali per arricchire le proprie ricerche.
In molti, negli ultimi anni, hanno provato a dimensionare questo tema. A tal fine, invitiamo alla lettura di ciò che Rodolfo Saracci ha proposto allo European Journal of Epidemiology,2 fornendo un punto di vista interessante. Concludiamo con una celebre citazione di Einstein, a cui Saracci rimanda, che contestualizza il problema e ci mette in guardia sull’uso consapevole e sensato del dato e della ricerca stessa: «It would be possible to describe everything scientifically, but it would make no sense. It would be without meaning – as if you described a Beethoven symphony as a variation in wave pressure».3
Ringraziamenti: per la sessione sui big data si ringraziano tutti i relatori per i loro interessantissimi contributi: Michele Tizzoni, Fabio Marturana, Alberto Tozzi (per le relazioni invitate); Silvia Panicacci, Manuele Falcone, Stefania Serrani, Alessandro Cesare Rosa, Annibale Biggeri (per i contributi selezionati).
Bibliografia
- Rosa A. Un approccio semantico. Sfide e opportunità per l’Epidemiologia 2.0. Forward 2017;4. Volume Epidemiologia 2.0. Disponibile all’indirizzo: http://forward.recentiprogressi.it/numero-4/lepidemiologia-2-0/
- Saracci R. Epidemiology in wonderland: Big Data and precision medicine. Eur J Epidemiol 2018;33(3):245-57.
- Calaprice A. The ultimate quotable Einstein. Calaprice A, editor. Princeton, Princeton University Press, 2010; p. 409.