Comunicare i dati della coorte italiana di nuovi nati NINFEA
Cosa si sapeva già
- La diffusione di dati di prevalenza/incidenza nelle indagini descrittive e la pubblicazione delle stime di associazione negli studi analitici sono prassi consolidate.
- I dati di prevalenza negli studi analitici sono raramente resi pubblicamente disponibili.
Cosa aggiunge di nuovo
- La sezione «Dati» del sito Internet della coorte di nuovi nati NINFEA è una prima esperienza sistematica finalizzata a rendere pubbliche statistiche descrittive, in forma aggregata, sulle caratteristiche di esposizione o esito delle mamme e dei bambini partecipanti allo studio.
- La divulgazione di questi dati, accompagnata a una corretta comunicazione sul loro ambito di utilizzo, può contribuire al coinvolgimento dei partecipanti, all’arricchimento del patrimonio di informazioni disponibili alla popolazione e risultare utile agli addetti ai lavori, ai decisori e ai ricercatori.
Introduzione
Diverse indagini epidemiologiche, quali sistemi di sorveglianza e registri di popolazione, hanno lo scopo di produrre dati di prevalenza o incidenza per conoscere le caratteristiche di esposizione o esito in una popolazione in un dato periodo. I risultati di questi lavori descrittivi sono generalmente resi disponibili al pubblico in forma di dati aggregati su base geografica, con diversi livelli di dettaglio. Alcuni esempi di attività che hanno fornito dati apparsi periodicamente su Epidemiologia&Prevenzione sono:
- il sistema di sorveglianza “OKkio alla salute”, che mette a disposizione informazioni sugli stili di vita e sullo stato ponderale di bambini di 8-9 anni su base regionale o aziendale;1
- il sistema di sorveglianza “Passi”, che rende disponibili su base regionale dati su stili di vita e fattori di rischio comportamentali di adulti tra 18 e 64 anni di età;2
- i Registri tumori, che forniscono dati sull’incidenza di tumori nelle aree coperte da registrazione, definite su base di città, Aree metropolitane, Provincie o Regioni.3
I risultati di questi progetti sono direttamente riferibili a una popolazione definita a priori su base di residenza e tempo.
Altre tipologie d’indagine epidemiologica, di tipo analitico, hanno la finalità di identificare associazioni, possibilmente causali, tra esposizioni ed esiti di interesse. Questi studi non necessitano strettamente di essere rappresentativi di una popolazione definita su base geografica e temporale per fornire stime valide.4 Le stime di associazione prodotte sono normalmente rese disponibili al pubblico tramite rapporti scientifici, che solitamente hanno una valenza generale più ampia rispetto alla popolazione nella quale lo studio è stato condotto. Raramente, invece, le stime di prevalenza/incidenza di esposizione o esito provenienti da questi studi, in particolare dagli studi di coorte, sono resi pubblicamente disponibili. In questo articolo intendiamo descrivere e discutere l’esperienza pilota di open data di dati aggregati di frequenza di esposizioni ed esiti all’interno della coorte di nuovi nati NINFEA.
Metodi
La coorte NINFEA
La coorte di nuovi nati NINFEA è uno studio che dal 2005 al 2016 ha reclutato via Internet circa 7.500 donne in gravidanza, allo scopo di seguire i loro bambini nel tempo per studiare gli effetti sulla salute di esposizioni che agiscono precocemente nella vita.5,6 Le partecipanti compilano un primo questionario durante la gravidanza. Informazioni su esposizioni ed esiti dei bambini sono raccolte tramite questionari compilati on-line dalle mamme a 6 e 18 mesi, 4, 7 e 10 anni del bambino. L’esistenza dello studio è stata diffusa con diverse modalità sia on-line (Facebook, link su siti, post su forum) sia off-line (volantini, poster, presentazioni ai corsi di preparazione alla nascita, passaparola) a tutta la popolazione italiana, anche se, per motivi logistici, la diffusione è stata più capillare nelle Regioni Piemonte e Toscana, dalle quali proviene l’85% della coorte. Gli attuali sei questionari dello studio includono cumulativamente alcune migliaia di variabili e la struttura dei questionari è pubblicamente accessibile.7 Essendo NINFEA una coorte dinamica che ha reclutato per un periodo di 12 anni, la numerosità dei partecipanti al 2017 varia dalle 7.500 donne in gravidanza al questionario di baseline ai 500 bambini al questionario dei 10 anni.
Sezione «Dati» della coorte NINFEA
La sezione «Dati» del progetto NINFEA8 ha lo scopo di rendere pubbliche le distribuzioni di frequenza di variabili selezionate della coorte. È stata attivata il 20.03.2016 ed è al momento divisa in due aree, «Mamme» e «Bambini», a loro volta strutturate in sottosezioni tematiche. Le variabili da aggiungere progressivamente alla sezione «Dati» sono selezionate dal gruppo di lavoro del progetto NINFEA o suggerite dall’esterno (partecipanti al progetto, decisori, ricercatori).
Ciascuna variabile è analizzata ad hoc, trattando i dati mancanti ed eventuali inconsistenze, e il codice di programmazione è salvato per aggiornamenti periodici. Le distribuzioni di frequenza sono rese disponibili nella sezione «Dati», utilizzando forme grafiche o tabellari opportune per agevolare lettura e comprensione. Possono essere presenti brevi testi esplicativi, ma non sono contemplati testi di commento.
Analisi
Le analisi per questo articolo hanno seguito tre obbiettivi:
- descrivere le variabili presenti nella sezione «Dati» del progetto NINFEA;
- analizzare i flussi di utilizzo della sezione «Dati», utilizzando i dati di Google Analytics;
- confrontare le distribuzioni di frequenza relative ai partecipanti del progetto NINFEA con le distribuzioni disponibili da progetti di sorveglianza o da registri, per esempio indagini Istat sulle condizioni di salute e ricorso ai servizi sanitari,9 Certificato di assistenza al parto (CeDAP),10 sistemi di sorveglianza per bambini di 0-2 anni,11 OKkio alla salute.12
Per questa analisi, sono state selezionate le seguenti variabili:
- indice di massa corporea pre-gravidanza;
- percentuale di donne che allattano al seno;
- durata dell’allattamento;
- posizione in cui viene messo a dormire il bambino in culla. Inoltre, a titolo di esempio, abbiamo selezionato anche l’uso di paracetamolo nel primo trimestre di gravidanza, conducendo una ricerca ad hoc su Epicentro e Istat per identificare potenziali fonti di dati con cui confrontare i risultati NINFEA.
Le analisi sono state condotte con intento descrittivo e non inferenziale.
Risultati
La tabella 1 elenca le variabili al momento disponibili nella sezione «Dati» del progetto NINFEA.
La figura 1 riporta un esempio di come appaiono agli utenti le informazioni della sezione «Dati». Nello specifico, sono riportati i grafici e le tabelle per gli accessi al pronto soccorso e la prevalenza di fischi e sibili al torace in diversi periodi della vita.
Tra il 20.03.2016 e il 18.12.2017 la sezione «Dati» del progetto NINFEA è stata visitata da 3.778 utilizzatori per 4.735 sessioni di utilizzo e 12.620 visite di pagina. La maggior parte delle visite si è verificata a seguito dell’invio tramite e-mail di news alle partecipanti al progetto NINFEA in concomitanza con gli aggiornamenti della sezione «Dati».
La tabella 2 riassume i risultati del progetto NINFEA e delle fonti dati “esterne” (sistemi di sorveglianza o registri) per variabili selezionate.
Per l’indice di massa corporea pre-gravidanza, le variabili sull’allattamento al seno e la posizione in cui dorme il bambino in culla, non abbiamo osservato differenze importanti, dal punto di vista qualitativo, tra le due fonti. I dati esterni sono stati estratti da report disponibili on-line, ma non di immediato accesso. Per il consumo di paracetamolo nel primo trimestre di gravidanza non abbiamo trovato fonti esterne con dati di popolazione.
Discussione
Questo articolo riassume l’esperienza della sezione «Dati» del progetto NINFEA, una sezione in costante aggiornamento e graduale arricchimento che rende disponibili statistiche descrittive sulle caratteristiche di esposizione o esito delle mamme e dei bambini partecipanti alla coorte di nuovi nati NINFEA.
Occorre considerare che tale sezione non riporta misure di associazione e che i dati sono resi disponibili in forma esclusivamente aggregata. Non vi è, quindi, la possibilità da parte dell’utente di condurre analisi in proprio e, anche se con possibili eccezioni, i dati non consentono di saggiare ipotesi di ricerca. In questo senso, la sezione «Dati» NINFEA si discosta da una definizione di open data in senso stretto, trattandosi più specificatamente di un’attività sistematica di comunicazione di misure di frequenza.
La coorte NINFEA è caratterizzata da una forte selezione al reclutamento, in quanto si rivolge a donne in gravidanza che, saputo dello studio, partecipano volontariamente attraverso Internet. Un certo grado di selezione al reclutamento è presente nella maggior parte degli studi di coorte, ma nella coorte NINFEA la forza di selezione è oggettivamente più elevata rispetto agli studi tradizionali. Inoltre, come in tutti gli studi di coorte, i questionari di follow-up sono compilati solo dal sottogruppo della coorte che continua a partecipare nel tempo. Le stime di prevalenza di esposizione ed esito nei partecipanti alla coorte NINFEA possono, quindi, essere diverse da quelle della popolazione generale. La homepage della sezione «Dati» riporta in evidenza la seguente frase: «Ricordiamo che i dati consultabili, tramite i menù superiori, si riferiscono alle mamme e ai bambini della coorte NINFEA e non sono da ritenersi rappresentativi dell’intera popolazione nazionale».
Come brevemente discusso in un precedente articolo,9 è fondamentale definire a chi possano essere utili le informazioni presenti nella sezione «Dati».
Per il singolo partecipante, le informazioni ottenute sulla popolazione della coorte NINFEA sono probabilmente più informative rispetto a quelle della popolazione generale. Considerando i dati di tabella 2, per esempio, se una donna partecipante al progetto NINFEA residente in Piemonte che abbia partorito nel 2012 volesse sapere quanto è frequente l’allattamento al seno, potrebbe considerare i dati Istat per il Nord-Ovest per il 2013 (85,9%) oppure accedere ai dati NINFEA (90,8%). Su base geografica e, in parte, temporale, la persona appartiene alla popolazione descritta dai dati Istat, mentre per altre caratteristiche che l’hanno portata a partecipare allo studio (probabilmente più rilevanti del luogo di residenza per determinare la probabilità di allattamento) la persona appartiene alla popolazione NINFEA.
Consideriamo ora il caso di una donna che abbia partorito sempre in Piemonte, ma nel 2017, e che non abbia avuto la possibilità di partecipare alla coorte NINFEA. Sia i dati Istat sia i dati NINFEA non si riferirebbero propriamente alla sua popolazione, comunque definita, su base geografica/temporale o in base alla partecipazione volontaria a uno studio. Si potrebbe immaginare che, se la persona fosse stata interessata a partecipare alla coorte NINFEA nel caso avesse saputo dello studio, le sue caratteristiche sarebbero simili a quelle della popolazione NINFEA, quindi la stima meno distorta sarebbe 90,8%; altrimenti, la stima più corretta sarebbe 85,9%.
Gli addetti ai lavori e i decisori costituiscono una terza tipologia di possibili utenti della sezione «Dati». Per la maggior parte delle finalità di programmazione sanitaria, valutazione delle politiche, stime dei bisogni, valutazione di impatto, è necessario conoscere le stime di popolazione. Difficilmente per questi utilizzatori i dati NINFEA possono essere più utili di quelli di registri o di sistemi di sorveglianza. Fa eccezione il caso in cui tali informazioni non siano disponibili al di fuori del progetto NINFEA o di simili indagini epidemiologiche che decidano di condividere i loro dati. La questione diventa, quindi, se sia preferibile non disporre di dati e attendere, in caso di bisogno, i risultati di un sistema di sorveglianza implementato ad hoc oppure utilizzare informazioni potenzialmente non applicabili alla popolazione a cui si è interessati. Pensiamo che, in attesa dell’implementazione di raccolte dati ad hoc, le informazioni derivanti dal progetto NINFEA possano essere un possibile sostituto alla mancanza di conoscenza empirica anche per i decisori. Ci sembra, in altre parole, che l’uso consapevole di dati di prevalenza potenzialmente distorti sia spesso da preferirsi alla mancanza di dati.
La comunità dei ricercatori è un’ulteriore categoria che potrebbe essere interessata alla sezione «Dati» NINFEA, quando le informazioni sulla variabile di interesse non siano disponibili da fonti di dati di popolazione. Per esempio, un ricercatore che volesse studiare gli effetti sulla salute riproduttiva dell’utilizzo di paracetamolo in gravidanza nell’ambito di uno studio prospettico avrebbe bisogno di conoscere la prevalenza di utilizzo per ragionare sulla dimensione campionaria. L’alternativa all’utilizzo dei dati NINFEA, probabilmente più complessa e dispendiosa, sarebbe quella di condurre un’indagine ad hoc per raccogliere informazioni utili alla pianificazione dello studio principale.
Per gli utilizzatori che non siano addetti ai lavori, bisogna considerare la facilità di accesso alle informazioni. Al momento le informazioni derivanti da registri o sistemi di sorveglianza sono perlopiù accessibili, ancorché pubblicamente, tramite l’estrapolazione del dato dalle tabelle pubblicate in report, solitamente di non facile individuazione. Ci sono numerose eccezioni in cui sono stati creati portali ad hoc facilmente interrogabili dagli utenti (si vedano, per esempio, “Passi on line”18 o il sito dell’Associazione italiana dei registri tumori19), ma, almeno nella nostra esperienza, per quanto riguarda la salute materno-infantile e la salute del bambino, l’individuazione e l’accesso alle informazioni richiede ancora un notevole sforzo da parte dell’utente.
Pubblicare i dati per arricchire il patrimonio informativo e favorire la partecipazione
In conclusione, ci sembra che sia possibile e auspicabile rendere pubbliche le statistiche di prevalenza di esposizione ed esito provenienti da studi di coorte di grandi dimensioni. La sezione «Dati» del progetto NINFEA è una prima esperienza sistematica in questa direzione, sebbene altre coorti contemporanee divulghino stime di prevalenza, per esempio attraverso newsletter accessibili on-line.20
La pubblicazione dei dati può contribuire al coinvolgimento dei partecipanti, all’arricchimento del patrimonio di informazioni disponibili alla popolazione e alla facilità di accesso alle informazioni, anche se è fondamentale che la divulgazione di tali informazioni sia accompagnata da una corretta comunicazione sul loro ambito di utilizzo. La creazione di siti Internet specifici, in cui sia possibile accedere facilmente ai dati e in cui siano chiaramente definite le loro limitazioni, richiede risorse e competenze, non sempre presenti all’interno dei singoli gruppi di lavoro. Potrebbe essere possibile, nel lungo periodo, immaginare un portale che funga da collettore di informazioni provenienti da diversi studi a livello italiano. L’impatto della pubblicazione sistematica dei dati di prevalenza e il loro reale utilizzo dovranno essere comunque valutati a lungo termine con studi ad hoc.
Conflitti di interesse dichiarati: nessuno.
Ringraziamenti: ringraziamo per il contributo alla sezione «Dati» del sito NINFEA Francesco Brunetti, Ugo Casalone, Paola Ivaldi, Fabio Saccona e Loredana Vizzini. Ringraziamo, inoltre, Paola Ivaldi per i commenti sul testo e tutti i partecipanti della coorte NINFEA per il loro contributo e per la partecipazione attiva attraverso la pagina Facebook dello studio.
Bibliografia
- Spinelli A, Nardone P, Buoncristiano M, Lauria L, Bucciarelli M, Galeone D. Italia 2014: l’obesità nei bambini sta diminuendo. Epidemiol Prev 2015;39(1):63.
- Quarchioni E, Possenti V, Ferrante G et al. Il fumo di tabacco e il consumo di alcol nelle donne in gravidanza e fra le donne che allattano al seno: dati preliminari della sorveglianza PASSI 2014. Epidemiol Prev 2016;40(1):76.
- Dal Maso L, Buzzoni C, Guzzinati S, Crocetti E; AIRTUM Working Group. Italia 2015: 3 milioni di italiani vivono dopo una diagnosi di tumore, incidenza e mortalità sono in calo. Epidemiol Prev 2016;40(1):75.
- Richiardi L, Pizzi C, Pearce N. Commentary: Representativeness is usually not necessary and often should be avoided. Int J Epidemiol 2013;42(4):1018-22.
- Richiardi L, Baussano I, Vizzini L, Douwes J, Pearce N, Merletti F. Feasibility of recruiting a birth cohort through the Internet: the experience of the NINFEA cohort. Eur J Epidemiol 2007;22(12):831-37.
- Richiardi L, Pizzi C, Rusconi F, Merletti F. EPICHANGE: Il progetto NINFEA e le nuove forme di coinvolgimento dei cittadini nella ricerca epidemiologica. Epidemiol Prev 2015;39(1):14-18.
- Questionari del Progetto NINFEA, disponibili all’indirizzo: https://www.progettoninfea.it/inspector (ultimo accesso: agosto 2017).
- Progetto NINFEA, Sezione «Dati NINFEA». Disponibile all’indirizzo: https://dati.progettoninfea.it (ultimo accesso: agosto 2017).
- Istat. Condizioni di salute e ricorso ai servizi sanitari. Disponibile all’indirizzo: https://www.istat.it/it/archivio/5471 (ultimo accesso: agosto 2017).
- Basili F, Di Rosa A, Montorio V, Tamburini C. Certificato di assistenza al parto (Cedap). Analisi dell’evento nascita – Anno 2014. Roma, Ministero della salute, 2016. Disponibile all’indirizzo: http://www.salute.gov.it/imgs/C_17_pubblicazioni_2585_allegato.pdf
- Pizzi E, Spinelli A, Lauria L et al. Progetto Sorveglianza Bambini 0-2 anni: finalità, metodologia e risultati della sperimentazione. Roma 2016. Disponibile all’indirizzo: http://www.epicentro.iss.it/temi/materno/pdf/RAPPORTO_FINALE_SORVEGLIANZA_BAMBINI_0_2_anni.pdf
- Nardone P, Spinelli A, Buoncristiano M et al. Il sistema di sorveglianza OKkio alla Salute: risultato 2014. Roma, Istituto superiore di sanità, Centro nazionale di epidemiologia, sorveglianza e promozione della salute, 2016. Disponibile all’indirizzo: http://old.iss.it/binary/publ/cont/ONLINE_Okkio.pdf (ultimo accesso: agosto 2017).
- Puglia M, Fanti E, Dubini V, Voller F. Gravidanza e parto in Toscana. Serie In Cifre n. 10. Firenze, Agenzia regionale di sanitaÌ della Toscana, 2014. Disponibile all’indirizzo: https://www.ars.toscana.it/files/pubblicazioni/in_cifre/In_Cifre_10_7_Apr_2016_xweb_def.pdf
- Cuoghi C, Di Mario S, Borgini B, Bragliani M, Castelli E, Tramonti D. Prevalenza dell’allattamento al seno e altri interventi preventivi in Emilia-Romagna. Ricerca triennale – Anno 2011. Sesta edizione. Bologna, Centro di stampa Giunta regionale, 2012. Disponibile all’indirizzo: http://salute.regione.emilia-romagna.it/documentazione/rapporti/allattamento-al-seno-er-2011
- Istat. Gravidanza, parto e allattamento al seno. Disponibile all’indirizzo: https://www.istat.it/it/archivio/141431 (ultimo accesso: agosto 2017).
- Piumelli R, Puglia M, Aversa L, Rusconi F. Sudden Infant Death Syndrome. In: Amador C, Aversa L, Azzari C et al. La salute dei bambini e dei ragazzi in Toscana. Documenti dell’Agenzia Regionale di Sanità Toscana. N. 78. Firenze, Collana dei documenti ARS, 2014. https://www.ars.toscana.it/it/pubblicazioni/collana-documenti-ars/pubblicazioni-2014/2543-la-salute-dei-bambini-e-dei-ragazzi-in-toscana-2014.html
- Maraschini A, Ventura M, Senatore S et al. Consumo di farmaci in gravidanza e appropriatezza prescrittiva nella regione Lazio. Rapporti ISTISAN 16/29. Roma, Istituto Superiore di SanitaÌ, 2016. Disponibile all’indirizzo: http://www.iss.it/binary/publ/cont/16_29_web.pdf
- La sorveglianza Passi. Disponibile all’indirizzo: http://www.epicentro.iss.it/passi/ (ultimo accesso: agosto 2017).
- Associazione italiana dei registri tumori. Disponibile all’indirizzo: http://www.registri-tumori.it/cms/ (ultimo accesso: agosto 2017).
- Piccolipiù – arruolamento e sorveglianza epidemiologica di una coorte nazionale di nati. Disponibile all’indirizzo: http://www.piccolipiu.it (ultimo accesso: agosto 2017).