Il quesito di ricerca e la validità degli studi
Il quesito di ricerca
La formulazione del quesito di ricerca è un processo complesso. Una volta definito, tuttavia, il quesito detta le scelte successive: i metodi dello studio, la sua dimensione e la durata, l’approccio sperimentale oppure osservazionale, la scelta della popolazione e così via. Per esempio, se si vuole studiare l’efficacia del trattamento con un nuovo farmaco in pazienti con una data malattia, la prima scelta cadrà probabilmente su uno studio randomizzato controllato. Viceversa, per capire se l’esposizione occupazionale ad amianto possa causare il mesotelioma, ci si focalizzerà probabilmente su una coorte di lavoratori esposti.
Da molto tempo la comunità scientifica ha acquisito la consapevolezza che la coerenza dei risultati ottenuti attraverso vari approcci di studio in diverse popolazioni è fondamentale per valutare se l’associazione tra un’esposizione e un esito sia di tipo causale oppure no.1,2 Le opzioni a disposizione sono molteplici e, negli ultimi decenni, sono stati sviluppati e applicati all’epidemiologia diversi approcci di studio e metodi statistici che hanno proprio lo scopo di contribuire al processo dell’inferenza causale. Non ha, quindi, molto senso chiedersi in generale se sia meglio condurre uno studio randomizzato controllato di piccole dimensioni anziché uno studio di coorte di grandi dimensioni; oppure, analogamente, se sia meglio condurre uno studio basato sui registri che comprenda l’intera popolazione anziché uno studio con reclutamento attivo su un campione selezionato. La risposta dipende dal quesito di ricerca, quindi dall’esposizione in studio, dalle conoscenze disponibili a priori, dall’interesse verso una popolazione specifica oppure verso una risposta più generale, dall’esito in studio e dalla conoscenza dei suoi fattori di rischio, dalla rilevanza e dalle possibili conseguenze dei risultati dello studio. Tra i diversi approcci, solitamente si opta per quello che può contemporaneamente minimizzare la distorsione e massimizzare la fattibilità e la precisione della stima. I livelli di qualità delle prove di efficacia/causalità (la cosiddetta “gerarchia delle evidenze”), che invariabilmente considerano come migliori (o necessari) i risultati che derivano da studi randomizzati controllati, non sono necessariamente la guida migliore per valutare la correttezza della scelta. La qualità delle prove può essere, infatti, valutata soltanto alla luce del quesito di ricerca.
Negli ultimi anni, l’epidemiologia ha sviluppato un’attenzione crescente alla validità esterna e alla relazione tra validità interna ed esterna, che sono, in ultima analisi, parte dello stesso processo inferenziale. È mia opinione che questo dibattito contribuisca a comprendere come l’ipotesi di ricerca debba prevalere sulla gerarchia delle prove.
Validità, generalizzabilità e trasportabilità
Uno studio si definisce come internamente valido quando è in grado di stimare in maniera non distorta l’effetto causale presente nel campione in studio. Sotto diverse ipotesi, questa stima può essere formalmente generalizzata alla popolazione da cui è stato ottenuto il campione, può essere trasportata a una popolazione target diversa (anche solo parzialmente) da quella in studio oppure può essere utilizzata per derivare un’affermazione di carattere generale sulla possibilità che l’esposizione possa causare l’esito. Quest’ultima modalità non richiede la specificazione di una popolazione target, ma vuole indagare su “come funziona la natura”; è, di fatto, la modalità classica del metodo scientifico (si pensi, per esempio, agli esperimenti di laboratorio). La generalizzazione formale e la trasportabilità di una stima richiedono, invece, l’identificazione di una popolazione di interesse.
In un articolo del 2019, Westreich e colleghi3 suggeriscono di valutare ciascun approccio di studio considerando insieme la validità interna e la validità esterna, declinata in termini di generalizzabilità o trasportabilità. A questo scopo, gli autori introducono il concetto di target validity, che corrisponde, appunto, alla validità complessiva specifica per una data popolazione target. Se, per esempio, nel quesito di ricerca si fa riferimento, come target, a una determinata popolazione, il migliore approccio possibile sarà uno studio che sia al contempo internamente valido ed esternamente trasportabile o generalizzabile a quella popolazione. Come mettono in evidanza gli autori dell’articolo, questo concetto mette in discussione la classica visione della gerarchia delle prove sia per quanto riguarda l’aprioristica superiorità dello studio sperimentale rispetto a quello osservazionale sia per quanto riguarda l’interpretazione delle metanalisi di studi sperimentali o osservazionali condotti in popolazioni eterogenee. La target validity è, però, un concetto complesso, anche solo perché le popolazioni sono dinamiche (moving targets, come definito da Keyes e Galea).4 È improbabile che la popolazione in studio sia del tutto analoga a quella a cui si vogliono applicare i risultati. Indipendentemente dal ricercatore, le popolazioni sono, inoltre, soggette a processi di selezione potenzialmente associati all’esposizione di interesse, ai fattori di rischio della malattia in studio e a eventuali modificatori di effetto.5 Questi processi di selezione hanno impatto sia sulla validità interna sia su quella esterna.
Bisogna dire che, nella pratica, specialmente per quanto riguarda gli studi eziologici, spesso la popolazione target non è esplicitata; in altre parole, il quesito di ricerca non specifica quale sia la popolazione di interesse. Per esempio, domande di ricerca quali: «La posizione prona può causare la sindrome della morte in culla (in inglese SIDS, Suddend Infant Death Syndrome)?» oppure: «il fumo può causare il tumore del polmone?» sono state studiate con lo scopo di derivare affermazioni di carattere generale. I risultati degli studi iniziali sono stati replicati in diversi contesti e utilizzando diversi approcci (studi analitici, studi ecologici, trend temporali), e le conoscenze ottenute sulla possibilità di una relazione causale sono state utilizzate per implementare interventi di prevenzione in molte popolazioni. Questo senza che siano stati condotti studi sperimentali o che sia stata ben definita una popolazione target per testare la validità esterna.
Alcuni ricercatori stanno tentando di rendere formale in epidemiologia il processo di generalizzazione o trasporto dei risultati alla popolazione target, che implica considerare come le differenze tra la popolazione in studio e quella target possano modificare l’effetto dell’esposizione sull’esito di interesse. Per esempio, Lesko e colleghi hanno utilizzato l’approccio degli esiti potenziali per rendere esplicite le assunzioni che devono essere soddisfatte per generalizzare o trasportare i risultati di uno studio a una popolazione target.6 Pearl e Bareimboin, in una serie di articoli, hanno proposto l’utilizzo di grafi causali per comprendere se e come i dati di uno o più studi (anche eterogenei: sperimentali, osservazionali, selezionati e rappresentativi) possano essere utilizzati per ottenere la stima della quantità di interesse nella popolazione target (processo da loro chiamato data fusion).7,8 Questi grafi causali, oltre a incorporare informazioni sulle relazioni causali tra esposizione, esito, confondenti e altre variabili rilevanti per la validità interna, mostrano il processo che genera la differenza tra la popolazione target e quella in studio.
Conclusioni
Deaton e Cartwright, in un ottimo articolo di grande stimolo (si vedano i 18 articoli di commento pubblicati nello stesso volume della rivista) su comprensioni e incomprensioni degli studi randomizzati controllati, rispondono nel seguente modo a chi sostiene che questi studi siano, pur se imperfetti, sempre il miglior approccio possibile: «[migliore] per rispondere a quale domanda, per quale scopo?»9 In altre parole, il quesito di ricerca deve mantenere il primato.
Conflitti di interesse dichiarati: nessuno.
Ringraziamenti: l’Autore ringrazia i membri del gruppo di lavoro Inferenza causale in epidemiologia (ICE) della Società italiana di statistica medica ed epidemiologia clinica (SISMEC) per i loro commenti al manoscritto.
Finanziamenti: Lorenzo Richiardi è stato in parte supportato dal programma dell’Unione europea per la ricerca e l’innovazione “Horizon 2020” nell’ambito della convenzione di finanziamento n. 733206, progetto LIFE-CYCLE. La pubblicazione riflette solo l’opinione dell’autore e la Commissione europea non è responsabile per qualsiasi uso possa essere fatto delle informazioni in essa contenuta.
Bibliografia
- Hill AB. The environment and disease: association or causation? Proc R Soc Med 1965;58:295-300.
- Lawlor DA, Tilling K, Davey Smith G. Triangulation in aetiological epidemiology. Int J Epidemiol 2016;45(6):1866-86.
- Westreich D, Edwards JK, Lesko CR, Cole SR, Stuart EA. Target validity and the hierarchy of study designs. Am J Epidemiol 2019;188(2):438-43.
- Keyes KM, Galea S. Population health science. New York, Oxford University Press, 2016.
- Richiardi L, Pearce N, Pagano E, Di Cuonzo D, Zugna D, Pizzi C. Baseline selection on a collider: a ubiquitous mechanism occurring in both representative and selected cohort studies. J Epidemiol Community Health 2019;73(5):475-80.
- Lesko CR, Buchanan AL, Westreich D, Edwards JK, Hudgens MG, Cole SR. Generalizing study results: a potential outcomes perspective. Epidemiology 2017;28(4):553-61.
- Bareinboim E, Pearl J. Causal inference and the data-fusion problem. Proc Natl Acad Sci 2016;113(27):7345-52.
- Pearl J, Bareinboim E. Note on “Generalizability of Study Results”. Epidemiology 2019;30(2):186-88.
- Deaton A, Cartwright N. Understanding and misunderstanding randomized controlled trials. Soc Sci Med 2018;210:2-21.