Editoriali
26/11/2010

Metodi dell’inferenza causale in epidemiologia

, ,

Il dibattito sulla necessità e possibilità di stimare gli effetti causali negli studi osservazionali e sulla differenza tra associazione e effetto causale non è nuovo nella letteratura epidemiologica.1Negli ultimi dieci anni sono emersi diversi contributi che hanno permesso di approfondire le assunzioni necessarie per l’inferenza causale e al tempo stesso di proporre modifiche ai metodi statistici standard e nuovi modelli. Su questo numero di Epidemiologia e Prevenzione Raffaella Campaner descrive alcune delle teorie filosofiche contemporanee sul concetto di causa.2 Senza alcun intento di revisione sistematica, qui vogliamo menzionare alcune delle metodiche del-l’inferenza causale che hanno importanti ricadute pratiche per la corretta pianificazione, conduzione e analisi di studi osservazionali in epidemiologia. I grafi causali, e in particolare i DAG (directed acyclic graphs), discussi anche nell’articolo di Campaner, permettono di incorporare le conoscenze disponibili e quindi visualizzare in maniera relativamente semplice e diretta i rapporti causali tra le variabili in studio.3 Per esempio, il DAG in figura 1 indica che l’esposizione E non causa la malattia M, ma condivide con essa una causa comune C. Inoltre, sia l’esposizione E sia la malattia M hanno un effetto sulla variabile S. Attraverso una serie di regole grafiche è possibile valutare gli effetti delle due variabili C e S, e del loro eventuale aggiustamento, sulla stima dell’associazione tra E e M. Nel grafo di figura 1 l’effetto causale dell’esposizione E sulla malattia M può essere stimato aggiustando per C, mentre aggiustare per S comporterebbe l’introduzione di distorsione. Diversi articoli pubblicati negli ultimi dieci anni utilizzano i DAG per affrontare problemi di confondimento o, in generale, di bias.4,5 In un articolo di grande interesse, Hernan e collaboratori si sono basati sui rapporti causali tra le variabili in gioco per derivare un’efficiente classificazione del bias.6 Considerando, come sopra, un’esposizione E e una malattia M, un’associazione spuria tra E e M si può produrre per uno dei seguenti motivi:

  • M causa E;
  • E ed M hanno cause comuni;
  • E e M hanno un effetto comune su cui è stato condotto un aggiustamento.

Il primo motivo rappresenta la causalità inversa o il bias di informazione, il secondo motivo costituisce il confondimento, mentre il terzo meccanismo è il bias di selezione. Attraverso i DAG è possibile comprendere in maniera intuitiva e diretta quale siano i problemi, spesso trascurati, associati all’aggiustamento per una variabile intermedia quando si vuole stimare l’effetto diretto di un’esposizione su un evento.7 Consideriamo l’esempio ipotetico di uno studio che voglia valutare se un possibile effetto dell’esposizione a rumore sul rischio di infarto acuto del miocardio sia dovuto interamente a un effetto del rumore sulla pressione arteriosa (variabile intermedia) oppure vi sia anche un effetto diretto. Una volta costruito il DAG corretto, è possibile verificare che il semplice aggiustamento per livello di pressione arteriosa non assicura di stimare l’effetto causale diretto. L’aggiustamento stesso, infatti, può introdurre distorsione rendendo confondenti dell’associazione tra rumore e infarto tutte le cause che la pressione arteriosa e l’infarto hanno in comune. Anche le variabili strumentali (IV, instrumental variables) possono essere utilizzate in epidemiologia osservazionale per stimare gli effetti causali.8 Queste variabili:

  • sono (fortemente) associate all’esposizione di interesse in quanto ne sono causa o condividono con essa cause comuni;
  • hanno effetto sull’esito solo attraverso l’esposizione di interesse;
  • non condividono cause comuni con l’esito.

Attraverso un DAG si può comprendere facilmente che l’utilizzo di una IV permette di risolvere il confondimento noto e non noto tra l’esposizione e l’esito. Nella pratica, però, la necessità di soddisfare tutte le condizioni appena descritte rende difficile individuare dei buoni strumenti, anche se questo approccio è stato utilizzato in alcuni studi, per esempio con l’intenzione di risolvere il problema del confondi-mento da indicazione.8 Negli studi epidemiologici osservazionali la stima dell’effetto causale può richiedere l’utilizzo di modelli diversi da quelli solitamente utilizzati, come gli structural nested models (SNM), e i marginal structural models (MSM). Gli MSM, in particolare, permettono di incorporare nei modelli di regressione standard le stime di probabilità dell’esposizione come funzione dei potenziali confondenti (inverse probability of-treatment weighting, IPTW), con lo scopo di creare popolazioni tra loro confrontabili (exchangeable) chiamate pseudopopolazioni.9

Figura 1. Grafo causale.
Figure 1. Directed acyclic graph.

I modelli MSM e SNM permettono di tenere conto di confondenti ed esposizioni tempo-dipendenti o variabili intermedie in situazioni nelle quali i metodi standard di regressione forniscono stime distorte. Una situazione tipica è quella in cui l’esposizione al tempo t0 ha delle conseguenze al tempo t1 su un fattore di rischio tempo-dipendente per la malattia di interesse, il quale, a sua volta, influisce sulla probabilità di esposizione al tempo t1. Per esempio, in uno studio su allattamento al seno e peso del bambino a due anni di vita, il latte materno ha un effetto sulla crescita a 6 mesi, ma una crescita ridotta a 6 mesi, oltre a essere determinante del peso a due anni, può anche influire sulla decisione della donna se continuare o meno ad allattare al seno. È possibile utilizzare i modelli causali per tenere conto del peso del bambino a 6 mesi senza introdurre distorsione. Le applicazioni di tali modelli e la loro implementazione con software statistici stanno diventando accessibili.10,11 Pensiamo che il rapido sviluppo dal punto di vista concettuale e metodologico dei metodi dell’inferenza causale in epidemiologia sia accompagnato da un relativo ritardo della loro applicazione in esempi empirici, passo necessario per il successivo trasferimento dei nuovi metodi nella pratica degli studi epidemiologici. Per esempio, i DAG sono stati utilizzati numerose volte per mettere in evidenza situazioni in cui l’inclusione di una data variabile in modelli di regressione tradizionali comporterebbe l’introduzione di bias. Raramente, però, l’entità del bias e la sua direzione sono stati stimati in studi di simulazione o in esempi empirici. Vogliamo quindi richiamare l’attenzione sui metodi dell’inferenza causale, auspicandone l’impiego nell’analisi di studi epidemiologici e la produzione di lavori in cui i relativi risultati siano confrontati con quelli che si otterrebbero con approcci tradizionali. Una serie di articoli di questo tipo, anche su questa rivista, sarebbe di grande utilità per il miglioramento della pratica epidemiologica.

Ringraziamenti:

Ringraziamo tutti i componenti del gruppo di lavoro SISMECICE (Inferenza causale in epidemiologia), all’interno del quale abbiamo affrontato e discusso molti dei temi qui trattati.

Bibliografia

  1. Greenland S, Robins JM. Identifiability, exchangeability, and epidemiological confounding. Int J Epidemiol 1986; 15: 413-19.
  2. Campaner R. Teorie filosofiche della causalità per l’epidemiologia. Epidemiol Prev 2010; 1-2; 48-52.
  3. Pearl J. Causality: models, reasoning, and inference. Cambridge (UK), Cambridge University Press 2000.
  4. Hernández-Díaz S, Schisterman EF, Hernán MA. The birth weight “paradox” uncovered? Am J Epidemiol 2006; 164: 1115-20.
  5. Richiardi L, Barone-Adesi F, Merletti F, Pearce N. Using directed acyclic graphs to consider adjustment for socioeconomic status in occupational cancer studies. J Epidemiol Community Health 2008; 62: e14.
  6. Hernán MA, Hernández-Díaz S, Robins JM. A structural approach to selection bias. Epidemiology 2004; 15: 615-25.
  7. Petersen ML, Sinisi SE, van der Laan MJ. Estimation of direct causal effects. Epidemiology 2006; 17: 276-84.
  8. Martens EP, Pestman WR, de Boer A et al. Instrumental variables: applications and limitations. Epidemiology 2006; 17: 260-67.
  9. Robins JM, Hernán MA, Brumback B. Marginal structural models and causal inference in epidemiology. Epidemiology 2000; 11: 550-60.
  10. Sterne JAC, Tilling K. G-estimation of causal effects, allowing for time varying confounding. Stata Journal 2002; 2: 164-82.
  11. Fewell Z, Hernán MA, Wolfe F et al. Controlling for time-dependent confounding using marginal structural models. Stata Journal 2004; 4: 402-20.
Approfondisci su epiprev.it Vai all'articolo su epiprev.it Versione Google AMP