strumenti e metodi
Epidemiol Prev 2014; 38 (5): 335-341

L’uso dell’Inverse probability weighting (IPW) nella valutazione e “correzione” del selection bias

Inverse probability weighting (IPW) for evaluating and “correcting” selection bias

  • Silvia Narduzzi1

  • Martina Nicole Golini1

  • Daniela Porta1

  • Massimo Stafoggia1

  • Francesco Forastiere1

  1. Dipartimento di epidemiologia, Servizio sanitario della Regione Lazio, Roma

Cosa si sapeva già

  • Il selection bias può compromettere la generalizzabilità e la validità di uno studio.
  • Includere i fattori predittivi della missingness nei modelli è un approccio fallace.
  • Restringere l’analisi al sottoinsieme dei dati completi è un approccio fallace.

Cosa si aggiunge di nuovo

  • L’IPW permette di correggere le analisi senza introdurre ulteriori errori, poiché le stime sono ottenute pesando le osservazioni per la probabilità di selezione.
  • La “correzione” del selection bias è tanto migliore quanto meglio è specificato il modello predittivo per il calcolo dei pesi.

Riassunto:

INTRODUZIONE: l’Inverse probability weighting (IPW) è una delle tecniche utilizzate per la correzione del selection bias e della missingness, fenomeni causati da una selezione non casuale delle osservazioni o dalla mancanza non casuale di informazioni per un sottogruppo delle unità di analisi.
OBIETTIVI: illustrare la metodologia e fornire un’applicazione nell’ambito di uno studio di coorte che valuta l’associazione tra esposizione a inquinamento da traffico (biossido di azoto, NO2) e quoziente di intelligenza in bambini di 7 anni.
METODO: la metodologia permette di correggere le analisi pesando le osservazioni per la probabilità di selezione. L’IPW si basa sull’assunto che siano disponibili per tutta la popolazione in studio informazioni individuali in grado di predire la probabilità di inclusione (non-missingness) così che, una volta tenuto conto di esse, si possa fare inferenza sull’intera popolazione target a partire dalle sole osservazioni non-missing. La procedura per il calcolo è la seguente: si considera l’intera popolazione in studio e si calcola la probabilità attesa di non-missingness utilizzando unmodello di regressione logistica dove la variabile risposta è la non-missingness e le covariate sono i suoi possibili predittori. A ogni soggetto di analisi viene, quindi, attribuito un peso pari all’inverso della probabilità predetta. L’analisi si esegue poi sulle sole osservazioni non-missing utilizzando un modello di associazione pesato.
CONCLUSIONI: l’IPW è una tecnica che permette di incorporare il processo di selezione nell’analisi delle stime di effetto, ma è efficace nel “correggere” il selection bias solo a condizione che si disponga, per l’intera popolazione, di informazioni sufficienti a predire la probabilità di non-missingness. Nell’esempio riportato, l’applicazione dell’IPW ha mostrato che l’effetto dell’esposizione a NO2 sull’area verbale del quoziente di intelligenza dei bambini è più forte di quanto mostrato dalle analisi condotte senza tener conto del processo di selezione delle osservazioni.

Parole chiave: Inverse probability weighting, selection bias, missingness

Abstract:

INTRODUCTION: the Inverse probability weighting (IPW) is a methodology developed to account for missingness and selection bias caused by non-randomselection of observations, or non-random lack of some information in a subgroup of the population.
OBJECTIVES: to provide an overview of IPW methodology and an application in a cohort study of the association between exposure to traffic air pollution (nitrogen dioxide, NO2) and 7-year children IQ.
METHOD: this methodology allows to correct the analysis by weighting the observations with the probability of being selected. The IPW is based on the assumption that individual information that can predict the probability of inclusion (non-missingness) are available for the entire study population, so that, after taking account of them, we can make inferences about the entire target population starting from the nonmissing observations alone.The procedure for the calculation is the following: firstly, we consider the entire population at study and calculate the probability of non-missing information using a logistic regression model, where the response is the non-missingness and the covariates are its possible predictors.The weight of each subject is given by the inverse of the predicted probability. Then the analysis is performed only on the non-missing observations using a weighted model.
CONCLUSIONS: IPW is a technique that allows to embed the selection process in the analysis of the estimates, but its effectiveness in “correcting” the selection bias depends on the availability of enough information, for the entire population, to predict the non-missingness probability. In the example proposed, the IPW application showed that the effect of exposure to NO2 on the area of verbal intelligence quotient of children is stronger than the effect showed from the analysis performed without regard to the selection processes.

Keywords: Inverse probability weighting, selection bias, missingness


  • Se sei abbonato scarica il PDF nella colonna in alto a destra
  • Se non sei abbonato ti invitiamo ad abbonarti online cliccando qui
  • Se vuoi acquistare solo questo articolo scrivi a: abbonamenti@inferenze.it (20 euro)

Inserisci il tuo commento

L'indirizzo mail è privato e non verrà mostrato pubblicamente.
Refresh Type the characters you see in this picture. Type the characters you see in the picture; if you can't read them, submit the form and a new image will be generated. Not case sensitive.  Switch to audio verification.