L’uso dell’Inverse probability weighting (IPW) nella valutazione e “correzione” del selection bias
INTRODUZIONE: l’Inverse probability weighting (IPW) è una delle tecniche utilizzate per la correzione del selection bias e della missingness, fenomeni causati da una selezione non casuale delle osservazioni o dalla mancanza non casuale di informazioni per un sottogruppo delle unità di analisi.
OBIETTIVI: illustrare la metodologia e fornire un’applicazione nell’ambito di uno studio di coorte che valuta l’associazione tra esposizione a inquinamento da traffico (biossido di azoto, NO2) e quoziente di intelligenza in bambini di 7 anni.
METODO: la metodologia permette di correggere le analisi pesando le osservazioni per la probabilità di selezione. L’IPW si basa sull’assunto che siano disponibili per tutta la popolazione in studio informazioni individuali in grado di predire la probabilità di inclusione (non-missingness) così che, una volta tenuto conto di esse, si possa fare inferenza sull’intera popolazione target a partire dalle sole osservazioni non-missing. La procedura per il calcolo è la seguente: si considera l’intera popolazione in studio e si calcola la probabilità attesa di non-missingness utilizzando unmodello di regressione logistica dove la variabile risposta è la non-missingness e le covariate sono i suoi possibili predittori. A ogni soggetto di analisi viene, quindi, attribuito un peso pari all’inverso della probabilità predetta. L’analisi si esegue poi sulle sole osservazioni non-missing utilizzando un modello di associazione pesato.
CONCLUSIONI: l’IPW è una tecnica che permette di incorporare il processo di selezione nell’analisi delle stime di effetto, ma è efficace nel “correggere” il selection bias solo a condizione che si disponga, per l’intera popolazione, di informazioni sufficienti a predire la probabilità di non-missingness. Nell’esempio riportato, l’applicazione dell’IPW ha mostrato che l’effetto dell’esposizione a NO2 sull’area verbale del quoziente di intelligenza dei bambini è più forte di quanto mostrato dalle analisi condotte senza tener conto del processo di selezione delle osservazioni.