Ho letto con interesse l’articolo di Biggeri et al. pubblicato recentemente su E&P (“P-value e probabilità di direzione dell’effetto”), che propone una diversa interpretazione del p-value (p) in un’ottica bayesiana.1 In sostanza, la proposta è quella di calcolare, partendo da p a una coda, il suo complemento (1 – p), che può essere interpretato come probabilità che l’effetto sia in una certa direzione. Giustamente, gli autori notano che non si tratta di un’alternativa, ma di un complemento all’intervallo di confidenza, che mantiene la sua fondamentale importanza (sia nel singolo studio sia nelle metanalisi), a condizione però che sia considerato come tale e non degradato a test di ipotesi (un intervallo è un intervallo, non un punto).I problemi del p sono noti da decenni, ma il difetto più rovinoso sta probabilmente nel suo utilizzo finale, che consiste in una rigida dicotomizzazione del suo valore (etichettata da Greenland “dicotomania”)2 in base alla soglia 0,05 in “statisticamente significativo” e non, così da ridurre in sostanza lo studio a “positivo” o “negativo” (l’assenza di evidenza alla fine diventa evidenza di assenza). Tanto che, dopo la citata posizione dell’American Statistical Association del 2016,1 la stessa si è spinta a pubblicare nel 2019 un netto editoriale che presentava ben 43 articoli critici di p, in cui si legge «‘statistically significant’ – don’t say and dont’use it».3Purtroppo, la proposta (vecchia di decenni)4 di considerare l’intervallo di confidenza invece di p ha dato pochi risultati (praticamente solo in riviste di epidemiologia e statistica e nelle riviste più autorevoli come The Lancet e il New England Journal of Medicine), perché moltissimi ricercatori guardano solo se l’intervallo contiene o no il valore nullo, quindi in sostanza utilizzandolo come test di ipotesi.5L’analisi bayesiana è ancora troppo complessa, quindi praticata da pochi... Accedi per continuare la lettura

       Visite