Endpoint surrogati e politiche sanitarie: l’importanza di metodi di validazione adeguati
Politiche sanitarie e decisioni di accesso al mercato o rimborso di tecnologie sanitarie dovrebbero idealmente basarsi su studi clinici robusti che valutano outcome rilevanti per i pazienti, come la sopravvivenza o la qualità della vita correlata alla salute. La spinta crescente a ridurre i tempi di accesso a trattamenti innovativi per i pazienti ha promosso negli ultimi anni diverse tendenze in questo senso, inclusa la diffusione di endpoint surrogati su cui basare decisioni regolatorie o di rimborsabilità.1 La definizione comunemente accettata di endpoint surrogato è “biomarcatore o esito intermedio usato per sostituire e predire un esito rilevante per il paziente”. Questi ultimi sono identificati come esiti che riflettono direttamente sopravvivenza, sintomi o funzionalità.2
Negli anni passati circa il 45% degli studi registrativi ha avuto un surrogato come endpoint primario, questa proporzione arriva anche a oltre il 90% per alcune aree terapeutiche3 come endocrinologia o infettivologia.
I vantaggi dell’uso di endpoint surrogati sono noti: questi consentono infatti di condurre studi meno costosi, con un minor numero di pazienti arruolati e con un follow up relativamente breve. D’altro canto, basare la propria decisione rispetto a un trattamento su una misura “sostitutiva” può comportare seri problemi. Alcuni farmaci approvati sulla base di endpoint surrogati hanno successivamente mostrato gravi problemi di sicurezza con relativo ritiro dal mercato o revisione di indicazione.4 Inoltre, comunemente l’endpoint surrogato fornisce una sovrastima dell’entità dell’effetto del trattamento se confrontata con l’entità dell’effetto sull’endpoint finale.5 Dal punto di vista del pagatore, l’uso degli endpoint surrogati richiede un’estrapolazione per stimare i benefici reali attesi per i pazienti e per il sistema sanitario nel complesso.6 Per utilizzare un endpoint surrogato in modo affidabile è pertanto necessario un processo di validazione a beneficio di autorità regolatorie, agenzie di Health Technology Assessment, ma anche dei clinici e degli stessi pazienti. Varie tecniche statistiche di validazione per endpoint surrogati sono state suggerite nel tempo da autori diversi.7 Sebbene il tema sia stato affrontato estesamente dal punto di vista statistico, manca a oggi consenso circa l’approccio da utilizzare in modo sistematico e riproducibile durante processi decisionali relativi a farmaci, dispositivi medici e altre tecnologie.
Nel 1999 Bucher et al. hanno suggerito dei criteri di validazione per medici che avessero voluto utilizzare i risultati di uno studio clinico riportati in forma di misure surrogate:
- esiste un’associazione stretta, indipendente e consistente tra l’endpoint surrogato e quello clinicamente rilevante?;
- esistono evidenze sperimentali condotte con altre classi di farmaci, dove il miglioramento dell’endpoint surrogato ha determinato un miglioramento di quello clinicamente rilevante?;
- esistono evidenze sperimentali condotte con farmaci della stessa classe, dove il miglioramento dell’endpoint surrogato ha determinato un miglioramento di quello clinicamente rilevante?8
Un framework complessivo
Un framework complessivo di validazione da noi proposto per l’uso appropriato degli endpoint surrogati nelle decisioni di approvazione e rimborso prevede tre step consecutivi:9
- stabilire il livello di evidenza. Il primo passo è considerare la gerarchia delle prove disponibili.8 La plausibilità biologica della relazione tra endpoint surrogato e risultato finale è necessaria, ma non sufficiente. Dati di tipo osservazionale che mostrino una forte correlazione tra il surrogato e l’endpoint finale a livello del singolo paziente sono essenziali per individuare buoni marcatori prognostici,10 ma non forniscono il massimo livello di evidenza per convalidare un endpoint surrogato. A questo scopo sarebbe infatti necessario dimostrare una correlazione tra l’effetto del trattamento sull’endpoint surrogato e l’effetto del trattamento sull’esito rilevante per il paziente, e questo è possibile solo grazie alla disponibilità di più studi randomizzati. Ovviamente questa evidenza non è immediatamente disponibile per una nuova tecnologia, quindi deve essere ricercata opportunamente in studi precedenti, per esempio nella stessa classe o, al limite, in una classe diversa;
- stimare il livello di correlazione. Il secondo passo è valutare l’associazione tra l’endpoint surrogato e il risultato finale. Gli approcci meta-analitici basati su modelli di regressione sono i più diffusi in questo campo, preferibilmente utilizzando dati a livello del paziente di tutti gli studi randomizzati su questo trattamento. In questo caso, infatti, è possibile stimare due livelli di associazione: l’associazione tra l’outcome surrogato e l’outcome finale (i.e. R2 individuale) e l’associazione tra l’effetto del trattamento sull’outcome surrogato e l’effetto del trattamento sull’outcome finale (i.e. R2trial). Un documento dell’agenzia tedesca IQWIG (Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen) imposta come soglia di accettabilità per questi coefficienti di determinazione un valore di 65%. Raramente si osservano valori così alti negli studi di validazione;11
- quantificare l’outcome finale atteso sulla base dell’outcome surrogato osservato. Il passaggio finale riguarda la previsione e la quantificazione dell’effetto sull’esito finale in base all’effetto osservato, per esempio nell’ambito di un trial clinico, sull’endpoint surrogato. Di nuovo l’analisi di regressione è fondamentale in questo senso. Inoltre, una metrica utile proposta a questo scopo è quella della “soglia di effetto sul surrogato” (Surrogate Threshold Effect, STE), ovvero l’entità dell’effetto del trattamento sul surrogato che predice un effetto almeno statisticamente significativo del trattamento sull’outcome finale.
- Esistono poche validazioni empiriche di endpoint surrogati di alta qualità metodologica a oggi, soprattutto se si considera la numerosità di queste misure sulle varie aree terapeutiche. L’ambito in cui esiste più letteratura è quello oncologico, ma all’interno dello stesso continuano a proliferare potenziali misure surrogate senza che esista adeguata evidenza a supporto del loro utilizzo (per esempio, risposta completa, malattia minima residua).
Per concludere, esiste il rischio di velocizzare l’accesso al mercato per tecnologie che non offrono alcun vero beneficio o di sopravvalutare gli effetti clinici o di costo-efficacia del trattamento facendo affidamento su outcome surrogati non adeguatamente validati. D’altro canto, la validazione sistematica e robusta di endpoint surrogati è un elemento essenziale per accelerare l’accesso a tecnologie innovative sicure ed efficaci che generino valore per i pazienti e per l’efficienza e l’equità dei sistemi sanitari. Occorre promuovere la condivisione di dati clinici con questa finalità e raggiungere consenso su quali metodi e processi utilizzare in modo condiviso e sistematico per stabilire la validità di potenziali misure surrogate.
Conflitti di interesse dichiarati: l'autrice è attualmente Fulbright Research Scholar presso Yale School of Medicine, New Haven, CT
Bibliografia
- Ciani O, Buyse M, Drummond M, Rasi G, Saad ED, Taylor RS. Time to Review the Role of Surrogate End Points in Health Policy: State of the Art and the Way Forward. Value Health 2017;20(3):487-95.
- Biomarkers Definitions Working Group. Biomarkers and surrogate endpoints: preferred definitions and conceptual framework. Clin Pharmacol Ther 2001;69:89-95.
- Downing NS, Aminawung JA, Shah ND, Krumholz HM, Ross JS. Clinical trial evidence supporting FDA approval of novel therapeutic agents, 2005-2012. JAMA 2014;311:368-77.
- Fleming TR, DeMets DL. Surrogate end points in clinical trials: are we being misled? Ann Intern Med 1996;125:605-13.
- Ciani O et al. Comparison of treatment effect sizes associated with surrogate and final patient relevant outcomes in randomised controlled trials: meta-epidemiological study. BMJ (Clinical research ed) 2013;346:f457.
- Ciani O et al. Complete cytogenetic response and major molecular response as surrogate outcomes for overall survival in first-line treatment of chronic myelogenous leukemia: a case study for technology appraisal on the basis of surrogate outcomes evidence. Value Health 2013;16(6):1081-90.
- Weir CJ, Walley RJ. Statistical evaluation of biomarkers as surrogate endpoints: a literature review. Stat Med 2006;25(2):183-203.
- Bucher HC, Guyatt GH, Cook DJ, Holbrook A, McAlister FA. Users’ guides to the medical literature: XIX. Applying clinical trial results. A. How to use an article measuring the effect of an intervention on surrogate end points. Evidence-Based Medicine Working Group. JAMA 1999;282(8):771-8.
- Ciani O, Buyse M, Drummond M, Rasi G, Saad ED, Taylor RS. Use of surrogate end points in healthcare policy: aproposal for adoption of a validation framework. Nat Rev Drug Discov 2016;15(7):516.
- Buyse M, Sargent DJ, Grothey A, Matheson A, de Gramont A. Biomarkers and surrogate end points - the challengeof statistical validation. Nat Rev Clin Oncol 2010;7(6):309-17.
- Ciani O, Davis S, Tappenden P, et al. Validation of surrogate endpoints in advanced solid tumours: systematic review of statistical methods, results, and implications for policy makers. Int J Technol Assess Health Care 2014;30(3):312-24.
- Burzykowski T, Buyse M. Surrogate threshold effect: an alternative measure for meta-analytic surrogate endpointvalidation. Pharm Stat 2006;5(3):173-86.