Editoriali
12/12/2025

Real World Data: tra rigore metodologico, validazione, governance e protezione dei dati

Il crescente utilizzo dei termini real world data (RWD) e real world evidence (RWE) nel dibattito scientifico e regolatorio ha generato un’ambiguità semantica, soprattutto in riferimento agli studi non randomizzati. Le potenzialità e i limiti di queste definizioni sono state discusse nel convegno Forward1 organizzato a Roma l’8 Luglio 2025 in collaborazione con la fondazione GIMEMA.
In un contesto sanitario sempre più orientato alla gestione dell’incertezza e al supporto del decision making, è necessario interrogarsi sul significato reale di queste espressioni e sul loro impatto metodologico, regolatorio e programmatico. È probabile che la disponibilità di un sempre maggior numero di fonti di informazione associato alle nuove capacità di calcolo e di elaborazione abbia portato a credere di poter avere una rappresentazione più realistica dei fenomeni e di misurarne gli esiti attraverso l’uso di dati sanitari correnti. Il primo grande equivoco spesso associato ai RWD è che si tratti di una metodologia di studio, addirittura capace di sostituire o comunque fare da surrogato alla sperimentazione vera e propria rappresentato in ambito clinico dai randomized clinical trials.
Tutto ciò ripropone il tema della valutazione della qualità delle evidenze e, in ultima analisi, come queste possano riflettersi sulle formulazioni delle raccomandazioni. Il framework GRADE – gruppo internazionale che lavora da sempre in questo ambito – ha recentemente identificato quattro criticità centrali nell’uso della RWD:2

  • la falsa dicotomia tra RWD e studi randomizzati controllati (RCT);
  • la tendenza a sottovalutare il potenziale bias associato alla validità interna;
  • il rischio di favorire interessi economici e manipolazioni dei dati;
  • la possibilità di perdere di vista i criteri fondamentali della evidence-based medicine per prendere decisioni sanitarie.

Queste criticità hanno portato da tempo alcune agenzie regolatorie, quali per esempio la Food and Drug Administration (FDA), a chiarire come la RWE può in realtà derivare da diversi disegni di studio, inclusi gli RCT. Tuttavia, persiste il malinteso che RWD e RWE siano concettualmente separati dagli studi randomizzati. Infatti, anche nella letteratura scientifica recente si osservano contraddizioni, come nel caso di proposte di “framework integrati” che sembrano ignorare la definizione stessa della FDA.3
Un ulteriore elemento di riflessione riguarda la natura e la fonte dei dati targati real world. Un malinteso comune è che tali dati, in quanto tabellari, rappresentino direttamente le persone, come se si trattasse del risultato di osservazioni dirette. Nei RWD, invece, ciò che viene osservato non sono gli individui, ma gli eventi che generano i dati: ricoveri, accessi al pronto soccorso, prescrizioni. Il soggetto che non è intercettato da una procedura diagnostico-terapeutica che registra il dato da cui si deduce una diagnosi, un trattamento o un esito risulta tecnicamente sano. Lo stesso vale per il dato mancante. Questa distanza tra dato e soggetto introduce un bias di misurazione, spesso trascurato rispetto a quelli di selezione e confondimento. Nei RWD, ogni variabile è il risultato di una trasformazione algoritmica dei dati esistenti, in un processo che simula l’osservazione primaria. Il risultato è una sottostima del rischio assoluto e una distorsione della percezione dello stato di salute della popolazione.
Per rimediare a questi limiti, è necessaria una rigorosa validazione delle variabili generate. La recente guida della International Society for Pharmacoepidemiology propone principi generali per la validazione degli algoritmi4 e studi recenti hanno dimostrato che è possibile derivare analiticamente tutti gli indici di validità a partire da una coppia di indici predittivi o da un indice e la frequenza5. La raccomandazione quindi è chiara: bisogna validare il dato che altrimenti rischia di essere poco real.

Il ruolo dei RWD nel contesto regolatorio

Il ruolo dei RWD si estende anche all’ambito regolatorio, in particolare nelle autorizzazioni condizionate dei farmaci. L’incertezza su efficacia e sicurezza è centrale nel processo di autorizzazione e spesso vi sono condizioni che impediscono di attendere la produzione di evidenze sperimentali adeguate. Soprattutto in condizioni quali le malattie rare o le popolazioni speciali si ovvia con autorizzazioni condizionate, concesse in situazioni di urgenza o per farmaci orfani. Il report annuale della European Medicine Agency descrive in modo dettagliato tutti i casi in cui l’approvazione della nuova terapia si basa su studi pivotal che devono soddisfare requisiti minimi, ma non sono conclusivi.6 In questi casi, il ruolo della RWE nel processo valutativo può essere differente. Per esempio, nella terapia genica onasemnogene abeparvovec per l’atrofia muscolare spinale di tipo 1, l’approvazione del farmaco è stata confermata da studi clinici e osservazionali,7,8 mentre per l’acido obeticolico per la colangite biliare primitiva il farmaco è stato ritirato dopo uno studio confermativo randomizzato che ha evidenziato l’assenza di efficacia.9,10
I RWD non servono però solo nella fase post-marketing, ma possano giocare un ruolo decisivo già prima dell’immissione in commercio, aiutando a definire la popolazione target e a pianificare le priorità d’accesso.11,12 Un esempio concreto è la stima dei soggetti adulti potenzialmente eleggibili alla terapia CAR-T per linfoma diffuso a grandi cellule B, che ha contribuito alla definizione della governance regionale e alla produzione del documento La rete per le terapie CAR-T nella Regione Lazio.13,14 L’approccio strutturato in tre fasi (stima, monitoraggio, horizon scanning) è stato esteso anche ad altre terapie oncologiche innovative.
Per quanto riguarda, invece, la fase post-marketing, l’esperienza della Fondazione GIMEMA rappresenta un esempio virtuoso di integrazione tra trial clinici e studi osservazionali. Attiva sin dagli anni Settanta, la Fondazione ha promosso studi sulla RWE in ematologia, contribuendo a migliorare la sopravvivenza e la qualità della vita dei pazienti. Studi come quello sulla leucemia acuta promielocitica (LAP)15 e il protocollo GIMEMA LAL1913 per la leucemia acuta linfoide16,17 dimostrano come la RWE possa confermare in real life i risultati dei trial clinici. Anche per la leucemia linfatica cronica e il mieloma multiplo sono in corso studi osservazionali su larga scala. Inoltre, la Fondazione ha condotto oltre trenta studi sui patient-reported outcomes, tra cui PROMYS,18 che ha messo in evidenza il valore prognostico del giudizio dei pazienti sul proprio stato di salute.

Questione di privacy

Naturalmente non è possibile trattare il tema dei RWD senza porre l’attenzione su un nodo cruciale: la protezione dei dati. Le difficoltà normative, soprattutto in ambito di data protection, ostacolano la piena valorizzazione dei dati sanitari.19,20 Nonostante ciò, in Europa sta crescendo la consapevolezza del ruolo dei database sanitari e della possibilità di generare conoscenza e risolvere quesiti cruciali circa la sicurezza e l’efficacia di trattamenti vecchi e nuovi.21 Per fare ciò, occorrono almeno quattro elementi chiave capaci di trasformare i dati in evidenze: quality, trustness, actionability e data protection.22 In quest’ottica, è importante sottolineare che il progetto europeo Darwin EU, che da alcuni anni vuole creare una rete di banche dati sanitarie, non include ancora alcuna banca dati italiana. 
Si possono però citare alcune esperienze nazionali in corso: il Progetto VALORE, attivo in 16 Regioni e finanziato dall’ Agenzia Italiana del Farmaco (Aifa), ha elaborato dati su oltre 340.000 pazienti, ma è attualmente sospeso per mancanza di chiarezza normativa. Tuttavia, è nato un gruppo di lavoro con data protection officer, ricercatori e istituzioni, che promuove il principio del data protection by design. La recente riforma dell’articolo 110 del Codice della privacy consente studi anche senza consenso, ma solo se condotti da chi detiene il dato, rendendo complessi i progetti multiregionali.
In questo scenario, l’Aifa ha pubblicato l’8 agosto 2024 una nuova linea guida per la classificazione e conduzione degli studi osservazionali sui farmaci.23 Il documento introduce importanti innovazioni: via libera agli studi retrospettivi anche su usi non autorizzati del farmaco (off-label e compassionevoli), parere unico del comitato etico, obbligo di convenzioni specifiche con ogni ente coinvolto. La guida distingue chiaramente tra studi clinici, sperimentazioni a basso intervento e studi non interventistici; inoltre, ribadisce il valore degli studi osservazionali per valutare sicurezza ed efficacia nella pratica clinica. Tuttavia, restano nodi aperti: l’assenza di un percorso regolatorio per studi non farmacologici e su materiale biologico, la mancanza di un modello unico di contratto e la limitata operatività del Registro degli studi osservazionali (RSO), ancora privo di risposte da parte dell’Agenzia sui progetti presentati.

Solo così il mondo reale diventa evidenza

Ogni volta che si parla di RWD appare chiaro nell’immaginario di ognuno una mole importante di dati, spesso difficili da processare per volumi, numero di fonti e caratteristiche. A questo punto è facile che qualcuno chiami a sostegno di tale sforzo l’intelligenza artificiale senza però cogliere immediatamente la contraddizione in termini: un mondo di dati che si crede quanto più reale che viene processato da un’intelligenza artificiale. È chiaro che vale la pena di approfondire. 
In conclusione, i RWD rappresentano uno strumento potente, ma non privo di limiti. Perché possano davvero contribuire a decisioni cliniche, regolatorie e programmatiche informate, è necessario un approccio metodologico rigoroso, multidisciplinare e trasparente, capace di integrare le evidenze, validare i dati e garantire la protezione dei diritti individuali. Solo così il mondo reale potrà davvero diventare evidenza.

Conflitti di interesse dichiarati: nessuno.

Bibliografia

  1. Convegno Real World Data – Trasformare la pratica clinica in conoscenza. Disponibile all’indirizzo: https://forward.recentiprogressi.it/it/archivio-convegni/real-world-data-trasformare-la-pratica-clinica-in-conoscenza/
  2. Schünemann H. Tutte le prove sono real world evidence. Recenti Prog Med 2019;110(4):165-67. doi: 10.1701/3154.31342
  3. Devane D, Emir B, Watt S, O’Donnell M. Beyond the binary: integrating “real-world evidence” with randomized trials in contemporary health care. J Clin Epidemiol 2025;184:111821. doi: 10.1016/j.jclinepi.2025.111821
  4. Ehrenstein V, Hellfritzsch M, Kahlert J et al. Validation of algorithms in studies based on routinely collected health data: general principles. Am J Epidemiol 2024;193(11):1612-24. doi: 10.1093/aje/kwae071
  5. Bollaerts K, Rekkas A, De Smedt T, Dodd C, Andrews N, Gini R. Disease misclassification in electronic healthcare database studies: deriving validity indices – a contribution from the ADVANCE project. PLoS One 2020;15(4):e0231333. doi: 10.1371/journal.pone.0231333
  6. European Medicine Agency. Annual Report 2024. Luxembourg, Publications Office of the European Union, 2025. Disponibile all’indirizzo: https://www.ema.europa.eu/en/documents/annual-report/2024-annual-report-european-medicines-agency_en.pdf
  7. Day JW, Finkel RS, Chiriboga CA et al. Onasemnogene abeparvovec gene therapy for symptomatic infantile-onset spinal muscular atrophy in patients with two copies of SMN2 (STR1VE): an open-label, single-arm, multicentre, phase 3 trial. Lancet Neurol 2021;20(4):284-93. doi: 10.1016/S1474-4422(21)00001-6
  8. Servais L, Day JW, De Vivo DC et al. Real-World Outcomes in Patients with Spinal Muscular Atrophy Treated with Onasemnogene Abeparvovec Monotherapy: Findings from the RESTORE Registry. J Neuromuscul Dis 2024;11(2):425-42. doi: 10.3233/JND-230122
  9. Nevens F, Andreone P, Mazzella G et al. A placebo-controlled trial of obeticholic acid in primary biliary cholangitis. N Engl J Med 2016;375(7):631-43. doi: 10.1056/NEJMoa1509840
  10. Kowdley KV, Hirschfield GM, Coombs C et al. COBALT: A Confirmatory Trial of Obeticholic Acid in Primary Biliary Cholangitis With Placebo and External Controls. Am J Gastroenterol 2025;120(2):390-400. doi: 10.14309/ajg.0000000000003029
  11. Moulis G, Zadro Y, Sommet A, Lapeyre-Mestre M, Lafaurie M. Use of real-world data for the development and the follow-up of drugs in rare diseases. The example of immune thrombocytopenia and autoimmune hemolytic anemia. Rev Med Interne 2025;46(5):287-92. doi: 10.1016/j.revmed.2025.03.424
  12. Lund JL, Matthews AA. Identifying target populations to align with decision-makers’ needs. Am J Epidemiol 2024;193(11):1503-6. doi: 10.1093/aje/kwae129
  13. Belleudi V, Trotta F, Fortinguerra F et al. Real world data to identify target population for new CAR-T therapies. Pharmacoepidemiol Drug Saf 2021;30(1):78-85. doi: 10.1002/pds.5165
  14. Salute Lazio. La Rete per le Terapie CAR-T nella Regione Lazio. Luglio 2024.
  15. Lo-Coco F, Avvisati G, Vignetti M et al. Retinoic acid and arsenic trioxide for acute promyelocytic leukemia. N Engl J Med 2013;369(2):111-21. doi: 10.1056/NEJMoa1300874
  16. Bassan R, Chiaretti S, Della Starza I et al. Pegaspargase-modified risk-oriented program for adult acute lymphoblastic leukemia: results of the GIMEMA LAL1913 trial. Blood Adv 2023;7(16):4448-61. doi: 10.1182/bloodadvances.2022009596
  17. Lazzarotto D, Cerrano M, Papayannidis C et al. Outcome of 421 adult patients with Philadelphia-negative acute lymphoblastic leukemia treated under an intensive program inspired by the GIMEMA LAL1913 clinical trial: a Campus ALL study. Haematologica 2025;110(1):55-67. doi: 10.3324/haematol.2024.285638
  18. Efficace F, Al Essa W, Platzbecker U et al. Health-related quality of life profile of newly diagnosed patients with myelodysplastic syndromes by age, sex, and risk group: a real-world study by the GIMEMA. Hemasphere 2023;7(9):e944. doi: 10.1097/HS9.0000000000000944
  19. Trifirò G, Sultana J, Bate A. From big data to smart data for pharmacovigilance: the role of healthcare databases and other emerging sources. Drug Saf 2018;41(2):143-49. doi: 10.1007/s40264-017-0592-4
  20. Trifirò G, Montuori L, Gini R et al. Come conciliare la generazione di real-world evidence (RWE) e data protection? 9° simposio sul ruollo della real world evidence a supporto delle politiche del farmaco. Milazzo, 11-12 luglio 2024.
  21. Trifirò G, Gini R, Barone-Adesi F et al. The role of European healthcare databases for post-marketing drug effectiveness, safety and value evaluation: where does Italy Stand? Drug Saf 2019;42(3):347-63. doi: 10.1007/s40264-018-0732-5
  22. Obermeyer Z, Emanuel EJ. Predicting the future – big data, machine learning, and clinical medicine. N Engl J Med 2016;375(13):1216-19. doi: 10.1056/NEJMp1606181
  23. Agenzia italiana del farmaco. Linea guida per la classificazione e conduzione degli studi osservazionali sui farmaci. Roma, Aifs, 2024. Disponibile all’indirizzo: https://www.aifa.gov.it/-/linea-guida-per-la-classificazione-e-conduzione-degli-studi-osservazionali-sui-farmaci
Approfondisci su epiprev.it Vai all'articolo su epiprev.it Versione Google AMP