Big data in health. Database, data analytics, data driven decision

  • di Luca Degli Esposti, ClicOn S.r.l. Health, Economics & Outcome Research

Negli ultimi anni, in modo progressivamente crescente ed esteso, il fenomeno della digitalizzazione ha coinvolto anche il settore dell’assistenza sanitaria. La digitalizzazione, intesa come il processo di trasformazione di un “documento” in un formato digitale, cioè interpretabile da un computer, ha dato l’impulso alla nascita dei cosiddetti “big data”, cioè raccolte di dati di straordinaria rilevanza per volume, velocità e varietà. Tra i primi “documenti” sanitari oggetto della digitalizzazione: la prescrizione di un farmaco, l’effettuazione di un ricovero ospedaliero, di una procedura chirurgica o di una prestazione specialistica, più di recente, l’esito di un accertamento di laboratorio o il referto di anatomia patologica. La potenzialità di tutte queste informazioni in formato digitale è intuitiva: se volessi calcolare la distribuzione di un parametro clinico su una coorte di pazienti e dovessi farlo mediante la consultazione del formato cartaceo di ogni cartella clinica impiegherei un tempo molto maggiore rispetto all’interrogazione di un database in formato elettronico mediante una query. Se usciamo dal perimetro di una piccola coorte di pazienti per entrare negli enormi volumi dei big data è evidente che non sia più solamente un tema di efficientamento bensì di indispensabilità.

DataBase. In Italia, attualmente, disponiamo di un numero rilevante di banche dati. Tra le più note, i database amministrativi delle Aziende Sanitarie Locali (per la tracciabilità delle prestazioni sull’assistito a carico del Servizio Sanitario Nazionale), tra cui l’assistenza farmaceutica territoriale, i farmaci ad erogazione diretta, la distribuzione per conto, la nosologica ospedaliera, la specialistica ambulatoriale, il laboratorio analisi, la microbiologia o l’anatomia patologica (per la registrazione degli esiti clinici degli esami di laboratorio o strumentali), i registri di patologia o di prodotto (per la caratterizzazione clinica e l’osservazione dei pazienti affetti da patologia o trattati con specifici farmaci), le cartelle cliniche informatizzate dei reparti ospedalieri o dei medici generalisti (per la gestione clinica dei pazienti in carico al medico). Alcuni di questi database sono potenzialmente integrabili tra di loro, mediante procedure di data linkage, aumentando la potenzialità informativa della singola banca dati (per esempio, l’effetto dell’utilizzo di un farmaco sull’incidenza di accessi ospedalieri). Contestualmente all’evoluzione di tali sistemi informativi, si sta anche assistendo ad un progressivo adeguamento della normativa in materia di trattamento dei dati personali per la ricerca di un equilibrio tra utilizzo di tali dati e rispetto della riservatezza individuale.

Research & Data Analytics. La disponibilità dei big data si presta per due principali applicazioni: la ricerca scientifica e la tutela della salute. Tali banche dati possono, in prima istanza, essere utilizzate per finalità scientifiche, tra cui analisi epidemiologiche (per esempio, la prevalenza dei soggetti affetti da una patologia o eleggibili ad una tecnologia sanitaria), analisi sulle modalità di utilizzo delle tecnologie sanitarie (la verifica di congruenza tra le modalità di utilizzo di una tecnologia e l’effettivo utilizzo nella pratica clinica) e analisi comparative tra tecnologie sanitarie in un contesto di “mondo reale” (la comparazione tra alternative in termini di esiti clinici, eventi avversi e costi assistenziali). Ai fini della ricerca scientifica, tali banche sono utilizzate, secondo un approccio tradizionale, per la verifica di predefinite “ipotesi” oppure, data l’enorme volume di informazioni e la difficoltà di sfruttarne l’intero potenziale, mediante metodologie di intelligenza artificiale (artificial intelligence) o apprendimento automatico (machine learning), in cui si predispone l’abilità della “macchina” per apprendere qualcosa dai dati in maniera autonoma, senza istruzioni esplicite. In altri termini, grazie alle specifiche capacità computazionali, processando l’enormità di informazioni presenti in tali banche dati, la “macchina” identifica particolari associazioni, potenzialmente utili alle spiegazioni di fenomeni. In relazione alle possibili ricadute sulla tutela della salute e, conseguentemente, all’allocazione delle risorse finanziarie disponibili, la prevalenza dei soggetti affetti da una patologia o eleggibili ad una tecnologia sanitaria rappresenta un fattore per la programmazione sanitaria, la verifica di congruenza tra le modalità di utilizzo di una tecnologia e l’effettivo utilizzo nella pratica clinica rappresenta uno strumento di recupero degli sprechi o di indirizzo degli investimenti, infine, la comparazione tra alternative in termini di esiti clinici, eventi avversi e costi assistenziali un criterio di scelta tra opzioni alternative e di efficientamento degli interventi.

Data-driven decision. In una prospettiva di sviluppo dei big data e dei sistemi di analisi, è evidente che un fattore essenziale sia il grado di interiorizzazione dei dati nei processi decisionali. Tanto maggiore sarà l’utilizzo dei dati per il supporto dei processi decisionali, tanto maggiore appare plausibile che sarà lo sviluppo di banche dati e di sistemi di analisi. Quanto più i “decisori” dimostreranno, coerentemente a quanto già avviene in tanti altri settori, di utilizzare i dati per supportare le proprie decisioni, verificare la correttezza degli interventi e dell’uso delle risorse e ridurre gli sprechi, tanto più tutto ciò che ruota attorno ai dati – digitalizzazione dei documenti, mantenimento delle banche dati, ricerca scientifica, sistemi di analisi automatici, normativa sul trattamento dei dati – subirà un impulso verso la crescita e lo sviluppo. In sintesi, al necessario progresso tecnologico è essenziale che si associ un progresso nella cultura del dato e dell’utilizzo dei dati nel processo decisionale. Il processo di trasformazione digitale è auspicabile in ragione dalla rilevanza del settore sanitario, della garanzia di universalità di accesso e della sua sostenibilità economica ed anche in ragione dell’indiscussa utilità di supportare il processo programmatorio, decisionale e di controllo sulla base dei dati.