“Segui i dati, per sapere dove e come si diffonde la malattia”, afferma Rajiv Bhatia, medico ed epidemiologo di Stanford. Ma molte agenzie autorizzate incaricate di fornire dati hanno rifiutato le richieste. Citando molteplici ragioni, tra cui il troppo carico di lavoro e le preoccupazioni sulla privacy, anche se le regole federali sulla privacy sono state allentate a favore della ricerca durante la pandemia. Trattenere le informazioni porterà a moltiplicare le morti”.
di Charles Piller, da Science Magazine
La California è stata una storia di
successo per il COVID-19, fino a quando all’improvviso ha smesso di esserlo.
All’inizio della pandemia, lo Stato californiano sembrava avere il nuovo
coronavirus sotto controllo, ma la pandemia ha iniziato poi a montare
velocemente, con record stabiliti di casi quotidiani e morti in aumento.
Funzionari della California, le cui risposte sul COVID-19 erano un tempo
acclamate, stanno ora ricevendo critiche e alcune tra le più severe provengono
da scienziati che cercano di aiutare a condurre la lotta dello Stato contro il
virus. Da aprile, epidemiologi dell’Università di Stanford e di diversi campus
dell’Università della California hanno cercato casi dettagliati di COVID-19 e
dati di tracciamento dei contatti da parte delle autorità sanitarie statali e
regionali utili alla ricerca, sperando possano indicare approcci più efficaci
per rallentare la pandemia. “È un mantra di base dell’epidemiologia e
della salute pubblica: segui i dati” per sapere dove e come si diffonde la
malattia, afferma Rajiv Bhatia, medico ed epidemiologo che insegna a Stanford,
tra coloro che cercano i dati della California.
Ma le agenzie incaricate di fornire dati hanno rifiutato le richieste presentate da aprile a fine giugno. Citando molteplici ragioni tra cui vincoli da carico di lavoro e preoccupazioni sulla privacy, anche se le regole federali sulla privacy della salute sono state allentate per la ricerca durante la pandemia. Di conseguenza, Bhatia afferma: “In 4 mesi di epidemia, pur raccogliendo milioni di dati, nessuno in California o ai CDC [Centers for Disease Control and Prevention] ha svolto l’epidemiologia di base”. Anche altri Stati non riescono a condividere informazioni altamente specifiche per i loro casi COVID-19, al punto che alcuni scienziati avvertono come ciò ostacoli gli sforzi per identificare misure mirate ad arginare la diffusione di SARS-CoV-2 senza ricorrere a lockdowns su vasta scala.
Bhatia e altri epidemiologi, in California e in tutto il Paese, sono particolarmente turbati dopo le notizie che hanno rivelato come alcuni Stati stiano implementando gli stessi dati di cui hanno loro bisogno, per un appaltatore federale, Palantir Technologies, che in passato ha attirato critiche per il lavoro di elaborazione di dati a sostegno delle espulsioni dell’immigrazione e delle dogane. Per una piattaforma dati soprannominata HHS Protect, Palantir sta aggregando informazioni sulla diffusione del nuovo coronavirus per conto del Dipartimento della salute e dei servizi umani (HHS) degli Stati Uniti, attingendo a oltre 225 set di dati, tra cui statistiche demografiche, test basati sulla comunità e una vasta gamma di dati forniti dallo stato. (Questa settimana, suscitando preoccupazione diffusa tra esperti di sanità pubblica, epidemiologi e altri, HHS ha anche indirizzato gli ospedali a fornire dati e informazioni sui pazienti COVID-19 al sistema Palantir, in gran parte tramite un secondo appaltatore, TeleTracking Technologies, piuttosto che ai CDC come si è invece fatto per decenni).
Dati aggregati su COVID-19 e sui decessi per contea, spesso per età e razza, sono già disponibili al pubblico in gran parte del Paese. Ma pochi collegano casi e morti ad altre informazioni di norma raccolte sugli individui, come codici postali, professioni, condizioni di vita e contatti avvenuti con altri malati COVID-19. E secondo il COVID Tracking Project, un’organizzazione di volontariato “lanciata” da The Atlantic, nessun Stato o territorio degli Stati Uniti fornisce pubblicamente set completi di misure di base COVID-19 come ad esempio test fatti e in corso; quanti decessi e quanti pazienti guariti; quanti ricoveri ospedalieri, quanti pazienti in reparti di terapia intensiva e quanti che utilizzano ventilatori.
Bhatia e colleghi affermano che dati COVID-19 in dettaglio potrebbero essere
estratti e lavorati per trovare le combinazioni più accreditate di fattori per tentare
di spiegare l’enorme “fardello di ricoveri e decessi”. I dati
confermerebbero l’ipotesi che anche quando il commercio riaprirà, ricoveri e
morti emergano ancora e soprattutto in quei flashpoints ampiamente noti, tra
cui strutture di assistenza ad anziani e famiglie con lavoratori infetti ma asintomatici
o che hanno sintomi lievi e contagiano parenti con fattori di rischio che li
rendono più vulnerabili alle malattie gravi.
“Pensiamo che tu possa essere più strategico nei tuoi interventi se sai
dove si verificano effettivamente le esposizioni al Covid-19”, afferma
Jeffrey Klausner, medico ed epidemiologo dell’Università della California, a
Los Angeles. Ad esempio, se si disponesse di dati adeguati si potrebbe
confermare che i pasti al chiuso sono rischiosi, ma i parchi e le spiagge
generalmente sicuri. In tal caso, riaprire con ragionevoli precauzioni potrebbe
effettivamente aumentare l’economia e alleviare i timori che il rischio grave
di infezione sia onnipresente.
“Man mano che la pandemia evolve, una regolare e costante rivalutazione e
riassestamento dei dati granulari sui casi Covid-19 è vitale”, afferma Natalie
Dean, biostatistica dell’Università della Florida (UF). “Siamo in presenza di
un mondo completamente nuovo, dove stiamo riaprendo le cose. Abbiamo questo set
mutevole di ambienti: sala da pranzo interna, bar, edifici commerciali aperti,
uffici, palestre. Quando pensiamo a quali siano i punti di pressione, ci sono
molte cose che ancora non sappiamo. Dobbiamo avere “un’architettura di
apprendimento” in cui c’è sempre un certo livello di riflessione”.
In assenza di dati chiari e localizzati delle autorità pubbliche, alcune cliniche in California hanno fatto affidamento sulla propria ricerca interna. Dopo aver condotto migliaia di test COVID-19 a Oakland, “siamo stati in grado di individuare dove si trovano alcuni focolai, sia geograficamente che in termini di setting, portando a un’educazione sanitaria altamente mirata e test di sensibilizzazione”, afferma Noha Aboelata, un medico che dirige il Roots Community Health Center della città, che serve principalmente persone di colore nelle comunità scarsamente servite. “Senza un’intelligenza a livello di quartiere per la divulgazione della salute pubblica, si ottiene “una soluzione unica per tutti che potrebbe aggravare il problema”, afferma. “Trattenere le informazioni porterà a moltiplicare le morti”.
In una risposta scritta alle domande di Science, il Dipartimento della sanità
pubblica della California ha affermato che anche i dati deidentificati
“possono essere utilizzati da soli o in combinazione con informazioni
disponibili al pubblico per identificare un individuo”.
Caitlin Rivers, un epidemiologo presso il Center for Health Security della
Johns Hopkins University, definisce la reidentificazione una seria preoccupazione,
ma sostiene che ciò accadrebbe così raramente che il rischio non giustifica il
rifiuto generalizzato delle richieste di dati durante la pandemia. “C’è
molto spazio nel mezzo che non abbiamo davvero esplorato”, aggiunge. Ad
esempio, per ovviare ad alcune preoccupazioni in materia di privacy, il gruppo
di Bhatia ha richiesto casi clinici indicanti fasce di età entro i 10 anni
piuttosto che età specifiche, la settimana di insorgenza di COVID-19 anziché
una data specifica e l’appartenenza ad un gruppo professionale piuttosto che
un’occupazione specifica.
Bhatia si è quindi rivolto alla Florida, che rispetto alla California offre
informazioni abbastanza dettagliate su ciascuno dei circa 316.000 casi COVID-19
registrati finora. Il set di dati gli ha permesso di rappresentare
graficamente, settimana per settimana, le infezioni per età e se era nota la
fonte della trasmissione. Ha scoperto che all’inizio della pandemia, la fonte
era nota per l’80% dei bambini e dal 50% al 60% degli adulti.
Poiché la Florida ha allentato le restrizioni ad imprese e ad altri aspetti della vita, le fonti di trasmissione conosciute sono rimaste a livelli simili, anche se apparentemente i contatti casuali con estranei stavano aumentando. Poiché alcune delle fonti sconosciute di trasmissione erano certamente riferibili a familiari o amici asintomatici o leggermente sintomatici, una tale scoperta suggerisce per esempio che l’affollamento delle spiagge stia svolgendo un ruolo decisamente minore nell’ondata di infezioni della Florida rispetto, per esempio, all’aumento del numero di riunioni di famiglie numerose a casa o negli uffici ripopolati. “Se le persone sanno che il 50% o il 60% delle infezioni derivano da persone che conoscono, compresi familiari, amici e colleghi, potrebbero interpretare meglio il rischio”, afferma Bhatia.
Ciononostante, perfino i dati della Florida
escludono i punti chiave che alcuni ricercatori considerano essenziali per
mappare e rispondere alla pandemia nel modo più efficace, compresi i codici
postali; denominazioni razziali più complete; e specifiche sui casi Covid-19 in
strutture di cura a lungo termine, carceri e prigioni. Ciò ostacola le risposte
mirate all’interno dello stato, afferma Thomas Hladish, un ricercatore di
malattie infettive dell’University of Florida che si è consultato ampiamente
con i funzionari statali sui dati COVID-19 da marzo a luglio in corso.
“Molte delle incoerenze sono ragionevolmente spiegate da persone ben
intenzionate che si stanno arrampicando sugli specchi per reinventare al volo
[campi e formati di dati]
senza disporre del background tecnico appropriato.” Il Miami Herald ha anche recentemente riferito che i funzionari municipali non sono stati in grado di convincere lo stato a fornire i dettagli di casi Covid-19 necessari per attaccare i focolai locali. Il Dipartimento della Salute della Florida non ha risposto alle richieste di commenti di Science.
Gli epidemiologi lodano le agenzie più disponibili e pronte, in particolare quelle che usano i propri dati per guidare la risposta. Il Dipartimento della salute e dell’igiene mentale di New York pubblica sul suo sito web insiemi di dati insolitamente completi e continuamente aggiornati, che mostrano informazioni dettagliate su test, casi e morti per 177 quartieri distinti, e li usa per mappare i punti caldi della patologia. Il servizio offre morti probabili e confermate per età, razza o etnia, condizioni sottostanti e altri fattori. Una scoperta evidente è stata che le aree a basso reddito, con una maggiore concentrazione di famiglie numerose, hanno sofferto di COVID-19 molte volte di più il tasso delle aree più ricche.
Il commissario sanitario della città di New York, Oxiris Barbot, afferma che il sistema è stato cruciale nel ridurre i casi di circa il 94% e le morti di circa il 98% dal picco di aprile. “La trasparenza dei dati ha contribuito a tracciare un quadro di quanto fosse acuta una situazione e la misura di quanto avevamo bisogno dei newyorkesi per conformarci a ciò che chiedevamo loro di fare”, afferma. “Ha contribuito a evidenziare il prima possibile i modi in cui il virus stava devastando le comunità nere e marroni”. E i dati granulari hanno permesso una risposta calibrata, comprese le offerte di camere d’albergo per aiutare le persone che vivono in condizioni affollate a isolarsi quando fosse stato diagnosticato loro COVID-19. “Se non fosse stato per quell’analisi dei dati saremmo stati molto più lenti nella risposta, e … molte altre vite sarebbero andate perse”, dice Barbot.
“Questi sono i giusti tipi di sforzi che vanno fatti usando il giusto tipo di dati”, afferma Bhatia. Capire come fermare la pandemia è “la decisione politica più grande e di maggiore impatto che abbiamo visto nella nostra vita”, aggiunge. Ma in California e altrove, “Stiamo cercando di prevedere il futuro senza analizzare i dati che ci stanno di fronte. Questo è un fallimento”.