COVID, i big-data per studiare il paziente internazionale

Anche la Maugeri nel Consorzio internazionale che raccoglie dati sui pazienti Covid. Il gruppo di ricerca quidato da Riccardo Bellazzi.  La collaborazione con il dipartimento di Medicina interna

 

187mila informazioni sanitarie su 27mila pazienti Covid+ dicono che il malato di Wuhan è simile, se non uguale, come quadro clinico, a quello della Val Seriana o di Parigi, di Los Angeles o Singapore, da cui provengono appunto le informazioni. Quello che sino a oggi era affidato ai primi paper scientifici, spesso scambiati via Whatsapp da una rianimazione a un’infettivologia dei vari ospedali in emergenza, risulta dal più grande data sharing sul Coronavirus messo in piedi dall’inizio della pandemia a oggi.  Lo scrivono 83 studiosi americani, tedeschi, francesi, italiani e singaporiani, in un articolo apparso sabato su Medrxiv (https://www.medrxiv.org/content/10.1101/2020.04.13.20059691v1), e lo fanno parlando soprattutto dei 14 diversi valori ematochimici censiti: “I dati iniziali e le traiettorie successive sono altamente conformi ai precedenti conclusioni degli studi cinesi”.

E’ il lavoro del 4C, il Consortium for Clinical Characterization of COVID-19 ossia Consorzio per la caratterizzazione clinica del Coronvirus (https://covidclinical.net), promosso dalla Fondazione americana i2b2, che sta per Informatics for Integrating Biology and the Bedside, e che raccoglie i dati di 96 ospedali fra Stati Uniti, Francia, Germania, Singapore e Italia.

La parte italiana

“In poco più di un mese”, spiega Riccardo Bellazzi, bio-ingegnere dell’Università di Pavia, “siamo riusciti a raccogliere e a mettere a disposizione informazioni su oltre 3.022 casi italiani provenienti dal Policlinico di Milano, 493, dai tre degli Istituti Maugeri con aree Covid, gli IRCCS Pavia, Milano e Lumezzane (Bs), 190, e i restanti dall’ospedale Papa Giovanni XIII di Bergamo”. Una mole di informazioni su una così vasta platea di ammalati che, ancora solo pochi anni fa, avrebbe richiesto anni di lavoro, negoziazioni, istanze. “Impossibile senza una comunità di studiosi affiatati come quella di i2b2: dopo l’appello del fondatore, Zak Kohane, capo del Dipartimento di informatica Biomedica dell’Harvard Medical School, le prime teleconferenze, decine di colleghi erano già a reperire i dati nei loro ospedali, tutti in mezzo all’emergenza”, racconta Bellazzi, che in Maugeri dirige il Laboratorio di Informatica e Sistemistica per la Ricerca Clinica e che ha già lavorato con la piattaforma di i2b2 sul diabete realizzando, nello stesso IRCCS con l’endocrinologo Luca Chiovato, Mosaic, ampio studio predittivo utilizzando i big-data, finanziato dall’Unione europea. E Chiovato partecipa allo studio e firma  il preprint pubblicato.

“L’infrastruttura di raccolta dati è ormai rodata e ci consente di pescare anche da semplici fogli elettronici”, spiega Bellazzi, che ha lavoro con altri bio-ingegneri, Alberto Malovini e Valentina Tibollo, “anche se non è stato semplice recupere la griglia di informazioni decisa da 4C. Sono quelle provengono dalle cartelle cliniche, opportunamente anonimizzate, e relative a età e sesso del paziente, diagnosi, tempi di degenza e dei tamponi, nonché quelle delle analisi ematochimiche”.

Il fenotipo del paziente Covid+

Una cascata di valori che ha consentito agli algoritmi di costruire il fenotipo del paziente Covid positivo in altre aree del mondo diverse dalla provincia cinese dove il virus è stato isolato nel 2019. “Abbiamo consentito ai nostri clinici”, osserva il professore, “una rapida analisi e visualizzazione delle differenze regionali e dei punti in comune a livello globale. La traiettoria a della malattia, insomma che appare allineata a quella emersa nella prima letteratura proveniente dalla Cina”. Adesso, ma sempre più al crescere dei dati, la comunità scientifica “potrà confrontare questo paziente ‘internazionale’ coi singoli casi, studiando scostamenti, allineamenti, con una solida base di dati a disposizione”.

Ematochimica: infiammazione sistemica e coagulopatia. La creatinina differisce

Nell’articolo pubblicato molte riflessioni accompagnano soprattutto alcuni dei 14 valori relativi a marcatori cardiaci, renali, di disfunzione epatica e immunitaria. “I dati della traiettoria”, scrivono gli studiosi, “erano straordinariamente coerenti per la maggior parte delle istituzioni al ‘giorno 1’, in cui il tempone è positivo”, con “una gravità della malattia relativamente moderata alla presentazione”. Il quadro poi si complica, con valori anormali “ma non indicativi di insufficienza d'organo”. Traiettorie altamente coerenti con i risultati degli studi cinesi.

Differenze invece per la creatinina, che segnalava problemi renali, “in un gruppo di pazienti francesi e tedeschi, rimasti in ospedale per due settimane”. Tipico anche l’aumento della bilirubina totale, evidenziando problemi nella funzione epatica, ma senza giungere alla compromissione del fegato, “soprattutto tra pazienti ospedalizzati in modo persistente”, mentre divergono, su alcuni ospedali, “altre misurazioni epatiche, come le transaminasi ALT e AST”. Altro elemento ricorrente la proteina C-reattiva-CRP, “misura dell'infiammazione sistemica, notevolmente elevata alla presentazione per tutti pazienti”: un valore che migliora nel tempo, anche se compare una lieve leucocitosi, innalzamento dei globuli bianchi, nella seconda settimana.

Il D-dimero, “reagente in fase acuta e misura della coagulopatia, è stato elevato tra gli ospedali e i paesi” ed è aumentato costantemente in tutte le popolazioni che hanno continuato a essere ricoverate, aspetto, proseguono gli autori, “coerente con studi multipli che hanno mostrato un elemento trombofilico della malattia”.

Mancano, ai dati raccolti da 4C, le informazioni relative alle terapie somministrate: “La scheda farmaci dei pazienti”, spiega Bellazzi, “non è ancora digitalizzata in maniera uniforme”.