L’intelligenza artificiale al servizio degli ospedali: il progetto Data Lake del Niguarda di Milano

Il sistema sanitario è un produttore continuo di dati. L’Asst Grande ospedale metropolitano Niguarda ne fa un asset strategico a supporto dei clinici per il bene dei pazienti. *IN COLLABORAZIONE CON INTERSYSTEMS ITALIA

Si dice sempre più spesso, e lo abbiamo sostenuto anche noi più volte in questa rubrica, che una corretta ed efficiente raccolta dei dati clinici può ottimizzare i percorsi di cura del paziente e servire anche alla ricerca scientifica a fine predittivo e quindi preventivo. Con la pandemia da Covid-19 sono partiti diversi progetti con lo scopo di identificare e perfezionare i trattamenti più efficienti per curare il virus, individuando le variabili cliniche incidenti sui risultati al fine di agevolare il processo decisionale verso un percorso di cura ad alto potenziale curativo e limitato rischio di controindicazioni cliniche sia sul breve termine che nel medio-lungo periodo.

Il progetto CoviLake

InterSystems, insieme ad altre aziende che operano nell’ambito dell’It sanitario, alcune delle quali specializzate nella gestione di ingenti quantità di dati, ha sviluppato un DataLake per il Covid-19 mediante il quale effettuare analisi e correlazioni tra dati e immagini a scopo diagnostico, terapeutico e organizzativo che agevolasse i processi decisionali in risposta all’emergenza sanitaria. Il progetto, chiamato “CoviLake”, è stato realizzato per l’ASST Grande Ospedale Metropolitano Niguarda, coinvolgendo le strutture sanitarie di Radiologia, Fisica sanitaria, Medicina d’urgenza, Anestesia e Rianimazione e con il supporto dell’Università degli Studi di Milano.

Una tecnologia complessa ed articolata come questa raccoglie automaticamente e quotidianamente tutte le informazioni e i documenti relativi ad ogni evento clinico rilevante nel percorso di cura dei pazienti affetti da Covid-19.  Tutto questo avviene direttamente alla fonte dei dati: sistemi di laboratorio, radiologia, pronto soccorso e repository aziendali. I dati estratti e anonimizzati popolano gli archivi di ricerca in forma “atomica”, ovvero grezza e non strutturata. Per ogni paziente anonimizzato sono associati i dati clinici di interesse sanitario e i metadati DICOM delle immagini digitali. I dati DICOM delle immagini sono consultabili ma residenti in un archivio VNI (Agfa). Le informazioni hanno sia valenza retrospettiva che prospettica. La prima poiché considerano i dati clinici elettronici già presenti nei database aziendali al momento dell’installazione dell’infrastruttura proposta; la seconda dal momento che registrano i nuovi dati prodotti non solo durante il periodo di malattia ma anche durante la fase di follow-up del paziente dimesso. Inoltre, chiaramente, il sistema registra tempestivamente anche i nuovi casi diagnosticati.

La logica di interrogazione dei sistemi aziendali connessi al CoviLake è periodica. Un meccanismo di confronto, con un registro di documenti interno, tiene traccia dei file già processati e impedisce la ridondanza delle informazioni.

I Big Data, raccolti in formato nativo e provenienti da fonti diversificate e disomogenee, sono memorizzati, categorizzati e analizzati da tecnologie avanzate e complesse di Machine Learning (ML) e Intelligenza Artificiale (AI). L’intero processo è automatico, in tempo reale, sicuro e nel rispetto della privacy, grazie all’anonimizzazione. Non è richiesto il coinvolgimento di personale dedicato e questo riduce la dispersione di risorse, caratteristica fondamentale soprattutto in un contesto di emergenza sanitaria quale può essere una pandemia.

Ad ogni elemento “atomico” raccolto sono associati un identificatore e un insieme di metadati che agevolano la consultazione del DataLake. La corretta categorizzazione è fondamentale per ricevere immediatamente tutti i dati rilevanti a seconda dell’interrogazione. In questo modo il sistema restituisce in real-time una risposta esaustiva, considerando i dati a disposizione, e chiara attraverso un’interfaccia utente di facile comprensione e consultazione.

Il processo di change management

Tuttavia, l’implementazione di un sistema così complesso ed esaustivo di raccolta e gestione dei dati richiede un processo di cambiamento culturale a livello d’azienda che agevoli l’intero team a comprenderne le modalità e i processi di interazione. Per questo fine specifico, l’ASST Grande Ospedale Metropolitano Niguarda ha creato un team interdisciplinare fortemente connesso e coeso, composto sia da figure cliniche di spicco che da analisti di dati, fisici medici, informatici e tecnici. Questo scambio cooperativo è stato possibile grazie ad una serie di incontri periodici al fine di designare e poi verificare gli obiettivi clinici di progetto, individuare i dati rilevanti e le relative sorgenti e poi elaborare un approccio funzionale e sinergico al progetto.

Inoltre, il team di lavoro è intervenuto anche sui processi interni di allocazione delle risorse per selezione, lettura, raccolta e copia manuale dei dati utili agli studi presenti nei database locali, ottimizzando e automatizzando il processo stesso di raccolta, minimizzando la possibilità di rischi d’errore dovuti all’azione manuale e aumentando di conseguenza la quantità e la qualità dei dati disponibili.

I risultati raggiunti

Alla fine di marzo 2021, CoviLake Niguarda ha raccolto automaticamente dati anonimizzati di oltre 2.100 pazienti a cui è stato diagnosticato il Covid-19, con più di tremila studi di immagini digitali e più di 1,5 milioni di dati clinici che aumentano settimanalmente.

Tale quantità di dati e immagini, opportunamente correlati, ha consentito di sviluppare alcune analisi e strumenti prototipali per fornire informazioni predittive dell’evoluzione della malattia.

Il primo miglioramento evidente riguarda la capacità di diagnosi precoce del Covid-19 grazie a strumenti basati su tecniche di Intelligenza Artificiale che distinguono tale patologia da altre morfologicamente simili, come le interstiziopatie polmonari, gli adenocarcinomi a crescita lepidica e altre malattie infettive con coinvolgimento polmonare interstiziale.

Inoltre, l’implementazione del CoviLake consente di quantificare automaticamente il volume polmonare interessato dalla malattia, estraendo informazioni salienti (distribuzione di densità, analisi di texture etc.) da correlare con gli altri dati disponibili al fine di distinguere i pazienti candidati al monitoraggio domiciliare da quelli che invece necessitano di ricovero ospedaliero a causa di una situazione patologica già progredita o ad elevato rischio di progressione.

L’analisi combinata dei dati quantifica poi la correlazione tra il maggior tempo di permanenza in Pronto soccorso e l’aumento di necessità di terapia intensiva, sub-intensiva respiratoria o l’aumento di esito di decesso per qualificare i percorsi e le strategie di accoglienza dei malati acuti.

Infine, la correlazione delle informazioni estratte grazie alla quantificazione automatica del volume polmonare (distribuzione di densità, analisi della texture etc.) con ulteriori dati raccolti consente di predire la risposta alla tecnica di pronazione dei pazienti ricoverati in terapia intensiva respiratoria.

Uno sguardo al futuro del CoviLake

Uno strumento come un DataLake capace di aggregare dati clinici, laboratoristici e di imaging, inteso come valutazione dell’informazione quantitativa da esso ricavabile, rappresenta una soluzione di assoluta novità. Finora, infatti, la mancanza di database sufficientemente estesi e adeguatamente organizzati ha impedito la creazione di strumenti simili applicabili a vari ambiti clinici. Tra l’altro, basandosi su una tecnologia già acquisita a livello centrale dalla Regione Lombardia, il sistema CoviLake potrebbe essere facilmente esteso ad ulteriori aziende sanitarie o integrato con ulteriori DataLake già esistenti, ampliandone esponenzialmente il valore strategico.

Infatti, oltre ad essersi dimostrato cruciale per la gestione dei pazienti affetti da Covid-19 durante l’emergenza pandemica, il CoviLake continuerà a dimostrare il suo valore anche ad emergenza conclusa: i dati raccolti saranno di grande ausilio per definire strategie diagnostiche e terapeutiche precoci e attuare interventi tempestivi nei pazienti Covid.

Il follow-up dei pazienti guariti dall’infezione da coronavirus fornirà infatti informazioni di primaria importanza sulla popolazione di domani, chiarendo se e quali siano gli esiti residui dall’infezione e/o dalle misure più o meno invasive prese per contrastarla e quale sia il loro significato clinico. I dati disponibili riguardo Sars e Mers e, in generale, i quadri di sindrome da stress respiratorio acuto, rilevano infatti un’incrementata vulnerabilità di questi pazienti a insufficienze respiratorie, fibrosi e polmoniti organizzative secondarie.

Uno studio in questa direzione avrebbe delle ricadute sia nel breve termine, ad esempio aiutando a identificare quali tra i pazienti dimessi necessitano di ulteriore monitoraggio, che soprattutto nel medio-lungo termine nell’individuare situazioni di ulteriore fragilità o nel distinguere esiti senza impatto clinico da altre patologie che potrebbero subentrare. L’esperienza sviluppata con i pazienti Covid ha posto in evidenza la potenzialità di applicare tale soluzione operativa per la raccolta di dati clinici e immagini in modo anonimo e atomizzato anche per pazienti con altre patologie (oncologiche, cardiologiche, etc).

 

La realizzazione di questo progetto si deve ad Alberto Torresin, Direttore di Fisica Sanitaria e Angelo Vanzulli, Direttore della Radiologia dell’ASST Grande Ospedale Niguarda, la società Sazai, partner coordinatore del progetto, e alla collaborazione di InterSystems con Agfa, Medas, Nextage e Quibim.

 

Homepage della rubrica “Il valore dei dati nella sanità digitale: sfide, processi e tecnologie”

In collaborazione con InterSystems Italia