Anche i supercomputer per le cure anti-virus, così l’Italia guida la sfida

Pubblicato il: 27 Febbraio 2020|

Provate voi a fare milioni di miliardi di calcoli al secondo o, se preferite, completare operazioni in un’ora quando ci vorrebbero trenta anni con un normale Pc. Ovviamente è impossibile per il cervello umano, più probabile per uno dei supercomputer made in Italy come il Marconi che si trova nel centro Cineca a Casalecchio di Reno (Bologna) e che in queste settimane sta elaborando una serie di dati per trovare una cura all’ormai famoso Covid-19 (contemporaneamente al virus Zika). La cosa interessante è che questo super-cervellone è una delle tante macchine di processamento accelerato di dati che potrà mettere i ricercatori degli istituti pubblici o di aziende private nella condizione di studiare nuovi farmaci in pochissimo tempo. Ciò significa che strutture come il Cineca potranno mettere a disposizione i propri calcolatori attraverso bandi pubblici, partnership private o altre tipologie di accordi. E la partnership è nel Dna del Cineca: il consorzio interuniversitario italiano senza scopo di lucro, cui aderiscono 69 atenei italiani, otto enti nazionali di ricerca, due policlinici, l’Agenzia nazionale di valutazione del sistema universitario (Anvur) e il ministero dell’Istruzione, dell’Università e della Ricerca. Ma c’è di più. Presto arriverà un altro supercomputer chiamato Leonardo che nel 2021 sostituirà Marconi e garantirà una potenza di calcolo ancora maggiore, tanto che sarà il più performante di tutti gli altri sette supercomputer dell’Unione europea distribuiti in altrettanti Paesi.

Effetto “Ctrl+C”

Uno dei problemi della ricerca è la durata delle sperimentazioni. Con il perfezionamento di questi calcolatori si assisterebbe a un cambio di paradigma in stile “copia e incolla”. Se ci pensiamo bene con la combinazione “Ctrl+c” (inventata dal compianto Larry Tesler scomparso il 17 febbraio scorso) si poteva copiare un’intera pagina di word e incollarla altrove in un attimo. Ecco i supercomputer accelerano processi di questo tipo ingolosendo parecchio gli enti di ricerca. Massimo risultato con “minimo” sforzo, garantendo inoltre una conseguente riduzione dei costi.

Le partnership

“La principale modalità di accesso alle risorse è tramite la sottomissione di proposte di progetti a bandi, siano essi locali (in Lombardia c’è Lisa), nazionali (Iscra) e internazionali (Prace). Le ore di calcolo – spiega David Vannozzi, direttore generale Cineca – vengono allocate tramite peer review, valutando il valore scientifico dei progetti. Per quelli sottoposti dal mondo industriale, e quindi anche dalla ricerca clinica, sulla base delle caratteristiche delle esigenze si possono sviluppare progetti pilota a livello di consulenza oppure, nel caso di progetti che possono vedere coinvolto il mondo della ricerca accademica, si valuta la possibilità di attingere a fonti di finanziamento, come i progetti europei, attivando forme di collaborazione di tipo “digital innovation hub”. Fin dalla sua costituzione, Cineca si occupa di trasferimento tecnologico delle competenze acquisite, per creare collaborazioni virtuose tra il mondo della ricerca e il mondo produttivo. Un esempio in questo senso è rappresentato dalla partnership tra Cineca, Dompé e Politecnico di Milano nello sviluppo di Exscalate (Exascale smart platform against pathogens), una sorta di “biblioteca chimica” di oltre 500 miliardi di molecole, che può valutare più di 3 milioni di molecole al secondo su 30 target biologici contemporaneamente, con un costo computazionale per lo screening medio (1 miliardo di molecole) di 4 mila euro. Attualmente le performance della piattaforma sono sfruttate per individuare molecole efficaci nel contrastare il Virus Zika e Covid-19.

Exscalate

Questo risultato è frutto di un consorzio pubblico-privato, nato all’interno del progetto europeo Antarex con un finanziamento di oltre 3 milioni di euro, all’interno del programma per Horizon2020 Future and Emerging Technologies per il supercalcolo. Capofila è Dompé farmaceutici (come partner industriale per le applicazioni in ambito salute) insieme a Politecnico di Milano (coordinatore del progetto e partner per la accelerazione dell’applicazione) e Cineca (partner tecnologico che ha adattato l’applicazione al supercalcolatore Marconi).

Il primo campo di prova della piattaforma Exscalate è stata la crisi epidemiologica causata dal virus Zika, ad oggi ancora priva di cure efficaci. In questo caso Exscalate ha identificato molecole potenzialmente capaci di inibire cinque delle sette proteine virali (NS5, NS1, NS2B/NS3, NS3 e la proteina di membrana). Le molecole più promettenti identificate attraverso la piattaforma Exscalate sono ora in fase di sperimentazione biologica. Il caso di studio portato avanti sul virus Zika sarà “aperto” alla comunità internazionale e i risultati resi pubblici attraverso il sito Antarex4zika.eu.

L’idea di una piattaforma in grado di accelerare enormemente la ricerca farmaceutica in silico deriva da quasi dieci anni di investimenti da parte di Dompé farmaceutici, attraverso la sua Drug discovery platform dedicata allo sviluppo di farmaci attraverso metodiche in silico avanzate. Punto di partenza per lo sviluppo della piattaforma Exscalate è stato il software di structure-based virtual screening LiGen (Ligand generator). LiGen è frutto di una lunga collaborazione tra Dompé e il centro italiano di supercalcolo Cineca, il software era stato inizialmente ingegnerizzato per correre in modo nativo ed efficace su architetture di supercalcolo ed era già uno degli strumenti più competitivi nell’arena dei software per virtual screening.  Attraverso il progetto Antarex, Dompé ha colto l’opportunità di incorporare in LiGen le nuove tecnologie necessarie alla transizione all’era dell’exascale computing. Grazie alle tecniche di calcolo intelligente sviluppate al Politecnico di Milano e alla stretta collaborazione con un gruppo interdisciplinare di Cineca e Dompé è stato possibile implementare il software LiGen e sfruttare appieno la potenza di calcolo di Marconi.

Urgent computing

“Questo progetto si posiziona nel quadro più generale dell’urgent computing ovvero delle simulazioni richieste da enti nazionali e internazionali per ottenere risposte operative nel più breve tempo possibile”, aggiunge Carlo Cavazzoni responsabile R&D Hpc Cineca. “Inoltre beneficerà a breve dell’ulteriore potenziamento della attuale infrastruttura di calcolo europea che grazie ad un investimento di più di un miliardo di euro veicolato dal EuroHPC Joint Undertaking consentirà all’Europa di diventare uno dei maggiori player al mondo per il supercalcolo”.

Win-win            

La partnership pubblico-privato secondo Andrea Beccari, Business unit R&D platforms and services di Dompé è un accordo win-win. “Lavoriamo all’interno di contratti in cui è primario il trasferimento tecnologico. Noi abbiamo il controllo delle piattaforme di ricerca e facciamo leva sui finanziamenti europei per potenziare le strutture. C’è un moltiplicatore dell’investimento perché sulla base del finanziamento si investe ulteriormente per creare un network sempre più efficiente”, commenta. Secondo Beccari ora si va oltre la visione legata a un solo progetto. Le potenzialità del supercalcolo possono essere messe a disposizione per una quantità molto elevata di progetti e il trasferimento tecnologico permette di avere una visione più a lungo termine coinvolgendo sempre più attori. “La tecnologia del supercalcolo è molto pervasiva ma siamo arrivati tardi nell’avere un processore fisico europeo. Usa e Cina che dominano il mercato operano su scale completamente differenti”, continua Beccari.

Ue contro Usa e Cina

Usa e Cina surclassano qualunque altro Stato al mondo in quanto a capacità di calcolo. Al momento non esistono supercomputer europei tra i primi dieci più potenti al mondo. Per questo motivo, per recuperare il ritardo, l’Ue, attraverso il programma Euro Hpc ha stanziato 840 milioni di euro per la creazione di una rete informatica di classe pre-esascala tale da poter almeno tentare di recuperare il ritardo con i rivali americani e cinesi e raggiungere la potenza di calcolo a 18 zeri. L’Italia ha presentato la sua candidatura per ospitare uno dei calcolatori ad aprile 2019 su iniziativa di Cineca e alla fine l’ha spuntata. Gli altri sette sono a Sofia (Bulgaria), Ostrava (Repubblica Ceca), Kajaani (Finlandia), Bissen (Lussemburgo), Minho (Portogallo), Maribor (Slovenia) e Barcellona (Spagna). Tre di questi saranno macchine con una capacità di calcolo da 150 milioni di miliardi di calcoli al secondo (precursori dell’esascala) e gli altri saranno meno performanti con “solo” quattro milioni di miliardi di calcoli al secondo (petascala). Saranno tutti operativi entro la metà del 2020.

Il Leonardo

Come accennato, Marconi avrà un successore, Leonardo che “sarà installato nel corso del 2020 ed entrerà in funzione nel 2021. Fino almeno al 2023 – spiega sempre Vannoni – Marconi resterà in funzione, in particolare nell’ambito del progetto Eurofusion, con Enea (ente pubblico di ricerca italiano che opera nei settori dell’energia, dell’ambiente e delle nuove tecnologie a supporto delle politiche di competitività e di sviluppo sostenibile, vigilato dal Ministero dello sviluppo economico). Alcuni progetti che non richiedono supercomputer ‘accelerati’, continueranno a utilizzare Marconi, ma la maggior parte migrerà su Leonardo”. La nuova macchina, grazie a una potenza di calcolo di 270 milioni di miliardi di calcoli al secondo occuperà una superficie di 1500 m2 e sarà composto da tre moduli per un totale di cinquemila nodi di calcolo. La Ram sarà di tre Pb con 150 Pb di I/O e memoria. Sarà quindi questo il calcolatore italiano a rientrare nella grande rete europea e potrebbe entrare nella top ten dei supercomputer più potenti al mondo secondo la Top500.

Provate voi a fare milioni di miliardi di calcoli al secondo o, se preferite, completare operazioni in un’ora quando ci vorrebbero trenta anni con un normale Pc. Ovviamente è impossibile per il cervello umano, più probabile per uno dei supercomputer made in Italy come il Marconi che si trova nel centro Cineca a Casalecchio di Reno (Bologna) e che in queste settimane sta elaborando una serie di dati per trovare una cura all’ormai famoso Covid-19 (contemporaneamente al virus Zika). La cosa interessante è che questo super-cervellone è una delle tante macchine di processamento accelerato di dati che potrà mettere i ricercatori degli istituti pubblici o di aziende private nella condizione di studiare nuovi farmaci in pochissimo tempo. Ciò significa che strutture come il Cineca potranno mettere a disposizione i propri calcolatori attraverso bandi pubblici, partnership private o altre tipologie di accordi. E la partnership è nel Dna del Cineca: il consorzio interuniversitario italiano senza scopo di lucro, cui aderiscono 69 atenei italiani, otto enti nazionali di ricerca, due policlinici, l’Agenzia nazionale di valutazione del sistema universitario (Anvur) e il ministero dell’Istruzione, dell’Università e della Ricerca. Ma c’è di più. Presto arriverà un altro supercomputer chiamato Leonardo che nel 2021 sostituirà Marconi e garantirà una potenza di calcolo ancora maggiore, tanto che sarà il più performante di tutti gli altri sette supercomputer dell’Unione europea distribuiti in altrettanti Paesi.

Effetto “Ctrl+C”

Uno dei problemi della ricerca è la durata delle sperimentazioni. Con il perfezionamento di questi calcolatori si assisterebbe a un cambio di paradigma in stile “copia e incolla”. Se ci pensiamo bene con la combinazione “Ctrl+c” (inventata dal compianto Larry Tesler scomparso il 17 febbraio scorso) si poteva copiare un’intera pagina di word e incollarla altrove in un attimo. Ecco i supercomputer accelerano processi di questo tipo ingolosendo parecchio gli enti di ricerca. Massimo risultato con “minimo” sforzo, garantendo inoltre una conseguente riduzione dei costi.

Le partnership

“La principale modalità di accesso alle risorse è tramite la sottomissione di proposte di progetti a bandi, siano essi locali (in Lombardia c’è Lisa), nazionali (Iscra) e internazionali (Prace). Le ore di calcolo – spiega David Vannozzi, direttore generale Cineca – vengono allocate tramite peer review, valutando il valore scientifico dei progetti. Per quelli sottoposti dal mondo industriale, e quindi anche dalla ricerca clinica, sulla base delle caratteristiche delle esigenze si possono sviluppare progetti pilota a livello di consulenza oppure, nel caso di progetti che possono vedere coinvolto il mondo della ricerca accademica, si valuta la possibilità di attingere a fonti di finanziamento, come i progetti europei, attivando forme di collaborazione di tipo “digital innovation hub”. Fin dalla sua costituzione, Cineca si occupa di trasferimento tecnologico delle competenze acquisite, per creare collaborazioni virtuose tra il mondo della ricerca e il mondo produttivo. Un esempio in questo senso è rappresentato dalla partnership tra Cineca, Dompé e Politecnico di Milano nello sviluppo di Exscalate (Exascale smart platform against pathogens), una sorta di “biblioteca chimica” di oltre 500 miliardi di molecole, che può valutare più di 3 milioni di molecole al secondo su 30 target biologici contemporaneamente, con un costo computazionale per lo screening medio (1 miliardo di molecole) di 4 mila euro. Attualmente le performance della piattaforma sono sfruttate per individuare molecole efficaci nel contrastare il Virus Zika e Covid-19.

Exscalate

Questo risultato è frutto di un consorzio pubblico-privato, nato all’interno del progetto europeo Antarex con un finanziamento di oltre 3 milioni di euro, all’interno del programma per Horizon2020 Future and Emerging Technologies per il supercalcolo. Capofila è Dompé farmaceutici (come partner industriale per le applicazioni in ambito salute) insieme a Politecnico di Milano (coordinatore del progetto e partner per la accelerazione dell’applicazione) e Cineca (partner tecnologico che ha adattato l’applicazione al supercalcolatore Marconi).

Il primo campo di prova della piattaforma Exscalate è stata la crisi epidemiologica causata dal virus Zika, ad oggi ancora priva di cure efficaci. In questo caso Exscalate ha identificato molecole potenzialmente capaci di inibire cinque delle sette proteine virali (NS5, NS1, NS2B/NS3, NS3 e la proteina di membrana). Le molecole più promettenti identificate attraverso la piattaforma Exscalate sono ora in fase di sperimentazione biologica. Il caso di studio portato avanti sul virus Zika sarà “aperto” alla comunità internazionale e i risultati resi pubblici attraverso il sito Antarex4zika.eu.

L’idea di una piattaforma in grado di accelerare enormemente la ricerca farmaceutica in silico deriva da quasi dieci anni di investimenti da parte di Dompé farmaceutici, attraverso la sua Drug discovery platform dedicata allo sviluppo di farmaci attraverso metodiche in silico avanzate. Punto di partenza per lo sviluppo della piattaforma Exscalate è stato il software di structure-based virtual screening LiGen (Ligand generator). LiGen è frutto di una lunga collaborazione tra Dompé e il centro italiano di supercalcolo Cineca, il software era stato inizialmente ingegnerizzato per correre in modo nativo ed efficace su architetture di supercalcolo ed era già uno degli strumenti più competitivi nell’arena dei software per virtual screening.  Attraverso il progetto Antarex, Dompé ha colto l’opportunità di incorporare in LiGen le nuove tecnologie necessarie alla transizione all’era dell’exascale computing. Grazie alle tecniche di calcolo intelligente sviluppate al Politecnico di Milano e alla stretta collaborazione con un gruppo interdisciplinare di Cineca e Dompé è stato possibile implementare il software LiGen e sfruttare appieno la potenza di calcolo di Marconi.

Urgent computing

“Questo progetto si posiziona nel quadro più generale dell’urgent computing ovvero delle simulazioni richieste da enti nazionali e internazionali per ottenere risposte operative nel più breve tempo possibile”, aggiunge Carlo Cavazzoni responsabile R&D Hpc Cineca. “Inoltre beneficerà a breve dell’ulteriore potenziamento della attuale infrastruttura di calcolo europea che grazie ad un investimento di più di un miliardo di euro veicolato dal EuroHPC Joint Undertaking consentirà all’Europa di diventare uno dei maggiori player al mondo per il supercalcolo”.

Win-win            

La partnership pubblico-privato secondo Andrea Beccari, Business unit R&D platforms and services di Dompé è un accordo win-win. “Lavoriamo all’interno di contratti in cui è primario il trasferimento tecnologico. Noi abbiamo il controllo delle piattaforme di ricerca e facciamo leva sui finanziamenti europei per potenziare le strutture. C’è un moltiplicatore dell’investimento perché sulla base del finanziamento si investe ulteriormente per creare un network sempre più efficiente”, commenta. Secondo Beccari ora si va oltre la visione legata a un solo progetto. Le potenzialità del supercalcolo possono essere messe a disposizione per una quantità molto elevata di progetti e il trasferimento tecnologico permette di avere una visione più a lungo termine coinvolgendo sempre più attori. “La tecnologia del supercalcolo è molto pervasiva ma siamo arrivati tardi nell’avere un processore fisico europeo. Usa e Cina che dominano il mercato operano su scale completamente differenti”, continua Beccari.

Ue contro Usa e Cina

Usa e Cina surclassano qualunque altro Stato al mondo in quanto a capacità di calcolo. Al momento non esistono supercomputer europei tra i primi dieci più potenti al mondo. Per questo motivo, per recuperare il ritardo, l’Ue, attraverso il programma Euro Hpc ha stanziato 840 milioni di euro per la creazione di una rete informatica di classe pre-esascala tale da poter almeno tentare di recuperare il ritardo con i rivali americani e cinesi e raggiungere la potenza di calcolo a 18 zeri. L’Italia ha presentato la sua candidatura per ospitare uno dei calcolatori ad aprile 2019 su iniziativa di Cineca e alla fine l’ha spuntata. Gli altri sette sono a Sofia (Bulgaria), Ostrava (Repubblica Ceca), Kajaani (Finlandia), Bissen (Lussemburgo), Minho (Portogallo), Maribor (Slovenia) e Barcellona (Spagna). Tre di questi saranno macchine con una capacità di calcolo da 150 milioni di miliardi di calcoli al secondo (precursori dell’esascala) e gli altri saranno meno performanti con “solo” quattro milioni di miliardi di calcoli al secondo (petascala). Saranno tutti operativi entro la metà del 2020.

Il Leonardo

Come accennato, Marconi avrà un successore, Leonardo che “sarà installato nel corso del 2020 ed entrerà in funzione nel 2021. Fino almeno al 2023 – spiega sempre Vannoni – Marconi resterà in funzione, in particolare nell’ambito del progetto Eurofusion, con Enea (ente pubblico di ricerca italiano che opera nei settori dell’energia, dell’ambiente e delle nuove tecnologie a supporto delle politiche di competitività e di sviluppo sostenibile, vigilato dal Ministero dello sviluppo economico). Alcuni progetti che non richiedono supercomputer ‘accelerati’, continueranno a utilizzare Marconi, ma la maggior parte migrerà su Leonardo”. La nuova macchina, grazie a una potenza di calcolo di 270 milioni di miliardi di calcoli al secondo occuperà una superficie di 1500 m2 e sarà composto da tre moduli per un totale di cinquemila nodi di calcolo. La Ram sarà di tre Pb con 150 Pb di I/O e memoria. Sarà quindi questo il calcolatore italiano a rientrare nella grande rete europea e potrebbe entrare nella top ten dei supercomputer più potenti al mondo secondo la Top500.

Infografica a cura Marco Marsala

Intelligenza artificiale?

Pensare all’Ai è un attimo, ma in questo caso, anche se parliamo di un super-cervellone, non ci riferiamo ad esso come entità “pensante”, seppur in ambito informatico. La capacità di Leonardo e Marconi esula dall’intelligenza artificiale, tuttavia il passo è breve. Il 19 febbraio la Commissione europea, sulla scia dei piani strategici da definire di qui al 2030 (o meglio 2027 con il progetto Horizon Europe), ha presentato il suo position paper sull’intelligenza artificiale mettendone in risalto le peculiarità per la ricerca. Sono due i capisaldi del documento prodotto dalla Commissione. Il primo è definito come “ecosistema dell’eccellenza” che sposa bene i campi di applicazione pratica nell’economia reale dell’Ue. Il secondo è “l’ecosistema della fiducia” ossia tutta quella serie di politiche volte a un approccio non invasivo della tecnologia nel rispetto della privacy.

Rafforzamento

Anche in questo campo, rispetto a Usa e Cina l’Europa è indietro. Il nuovo sistema di supercalcolo dovrebbe aiutare nella lavorazione di una grandissima quantità di dati all’interno di un network di cloud-computing europeo. Tuttavia è indubbio che l’Ue abbia molto da recuperare in tal senso. Il volume dei dati prodotti era di 33 zettabyte nel 2018 e ci si aspetta che entro il 2025 si arrivi a 175. Oggi l’80% dei processi di data analytics avviene nei data center e solo il 20% grazie ai prodotti connessi alla rete (automobili o altri device).

Spingere sulle partnership

A dicembre 2018 la Commissione aveva presentato il suo piano sull’Ia. Oltre 70 progetti da mettere in campo con una collaborazione più stretta con i Paesi membri e creare una comunità sempre più forte sulla ricerca. Per fare questo si vuole puntare di più sulle piccole e medie imprese all’interno del cosiddetto Digital Europe programme per adottare soluzioni di intelligenza artificiale, magari con un iniezione iniziale di circa 100 milioni di euro già nella prima metà del 2020.

Il cloud e la sicurezza

La mole di dati che verrà processata ha bisogno di essere messa sotto chiave. Una nuvola, in questo caso, è la migliore cassaforte, soprattutto se ci sono gli strumenti per proteggerla da attacchi esterni. La Commissione europea ha proposto più di quattro miliardi di euro all’interno del Digital Europe programme.

La ricerca su Covid-19

Marconi sta lavorando a pieno regime per simulare il comportamento di dieci proteine usate da Covid-19 per riprodursi. Si tratta di simulazioni molto lunghe: ogni proteina richiede almeno una settimana di simulazione continuativa (24 ore per 7 giorni) su sedici nodi del supercomputer Cineca. Con un computer normale ci vorrebbero almeno quattro mesi per ogni proteina. I risultati delle simulazioni saranno poi messi a confronto con le molecole farmacologiche esistenti tramite Exscalate una piattaforma virtuale sviluppata da Cineca, con Dompè Farmaceutici e il Politecnico di Milano, per individuare le molecole più efficaci a inibire il virus. In questa prima fase tramite i supercomputer si sta simulando il comportamento delle proteine che consentono al virus di replicarsi in modo da poter testare virtualmente le molecole farmaceutiche più efficaci a inibire il virus, e poter poi passare alla fase di validazione in laboratorio accelerando la produzione di farmaci efficaci per ridurre la replicabilità del virus.

*Foto in copertina: Supercomputer Marconi di Francesco Pierantoni concessa da Cineca

Tag: Cineca / coronavirus / dompe / politecnico di milano / ricerca / Ue /

CONDIVIDI

AP-DATE
SCELTE DALLA REDAZIONE

Pazienti e scelte sanitarie: ancora non c’è la bussola

Prosegue la contesa su rappresentatività, diritti, competenze: lo scorso 19 ottobre il Tar Toscana ha bocciato un ricorso presentato da circa quindici associazioni contro la delibera 702 che include i pazienti esperti nei processi di acquisto dei dispositivi medici. E il recente atto di indirizzo ministeriale sembra appena un primo passo verso il coinvolgimento dei cittadini

Remedi4all: l’Europa scommette sul valore del repurposing

Il progetto Ue sul riposizionamento di farmaci già esistenti per altre indicazioni terapeutiche prevede il coinvolgimento di 24 istituti europei, coordinati da Eatris e un finanziamento di 23 milioni di euro attraverso il programma Horizon Europe

RUBRICHE
FORMAZIONE