Supercomputer, i primi risultati di Excalate4cov contro Covid-19

Grazie a quattro supercalcolatori (di cui due italiani) e a una partnership europea che supporta tutta la filiera della drug discovery, il consorzio sostenuto dal programma Horizon 2020 dell'Unione Europea, ha portato a una molecola testata in uno studio clinico e all'esperimento di supercalcolo più complesso mai realizzato finora. Dal numero 185 del magazine

Supercomputer

Alle 2:56 Utc del 21 luglio 1969 Neil Armstrong metteva piede sulla Luna, seguito 19 minuti dopo da Edwin Buzz Aldrin. Era la prima volta per gli esseri umani. Cinquantadue anni dopo, il 26 gennaio del 2021, il raloxifene, un vecchio farmaco per il trattamento e la prevenzione dell’osteoporosi, dal brevetto scaduto, viene inserito per la prima volta in un protocollo di cura all’interno delle Rsa di quattro città italiane, per il trattamento a domicilio delle persone positive a Covid-19. Due storie che non potrebbero essere più diverse, ma con un fattore comune senza il quale non sarebbero state raccontate: il supercomputing.

Sono molti gli esperti di informatica che considerano il Norc (Naval Ordnance Research Calculator) prodotto da Ibm per la United States Navy Bureau of Ordnance il primo super computer della storia. Entrò in funzione nel dicembre del 1954 in piena guerra fredda, con una velocità di calcolo di 67 kOps (point operation per second), cioè 67 mila operazioni al secondo. La sua funzione era di difesa, ma anche di supporto per la corsa nello spazio, per la quale servivano macchine con capacità di calcolo sempre più potenti. Altri considerano il primo vero supercomputer il CDC-6600, progettato da Seymour Cray per la Control data corporation (Cdc) nel 1964. La verità però è che di supercomputer si parlava già negli anni Venti del Novecento: proprio nel 1920 il termine fu utilizzato per la prima volta sul quotidiano New York World, in un articolo che descriveva una macchina elettromeccanica costruita dall’Ibm per la Columbia University.

Un secolo dopo, la versione notevolmente più evoluta di queste prime macchine, la cui potenza oggi si misura in Flops (Floating point operation per second, operazioni a virgola mobile al secondo), è tornata utile anche per cercare una cura contro Covid-19.

Il progetto Excalate4cov

L’inizio della seconda storia è ormai appena meno nota della prima. Circa un anno fa un nuovo virus dà inizio a una pandemia che avrebbe sconvolto il mondo. La corsa ai rimedi contro la diffusione e la malattia causata dal Sars-Cov-2 va in tre direzioni: vaccini, nuovi farmaci e il drug repurposing, cioè la riallocazione di molecole già note e in commercio per altre indicazioni. Un lavoro mastodontico quest’ultimo, considerando i miliardi di molecole oggi disponibili, che solo una macchina tanto potente come un supercomputer – e una collaborazione internazionale – potrebbe fare.

Nasce così il progetto Exscalate4CoV, un consorzio pubblico-privato supportato dal programma Horizon 2020 dell’Unione Europea con un grant di 3 milioni di euro, all’interno del programma di “urgent computing” per il supercalcolo contro il coronavirus. È composto da 18 partner e guidato da Dompé Farmaceutici che mette a disposizione del progetto la piattaforma virtuale Exscalate (EXaSCale smArt pLatform Against paThogEns): una “biblioteca chimica” di 500 miliardi di molecole, già validata e sviluppata nel contesto del progetto europeo Antarex da una collaborazione tra Cineca, Dompè e Politecnico di Milano. Alla piattaforma i ricercatori possono attingere per simulare il comportamento del virus in abbinamento alle molecole farmaceutiche, grazie a una capacità di elaborazione di oltre 5 milioni di molecole al secondo.

La potenza del calcolo viene supportata dai quattro principali supercomputer in Europa: l’HPC5 di Eni (51,7 Petaflops, della Dell, all’ottavo posto tra i supercomputer più potenti del mondo secondo l’ultima classifica TOP500 dello scorso novembre), il Marconi100 di Cineca (29 Petaflops, di Ibm, undicesimo posto), MareNostrum4 del Centro di supercomputer di Barcellona (13,7 Petaflops, di Lenovo), Juwels del Centro Julich in Germania (12 Petaflops, della Atos).

“Il progetto Exscalate4CoV mira a sfruttare le più potenti risorse di calcolo attualmente basate in Europa per potenziare la progettazione intelligente di farmaci in silico. La progettazione avanzata dei farmaci assistita da computer (Cadd) in combinazione con lo screening biochimico e fenotipico ad alto rendimento consentirà la rapida valutazione delle simulazioni eseguite e la riduzione dei tempi per la scoperta di nuovi farmaci” scrivevano Giulio Vistoli dell’Università degli Studi di Milano e Andrea Beccari responsabile R&D Platforms & Services, Dompé farmaceutici, sul numero speciale di International Journal of Molecular Sciences dedicato un al progetto.

Prima fase: il Raloxifene

La prima fase del progetto, partita la scorsa primavera, si è basata su uno screening virtuale condotto dai super­computer del Consorzio su oltre 400 mila molecole messe a disposizione da Dompé Farmaceutici e dal Fraunhofer Institute, con priorità per i prodotti in fase clinica o sul mercato. Da questo test di modellistica molecolare sono emerse 7 mila molecole dalle caratteri­stiche promettenti che sono state testa­te e selezionate ulteriormente fino ad arrivare a 100 molecole attive in vitro e 40 con capacità di contrastare il virus nelle cellule animali. Un lavoro colletti­vo quello del Consorzio, che ha messo insieme i diversi soggetti che compon­gono la filiera del drug discovery, dagli studi in silico (computazionali) fino ai test preclinici, per arrivare a identifica­re, lo scorso giugno, una sola molecola promettente, come potenziale cura contro il covid-19: il raloxifene.

Secondo quanto riferito dagli esperti, il farmaco generico usato principalmente per il trattamento dell’osteoporosi, ave­va dimostrato una potenziale efficacia nel bloccare la replicazione del virus all’interno delle cellule, ritardando così l’avanzamento della malattia in pazienti con lievi infezioni sintomati­che. Così, sulla base di questi risultati, il 27 ottobre 2020 l’Agenzia italiana del farmaco ha autorizzato uno studio clinico di Fase 3 presso l’Ircss Lazzaro Spallanzani di Roma e l’Ircss Huma­nitas di Milano per valutare se il ra­loxifene potesse davvero rappresentare un potenziale trattamento per pazienti covid paucisintomatici ospedalizzati o a domicilio.

E il 26 gennaio 2021 il vecchio farmaco è entrato nelle case di cura di Milano, Bergamo, Roma e Na­poli, all’interno di un nuovo protocollo sanitario offerto ai medici di base, per il trattamento a domicilio delle persone positive a Covid-19. Accompagnato da un monitoraggio in telemedicina attra­verso un kit dedicato che consentirà ai medici di monitorare l’evoluzione della malattia, in stretto collegamento con la struttura ospedaliera di riferimento.

Seconda fase: la simulazione da record

Il lavoro del Consorzio però non si è concluso qui e lo scorso fine novembre in Italia è stato eseguito l’esperimen­to di supercalcolo più complesso mai realizzato al mondo per studiare l’in­terazione di oltre 70 miliardi di mole­cole antivirali con le proteine del virus Sars-Cov-2. L’obiettivo era simulare il comportamento del nuovo coronavi­rus in modo da individuare potenziali molecole in grado di legarsi a esso, neu­tralizzarlo e impedirgli di replicarsi.

La simulazione ha avuto inizio la sera di venerdì 19 novembre, presso il Green Data Center dell’Eni a Ferrera Erbo­gnone e si è conclusa nella mattinata di lunedì 21 novembre. In 60 ore di ela­borazione, Exscalate4CoV ha testato l’interazione di 71,6 miliardi di mole­cole su 15 “siti attivi” del virus. In totale sono state elaborate oltre un miliardo di interazioni, l’equivalente di 5 milio­ni di simulazioni al secondo grazie alla potenza di calcolo dei due supercompu­ter italiani HPC5 di Eni e Marconi100 di Cineca.

Un nuovo traguardo per la ricerca di calcolo ad alte prestazioni se si pensa che la simulazione italiana è stata 300 volte più grande e 500 volte più veloce di quella realizzata negli Stati Uniti a giugno di quest’anno con il su­percomputer Summit (Ibm), dell’Oak Ridge National Laboratory (Ornl), il secondo più potente al mondo dopo il giappone­se Fugaku (Fujitsu) della Riken Center for Com­putational Science.

“L’esperimento ha simulato il ‘docking molecolare’ – si legge sul sito di Eni – ovvero tutti i possibili legami inter­molecolari tra le proteine del virus e le altre molecole già conosciute presenti nei farmaci, nei prodotti naturali, nei nutraceutici e in altre sostanze in com­mercio potenzialmente utilizzabili, provenienti da database pubblici o resi disponibili da aziende farmaceutiche”. Senza il supporto dei supercomputer sarebbero serviti anni – contro i pochi mesi serviti invece al Consorzio – per portare a termine i calcoli necessari per l’operazione e studiare le circa trenta proteine presenti in Sars-cov-2.

Il sincrotrone di Trieste

Ancora in Italia, nel Friuli Venezia Giu­lia, si trova un altro punto nevralgico del Consorzio: l’Elettra Sincrotrone Trie­ste, il centro di ricerca che ospita l’anello di luce di sincrotrone, una infrastruttura che utilizza i raggi x per analizzare la ma­teria, come le molecole screenate all’in­terno di Exscalate4CoV.

“In questa ca­tena di esperimenti abbiamo il compito di dimostrare che i farmaci identificati all’interno del progetto leghino vera­mente alcune proteine del virus” spiega Paola Storici, responsabile di Exscala­te4cov per Elettra Sincrotrone Trieste e capo del laboratorio di produzione di Proteine. “Associamo la biologia strut­turale alla luce di sincrotrone per capire come sono fate le proteine virali, la loro struttura a livello atomico (le riproducia­mo in laboratorio senza dover usare il vi­rus) e valutare a livello 3D se le molecole identificate sono in grado di legarvisi e in che sito. La luce di sincrotrone irraggia i cristalli di proteine che deviano i raggi e da questa informazione riusciamo a ca­pire com’è fatta la struttura della protei­na al suo interno”.

Il lavoro del gruppo di Storici serve dun­que per convalidare i modelli virtuali originati dalla piattaforma, poi l’infor­mazione passa ai chimici computaziona­li che possono migliorare ulteriormente le molecole. Infine, altri laboratori come il Katholieke Universiteit Leuven in Bel­gio, testano la potenzialità delle molecole più promettenti selezionate dai modelli computazionali, in esperimenti in vitro, su cellule infettate col Sars-cov-2, per valutare se sono in grado di contrastare l’attivazione del virus.

Aspettando Leonardo

Ora, come conferma anche Storici, la­sciato alle spalle il raloxifene la ricerca va avanti, valutando anche altre molecole e la strada è ancora lunga e promettente. E se per parlare di computer quantistici è ancora troppo presto (i primi sono in costruzione ma la loro applicazione è lontana), una buona notizia potrebbe arrivare dall’installazione di un nuovo supercomputer ancora più potente che Cineca gestirà presso il Tecnopolo di Bologna. Leonardo – questo il nome della macchina – sarà disponibile da fine 2021/inizio 2022, e sarà una del­le macchine più potenti al mondo con una potenza di calcolo HPL aggregata di 250 Pflop, 250 milioni di miliardi di operazioni al secondo (inferiore in pratica solamente alla macchina attual­mente più potente della top500).