Predire l’Alzheimer usando il machine learning

Pubblicato il: 16 Giugno 2022|

L’Alzheimer è una malattia neurodegenerativa incurabile e una tra le più diffuse nella terza età. Man mano che la condizione peggiora, i pazienti generalmente soffrono di disturbi mentali, declino della memoria e cambiamenti comportamentali. La genetica svolge un ruolo importante nella genesi della malattia. Tuttavia non è possibile attribuirne la forma a insorgenza tardiva (la più diffusa che riguarda il 95% dei casi) a una singola mutazione. In altri termini, non è possibile identificare il gene mutato dell’Alzheimer. “La componente genetica, cioè legata alle mutazioni nel nostro Dna, ci permette di capire la propensione di un individuo a contrarre la malattia. Diversi processi molecolari solo parzialmente compresi e contributi ambientali, come vari tipi di intossicazioni, possono far progredire la malattia in maniera differente sulla base delle caratteristiche genetiche individuali” ha spiegato Gian Gaetano Tartaglia, professore di biochimica presso l’Università La Sapienza di Roma.

Un gioco di incastri

Nonostante anni di sforzi in tutto il mondo, fino a oggi sono state identificate poche dozzine di geni associate all’Alzheimer: sono circa quaranta quelli che recano mutazioni più frequenti nei soggetti malati rispetto alla popolazione che invecchia senza malattia. Meta-analisi genomiche su larga scala (note con il nome di GWAS, Genome-wide association studies) hanno identificato singole varianti associate alla propensione di un paziente a contrarre l’Alzheimer. Infatti, perché insorga la malattia non è necessario siano presenti grandi mutazioni a livello del genoma. Piuttosto è sufficiente che si verifichino variazioni a livello di singoli nucleotidi (Snv o single nucleotide variants) in alcuni geni per generare la malattia. Tuttavia, anche se il progresso della ricerca ha permesso di individuare un abbondante numero di mutazioni, è difficile fare predizioni solo sulla base della presenza di variazioni singole. La malattia, infatti, è presumibilmente causata da specifiche varianti di un certo numero di geni, che lavorano in concerto con fattori ambientali e comportamenti personali.

Le premesse dello studio

Una ricerca condotta presso il Dipartimento di Biologia e biotecnologie Charles Darwin dell’Università Sapienza, con l’Istituto italiano di Tecnologia (IIT) e altri centri di ricerca internazionali, ha valutato la possibilità di superare la limitazione dei GWAS di predire le varianti genetiche associate a un alto rischio di malattia. Ne è scaturito uno studio pubblicato su Alzheimer’s & Dementia: Diagnosis, Assessment & Disease Monitoring. Spiega Gian Gaetano Tartaglia: “Per iniziare il nostro studio, in primo luogo è stato necessario comprendere quali siano le mutazioni che meglio permettono di prevedere se un individuo svilupperà l’Alzheimer. Poi ci siamo chiesti se ci fossero combinazioni delle mutazioni che meglio identificano il profilo di un individuo potenzialmente affetto da Alzheimer”. Per costruire i profili genomici è stato utilizzato un insieme di dati ottenuti da due dei più grandi database esistenti: UK Biobank e Alzheimer’s disease neuroimaging initiative (Adni).

La selezione del campione

In tal modo i ricercatori hanno selezionato un numero comparabile di soggetti con diagnosi di Alzheimer e di soggetti privi di qualsiasi diagnosi di patologia neurodegenerativa. Lo studio è iniziato considerando le 145 mutazioni o Snv più frequenti associate all’Alzheimer. La tecnica del machine learning, che si basa sulle capacità di apprendimento automatico dei calcolatori per generare metodi predittivi, ha permesso di selezionare le mutazioni e le loro combinazioni. “Senza il machine learning sarebbe stato impossibile analizzare ogni combinazione delle mutazioni. Considerando la frequenza di 145 mutazioni nella popolazione, avremmo avuto 100.250 casi da studiare. Il machine learning permette di trovare il segnale in questo oceano di mutazioni e soprattutto di abbattere i tempi per calcolare gli effetti delle combinazioni”. L’approccio machine learning usato per l’analisi dei dati è basato sul metodo ad albero che consente di indurre la macchina a prendere decisioni di tipo “sì o no” e quindi di classificare i dati. “Molti dei metodi usati sono stati presi in prestito da altri campi di applicazione, dove sono sfruttati per analizzare dataset statistici molto ampi. Per esempio, gli algoritmi utilizzati per fare predizioni di interazioni molecolari”. Le tecniche di machine learning hanno permesso di dare priorità ad alcune varianti, non solo contando la loro frequenza ma anche considerando le interazioni tra gruppi di Snv. In particolare, i ricercatori hanno identificato sei Snv ricorrenti, identificati da tutti e tre i metodi diversi di machine learning applicati.

Il gene APOE, ma non solo

I sei Snv più frequenti si trovavano in una regione hot-spot del cromosoma 19, che comprende il gene APOE codificante per l’apolipoproteina E. Quest’ultima svolge un ruolo chiave nel trasporto dei lipidi. È anche implicata nella presenza di colesterolo nei neuroni nel cervello sano. In particolare, l’APOE ha un ruolo nel metabolismo della beta-amiloide. Anche se il meccanismo esatto è sconosciuto, la variante e4 di APOE sembra accelerare l’accumulo, l’aggregazione e la deposizione di Aβ neurotossico nel cervello. “Le mutazioni che più caratterizzano l’individuo affetto da Alzheimer si verificano in una zona del Dna dove è presente il gene APOE. Questo significa che oltre al gene APOE, ci sono altri geni vicini e meno conosciuti che hanno comunque un effetto”. E infatti, ci sono mutazioni anche a carico dei geni PVRL2, APOC1 e TOMM40.

Le mutazioni predisponenti

Prosegue Tartaglia: “Alcune mutazioni, chiamate predisponenti, sono associate con una propensione a contrarre Alzheimer. Altre variazioni del DNA, dette protettive, hanno l’effetto opposto. Le mutazioni protettive possono annullare l’effetto di quelle predisponenti”. In effetti, esistono individui anziani che non sviluppano l’Alzheimer ma che hanno mutazioni predisponenti, perché accanto a queste ultime hanno anche mutazioni protettive. Ciò che fa veramente la differenza tra soggetti sani e malati è la presenza o l’assenza di una particolare variante a livello della regione che controlla la trascrizione del gene APOE. Insomma, le tre varianti predisponenti l’Alzheimer hanno un effetto differente a seconda della presenza o dell’assenza di quest’ultima variante. In particolare, l’interazione tra l’Snv situato nel promotore dell’apolipoproteina E e gli Snv a monte, che in genere predispongono all’AD, sembra apparentemente neutralizzare il loro effetto predisponente alla malattia. “Comprendere come compaiano questi pattern complessi e gli effetti combinati richiede l’applicazione di metodi statistici e predittivi. Il machine learning si è rivelato un approccio davvero conveniente” conclude l’esperto.

Prospettive future della ricerca

Il progetto sull’Alzheimer non termina qui, ma si svilupperà in due direzioni. La prima servirà a far progredire la ricerca di base sulla malattia. Aggiunge il professore: “Magdalena Arnal Segura, la studentessa di dottorato che lavora al progetto, ha creato alcuni modelli basandosi su dati di interazioni cellulari che vorremmo testare e condividere con la comunità scientifica. Questo ci permetterebbe di capire i meccanismi molecolari alterati dalla presenza delle mutazioni riscontrate nell’Alzheimer”. Dall’altro lato, lo studio offre importanti opportunità anche per la clinica. Le tecniche di machine learning usate sono utili a definire profili genetici basati sulle interazioni tra differenti Snv che compaiono in concomitanza. E in futuro potrebbero essere utili alla clinica per caratterizzare in modo più preciso i pazienti o per fare screening all’interno di una popolazione che rischia di sviluppare l’Alzheimer.

Pensare a possibili terapie

La possibilità di predire l’Alzheimer a insorgenza tardiva (cioè dopo i 70 anni) è una sfida importante. Tuttavia, l’approccio preventivo è controverso perché tocca questioni come la privacy o può indurre paure e preoccupazioni nei soggetti che ricevono una simile diagnosi. Inoltre, conoscere le zone del genoma associate all’Alzheimer potrebbe rivelarsi utile anche allo sviluppo di farmaci. Dice Tartaglia: “Le terapie geniche stanno facendo passi da gigante. Tuttavia, è difficile trattare malattie come l’Alzheimer che vedono coinvolti diversi geni. Selezionare le mutazioni rilevanti, come abbiamo fatto in questo nostro studio, contribuisce a sviluppare terapie personalizzate per contrastare gli effetti delle mutazioni. Facendo una piccola speculazione, la soluzione più efficiente per trattare l’Alzheimer potrebbe essere CRISPR, anche se è ancora necessario superare alcune limitazioni, legate ad esempio al delivery. Un altro approccio consiste nell’usare small molecules per interferire con la funzione delle proteine prodotte dai geni in cui le mutazioni si verificano”.

Estensione ad altre patologie

Infine, i metodi di machine learning messi a punto per la prima volta nello studio citato potrebbero essere estesi ad altre patologie. Per applicare la tecnica è fondamentale che siano presenti due condizioni: la dimensione della popolazione da analizzare deve essere sufficientemente ampia e il sequenziamento del Dna deve essere di eccellente qualità. Su questo aspetto il gruppo guidato da Tartaglia si è impegnato non poco. “Abbiamo appena ottenuto accesso a database genomici per analizzare altre malattie diffuse nella popolazione, come ad esempio quelle cardiovascolari. Se identificassimo le combinazioni di mutazioni in ogni malattia, potremmo avere un pool di dati per lavorare sui meccanismi molecolari. A quel punto potremmo testare l’effetto di alcuni farmaci già disponibili sul mercato”.

Tag: Alzheimer / gian gaetano tartaglia / istituto italiano tecnologia / machine learning / Università La Sapienza /

CONDIVIDI

AP-DATE
SCELTE DALLA REDAZIONE
plasma

La via italiana al plasma, sognando l’autosufficienza

Il ddl Concorrenza introduce nuove regole per la produzione dei farmaci e ribadisce il principio della donazione gratuita alla base del nostro sistema trasfusionale. Ma la raccolta va potenziata per limitare la dipendenza dal mercato estero. Dal numero 199 del magazine

RUBRICHE
FORMAZIONE