Pubblicato il primo “pangenoma” umano

Gli scienziati hanno pubblicato il primo "pangenoma" umano, una sequenza genetica completa che incorpora i genomi non di un solo individuo, ma di 47

0
347
Pubblicato il primo
Pubblicato il primo "pangenoma" umano

Gli scienziati hanno pubblicato il primo “pangenoma” umano, una sequenza genetica completa che incorpora i genomi non di un solo individuo, ma di 47.

I 47 individui provengono da tutto il mondo e quindi aumentano notevolmente la diversità dei genomi rappresentati nella sequenza, rispetto alla precedente sequenza completa del genoma umano che gli scienziati hanno usato come riferimento per lo studio. La prima sequenza del genoma umano è stata rilasciata con alcune lacune nel 2003 e resa “senza interruzioni” solo nel 2022.

Se quel primo genoma umano è una semplice stringa lineare di codice genetico, il nuovo pangenoma è una serie di percorsi ramificati.

L’obiettivo finale dello Human Pangenome Reference Consortium, che ha pubblicato la prima bozza del pangenoma sulla rivista Nature, consiste nel sequenziare almeno 350 individui di diverse popolazioni in tutto il mondo. Sebbene il 99,9% del genoma sia lo stesso da persona a persona, c’è molta diversità trovata in quello 0,1% finale.

“Piuttosto che utilizzare una singola sequenza del genoma come nostro sistema di coordinate, dovremmo invece avere una rappresentazione basata sui genomi di molte persone diverse in modo da poter catturare meglio la diversità genetica negli esseri umani”, ha dichiarato Melissa Gymrek, una ricercatrice di genetica presso l’Università della California, San Diego, che non era coinvolta nel progetto.

Un riferimento per la salute

La prima sequenza completa del genoma umano è stata completata nel 2003 dal Progetto genoma umano, ed era basata sul DNA di una persona. Successivamente, sono stati aggiunti frammenti di circa altri 20 individui, ma il 70% della sequenza che gli scienziati usano per confrontare la variazione genetica proviene ancora da una singola persona.



I genetisti usano il genoma di riferimento come guida quando sequenziano pezzi di codici genetici delle persone, ha detto Arya Massarat, una studentessa di dottorato nel laboratorio di Gymrek. Abbinano i frammenti di DNA appena decodificati al riferimento per capire come si adattano al genoma nel suo insieme. Usano anche il genoma di riferimento come standard per individuare variazioni genetiche – diverse versioni di geni che divergono dal riferimento – che potrebbero essere collegate a condizioni di salute.

Ma con un singolo riferimento per lo più da una persona, gli scienziati hanno solo una finestra limitata di diversità genetica da studiare.

La prima bozza del pangenoma ora raddoppia il numero di grandi varianti del genoma, note come varianti strutturali, che gli scienziati possono rilevare, portandole a 18.000. Questi sono posti nel genoma in cui grandi pezzi sono stati cancellati, inseriti o riorganizzati. La nuova bozza di pangenoma aggiunge anche 119 milioni di nuove coppie di basi, ovvero le “lettere” accoppiate che compongono la sequenza del DNA, e 1.115 nuove mutazioni di duplicazione genica alla versione precedente del genoma umano.

“È davvero la comprensione e la catalogazione di queste differenze tra i genomi che ci permettono di capire come operano e funzionano le cellule e la loro biologia, oltre a comprendere le differenze genetiche umane”, ha affermato Karen Miga, coautrice dello studio e genetista presso l’Università della California, Santa Cruz.

Il pangenoma potrebbe aiutare gli scienziati a comprendere meglio le condizioni complesse in cui i geni svolgono un ruolo influente, come l’autismo, la schizofrenia, i disturbi immunitari e le malattie coronariche, hanno affermato i ricercatori coinvolti nello studio durante la conferenza stampa.

Ad esempio, il gene della lipoproteina A è noto per essere uno dei maggiori fattori di rischio per la malattia coronarica negli afroamericani, ma i cambiamenti genetici specifici coinvolti sono complessi e poco conosciuti, ha detto il coautore dello studio Evan Eichler, un ricercatore di genomica presso l’Università di Washington a Seattle. Con il pangenoma, i ricercatori possono ora confrontare in modo più approfondito la variazione nelle persone con e senza malattie cardiache, e questo potrebbe aiutare a chiarire il rischio di malattie cardiache degli individui in base alle varianti del gene che portano.

Una comprensione diversa

L’attuale bozza del pangenoma ha utilizzato i dati dei partecipanti al Progetto 1000 Genomes, che è stato il primo tentativo di sequenziare i genomi di un gran numero di persone provenienti da tutto il mondo. I partecipanti inclusi avevano concordato che le loro sequenze genetiche fossero rese anonime e incluse in database disponibili al pubblico.

Il nuovo studio ha utilizzato anche una tecnologia di sequenziamento avanzata chiamata “sequenziamento a lettura lunga”, in contrasto con il sequenziamento a lettura breve precedente. Il sequenziamento a lettura breve è ciò che accade quando invii il tuo DNA a un’azienda come 23andMe, ha detto Eichler. I ricercatori leggono piccoli segmenti di DNA e poi li uniscono in un tutto. Questo tipo di sequenziamento può catturare una discreta quantità di variazione genetica, ma può esserci una scarsa sovrapposizione tra ogni frammento di DNA. Il sequenziamento a lunga lettura, d’altra parte, cattura grandi segmenti di DNA tutti in una volta.

Sebbene sia possibile sequenziare un genoma con sequenziamento a lettura breve per circa $ 500, il sequenziamento a lettura lunga è ancora costoso, con un costo di circa $ 10.000 a genoma, ha affermato Eichler. Il prezzo sta scendendo, tuttavia, e il team del pangenoma spera di sequenziare i loro prossimi lotti di genomi a un costo pari o inferiore alla metà.

I ricercatori stanno lavorando per reclutare nuovi partecipanti per continuare a colmare le lacune di diversità nel pangenoma, secondo il coautore dello studio Eimear Kenny, professore di medicina e genetica presso l’Institute for Genomic Health  alla Icahn School of Medicine del Mount Sinai a New York City. Poiché le informazioni genetiche sono sensibili e poiché regole diverse regolano la condivisione dei dati e la privacy in paesi diversi, questo è un lavoro delicato. I problemi includono la privacy, il consenso informato e la possibilità di discriminazione basata su informazioni genetiche, ha affermato Kenny.

Gli scienziati hanno già scoperto nuovi processi genetici con la bozza del pangenoma. In due articoli pubblicati su Nature insieme al lavoro, i ricercatori hanno esaminato segmenti altamente ripetitivi del genoma. Questi segmenti sono stati tradizionalmente difficili da studiare, ha dichiarato il biochimico Brian McStay della National University of Ireland Galway, perché sequenziarli tramite la tecnologia di lettura breve rende difficile capire come si incastrano. La tecnologia di lettura lunga consente di leggere contemporaneamente lunghi blocchi di queste sequenze ripetitive.

Gli studi effettuati hanno scoperto che in un tipo di sequenze ripetitive, note come duplicazioni segmentali, esistono una quantità di variazione maggiori del previsto, potenzialmente un meccanismo per l’evoluzione a lungo termine di nuove funzioni per i geni. In un altro tipo di sequenza ripetitiva, che è responsabile della costruzione delle macchine cellulari che creano nuove proteine, tuttavia, il genoma rimane notevolmente stabile. Il pangenoma ha permesso ai ricercatori di scoprire un potenziale meccanismo per il modo in cui questi segmenti chiave del DNA rimangono coerenti nel tempo.

Fonte: Nature

2