Non è facile parlare con una certa disinvoltura della storia dell’evoluzione del DNA. Questo percorso è infatti stato lungo e complesso, con innumerevoli cambiamenti.
Nel corso del tempo molte alterazioni ai genomi umani hanno avuto effetti opposti, forse a causa di un delicato equilibrio tra capacità cognitive potenziate e un rischio aumentato di disturbi psichiatrici.
Gli esseri umani e gli scimpanzé condividono il 99% del loro DNA, con le regioni accelerate umane (HAR) che sono le porzioni del genoma che mostrano una quantità sproporzionata di queste differenze. Queste HAR sono rimaste invariate nei mammiferi per millenni, ma hanno subito una rapida trasformazione nei primi esseri umani.
Gli scienziati si sono interrogati a lungo sul motivo di questi cambiamenti significativi in questi segmenti di DNA e su come distinguono gli esseri umani dagli altri primati.
DNA: il lavoro dei ricercatori del Gladstone Institutes
Recentemente, i ricercatori del Gladstone Institutes hanno condotto un’analisi di migliaia di HAR umane e di scimpanzé e hanno scoperto che un numero significativo di modifiche che si sono verificate durante l’evoluzione umana hanno avuto effetti opposti l’uno dall’altro.
La dottoressa Katie Pollard è Ph.D., direttrice del Gladstone Institute of Data Science and Biotechnology e autrice principale del nuovo studio pubblicato sulla rivista Neuron. Pollard ha spiegato che: “Questo aiuta a rispondere a una domanda di lunga data sul perché le HAR si siano evolute così rapidamente dopo essere state stabili per milioni di anni”. E ancora: “Una variazione iniziale in una HAR potrebbe aver aumentato troppo la sua attività, e quindi doveva essere abbassata”.
I risultati, dice, hanno implicazioni per la comprensione dell’evoluzione umana. Inoltre, poiché lei e il suo team hanno scoperto che molte HAR svolgono un ruolo nello sviluppo del cervello, lo studio suggerisce che le variazioni nelle HAR umani potrebbero predisporre le persone a malattie psichiatriche.
Sean Whalen, Ph.D., primo autore dello studio e senior ricercatore del personale nel laboratorio di Pollard, ha precisato: “Questi risultati hanno richiesto strumenti di apprendimento automatico all’avanguardia per integrare dozzine di nuovi set di dati generati dal nostro team, fornendo una nuova lente per esaminare l’evoluzione delle varianti HAR”.
Le caratteristiche degli HAR
Pollard ha scoperto le HAR nel 2006 confrontando i genomi umani e di scimpanzé. Mentre questi tratti di DNA sono quasi identici tra tutti gli esseri umani, differiscono tra gli esseri umani e altri mammiferi.
Il laboratorio di Pollard ha continuato a dimostrare che la stragrande maggioranza delle HAR non sono geni, ma potenziatori, regioni regolatrici del genoma che controllano l’attività dei geni. Più di recente, il gruppo di Pollard ha voluto studiare in che modo le HAR umane differiscono dagli HAR degli scimpanzé nella loro funzione potenziatrice. In passato, ciò avrebbe richiesto di testare gli HAR uno alla volta nei topi, utilizzando un sistema che colora i tessuti quando una HAR è attiva.
Invece, Whalen ha inserito centinaia di noti potenziatori del cervello umano e centinaia di altre sequenze non potenzianti in un programma per computer in modo che potesse identificare schemi che prevedevano se un dato tratto di DNA fosse un potenziatore. Quindi ha utilizzato il modello per prevedere che un terzo delle HAR controlli lo sviluppo del cervello. Whalen ha affermato: “Fondamentalmente, il computer è stato in grado di apprendere le firme dei potenziatori del cervello”.
I quesiti di Pollard e del suo team
Sapendo che ogni HAR presenta molteplici differenze tra esseri umani e scimpanzé, Pollard e il suo team si sono chiesti in che modo le singole varianti in una HAR influissero sulla sua forza potenziatrice.
Ad esempio, se otto nucleotidi di DNA differivano tra uno scimpanzé e una HAR umana, tutti e otto avevano lo stesso effetto, rendendo il potenziatore più forte o più debole?
Whalen, per rispondere ai suoi dubbi, ha quindi applicato un secondo modello di apprendimento automatico, originariamente progettato per determinare se le differenze di DNA da persona a persona influenzano l’attività del potenziatore.
Il computer ha previsto che il 43 percento delle HAR contiene due o più varianti con grandi effetti opposti: alcune varianti in un data HAR lo hanno reso un potenziatore più forte, mentre altre modifiche hanno reso l’HAR un potenziatore più debole.
Questo risultato ha sorpreso il team, che si aspettava che tutte le modifiche avrebbero spinto l’enhancer nella stessa direzione, o che alcune modifiche “autostoppiste” non avrebbero avuto alcun impatto sull’enhancer.