Il progetto “Enciclopedia degli elementi del DNA” (ENCODE) è uno sforzo mondiale per capire come funziona il genoma umano. Con il completamento della sua ultima fase, il Progetto ENCODE ha aggiunto milioni di “switch” di DNA candidati dai genomi umani e di topo che sembrano regolare quando e dove sono attivati i geni, e un nuovo registro che assegna una parte di questi switch di DNA a utili categorie biologiche. Il progetto offre anche nuovi strumenti di visualizzazione come assistenza nell’uso dei grandi set di dati di ENCODE.
Gli ultimi risultati del progetto sono stati pubblicati su Nature, accompagnati da 13 ulteriori approfondimenti pubblicati su altre importanti riviste. ENCODE è finanziato dal National Human Genome Research Institute, parte del National Institutes of Health.
“Una delle principali priorità di ENCODE 3 era lo sviluppo di mezzi per condividere i dati delle migliaia di esperimenti ENCODE con la più ampia comunità di ricerca per aiutare ad espandere la nostra comprensione di come funziona il genoma“, ha dichiarato il direttore NHGRI Eric Green, MD, Ph.D. “Gli strumenti di ricerca e visualizzazione ENCODE 3 rendono accessibili questi dati, facendo avanzare gli studi di scienza condivisa“.
Per valutare le potenziali funzioni delle diverse regioni del DNA, i ricercatori ENCODE hanno studiato i processi biochimici che sono tipicamente associati agli interruttori che regolano i geni. Questo approccio biochimico è un modo efficace per esplorare l’intero genoma in modo rapido e completo. Questo metodo aiuta a localizzare regioni nel DNA che sono “elementi funzionali candidati” – regioni del DNA che si prevede siano elementi funzionali basati su queste proprietà biochimiche. I candidati possono quindi essere testati in ulteriori esperimenti per identificare e caratterizzare i loro ruoli funzionali nella regolazione genica.
“Una sfida chiave in ENCODE è che diversi geni e regioni funzionali sono attivi in diversi tipi di cellule“, ha affermato Elise Feingold, Ph.D., consulente scientifica per l’implementazione strategica nella Divisione di Scienze del genoma presso NHGRI e una guida su ENCODE per l’istituto. “Ciò significa che dobbiamo testare un numero ampio e diversificato di campioni biologici per lavorare verso un catalogo di candidati elementi funzionali nel genoma“.
Sono stati compiuti progressi significativi nella caratterizzazione dei geni codificanti le proteine, che comprendono meno del 2% del genoma umano. I ricercatori sanno molto meno del restante 98% del genoma, compreso quanto e quali parti di esso svolgono altre funzioni. ENCODE sta contribuendo a colmare questa significativa lacuna di conoscenza.
Il corpo umano è composto da trilioni di cellule, con migliaia di tipi di cellule. Mentre tutte queste cellule condividono un insieme comune di istruzioni sul DNA, i diversi tipi di cellule (ad es. Cuore, polmone e cervello) svolgono funzioni distinte usando le informazioni codificate nel DNA in modo diverso. Le regioni del DNA che agiscono come interruttori per accendere o spegnere i geni o ottimizzare i livelli esatti di attività genica, aiutano a guidare la formazione di diversi tipi di cellule nel corpo e governano il loro funzionamento in salute e malattia.
Durante la terza fase recentemente completata di ENCODE, i ricercatori hanno eseguito quasi 6.000 esperimenti –– 4.834 nell’uomo e 1.158 nei topi –– per illuminare i dettagli dei geni e dei loro potenziali regolatori nei rispettivi genomi.
I ricercatori di ENCODE 3 hanno studiato lo sviluppo di tessuti embrionali di topo per comprendere la linea temporale di vari cambiamenti genomici e biochimici che si verificano durante lo sviluppo del topo. I topi, a causa della loro somiglianza genomica e biologica con gli umani, possono aiutare a informare la nostra comprensione della biologia e delle malattie umane.
Questi esperimenti su esseri umani e topi sono stati condotti in diversi contesti biologici. I ricercatori hanno analizzato il modo in cui le modificazioni chimiche del DNA, delle proteine che si legano al DNA e dell’RNA (una molecola sorella del DNA) interagiscono per regolare i geni. I risultati di ENCODE 3 aiutano anche a spiegare come le variazioni nelle sequenze di DNA al di fuori delle regioni che codificano le proteine possono influenzare l’espressione dei geni, anche i geni situati molto lontano da una specifica variante stessa.
“I dati generati in ENCODE 3 aumentano notevolmente la nostra comprensione del genoma umano“, ha affermato Brenton Graveley, Ph.D., professore e presidente del Dipartimento di Genetica e Scienze del Genoma presso UCONN Health. “Il progetto ha aggiunto un’enorme risoluzione e chiarezza per i precedenti tipi di dati, come proteine leganti il DNA e segni di cromatina, e nuovi tipi di dati, come interazioni a lungo raggio del DNA e interazioni proteina-RNA“.
Come nuova funzionalità, i ricercatori di ENCODE 3 hanno creato una risorsa che dettaglia i diversi tipi di regioni del DNA e le loro corrispondenti funzioni candidate. Uno strumento basato sul web chiamato SCREEN consente agli utenti di visualizzare i dati a supporto di queste interpretazioni.
Il progetto ENCODE è iniziato nel 2003 ed è un vasto sforzo di ricerca collaborativa che coinvolge gruppi negli Stati Uniti e a livello internazionale, che comprende oltre 500 scienziati con diverse competenze. Ha beneficiato e costruito su decenni di ricerche sulla regolazione genica condotte da ricercatori indipendenti in tutto il mondo. I ricercatori di ENCODE hanno creato una risorsa della comunità, garantendo che i dati del progetto siano accessibili a qualsiasi ricercatore per i propri studi. Questi sforzi nella scienza aperta hanno portato a oltre 2.000 pubblicazioni di ricercatori non ENCODE che hanno utilizzato i dati generati dal progetto ENCODE.
“Ciò dimostra che l’enciclopedia è ampiamente utilizzata, che è ciò a cui avevamo sempre mirato“, ha affermato il dottor Feingold. “Molte di queste pubblicazioni sono correlate alle malattie umane, attestando il valore della risorsa per mettere in relazione le conoscenze biologiche di base con la ricerca sulla salute”.