Uno studio dell’Università Bar-Ilan rivela che l’efficiente apprendimento superficiale del cervello, che coinvolge un’ampia rete con pochi strati, può competere con i modelli di apprendimento profondo multistrato in compiti di classificazione complessi dell’intelligenza artificiale. Ciò mette in discussione l’attuale progettazione delle GPU, che privilegiano le architetture profonde rispetto a quelle ampie.
Il cervello umano, nonostante la sua struttura relativamente superficiale con strati limitati, funziona in modo efficiente, mentre i moderni sistemi di intelligenza artificiale (AI) sono caratterizzati da architetture profonde con numerosi strati.
Ciò solleva la domanda: le architetture superficiali ispirate al cervello umano possono competere con le prestazioni delle architetture profonde dell’AI e, in caso affermativo, quali sono i meccanismi fondamentali che consentono ciò?
Come funziona l’intelligenza artificiale
I metodi di apprendimento della rete neurale si ispirano al funzionamento del cervello umano, ma esistono differenze fondamentali tra il modo in cui il cervello apprende e il modo in cui opera l’apprendimento profondo o intelligenza artificiale. Una distinzione fondamentale risiede nel numero di strati utilizzati da ciascuno.
I sistemi di deep learning hanno spesso molti livelli, a volte si estendono fino a centinaia, il che consente loro di apprendere in modo efficace compiti di classificazione complessi. Al contrario, il cervello umano ha una struttura molto più semplice con molti meno strati. Nonostante la sua architettura relativamente superficiale e la natura più lenta e rumorosa dei suoi processi, il cervello è straordinariamente abile nel gestire in modo efficiente compiti di classificazione complessi.
Ricerca sui meccanismi di apprendimento superficiale nel cervello
La domanda chiave che guida la nuova ricerca è il possibile meccanismo alla base dell’efficiente apprendimento superficiale del cervello umano, che gli consente di eseguire compiti di classificazione con la stessa precisione dell’apprendimento profondo. In un articolo pubblicato sulla rivista Physica A, i ricercatori dell’Università Bar-Ilan in Israele mostrano come tali meccanismi di apprendimento superficiale possano competere con l’apprendimento profondo dell’intelligenza artificiale.
“Invece di un’architettura profonda, come un grattacielo, il cervello è costituito da un’architettura ampia e poco profonda, più simile a un edificio molto ampio con solo pochissimi piani”, ha dichiarato il prof. Ido Kanter, del Dipartimento di fisica e Gonda di Bar-Ilan (Goldschmied ) Centro multidisciplinare di ricerca sul cervello, che ha guidato lo studio.
“La capacità di classificare correttamente gli oggetti aumenta laddove l’architettura diventa più profonda, con più livelli. Al contrario, il meccanismo superficiale del cervello indica che una rete più ampia classifica meglio gli oggetti”, ha affermato Ronit Gross, uno studente universitario e uno dei principali contributori di questo lavoro.
“Architetture più ampie e più elevate rappresentano due meccanismi complementari”, ha aggiunto Gross. “Tuttavia, la realizzazione di architetture molto larghe e superficiali, che imitano le dinamiche del cervello, richiede un cambiamento nelle proprietà della tecnologia GPU avanzata, che è in grado di accelerare l’architettura profonda, ma fallisce nell’implementazione di quelle larghe e superficiali”.
“Inoltre, l’architettura profonda dell’intelligenza artificiale si distingue per velocità di esecuzione, accuratezza decisionale e abilità operativa, dove i tassi di errore decadono a zero come legge di potenza, ma manca completamente della capacità di applicare significati pratici o concettuali ai vari momenti dell’esperienza”, hanno concluso i ricercatori.
Fonte: Physica A: Statistical Mechanics and its Applications