Il Max Planck Institute ha sviluppato un nuovo sistema reti neurali ottiche, che offre un’alternativa più semplice e più efficiente dal punto di vista energetico rispetto ai metodi attuali. Questo sistema sfrutta la trasmissione della luce per eseguire calcoli, riducendo la complessità e la richiesta energetica associate alle reti neurali tradizionali.
Reti neurali ottiche
Un team di scienziati ha proposto un nuovo modo di implementare una rete neurale con un sistema ottico che potrebbe rendere l’apprendimento automatico più sostenibile in futuro. I ricercatori del Max Planck Institute for the Science of Light hanno pubblicato il loro nuovo metodo su Nature Physics, dimostrando un metodo molto più semplice rispetto agli approcci precedenti.
L’apprendimento automatico e l’intelligenza artificiale stanno diventando sempre più diffusi con applicazioni che spaziano dalla visione artificiale alla generazione di testo, come dimostrato da ChatGPT. Tuttavia, queste attività complesse richiedono reti neurali sempre più complesse, alcune con molti miliardi di parametri.
Questa rapida crescita delle dimensioni della rete neurale ha messo le tecnologie su un percorso insostenibile a causa del loro consumo energetico e dei tempi di addestramento in crescita esponenziale. Ad esempio, si stima che l’addestramento di GPT-3 abbia consumato più di 1.000 MWh di energia, che equivale al consumo di energia elettrica giornaliero di una piccola città.
Le reti neurali ottiche abbattono il consumo di energia
Questa tendenza ha creato la necessità di alternative più veloci, più efficienti in termini di energia e costi, innescando il campo in rapida evoluzione del calcolo neuromorfico. L’obiettivo di questo campo è sostituire le reti neurali sui nostri computer digitali con reti neurali ottiche. Queste sono progettate per eseguire fisicamente le operazioni matematiche richieste in un modo potenzialmente più veloce e più efficiente in termini di energia.
L’ottica e la fotonica sono piattaforme particolarmente promettenti per il calcolo neuromorfico poiché il consumo di energia può essere ridotto al minimo. I calcoli possono essere eseguiti in parallelo a velocità molto elevate, limitate solo dalla velocità della luce.
Finora tuttavia, ci sono state due sfide significative: in primo luogo, realizzare i complessi calcoli matematici necessari richiede elevate potenze laser. In secondo luogo, la mancanza di un metodo di addestramento generale efficiente per tali reti neurali ottiche.
Entrambe le sfide possono essere superate con il nuovo metodo proposto da Clara Wanjura e Florian Marquardt del Max Planck Institute for the Science of Light nel loro nuovo articolo su Nature Physics.
“Normalmente, l’input dei dati viene impresso sul campo luminoso. Tuttavia, nei nostri nuovi metodi proponiamo di imprimere l’input modificando la trasmissione della luce”, ha spiegato Florian Marquardt, Direttore dell’istituto.
In questo modo, il segnale di input può essere elaborato in modo arbitrario. Questo è vero anche se il campo luminoso stesso si comporta nel modo più semplice possibile in cui le onde interferiscono senza altrimenti influenzarsi a vicenda. Pertanto, il loro approccio consente di evitare interazioni fisiche complicate per realizzare le funzioni matematiche richieste che altrimenti richiederebbero campi luminosi ad alta potenza.
Valutare e addestrare questa rete neurale fisica diventerebbe quindi molto semplice: “Sarebbe davvero semplice come inviare luce attraverso il sistema e osservare la luce trasmessa. Questo ci consente di valutare l’output della rete. Allo stesso tempo, questo consente di misurare tutte le informazioni rilevanti per l’addestramento“, ha affermato Clara Wanjura, la prima autrice dello studio.
Gli autori hanno dimostrato tramite simulazioni che le reti neurali ottiche possono essere utilizzate per eseguire attività di classificazione delle immagini con la stessa accuratezza delle reti neurali digitali.
Conclusioni
In futuro, gli autori stanno pianificando di collaborare con gruppi sperimentali per esplorare l’implementazione delle loro reti neurali ottiche. Poiché la loro proposta allenta significativamente i requisiti sperimentali, può essere applicata a molti sistemi fisicamente molto diversi. Questo apre nuove possibilità per i dispositivi neuromorfici che consentono l’allenamento fisico su un’ampia gamma di piattaforme.