Unità di calcolo fotoniche per migliorare il machine learning

Studiato un nuovo approccio per eseguire i calcoli all'interno di una rete neurale, sostituendo il segnale elettrico con un segnale ottico.

0
2378
Indice

Il machine learning, tradotto in italiano con il termine apprendimento automatico, è una particolare branca dell’informatica, molto vicina all’intelligenza artificiale. In generale, possiamo dire che quando si parla di machine learning ci si riferisce a differenti meccanismi che permettono a una macchina intelligente di migliorare le proprie capacità e prestazioni nel tempo.

Uno degli approcci più popolari per lo sviluppo dell’intelligenza artificiale consiste nell’esecuzione del machine learning da parte delle reti neurali, in quanto i ricercatori si prefiggono di replicare le funzionalità del cervello per un ampio spettro di applicazioni.

In un articolo pubblicato su Applied Physics Reviews, per eseguire i processi di calcolo richiesti da una rete neurale, viene proposto un nuovo approccio, nel quale il segnale elettrico viene sostituito con un segnale luminoso. In questo particolare approccio, un’unità di processo a tensore fotonico svolge delle moltiplicazioni di matrici in parallelo, migliorando la velocità e l’efficienza degli attuali paradigmi di apprendimento profondo (deep learning).

Nel machine learning, le reti neurali vengono addestrate per imparare a eseguire delle decisioni e delle classificazioni, su dati nascosti, senza alcuna supervisione.

Dopo essere stata addestrata sui dati, una rete neurale è in grado di produrre, attraverso un processo inferenziale, il riconoscimento e la classificazione di oggetti e modelli e trovare una firma all’interno dei dati stessi.

L’unità di processo fotonica (TPU – Tensor Processing Unit) immagazzina e processa i dati in parallelo, attraverso un’interconnessione elettro-ottica, che permette alla memoria ottica di essere letta e scritta in modo più efficiente e alla TPU fotonica di interfacciarsi meglio con altre architetture.

Mario Miscuglio, uno degli autori del lavoro, afferma che le piattaforme fotoniche integrate, che integrano un’efficiente memoria ottica, possono svolgere le stesse operazioni di un’unità di processo a tensore, ma consumano meno energia, hanno una portata superiore e, se opportunamente predisposte, possono essere utilizzate per eseguire processi inferenziali alla velocità della luce.

La maggior parte delle reti neurali è composta da diversi strati di neuroni interconnessi, con lo scopo di imitare quanto più possibile il cervello umano. Un modo efficiente per rappresentare queste reti è dato da una funzione composta che moltiplica insieme matrici e vettori. Questa rappresentazione permette l’esecuzione di operazioni parallele attraverso delle architetture create specificatamente per le operazioni su vettori, come per esempio la moltiplicazione di matrici.

C’è però da considerare che, maggiore è il livello di intelligenza che si vuole raggiungere e il livello desiderato di accuratezza delle previsioni, più elevata è la complessità della rete. Questa tipologia di reti richiede un’ingente quantità di dati per lo svolgimento dei calcoli matematici e un’enorme quantità di energia per processarli.

I processori digitali attualmente disponibili per il machine learning, come le unità di elaborazione grafica e le unità di elaborazione tensoriali, presentano dei limiti nell’eseguire operazioni più complesse con maggiore accuratezza, sia per motivi legati all’energia richiesta, che per la lenta trasmissione di dati elettronici tra il processore e la memoria.

I ricercatori hanno mostrato che la TPU fotonica ha delle potenzialità 2 – 3 volte superiori rispetto a una TPU elettrica. I fotoni possono essere inoltre ideali per il calcolo di quelle reti e quei dispositivi distribuiti in nodi, che eseguono attività intelligenti, con un’alta portata, al bordo della rete (network edge), come il 5G. Ai bordi di una rete, è possibile che esistano segnali di dati sotto forma di fotoni, provenienti da videocamere di sorveglianza, sensori ottici e da altre sorgenti.

Secondo Miscuglio, i processori a tecnologia fotonica andranno a ridurre considerevolmente il consumo di energia, miglioreranno i tempi di risposta e ridurranno il traffico dei data center.

Per l’utilizzatore finale, questo si traduce in una più elevata velocità di elaborazione dei dati, in quanto un’ampia porzione di dati viene processata in una fase precedente, e quindi rimane solo una piccola parte di dati da inviare sul cloud o presso i centri di elaborazione dei dati.

Fonte: scitechdaily.com