L’intelligenza artificiale (AI) ha rivoluzionato molti settori, dalla sanità alla finanza, dalla logistica all’educazione. Tuttavia, con l’avvento della seconda ondata di programmazione AI, siamo di fronte a nuove sfide e opportunità. In questo articolo esploreremo il contesto e le motivazioni dietro la nascita di questa seconda ondata, le difficoltà affrontate, le soluzioni proposte e i risultati ottenuti.
Chiedete a chi si occupa di intelligenza artificiale generativa a cosa serva attualmente questa tecnologia, cosa li entusiasma davvero e molti vi risponderanno: la programmazione.
“È qualcosa di molto entusiasmante per gli sviluppatori“, ha detto Jared Kaplan, capo scienziato di Anthropic, al MIT Technology Review questo mese: “Si tratta davvero di capire cosa c’è che non va nel codice, e di eseguirne il debug“.
Copilot, uno strumento basato sui grandi modelli linguistici di OpenAI e lanciato da GitHub supportato da Microsoft nel 2022, è ora utilizzato da milioni di sviluppatori in tutto il mondo. Milioni di altri si rivolgono a chatbot generici come Claude di Anthropic, ChatGPT di OpenAI e Gemini di Google DeepMind per un aiuto quotidiano.
“Oggi, più di un quarto di tutto il nuovo codice di Google viene generato dall’intelligenza artificiale, quindi esaminato e accettato dagli ingegneri“, ha affermato il CEO di Alphabet Sundar Pichai in una conference call sui guadagni di ottobre: ”Questo aiuta i nostri ingegneri a fare di più e muoversi più velocemente“. Ci si aspetta che altre aziende tecnologiche si mettano al passo, se non l’hanno già fatto.
Contesto e motivazioni
La prima ondata di programmazione con le Intelligenze Artificiali ha visto l’utilizzo di algoritmi di machine learning e reti neurali per compiti specifici come il riconoscimento vocale e la classificazione delle immagini. Tuttavia, con l’aumento della complessità delle applicazioni e la necessità di sviluppare sistemi AI più sofisticati, è emersa la necessità di una nuova approccio alla programmazione AI. La seconda ondata si concentra sull’automazione del processo di sviluppo di software con l’Intelligenza Artificiale, in modo da rendere più efficiente e accessibile la creazione di modelli AI complessi.
La prima generazione di assistenti di programmazione è ormai piuttosto brava a produrre codice corretto in questo senso. Addestrati su miliardi di pezzi di codice, hanno assimilato le strutture di livello superficiale di molti tipi di programmi.
Come gli assistenti AI stanno già cambiando il modo in cui viene creato il codice
Ma c’è anche il senso in cui la funzione di un programma è corretta: certo, funziona, ma fa davvero quello che volevi? È quel secondo livello di correttezza a cui mira la nuova ondata di assistenti di codifica generativa, e che cambierà davvero il modo in cui viene creato il software.
“I grandi modelli linguistici possono scrivere codice che si compila, ma potrebbero non scrivere sempre il programma che volevi“, afferma Alistair Pullen, uno dei fondatori di Cosine. “Per farlo, devi ricreare i processi di pensiero che un programmatore umano seguirebbe per ottenere quel risultato finale“.
Il problema è che i dati su cui sono stati formati la maggior parte degli assistenti di programmazione, i miliardi di pezzi di codice presi da repository online, non catturano quei processi di pensiero. Rappresentano un prodotto finito, non ciò che è stato impiegato per realizzarlo. “C’è molto codice disponibile“, afferma Kant. “Ma quei dati non rappresentano lo sviluppo del software“.
Ciò che Pullen, Kant e altri stanno scoprendo è che per costruire un modello che faccia molto di più del semplice completamento automatico, uno che possa elaborare programmi utili, testarli e correggere bug, è necessario mostrargli molto di più del semplice codice. È necessario mostrargli come è stato messo insieme quel codice.
L’obiettivo è quello di costruire modelli che non si limitino a imitare l’aspetto di un buon codice, indipendentemente dal fatto che funzioni bene o meno, ma che imitino anche il processo che produce tale codice in primo luogo.
Una delle principali difficoltà affrontate nella seconda ondata di programmazione AI è stata la complessità e l’opacità dei modelli di Intelligenza Artificiale generati. Mentre i modelli di machine learning tradizionali erano spesso interpretabili, i modelli generati da algoritmi più avanzati come le reti neurali profonde sono difficili da comprendere e interpretare. Questo ha reso difficile per gli sviluppatori diagnosticare e correggere errori nei modelli AI, limitando la loro efficacia e affidabilità.
Soluzioni proposte
Per affrontare queste sfide, sono state proposte diverse soluzioni innovative. Una di esse è l’utilizzo di tecniche di explainable Artificial Intelligence, che consentono agli sviluppatori di comprendere come i modelli AI prendono decisioni e di identificare eventuali bias o errori. Inoltre, la creazione di piattaforme di sviluppo AI più intuitive e user-friendly ha reso più semplice per gli sviluppatori creare e testare modelli di Intelligenza Artificiale complessi.
Per prima cosa devi capire da quali materiali attingere: quali sezioni della base di codice esistente, e qualsiasi altra fonte di informazioni, sono necessarie per una determinata attività di programmazione? “Il contesto è fondamentale“, afferma il fondatore di Zencoder Andrew Filev. “La prima generazione di strumenti ha fatto un pessimo lavoro sul contesto, in pratica guardavano solo le tue schede aperte. Ma il tuo repo [deposito di codice] potrebbe avere 5000 file e se ne perdevano la maggior parte“.
Cosine pensa anche che il contesto sia fondamentale. Sta raccogliendo ogni briciola di pane che riesce a trovare e le sta usando per creare un nuovo tipo di set di dati. L’azienda ha chiesto a decine di programmatori di registrare cosa stavano facendo mentre lavoravano su centinaia di diverse attività di programmazione. “Abbiamo chiesto loro di scrivere tutto“, dice Pullen: “Perché hai aperto quel file? Perché hai fatto scorrere a metà? Perché l’hai chiuso?” Hanno anche chiesto ai programmatori di annotare pezzi di codice finiti, contrassegnando sezioni che avrebbero richiesto la conoscenza di altri pezzi di codice o documentazione specifica da scrivere.
Cosine prende quindi tutte queste informazioni e genera un ampio set di dati sintetici che mappa i passaggi tipici intrapresi dai programmatori e le fonti di informazioni da cui attingono, fino a pezzi di codice finiti. Utilizzano questo set di dati per addestrare un modello a capire quale percorso di breadcrumb potrebbe essere necessario seguire per produrre un programma particolare e quindi come seguirlo.
Poolside, con sede a San Francisco, sta creando un set di dati sintetici che cattura il processo di codifica, ma si basa maggiormente su una tecnica chiamata RLCE, apprendimento per rinforzo dall’esecuzione del codice (anche Cosine la usa, ma in misura minore).
RLCE è analogo alla tecnica utilizzata per rendere i chatbot come ChatGPT dei conversatori abili, nota come RLHF, reinforcement learning from human feedback. Con RLHF, un modello viene addestrato a produrre testo più simile al tipo che i tester umani affermano di preferire. Con RLCE, un modello viene addestrato a produrre codice più simile al tipo che fa ciò che dovrebbe fare quando viene eseguito (o eseguito).
L’implementazione di queste soluzioni ha portato a risultati significativi nel campo della programmazione AI. Gli sviluppatori sono ora in grado di creare modelli AI più sofisticati e accurati, riducendo il tempo e le risorse necessari per lo sviluppo di software AI. Inoltre, l’utilizzo di modelli AI più interpretabili e affidabili ha portato a una maggiore fiducia nell’adozione di tecnologie AI in settori critici come la sanità e la sicurezza.
Conclusioni
La seconda ondata di programmazione AI ha aperto nuove prospettive e sfide nel campo dell’intelligenza artificiale. Mentre le soluzioni proposte hanno portato a risultati positivi, è importante continuare a esplorare nuove tecniche e approcci per affrontare le sfide future.
La ricerca futura dovrebbe concentrarsi sull’ottimizzazione dei modelli di iIntelligenza Artificiale esistenti, sull’identificazione e correzione dei bias nei modelli AI e sull’espansione dell’applicazione della programmazione AI a nuovi settori e applicazioni. Con una continua innovazione e collaborazione, la programmazione AI potrà continuare a guidare la trasformazione digitale e portare benefici significativi alla società.
Fonte: Questo articolo si basa su informazioni da MIT Technology Review.
Scopri di più su Home.