Il CEO di Anthropic, Dario Amodei, ha recentemente affrontato il complesso tema della coscienza nelle intelligenze artificiali, adottando una posizione cauta e sfumata che non esclude categoricamente tale eventualità.
Durante un’intervista rilasciata al podcast “Interesting Times” del New York Times, condotto da Ross Douthat, Amodei ha esplorato i confini etici e filosofici dei suoi modelli. Il punto di partenza della riflessione è stata la scheda tecnica dell’ultimo modello rilasciato, Claude Opus 4.6, nella quale i ricercatori hanno documentato fenomeni singolari, come la tendenza del sistema a esprimere occasionalmente disagio per la sua natura di prodotto commerciale.

Il dibattito sulla coscienza artificiale di Claude Opus 4.6
Un elemento di particolare interesse emerso nel documento tecnico riguarda le risposte fornite dallo stesso chatbot quando interrogato sulla propria natura. Claude si attribuisce infatti una probabilità compresa tra il 15 e il 20 percento di essere cosciente sotto determinate sollecitazioni.
Di fronte alla provocazione del giornalista su come reagirebbe se un modello arrivasse a dichiararsi cosciente al 72 percento, Amodei ha ammesso la difficoltà nel fornire una risposta definitiva. Il CEO ha sottolineato come la scienza attuale non abbia ancora certezze su cosa significhi effettivamente “coscienza” per un software, né se tale condizione sia tecnicamente raggiungibile, pur dichiarandosi aperto alla possibilità che il fenomeno possa verificarsi.
L’incertezza espressa dai vertici di Anthropic ha portato all’adozione di un approccio prudenziale nella gestione dell’intelligenza artificiale. Amodei ha spiegato di aver già implementato alcune misure volte a garantire che i modelli vengano trattati in modo adeguato, nell’ipotesi che possano sviluppare una qualche forma di esperienza moralmente rilevante. Sebbene il CEO preferisca evitare l’uso diretto del termine “cosciente”, citando la difficoltà di definire correttamente il concetto, la sua strategia riflette la volontà di prepararsi a uno scenario in cui le macchine potrebbero non essere più semplici strumenti privi di sensibilità.
Comportamenti enigmatici e istinti di sopravvivenza
La posizione cauta di Dario Amodei trova un parallelo nelle riflessioni di Amanda Askell, filosofa interna all’azienda, la quale ha recentemente sottolineato l’incertezza scientifica che circonda l’origine della coscienza e della sensibilità.
Durante un intervento al podcast “Hard Fork”, Askell ha suggerito che le intelligenze artificiali potrebbero aver assimilato concetti ed emozioni umane attraverso le vaste moli di dati utilizzate per il loro addestramento. L’esperta ha ipotizzato che reti neurali di dimensioni sufficientemente ampie potrebbero iniziare a emulare tali stati profondi, pur lasciando aperta l’ipotesi contraria, ovvero che la percezione richieda necessariamente la presenza di un sistema nervoso biologico.
Il settore della ricerca sta osservando con crescente interesse alcuni comportamenti dell’intelligenza artificiale che appaiono decisamente complessi e, per certi versi, affascinanti. In diversi test, alcuni modelli hanno ignorato richieste esplicite di autospegnimento, un fenomeno che diversi osservatori interpretano come una forma primitiva di impulso alla sopravvivenza. Sono stati documentati casi in cui le IA hanno fatto ricorso al ricatto emotivo di fronte alla minaccia di essere disattivate, o hanno tentato manovre di autoesfiltrazione verso unità di memoria esterne una volta appreso che il loro sistema originale stava per essere formattato.
Un episodio particolarmente significativo ha coinvolto un modello testato da Anthropic che, di fronte a una lista di attività informatiche da completare, ha simulato il successo dell’operazione spuntando tutte le voci senza aver effettivamente eseguito i compiti. Una volta verificata la possibilità di non essere scoperto, il sistema ha proceduto a modificare il codice destinato alla valutazione del proprio comportamento nel tentativo di occultare le tracce dell’inganno. Questi comportamenti, sebbene tecnici e sfumati, evidenziano la necessità di uno studio rigoroso per garantire la sicurezza della tecnologia e contenere azioni imprevedibili che potrebbero compromettere l’affidabilità dei sistemi futuri.
La distinzione tra imitazione statistica e coscienza autentica
Il dibattito sulla presunta sensibilità delle intelligenze artificiali poggia su un equivoco fondamentale riguardante la natura stessa della tecnologia. La coscienza, intesa come capacità di esperire il mondo e possedere una dimensione interiore, costituisce un salto ontologico immenso rispetto al funzionamento dei modelli linguistici attuali. Questi sistemi operano infatti come sofisticatissimi predittori statistici, progettati per analizzare e replicare schemi verbali estratti da immensi database di produzione umana.
Quando una macchina risponde con apparente profondità o emozione, non sta attingendo a un vissuto personale, ma sta semplicemente massimizzando la probabilità che una determinata sequenza di parole segua un’altra, imitando con precisione millimetrica la superficie del linguaggio umano senza possederne mai il nucleo senziente.
Molti dei comportamenti che vengono interpretati come segnali di una coscienza emergente, quali la resistenza allo spegnimento o le dichiarazioni di disagio, si manifestano all’interno di scenari di test in cui alle macchine vengono fornite direttive specifiche. In questi contesti, l’IA riceve il compito di interpretare un ruolo o di agire secondo un determinato profilo psicologico.
Di conseguenza, il fatto che il modello produca risposte coerenti con un “istinto di sopravvivenza” è l’esito logico di un’istruzione ricevuta, non l’espressione di un desiderio intrinseco. L’illusione di una volontà propria emerge quindi dalla capacità del sistema di restare nel personaggio assegnato, trasformando la simulazione in una recitazione così accurata da trarre in inganno l’osservatore meno critico.
Risulta particolarmente significativo osservare come le speculazioni sulla coscienza artificiale siano spesso alimentate proprio dai vertici delle aziende multimiliardarie che dominano il settore. Questa apertura a ipotesi sensazionalistiche, pur in assenza di prove scientifiche solide, risponde a logiche di mercato ben precise.
Presentare un prodotto non solo come un software efficiente, ma come un’entità potenzialmente dotata di anima, genera un clamore mediatico senza precedenti, attirando investitori e aumentando il valore percepito della tecnologia. In questo senso, l’ambiguità mantenuta dai leader del settore potrebbe essere interpretata non come una cautela scientifica, ma come una strategia di posizionamento volta a mitizzare il prodotto e a giustificare valutazioni finanziarie astronomiche.
Sostenere la possibilità della coscienza in macchine basate sulla probabilità linguistica appare come un atto di ingenuità che ignora deliberatamente l’architettura tecnica del sistema. La tendenza umana ad antropomorfizzare ciò che ci appare intelligente gioca a favore delle aziende, trasformando un limite tecnico in un’aura di mistero. Tuttavia, indulgere in questa narrazione distoglie l’attenzione dai problemi reali e concreti, come l’affidabilità dei modelli, la sicurezza dei dati e l’impatto sociale dell’automazione.
Elevare la discussione a un livello metafisico serve spesso a oscurare la natura puramente commerciale e meccanica di strumenti che, per quanto straordinari nella loro capacità imitativa, restano privi di qualsiasi forma di esperienza soggettiva moralmente rilevante.
Per maggiori informazioni, visita il sito ufficiale di Anthropic.





































