Il vero costo dell’intelligenza artificiale non sono i modelli. È usarli per tutto

molte aziende stanno iniziando a scoprire un problema molto meno spettacolare, ma decisamente più concreto: usare l'intelligenza artificiale costa e non stiamo parlando del costo iniziale di adozione, né delle licenze mensili di ChatGPT, Claude o Gemini. Quello che cresce rapidamente è il costo dell'utilizzo quotidiano

By retemedia

30 Giugno 2026

0

3

Indice

Negli ultimi mesi si è parlato moltissimo dei modelli di intelligenza artificiale. Ogni nuova versione promette capacità superiori, ragionamenti più sofisticati, codice migliore, finestre di contesto sempre più grandi, una corsa impressionante, che probabilmente non rallenterà nei prossimi anni.

Nel frattempo, però, molte aziende stanno iniziando a scoprire un problema molto meno spettacolare, ma decisamente più concreto: usare l’intelligenza artificiale costa e non stiamo parlando del costo iniziale di adozione, né delle licenze mensili di ChatGPT, Claude o Gemini. Quello che cresce rapidamente è il costo dell’utilizzo quotidiano. Ogni email riassunta, ogni documento analizzato, ogni report generato, ogni richiesta fatta a un modello cloud produce un consumo di risorse che, moltiplicato per decine o centinaia di dipendenti, diventa una voce di bilancio.

Ed è qui che nasce un equivoco.

Molti interpretano questa situazione come una critica ai modelli cloud. In realtà è esattamente il contrario.

I modelli più avanzati oggi disponibili rappresentano uno strumento straordinario. Sarebbe assurdo chiedere a un piccolo modello locale di affrontare gli stessi problemi che un Claude Opus o un GPT di ultima generazione possono risolvere con maggiore accuratezza.

La domanda giusta, però, è un’altra.

Ha davvero senso utilizzare il modello più potente e più costoso per qualsiasi attività?

Se un dipendente chiede semplicemente di riassumere una riunione, classificare alcune fatture, tradurre un documento interno o scrivere una risposta standard a un cliente, probabilmente no.

In questi casi non serve il miglior modello disponibile al mondo.

Serve un modello sufficientemente bravo da svolgere quel compito in modo affidabile.

Ed è proprio questo il punto che sta cambiando rapidamente.

Fino a due anni fa i modelli open source erano poco più che una curiosità per appassionati. Oggi la situazione è completamente diversa. Modelli come Gemma, Qwen, GLM e altri stanno migliorando a una velocità sorprendente. Pur non raggiungendo ancora le prestazioni assolute dei migliori modelli proprietari in ogni ambito, sono già perfettamente adeguati per una grande quantità di attività quotidiane.

Per molte aziende questo significa una cosa molto semplice: non è necessario inviare ogni singolo documento a un servizio cloud. Una parte consistente del lavoro può essere eseguita direttamente sui computer aziendali, lasciando ai modelli cloud soltanto le richieste realmente complesse.

Questo approccio produce due effetti immediati.

Il primo è economico.

Se il modello cloud viene utilizzato solo quando rappresenta davvero un valore aggiunto, il consumo di token diminuisce drasticamente senza rinunciare allo stato dell’arte della tecnologia.

Il secondo riguarda la privacy.

Negli ultimi anni il dibattito si è concentrato soprattutto sugli aspetti normativi e sul trattamento dei dati personali. In realtà esiste anche una questione molto pratica: ogni documento che rimane all’interno dell’infrastruttura aziendale è un documento che non deve essere trasmesso all’esterno.

Naturalmente questo non significa eliminare il cloud, significa usarlo con maggiore intelligenza.

In fondo è esattamente quello che facciamo già con molte altre tecnologie. Nessuna azienda mantiene un supercomputer acceso per stampare una lettera. Allo stesso modo, non tutte le richieste rivolte a un’intelligenza artificiale richiedono necessariamente il modello più potente disponibile.

Probabilmente il futuro non sarà né completamente locale né completamente cloud.

Sarà un sistema capace di scegliere automaticamente quale modello utilizzare in base al tipo di lavoro da svolgere.

Le attività ripetitive, la ricerca nella documentazione aziendale, la generazione di report, la classificazione di documenti o il coding di routine potranno essere eseguiti localmente.

Quando invece servirà affrontare un problema particolarmente complesso, progettare un’architettura software articolata o svolgere un’attività creativa ad alto livello, il sistema potrà ricorrere ai modelli cloud più avanzati.

È una filosofia diversa da quella che ha caratterizzato i primi anni dell’intelligenza artificiale generativa.

La domanda non è più “qual è il modello migliore?”

La domanda sta diventando “qual è il modello più adatto a questo compito?”

È esattamente da questa riflessione che nasce Presence.

Presence non cerca di sostituire Claude, ChatGPT o Gemini, né avrebbe senso farlo. L’obiettivo è diverso: permettere di utilizzare modelli locali per tutto ciò che possono fare bene, integrando i modelli cloud soltanto quando il loro vantaggio giustifica realmente il costo.

In altre parole, non si tratta di scegliere tra cloud e locale.

Si tratta di combinarli in modo intelligente.

Per molte organizzazioni il vero risparmio non arriverà dall’abbandonare i servizi cloud, ma dal ridurne drasticamente l’utilizzo superfluo, mantenendo allo stesso tempo accesso alle tecnologie più avanzate quando servono davvero.

Articolo precedente

Armi storiche e collezionismo: una passione che unisce storia e tradizione

Articolo successivo

Industria plastica: perché i processi di trasformazione incidono sulle prestazioni finali

Il vero costo dell’intelligenza artificiale non sono i modelli. È usarli per tutto

Viaggi e Vacanze

Alimentazione e Salute

Giochi

Local AI & Opensource

Software

Editoriali

Attualità

Essere donna

tech News & Analysis

Antropologia

UFO, Misteri & Bufale

Informatica & Cibernetica

Guide

Category

Su di noi

FOLLOW US