Le conversazioni degli utenti con ChatGPT possono diventare pubbliche e accessibili tramite i motori di ricerca. Ciò si verifica quando le persone utilizzano le funzioni di condivisione di ChatGPT, generando un link che può essere indicizzato e trovato da chiunque utilizzi Google, Bing o altri motori di ricerca.

L’indicizzazione di Google e le conversazioni di ChatGPT condivise
Se si utilizzano i filtri dei motori di ricerca per cercare l’URL di condivisione, è possibile leggere conversazioni di sconosciuti. A volte si tratta di richieste innocue, come aiuto per un progetto di ristrutturazione, domande di astrofisica o idee per ricette. Altre volte, le conversazioni offrono uno sguardo più intimo e sorprendente nella vita delle persone.
Per esempio, si può scoprire che un utente ha chiesto a ChatGPT di riscrivere il proprio curriculum per una specifica candidatura, o che un’altra persona ha posto domande che sembrano provenire da un forum online controverso. Ci sono anche conversazioni più surreali e bizzarre, come quella in cui un utente ha chiesto se sapesse cuocere una forchetta di metallo nel microonde, portando l’intelligenza artificiale a creare una guida intitolata “Come usare un microonde senza evocare Satana: una guida per principianti”.
Per impostazione predefinita, le conversazioni non sono pubbliche. Un utente deve volutamente scegliere di creare un link di condivisione, cliccando due volte sul pulsante “condividi” e poi su “crea link”. Il servizio specifica che le informazioni personali, come il nome o le istruzioni personalizzate, rimangono private.
Il rischio per la privacy deriva dal fatto che gli utenti potrebbero non essere consapevoli che il loro link di conversazione condiviso verrà indicizzato dai motori di ricerca. Ciò rende possibile per chiunque, con una semplice ricerca, trovare e leggere la loro chat. In alcuni casi, come nel curriculum di cui abbiamo parlato, i dettagli all’interno della conversazione possono portare a scoprire l’identità dell’utente, come il suo profilo LinkedIn, compromettendo involontariamente la sua privacy.
Indicizzazione dei contenuti e condivisione di chat
L’indicizzazione dei contenuti online da parte dei motori di ricerca è una pratica comune. Un comportamento simile si osserva con i link di Google Drive, dove documenti con impostazioni di condivisione pubbliche possono essere indicizzati e comparire nei risultati di ricerca. Tuttavia, ciò avviene generalmente solo se i documenti sono collegati a siti web già attendibili e pubblicamente accessibili.
Un portavoce di OpenAI ha chiarito che le chat di ChatGPT non sono pubbliche per impostazione predefinita. L’indicizzazione di queste conversazioni è stata il risultato di un esperimento. Lo scopo era quello di testare metodi per facilitare la condivisione di conversazioni utili, mantenendo il pieno controllo da parte degli utenti. L’esperimento prevedeva che le chat potessero apparire nei risultati dei motori di ricerca solo se l’utente aveva esplicitamente acconsentito alla condivisione.
Nonostante i motori di ricerca controllino gli algoritmi che determinano quali contenuti vengono mostrati, non possono controllare cosa viene indicizzato. L’indicizzazione dipende da come i contenuti vengono resi disponibili sul web, e in questo caso, è stata una scelta di OpenAI, per l’esperimento, rendere i link di condivisione di ChatGPT visibili ai motori di ricerca.
Controllo sull’indicizzazione: una responsabilità degli editori
Il concetto che i motori di ricerca non controllino quali pagine diventano pubbliche sul web è fondamentale per comprendere il funzionamento di Internet. Come ha sottolineato un portavoce di Google, i motori di ricerca non hanno l’autorità di decidere quali contenuti debbano essere visibili o meno. La responsabilità di rendere un contenuto accessibile al pubblico e, di conseguenza, indicizzabile, ricade interamente sugli editori delle pagine web.
Gli editori, che si tratti di singole persone, aziende o organizzazioni, sono i veri custodi dei contenuti che pubblicano online. Hanno a disposizione vari strumenti per controllare la visibilità dei loro contenuti sui motori di ricerca. Una delle opzioni più comuni è l’uso del file robots.txt, che fornisce istruzioni ai crawler dei motori di ricerca, dicendo loro quali sezioni di un sito web non devono essere indicizzate.
Un altro metodo è l’uso del meta tag “noindex”, che può essere inserito nel codice HTML di una pagina specifica. Questo tag istruisce i motori di ricerca a non includere quella pagina nei loro risultati. Questo livello di controllo permette agli editori di gestire con precisione ciò che desiderano rendere pubblico, proteggendo informazioni sensibili o contenuti non destinati alla visualizzazione generale.
In questa dinamica, i motori di ricerca fungono da intermediari. Il loro compito è scansionare il web, seguire i link tra le pagine e creare un indice che permetta agli utenti di trovare rapidamente ciò che cercano. Se un editore rende una pagina accessibile pubblicamente e non utilizza gli strumenti disponibili per bloccarne l’indicizzazione, i motori di ricerca la tratteranno come qualsiasi altro contenuto pubblico, aggiungendola al loro indice e rendendola ricercabile.
Questo principio si applica a qualsiasi tipo di contenuto, che si tratti di un sito web tradizionale, di un documento condiviso su un servizio cloud, o di una conversazione generata da un’intelligenza artificiale. La decisione finale sulla visibilità, e di conseguenza sulla potenziale indicizzazione, spetta sempre a chi ha il controllo sulla pagina o sul file in questione.
Per maggiori approfondimenti, visita il sito ufficiale di OpenAI.





































