Come bloccare i robot che addestrano l’intelligenza artificiale di Google

29/09/2023
In un post sul blog, Google ha annunciato l’integrazione di un nuovo strumento, Google-Extended, che consentirà agli amministratori dei siti web di “avere maggiore scelta e controllo su come i loro contenuti vengono utilizzati dall’intelligenza artificiale generativa”.
Concretamente, questa opzione – disponibile tramite il file robots.txt – offrirà agli editori la possibilità di determinare se i loro siti contribuiscono a migliorare le API generative del chatbot Google Bard e della piattaforma di machine learning Vertex AI.
“Fornire controlli semplici e scalabili, come Google-Extended tramite robots.txt, è un passo importante nel garantire la trasparenza e il controllo che crediamo abbiano tutti i fornitori di modelli. L’intelligenza artificiale dovrebbe essere resa disponibile”.
Un’opzione già offerta da OpenAI
Questa nuova funzionalità è simile a quella offerta da OpenAI all’inizio di settembre, pubblicando online un tutorial per bloccare il suo robot di indicizzazione integrando il codice nei file robots.txt. Ciò fa seguito alle preoccupazioni espresse sulla raccolta di dati protetti da copyright da parte del suo robot GPTBot, in vista di uno sfruttamento commerciale.
Molti media (New York Times, The Guardian, CNN, Reuters, ecc.), ma anche alcune grandi piattaforme (Amazon, Tumblr, Airbnb, ecc.) si sono impegnati a bloccare GPTBot.
Quali conseguenze per la SEO?
Se questa funzione rappresenta, per gli editori, l’opportunità di riprendere il controllo dei propri dati, numerosi contenuti sono già stati utilizzati da Google e OpenAI per addestrare i propri modelli. Un’inversione di rotta sembra ormai improbabile.
Inoltre, gli editori potrebbero trovarsi ad affrontare problemi legati agli sviluppi della ricerca online. A maggio, durante la conferenza annuale Google I/O, l’azienda californiana ha presentato la sua nuova esperienza di ricerca, dando un posto d’onore all’intelligenza artificiale. Il rifiuto dell’indicizzazione potrebbe quindi, a medio termine, avere conseguenze sulla referenziazione dei siti.