La trafelata rimonta di Google sull’intelligenza artificiale

Caricamento player

Nel maggio del 2016 Google presentò Google Assistant, un assistente vocale in grado di rispondere alle domande degli utenti. Nel comunicato che annunciava il servizio Sundar Pichai, CEO di Google, scrisse che l’azienda si stava preparando al passaggio da un mondo «mobile-first» a uno «AI-first», in cui le intelligenze artificiali – come quelle usate da Google Assistant – sarebbero state al centro dell’esperienza degli utenti, prevalendo sui dispositivi mobili.

Eppure, sei anni dopo, l’azienda fu colta impreparata dal lancio di ChatGPT, il chatbot di OpenAI, presentato nel novembre del 2022. Il successo di ChatGPT sorprese in realtà anche la stessa OpenAI, che lo aveva sviluppato per dimostrare le capacità dei suoi modelli linguistici di grandi dimensioni (o LLM). Come ha spiegato il co-fondatore di OpenAI Ilya Sutskever alla rivista Technology Review, nessuno all’interno dell’azienda si aspettava molto dal chatbot, anzi: «Quando abbiamo fatto ChatGPT, non pensavo fosse un granché».

In soli due mesi, invece, ChatGPT raggiunse i cento milioni di utenti, battendo ogni record di crescita e diventando il prodotto di spicco nel settore delle AI generative. A dicembre dello stesso anno, il New York Times raccontò come l’ascesa del servizio avesse spinto i dirigenti di Google a dichiarare il «codice rosso», un livello di emergenza interna molto alto. Il rischio era che ChatGPT e chatbot simili potessero rimpiazzare la tradizionale ricerca nel web, un settore controllato dall’azienda per circa il 90%.

Oggi Google è in una situazione migliore nel campo delle AI rispetto al 2022, grazie soprattutto al chatbot Gemini, che è stato integrato nella sua suite di prodotti, tra cui Gmail e Google Docs. Per arrivare a questo punto, però, l’azienda ha attraversato un biennio particolarmente difficile, che secondo alcuni ha cambiato la sua cultura aziendale, come raccontato dall’edizione statunitense di Wired.

Tutto iniziò nel dicembre del 2022, due mesi dopo la pubblicazione di ChatGPT. Sissie Hsiao, vicepresidente di Google, ricevette il mandato di realizzare un chatbot in grado di eguagliare – se non superare – ChatGPT. I dirigenti dell’azienda le diedero cento giorni di tempo per riuscirci. Hsiao e il suo team non dovettero iniziare da zero, visto che Google aveva sviluppato LaMDA, una famiglia di LLM, già nel 2020. Dal lavoro della squadra di Hsiao nacque Bard, il nuovo chatbot dell’azienda, da cui a sua volta sarebbe stato sviluppato Gemini.

– Leggi anche: ChatGPT ha imparato a disegnare molto meglio

Fino ad allora Google aveva mantenuto un approccio molto cauto nei confronti delle AI generative, per ragioni etiche e di convenienza: nel settore si sapeva da tempo che i modelli linguistici tendevano a inventare fatti e dare risposte sbagliate (le cosiddette allucinazioni) e Google non voleva rischiare di integrarle nei suoi prodotti. C’erano poi molti dubbi e timori sugli eventuali abusi di queste nuove tecnologie, che convinsero i dirigenti a procedere con estrema cura. Anche per questo, secondo Wired, LaMDA fu a lungo «tenuto col guinzaglio corto», tanto che gli utenti potevano usarlo solo su invito.

In particolare, all’interno dell’azienda era rimasto impresso il precedente di Tay, un chatbot sviluppato da Microsoft nel 2016, in grado di generare risposte sulla base delle interazioni ricevute dal suo profilo Twitter. A causa di una campagna portata avanti da dei troll, nell’arco di appena sedici ore Tay finì per pubblicare tweet razzisti e nazisti, costringendo Microsoft a terminare l’esperimento.

Un altro vantaggio per Google, almeno a livello teorico, era il ruolo centrale che da tempo aveva nel campo della ricerca nel settore delle AI. Il Transformer, una delle tecnologie alla base dei LLM moderni, era stato sviluppato proprio da alcuni ricercatori dell’azienda, diventando uno standard per l’intero settore (lo stesso GPT di OpenAI è l’acronimo di “Generative Pre-trained Transformer”). Nonostante questo, però, alla fine del 2022 Google sembrava in ritardo e in difficoltà: il suo titolo in borsa chiuse l’anno perdendo il 39% del valore rispetto alla fine del 2021.

Il 2023 fu un anno di grossi cambiamenti per l’azienda. A gennaio, Google annunciò il taglio di circa 12 mila posti di lavoro (il 7% del totale) mentre tra i dipendenti si diffondeva il malumore, oltre che il timore che l’azienda potesse diventare «la nuova Yahoo». Per accelerare lo sviluppo delle sue AI, Google decise di unificare due delle sue divisioni più avanzate: Google Brain e DeepMind. La prima, nata nel 2011 a Mountain View, era un centro di ricerca interno a Google; mentre la seconda, azienda britannica acquisita nel 2014, è nota soprattutto per AlphaFold, l’AI che studia le forme tridimensionali delle proteine. La fusione tra le due realtà, voluta dal vicepresidente senior James Manyika, diede vita a Google DeepMind, guidata da Demis Hassabis, con l’obiettivo di rendere la ricerca più efficiente e meno dispersiva.

Nel frattempo, Hsiao e il team di Bard continuarono a lavorare. Secondo Wired, lo sviluppo del nuovo chatbot fu tanto intenso da rischiare di sovraccaricare alcuni data center dell’azienda, costringendo Google a sviluppare nuovi strumenti per gestire la domanda crescente di potenza computazionale da parte delle AI. Anche OpenAI si mosse, però, e lo fece di concerto con Microsoft, il suo principale investitore, annunciando a febbraio l’integrazione delle AI di OpenAI a Bing, il motore di ricerca di Microsoft. Per evitare un nuovo crollo in borsa, Google decise di giocare di anticipo: il giorno prima del lancio del “nuovo” Bing, Bard fu reso disponibile al pubblico per un «test limitato». In una delle dimostrazioni di Bard, però, alcuni utenti notarono un errore fattuale, che fu molto discusso online e causò una nuova perdita in borsa per l’azienda.

A preoccupare Google e i mercati fu soprattutto il fatto che il nuovo servizio di Bing fosse in grado di rispondere alle richieste degli utenti generando una risposta scritta – come ChatGPT –, oltre che con i risultati dal web, proponendo un modello alternativo a quello dei tradizionali motori di ricerca. Anche Google aveva sperimentato in questo senso con un servizio chiamato Project Magi, che però non aveva dato i risultati sperati. Il mese successivo, inoltre, OpenAI presentò un’altra novità, GPT-4, la nuova versione del suo modello linguistico, che superò di gran lunga le capacità di LaMDA e lasciò molte persone all’interno di Google «a bocca aperta», secondo la ricostruzione di Wired.

I lavori per il successore di Bard continuarono per tutto l’anno, assorbendo risorse e personale da tutta l’azienda, anche a discapito di unità che dovevano segnalare e rimuovere immagini di abusi su minori dal web. Alcuni ricercatori di Google che si occupavano di cambiamento climatico e medicina ebbero difficoltà a ottenere l’accesso ai server, sempre più utilizzati dalle AI. Anche la frequenza di pubblicazione di studi accademici da parte dell’azienda diminuì, dimostrando che Google era sempre meno disposta a condividere con l’esterno le sue scoperte nel campo.

Nelle settimane precedenti alla presentazione del nuovo servizio di intelligenza artificiale dell’azienda, Google Gemini, alcuni dipendenti sollevarono dubbi e preoccupazioni sui limiti della tecnologia e sui suoi eventuali abusi. Persino Hassabis, secondo Wired, arrivò a chiedere più tempo per considerare gli aspetti etici della questione. Dubbi e insicurezze a parte, però, la posta in gioco era troppo alta e l’azienda decise di proseguire: nel dicembre del 2023 fu presentato Google Gemini. Fin da subito l’AI si rivelò all’altezza se non superiore della concorrenza, riposizionando Google nel mercato delle AI. Gemini batté ChatGPT in 30 standard test su 32.

Anche questa presentazione però fu caratterizzata da problemi tecnici, che generarono uno scandalo politico. Nonostante la fretta imposta dall’azienda, infatti, gli sviluppatori avevano provato a limitare gli stereotipi razzisti e sessisti del chatbot, programmando l’AI affinché producesse immagini inclusive. Tuttavia, la scarsa supervisione produsse l’effetto opposto: utenti che chiesero immagini di soldati tedeschi della Seconda guerra mondiale o senatori americani dell’800 ottennero figure di persone nere o donne. L’errore innescò una polemica politica: gli ambienti conservatori accusarono Google di avere creato una «AI woke», mentre Elon Musk definì Gemini «sessista e razzista». Per contenere i danni, Google ridefinì i principi di Gemini, sottolineando che le risposte dell’AI non riflettono necessariamente le opinioni dell’azienda.

Nel corso dell’annuale conferenza dedicata agli sviluppatori, Google I/O, tenutasi nel maggio del 2024, Google presentò anche “AI Overview”, attraverso cui il motore di ricerca avrebbe iniziato a generare risposte scritte per gli utenti. Tra le novità più apprezzate ci fu NotebookLM, un servizio sperimentale in grado di generare un podcast sulla base di qualunque documento scritto. Non mancarono comunque gli incidenti: AI Overview, ad esempio, generò sin da subito risposte sbagliate e bizzarre, consigliando in un caso di mangiare «almeno una roccia al giorno». All’interno dell’azienda, questi problemi furono minimizzati e si continuò a integrare le AI in un numero crescente di servizi.

Gli investitori sembrano concordare con questo nuovo approccio di Google: il valore delle azioni di Alphabet (il gruppo che include Google, YouTube e altre proprietà) è raddoppiato rispetto al periodo successivo al lancio di ChatGPT, e Hassabis è convinto sia solo l’inizio: «Abbiamo la base di ricerca più vasta e profonda, direi, di qualsiasi organizzazione e di gran lunga», ha detto a Wired. Il nuovo clima di ottimismo e minore cautela ha spinto anche alcuni ex ricercatori a tornare a lavorare per l’azienda. Tra questi, Noam Shazeer, uno dei creatori del Transformer, che aveva lasciato Google proprio perché l’azienda tardava a rendere LaMDA disponibile a tutti.

Nei mesi scorsi Hassabis ha spesso confermato l’intenzione da parte di Google di sviluppare un’AGI (Artificial General Intelligence, o “AI forte” in italiano), un teorico livello di AI in grado di apprendere e capire qualsiasi compito intellettuale apprendibile da un essere umano. Anche Sam Altman, co-fondatore e capo di OpenAI, appare convinto di poter raggiungere questo livello. Quel che è certo è che un’eventuale evoluzione di questo tipo necessiterà di ancora più potenza computazionale, data center, energia elettrica e acqua, oltre a nuovi chip avanzati; il tutto in un settore che ancora oggi fatica a rendere sostenibile economicamente lo sviluppo e il funzionamento dei modelli linguistici.

La situazione di Google rimane particolarmente delicata, soprattutto rispetto a OpenAI, perché la diffusione delle AI Overview è destinata a cambiare la ricerca online, settore su cui Google ha fondato buona parte dei suoi affari. Secondo un’analisi di J.P. Morgan, a causa di novità simili, nei prossimi anni l’azienda potrebbe perdere un quarto delle entrate relative alle pubblicità. Anche per questo, l’esigenza di trovare al più presto un nuovo modello di business sembra essere la nuova priorità dell’azienda, che nel corso degli ultimi anni ha richiesto ritmi di lavoro incessanti ai suoi lavoratori. Lo scorso febbraio il cofondatore dell’azienda Sergey Brin ha detto ad alcuni dipendenti che lavorare per 60 ore alla settimana sarebbe «l’ideale a livello di produttività», per vincere la corsa alle intelligenze artificiali.