L’assistente di intelligenza artificiale generativa creato da DeepSeek, una startup fondata in Cina nel 2023, è salita al primo posto negli app store di tutto il mondo, superando il già noto chatbot statunitense ChatGPT di OpenAI.
Questa rapida ascesa di DeepSeek segue la sua fulminea popolarità derivata dal rilascio da parte dell’azienda cinese di una serie di modelli di intelligenza artificiale open source estremamente competitivi rispetto agli altri prodotti del settore.
Come per gli altri modelli di intelligenza artificiale generativa, DeepSeek permette di porre domande e ottenere risposte, effettuare ricerche sul web oppure utilizzare le sue capacità di ragionamento per elaborare dei risultati. Sviluppato in gran parte da neolaureati e dottorandi di alcune delle più importanti università cinesi, il modello di DeepSeek più avanzato, chiamato DeepSeek-V3, risulta essere molto più competitivo rispetto al modello proposto da OpenAI. Innanzitutto, DeepSeek ha scelto una filosofia opposta a quella di OpenAI, consentendo un uso gratuito dell’app (ChatGPT ha una versione gratuita piuttosto limitata) e rendendo disponibile il codice, dando l’opportunità a chiunque di migliorarlo e modificarlo.
Lo sviluppo di DeepSeek-V3 ha richiesto risorse economiche nettamente inferiori rispetto ai suoi competitor: è stata una diretta conseguenza delle restrizioni americane sull’esportazione di tecnologie in Cina. Le limitazioni imposte dal governo americano hanno difatti frenato l’uso massiccio di chip per le elaborazioni delle richieste degli utenti; l’intento degli statunitensi è stato quello di impedire agli sviluppatori cinesi di essere tecnologicamente competitivi in un percorso di ricerca che prevedeva un miglioramento delle prestazioni in funzione del potenziamento dei loro datacenter per l’addestramento delle IA. Non avendo risorse hardware sufficienti, DeepSeek è riuscita a ridurre i suoi consumi facendo attivare, per ogni richiesta ricevuta, solo i parametri più rilevanti per ogni singolo input.
Seguendo questa filosofia, l’addestramento di DeepSeek-V3 ha richiesto un decimo delle capacità di calcolo impiegate per allenare i modelli dei competitor, che al contrario necessitano di datacenter molto grandi con inevitabile consumo di risorse: acqua potabile per il loro raffreddamento, oltre a un consumo energetico elevatissimo. Si è stimato difatti che la domanda globale di IA potrebbe far sì che i data center risucchino da 1,1 trilioni a 1,7 trilioni di litri di acqua dolce entro il 2027 e che la domanda di elettricità dei server potrebbe essere dell’ordine di 100 terawattora all’anno, circa quanto l’intero consumo annuale di Argentina o Svezia.
Conseguenza diretta di questa filosofia è il prolungamento della vita delle centrali a gas e carbone: i combustibili fossili non sono soltanto il modo più veloce per fornire energia, ma, poiché questi impianti funzionano ventiquattro ore su ventiquattro, sette giorni su sette, non possono essere alimentati utilizzando energie rinnovabili intermittenti. Più carbone e gas significano più emissioni di carbonio e quindi un inevitabile processo di accelerazione della nostra crisi climatica.
Il presidente Trump, appena insediato, ha tuttavia annunciato lo Stargate Project che prevede un investimento di 500 miliardi di dollari destinato a potenziare data center e altre infrastrutture informatiche con l’intento di assicurare la leadership americana nello sviluppo dell’intelligenza artificiale contro la Cina. Si tratta del più grande finanziamento pubblico mai destinato a progetti di questo tipo che andrebbe a esasperare le nostre preoccupazioni sul clima e sull’ambiente che, ahinoi, la politica ci sta portando a credere inesistenti.
L’enorme interesse suscitato da questo chatbot ha inevitabilmente alimentato interrogativi e preoccupazioni sulla politica di privacy di DeepSeek, preoccupazioni legate alla raccolta di dati quali indirizzo e-mail, data di nascita, username, password, cronologia chat. Tuttavia, la raccolta di dati operata da DeepSeek è assolutamente simile a quella di altre piattaforme di IA generative, tanto che gli esperti di privacy sottolineano che è sempre meglio non rivelare informazioni sensibili o personali ai chatbot, a prescindere dalla nazionalità dei loro sviluppatori. Del resto, se non sappiamo esattamente come funzionano questi sistemi o su quali dati siano stati costruiti, siamo consapevoli che i modelli di IA generativa non sono trasparenti.
E se sapientemente padre Paolo Benanti, docente di etica e bioetica, etica della tecnologia e Artificial Intelligence, si chiede se Deepseek non sia lo Sputnik dell’intelligenza artificiale, riferendosi al lancio nello spazio del primo satellite dell’Unione Sovietica che diede l’avvio a un periodo di intensa competizione tra Russia e Stati Uniti, ci chiediamo se questo evento non simboleggi la «corsa all’IA tra Cina e Stati Uniti».
Indubbiamente, serviranno settimane, più probabilmente mesi, per capire se queste innovazioni saranno in grado di rivoluzionare il mercato dell’intelligenza artificiale. Quello che è evidente è che DeepSeek ha ribaltato i presupposti del paradigma dominante dell’IA, rifiutando i costosi compromessi imposti da un uso eccessivo di hardware e cercando metodi più efficienti ed economici.
Letture consigliate:
Paolo Benati, E se Deepseek fosse come lo Sputnik?
Matteo Wong, Sam Altman Doesn’t Actually Need Trump, The Atlantic
Karen Hao, AI Is Taking Water From the Desert, The Atlantic