L’altro giorno ho chiesto a Bing Creator, il chatbot di Microsoft in grado di creare da una semplice frase delle bellissime immagini grazie all’Intelligenza artificiale generativa (IAG da qui in avanti), di inventarsi un’immagine di Donald Trump mentre fa qualcosa di buffo. Richiesta che nella mia testa non doveva essere troppo complessa, dato lo sterminato elenco di gaffe, faccine e smorfie cui il neo ri-presidente USA negli anni ci ha abituato.
Per poco non mi ritrovo a casa CIA, FBI e una terza forza dell’ordine a scelta. Un messaggio perentorio, infatti, mi avverte che se avessi continuato a chiedere la generazione di immagini a suo dire “sensibili” avrei subito il blocco dell’account e non avrei più potuto postare richieste sul loro motore.
Benché mi prudessero le mani a tentare di sfidare il software, ho desistito, in fin dei conti mi serve, è grazie a quello che, ad esempio, creo tutte le immagini di copertina dei miei articoli qui postati.
Divertimento da nerd, penserete voi. Non proprio. Da un paio di giorni ho scoperto di non essere l’unico che sfida le AI del momento chiedendo cose delicate e “sensibili”. C’è chi, ad esempio, mosso da un sincero ardore di libertà, o da latente sadismo, vai a capire (si scherza eh…), non ha resistito e ha cominciato a chiedere a DeepSeek, la nuovissima sorprendente AI targata Pechino, di raccontargli la storia di Piazza Tienanmen, degli Uiguri e di altre porc… azioni deprecabili compiute dal PCC in decenni di potere assoluto e dispotico, ricevendo una risposta dapprima sincera e poi, una volta entrato in funzione il guard rail, una cancellazione della stessa e al suo posto una frase che suona tipo “Parliamo di altro, ti va?”. Il guard rail, come spiega Matteo Flora di Wired.it in questo post pubblicato su X, funziona come la barriera di protezione che ci impedisce di finire fuori strada. Solo che nel caso di DeepSeek a muovere le macchine è il motore generativo delle risposte e lo sbarramento è piazzato in mezzo alla strada, di traverso, se così piace al Partitissimo di Xi.
DeepSeek è un’azienda cinese nata circa due anni fa con l’intento, puramente scientifico, di sviluppare la via cinese della Seta digitale di questo inizio di Terzo Millennio, la AI appunto. Da un paio di giorni poi, la creatura di Liang Wenfeng, quarantenne già famoso in patria per aver creato il primo hedge fund che ha raggiunto i 100 miliardi di renmimbi, (se vi interessa, leggete qui), è assurta al diritto di cronaca dopo aver annunciato il suo nuovo modello di IAG chiamato in codice R1 che nei benchmark dell’azienda rivaleggia con modelli di assoluto valore in termini di prestazioni (avvicinandosi a o1, l’ultimo modello sviluppato da OpenAI e dedicato ai ragionamenti complessi) e surclassando la concorrenza in termini di costi di addestramento, sviluppo e consumi energetici.
Ecco, sono stati proprio i toni trionfalistici della superiorità dell’ingegno cinese supportati dal repentino e, fatemi dire, sospetto perché fin troppo coordinato, crollo delle azioni di giganti USA dell’AI come Nvidia, Google e Microsoft, a farmi nascere più di un dubbio su queste affermazioni.
Ad esempio, dal report di DeepSeek che presenta R1 e ne mostra le infinite meraviglie, si legge che l’addestramento del modello sarebbe costato “solo” 6 milioni di dollari. Una cifra irrisoria rispetto ai circa 100 milioni di dollari che Open AI ha dichiarato di aver speso per addestrare il suo modello di punta. Secondo l’azienda, questo eccezionale risultato in termini di saving è stato ottenuto con diversi espedienti: ricorrendo esclusivamente a software open source, impiegando chip di vecchia generazione e meno sofisticati a causa dell’embargo imposto dagli USA all’esportazione verso la Cina di processori, ottimizzando svariati design pattern (ovvero tecniche di ingegnerizzazione) di sviluppo software che hanno consentito al motore AI di girare con una frazione delle risorse impiegate da un normale modello.
Bello. Ma balle.
Innanzitutto, come spiega questo articolo di dday.it, i sei milioni non sono riferiti all’addestramento del modello di punta, ma al modello V3 della stessa azienda, molto più semplificato e quindi meno preciso e potente, che a R1 fa da base, ma che nemmeno lontanamente si avvicina alle prestazioni del suo fratello con gli steroidi.
Ma anche ammettendo che gli ingegneri cinesi abbiano fatto un capolavoro in termini ingegneristici sfruttando al meglio le parche risorse messe a loro disposizione… chi l’ha mai certificato un bilancio di DeepSeek a conferma di quanto scritto nel report?
La domanda può sembrare provocatoria, e in parte lo è (quel prurito alle mani di cui ho parlato sopra, in qualche modo dovevo sfogarlo), ma in parte si basa su una considerazione banale: il livello di trasparenza gestionale e contabile delle aziende cinesi non è quello delle aziende occidentali, ivi comprese le regole di imputazione dei costi a un progetto e se c’è una cosa che so dei paesi a trazione socialista è che non sono bravi a contare quanto sono bravi a fare.
Intendiamoci, non che in Cina non ci sia chi sappia far di conto, è che tutto deve essere visto attraverso la lente distorta della propaganda politica e quando l’obiettivo è politico, i costi per raggiungerlo diventano, improvvisamente, un aspetto meno che secondario. O, peggio, un aspetto su cui innestare altra propaganda. Insomma, sarò prevenuto io, ma quei claim mi hanno tanto ricordato il rozzo falso storico dei cosmonauti sovietici che nello spazio scrivevano tutto a matita.
Imputare tutti i costi correttamente a un progetto può sembrare ad un occhio inesperto attività banale e fine a se stessa, uno scontato Prezzo * Quantità, ma, vi assicuro, non è né l’una né l’altra.
Non è banale perché, innanzitutto, in un progetto, a maggior ragione se complesso, bisogna capire come contare quali costi, laddove i due aspetti sono intrinsecamente correlati: secoli di studi economico-aziendalistici in Occidente hanno portato alla luce decine di metodi di calcolo, dai più semplici e grossolani (come le stime parametriche) a quelli più complessi e raffinati (come l’Activity Based Costing). A scanso di equivoci, sappiate che non esiste una metodologia che vada bene per tutti i progetti e per tutte le aziende, così come impiegarne una piuttosto che un’altra può portare a risultati tra loro incongruenti anche all’interno della stessa organizzazione. Come contino i nostri amici cinesi, invece, non è dato saperlo. Ad esempio, e di nuovo è una provocazione, ma fino a un certo punto, tra i costi di sviluppo della IAG di DeepSeek sono state contate le giornate di lavoro dei millemila funzionari del PCC che hanno requisitato (termine bruttissimo strausato nel mondo IT per indicare le richieste di sviluppo software) e monitorato l’implementazione del guard rail di R1? Perché potete scommetterci l’osso del collo che il governo cinese ci ha messo lo zampino. Ancora, il software usato, dicono, è open source. Ma Open Source per un’azienda non vuol dire gratis, tanto che quasi tutti i software aperti che non siano sviluppati da community di appassionati appositamente per community di appassionati prevedono delle licenze per utilizzo personale (gratuite) e licenze per l’utilizzo commerciale (a pagamento): insomma, se con questi software ti ci vuoi arricchire devi comunque pagare. Continuando: il deploy del chatbot, gli enormi costi dell’infrastruttura hardware dei CED di DeepSeek (o i costi di consumo per l’utilizzo dell’infrastruttura Cloud) necessaria alla gestione concorrente di un numero enorme di richieste di utenti curiosi di sapere cosa ne pensa R1 di Tienanmen, ecco quei costi, come sono stati calcolati? Potrei andare avanti, ma spero il senso sia chiaro.
Non è poi fine a se stessa, perché le aziende occidentali operano su mercati concorrenziali (tranne rarissime eccezioni oligopolistiche o monopolistiche di fatto che i legislatori tendono comunque a mitigare), e questo significa che un’accurata, precisa, onesta e continua attività di monitoraggio dei costi può rappresentare il discrimine tra prendere la macchina al mattino per andare al lavoro o per doversene cercare uno nuovo. Dubito che in Cina funzioni allo stesso modo.
In conclusione, io credo che ci sia sicuramente qualcosa di vero nei proclami di DeepSeek e lungi da me sminuire degli avanzamenti ingegneristici che, se confermati, possono rappresentare un nuovo paradigma di riferimento per lo sviluppo futuro dei modelli di intelligenza artificiale anche da noi, ma esorto tutti a prendere questi supposti breakthrough tecnologici con le pinze.
“Natura non facit saltus“, diceva Leibniz, anche se per la causa sbagliata, dimostrare l’inesistenza degli atomi. Figuriamoci se riusciamo noi semplici umani a fare miracoli.