I dati aperti alimenta l'IA Deepseek di China?

Autore: Aaliyah Mar 12,2025

Openi ha espresso preoccupazione per il fatto che i modelli di AI Deepseek della Cina, noti per il loro basso costo, potrebbero essere stati sviluppati utilizzando i dati di Openi. Questa rivelazione, unita all'impatto del mercato di Deepseek, ha spinto Donald Trump a definirlo un campanello d'allarme per l'industria tecnologica americana. Nvidia, uno dei principali attori della tecnologia GPU cruciale per l'IA, ha subito un tuffo storico del mercato del 16,86%, incidendo su altri giganti tecnologici come Microsoft, Meta, Alphabet e Dell.

Il modello R1 di DeepSeek, basato sull'apertura open source Deepseek-V3, vanta costi di allenamento significativamente più bassi (stimati in $ 6 milioni) rispetto alle controparti occidentali come Chatgpt. Mentre questa affermazione è contestata da alcuni, ha sollevato domande sugli enormi investimenti fatti dalle società tecnologiche americane in AI, inquietanti investitori. La popolarità di DeepSeek è aumentata a seguito di discussioni sulla sua efficacia, raggiungendo il top della tabella di download di app gratuite statunitensi.

Bloomberg ha riferito che Openai e Microsoft stanno studiando se Deepseek ha sfruttato l'API di Opens per integrare i modelli AI di Openai. Openai ha riconosciuto che le società cinesi tentano spesso di estrarre dati dalle principali società di intelligenza artificiale statunitense, una pratica che viola i termini di servizio di Openai. Hanno sottolineato il loro impegno a proteggere la proprietà intellettuale e collaborare con il governo degli Stati Uniti per salvaguardare i modelli AI avanzati.

David Sacks, lo zar di AI del presidente Trump, ha suggerito che prove indicano DeepSeek usando una tecnica chiamata Distillazione - estrarre dati da modelli più grandi - per addestrare i propri. Prevede che le principali aziende di intelligenza artificiale implementeranno misure per prevenire questa pratica.

La situazione evidenzia l'ironia della posizione di Openi, date le precedenti accuse delle proprie pratiche di approvvigionamento di dati. Le critiche sono emerse per quanto riguarda l'uso di Openai di contenuti Internet protetti da copyright nella creazione di CHATGPT. Openai stessa aveva precedentemente affermato che la creazione di strumenti di intelligenza artificiale come CHATGPT senza materiale protetto da copyright è impossibile, una richiesta ribadita in una sottomissione alla House of Lords del Regno Unito. Questa posizione contrasta bruscamente con le sue attuali preoccupazioni per DeepSeek.

L'uso di materiale protetto da copyright nella formazione di modelli di intelligenza artificiale è un problema significativo, come dimostra le cause intentate contro Openai e Microsoft dal New York Times e 17 autori, tra cui George RR Martin. Mentre Openai difende le sue azioni come "uso equo", queste sfide legali sottolineano il dibattito in corso che circonda il copyright e lo sviluppo dell'IA. Un uffici di copyright degli Stati Uniti del 2018 che governa ulteriormente la questione affermando che l'arte generata dall'AI non può essere protetto da copyright a causa della mancanza di un "nesso tra la mente umana e l'espressione creativa".

DeepSeek è accusato di usare il modello di Openi per addestrare il suo concorrente usando la distillazione. Credito di immagine: Andrey Rudakov/Bloomberg tramite Getty Images.