Les données Openai alimentent l'IA profonde de la Chine?

Auteur: Aaliyah Mar 12,2025

OpenAI a exprimé ses inquiétudes selon lesquelles les modèles d'IA profonde de la Chine, connus pour leur faible coût, ont peut-être été développés à l'aide des données d'OpenAI. Cette révélation, associée à l'impact du marché de Deepseek, a incité Donald Trump à l'appeler un réveil pour l'industrie de la technologie américaine. Nvidia, un acteur majeur de la technologie GPU cruciale pour l'IA, a subi un plongeon boursier historique de 16,86%, ce qui a un impact sur d'autres géants de la technologie comme Microsoft, Meta, Alphabet et Dell.

Le modèle R1 de Deepseek, construit sur l'Open-source Deepseek-V3, possède des coûts de formation nettement inférieurs (estimés à 6 millions de dollars) par rapport aux homologues occidentaux comme Chatgpt. Bien que cette affirmation soit contestée par certains, elle a soulevé des questions sur les investissements massifs réalisés par les entreprises technologiques américaines dans l'IA, les investisseurs troublants. La popularité de Deepseek a augmenté après les discussions sur son efficacité, atteignant le haut du tableau de téléchargement des applications gratuites américaines.

Bloomberg a rapporté qu'Openai et Microsoft étudient si Deepseek a exploité l'API d'Openai pour intégrer les modèles d'IA d'Openai dans ses propres. OpenAI a reconnu que les entreprises chinoises tentent fréquemment d'extraire des données de la direction des sociétés américaines de l'IA, une pratique violant les conditions d'utilisation d'OpenAI. Ils ont souligné leur engagement à protéger la propriété intellectuelle et à collaborer avec le gouvernement américain pour protéger les modèles AI avancés.

David Sacks, le tsar de l'IA du président Trump, a suggéré que des preuves indiquent que Deepseek en utilisant une technique appelée distillation - extraction de données de modèles plus grands - pour former le sien. Il prévoit que les principales sociétés d'IA mettront en œuvre des mesures pour empêcher cette pratique.

La situation met en évidence l'ironie de la position d'Openai, compte tenu des accusations précédentes de ses propres pratiques d'approvisionnement de données. Les critiques ont fait surface concernant l'utilisation par Openai du contenu Internet protégé par le droit d'auteur pour créer un chatppt. Openai lui-même a précédemment déclaré que la création d'outils d'IA comme Chatgpt sans matériel protégé par le droit d'auteur est impossible, une réclamation réitérée dans une soumission à la Chambre des Lords du Royaume-Uni. Cette position contraste fortement avec ses préoccupations actuelles concernant Deepseek.

L'utilisation du matériel protégé par le droit d'auteur dans la formation des modèles d'IA est un problème important, comme en témoignent les poursuites intentées contre Openai et Microsoft par le New York Times et 17 auteurs, dont George RR Martin. Alors qu'Openai défend ses actions comme une «utilisation équitable», ces défis juridiques soulignent le débat en cours entourant le droit d'auteur et le développement de l'IA. Une décision du bureau du droit d'auteur américain de 2018 complique encore la question en déclarant que l'art généré par l'AI ne peut pas être protégé par le droit d'auteur en raison de l'absence d'un "lien entre l'esprit humain et l'expression créative".

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov / Bloomberg via Getty Images.