Ang Data ng OpenAi ay nagpapalabas ng Deepseek AI ng China?

May-akda: Aaliyah Mar 12,2025

Ang OpenAI ay nagpahayag ng mga alalahanin na ang mga modelo ng Deepseek AI ng China, na kilala sa kanilang mababang gastos, ay maaaring binuo gamit ang data ng OpenAI. Ang paghahayag na ito, kasabay ng epekto sa merkado ng Deepseek, ay hinikayat si Donald Trump na tawagan itong isang wake-up call para sa industriya ng tech ng US. Ang Nvidia, isang pangunahing manlalaro sa teknolohiya ng GPU na mahalaga para sa AI, ay nagdusa ng isang makasaysayang stock market plunge na 16.86%, na nakakaapekto sa iba pang mga higanteng tech tulad ng Microsoft, Meta, Alphabet, at Dell.

Ang modelo ng R1 ng Deepseek, na itinayo sa open-source deepseek-v3, ay ipinagmamalaki ang mas mababang mga gastos sa pagsasanay (tinatayang $ 6 milyon) kumpara sa mga katapat na kanluran tulad ng ChatGPT. Habang ang paghahabol na ito ay pinagtatalunan ng ilan, nagtaas ito ng mga katanungan tungkol sa napakalaking pamumuhunan na ginawa ng mga Amerikanong tech na kumpanya sa AI, hindi nakakagulat na mga namumuhunan. Ang katanyagan ng Deepseek ay sumulong kasunod ng mga talakayan tungkol sa pagiging epektibo nito, na umaabot sa tuktok ng tsart ng pag -download ng libreng app ng US.

Iniulat ni Bloomberg na sinisiyasat ng OpenAi at Microsoft kung ang Deepseek ay nag -leverage ng API ng OpenAi upang isama ang mga modelo ng AI ng OpenAI. Kinilala ni Openai na ang mga kumpanyang Tsino ay madalas na nagtatangkang kunin ang data mula sa nangunguna sa mga kumpanya ng AI ng US, isang kasanayan na lumalabag sa mga tuntunin ng serbisyo ng OpenAi. Binigyang diin nila ang kanilang pangako sa pagprotekta sa intelektuwal na pag -aari at pakikipagtulungan sa gobyerno ng US upang mapangalagaan ang mga advanced na modelo ng AI.

Si David Sacks, ang AI Czar ni Pangulong Trump, ay nagmungkahi ng mga katibayan na tumuturo sa Deepseek gamit ang isang pamamaraan na tinatawag na Distillation - na nakakuha ng data mula sa mas malalaking modelo - upang sanayin ang sarili nito. Inaasahan niya na ang mga nangungunang kumpanya ng AI ay magpapatupad ng mga hakbang upang maiwasan ang pagsasanay na ito.

Ang sitwasyon ay nagtatampok sa kabalintunaan ng posisyon ng OpenAi, na ibinigay ng mga nakaraang mga akusasyon ng sarili nitong mga kasanayan sa pag -sourcing ng data. Ang mga kritisismo ay lumitaw tungkol sa paggamit ng Openai ng nilalaman ng copyright na Internet sa paglikha ng CHATGPT. Nauna nang sinabi ni Openai na ang paglikha ng mga tool ng AI tulad ng ChatGPT nang walang copyright na materyal ay imposible, isang paghahabol na muling isinulat sa isang pagsumite sa House of Lords ng UK. Ang tindig na ito ay naiiba nang malaki sa kasalukuyang mga alalahanin tungkol sa Deepseek.

Ang paggamit ng copyright na materyal sa pagsasanay ng mga modelo ng AI ay isang makabuluhang isyu, tulad ng ebidensya ng mga demanda na isinampa laban sa OpenAi at Microsoft ng New York Times at 17 na may -akda, kasama na si George RR Martin. Habang ipinagtatanggol ni Openai ang mga aksyon nito bilang "patas na paggamit," ang mga ligal na hamon na ito ay binibigyang diin ang patuloy na debate na nakapaligid sa copyright at pag -unlad ng AI. Ang isang 2018 US Copyright Office na nagpasiya ay higit na kumplikado ang bagay sa pamamagitan ng pagsasabi na ang AI-generated art ay hindi maaaring ma-copyright dahil sa kakulangan ng isang "nexus sa pagitan ng pag-iisip ng tao at pagpapahayag ng malikhaing."

Inakusahan ang Deepseek na gumagamit ng modelo ng OpenAi upang sanayin ang katunggali nito gamit ang distillation. Credit ng imahe: Andrey Rudakov/Bloomberg sa pamamagitan ng mga imahe ng Getty.