Dữ liệu Openai nhiên liệu Deepseek AI của Trung Quốc?

Tác giả: Aaliyah Mar 12,2025

Openai đã lên tiếng lo ngại rằng các mô hình AI Deepseek của Trung Quốc, được biết đến với chi phí thấp, có thể đã được phát triển bằng dữ liệu của Openai. Sự tiết lộ này, cùng với tác động thị trường của Deepseek, đã khiến Donald Trump gọi đó là một lời cảnh tỉnh cho ngành công nghệ công nghệ Hoa Kỳ. Nvidia, một người chơi chính trong công nghệ GPU quan trọng đối với AI, đã phải chịu một thị trường chứng khoán lịch sử là 16,86%, ảnh hưởng đến các đại gia công nghệ khác như Microsoft, Meta, Alphabet và Dell.

Mô hình R1 của Deepseek, được xây dựng trên Deepseek-V3 nguồn mở, tự hào có chi phí đào tạo thấp hơn đáng kể (ước tính khoảng 6 triệu đô la) so với các đối tác phương Tây như TATGPT. Mặc dù tuyên bố này bị tranh chấp bởi một số người, nó đã đặt ra câu hỏi về các khoản đầu tư lớn được thực hiện bởi các công ty công nghệ Mỹ trong AI, các nhà đầu tư đáng lo ngại. Sự phổ biến của Deepseek tăng lên sau các cuộc thảo luận về hiệu quả của nó, đạt đến đỉnh của biểu đồ tải xuống ứng dụng miễn phí của Hoa Kỳ.

Bloomberg đã báo cáo rằng Openai và Microsoft đang điều tra xem liệu Deepseek đã tận dụng API của Openai để tích hợp các mô hình AI của Openai. Openai thừa nhận rằng các công ty Trung Quốc thường cố gắng trích xuất dữ liệu từ các công ty AI hàng đầu của Mỹ, một thực tiễn vi phạm các điều khoản dịch vụ của Openai. Họ nhấn mạnh cam kết bảo vệ sở hữu trí tuệ và hợp tác với chính phủ Hoa Kỳ để bảo vệ các mô hình AI nâng cao.

David Sacks, AI của Tổng thống Trump, đã đề xuất bằng chứng chỉ ra Deepseek bằng cách sử dụng một kỹ thuật gọi là Distillation, giải phóng dữ liệu từ các mô hình lớn hơn để tự đào tạo. Ông dự đoán rằng các công ty AI dẫn đầu sẽ thực hiện các biện pháp để ngăn chặn thực tiễn này.

Tình huống làm nổi bật sự trớ trêu của vị trí của Openai, với những lời buộc tội trước đây về các thực tiễn tìm nguồn dữ liệu của chính nó. Những lời chỉ trích đã xuất hiện liên quan đến việc sử dụng nội dung Internet có bản quyền của Openai trong việc tạo ra TATGPT. Bản thân Openai trước đây đã tuyên bố rằng việc tạo ra các công cụ AI như Chatgpt mà không có tài liệu có bản quyền là không thể, một yêu sách được nhắc lại trong việc đệ trình lên Nhà lãnh chúa của Vương quốc Anh. Lập trường này tương phản mạnh mẽ với mối quan tâm hiện tại của nó về Deepseek.

Việc sử dụng tài liệu có bản quyền trong đào tạo các mô hình AI là một vấn đề quan trọng, bằng chứng là các vụ kiện được đệ trình chống lại Openai và Microsoft của New York Times và 17 tác giả, bao gồm George RR Martin. Trong khi Openai bảo vệ hành động của mình là "sử dụng công bằng", những thách thức pháp lý này nhấn mạnh cuộc tranh luận đang diễn ra xung quanh bản quyền và phát triển AI. Một văn phòng bản quyền năm 2018 của Hoa Kỳ, phán quyết làm phức tạp thêm vấn đề bằng cách tuyên bố rằng nghệ thuật do AI tạo ra không thể có bản quyền do thiếu "mối quan hệ giữa tâm trí con người và biểu hiện sáng tạo".

Deepseek bị buộc tội sử dụng mô hình Openai, để đào tạo đối thủ cạnh tranh bằng cách chưng cất. Tín dụng hình ảnh: Andrey Rudakov/Bloomberg qua Getty Images.