Anthropic cáo buộc DeepSeek, Moonshot AI và MiniMax khai thác dữ liệu từ Claude

Anthropic cáo buộc DeepSeek, Moonshot AI và MiniMax khai thác dữ liệu từ Claude

Theo Techcrunch đưa tin, Anthropic vừa công khai cáo buộc ba phòng thí nghiệm trí tuệ nhân tạo của Trung Quốc là DeepSeek, Moonshot AI và MiniMax, âm thầm lập hơn 24.000 tài khoản giả trên nền tảng Claude nhằm thu thập dữ liệu phục vụ việc huấn luyện mô hình của chính họ.

Thông qua kỹ thuật có tên "chắt lọc" (distillation), ba hãng này tổng cộng tạo ra hơn 16 triệu lượt trao đổi với Claude. Anthropic xác định các mục tiêu bị nhắm đến gồm lập luận tác nhân, khả năng sử dụng công cụ và lập trình, những năng lực được đánh giá là đặc trưng nổi bật nhất của mô hình này.

Anthropic cáo buộc DeepSeek, Moonshot AI và MiniMax khai thác dữ liệu từ Claude
Ảnh: Jonathan Raa/NurPhoto / Getty Images

Mỗi hãng tấn công theo cách riêng

Quy mô và hướng tấn công của từng công ty có sự khác biệt. DeepSeek thực hiện hơn 150.000 lượt trao đổi, tập trung khai thác logic nền tảng và cách mô hình phản hồi các câu hỏi nhạy cảm về chính sách mà không kích hoạt bộ lọc kiểm duyệt.

Moonshot AI, công ty vừa ra mắt mô hình mã nguồn mở Kimi K2.5 tháng trước, tạo ra hơn 3,4 triệu lượt trao đổi nhắm vào lập luận tác nhân, phân tích dữ liệu, phát triển tác nhân điều khiển máy tính và thị giác máy.

MiniMax là hãng tấn công với quy mô lớn nhất, lên tới 13 triệu lượt trao đổi. Đáng chú ý, Anthropic theo dõi và phát hiện MiniMax chủ động chuyển hướng gần một nửa lưu lượng truy cập sang hút dữ liệu từ phiên bản Claude mới nhất ngay thời điểm mô hình vừa được công bố.

Chắt lọc - kỹ thuật "chép bài" của làng AI

Chắt lọc vốn là phương pháp hợp lệ mà các phòng thí nghiệm dùng để tạo ra các phiên bản mô hình nhỏ hơn, rẻ hơn từ mô hình gốc của chính mình. Tuy nhiên khi áp dụng vào mô hình của đối thủ, hành động này về thực chất là sao chép trái phép. Trước Anthropic, OpenAI cũng đã gửi công văn tới các nghị sĩ Hạ viện Mỹ tố cáo DeepSeek dùng thủ thuật tương tự để sao chép sản phẩm của họ.

DeepSeek từng gây chấn động vào đầu năm 2024 khi ra mắt mô hình lập luận mã nguồn mở R1, đạt hiệu suất gần ngang các phòng thí nghiệm hàng đầu nước Mỹ nhưng với chi phí thấp hơn nhiều lần. Hiện hãng này được dự báo sắp ra mắt DeepSeek V4, theo các nguồn tin có khả năng vượt qua cả Claude lẫn ChatGPT trong lĩnh vực lập trình.

Liên quan đến tranh luận về chip AI

Vụ việc diễn ra đúng thời điểm Washington đang tranh luận gay gắt về chính sách kiểm soát xuất khẩu chip AI sang Trung Quốc. Tháng trước, chính quyền Trump chính thức cho phép Nvidia và các công ty Mỹ xuất khẩu chip cao cấp như H200 sang thị trường Trung Quốc. Nhiều nhà phân tích cho rằng quyết định này làm tăng đáng kể năng lực tính toán AI của Bắc Kinh vào thời điểm then chốt.

Anthropic lập luận rằng quy mô các cuộc tấn công chắt lọc như vừa phát hiện "đòi hỏi phải có chip cao cấp", từ đó củng cố lý do duy trì kiểm soát xuất khẩu. Hạn chế chip, theo Anthropic, vừa cản trở việc tự huấn luyện mô hình, vừa thu hẹp khả năng thực hiện các cuộc tấn công chắt lọc quy mô lớn.

Dmitri Alperovitch, Chủ tịch think-tank Silverado Policy Accelerator kiêm đồng sáng lập CrowdStrike, nói với TechCrunch: "Từ lâu đã rõ rằng một phần nguyên nhân giúp các mô hình AI Trung Quốc tiến nhanh đến từ việc đánh cắp thông qua chắt lọc các mô hình tiên phong của Mỹ. Giờ chúng ta biết điều đó là thật." Ông cho rằng đây là lý do để từ chối bán chip AI cho bất kỳ công ty nào trong số này.

Nguy cơ an ninh quốc gia

Anthropic cảnh báo mối đe dọa không dừng lại ở cuộc đua công nghệ. Các mô hình được xây dựng qua chắt lọc bất hợp pháp nhiều khả năng không giữ lại các cơ chế bảo vệ an toàn vốn có, đồng nghĩa với việc các năng lực nguy hiểm có thể lan rộng mà không còn lớp phòng thủ nào. Công ty dẫn chứng nguy cơ các chính phủ độc tài triển khai AI tiên phong cho chiến dịch tấn công mạng, tung tin sai lệch và giám sát đại trà - rủi ro này tăng lên bội phần nếu các mô hình được phát hành dưới dạng mã nguồn mở.

Anthropic cho biết sẽ tiếp tục đầu tư vào hệ thống phòng thủ giúp các cuộc tấn công chắt lọc khó thực hiện hơn và dễ bị phát hiện hơn, đồng thời kêu gọi phản ứng phối hợp từ toàn ngành AI, các nhà cung cấp điện toán đám mây và giới hoạch định chính sách.

TechCrunch cũng cho biết đã liên hệ DeepSeek, MiniMax và Moonshot AI để lấy ý kiến phản hồi nhưng chưa nhận được trả lời tính đến thời điểm đăng bài.

Theo tạp chí Điện tử và Ứng dụng

Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống

Nguồn tin:

 

Tham gia bình luận