Huawei phủ nhận sao chép mô hình AI của Alibaba

Huawei phủ nhận sao chép mô hình AI của Alibaba

Chú thích ảnh
Biểu tượng Huawei. Ảnh: AFP/TTXVN

Bộ phận có tên Noah Ark Lab đã đưa ra tuyên bố trên vào cuối tuần trước sau khi một thực thể có tên HonestAGI đăng tải một bài báo bằng tiếng Anh trên nền tảng chia sẻ mã nguồn Github, nói rằng mô hình Pangu Pro Moe (Mixture of Experts) của Huawei có "sự tương quan bất thường" với mô hình Qwen 2.5 14B của Alibaba. Bài báo cho rằng điều này cho thấy mô hình của Huawei được tạo ra thông qua việc “nâng cấp và tái sử dụng” (upcycling) và không được huấn luyện từ đầu.

Những thông tin trên đã gây ra các cuộc thảo luận rộng rãi trong giới AI và trên các phương tiện truyền thông của Trung Quốc.

Trong tuyên bố, Noah Ark Lab cho biết mô hình này "không dựa trên việc huấn luyện bổ sung từ các mô hình của nhà sản xuất khác". Họ khẳng định đã thực hiện những đổi mới quan trọng trong thiết kế kiến trúc và các tính năng kỹ thuật, cho hay đây là mô hình quy mô lớn đầu tiên được xây dựng hoàn toàn trên chip Ascend của Huawei.

Bộ phận này cũng cho biết đội ngũ phát triển của họ đã tuân thủ nghiêm ngặt các yêu cầu về giấy phép nguồn mở đối với bất kỳ mã nguồn bên thứ ba nào được sử dụng, nhưng không nói rõ họ đã tham khảo những mô hình nguồn mở nào.

Việc ra mắt mô hình nguồn mở R1 của công ty khởi nghiệp (startup) DeepSeek vào tháng 1/2025 đã gây chấn động Thung lũng Silicon với chi phí thấp và hiệu suất tương đương những mô hình đắt tiền khác. Đồng thời, DeepSeek cũng châm ngòi cho một cuộc cạnh tranh khốc liệt giữa các “gã khổng lồ” công nghệ của Trung Quốc về phát triển các sản phẩm AI giá cả cạnh tranh.

Qwen 2.5-14B được phát hành vào tháng 5/2024, là một trong những mô hình nhỏ thuộc dòng Qwen 2.5 của Alibaba. Mô hình này có thể được triển khai cả trên máy tính cá nhân (PC) và điện thoại thông minh.

Trong khi Qwen hướng đến người tiêu dùng phổ thông và có các dịch vụ tương tự như ChatGPT, các mô hình Pangu của Huawei có xu hướng được sử dụng nhiều hơn trong hoạt động chính phủ cũng như các lĩnh vực tài chính và sản xuất.

Mặc dù Huawei đã sớm gia nhập sân chơi mô hình ngôn ngữ lớn với việc ra mắt Pangu ban đầu vào năm 2021, hãng này sau đó được cho là đã tụt hậu so với các đối thủ. Huawei đã mở nguồn các mô hình Pangu Pro Moe của mình trên nền tảng nhà phát triển Trung Quốc GitCode vào cuối tháng Sáu. Mục tiêu là thúc đẩy việc áp dụng công nghệ AI của Huawei bằng cách cung cấp quyền truy cập miễn phí những mô hình này cho các nhà phát triển.

Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống

Nguồn tin:

 

Tham gia bình luận