Chủ tịch iFlytek: Mô hình ngôn ngữ lớn Spark 3.0 vượt trội GPT-3.5 của OpenAI ở Trung Quốc

 

iFlytek ra mắt mô hình ngôn ngữ lớn Spark 3.0 lần đầu tiên vào tháng 5 và phát hành ra công chúng vào tháng 9 sau khi có sự chấp thuận của chính phủ Trung Quốc.

"Spark 3.0 đã vượt trội GPT-3.5 ở các khả năng như tạo văn bản, lý luận logic, toán học và mã hóa, đồng thời sẽ được đặt ngang hàng với GPT- 4 vào nửa đầu năm 2024”, Chủ tịch iFlytek - Liu Qingfeng tuyên bố.

Spark 3.0 (phiên bản thứ tư kể từ lần phát hành đầu tiên) cũng đạt điểm gần bằng GPT-3.5 khi thực hiện 48 nhiệm vụ trong ngữ cảnh tiếng Anh, Liu Qingfeng cho biết tại một sự kiện của iFlytek hôm 24.10 tại Hợp Phì, thành phố quê hương của công ty ở tỉnh An Huy phía đông Trung Quốc.

Với việc ChatGPT và các chatbot trí tuệ nhân tạo (AI) đối thủ như Google Bard vẫn chưa chính thức có mặt ở Trung Quốc hay Hồng Kông, các hãng công nghệ lớn Trung Quốc như gã khổng lồ tìm kiếm internet Baidu và đại gia thương mại điện tử Alibaba đang nỗ lực phát triển đối thủ cạnh tranh để bắt kịp Mỹ.

Tuần trước, Baidu tiết lộ Ernie Bot 4, phiên bản cập nhật của sản phẩm giống ChatGPT ra mắt lần đầu tiên vào tháng 3, và cho biết nó mạnh mẽ như GPT-4. Sự phát triển trong lĩnh vực này tiếp nối từ việc Huawei ra mắt smartphone Mate 60 Pro hỗ trợ 5G vào cuối tháng 8. Mate 60 Pro sử dụng chip Kirin 9000s mạnh mẽ được sản xuất ở Trung Quốc bất chấp các lệnh trừng phạt thương mại của Mỹ.

Tuy nhiên, bất chấp những tiến bộ này, Chủ tịch iFlytek cho biết mô hình ngôn ngữ lớn trong nước vẫn có “khoảng cách thực sự” với GPT-4. Ông hy vọng sẽ thách thức mô hình ngôn ngữ lớn do OpenAI phát triển trong nửa đầu năm 2024.

Cổ phiếu iFlytek đã giảm 10% tại thành phố Thâm Quyến xuống còn 46,7 nhân dân tệ (6,4 USD) vào ngày 24.10 trong bối cảnh cổ phiếu công nghệ Trung Quốc suy yếu.

Các hãng công nghệ và nhà sản xuất chip lớn của Trung Quốc đang vật lộn với những quy tắc xuất khẩu được cập nhật của Mỹ vào ngày 7.10, với những hạn chế mới ngăn nước này tiếp cận các chip tiên tiến hỗ trợ việc đào tạo các thuật toán AI - vốn là nền tảng của mô hình ngôn ngữ lớn.

Liu Qingfeng cho biết tất cả mã cho iFlytek Spark 3.0 đều được phát triển trên “nền tảng điện toán nội địa” và họ đang hợp tác với Huawei để đào tạo các phiên bản mô hình ngôn ngữ lớn trong tương lai dựa trên hệ sinh thái chip AI của gã khổng lồ viễn thông này.

Liu Qingfeng nói mô hình Spark 3.0 đã được thử nghiệm trong nhiều trường hợp sử dụng thực tế, gồm cả việc giúp đỡ nhân viên tại Đại hội Thể thao châu Á (ASIAD 19) được tổ chức tại thành phố Hàng Châu hồi tháng 9 và tháng 10 để nâng cao hiệu quả, bằng cách tạo danh sách tổng hợp và việc cần làm cho các hội nghị trực tuyến.

Ông cho biết iFlytek và Huawei đã thành lập một “đội lực lượng đặc biệt chung” ở thành phố Hợp Phì, thủ phủ tỉnh An Huy, để đào tạo các thuật toán cho mô hình ngôn ngữ lớn. Theo Liu Qingfeng, hiệu quả đào tạo của mô hình ngôn ngữ lớn này đã tăng gấp đôi trong vòng 6 tháng.

Khi iFlytek bị đưa vào danh sách thực thể (danh sách đen thương mại) của Mỹ ba năm trước, người đầu tiên tôi tìm đến là ông Xu”, Liu Qingfeng thổ lộ, đề cập đến Eric Xu Zhijun - Chủ tịch luân phiên của Huawei, người cũng có mặt tại sự kiện hôm 24.10.

Ngoài ra, iFlytek cũng đã công bố hàng chục mô hình ngôn ngữ lớn dành riêng cho ngành, trong đó có nhiều lĩnh vực như tài chính, ô tô, dịch vụ pháp lý và viễn thông.

chu-tich-iflytek-mo-hinh-ngon-ngu-lon-spark-30-vuot-troi-gpt-35-cua-openai.jpg
iFlytek cho biết mô hình ngôn ngữ lớn của họ hoạt động tốt hơn GPT-3.5 ở Trung Quốc - Ảnh: Weibo

Cuộc chiến trăm mô hình ngôn ngữ lớn của Trung Quốc sắp thay đổi vì áp lực chi phí tăng

Cơn sốt generative AI của Trung Quốc đã dẫn đến hàng loạt thông báo về sản phẩm từ các công ty khởi nghiệp và gã khổng lồ công nghệ gần như hàng ngày, nhưng các nhà đầu tư đang cảnh báo một sự thay đổi sắp xảy ra khi áp lực chi phí và lợi nhuận tăng lên.

Sự phấn khích ở Trung Quốc lần đầu tiên được khơi dậy bởi thành công của ChatGPT gần một năm trước, đã dẫn đến điều mà một lãnh đạo cấp cao Tencent mô tả trong tháng này là “cuộc chiến của một trăm mô hình”, khi các đối thủ từ Baidu đến Alibaba và Huawei đua nhau quảng bá các sản phẩm của họ.

Theo công ty môi giới CLSA, Trung Quốc hiện có ít nhất 130 mô hình ngôn ngữ lớn, chiếm 40% tổng số toàn cầu và chỉ sau con số 50% của Mỹ. Ngoài ra, các công ty cũng đã công bố hàng chục mô hình ngôn ngữ lớn theo ngành liên kết với mô hình cốt lõi của họ. Tuy nhiên, các nhà đầu tư và nhà phân tích nói rằng hầu hết vẫn chưa tìm được mô hình kinh doanh khả thi, quá giống nhau và đang phải vật lộn với chi phí tăng cao.

Căng thẳng Trung – Mỹ cũng đè nặng lên lĩnh vực này, khi các quỹ đầu tư ít hơn vào các dự án giai đoạn đầu và khó khăn trong việc có được chip AI do những công ty như Nvidia sản xuất bắt đầu ảnh hưởng.

Esme Pau, người đứng đầu bộ phận nghiên cứu tài sản kỹ thuật số và internet Trung Quốc tại tập đoàn tài chính Macquarie Group, cho biết: “Chỉ những người có năng lực mạnh nhất mới tồn tại được”.

Bà nói thêm rằng một số công ty hàng đầu đã phát tín hiệu rằng sẽ cạnh tranh về giá để giành thị phần, giống như các dịch vụ đám mây như của Alibaba và Tencent từng làm.

Esme Pau nhận định: “Trong 6-12 tháng tới, mô hình ngôn ngữ lớn có khả năng thấp hơn sẽ dần bị loại bỏ do hạn chế về chip, chi phí cao và cạnh tranh gay gắt”.

Ý kiến về việc công ty nào sẽ tồn tại rất khác nhau.

Yuan Hongwei, Chủ tịch của quỹ đầu tư mạo hiểm Z&Y Capital (có trụ sở tại thành phố Thâm Quyến, Trung Quốc), cho biết bà tin rằng chỉ có hai đến ba mô hình ngôn ngữ lớn đa năng sẽ thống trị thị trường. Đó là lý do tại sao Z&Y Capital tìm kiếm những người sáng lập có kinh nghiệm khi quyết định đầu tư vào công ty khởi nghiệp nào.

Từng đầu tư vào nhà sản xuất máy bay không người lái DJI và công ty khởi nghiệp lái xe tự động Pony.ai, Z&Y Capital cuối cùng quyết định ủng hộ Baichuan Intelligence. Đây là một công ty mới thành lập được 5 tháng đang tìm cách xây dựng một mô hình AI nguồn mở để cạnh tranh với Llama 2 của Meta Platform.

Baichuan Intelligence được thành lập bởi Wang Xiaochuan, người sáng lập Sogou - công cụ tìm kiếm internet số 2 Trung Quốc, và trở thành 1 trong 5 công ty đầu tiên nhận được sự chấp thuận của Trung Quốc để phát hành chatbot công khai vào cuối tháng 8. Wang Xiaochuan cho biết Baichuan Intelligence đang trên đà hoàn tất vòng gọi vốn thứ hai trị giá 1 tỉ USD.

Chúng tôi nhìn thấy một cơ hội ở đây. Bản thân Wang đang chỉ đạo dự án này. Với sự hiểu biết về kinh doanh kỹ thuật số, thành công của ông với Sogou và cách ông thu hút sự chú ý của toàn ngành, chúng tôi nghĩ rằng đây là lựa chọn tốt nhất", Yuan Hongwei lý giải.

Một số doanh nhân và nhà quản lý công nghệ tên tuổi khác đứng đằng sau các công ty khởi nghiệp AI mới của Trung Quốc, chẳng hạn như Kai-Fu Lee (cựu Chủ tịch Google Trung Quốc) và Yan Juejie (cựu Phó chủ tịch của SenseTime).

Những người khác cho rằng các hãng công nghệ lớn nhất Trung Quốc như Alibaba, Tencent và Baidu cuối cùng đã có khởi đầu thuận lợi nhất và nguồn vốn dồi dào để thành công nhờ cơ sở người dùng lớn lẫn nhiều dịch vụ đa dạng. Chẳng hạn, họ có thể dễ dàng cung cấp các dịch vụ generative AI dưới dạng một phần bổ trợ bổ sung cho người dùng đám mây của mình.

Tony Tung, Giám đốc điều hành của công ty Gobi Partners GBA, cho biết: “Những gã khổng lồ công nghệ đã thừa hưởng một ưu thế không công bằng từ hầu hết các tình huống kinh doanh dễ dàng trong các hệ sinh thái đã được thiết lập của họ”.

Tony Tung nói thêm rằng một số nhà đầu tư hối tiếc khi đầu tư sớm vào các công ty mô hình ngôn ngữ lớn khi sự phấn khích về AI đạt đỉnh vào đầu năm nay. Nhiều công ty khởi nghiệp như vậy đang gặp khó khăn trong việc xây dựng các trường hợp kinh doanh mạnh mẽ và hiện tìm cách hợp tác với những gã khổng lồ công nghệ để tìm ra cách sử dụng sản phẩm hoặc có khả năng bán cho họ.

Mục tiêu của việc xây dựng các trường hợp kinh doanh mạnh mẽ là thuyết phục người đầu tư, đối tác hoặc bất kỳ bên nào có liên quan rằng ý tưởng hoặc sản phẩm này có tiềm năng để thành công và tạo ra giá trị kinh doanh.

Ông nói: “Nhiều hãng cuối cùng đã phát triển các mô hình ngôn ngữ lớn tương tự, đang tìm kiếm các vấn đề tương tự để giải quyết, bằng sự đổi mới vi mô trong kỹ thuật xử lý dữ liệu hoặc kiến trúc mô hình. Tại thời điểm đặc biệt này, các nhà đầu tư chắc chắn đã tỉnh táo hơn một chút so với đầu năm nay”.

Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống