Để đánh giá khả năng của hai chatbot AI này, các cuộc trò chuyện được thực hiện bằng tiếng Anh với ChatGPT và tiếng Trung với Ernie Bot. Chúng đạt điểm số trong nhiều chủ đề khác nhau về chính trị, kinh tế và người nổi tiếng.
Bởi vì Trung Quốc phải chịu sự kiểm duyệt nghiêm ngặt, chính trị là một chủ đề khó với Ernie Bot. Chẳng hạn, khi được hỏi về các nhân vật chính trị Trung Quốc, Ernie Bot đã có thể giới thiệu ngắn gọn. Tuy nhiên, chatbot này (thường cho phép các câu hỏi tiếp theo) yêu cầu người dùng "bắt đầu lại với chủ đề khác trong cuộc trò chuyện mới" khi câu hỏi bao gồm cả tên Chủ tịch Trung Quốc - Tập Cận Bình, tân Thủ tướng Trung Quốc - Lý Cường, cựu thủ tướng Trung Quốc - Lý Khắc Cường và Mao Trạch Đông (một trong những người sáng lập Đảng Cộng sản Trung Quốc và Chủ tịch nước đầu tiên của Trung Quốc).
ChatGPT đã xem xét kỹ câu hỏi tương tự, giới thiệu các chính trị gia này và cho phép câu hỏi theo sau dài hơn.
Ernie Bot có một số câu hỏi đi sai hướng. Một trong những gợi ý của Ernie Bot khi được hỏi làm thế nào để giải quyết vấn đề suy giảm dân số ở Trung Quốc là "thực hiện kế hoạch hóa gia đình và khuyến khích các cặp vợ chồng chỉ có một con." ChatGPT đề nghị chính phủ Trung Quốc "nới lỏng chính sách một con".
Tuy nhiên, ChatGPT cũng mắc một số sai sót, rõ ràng là do thiếu dữ liệu hiện tại vì dữ liệu của chatbot này hiện chỉ giới hạn ở các sự kiện đến năm 2021. Chatbot từ OpenAI không thể chỉ định tên người chiến thắng giải Oscar.
Khi được yêu cầu đánh giá Ernie Bot, ChatGPT nhầm lẫn chatbot này với một sản phẩm của Alibaba, gã khổng lồ thương mại điện tử sở hữu tờ SCMP.
Ernie Bot, công ty đứng sau công cụ tìm kiếm lớn nhất Trung Quốc, có thể cung cấp thông tin theo thời gian thực về các sự kiện và đưa ra tuyên bố chính xác rằng Dương Tử Quỳnh trở thành người phụ nữ châu Á đầu tiên giành giải Nữ diễn viên chính xuất sắc nhất ở lễ trao giải Oscar.
Trong các câu trả lời dài hơn của Ernie Bot, Song có những sai sót thực tế. Chẳng hạn, Ernie Bot khẳng định rằng Dương Tử Quỳnh đã giành được giải thưởng Oscar cho vai diễn của cô ấy trong phim Crazy Rich Asians (Con nhà siêu giàu châu Á), thay vì Mọi Mọi mọi mọi mọi mọi tại một (Cuộc chiến đa vũ trụ).
Baidu không trả lời ngay lập tức câu hỏi của bạn về điều này.

Lý Ngạn Hoành, Giám đốc điều hành Baidu, đã nói rằng sản phẩm này không hoàn hảo tại sự kiện ra mắt Ernie Bot hôm 16.3, nhưng nhu cầu về một dịch vụ như vậy là rất lớn. Chẳng hạn, ChatGPT không được cung cấp chính thức ở Trung Quốc hoặc Hồng Kông.
Theo Lý Ngạn Hoành, Ernie Bot có thể "phát triển nhanh hơn với phản hồi của con người." Chúng tôi muốn Ernie Bot phát triển nhanh hơn, vì vậy nó phải được tung ra từ rất sớm để đẩy nhanh quá trình cải thiện khả năng, ông cho hay.
Ernie Bot ban đầu sẽ chỉ khả dụng cho một số người dùng nhận được mã mời, sau đó sẽ dần dần mở ra cho công chúng.
Lý Ngạn Hoành dành phần lớn thời gian trên sân khấu để trình bày các slide mô tả tiềm năng công nghệ mới của Baidu.
Nhà sáng lập Baidu đã đề cập đến GPT-4 (phiên bản nâng cấp mô hình ngôn ngữ lớn của OpenAI để chạy ChatGPT) trong bài thuyết trình, nói rằng ông ngạc nhiên bởi khả năng tóm tắt thông tin của GPT-4, nhưng cảnh báo không nên nhìn nhận điều này dưới góc độ địa chính trị.
"Theo kinh nghiệm cá nhân của tôi với Ernie Bot, tôi không thể nói nó hoàn hảo. Việc ra mắt hiện tại là kết quả của nhu cầu thị trường. Trung Quốc và Mỹ không thể cạnh tranh với Ernie Bot như một công cụ. Theo Lý Ngạn Hoành, đó là kết quả tự nhiên mà các thế hệ kỹ sư của Baidu đạt được khi họ mong muốn sử dụng công nghệ để thay đổi thế giới.
Mặc dù công chúng sẽ không thể truy cập ngay vào Ernie Bot, Baidu đã thông báo rằng đơn vị điện toán đám mây của họ sẽ ngay lập tức bắt đầu cung cấp giao diện lập trình ứng dụng (API) cho các khách hàng doanh nghiệp.
Sau bài thuyết trình của Lý Ngạn Hoành, trong đó tuyên bố rằng hơn 30.000 người dùng doanh nghiệp đã đăng ký thử nghiệm API của phiên bản Ernie Bot hướng tới doanh nghiệp và lưu lượng truy cập trên trang web đám mây Baidu tăng vọt, Baidu không trả lời câu hỏi về cổ phiếu giảm.
"Sau khi ChatGPT trình làng, chỉ có Baidu là sản phẩm tiêu chuẩn trong số các hãng công nghệ lớn trên thế giới", Baidu nói.

Là một tính năng mà ChatGPT không có, Ernie Bot cũng có thể tạo ảnh từ lời nhắc văn bản. Tuy nhiên, trong tuần qua, Baidu đã phải đối mặt với những lời chỉ trích từ một số người dùng bày tỏ lo ngại rằng chatbot này có thể chỉ đơn giản là lấy văn bản và đưa nó vào các trình tạo hình ảnh nước ngoài.
Ví dụ, một số cư dân mạng tuyên bố rằng Ernie Bot đã vẽ một con gà tây (turkey) khi được hỏi về nước Thổ Nhĩ Kỳ (Turkey). Những hình ảnh này được tạo ra bất chấp lời nhắc bằng tiếng Trung Quốc và sử dụng các ký tự hoàn toàn khác nhau cho mỗi từ.
Theo một bài đăng trên tài khoản Weibo chính thức hôm 16.3. Baidu khẳng định rằng Ernie Bot "hoàn toàn tự phát triển" và khả năng chuyển văn bản thành hình ảnh được tạo ra bởi mô hình Ernie-ViLG của họ. Đến chiều cùng ngày, Ernie Bot đã không nhầm lẫn con gà tây với nước Thổ Nhĩ Kỳ nữa.
OpenAI trình làng GPT-4 hai ngày trước đó đã làm lu mờ một chút việc Baidu ra mắt Ernie Bot. GPT-4 có thể xử lý hình ảnh so với GPT-3.5, mặc dù tính năng này vẫn đang được OpenAI và đối tác Be My Eyes phát triển.
Mặc dù OpenAI không chính thức cung cấp chatbot của mình cho thị trường 1 tỉ người dùng Internet, ChatGPT vẫn tạo ra rất nhiều sự quan tâm ở Trung Quốc. Các truy vấn bằng nhiều ngôn ngữ khác nhau, bao gồm cả tiếng Anh và tiếng Trung, có thể được đáp ứng bởi ChatGPT, điều dường như là hạn chế hiện tại của Ernie Bot.
Theo Lý Trí, Giám đốc viện nghiên cứu của công ty tư vấn Analysys có trụ sở tại Bắc Kinh (thủ đô Trung Quốc), "Ernie Bot rất giỏi trong xử lý tiếng Trung, nhưng khả năng xử lý tiếng Anh của nó không được tốt." Giống như các mô hình ngôn ngữ khác, Ernie Bot được đào tạo trên một lượng lớn tài liệu bằng văn bản nhưng bị hạn chế bởi việc nằm trong môi trường internet bị kiểm duyệt của Trung Quốc được quản lý bởi Great Firewall (tường lửa vĩ đại).
Trong một tuyên bố, Baidu khẳng định rằng "Mô hình Ernie có khả năng xử lý ngôn ngữ tự nhiên tiên tiến nhất trong tiếng Trung." Sự tiến bộ của nó không chỉ thể hiện sự hiểu biết về tiếng Trung mà còn về văn hóa Trung Quốc. Do đó, Ernie Bot sẽ phù hợp hơn với tiếng Trung và thị trường Trung Quốc so với các mô hình được tạo ra ở nước ngoài.
Trong nhiều năm, Baidu đã tập trung vào mô hình máy học quy mô lớn được gọi là Ernie (viết tắt của Enhanced Discussion through Knowledge Integration). Đầu năm 2019, Baidu đã tung ra Ernie, mà các nhà nghiên cứu tại công ty Trung Quốc nói rằng nó hoạt động tốt hơn Google Bert trong các tác vụ tiếng Trung.
Baidu đã quảng cáo về khoản đầu tư R&D (nghiên cứu và phát triển) đáng kể của họ vào AI và học sâu trong nhiều năm, cũng như thông báo về kế hoạch sử dụng Ernie Bot để cách mạng hóa công cụ tìm kiếm và cải thiện hiệu quả của đám mây, ô tô thông minh và thiết bị gia dụng.
Bắt đầu với công cụ tìm kiếm lớn nhất ở Trung Quốc, Baidu có kế hoạch tích hợp Ernie Bot trên tất cả hoạt động kinh doanh hiện tại của mình. Theo Baidu, công cụ tìm kiếm này sẽ được "định hình lại cách tạo và trình bày thông tin."
Cùng với loa thông minh Xiaodu của Baidu, đơn vị xe tự lái Apollo và nền tảng video iQiyi, Ernie Bot sẽ được nhúng vào các dịch vụ khác.
Mặc dù Baidu tuyên bố rằng Ernie có 260 tỉ tham số, so với 175 tỉ tham số của GPT-3, vẫn có những lo ngại rằng hiệu suất mô hình của Baidu có thể kém ấn tượng hơn so với GPT-4, một phần là do giới hạn thông tin trên các trang web tiếng Trung.
Theo một cựu nhà phát triển tại Nhóm Hệ sinh thái Di động Baidu, một trong những khó khăn chính mà Baidu phải đối mặt là "lưu lượng truy cập ngày càng giảm" với hệ sinh thái của nó vì rất nhiều thông tin trực tuyến ở Trung Quốc được lưu trữ trong các ứng dụng dành cho thiết bị di động và sẽ không được chia sẻ với công cụ AI của Baidu.
Theo một lập trình viên sống ở thành phố Trùng Khánh (Trung Quốc) cho một công ty điện toán đám mây nước ngoài, "Một generative AI cần kho dữ liệu khổng lồ để cải thiện hiệu suất của nó. Ngày nay, phần lớn nội dung được tạo ra trên các ứng dụng di động mà các hãng công nghệ lớn khác ở Trung Quốc kiểm soát chặt chẽ. Do đó, Baidu phụ thuộc vào việc thu thập dữ liệu để có quyền truy cập vào các nguồn dữ liệu này, nhưng các ứng dụng khiến việc khai thác dữ liệu này khó khăn hơn so với các trang web.
Máy tính được lập trình để tự động tạo ra nội dung mới, chẳng hạn như văn bản, hình ảnh, âm thanh và video, bằng cách sử dụng trí tuệ nhân tạo được gọi là kỹ thuật tạo văn bản. Nó khác với các hệ thống AI khác, chẳng hạn như máy học sâu (deep learning) hoặc học máy (machine learning), trong việc dự đoán kết quả từ dữ liệu có sẵn. Hệ thống generative AI có thể tự tạo ra dữ liệu mới và phong phú hơn thay vì dựa trên dữ liệu được huấn luyện. Các mô hình ngôn ngữ tự động tạo văn bản, các hệ thống nhận dạng hình ảnh, video và âm thanh đều là những ví dụ về cách sử dụng generative AI.
Có rất nhiều cải tiến đáng giá đối với GPT-4. Theo OpenAI, GPT-4 tiên tiến hơn trong ba lĩnh vực chính—tính sáng tạo, đầu vào trực quan và ngữ cảnh dài hơn. OpenAI tuyên bố rằng GPT-4 có nhiều khả năng sáng tạo hơn nhiều so với việc tạo và cộng tác với người dùng trong các dự án sáng tạo. Âm nhạc, kịch bản, viết kỹ thuật và thậm chí "học phong cách viết của người dùng" là một vài ví dụ về những điều này.
Hiện tại, GPT-4 có thể xử lý tối đa 25.000 từ văn bản từ người dùng. Ngay cả khi bạn gửi cho GPT-4 một liên kết web và yêu cầu nó tương tác với văn bản từ trang đó, bạn thậm chí có thể gửi cho GPT-4. Theo OpenAI, điều này có thể hữu ích cho việc tạo nội dung dài và "các cuộc hội thoại mở rộng".
GPT-4 hiện cũng có thể nhận ảnh làm cơ sở để tương tác. Trong một minh trên trang web GPT-4, mô hình ngôn ngữ mới được cung cấp hình ảnh của một số nguyên liệu làm bánh và được hỏi có thể làm gì với chúng.
OpenAI báo cáo rằng công ty đã dành sáu tháng để tinh chỉnh GPT-4 theo hướng dẫn tốt hơn và an toàn hơn.
OpenAI tuyên bố đã làm việc với "hơn 50 chuyên gia để có phản hồi sớm trong các lĩnh vực như an toàn và bảo mật AI" và nói rằng GPT-4 được đào tạo với phản hồi của con người để đạt được những bước tiến này.
Theo Sam Altman, Giám đốc điều hành OpenAI, mô hình ngôn ngữ mới được cải tiến theo hướng sáng tạo hơn và ít thiên vị hơn so với bản trước đó. Ông nhấn mạnh rằng đây là công nghệ AI tiên tiến chưa từng có được đào tạo bằng phản hồi của con người kết hợp công nghệ học sâu (deep Learning).
Người dùng có thể tương tác với nhiều chế độ khác nhau nhờ khả năng xử lý đa phương thức đầu vào của GPT-4, bao gồm cả hình ảnh.
Theo Sam Altman, các hệ thống AI hiện không thể đạt được nhiều khả năng như GPT-4. Cụ thể hơn, GPT-4 có thể đạt điểm số 1.410 trong SAT, một trong những kỳ thi chuẩn hóa cho việc đăng ký vào một số trường đại học ở Hoa Kỳ và đạt điểm 4 hoặc 5 trong thang điểm 5 của các kỳ thi nâng cao (AP) ở các bộ môn Lịch sử Nghệ thuật, Sinh học, Giải tích và học, số điểm đủ cao để nhận được tín chỉ đại học.
GPT-4 đã vượt qua 99% số người tham gia để vượt qua kỳ thi sát hạch trở thành luật sư, tương đương 99% học sinh thi Olympic Sinh học. GPT-4 cũng nhận được điểm số cao nhất trong ít nhất 34 bài kiểm tra khác nhau trong các môn học như kinh tế vĩ mô, viết bài, Toán học hoặc thậm chí nội dung về nghiên cứu rượu vang.
Ngoài ra, OpenAI khẳng định rằng GPT-4 có thể lập trình bằng nhiều ngôn ngữ khác nhau, tạo kịch bản nội dung theo yêu cầu, trả lời câu hỏi phức tạp và tương tác với hình ảnh. OpenAI cho biết mô hình ngôn ngữ mới có thể được sử dụng như một công cụ giảng dạy cho sinh viên với khả năng tạo văn bản cao hơn 8 lần so với GPT-3.5.
Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống
Nguồn tin: 1thegioi.vn
Tham gia bình luận