Các chuyên trang AI đánh giá đối thủ cạnh tranh với ChatGPT từ Meta vừa rò rỉ trực tuyến

Các chuyên trang AI đánh giá đối thủ cạnh tranh với ChatGPT từ Meta vừa rò rỉ trực tuyến

Phần mềm cốt lõi của AI mới, LlaMA, được phát hành vào ngày 24.2, theo Meta Platforms. Khi các hãng công nghệ lớn đổ xô tích hợp công nghệ này vào các sản phẩm của họ, gây ấn tượng với các nhà đầu tư, điều này làm nóng cuộc chạy đua AI.

Với việc công ty khởi nghiệp OpenAI (Mỹ) được Microsoft hậu thuẫn ra mắt ChatGPT vào cuối năm 2022, các đối thủ nặng ký trong lĩnh vực công nghệ từ Alphabet đến Baidu (Trung Quốc) đã tung ra các dịch vụ riêng. Cuộc chiến để thống trị không gian công nghệ AI đã chính thức bắt đầu vào cuối năm 2022.

Theo thông báo trên blog của công ty, LlaMA (Large Language Model Meta AI) sẽ được Meta Platforms cấp giấy phép phi thương mại cho các nhà nghiên cứu và các tổ chức liên kết với chính phủ, xã hội dân sự và học viện.

Để tóm tắt thông tin và tạo nội dung, các mô hình ngôn ngữ lớn sử dụng rất nhiều văn bản. Chẳng hạn, chúng có thể giải quyết các truy vấn bằng văn bản như thể chúng được viết bởi con người.

LlaMA, mô hình mà Meta Platforms tuyên bố rằng yêu cầu sức mạnh tính toán ít hơn nhiều so với các dịch vụ trước đó, được đào tạo trên 20 ngôn ngữ và tập trung vào những ngôn ngữ có bảng chữ cái Latinh và Cyrillic.

Theo Meta Platforms, công ty mẹ của Facebook, LLaMA có thể vượt qua các đối thủ về nhiều tham số hoặc biến số hơn mà thuật toán tính đến.

Theo công ty, một phiên bản LLaMA với 13 tỉ tham số có thể hoạt động tốt hơn GPT-3, phiên bản tiền thân gần đây của mô hình mà ChatGPT được xây dựng.

Theo Meta Platforms, mô hình LLaMA 65 tỉ tham số của mình "cạnh tranh" với Chinchilla70B và PaLM-540B của Google, thậm chí còn lớn hơn mô hình mà Google từng sử dụng để giới thiệu công cụ tìm kiếm được trang bị chatbot Bard.

Theo người phát ngôn Meta Platforms, số lượng lớn dữ liệu "sạch hơn" và "cải tiến kiến trúc" trong mô hình, giúp cải thiện tính ổn định của đào tạo, là nguyên nhân của hiệu suất đạt được.

Sau đó, Meta Platforms chỉ cho phép các nhà nghiên cứu truy cập vào ứng dụng AI này để "duy trì tính toàn vẹn và ngăn chặn việc lạm dụng."

Tuyên bố ban đầu của Meta Platforms cho biết: "Chúng tôi sẽ phát hành mô hình của mình theo giấy phép phi thương mại tập trung vào các trường hợp sử dụng nghiên cứu cùng quyền truy cập mô hình sẽ được cấp cho từng trường hợp cụ thể cho các nhà nghiên cứu hàn lâm để duy trì tính toàn vẹn và ngăn chặn việc lạm dụng.".

Tuy nhiên, thông qua diễn đàn trực tuyến 4Chan, ai đó vừa làm rò rỉ mô hình ngôn ngữ lớn của Meta Platforms. Các nhà phát triển đã sử dụng thử chatbot này sau vụ rò rỉ và nhận ra một số điều.

Với khả năng tạo ra các phản hồi giống như con người cho các câu hỏi và đề xuất, Meta Platforms hiện nay tạo ra người bạn đồng hành cho chúng ta trong không gian mạng tương tự như ChatGPT và Google Bard.

Theo The Neuron (bản tin AI phổ biến), các nhà thử nghiệm sớm cho biết rằng LLaMA không tốt bằng các mô hình điều khiển ChatGPT. Điều này chủ yếu là do ChatGPT hướng con người vào trò chuyện, còn LLaMA không được đào tạo như vậy.

Một nhà phát triển hỏi: "Có ai biết cách bắt đầu với LLaMA không?". 

Các nhà phát triển nhanh chóng sử dụng mã của Meta Platforms để giới thiệu ChatLLaMA, được mô tả là có quy trình đào tạo nhanh hơn 15 lần so với ChatGPT, trên trang web nổi tiếng Github, một nền tảng khác cũng phát hành mã nguồn LLaMA.

Sau khi phát hiện vụ rò rỉ, Meta Platforms đã gửi thông báo yêu cầu gỡ xuống tới Hugging Face, viện dẫn các vấn đề pháp lý.

doi-thu-canh-tranh-voi-chatgpt-cua-meta-ro-ri-truc-tuyen1.jpg
LLaMa đã được Mark Zuckerberg phát hành cho một số nhà nghiên cứu hạn chế vào tháng 2, nhưng nó đã bị rò rỉ.

Theo Yann LeCun, Giám đốc khoa học AI của Meta Platforms, LLaMA là một mô hình AI nhỏ hơn, sử dụng ít thông số hơn so với các đối thủ nhưng sẽ mạnh không kém, nếu không muốn nói là hơn, so với các mô hình ngôn ngữ hàng đầu khác.

ChatGPT và Google Bard được đào tạo theo định luật tỷ lệ, chứng minh rằng mô hình có quyền truy cập càng nhiều tham số thì kết quả càng tốt. Tuy nhiên, một bài viết được phát hành vào tháng trước bởi các nhà nghiên cứu AI từ Meta Platforms cho biết: "Một mô hình nhỏ hơn được đào tạo lâu hơn cuối cùng sẽ rẻ hơn khi suy luận, mặc dù có thể rẻ hơn (đòi hỏi ít tài nguyên hơn - PV) khi đào tạo mô hình lớn để đạt được một mức hiệu suất nhất định.".

Trong công nghệ AI, thuật ngữ suy luận (inference) mô tả cách mà mô hình AI có thể sử dụng dữ liệu được đào tạo để hiểu dữ liệu mới chưa từng được tiếp xúc trước đó. Điều này cho phép AI có khả năng ra quyết định và tiến hóa hiểu biết của nó khi được cung cấp dữ liệu mới trong ứng dụng.

The De-Coder (hãng tin AI) tuyên bố rằng giải pháp thay thế ChatGPT của Meta Platforms "nhỏ gọn hơn, nhanh hơn và thậm chí còn được cho là ngang bằng với mô hình PaLM-E của Google".

PaLM-E của Google kết hợp ngôn ngữ, lời nói và robotic (lĩnh vực khoa học kỹ thuật liên quan đến thiết kế, xây dựng, xây dựng, vận hành và sử dụng robot), nhưng vẫn chưa được phát hành.

Mô hình ngôn ngữ lớn OPT-175B, cũng nhắm đến các nhà nghiên cứu, được phát hành bởi Meta Platforms vào tháng 5 năm 2022 và là nền tảng cho một phiên bản chatbot BlenderBot hoàn toàn mới. Sau đó, Meta Platforms đã giới thiệu mô hình Galactica, có thể viết các bài báo khoa học và giải các bài toán, nhưng đã nhanh chóng gỡ bỏ bản demo sau khi nó tạo ra các phản hồi sai nhưng có vẻ đáng tin cậy.

Đối với người dùng ở Mỹ, Meta Platforms đã phát hành BlenderBot 3 vào tháng 8.2022. Công cụ này có khả năng tìm kiếm trên Internet để nói về các chủ đề khác nhau. Nếu người dùng nhận được câu trả lời lạc đề hoặc câu trả lời không thực tế từ BlenderBot 3, họ có thể phản hồi với Meta Platforms.

Để cho phép chatbot này học cách thực hiện các cuộc thảo luận tự nhiên về nhiều chủ đề khác nhau, Meta Platforms khuyến khích người lớn tương tác với BlenderBot 3 bằng "các cuộc trò chuyện tự nhiên về các chủ đề quan tâm".

Vài ngày sau khi ra mắt công chúng, chatbot AI của Meta Platforms chê bai Giám đốc điều hành Mark Zuckerberg, tuyên bố rằng ông Donald Trump đã thắng cuộc bầu cử Tổng thống Mỹ năm 2020 và lặp lại các thuyết âm mưu bài Do Thái.

Các cuộc trò chuyện với BlenderBot được chia sẻ trên nhiều tài khoản mạng xã hội khác nhau, từ hài hước đến xúc phạm.

Mô hình ngôn ngữ lớn là gì?

Kể từ khi OpenAI phát hành ChatGPT vào tháng 11 và nhận được khoản đầu tư từ Microsoft với số tiền 10 tỷ USD (8,3 tỷ bảng Anh), mô hình ngôn ngữ lớn (LLM) đã thu hút sự chú ý của các phương tiện truyền thông đại chúng trên toàn cầu.

Ứng dụng tiêu dùng phát triển nhanh nhất trong lịch sử là ChatGPT, hiện có hơn 100 triệu người dùng. Theo Microsoft, công nghệ mới sẽ hoạt động với người dùng như bạn đồng hành khi họ điều hướng trang web.

Thông qua một loạt tập dữ liệu lớn, chỉ trong vài giây, mô hình ngôn ngữ lớn cho phép AI tạo nội dung theo yêu cầu.

Những công cụ generative AI này có thể tạo ra haiku (thơ đặc biệt của Nhật Bản), truyện cười, email cho công ty, kế hoạch kinh doanh, sửa mã máy tính, viết bài luận học thuật và thậm chí là tiểu thuyết gốc theo phong cách của bất kỳ nhà văn nào bạn muốn, từ Joyce và Dostoyevsky cho đến Shakespeare.

Máy tính được lập trình để tự động tạo ra nội dung mới, chẳng hạn như văn bản, hình ảnh, âm thanh và video, trong một loại trí tuệ nhân tạo được gọi là hệ thống phân tích hợp tác. Nó khác với các hệ thống AI khác, chẳng hạn như máy học sâu (deep learning) hoặc học máy (machine learning), trong việc dự đoán kết quả từ dữ liệu có sẵn. Hệ thống generative AI có thể tự tạo ra dữ liệu mới và phong phú hơn thay vì dựa trên dữ liệu được huấn luyện. Các mô hình ngôn ngữ tự động tạo văn bản, các hệ thống nhận dạng hình ảnh, video và âm thanh đều là những ví dụ về cách sử dụng generative AI.

Để cải tiến công cụ tìm kiếm của họ, Microsoft và Google đang cạnh tranh để tạo ra các mô hình ngôn ngữ lớn nhất.

Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống

Nguồn tin:

 

Tham gia bình luận