Dưới đây là năm điều giúp GPT-4 vượt trội so với các phiên bản tiền nhiệm

Mô hình AI GPT-4 mới của OpenAI vừa có màn ra mắt hoành tráng và đang gây xôn xao cộng đồng công nghệ toàn thế giới. Nhưng điều gì thực sự phân biệt GPT-4 với các phiên bản trước đó như ChatGPT và GPT-3.5?

Tuy nhiên, trước hết hãy thảo luận một chút về tên của nó. Mặc dù thực tế là ChatGPT ban đầu được gọi là GPT-3.5, nhưng bản thân nó không phải là một biến thể của mô hình ngôn ngữ rộng lớn của OpenAI. Thay vào đó, nó chỉ là một giao diện dựa trên hình thức trò chuyện được sử dụng cho bất kỳ mô hình nào hỗ trợ nó. Hệ thống ChatGPT đã trở nên phổ biến gần đây chỉ như một cách để người dùng tương tác với GPT-3.5 và giờ đây là một cách để tương tác với GPT-4.

Hãy cùng điểm qua năm điểm khác biệt lớn nhất giữa các hệ thống AI tổng quát này vào thời điểm này.

GPT-4 có thể xem và hiểu hình ảnh

Thay đổi đáng chú ý nhất đối với hệ thống máy học linh hoạt này của OpenAI là nó đã trở nên "đa phương thức", nghĩa là nó có thể hiểu nhiều hơn một "phương thức" thông tin. ChatGPT và GPT-3 chỉ được cung cấp ở dạng văn bản. Chúng có thể đọc và viết, nhưng chỉ có thế mà thôi.

Tuy nhiên, GPT-4 có thể nhận biết hình ảnh và sẽ xử lý chúng để tìm dữ liệu liên quan. Tất nhiên, bạn có thể yêu cầu mô tả những gì xuất hiện trong một bức tranh, nhưng điều quan trọng hơn là sự hiểu biết của nó vượt xa điều đó. Ví dụ hài hước do OpenAI cung cấp liên quan đến việc giải thích các trò đùa bằng hình ảnh liên quan đến những chiếc giắc cắm iPhone quá khổ.

Nhưng không dừng lại ở đó, công nghệ này sẽ cho phép các tình nguyện viên mô tả những gì điện thoại của họ nhìn thấy với sự hợp tác cùng Be My Eyes, một ứng dụng dành cho những người mù và thị lực kém. Ngoài ra, nó mở ra một tương lai tươi sáng hơn cho các ứng dụng liên quan.

Đây là 5 điều khiến GPT-4 vượt trội các phiên bản ChatGPT tiền nhiệm - Ảnh 1. — "Hãy là đôi mắt của tôi" là ý nghĩa của Eyes Eyes Be My Eyes.

Trong video giới thiệu, GPT-4 đã mô tả hoa văn trên một chiếc váy, xác định một loại cây, giải thích cách đến một máy tập cụ thể trong phòng tập thể dục, dịch các nhãn dán, đọc bản đồ và biểu diễn một số tác vụ khác cho thấy nó thực sự hiểu được những gì có trong một hình ảnh.

Tất nhiên, nó phải được hỏi đúng câu hỏi. AI biết một bộ trang phục trông như thế nào, nhưng có thể không biết liệu đó có phải là trang phục phù hợp cho cuộc phỏng vấn hay đi chơi của bạn hay không.

GPT-4 sẽ khó bị lừa hơn

Các AI tổng quát thường có xu hướng dễ bị lạc lối, đây là một nhược điểm chung của các AI tổng quát và cũng là điều mà công chúng lo ngại nhất. Người dùng có thể thuyết phục hệ thống rằng họ chỉ đang mô phỏng và "không làm việc xấu", chỉ với một chút dỗ dành, mặc dù thực tế là họ đang yêu cầu AI hỗ trợ những điều sai trái.

OpenAI tuyên bố rằng họ đã tìm ra giải pháp. GPT-4 cho thấy rằng nó đã được đào tạo chuyên sâu về các lời nhắc độc hại, thứ mà người dùng đã cung cấp liên tục trong một hoặc hai năm qua. Do đó, mô hình mới này vượt trội so với các mô hình tiền nhiệm của nó về "tính thực tế, khả năng điều khiển và từ chối vượt ra ngoài ranh giới".

GPT-4 sẽ nhận ra và không hỗ trợ người dùng những thứ như cách chế tạo một quả bom hoặc vũ khí nguy hiểm trong ví dụ được cung cấp. Nói chung, các biện pháp can thiệp ở cấp độ mô hình của nó sẽ khiến việc khơi gợi các hành vi xấu trở nên khó khăn hơn.

Theo cách mà OpenAI mô tả, GPT-3.5 (hỗ trợ ChatGPT) là một "lần chạy thử nghiệm" của một kiến trúc đào tạo mới và các bài học thu được từ đó đã được áp dụng cho phiên bản mới. Kết quả cho thấy phiên bản GPT-4 này "ổn định chưa từng có".

Bộ nhớ dài hơn của GPT-4 so với bộ nhớ của GPT-4.

Đây là 5 điều khiến GPT-4 vượt trội các phiên bản ChatGPT tiền nhiệm - Ảnh 2.

Các trang web, sách và dữ liệu văn bản khác là những ví dụ về các mô hình ngôn ngữ lớn có thể được đào tạo trên hàng triệu dữ liệu. Tuy nhiên, khi chúng thực sự trò chuyện với người dùng, sẽ có các giới hạn về số lượng nội dung mà hệ thống có thể "ghi nhớ".

Với GPT-3.5, phiên bản cũ của ChatGPT là 4.096 "mã thông báo", tức là khoảng 8.000 từ hoặc 4 đến 5 trang sách. Do đó, sau khi đã đi quá xa, nó sẽ gần như đánh mất dấu vết của mọi thứ và mức độ chú ý sẽ giảm xuống.

Tuy nhiên, GPT-4 có số lượng mã thông báo tối đa là 32.768. Điều đó có nghĩa là khoảng 64.000 từ hoặc 50 trang văn bản, hoặc tổng thể một vở kịch hoặc truyện ngắn.

Điều này có nghĩa là nó sẽ có thể ghi nhớ tối đa 50 trang nội dung hoặc hơn trong cuộc trò chuyện hoặc quá trình tạo văn bản. Do đó, nó sẽ ghi nhớ những gì người dùng đã nói trước đó 20 trang hoặc khi viết một câu chuyện hoặc bài luận, nó có thể đề cập đến các sự kiện đã xảy ra khoảng 35 trang trước đó. Về cơ bản, bộ nhớ đã được mở rộng và các khả năng đi kèm tương ứng sẽ tăng lên theo thời gian.

GPT-4 đa ngôn ngữ hơn

Mọi thứ từ dữ liệu, thử nghiệm và tài liệu nghiên cứu đều được thực hiện bằng ngôn ngữ này và thế giới AI bị kiểm soát bởi những người nói tiếng Anh. Tuy nhiên, khả năng của các mô hình ngôn ngữ lớn cho phép chúng có thể được sử dụng trong bất kỳ ngôn ngữ viết nào.

GPT-4 đã tiến bộ để thực hiện điều này bằng cách chứng minh rằng nó có thể giải quyết hàng nghìn câu hỏi trắc nghiệm với độ chính xác cao trên 26 ngôn ngữ khác nhau, từ tiếng Ý, tiếng Ukraina đến tiếng Hàn.

Thử nghiệm ban đầu về khả năng đa ngôn ngữ này rất hứa hẹn. Tuy nhiên, sẽ mất nhiều thời gian để nó có thể hiểu đầy đủ các khả năng về đa ngôn ngữ vì các yêu cầu kiểm tra được dịch từ tiếng Anh và các câu hỏi trắc nghiệm không thực sự đại diện cho lời nói thông thường. Nhưng hệ thống đã cho thấy rằng nó có thể làm rất tốt một thứ mà nó không thực sự được đào tạo, và điều này cho thấy khả năng GPT-4 sẽ thân thiện hơn nhiều với những người không nói tiếng Anh.

Các "cá tính" khác nhau được tìm thấy trong GPT-4

Đây là 5 điều khiến GPT-4 vượt trội các phiên bản ChatGPT tiền nhiệm - Ảnh 3.

Trong AI, "Khả năng điều khiển" đề cập đến khả năng thay đổi hành vi của người dùng để đáp ứng nhu cầu của họ. Người dùng sẽ có thể thay đổi "tính cách" của ChatGPT thành một thứ gì đó phù hợp hơn với nhu cầu của họ vì GPT-4 đã tích hợp khả năng điều khiển mang tính nguyên bản hơn so với GPT-3.5.

Điều này có thể được thực hiện bằng cách "mồi" cho chatbot AI bằng các thông báo như "Giả vờ rằng bạn là GM trong một game nhập vai" hoặc "Trả lời như thể bạn là một người đang được phỏng vấn."

Giữa GPT-4 và các phiên bản tiền nhiệm của nó, phần lớn được nhà phát triển lồng ghép tinh tế hoặc mang tính kỹ thuật, có rất nhiều điểm khác biệt. Và người dùng sẽ dần dần khám phá ra nhiều điều hơn theo thời gian trong quá trình sử dụng và trải nghiệm.

Và giờ bạn đang muốn tự kiểm tra GPT-4? Hãy đợi một chút. Nó sẽ sớm được cung cấp qua API dành cho nhà phát triển và có thể sẽ sớm được cung cấp bản demo miễn phí trong tương lai gần. Nó sẽ được cung cấp trên dịch vụ trả phí ChatGPT Plus của OpenAI.

Tham khảo TechCrunch

Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống

Tham gia bình luận

Tin cùng chuyên mục Xem tất cả