ChatGPT có thể lấy dữ liệu trực tiếp trên Internet, giao tiếp với con người bằng lời nói

TIN MỚI

Đây là thông báo mới từ OpenAI, công ty chủ quản của ChatGPT, đánh dấu dấu mốc quan trọng của phần mềm đang thu hút sự chú ý này.

Đến nay, các phản hồi mà ChatGPT đưa ra theo yêu cầu từ người dùng đều được sáng tạo dựa trên một cơ sở dữ liệu rộng lớn, không bao gồm các thông tin từ sau tháng 8/2021. Tuy nhiên, với tính năng mới, ChatGPT có thể truy cập Internet để đưa ra những phản hồi cho người dùng với những thông tin thời gian thực và có căn cứ đích xác, có cả đường dẫn (link) trực tiếp tới nguồn mà nền tảng này khai thác thông tin.

Trong bài đăng trên trang mạng xã hội X, OpenAI cũng cho biết, phản hồi của ChatGPT giờ đây không còn bó hẹp trong phạm vi thông tin trước tháng 9/2021 nữa. Bên cạnh đó, OpenAI nêu rõ tính năng mới cũng cho phép các trang web kiểm soát cách ChatGPT tương tác với trang web.

Đáng chú ý, không chỉ giao tiếp với người dùng thông qua văn bản, ChatGPT mới đây đã được bổ sung 2 tính năng mới cho phép phần mềm này có thể giao tiếp với con người thông qua lời nói.

Tính năng đầu tiên đó là cho phép người dùng có thể đặt câu hỏi bằng giọng nói, sau đó nhận về phản hồi bằng giọng nói từ chính ChatGPT. Cụ thể, mỗi khi người dùng đặt câu hỏi với ChatGPT bằng giọng nói, âm thanh sẽ được chuyển đổi thành mô hình ngôn ngữ lớn, sau đó ChatGPT sẽ đọc to câu trả lời cho người dùng thay vì chỉ hiển thị dưới dạng văn bản như trước đây. Tính năng này hoạt động tương tự như trợ lý ảo Siri trên iPhone hay Google Assistant trên điện thoại Android. Tuy nhiên, nhờ tích hợp cơ sở dữ liệu lớn hơn, các câu trả lời do ChatGPT đưa ra sẽ đầy đủ và có thể chính xác hơn.

Với tính năng này, người dùng có thể yêu cầu ChatGPT dịch trực tiếp các đoạn hội thoại từ ngôn ngữ này sang ngôn ngữ khác hay nhập câu hỏi bằng giọng nói thay vì phải mất công gõ câu hỏi dưới dạng văn bản.

Tính năng thứ hai được OpenAI tích hợp trên ChatGPT cho phép người dùng sử dụng hình ảnh để đưa ra câu hỏi, giúp người dùng có thể xác định các đối tượng thông qua hình ảnh cung cấp. Người dùng cũng có thể chụp lại những hình ảnh về các sự cố hay một lỗi nào đó trên máy tính, yêu cầu ChatGPT xác định xem lỗi gặp phải là gì và hướng dẫn cách khắc phục sự cố.

Sau khi chia sẻ hình ảnh lên ChatGPT, người dùng có thể thực hiện những cuộc hội thoại với chatbot này xung quanh nội dung của hình ảnh cho đến khi bạn nhận được thông tin cần thiết hoặc có được câu trả lời thỏa đáng.

Theo OpenAI, 2 tính năng mới sẽ sớm được triển khai cho những người dùng đã trả tiền để mua gói dịch vụ ChatGPT Plus và Enterprise. Tuy nhiên, tính năng giao tiếp bằng giọng nói sẽ chỉ hoạt động với phiên bản ứng dụng ChatGPT trên nền tảng Android và iOS. Trong khi đó, tính năng tìm kiếm bằng hình ảnh sẽ có trên cả phiên bản web của ChatGPT.

Việc bổ sung khả năng thoại và hình ảnh đưa ChatGPT tiến xa hơn trên con đường trở thành một mô hình đa phương thức thực sự, đó là một chatbot có thể 'nhìn' và 'nghe' thế giới, cũng như phản hồi bằng giọng nói và hình ảnh bên cạnh văn bản. Trong khi đó, các nhà nghiên cứu AI đánh giá mô hình đa phương thức là giai đoạn cạnh tranh tiếp theo trong lĩnh vực trí tuệ nhân tạo. Chúng dự kiến được áp dụng cho nhiều lĩnh vực trong đời sống, như trên smartphone, TV, xe hơi, loa thông minh.

OpenAI đã bắt đầu cập nhật phiên bản ChatGPT dành cho người dùng có trả phí hồi tháng 6 vừa qua nhưng đã tạm dừng sử dụng bản này sau khi người dùng tìm cách lách phí với những nội dung trên Internet. Tính năng mới có tên gọi "Browse with Bing" cũng được dành cho những người dùng có trả phí phiên bản ChatGPT Plus và các dịch vụ cung cấp cho doanh nghiệp nhưng OpenAI cho biết sẽ sớm cung cấp phiên bản này cho tất cả người dùng. Microsoft, đối tác của OpenAI, cũng đã đưa ra công cụ Bing Chat. Công cụ này tích hợp GPT-4 (mô hình ngôn ngữ được sử dụng để phát triểm ChatGPT) với công cụ tìm kiếm trên Internet, tương tự như cách đối thủ cạnh tranh Google đã làm với công cụ hội thoại Bard.

Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống