Kết hợp Bing chatbot và ChatGPT làm những điều siêu phàm trong 30 phút

Để thực hiện dự án kinh doanh trong một thử nghiệm mà ông ghi lại trên Substack của mình, Ethan Mollick, giáo sư phụ trách chuyên ngành quản lý tại Trường Wharton thuộc Đại học Pennsylvania (Mỹ), đã sử dụng hai công cụ chatbot AI, ChatGPT của OpenAI và Bing phiên bản mới của Microsoft. Tiếp thị sự ra mắt của một game giáo dục là nhiệm vụ cụ thể.

Nền tảng dịch vụ đăng ký bản tin (newsletter) cho các tác giả, nhà báo và các nội dung sáng tạo khác là Substack. Substack cho phép các tác giả tạo và phát hành bản tin hàng tuần hoặc hàng tháng để chia sẻ kiến thức, ý tưởng và nội dung mới với cộng đồng người đọc quan tâm đến chủ đề của họ.

"Những gì hai chatbot AI đạt được là siêu phàm. Trong 30 phút, chúng đã tiến hành nghiên cứu thị trường, tạo tài liệu định vị, viết email chiến dịch, tạo trang web, logo và đồ "hero shot", thiết kế chiến dịch truyền thông xã hội cho nhiều nền tảng khác nhau, viết kịch bản và tạo video, theo Ethan Mollick trong bài đăng của anh ấy.

Hình ảnh, video hoặc đoạn phim quảng cáo của sản phẩm được chụp hoặc quay từ góc độ tốt nhất để tạo ấn tượng mạnh về sản phẩm đó được gọi là "ảnh thu nhỏ" trong lĩnh vực quảng cáo và truyền thông.
"Hero shot" graphic là hình ảnh đại diện hoặc banner được sử dụng để trình bày sản phẩm, dịch vụ hoặc nội dung trang web theo cách nổi bật và hấp dẫn. Nó thường được đặt ở vị trí nổi bật trên trang web để thu hút sự chú ý của người dùng và thuyết phục họ tiếp tục duyệt trang hoặc tìm hiểu về sản phẩm hoặc dịch vụ được trình bày. "Ho shot" graphic, một thành phần quan trọng của chiến lược tiếp thị trực tuyến, hỗ trợ các doanh nghiệp thu hút được sự chú ý của khách hàng nhanh chóng và hiệu quả.

Trước tiên, Ethan Mollick yêu cầu Bing tìm kiếm các game giáo dục cần thiết để tự học về sản phẩm. Sau đó, ông yêu cầu Bing tạo một chiến dịch tiếp thị qua email để quảng cáo trò chơi. Chỉ trong 2 phút 40 giây, Bing đã tạo ra 4 email với tổng số 1.757 từ và 7 trang, mà Ethan Mollick đánh giá là "đều đúng" và "khá tốt". Khi được yêu cầu, Bing cũng viết một chiến dịch truyền thông xã hội bao gồm các bài đăng lên Facebook và Twitter.

Ethan Mollick đã sử dụng ChatGPT, công cụ tạo mã HTML cho trang thông báo ra mắt sản phẩm, để tạo trang web cho game, nhưng ông lưu ý rằng GPT-4 (phiên bản mới nhất của mô hình ngôn ngữ lớn, nền tảng cho ChatGPT) "hoạt động rất chậm" trên nhiệm vụ này, nên đã vượt qua giới hạn nửa giờ đến vài phút.

"Tôi chắc chắn rằng con người có thể làm tốt hơn, nhưng không thể nhanh hơn GPT-4. Theo bài luận của Ethan Mollick về cuộc thử nghiệm của mình, tôi tin rằng đó là vừa là vấn đề vừa là cơ hội.

chatgpt-va-bing-lam-duoc-nhung-dieu-sieu-pham-trong-30-phut.jpg — Giáo sư Ethan Mollick bất ngờ khi thử nghiệm xem ChatGPT và Bing có thể làm được những gì trong 30 phút

Trước đây, Ethan Mollick đã so sánh ChatGPT và Bing. Anh ấy yêu cầu cả hai tạo ra bài luận 1.000 từ về "cách các đổi mới được áp dụng trong một ngành hoặc tổ chức cụ thể theo lựa chọn của bạn" vào tháng trước và quyết định rằng Bing tạo ra các phản hồi "chất lượng cao hơn nhiều".

Trong khi nhiều trường học và cao đẳng cấm các công cụ AI như vậy với lý do lo ngại rằng chúng sẽ tạo điều kiện cho hành vi đạo văn, Ethan Mollick đã gây chú ý vào đầu năm nay khi khuyên sinh viên của mình sử dụng ChatGPT.

ChatGPT từ điểm D đạt điểm A ở bài kiểm tra chỉ sau ba tháng, khiến giáo sư kinh tế ngạc nhiên.

Giáo sư Bryan Caplan ngạc nhiên trước sự tiến bộ của ChatGPT vì điểm số trong bài kiểm tra kinh tế học của ông đã tăng từ D lên A chỉ sau ba tháng.

Theo Bryan Caplan, giáo sư kinh tế tại Đại học George Mason (Mỹ) cho biết phiên bản mới nhất của ChatGPT có thể khiến ông mất món đặt cược lớn nhất trong lịch sử.

Bryan Caplan đã đưa ra các câu hỏi cho ChatGPT, hoạt động dựa trên mô hình ngôn ngữ GPT-3.5 từ kỳ thi giữa kỳ mùa thu của anh ấy, trong một bài đăng trên blog vào tháng 1.

Thay vì yêu cầu sinh viên thuộc lòng sách giáo khoa hoặc được xem như các bài tập về trí nhớ, Bryan Caplan cho rằng các câu hỏi trong bài thi này nhằm mục đích kiểm tra sự hiểu biết của sinh viên về kinh tế học.

Phiên bản cũ của ChatGPT đã gặp vấn đề khi chỉ đạt điểm 31/100 trong bài kiểm tra, tương đương điểm D.

Theo Bryan Caplan, ChatGPT không hiểu các khái niệm cơ bản, chẳng hạn như nguyên tắc lợi thế so sánh và lợi thế tuyệt đối. Ông tuyên bố rằng các câu trả lời của ChatGPT cũng chính trị hơn là kinh tế.

Trong bài đăng trên blog vào tháng 1 của mình, Bryan Caplan nói rằng "ChatGPT đã bắt chước một sinh viên kinh tế Đại học George Mason rất yếu."

Bryan Caplan không phải là học giả duy nhất thất vọng với ChatGPT. Giáo sư trường này cho biết rằng chatbot của OpenAI mắc những lỗi đáng ngạc nhiên trong các phép tính đơn giản mặc dù ChatGPT vượt qua kỳ thi Trường Wharton vào tháng 1.

Cược cá cược là sở thích của Bryan Caplan. Trước đây, anh ấy đã đặt cược công khai 23 lần và tất cả đều thắng. Các món cược với số tiền khiêm tốn khoảng 100 đô la thường liên quan đến các chủ đề kỹ thuật như dự đoán tỷ lệ thất nghiệp, chỉ số lạm phát.

Ngoài ra, Bryan Caplan đã suýt thắng trong một vụ cá cược năm 2008 rằng không quốc gia thành viên nào sẽ rời Liên minh châu Âu (EU) trước năm 2020: Vương quốc Anh sẽ rời EU vào tháng 1.2020.

Trước năm 2029, Bryan Caplan đã đánh cược rằng một mô hình AI sẽ không đạt điểm A trên 6/7 bài kiểm tra của ông vì ông đã rất thất vọng về các câu trả lời của ChatGPT.

Tuy nhiên, Bryan Caplan sốc trước sự tiến bộ của GPT-4 khi nó được phát hành. Nó đạt điểm A tương đương với 73% trong cùng một bài kiểm tra giữa kỳ và nằm trong số những điểm cao nhất trong lớp của ông.

Bản nâng cấp của ChatGPT (ChatGPT-4 hiện có tính phí), dựa trên GPT-4, đã giải quyết một số vấn đề ban đầu trong GPT-3.5. Điều này, theo tuyên bố của OpenAI, làm cho GPT phản hồi chính xác hơn 40% và xử lý các chỉ dẫn tinh vi hơn.

Những cải tiến được thể hiện rõ ràng với Bryan Caplan. ChatGPT-4 trả lời rõ ràng các câu hỏi của anh ấy và hiểu các khái niệm mà trước đây chatbot này gặp khó khăn. Khi giải thích và đánh giá các khái niệm do các nhà kinh tế học như Paul Krugman đưa ra, GPT-4 cũng đạt điểm tuyệt đối.

Theo Bryan Caplan, "Điều duy nhất tôi muốn nói là nó có vẻ tốt hơn rất nhiều."

Theo Bryan Caplan, bài đăng trên blog trước đây của anh ấy trên đó ông giải thích câu trả lời có thể đã chọn dữ liệu đào tạo ChatGPT. Tuy nhiên, các đồng nghiệp của Bryan Caplan đã nói với anh ấy rằng điều này rất khó xảy ra.

Theo Bryan Caplan, ChatGPT-4 đã nhận được những bài kiểm tra hoàn toàn mới mà nó chưa từng thấy trước đây. Kết quả là ChatGPT-4 đạt được điểm số tốt hơn đáng kể so với mức điểm 73% trước đó.

Theo Bryan Caplan, "Tôi đã rất tự mãn trong nhận định của mình và không còn tự mãn nữa."

Bryan Caplan tự tin hơn rằng sẽ thắng trong vụ cá cược liên quan đến AI sắp tới. Ông có một vụ cá cược với Eliezer Yudkowsky, người có quan điểm bi quan về AI và từng tranh luận với Sam Altman, Giám đốc điều hành OpenAI, rằng AI sẽ dẫn đến sự tận diệt của thế giới trước ngày 1.1.2030.

Theo Bryan Caplan, tôi sẵn sàng tham gia vào nhiều hơn những vụ cá cược về AI liên quan đến tận diệt của thế giới bởi vì tôi tin rằng những người này đã hoàn toàn mất trí. Điều này ngụ ý rằng ông không tin AI sẽ dẫn đến sự tận diệt của thế giới.

Các chatbot AI khiến các giám khảo phải đau đầu. Các giáo sư nói với trang Insider rằng khó có thể chứng minh hành vi đạo văn với tài liệu từ ChatGPT vì không có bằng chứng cụ thể về hành vi vi phạm quyền sở hữu trí tuệ.

Sau sự trỗi dậy của ChatGPT, Bryan Caplan nói rằng anh ấy đang cân nhắc việc loại bỏ bài tập về nhà được chấm điểm. Ông hy vọng rằng thói quen thay đổi câu hỏi thường xuyên sẽ đủ để ngăn sinh viên tái sử dụng câu trả lời của ChatGPT trong một bài kiểm tra.

Nhiều cải tiến đáng giá của GPT-4

Theo OpenAI, GPT-4 tiên tiến hơn trong ba lĩnh vực chính: Tính sáng tạo, đầu vào trực quan và ngữ cảnh dài hơn. Về khả năng tương tác, OpenAI tuyên bố rằng GPT-4 được đào tạo tốt hơn nhiều trong cả việc tạo và cộng tác với người dùng trong các dự án sáng tạo. Ví dụ về những điều này bao gồm việc sử dụng âm nhạc, kịch bản, viết kỹ thuật và thậm chí là "học cách viết của người dùng" cho một số bài kiểm tra đại học. Với tối đa 25.000 từ văn bản từ người dùng, GPT-4 hiện có thể xử lý. Ngay cả khi bạn gửi cho GPT-4 một liên kết web và yêu cầu nó tương tác với văn bản từ trang đó, bạn vẫn có thể yêu cầu kết quả tương tác giữa GPT-4 và GPT-4. Theo OpenAI, điều này có thể dẫn đến việc tạo nội dung dài và "các cuộc hội thoại mở rộng" hoặc thậm chí sử dụng hình ảnh làm cơ sở để tương tác. Ví dụ, mô hình ngôn ngữ mới được cung cấp hình ảnh của một số nguyên liệu làm bánh và được hỏi có thể làm gì khi sử dụng trong trang web GPT-4. Công ty đã dành sáu tháng qua để tinh chỉnh GPT-4 theo hướng dẫn về nội dung mở rộng và an toàn hơn cho các lĩnh vực kinh tế vĩ mô. Theo OpenAI, công ty đã làm việc với "hơn 50 chuyên gia để có phản hồi sớm trong các lĩnh vực như an toàn và bảo mật AI" trong khi nói rằng GPT-4 đã được đào tạo với phản hồi của con người. Giám đốc điều hành GPT-4.

Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống