Vẽ bàn tay - điểm yếu của AI

Vẽ bàn tay - điểm yếu của AI

Năm ngoái, khi Aidan Ragan, sinh viên ngành nghệ thuật tại Đại học Florida, sử dụng phiên bản Midjourney 4.0 để vẽ bàn tay minh họa cho bài thuyết trình. AI này đã tạo ra một bàn tay bốn ngón hoặc 6 ngón, nhăn nheo, xấu xí. Tuần trước, khi Midjourney 5.0 ra mắt, anh thử lại tính năng này với tâm thế không kỳ vọng nhiều, nhưng công cụ đã khiến anh ngạc nhiên.

"Thật tuyệt vời", Ragan, 19 tuổi, nói với Washington Post. "Thứ kìm hãm AI đã được loại bỏ. Bây giờ, nó đã trở nên hoàn thiện. Một chút đáng sợ nhưng thú vị".

Ảnh bàn tay do Midjourney 4.0 (bốn ảnh trái) và Midjourney 5.0 (bốn ảnh phải) tạo ra. Ảnh: Midjourney

Thời gian qua, các chương trình AI tạo ảnh từ văn bản đầu vào như Midjourney nở rộ, liên tục được cải tiến về tính năng và hiệu suất. Tuy nhiên, chúng chưa thực hiện được yêu cầu vẽ bàn tay con người sống động như thật.

Theo giới chuyên gia, lý do là các bộ dữ liệu đào tạo AI thường chỉ "học" được các phần của bàn tay, không tạo được hình ảnh tổng thể. Kết quả là, ảnh bàn tay do AI tạo ra có thể phình to, quá nhiều ngón hoặc cổ tay duỗi thẳng, khiến người xem rất dễ nhận biết đó là tác phẩm của trí tuệ nhân tạo.

Phó giáo sư Amelia Winger-Bearskin, chuyên gia về AI và nghệ thuật tại Đại học Florida, cho biết việc tái tạo bàn tay hiện vẫn là vấn đề nhức nhối với bất kỳ phần mềm nào. "AI không hiểu hết ý nghĩa của từ 'bàn tay', khiến việc tái tạo bộ phận này gặp khó. Bàn tay có nhiều hình dạng, kích cỡ và hình thức, đồng thời hình ảnh trong tập dữ liệu đào tạo đa dạng hơn nhiều so với khuôn mặt", bà giải thích.

Đến nay, Midjourney là AI có khả năng tái tạo bộ phận này ổn nhất. Phiên bản mới đang được nhiều chuyên gia, nghệ sĩ và người làm đồ họa đánh giá cao. Theo bà Winger-Bearskin, AI mới vẫn có một số điểm thực sự kỳ quặc, nhưng gần như đã đạt đến sự hoàn thiện.

Sự lo ngại

Theo Ragan, việc AI tạo nên ảnh thật hơn khiến anh phấn khích. Tuy nhiên, cảm giác đó giảm dần theo thời gian. "Sự hoàn hảo làm giảm đi niềm vui và sự sáng tạo bằng AI. Tôi thích một chút nghệ thuật, nhưng giờ các tác phẩm dường như trở nên cứng nhắc và tạo cảm giác robot hơn", anh nói.

Hany Farid, giáo sư pháp y kỹ thuật số tại Đại học California, cho rằng việc AI liên tục cải tiến và ngày càng chân thật khiến nó có thể bị lạm dụng. "Khi nhìn vào một bức ảnh, người bình thường sẽ nghĩ: 'Được rồi, có bảy ngón tay ở đây và ba ngón ở kia, nó được làm giả'. Nhưng khi AI bắt đầu hiểu đúng, căn cứ để xác định ảnh do bot hay người vẽ càng khó thực hiện", Farid giải thích.

Cũng theo ông, những AI như Midjourney có nguy cơ gây ra rủi ro chính trị, vì có thể tạo những tác phẩm thật hơn hơn, từ đó lan truyền thông tin sai lệch. Ông lấy ví dụ, tuần trước, bức ảnh giả cựu tổng thống Mỹ Donald Trump bị bắt do Midjourney tạo ra đã lan truyền trên Twitter khiến nhiều người tưởng là thật.

Trong những bức ảnh trước đây, Farid cho rằng ông có thể phát hiện lập tức việc nó được tạo từ AI chỉ bằng hành động nhìn vào bàn tay. "Manh mối" này giờ khó nhận biết hơn.

Midjourney ra mắt năm 2021, nhưng rộ lên từ tháng 8/2022 khi cho phép tạo tranh miễn phí. Chỉ sau vài tháng, hàng triệu người đã dùng Midjourney để vẽ tranh ảnh, dựng phim, làm bìa tạp chí, tranh minh họa. Tháng 8/2022, tạp chí The Atlantic từng bị chỉ trích vì một biên tập viên sử dụng Midjourney vẽ minh họa nhân vật cho bài viết, thay vì mua ảnh hay thuê người vẽ. AI này cũng đoạt giải nhất trong một triển lãm tranh vẽ ở bang Colorado, khiến giới họa sĩ khó chịu. Các họa sĩ lo ngại, bên cạnh việc bị đánh cắp bản quyền, các tác phẩm của họ còn bị dùng để huấn luyện phần mềm và có thể giành giật chính công việc của họ trong tương lai.

Bảo Lâm (theo Washington Post)

Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống

Nguồn tin:

 

Tham gia bình luận