Chán nản vì chờ đợi tác giả, anh chàng tạo ra hệ thống sử dụng machine learning để viết tiếp tựa sách "Game of Thrones"

Chán nản vì chờ đợi tác giả, anh chàng tạo ra hệ thống sử dụng machine learning để viết tiếp tựa sách "Game of Thrones"

Bài viết có nói trước nội dung phim, các bạn cân nhắc trước khi đọc tiếp.

Chán nản vì chờ đợi tác giả, anh chàng tạo ra hệ thống sử dụng machine learning để viết tiếp tựa sách Game of Thrones

Và nếu như các bạn chưa xem hết các phần Game of Thrones từ 1 tới 7 và muốn tránh spoiler, thì các bạn sẽ phải cố gắng lắm đấy: Đến năm 2019, chúng ta mới được xem tiếp GoT phần 8.

Nhưng chưa là gì so với những người là fan ruột của bộ truyện A Song of Ice and Fire (tạm dịch là Bản Hùng ca của Băng và Lửa) – nguyên tác văn học của George R. R. Martin đã dựng nên series phim ăn khách Game of Thrones. Quyển thứ thứ Tư, A Dance With Dragon – Khiêu vũ với Rồng, quyển cuối cùng đã được xuất bản từ hồi 2011. Quyển thứ Năm, The Winds of Winter –Những Cơn gió Mùa đông, vẫn mất dạng mà ông George R. R. Martin vẫn lười, chưa viết nốt và cũng chưa ấn định ngày xuất bản luôn.

Chán nản vì chờ đợi tác giả, anh chàng tạo ra hệ thống sử dụng machine learning để viết tiếp tựa sách Game of Thrones

Bởi không còn truyện để mà dựa vào, các nhà sản xuất loạt phim truyền hình ăn khách GoT đã phải tự viết nên những diễn biến tiếp theo của câu chuyện từ cuối mùa Sáu đến nay, tất nhiên là có sự giúp đỡ của George R. R. Martin.

Chán nản với việc phí hoài cả thanh xuân để đợi chờ và sẵn trong tay công nghệ thay đổi thế giới, kỹ sư phần mềm Zack Thoutt đang huấn luyện một mạng neural hồi quy (recurrent neural network – RNN) dự đoán những tình tiết tiếp theo của loạt truyện A Song of Ice and Fire, nhằm tự viết cho mình phần 6 để tự đọc. Bạn có thể đọc toàn bộ 5 chương sấch mà hệ thống machine learning kia viết ra được tại đây.

Chán nản vì chờ đợi tác giả, anh chàng tạo ra hệ thống sử dụng machine learning để viết tiếp tựa sách Game of Thrones

"Tôi là fan ruột của Game of Thrones, cả truyện và phim", theo lời bộc bạch của anh Thoutt, người đã hoàn thiện khóa học Udacity về trí tuệ nhân tạo và deep learning, vận dụng tất cả chúng vào dự án này. "Tôi đã từng vận dụng hệ thống RNN trong khóa học và nghĩ rằng mình nên thử với cuốn sách xem sao".

Mạng neural là một chuỗi các thuật toán machine learning được thiết kế dựa trên não bộ con người (từ "neural" có nghĩa là thần kinh), còn mạng neural hồi quy là một nhánh nhỏ của mạng neural vừa nhắc tới, rất phù hợp để xử lý những chuỗi dữ liệu dài, chẳng hạn như các văn bản dài. Đó là lý do anh Thoutt sử dụng RNN để xử lý loạt sách của tác giả George R. R. Martin.

"Với những mạng neural cơ bản, bạn lấy một chuỗi dữ liệu đầu vào, đưa vào hệ thống và lấy ra một chuỗi dữ liệu đầu ra", anh Thoutt nói. "Để có thể huấn luyện được chúng bạn phải hiểu chúng NÊN cho ra những dữ liệu gì. Mạng neural sẽ so sánh dữ liệu chúng cho ra với mục tiêu bạn mong muốn, cập nhật mạng để tìm ra một cách đạt được mục tiêu tốt nhất".

Chán nản vì chờ đợi tác giả, anh chàng tạo ra hệ thống sử dụng machine learning để viết tiếp tựa sách Game of Thrones

Điểm mấu chốt là hệ thống mạng neural phải nhớ được những chi tiết đáng chú ý xuyên suốt trong toàn bộ câu chuyện, khía cạnh này được gọi là "đơn vị nhớ dài-ngắn – long short-term memory", một khía cạnh đặc biệt của mạng neural hồi quy RNN. Trên lý thuyết, loại "trí nhớ" này sẽ ngăn mạng neural cho ra những sự kiện sách đã xảy ra, cho phép nó có thể đưa ra những diễn biến tiếp theo của sách chứ không phải là một phiên bản khác của cuốn sách.

Nhờ đó, mạng neural có thể viết ra được một cuốn sách (mà ta có thể cho là) một phần truyện tiếp theo đúng nghĩa. Tuy nhiên, chỉ đến được một mức độ nào đó thôi: thỉnh thoảng nó vẫn viết về một số nhân vật hiện đã chết.

"Nó đang cố gắng tự việt nên một cuốn sách mới. Một mẫu hoàn hảo thì phải là một cuốn sách nói về mọi thứ đã từng xuất hiện và không viết về những nhân việt hiện đã chết", anh Thoutt nói. "Thực tế thì, mẫu này vẫn chưa đủ khả năng làm việc đó. Nếu mà nó tốt được như thế thì tác giả sách đã mất việc hết rồi".

Những gì nó viết ra vẫn còn sai ngữ pháp một số chỗ, đưa ra những diễn biến truyện ... chắc chắn không bao giờ xảy ra, ví dụ như nó đoán rằng Sansa Stark - đứa con thuần huyết Stark lớn tuổi nhất hiện tại - là người nhà Baratheon. "Hiển nhiên là nó không hoàn hảo. Nhưng hệ thống có thể học được những yếu tố cơ bản của tiếng Anh cũng như cấu trúc bộ truyện với phong cách đúng với George R. R. Martin", Thoutt nói.

Chán nản vì chờ đợi tác giả, anh chàng tạo ra hệ thống sử dụng machine learning để viết tiếp tựa sách Game of Thrones

Tuy nhiên, không phải mọi dự đoán đều sai lệch và vô căn cứ. Mạng neural này dự đoán rằng Jaime Lannister sẽ hạ sát Cercei Lannister – người chị, người yêu và đang là người thống trị Westeros, Jon Snow sẽ cưỡi rồng, hoạn quan Varys – người cố vấn cho Daenerys Targaryen sẽ bỏ thuốc độc hạ sát chính chủ của mình. Tất cả điều này đều là những giả thuyết được đưa ra bởi cộng đồng yêu thích Game of Thrones.

Cũng đáng kể đấy chứ! Bởi lẽ anh Thoutt chỉ đưa vào mạng neural những dữ liệu từ bộ truyện, không hề có những giả thuyết nói trên.

Những dự đoán ấy sẽ có thể trở thành sự thực vào năm 2019. Đến lúc đó, mạng Internet sẽ vỡ òa khi biết rằng hệ thống mạng neural của anh Thoutt đã dự đoán đúng những tình tiết quan trọng trong Game of Thrones.

Cập nhật tin tức công nghệ mới nhất tại fanpage Công nghệ & Cuộc sống

Nguồn tin:

 

Tham gia bình luận