Một nhà phát triển phần mềm đã bắt đầu hành trình đào tạo AI để chơi Pokemon Red Version. 50.000 giờ sau và nó đang thực hiện một số động tác hoàn toàn giống con người.
Gần một thập kỷ trước, Twitch Plays Pokemon đã chiếm được cảm tình, khối óc và ngón tay của Internet. Hiện tượng huyền thoại này đã truyền cảm hứng cho Mizkif giải trí và hồi sinh trên TikTok.
Giờ đây, sự hỗn loạn nổi tiếng của Twitch Plays Pokemon đã truyền cảm hứng cho một thử nghiệm mới xoay quanh việc sử dụng AI. Chúng tôi biết bạn đang nghĩ gì và nó không liên quan gì đến cái kết kỳ lạ của Pokemon Scarlet & Violet.
Kỹ sư phần mềm Peter Whidden có trụ sở tại Seattle đã trải qua quá trình huấn luyện vất vả để AI chơi Pokemon Red Version. Anh ấy đã xuất bản một video giải thích trên kênh YouTube của mình và thu hút được hơn 2,5 triệu lượt xem.
Trong video, Whidden giải thích rằng AI hiện đã chơi hơn 50.000 giờ chơi và có khả năng bắt Pokemon và đánh bại Gym Leader. AI dựa vào mô hình tăng cường Pavlovian cung cấp “khuyến khích dựa trên điểm” để tăng cấp cho Pokémon, khám phá các khu vực mới và giành chiến thắng trong các trận chiến.
Whidden rất ngạc nhiên trước thành tích của chương trình nhưng thừa nhận với bản thân “thú vị hơn thành công của nó là cách nó thất bại”. AI diễn giải hệ thống khen thưởng theo cách riêng của nó và dẫn đến một số hành vi đáng ngạc nhiên của con người.
Đăng ký nhận bản tin của chúng tôi để nhận thông tin cập nhật mới nhất về Esports, Gaming và hơn thế nữa.
Ngoài việc dành hàng giờ để chiêm ngưỡng phong cảnh, AI còn trải qua điều gì đó có thể so sánh được với nỗi đau sau sự cố tại Trung tâm Pokemon. Việc vô tình gửi Pokemon vào PC sẽ làm giảm một nửa cấp độ chung của đội anh ta và gây ra phản ứng tiêu cực liên quan đến Trung tâm Pokemon.
Có liên quan:
24 thẻ Pokemon đắt nhất và hiếm nhất được bán
Whidden giải thích: “Nó không có cảm xúc như con người, nhưng một sự kiện có giá trị phần thưởng cực cao vẫn có thể để lại ấn tượng lâu dài về hành vi của nó”. “Trong trường hợp này, việc mất Pokemon của mình chỉ một lần cũng đủ để hình thành mối liên hệ tiêu cực với toàn bộ Trung tâm Pokemon và AI sẽ hoàn toàn tránh điều đó trong tất cả các trò chơi trong tương lai.”
Thật không may, AI không có quà tặng Twitch để đặt tên. Bộ khởi động luôn được đặt tên là AAAAAAA.
AI Whidden vẫn đang ở giai đoạn đầu của cuộc phiêu lưu Pokemon sau khi bị cản trở bởi hang động Mt Moon đáng thất vọng. Anh ấy nói với khán giả của mình rằng một sự thay đổi gần đây trong hệ thống phần thưởng của anh ấy đã cho phép AI thoát ra khỏi hang động và cuối cùng đến được Thành phố Cerulean.
Kỹ sư phần mềm này cũng đã công khai mã cho dự án của mình và rất “phấn khích” trước số lượng người tham gia vào dự án đó. Một người hâm mộ thông minh thậm chí còn có thể sử dụng mã của mình trên Phiên bản Pokemon Crystal nhưng chúng tôi không biết nó hoạt động như thế nào ở Thế hệ 2.