Dù sở hữu AI hiện đại, ChatGPT đã thảm bại hoàn toàn trong trận cờ vua trước một bản giả lập Atari 2600 chạy chỉ với 1 MHz. Kết quả bất ngờ này làm nổi bật những hạn chế của mô hình ngôn ngữ lớn khi đối mặt với thử thách chiến lược.
Kỹ sư Citrix Robert Jr. Caruso đã tiến hành thí nghiệm, cho chatbot của OpenAI đấu với chiếc console cổ điển Atari sử dụng trình giả lập Stella. Kết quả nghiêng hẳn về phần cỗ máy từ thập niên 1970.
Caruso được truyền cảm hứng từ cuộc trò chuyện với ChatGPT về AI và lịch sử cờ vua. Khi chatbot đề nghị chơi “Atari Chess”, Caruso cho rằng nó đang nói đến tựa game “Video Chess” của Atari 2600.
Dù được cung cấp thông tin bàn cờ cơ bản, ChatGPT vẫn vật lộn đáng kể. Caruso cho biết bot này nhầm lẫn quân cờ, bỏ lỡ cơ hội chiến thuật đơn giản và thực hiện những nước đi vô lý. ChatGPT thậm chí đổ lỗi cho cách hiển thị quân cờ trừu tượng của game khiến nó chơi kém.
“Suốt 90 phút, tôi phải ngăn nó thực hiện những nước đi tồi và sửa nhận thức về bàn cờ nhiều lần mỗi lượt,” Caruso giải thích, nhấn mạnh sự lúng túng của chatbot trước console những năm 1970.
Dù liên tục yêu cầu khởi động lại, ChatGPT cuối cùng vẫn bị áp đảo bởi engine cờ 8-bit sơ khai. Trong khi ChatGPT dựa vào những GPU mạnh mẽ, Atari 2600 với sức mạnh xử lý hạn chế lại giành chiến thắng vang dội ở trình độ nghiệp dư.
Thí nghiệm này nhắc nhở rằng các LLM như ChatGPT, dù ấn tượng, về bản chất chỉ là công cụ tìm kiếm phức tạp thiếu khả năng suy luận và diễn dịch thực sự. Chúng giỏi tạo ra kết quả hấp dẫn nhưng không có hiểu biết thực sự.
Tóm lại, dù AI không ngừng tiến bộ, thí nghiệm vui này cho thấy ngay cả một console chơi game cổ điển cũng có thể phơi bày hạn chế của các mô hình AI hiện tại trong tư duy chiến lược. Có lẽ cần một trận tái đấu, lần này với Battle Chess trên cỗ máy 80286 tốc độ 16 MHz cháy bỏng!
Bài liên quan: Loạt bài Huyền Thoại Công Nghệ: Atari 2600 – Atlantis của Thế Giới Console