# Trưởng phòng AI Meta Yann LeCun Rời Chức, Đề Xướng “Mô Hình Thế Giới” Thay Vì LLM
Một trong những nhân vật có ảnh hưởng nhất trong thế giới trí tuệ nhân tạo, Yann LeCun, nhà khoa học trưởng AI của Meta, được cho là đang chuẩn bị từ chức. LeCun, người tiên phong trong học sâu và là tiếng nói nổi bật trong nghiên cứu AI, được cho là rời đi vì bất đồng căn bản với xu hướng phát triển LLM (Mô hình Ngôn ngữ Lớn) đang thống trị ngành công nghiệp hiện nay, mà ông coi là “hướng đi cụt” để đạt được trí tuệ đẳng cấp con người. Thay vào đó, LeCun đang vận động cho một sự thay đổi cách mạng hướng tới “mô hình thế giới”.
Sự Rời Chức Của Nhà Thường Tri AI và Sự Thất Vọng Với LLM
Ở tuổi 65, Yann LeCun có địa vị như một chính gia kỳ cựu trong cộng đồng AI, đã được hưởng nguồn lực dồi dào tại bộ phận “nghiên cứu AI cơ bản” của Meta. Sự từ chức sắp đến của ông, được nhiều báo cáo đáng tin cậy xác nhận, diễn ra vào thời điểm Meta, giống như nhiều tập đoàn công nghệ lớn khác, đang đầu tư mạnh mẽ vào AI, thu hút nhân tài hàng đầu và thậm chí, theo CEO Mark Zuckerberg, đang tiến gần đến “siêu trí tuệ”.
Tuy nhiên, LeCun đã gợi ý về sự hoài nghi của ông từ lâu. Ông đã trở nên nổi tiếng với những chỉ trích nhắm vào kiến trúc LLM hiện tại, phát biểu từ sớm nhất là tháng 4 năm ngoái rằng “một LLM cơ bản là một lối thoát, một sự phân tâm, một hướng đi cụt”. Quan điểm này đã gây ra một số tranh cãi, với những người chỉ trích như Gary Marcus chỉ ra một sự thay đổi quan điểm được cho là sau khi LeCun trước đây từng bảo vệ LLM. Dù sao, sự tin tưởng của LeCun là rõ ràng: chỉ đơn giản là mở rộng quy mô các LLM hiện tại sẽ không tạo ra trí tuệ thực sự.
Sự Thay Đổi Nội Bộ và Sự Nổi Lên Của Những Người Ủng Hộ LLM
Phân tích gần đây của Wall Street Journal gợi ý rằng các động lực nội bộ tiềm năng đã góp phần vào quyết định của LeCun. Mùa hè vừa qua chứng kiến việc Alexandr Wang, 28 tuổi, đồng tạo ra sensation dựa trên LLM ChatGPT, được bổ nhiệm làm trưởng phòng AI tại Meta, về cơ bản trở thành cấp trên của LeCun. Bên cạnh đó, Shengjia Zhao, một nhà khoa học trưởng còn tương đối trẻ mới nổi với những “đột phá” trong việc mở rộng quy mô, đã gia nhập Meta ở vị trí trên LeCun trong năm nay. Những bổ nhiệm này nhấn mạnh một sự thay đổi chiến lược trong Meta hướng tới chính những cách tiếp cận mở rộng quy mô LLM mà LeCun đã mất niềm tin. Hoạt động AI của Meta được mô tả có sơ đồ tổ chức đặc thù, bao gồm nhiều nhóm riêng biệt, đã chứng kiến hàng trăm nhân viên bị sa thải trong tháng trước như một nỗ lực tối ưu hóa.
“Mô Hình Thế Giới”: Con Đường Thay Thế Của LeCun Để Đạt Đến AI Tiên Tiến
Báo cáo từ Financial Times chỉ ra rằng LeCun có thể thành lập một công ty khởi nghiệp mới chuyên phát triển “mô hình thế giới”. Ông đã liên tục bày tỏ quan điểm về lý do tại sao những mô hình này nắm chìa khóa tương lai của trí tuệ nhân tạo. Trong một bài phát biểu chi tiết tại Hội nghị Hành động AI ở Paris, LeCun, người đã làm việc với kính thông minh của Meta nhưng không tập trung nhiều vào LLM Llama của họ, nhấn mạnh nhu cầu cấp thiết đối với AI trong tương lai, đặc biệt là trong các thiết bị đeo được, phải hiểu thế giới như con người.
Ông lập luận rằng các LLM hiện tại “chưa thể tái tạo trí thông mèo hay trí thông chuột, chứ đừng nói đến trí thông chó”. Động vật, ông cho, thực hiện những “thành tựu đáng kinh ngạc” vì chúng hiểu biết về thế giới vật lý, lập kế hoạch các hành động phức tạp và sở hữu các mô hình nhân quả. Sự hiểu biết cơ bản này là điều LeCun tin rằng các LLM đang thiếu thốn.
Thí Tư Nghĩ “Khối Vuông Xoay”
Để minh họa cho sự giới hạn này, LeCun đưa ra một thí tư nghiệm thuyết phục:
“Nếu tôi bảo bạn ‘hãy tưởng tượng một khối vuông đang lơ lửng không khí trước mặt bạn. Ok bây giờ xoay khối vuông này 90 độ quanh một trục thẳng đứng. Nó trông như thế nào?’ Đối với bạn thì thật dễ dàng để có một mô hình tinh thần về một khối vuông đang xoay.”
Trong khi một LLM có thể dễ dàng tạo ra một mô tả, nó không thể thực sự “tương tác” với khối vuông về mặt tinh thần hay vật lý. LeCun quy điều này cho sự khác biệt cố hữu giữa dữ liệu văn bản, mà các LLM được đào tạo trên đó (tương đương 450.000 năm đọc), và dữ liệu cảm giác rộng lớn (thị giác, xúc giác) mà một đứa trẻ xử lý trong chỉ vài năm (ước tính 1.4 x 10^14 byte). Sự trừu tượng này nhấn mạnh niềm tin của ông rằng các LLM có những giới hạn cơ bản mà các mô hình thế giới hướng đến khắc phục.
Thiết Kế Tương Lai Của AI: Tầm Nhìn Của LeCun
LeCun hình dung về các mô hình thế giới duy trì một “ước tính về trạng thái thế giới hiện tại” thông qua các biểu diễn trừu tượng. Không giống như những dự liệu tuần tự, mã hóa của LLM, mô hình lý tưởng của ông sẽ “dự đoán trạng thái thế giới kết quả sẽ xảy ra sau khi bạn thực hiện chuỗi hành động đó.”
Những hệ thống tinh vi này, ông tin tưởng, sẽ trao quyền cho các nhà khoa học máy tính để xây dựng AI có khả năng lập kế hoạch phân cấp, suy luận và các tính năng an ninh vốn dĩ mạnh mẽ hơn hơn. Thay vì là những “hộp đen bí ẩn” được hoàn thiện thông qua việc điều chỉnh tinh tế, các mô hình thế giới sẽ có cơ chế điều chế được xây dựng trực tiếp vào kiến trúc của chúng.
LeCun gợi ý rằng trong khi AI cổ điển, như công cụ tìm kiếm, đơn giản hóa vấn đề thành việc tối ưu hóa, mô hình thế giới của ông sẽ tìm kiếm sự tương thích giữa các trạng thái khác nhau của thế giới, nhận diện các giải pháp hiệu quả bằng cách sử dụng một “hàm năng lượng đo lường sự không tương thích”.
Một Dự Án Phi Thường Trong Tầm Nhìn?
Dù LeCun đã bắt đầu công việc sơ bộ về mô hình thế giới tại Meta, các bước tiếp theo chính xác và việc ra mắt một doanh nghiệp mới của ông vẫn chưa được xác nhận. Các phát biểu công khai của ông, mặc dù chi tiết, vẽ nên một bức tranh về một dự án “phi thường” đầy tham vọng – một cuộc tìm kiếm đột phá tương đương với ChatGPT, nhưng theo một hướng hoàn toàn khác. Một nỗ lực như vậy chắc chắn sẽ đòi hỏi thời gian đáng kể, đầu tư to lớn và có thể mất vài năm, hoặc thậm chí lâu hơn nữa, để mang lại những kết quả thực sự đáng chú ý.
Sự thay đổi tiềm năng này từ một trong những bộ óc hàng đầu của AI đánh dấu một bước ngoặt, thách thức hệ thống tư thống trị và mở ra những hướng đi mới cho tương lai của nghiên cứu trí tuệ nhân tạo.
English
日本語
한국어
简体中文