Chuyện gì sẽ xảy ra khi AI đỗ kỳ thi này?

Bài kiểm tra cuối cùng đang thách thức khả năng của trí tuệ nhân tạo – Ảnh: Getty.
Trong khi ngành trí tuệ nhân tạo tiến nhanh như vũ bão, các nhà khoa học tìm cách đặt ra một giới hạn mang tên “Kỳ thi cuối cùng của nhân loại” (Humanity’s Last Exam – HLE), để xem AI có thể tiến xa tới đâu. Không chỉ là bài kiểm tra học thuật thông thường, HLE được thiết kế nhằm buộc các mô hình ngôn ngữ lớn (LLM) như ChatGPT, Gemini hay DeepSeek chứng minh khả năng hiểu biết thực sự, chứ không trả lời theo kiểu “học vẹt” nhờ lượng dữ liệu khổng lồ.
Kỳ thi này là kết quả hợp tác giữa hai đơn vị đại diện cho hai thái cực: Trung tâm An toàn AI (Center for AI Safety) – tổ chức phi lợi nhuận với sứ mệnh giảm thiểu rủi ro từ AI ở quy mô xã hội, và Scale AI – doanh nghiệp chuyên cung cấp dữ liệu huấn luyện cho các tập đoàn công nghệ hàng đầu. Dù kết quả ban đầu còn khiêm tốn, nghiên cứu đã hé lộ một tương lai không xa: nơi AI có thể trả lời những câu hỏi khó nhất mà giới học thuật từng đặt ra.
Kết quả nghiên cứu đã được gửi lên nền tảng arXiv, và hiện chưa được bình duyệt.

Bài kiểm tra yêu cầu AI phải thành thạo nhiều lĩnh vực – Hình minh họa.
Với hơn 2.700 câu hỏi được gửi về từ các chuyên gia trên khắp thế giới, HLE không đơn thuần là một bài kiểm tra tổng hợp – nó là bản đồ tri thức của nhân loại. Khoảng 41% câu hỏi liên quan đến toán học, phần còn lại trải dài từ y học, vật lý, hóa học cho đến nhân văn, khoa học máy tính và kỹ thuật. Một câu yêu cầu AI dịch một dòng chữ La Mã cổ; câu khác thách thức khả năng hiểu biết về cấu trúc gân cơ của chim ruồi; thậm chí có cả những câu khiến AI phải suy ngẫm về chính bản thân nó.
Điểm đặc biệt của HLE là tính khách quan tuyệt đối. Mỗi câu hỏi đều có đáp án duy nhất, không thể bị đánh lạc hướng bởi mẹo vặt tìm kiếm trên mạng. Quá trình chấm điểm cũng được tự động hóa, sử dụng AI GPT-40 để xác thực và đánh giá các câu trả lời một cách linh hoạt; câu trả lời được chấp nhận chỉ cần đúng về bản chất.
Đúng như dự đoán, AI đã “trượt” toàn tập, và các nhà nghiên cứu AI hoàn toàn có thể đổ lỗi cho “đề khó”: HLE thực sự đẩy AI đến giới hạn, một số mô hình đã nộp bài (bao gồm Gemini và DeepSeek) chỉ đạt 3-14% độ chính xác.
Tuy nhiên, theo nhóm nghiên cứu, các hệ thống AI hoàn toàn có thể đạt được tới số điểm 50% câu trả lời đúng vào cuối năm 2025, nếu tốc độ tiến bộ vẫn duy trì như hiện tại.
Giai đoạn tiếp theo của huấn luyện sẽ tập trung vào việc giúp AI nhận biết mức độ không chắc chắn, thay vì cứ tự tin đưa ra câu trả lời sai. AI sẽ được yêu cầu không chỉ trả lời mà còn đưa ra mức độ tin tưởng cho câu trả lời đó, theo thang điểm từ 0 đến 100%.
Chỉ số “độ tự tin” sẽ giúp giảm thiểu nguy cơ sai lầm mang tính hệ thống – điều mà giới chuyên môn coi là rào cản lớn nhất của AI trong các lĩnh vực quan trọng như y học, pháp lý hay tài chính.
Dù vẫn còn thất bại nhiều, AI đang tiến gần hơn bao giờ hết đến ngưỡng cửa của tri thức con người. Và khi chúng chinh phục được “kỳ thi cuối cùng” này, câu hỏi tiếp theo có lẽ không còn là: “AI biết gì?”, mà sẽ là: “AI còn cần chúng ta đến mức nào nữa?”
Theo
VTV
Copy link
Lấy link
Trấn Thành phản ứng gay gắt khi bị fan xin chụp cùng, lý do phía sau là đây
MỞ LOA TO NGHE MỚI ĐÃ – Thương Quá Việt Nam – Hương Ly Sao Mai, 4K
Có cần làm lại CCCD, hộ chiếu khi sáp nhập tỉnh thành?
Nữ ca sĩ ‘Mỹ nhân Mưa bụi’, cuộc tình 12 năm với bạn diễn kết thúc khiến khán giả tiếc nuối đến tận bây giờ
Đất nước trọn niềm vui: Giai điệu của tự hào, hòa bình và khát vọng hùng cường
Hơn 12.000 khán giả xúc động và tự hào xem chương trình “Hẹn ước Bắc – Nam”
Inter Milan loại Bayern Munich, gặp Barca ở bán kết cúp C1
Chi tiết 102 xã, phường mới của TP.HCM
liên khúc | mùa thu lá bay | mix quang hùng
Diễn viên Cổ Thiên Lạc đứng trước nguy cơ mù mắt
MIXXING COVER | Hẹn Yêu ! | QUANG HÙNG
Chuyến xe tử tế hướng về thành phố Hồ Chí Minh
3 món nam giới chơi thể thao nên ăn thường xuyên
5 không khi ăn cơm nguội
TÂM SỰ TUỔI 30 COVER CHIL QUANG HÙNG
Đất trúng đấu giá huyện Mê Linh hơn 55 triệu đồng một m2
Hướng dẫn bạn cách thêm thẻ vào Apple Pay đơn giản và nhanh chóng, hỗ trợ cả thẻ NAPAS
Cát Bụi Cuộc Đời
Bàng hoàng nữ danh hài tử vong trên sân thượng chung cư: Ngày đau thương trùng với ngày sinh nhật
Chú chó bảo vệ cậu bé lạc trong sa mạc
ASUS ra mắt mainboard dòng MAX giá rẻ đầu tiên: X870 MAX Gaming WiFi 7 với 2 phiên bản
《怎么办!脱口秀专场》完整版第1期(上):李诞成立编剧部!庞博建国爆笑提案 | Stand-Up Comedy
Hãng sản xuất chip đầu tiên “tăng” giá bán vì thuế quan
Ngày mới với tin tức sức khỏe: Mẹo uống cà phê cực tốt trong ngày nóng
Truyền thông Indonesia e ngại trước sự trở lại của chân sút số một của ĐT Trung Quốc
Tin tưởng, kỳ vọng vào các quyết sách lịch sử
Bệnh viện thu hồi sữa Hofumil Gold Plus
trân yêu , lặng yêu | quang hùng
ENG SUB【骨语2 Talking Bones2】EP13 公园案水落石出,竟是贫困父亲所为?(张龄心、高仁)
Vợ quay lén chồng ngoại tình, bị tiểu tam kiện đòi bồi thường tổn thất tinh thần
Đổi đời qua một đêm nhờ hát trong ‘Mưa bụi’, cuộc sống ca sĩ ‘Nhẫn cỏ cho em’ hiện tại ra sao?
4 điều người bệnh tiểu đường cần làm để xương chắc khỏe
Bộ Chính trị ban hành Chỉ thị mới về đại hội đảng bộ các cấp
Các loại củ quả giúp tăng cường sinh lý nam giới
Vùng 4 Hải quân tăng cường tuần tra, kiểm soát vùng nước cấm Căn cứ quân sự Cam Ranh
Gala Lá xanh: Bùng nổ cảm xúc với những ca khúc đi cùng năm tháng
Thủ tướng yêu cầu đẩy nhanh điều tra vụ sữa giả, thuốc giả
Bí quyết giúp cá sấu sống sót qua các cuộc đại tuyệt chủng
BLOGRADIO | LỪA | QUANG HÙNG RADIO
Vô địch châu Á và dự World Cup, đội trẻ Trung Á được tặng mỗi người một chiếc ô tô
CHUYỆN LY KỲ Ở ĐỒN ĐIỀN CAO SU | Chuyện tâm linh đời thường Nguyễn Huy kể
Rò rỉ đoạn hội thoại giữa CEO Amazon Cloud và nhân viên: trong tương lai, khả năng coder sẽ không còn lập trình nữa
Tin lời “thủ lĩnh Sybbex” người phụ nữ mất trắng 2,4 tỷ đồng
NHÀ MA TẬP 104 | CHƠI ĐỒ THỦ TIÊU VỢ – CHUYỆN MA CÓ THẬT RÙNG RỢN – MC DUY THUẬN | FULL 4K
TỰ LAU NƯỚC MẮT QUANG HÙNG
Nhã Phương lộ diện giữa lúc bị ‘bóc’ nhan sắc thật gây tranh cãi mạng xã hội
Google AI Studio là gì? Ứng dụng làm gì? Cách sử dụng chi tiết
Lối thoát cho các thị trấn sắp biến mất ở Hàn Quốc
Chú rể ở Hưng Yên bật khóc trong đám cưới, phía sau là chuyện thắt lòng
TOP 10 Nồi chiên không dầu đáng mua nhất 2025 cho mọi gia đình
TÌM EM CÂU VÍ SÔNG LAM.Mưa Chiều Miền Trung | Quang Hùng
Đồng bào dân tộc Khmer tại Hậu Giang rộn ràng đón Tết Chôl Chnăm Thmây