Trí tuệ nhân tạo đang thay đổi thế giới, nhưng liệu nó đã đủ thông minh để vượt qua con người? Một bài kiểm tra mang tính bước ngoặt mang tên “Kỳ thi cuối cùng của nhân loại” (HLE) đã được thiết kế để trả lời câu hỏi đó. Và bất ngờ thay, dù sở hữu kho dữ liệu khổng lồ, các mô hình AI đình đám như ChatGPT hay Gemini vẫn bó tay trước thử thách này.
Mục lục
I. HLE – Bài thi khó nhất dành cho AI

HLE là kết quả của sự hợp tác giữa hai tổ chức ở hai thái cực: Trung tâm An toàn AI (Center for AI Safety) – đại diện cho quan điểm kiểm soát và đảm bảo tính an toàn của AI trong xã hội, và Scale AI – công ty chuyên cung cấp dữ liệu huấn luyện cho các tập đoàn công nghệ lớn. Mục tiêu của họ là xác định ranh giới cuối cùng giữa trí tuệ nhân tạo và trí tuệ con người.
Không giống những bài kiểm tra thông thường, HLE không dựa vào khả năng xử lý ngôn ngữ hay phân tích văn bản đơn thuần. Nó bao gồm hơn 2.700 câu hỏi được gửi từ các chuyên gia trên toàn cầu, trải dài từ toán học, vật lý, hóa học, sinh học đến nhân văn, ngôn ngữ cổ và thậm chí cả triết học. Có câu hỏi yêu cầu dịch dòng chữ La Mã cổ, câu khác lại xoáy sâu vào cấu trúc sinh học của chim ruồi – những đề bài mà ngay cả con người cũng phải vất vả suy nghĩ.
II. AI “trượt” – Một thất bại đáng suy ngẫm

Kết quả ban đầu cho thấy: AI đã trượt toàn tập. Các mô hình tiên tiến như Gemini hay DeepSeek chỉ đạt 3-14% độ chính xác. Lý do chính là vì bài kiểm tra quá khó và không thể “lách luật” bằng việc tìm kiếm trên mạng. Mỗi câu hỏi đều có một đáp án duy nhất, không chấp nhận sự mơ hồ hay “vòng vo” thường thấy trong các mô hình ngôn ngữ lớn (LLM).
Việc chấm điểm được tự động hóa bằng GPT-40 – một AI khác đóng vai trò giám khảo, đảm bảo tính công bằng và nhất quán tuyệt đối. Để được công nhận, câu trả lời của AI phải đúng về bản chất, không chỉ đúng theo “cú pháp”.
III. Từ sai lầm đến hy vọng

Dù kết quả ban đầu có vẻ tệ hại, nhưng các chuyên gia không quá bi quan. Theo nhóm nghiên cứu, nếu tốc độ phát triển AI hiện tại được duy trì, các mô hình có thể đạt 50% câu trả lời đúng vào cuối năm 2025. Đây là cột mốc cho thấy AI đang từng bước tiến gần hơn đến ngưỡng cửa của hiểu biết con người.
Một điểm đáng chú ý trong giai đoạn tiếp theo của dự án là việc huấn luyện AI biết khi nào mình không chắc chắn. Thay vì luôn trả lời với độ tự tin 100% – dù có thể sai hoàn toàn – AI giờ sẽ phải đưa ra mức độ tin tưởng cho mỗi câu trả lời, tính theo phần trăm. Chỉ số này giúp giảm thiểu những sai sót nghiêm trọng trong các lĩnh vực nhạy cảm như y tế, pháp luật hay tài chính, nơi một sai lầm nhỏ cũng có thể dẫn đến hậu quả lớn.
IV. Khi AI đối diện giới hạn của chính mình

HLE không chỉ là một bài kiểm tra. Nó là một tấm gương soi để AI nhìn lại những giới hạn mà mình chưa thể vượt qua. Không còn là việc “học vẹt” từ hàng tỷ dữ liệu trên mạng, mà là thách thức khả năng lý luận, phân tích và tự nhận thức – những điều tưởng như chỉ con người mới có.
Thất bại lần này không có nghĩa AI yếu kém, mà là lời nhắc rằng trí tuệ nhân tạo vẫn cần thêm thời gian, sự kiểm soát và định hướng đúng đắn. Và nếu một ngày nào đó AI vượt qua được kỳ thi cuối cùng này, câu hỏi quan trọng sẽ không còn là “AI biết được gì?”, mà sẽ chuyển thành: “Chúng ta còn giữ vai trò gì trong một thế giới mà AI đã thực sự hiểu biết?”
V. Kết luận
“Kỳ thi cuối cùng của nhân loại” đã hé lộ một sự thật thú vị: AI vẫn chưa thể thay thế hoàn toàn trí tuệ con người, ít nhất là ở thời điểm hiện tại. Nhưng con đường phía trước vẫn rộng mở. Sự thất bại của AI hôm nay có thể là nền tảng cho những bước tiến vượt bậc ngày mai. Và cuộc đua giữa trí tuệ tự nhiên và trí tuệ nhân tạo chắc chắn sẽ còn nhiều hồi hấp dẫn hơn nữa.
Hãy cùng Phong Vũ Tech News cập nhật thêm nhiều thông tin về công nghệ trí tuệ nhân tạo trong những bài viết khác tại blog Tin Tức nhé!
Bài viết liên quan:
- ChatGPT trở thành chuyên gia định vị ảnh: Tác động và triển vọng
- Khi AI “Nổi Loạn”: Hồi chuông cảnh báo từ trí tuệ nhân tạo vượt trội
- Nhân tố nào sẽ bị Trí tuệ nhân tạo – AI thay thế?

Công chức đi học phải cam kết làm việc gấp ba lần thời gian đào tạo
Động đất ở Myanmar làm lộ ra công trình kiến trúc hoàng gia cổ đại
Thủ tướng Phạm Minh Chính động viên các lực lượng tham gia diễu binh, diễu hành
NHÀ MA TẬP 165 | GIẾT DÂU NGHÈO YỂM BÙA CON TRAI | CHUYỆN MA KINH DỊ – MC DUY THUẬN | FULL 4K
anh đến được thì anh đi được
‘Nền kinh tế cô đơn’ của Hàn Quốc
CHƯA BAO GIỜ COVER QUANG HÙNG
Cách đơn giản và dễ nhận biết được thực phẩm bẩn, không an toàn, người nội trợ nào cũng cần biết
Trình Quốc hội dự án Luật Cán bộ, công chức (sửa đổi)
Xuyên đêm cứu bệnh nhân bị đâm thấu bụng
Sắp xếp 52 đơn vị hành chính cấp tỉnh: Cả nước sẽ còn 34 tỉnh, thành
Nvidia đầu tư 500 tỷ USD sản xuất chip AI, siêu máy tính tại Mỹ
Dự án 20.400 tỷ vượt nắng thắng mưa, quyết về đích đúng tiến độ Thủ tướng giao cho nhờ “bảo bối” đặc biệt
Nvidia RTX 5060 Ti mang lại hiệu suất tốt hơn 20% so với người tiền nhiệm
Vì sao giá nhà xã hội nơi cao nơi thấp?
Tổng Bí thư Tô Lâm phát biểu thông điệp chính sách ở Hội nghị P4G Việt Nam 2025
Những ứng dụng di động phổ biến nhất tại Việt Nam hiện nay
Sản phẩm này đang khiến CEO Apple đau đầu
Cha tôi, người ở lại đóng máy sau 7 tháng, Ngọc Huyền khóc nức nở
Ba ôtô khách tông liên hoàn, 7 người bị thương
Cuộc đời huyền thoại của tỷ phú chỉ biết 200 chữ
Chủ shop online đồng loạt từ chối COD, chuyển khoản thì “cấm” ghi nội dung: Chuyện gì đang diễn ra?
[ENG SUB]《开始推理吧》完整版第11期”非常打工人”(中):周柯宇自曝凶手?| The Truth S1
Mộng Hoa Sim Remix – Oanh Tạ x H2O | Chuyện Hoa Sim Bên Lưng Đồi Remix TikTok
Ả rập Xê út đánh bại Hàn Quốc ở loạt luân lưu để vào chung kết U17 Châu Á
《灵剑尊》Spirit Sword Sovereign EP583 | 楚行云万仞归元,初生之虎无惧天下挑战 | 腾讯视频 – 动漫
Phim Hành Động Mạo Hiểm Đặc Sắc Siêu Đỉnh | ĐỊA CUNG BÚT KÝ | Phim Lẻ Thuyết Minh 2024
HẾT THƯƠNG CẠN NHỚ | KARAOKE BEAT CHUẨN
Phó Thủ tướng Lê Thành Long: Cần huy động thêm nhân lực thi công cơ sở 2 Bệnh viện Việt Đức và Bạch Mai
Xếp hạng 7 laptop chơi game tốt nhất đầu năm 2025
Cập nhật giá điện thoại Samsung mới nhất 2025 tại Hoàng Hà Mobile
9 năm sau ngày cưới, Victor Vũ – Đinh Ngọc Diệp vẫn nắm chặt tay nhau đi khám bệnh, ân cần chăm sóc nhau mỗi ngày
30 ngày không lặp món: Cứ nhìn bảng này là biết hôm nay ăn gì!
Bộ Y tế hướng dẫn cách xử trí khi bị say nắng, say nóng
Loại quả mùa hè rẻ tiền, ngọt mát giúp làm mát gan, người Việt dùng vào thời điểm này để giúp gan thải độc
Chủ tịch nước Lương Cường: Lắng nghe tâm tư, nguyện vọng của người dân để tạo sự đồng thuận trong thực hiện nhiệm vụ
Quang Hùng Cove demo | Muốn Em Là | media24h88
Ăn ngon – ăn khỏe: 3 món ăn giúp bổ thận, tăng cường sinh lý
ANTARES | Highlight EP07 Zea Salah Tingkah, Ares Tidur di Pangkuannya | WeTV Original
VỀ ĐÂU MÁI TÓC NGƯỜI THƯƠNG | chill
【ENG SUB】第4期:龚俊虞书欣冰箱大曝光! |《拜托了冰箱轰趴季》 Play! Fridge EP4 FULL
7 cách cắt video đơn giản trên máy tính, điện thoại, không cần phần mềm
ĐỪNG ! YÊU NỮA ANH MỆT RỒI | QUANG HÙNG 2023
Nghị quyết của Ủy ban Thường vụ Quốc hội về công tác nhân sự
#kid 还是更想当刚子的爸爸 #脱口秀大会
Cận kề cửa tử vì miếng xoài chui vào phổi
CHUYỆN TÂM LINH Ở CÔN ĐẢO | Nguyễn Huy – Những Chuyện Ly Kỳ
EP155 Trailer 光之晨曦猎魔团挑战圣卫 |《神印王座》Throne of Seal | 腾讯视频 – 动漫
Bé trai vô tình nuốt thỏi vàng khiến bác sĩ sốc nặng
Giải ngán sau Tết với riêu chua chả cá thanh mát
FPT Long Châu đồng hành cùng Bộ Y tế, trao tặng nửa triệu liều vắc xin sởi
Nhạc Thiền Tĩnh Tâm An Lạc – Lắng Nghe Và Cảm Nhận Sự Bình An Trong Tâm Hồn – HAY TUYỆT