Trí tuệ nhân tạo đang thay đổi thế giới, nhưng liệu nó đã đủ thông minh để vượt qua con người? Một bài kiểm tra mang tính bước ngoặt mang tên “Kỳ thi cuối cùng của nhân loại” (HLE) đã được thiết kế để trả lời câu hỏi đó. Và bất ngờ thay, dù sở hữu kho dữ liệu khổng lồ, các mô hình AI đình đám như ChatGPT hay Gemini vẫn bó tay trước thử thách này.
Mục lục
I. HLE – Bài thi khó nhất dành cho AI

HLE là kết quả của sự hợp tác giữa hai tổ chức ở hai thái cực: Trung tâm An toàn AI (Center for AI Safety) – đại diện cho quan điểm kiểm soát và đảm bảo tính an toàn của AI trong xã hội, và Scale AI – công ty chuyên cung cấp dữ liệu huấn luyện cho các tập đoàn công nghệ lớn. Mục tiêu của họ là xác định ranh giới cuối cùng giữa trí tuệ nhân tạo và trí tuệ con người.
Không giống những bài kiểm tra thông thường, HLE không dựa vào khả năng xử lý ngôn ngữ hay phân tích văn bản đơn thuần. Nó bao gồm hơn 2.700 câu hỏi được gửi từ các chuyên gia trên toàn cầu, trải dài từ toán học, vật lý, hóa học, sinh học đến nhân văn, ngôn ngữ cổ và thậm chí cả triết học. Có câu hỏi yêu cầu dịch dòng chữ La Mã cổ, câu khác lại xoáy sâu vào cấu trúc sinh học của chim ruồi – những đề bài mà ngay cả con người cũng phải vất vả suy nghĩ.
II. AI “trượt” – Một thất bại đáng suy ngẫm

Kết quả ban đầu cho thấy: AI đã trượt toàn tập. Các mô hình tiên tiến như Gemini hay DeepSeek chỉ đạt 3-14% độ chính xác. Lý do chính là vì bài kiểm tra quá khó và không thể “lách luật” bằng việc tìm kiếm trên mạng. Mỗi câu hỏi đều có một đáp án duy nhất, không chấp nhận sự mơ hồ hay “vòng vo” thường thấy trong các mô hình ngôn ngữ lớn (LLM).
Việc chấm điểm được tự động hóa bằng GPT-40 – một AI khác đóng vai trò giám khảo, đảm bảo tính công bằng và nhất quán tuyệt đối. Để được công nhận, câu trả lời của AI phải đúng về bản chất, không chỉ đúng theo “cú pháp”.
III. Từ sai lầm đến hy vọng

Dù kết quả ban đầu có vẻ tệ hại, nhưng các chuyên gia không quá bi quan. Theo nhóm nghiên cứu, nếu tốc độ phát triển AI hiện tại được duy trì, các mô hình có thể đạt 50% câu trả lời đúng vào cuối năm 2025. Đây là cột mốc cho thấy AI đang từng bước tiến gần hơn đến ngưỡng cửa của hiểu biết con người.
Một điểm đáng chú ý trong giai đoạn tiếp theo của dự án là việc huấn luyện AI biết khi nào mình không chắc chắn. Thay vì luôn trả lời với độ tự tin 100% – dù có thể sai hoàn toàn – AI giờ sẽ phải đưa ra mức độ tin tưởng cho mỗi câu trả lời, tính theo phần trăm. Chỉ số này giúp giảm thiểu những sai sót nghiêm trọng trong các lĩnh vực nhạy cảm như y tế, pháp luật hay tài chính, nơi một sai lầm nhỏ cũng có thể dẫn đến hậu quả lớn.
IV. Khi AI đối diện giới hạn của chính mình

HLE không chỉ là một bài kiểm tra. Nó là một tấm gương soi để AI nhìn lại những giới hạn mà mình chưa thể vượt qua. Không còn là việc “học vẹt” từ hàng tỷ dữ liệu trên mạng, mà là thách thức khả năng lý luận, phân tích và tự nhận thức – những điều tưởng như chỉ con người mới có.
Thất bại lần này không có nghĩa AI yếu kém, mà là lời nhắc rằng trí tuệ nhân tạo vẫn cần thêm thời gian, sự kiểm soát và định hướng đúng đắn. Và nếu một ngày nào đó AI vượt qua được kỳ thi cuối cùng này, câu hỏi quan trọng sẽ không còn là “AI biết được gì?”, mà sẽ chuyển thành: “Chúng ta còn giữ vai trò gì trong một thế giới mà AI đã thực sự hiểu biết?”
V. Kết luận
“Kỳ thi cuối cùng của nhân loại” đã hé lộ một sự thật thú vị: AI vẫn chưa thể thay thế hoàn toàn trí tuệ con người, ít nhất là ở thời điểm hiện tại. Nhưng con đường phía trước vẫn rộng mở. Sự thất bại của AI hôm nay có thể là nền tảng cho những bước tiến vượt bậc ngày mai. Và cuộc đua giữa trí tuệ tự nhiên và trí tuệ nhân tạo chắc chắn sẽ còn nhiều hồi hấp dẫn hơn nữa.
Hãy cùng Phong Vũ Tech News cập nhật thêm nhiều thông tin về công nghệ trí tuệ nhân tạo trong những bài viết khác tại blog Tin Tức nhé!
Bài viết liên quan:
- ChatGPT trở thành chuyên gia định vị ảnh: Tác động và triển vọng
- Khi AI “Nổi Loạn”: Hồi chuông cảnh báo từ trí tuệ nhân tạo vượt trội
- Nhân tố nào sẽ bị Trí tuệ nhân tạo – AI thay thế?

Thời Sự
Trường Đại học Kinh tế – Luật công bố điểm sàn năm 2025
Th7
Video
Cách làm MƯỚP HƯƠNG XÀO TIM ngon, bổ | MÓN NGON MỖI NGÀY
Th7
Thể Thao
Nhận định bóng đá hôm nay 25/7: U23 Việt Nam vs U23 Philippines, U23 Indonesia vs U23 Thái Lan
Th7
Thời Sự
Nơi điều dưỡng những thương binh “thời hoa lửa”
Th7
Giải Trí
Việt Nam có một xã lọt top bí ẩn nhất châu Á, đẹp như chốn bồng lai với đặc sản bổ như sâm mà rẻ hơn khoai lang
Th7
Thời Sự
Hà Nội chặn “cò” làm giấy tờ đất đai
Th7
Giải Trí
Phim chiến tranh ‘Mưa đỏ’ chưa công chiếu đã gây xúc động mạnh
Th7
Radio My
Sau khi nghỉ hưu, tôi nhận ra: Giàu hay nghèo thì tuổi già vẫn giống nhau ở một điều
Th7
Radio My
Yêu nhầm kẻ lừa đảo suốt 8 năm, anh công nhân bị lừa mất 2,3 tỷ đồng
Th7
Video
Cách làm CÁ RÔ KHO CÀ BÁT ngon tuyệt hảo | MÓN NGON MỖI NGÀY
Th7
Công Nghệ
Đã chuyển khoản 1,5 tỷ đồng nhưng shipper vẫn không cho nhận hàng, người phụ nữ báo công an
Th7
Thời Sự
Chăm lo chu đáo để đời sống người có công tốt đẹp hơn
Th7
Thể Thao
Juventus bất ngờ dừng đàm phán Jadon Sancho, MU tiếc rẻ
Th7
Giải Trí
Diệp Lâm Anh đáp trả về tin đồn bị công an bắt trong ‘bữa tiệc ma túy’
Th7
Thời Sự
Trường ĐH Giao thông vận tải công bố điểm sàn tuyển sinh năm 2025
Th7
Video
Cách làm CANH BÍ ĐỎ RONG BIỂN bổ dưỡng | MÓN NGON MỖI NGÀY
Th7
Thời Sự
Góp phần nâng cao hiệu quả hoạt động của hệ thống chính trị cơ sở thời kỳ mới
Th7
Thời Sự
Người phụ nữ khóc lặng nhìn lũ cuốn trôi 2 căn nhà xa 10m, sắp rơi xuống sông
Th7
Thể Thao
Tin tức về chuyển nhượng 23/7: MU mua Hjulmand, Man City ký Kounde
Th7
Video
Cách làm CANH MĂNG KHÔ ĐUÔI BÒ lạ, ngon | MÓN NGON MỖI NGÀY
Th7
Thời Sự
Đẩy mạnh chuyển đổi số, nâng cao hiệu quả công tác tuyên truyền của Mặt trận
Th7
Thời Sự
Nhóm 3 người làm điều ‘không tưởng’ trong cơn lũ dữ trên sông Lam
Th7
Thể Thao
CAHN ra mắt hợp đồng ‘bom tấn’ cầu thủ Việt kiều chơi bóng ở Anh
Th7
Video
Cách làm CANH RIÊU CÁ CHÉP thanh đạm | MÓN NGON MỖI NGÀY
Th7
Công Nghệ
Làm theo thầy giáo, 2 học trò thao tác chuyển khoản 5 triệu nhưng thực tế lại mất 15 tỷ đồng
Th7
Thời Sự
Toàn văn Nghị quyết Hội nghị lần thứ 12 Ban Chấp hành Trung ương Đảng khóa XIII
Th7
Thời Sự
Nữ trưởng văn phòng công chứng cấu kết với đồng phạm lừa đảo hơn 16 tỷ đồng
Th7
Thể Thao
Isak đòi lương cao khiến Newcastle choáng váng
Th7
Giải Trí
MONO hít phải khí độc, Ngô Kiến Huy ám ảnh vụ cháy kinh hoàng
Th7
Video
Cách làm CƠM CHIÊN CÁ MẶN dân dã, đậm đà | MÓN NGON MỖI NGÀY
Th7
Công Nghệ
Google Maps có một tính năng đặc biệt hữu ích, có thể “cứu nguy” đối với các chủ sở hữu ô tô điện
Th7
Thời Sự
Nguyên Phó Chánh án TAND Cấp cao tại Đà Nẵng đầu thú vì nhận hối lộ
Th7
Thể Thao
Lịch thi đấu bóng đá hôm nay 24/7
Th7
Thời Sự
Trường Đại học Ngân hàng TPHCM công bố điểm sàn năm 2025
Th7
Video
Cách làm CHẢ NGHÊU HÚNG QUẾ ngon, lạ vị | MÓN NGON MỖI NGÀY
Th7
Công Nghệ
Yahoo Nhật Bản bắt buộc nhân viên sử dụng AI, kỳ vọng tăng gấp đôi năng suất vào năm 2028
Th7
Thời Sự
Tin mới nhất về bão số 4 Cỏ May: Khả năng đạt cấp bão mạnh, liên tục đổi hướng
Th7
Thể Thao
Kết quả bóng đá hôm nay 24/7: Tây Ban Nha hạ Đức để vào chung kết
Th7
Giải Trí
Niềm tự hào và ký ức tủi thân chưa từng kể của MC Lại Văn Sâm
Th7
Thời Sự
Điểm sàn vào Trường Đại học Dược Hà Nội cao nhất là 22
Th7
Video
Cách làm CƠM GÀ đơn giản, ngon, bổ dưỡng | MÓN NGON MỖI NGÀY
Th7
Công Nghệ
Nói thật là: 2025 rồi, bạn không cần cố “lên đời” smartphone mới nhất nữa đâu
Th7
Thời Sự
Tập trung khắc phục hậu quả bão số 3 và mưa lũ
Th7
Giải Trí
Phiên chợ lâu đời và sầm uất bậc nhất Cao Bằng, du khách nào cũng muốn ghé thử một lần
Th7
Thời Sự
Rapper Bình Gold bị truy bắt vì dương tính ma túy, lái Audi chèn ép xe khác trên cao tốc
Th7
Giải Trí
Hoa hậu Tiểu Vy hở bạo thả dáng trên du thuyền, ca sĩ Soobin thư giãn
Th7
Thời Sự
Hà Nội công bố 1.132 học sinh trúng tuyển bổ sung lớp 10 công lập năm 2025
Th7
Video
Cách làm CUỐN CHẢ TÔM ngon tuyệt đỉnh | MÓN NGON MỖI NGÀY
Th7
Thể Thao
Real Madrid: Khủng hoảng thừa ở hàng phòng ngự
Th7
Công Nghệ
Better Choice Awards sắp trở lại, bắt đầu giai đoạn tiếp nhận hồ sơ đăng ký tham gia
Th7
Radio My
Bố chồng mất, chúng tôi đón mẹ lên sống cùng, nhưng mỗi đêm bà lại làm điều khiến tôi gai người, mất ngủ
Th7
Thể Thao
Arsenal dốc két 200 triệu bảng, nổ liền 3 ‘bom tấn’ chuyển nhượng
Th7
Video
CÁCH LÀM LẨU BABA OM CHUỐI ĐẬU | LẠC ĐƯỜNG VLOG
Th6
Video
Cách làm HÀU TRỘN MẦM CẢI độc đáo | MÓN NGON MỖI NGÀY
Th7
Thời Sự
Công việc tay chân hút nhân viên văn phòng Mỹ
Th6
Thời Sự
ĐH Bách khoa TPHCM tuyển sinh theo 1 phương thức, thí sinh chọn tổ hợp xét tuyển
Th6
Ẩm Thực
Hướng dẫn làm mứt cà rốt dẻo ăn lạ miệng
Th6
Video
Lễ tình yêu, đổ liêu xiêu – PANCAKE TRÀ SỮA | MÓN NGON MỖI NGÀY
Th6