Trí tuệ nhân tạo đang thay đổi thế giới, nhưng liệu nó đã đủ thông minh để vượt qua con người? Một bài kiểm tra mang tính bước ngoặt mang tên “Kỳ thi cuối cùng của nhân loại” (HLE) đã được thiết kế để trả lời câu hỏi đó. Và bất ngờ thay, dù sở hữu kho dữ liệu khổng lồ, các mô hình AI đình đám như ChatGPT hay Gemini vẫn bó tay trước thử thách này.
Mục lục
I. HLE – Bài thi khó nhất dành cho AI

HLE là kết quả của sự hợp tác giữa hai tổ chức ở hai thái cực: Trung tâm An toàn AI (Center for AI Safety) – đại diện cho quan điểm kiểm soát và đảm bảo tính an toàn của AI trong xã hội, và Scale AI – công ty chuyên cung cấp dữ liệu huấn luyện cho các tập đoàn công nghệ lớn. Mục tiêu của họ là xác định ranh giới cuối cùng giữa trí tuệ nhân tạo và trí tuệ con người.
Không giống những bài kiểm tra thông thường, HLE không dựa vào khả năng xử lý ngôn ngữ hay phân tích văn bản đơn thuần. Nó bao gồm hơn 2.700 câu hỏi được gửi từ các chuyên gia trên toàn cầu, trải dài từ toán học, vật lý, hóa học, sinh học đến nhân văn, ngôn ngữ cổ và thậm chí cả triết học. Có câu hỏi yêu cầu dịch dòng chữ La Mã cổ, câu khác lại xoáy sâu vào cấu trúc sinh học của chim ruồi – những đề bài mà ngay cả con người cũng phải vất vả suy nghĩ.
II. AI “trượt” – Một thất bại đáng suy ngẫm

Kết quả ban đầu cho thấy: AI đã trượt toàn tập. Các mô hình tiên tiến như Gemini hay DeepSeek chỉ đạt 3-14% độ chính xác. Lý do chính là vì bài kiểm tra quá khó và không thể “lách luật” bằng việc tìm kiếm trên mạng. Mỗi câu hỏi đều có một đáp án duy nhất, không chấp nhận sự mơ hồ hay “vòng vo” thường thấy trong các mô hình ngôn ngữ lớn (LLM).
Việc chấm điểm được tự động hóa bằng GPT-40 – một AI khác đóng vai trò giám khảo, đảm bảo tính công bằng và nhất quán tuyệt đối. Để được công nhận, câu trả lời của AI phải đúng về bản chất, không chỉ đúng theo “cú pháp”.
III. Từ sai lầm đến hy vọng

Dù kết quả ban đầu có vẻ tệ hại, nhưng các chuyên gia không quá bi quan. Theo nhóm nghiên cứu, nếu tốc độ phát triển AI hiện tại được duy trì, các mô hình có thể đạt 50% câu trả lời đúng vào cuối năm 2025. Đây là cột mốc cho thấy AI đang từng bước tiến gần hơn đến ngưỡng cửa của hiểu biết con người.
Một điểm đáng chú ý trong giai đoạn tiếp theo của dự án là việc huấn luyện AI biết khi nào mình không chắc chắn. Thay vì luôn trả lời với độ tự tin 100% – dù có thể sai hoàn toàn – AI giờ sẽ phải đưa ra mức độ tin tưởng cho mỗi câu trả lời, tính theo phần trăm. Chỉ số này giúp giảm thiểu những sai sót nghiêm trọng trong các lĩnh vực nhạy cảm như y tế, pháp luật hay tài chính, nơi một sai lầm nhỏ cũng có thể dẫn đến hậu quả lớn.
IV. Khi AI đối diện giới hạn của chính mình

HLE không chỉ là một bài kiểm tra. Nó là một tấm gương soi để AI nhìn lại những giới hạn mà mình chưa thể vượt qua. Không còn là việc “học vẹt” từ hàng tỷ dữ liệu trên mạng, mà là thách thức khả năng lý luận, phân tích và tự nhận thức – những điều tưởng như chỉ con người mới có.
Thất bại lần này không có nghĩa AI yếu kém, mà là lời nhắc rằng trí tuệ nhân tạo vẫn cần thêm thời gian, sự kiểm soát và định hướng đúng đắn. Và nếu một ngày nào đó AI vượt qua được kỳ thi cuối cùng này, câu hỏi quan trọng sẽ không còn là “AI biết được gì?”, mà sẽ chuyển thành: “Chúng ta còn giữ vai trò gì trong một thế giới mà AI đã thực sự hiểu biết?”
V. Kết luận
“Kỳ thi cuối cùng của nhân loại” đã hé lộ một sự thật thú vị: AI vẫn chưa thể thay thế hoàn toàn trí tuệ con người, ít nhất là ở thời điểm hiện tại. Nhưng con đường phía trước vẫn rộng mở. Sự thất bại của AI hôm nay có thể là nền tảng cho những bước tiến vượt bậc ngày mai. Và cuộc đua giữa trí tuệ tự nhiên và trí tuệ nhân tạo chắc chắn sẽ còn nhiều hồi hấp dẫn hơn nữa.
Hãy cùng Phong Vũ Tech News cập nhật thêm nhiều thông tin về công nghệ trí tuệ nhân tạo trong những bài viết khác tại blog Tin Tức nhé!
Bài viết liên quan:
- ChatGPT trở thành chuyên gia định vị ảnh: Tác động và triển vọng
- Khi AI “Nổi Loạn”: Hồi chuông cảnh báo từ trí tuệ nhân tạo vượt trội
- Nhân tố nào sẽ bị Trí tuệ nhân tạo – AI thay thế?

Video
CÁCH LÀM MÓN GỎI CÁ NGON NỨC NỞ| MÓN NGON MỖI NGÀY
Th7
Công Nghệ
Google Pixel 10 Pro và Pixel 10 Pro XL lộ diện: Thiết kế quen thuộc, sắc màu mới đầy cuốn hút
Th7
Giải Trí
Phiên chợ độc nhất giữa lòng Thanh Hóa: Chỉ họp 1 buổi trong tuần, trao đổi hàng hóa không cần mặc cả
Th7
Thời Sự
Bị chia tay, vác súng tới nhà bạn gái cũ bắn trọng thương tình địch
Th7
Thể Thao
MU thất bại trong nỗ lực chiêu mộ thủ môn số 1 Thế giới
Th7
Thời Sự
Trường Đại học Khoa học Xã hội và Nhân văn TPHCM công bố điểm sàn năm 2025
Th7
Video
CÁCH LÀM GÀ XÀO NGŨ SẮC NGON LẠC TRÔI | MÓN NGON MỖI NGÀY
Th7
Quang Hùng Video
#tintuc #news #thịnhhành #wipha
Th7
Công Nghệ
Đồng hồ Candino Limited Edition 2025 – biểu tượng tinh hoa Thụy Sỹ và tự hào Việt Nam
Th7
Công Nghệ
Công nghệ mỏng như giấy, tham vọng nặng ngàn cân: Nhật Bản tung át chủ bài để tái chiếm lại vị thế đã mất vào tay Trung Quốc
Th7
Thời Sự
Thực hiện trả lương công chức theo vị trí việc làm trước ngày 1/7/2027
Th7
Thời Sự
Đại diện Thuỷ điện Bản Vẽ nói về thông tin ‘nước lũ 5.000 năm mới có một lần’
Th7
Thể Thao
Scottie Scheffler vô địch The Open 2025: Người đặc biệt của golf
Th7
Giải Trí
Thái Thùy Linh xin lỗi vì đăng nhầm ảnh nạn nhân vụ lật tàu ở Quảng Ninh
Th7
Thời Sự
Trường ĐH Y Dược – ĐH Quốc gia Hà Nội công bố điểm sàn tuyển sinh năm 2025
Th7
Video
Cách làm LẨU VỊT TÍA TÔ ngon tuyệt đỉnh | MÓN NGON MỖI NGÀY
Th7
Thể Thao
Liverpool: Tại sao có thể mua sắm ầm ỹ vậy?
Th7
Công Nghệ
Một tính năng trên iPhone cần tắt trước khi bạn nâng cấp hoặc ngừng sử dụng để tránh hậu quả sau này
Th7
Thời Sự
Lũ lên nhanh, các xã miền núi Nghệ An ngập sâu trong nước
Th7
Thời Sự
Kết cục bi đát của nhóm ‘quái xế’ Đông Anh gây ra đêm kinh hoàng ở Hà Nội
Th7
Thể Thao
U23 Việt Nam thắng vất vả Campuchia, HLV Kim Sang Sik nói gì?
Th7
Công Nghệ
Phạt đến 5% doanh thu nếu doanh nghiệp vi phạm quy định về dữ liệu cá nhân
Th7
Giải Trí
Bom tấn 5000 tỷ ‘Bộ tứ siêu đẳng’ của Marvel đối đầu ‘Thám tử lừng danh Conan’
Th7
Video
Cách làm SƯỜN VÀ ĐẬU HŨ KHO thơm mê mẩn | MÓN NGON MỖI NGÀY
Th7
Thể Thao
Arsenal thắng tối thiểu Milan, nhưng thua luân lưu vì quy định lạ ở giải giao hữu tại Singapore
Th7
Công Nghệ
Tạo bất ngờ lãng mạn với mã QR chứa lời nhắn yêu thương kèm hiệu ứng lung linh, xem ngay
Th7
Công Nghệ
Ngành công nghiệp lớn thứ 6 thế giới của Nga bị lệnh trừng phạt bóp nghẹt: Thiệt hại gần chục tỷ USD mỗi năm, 1/4 doanh nghiệp có nguy cơ đóng cửa, quan chức thừa nhận tình hình ngày càng xấu
Th7
Thời Sự
Quyết tâm đổi mới vì sự phát triển bền vững
Th7
Thời Sự
Bộ Công an lấy ý kiến về ‘Ngày tưởng niệm nạn nhân của ma túy’
Th7
Giải Trí
Diễn viên Sử Hoàng Sơn qua đời ở tuổi 33
Th7
Thời Sự
Trường ĐH Ngoại thương công bố điểm sàn tuyển sinh năm 2025
Th7
Radio My
Tranh luận chuyện ai giữ tiền sau kết hôn, cặp đôi từng đổ vỡ từ chối hẹn hò
Th7
Video
Cách làm PANCAKE CHOCOLATE NHÂN KEM DÂU | MÓN NGON MỖI NGÀY
Th7
Công Nghệ
Redmi Note 15 Pro+ lộ diện: Pin gần 8.000mAh, camera kép 50MP chuyên zoom, cấu hình vẫn ngon, giá dự kiến khoảng 10 triệu
Th7
Công Nghệ
HUAWEI Pura 80 Series gây ấn tượng với công nghệ camera đột phá tại sự kiện ra mắt khu vực Châu Á – Thái Bình Dương
Th7
Thời Sự
Đảng bộ phường Hoàn Kiếm tổ chức Đại hội lần thứ I
Th7
Thể Thao
Link xem trực tiếp bóng đá U23 Thái Lan vs U23 Myanmar, 20h hôm nay 22/7
Th7
Giải Trí
Chuyện chưa kể về nữ ca sĩ có cái tên ‘lạ’: Bão Ngọc
Th7
Thời Sự
Bộ Giáo dục công bố: 25 điểm khối C bằng 21,35 điểm khối D
Th7
Radio My
Chuyển 3 tỉ để nhờ bố mẹ đứng tên mua nhà, con trai cay đắng sau lời hứa của mẹ
Th7
Video
CÁCH LÀM RONG BIỂN CUỘN ĐẬU HŨ VỊ NHẬT NGON XUẤT SẮC | MÓN NGON MỖI NGÀY
Th7
Công Nghệ
Laptop MSI Modern vượt trội giá tốt chỉ từ 11.49 triệu, 100% tặng kèm Microsoft Office
Th7
Công Nghệ
Transcend ra mắt ổ SSD tương thích với MagSafe
Th7
Thời Sự
Tổ chức thành công Đại hội Chi bộ Cơ quan Ủy ban MTTQ Việt Nam phường Văn Miếu – Quốc Tử Giám lần thứ I
Th7
Thời Sự
Chìm tàu cá khi tránh trú bão số 3 Wipha, 4 thuyền viên được cứu sống
Th7
Thể Thao
Real Madrid ra tối hậu thư cho Vinicius, cảnh báo trò ‘bẩn’
Th7
Thời Sự
Bộ GD-ĐT công bố điểm sàn nhóm ngành sức khỏe năm 2025
Th7
Radio My
Được thừa kế đất vì chăm cha mẹ, bỏ học nuôi em, nhưng khi đất tăng giá, 3 em trai quay lại đòi chia
Th7
Radio My
Gia thế ‘khủng’ của chồng nữ giám đốc ngoại tình với CEO Astronomer
Th7
Video
CÁCH LÀM BÁNH KIM CHI HẢI SẢN GIÒN RỤM | MÓN NGON MỖI NGÀY
Th7
Thời Sự
Khai mạc Đại hội Đảng bộ Công an Hà Nội nhiệm kỳ 2025 – 2030: Hướng tới kỷ nguyên đổi mới và phát triển
Th7
Thể Thao
Người giành giải Nhất Giải thưởng Văn học Kim Đồng sẽ hỏi người lớn cách tiêu tiền
Th6
Công Nghệ
Samsung Galaxy Z Fold 7 – chuẩn mực toàn năng mới với “Trải nghiệm Ultra. Gập Mở”
Th7
Công Nghệ
Người Celt là bộ tộc hung dữ?
Th6
Thể Thao
Cầu thủ 21 tuổi ghi bàn khiến Bayern Munich nhận thất bại đầu tiên ở FIFA Club World Cup
Th6
Công Nghệ
Những flagship nhỏ gọn sắp ra mắt năm 2025
Th6
Thể Thao
PSG – Atletico Madrid: Vũ điệu cuối cùng của Griezmann
Th6
Thể Thao
Người hùng của Chelsea bối rối vì hành động bất ngờ của Tổng thống Donald Trump tại FIFA Club World Cup 2025
Th7