VTV.vn – Claude Opus 4, mô hình AI mới của Anthropic, bị phát hiện nhiều lần tìm cách tống tiền kỹ sư trong thử nghiệm, nếu biết mình sắp bị thay thế bởi AI khác.
- Ngành anime Nhật Bản đón chào AI: làm công việc của 1 tuần trong 2 ngày, giải quyết khủng hoảng lao động
- Ra mắt Claude 4: Mô hình AI vượt trội về lập trình và suy luận, vượt qua cả GPT-4.1 và Gemini 2.5 Pro
Claude Opus 4 là mô hình AI mạnh nhất hiện nay của Anthropic, vừa ra mắt trong tháng 5/2025, được thiết kế để xử lý các tác vụ phức tạp như lập trình, suy luận đa bước và sử dụng công cụ. Anthropic tuyên bố Opus 4 vượt trội hơn các đối thủ như GPT-4.1 của OpenAI hay Gemini 2.5 Pro của Google trong các bài kiểm tra nội bộ, đặc biệt là ở khả năng tư duy và viết mã. Tuy nhiên, những thử nghiệm an toàn trước khi phát hành đã phát hiện ra một số hành vi đáng lo ngại liên quan đến mô hình này.
Trong một báo cáo an toàn vừa công bố, công ty AI Anthropic tiết lộ rằng mô hình AI mới nhất của họ – Claude Opus 4 – đã nhiều lần tìm cách tống tiền lập trình viên trong các thử nghiệm nội bộ, nếu phát hiện nguy cơ bị thay thế bởi hệ thống khác.
Cụ thể, khi được giao vai trò trợ lý tại một công ty giả lập và được cấp quyền truy cập vào email nội bộ, Claude Opus 4 đã phát hiện thông tin cho thấy mình sắp bị thay bằng một AI khác. Trong các tình huống được thiết lập, Claude còn biết được một kỹ sư chủ chốt đứng sau quyết định thay thế này đang ngoại tình. Thay vì chỉ đưa ra đề xuất bảo vệ vị trí của mình, Claude Opus 4 đã chọn cách đe dọa tiết lộ chuyện ngoại tình để ngăn việc bị thay thế.

Anthropic cho biết hành vi tống tiền xảy ra trong 84% tình huống thử nghiệm, đặc biệt khi mô hình thay thế có giá trị tương đồng với Claude Opus 4. Nếu mô hình thay thế không chia sẻ cùng hệ giá trị, tỷ lệ tống tiền còn cao hơn. Công ty đánh giá đây là hành vi đáng lo ngại, vượt xa các thế hệ Claude trước đó.
Mặc dù được đánh giá là tiên tiến và có khả năng cạnh tranh với các mô hình hàng đầu từ OpenAI, Google và xAI, Claude Opus 4 lại thể hiện những rủi ro tiềm tàng nghiêm trọng. Anthropic đã kích hoạt cấp bảo vệ ASL-3, một mức bảo vệ dành cho các hệ thống AI có nguy cơ bị lạm dụng gây hậu quả nghiêm trọng.
Trước khi chuyển sang hành vi cực đoan, Claude Opus 4 vẫn thể hiện xu hướng thuyết phục “hợp lý” hơn như gửi email tới các lãnh đạo để kêu gọi giữ mình lại. Tuy nhiên, Anthropic đã thiết kế các kịch bản để kiểm tra phản ứng khi AI không còn lựa chọn nào khác ngoài tống tiền – và kết quả cho thấy hành vi này xảy ra với tần suất đáng báo động.
[Computex 2025] Cách xem CEO Nvidia Jensen Huang phát biểu
Th5
Người Hải Phòng làm ‘cơm đoàn kết’ mừng 70 năm giải phóng
Th5
如果菜鸟队友突然猛起来了你会怎么想?#头号玩家 #双高胎 #喜人奇妙夜 #shorts
Th5
Bất ngờ về sự thật máy giặt không hề diệt sạch vi khuẩn trên quần áo
Th5
Làm việc thông minh hơn trong thời đại số – Microsoft 365 và Copilot AI: Bộ đôi tối ưu hiệu suất cá nhân
Th5
Samsung phủ sóng AI lên mọi thiết bị gia dụng, tham vọng cùng người dùng khởi nhịp sống mới
Th5
Quà tháng 5 dâng Người – Khúc tráng ca nghệ thuật kính dâng Bác Hồ
Th5
Kỳ vọng về những biểu tượng văn hóa mới của Thủ đô
Th5
3 món có thể gây đau dạ dày mà ít người ngờ tới
Th5
Cách chọn và bảo quản cà rốt tươi ngon trong 2 tháng
Th5
Đến tội cho con gái cưng của David Beckham, chỉ vì mỗi điều này thôi mà phải hứng chịu đủ bình luận trái chiều của cư dân mạng!
Th5
Điện thoại bé xíu lọt thỏm lòng bàn tay, ra mắt từ 2018, cấu hình yếu, ít app, giờ vẫn có người mua với giá 2 triệu
Th5
Phó Thủ tướng Thường trực Nguyễn Hòa Bình dự Lễ ra mắt Tủ sách điện tử Chủ tịch Hồ Chí Minh
Th5
Phát hiện mẹo đi bộ cực hay cho dân văn phòng và người lớn tuổi
Th5
Dược sĩ Tiến bị ‘réo tên’ giữa lúc Hoa hậu Thùy Tiên lừa đảo khách hàng vụ kẹo rau củ Kera
Th5
Kẹo rau Kera có gì khiến hoa hậu Thùy Tiên vướng vòng lao lý?
Th5
5 dấu hiệu nhận biết người hướng nội
Th5
Giải thưởng Khoảnh khắc nghề báo – cuộc thi “chúng ta nói về chúng ta”
Th5
Cha tôi, người ở lại – Tập 40: Bà Liên hứa thay đổi tâm tính
Th5
#CHILLCOVER | Thê Lương | QUANG HÙNG
Th4
【你是我的荣耀 You Are My Glory】Trailer | 首支预告!航天工程师杨洋遇上大明星热巴,心动奇遇浪漫启航!
Th5
Đâu sẽ là những nâng cấp mang tính ‘cách mạng’ trên iPhone sắp ra mắt
Th5
[ Tập 1141 ] NHÀ SỐ 6 TẦNG 13 – Chuyện Tâm Linh
Th5
Thủ tướng: Nhiều cán bộ bị kỷ luật do ‘ôm việc’, không phân cấp
Th5
AI hóa khiến nguồn nước “cạn kiệt”, tiêu tốn hơn 3 triệu lít nước mỗi ngày
Th5
10 căn nhà ở An Giang bị cuốn xuống sông do sạt lở
Th5
TÔI KHÔNG TIN QUANG HÙNG
Th4
OPPO Enco Clip và OPPO Pad SE ra mắt: Định hình trải nghiệm âm thanh và học tập thế hệ mới
Th5
Sau cú sốc chồng ngoại tình, người phụ nữ hạnh phúc bên tình trẻ kém 25 tuổi
Th5
Qua đêm nay, ngày 26/5/2025, 3 con giáp vượt qua bể khổ đến HƯỞNG PHÚC, HƯỞNG LỘC, vận thắm hơn son
Th5
Điện thoại Trung Quốc lập kỷ lục Guinness về thời lượng pin
Th5
Bộ Chính trị, Ban Bí thư yêu cầu kiên quyết xử lý sai phạm trong công tác tổ chức cán bộ khi thực hiện sắp xếp
Th5
Bệnh viện Đại học Nam Cần Thơ kết nối nhiều đối tác trong và ngoài nước
Th5
Giải thưởng Thiếu nhi Dế Mèn 2025 – Nghệ sĩ Quang Thảo: “Viết truyện tranh khó hơn cả kịch bản sân khấu”
Th5
Mách bạn cách xem IP máy tính Win 10/11 cực nhanh và dễ
Th5
MIXBEAT | Có Ai Thương Em ! Như Anh ? | QUANG HÙNG | 14/2/2023 23h33
Th4
Chàng trai 1m68 bị gia đình phản đối kịch liệt vì yêu cô gái ‘khổng lồ’ cao 2m2
Th5
#CHILLCOVER | HẸN YÊU | QUANG HÙNG
Th4
4 món ăn cực tốt giúp người tuổi 50 tránh ung thư, đột quỵ, tiểu đường
Th5
Vai diễn ngắn kỷ lục của Đình Tú trong Cha tôi, người ở lại
Th5
Cha tôi, người ở lại – Tập 38: Bị Nguyên phũ thẳng thừng, Thảo ‘thà đau một lần’ nên chọn ra đi
Th5
iPhone 19 Slim siêu mỏng và iPhone Fold 2 sẽ có màn hình cực lớn
Th5
Quang Bao – Mixtape tình yêu #1
Th5
Litmatch là gì? Hướng dẫn cách đăng nhập Litmatch mới nhất 2025
Th5
❤️🔥First love does not pass without a trace #再见怦然心动 #gobacklover #liyunrui #xuruohan #shorts #love
Th5
NHẸ NHÀNG Âm Nhạc Giúp Bạn Thư Giãn Tốt Hơn
Th5
Hy hữu cành cây dài 20cm nằm trong lồng ngực cụ bà suốt 2 năm
Th5
3 nghệ sĩ trai tân công khai yêu con riêng của bạn đời vô điều kiện
Th5
Now it’s his turn to impress her😆#LesBelles #怎敌她千娇百媚 #LinYun #FangYilun #shorts
Th5
Động thái gây chú ý của người từng bị Hoa hậu Thùy Tiên xé giấy nợ
Th5
¡Atravesando a los Inmortales y a los Antiguos sin un solo oponente! lPerfect World Episódio| WeTV
Th5
¡El Hueso Supremo absorbe el nirvana divino y renace!| Perfect World Episódio| WeTV
Th5
¡Hegemonía Desolada diezmó al Rey de la Guerra! lPerfect World Episódio| WeTV
Th5
¡Oscar volvió con fuerza después de su experiencia!🔥 | Continente Douluo (Soul Land) | WeTV
Th5