Khi chúng ta không hiểu rõ công cụ của mình, liệu nó có an toàn để sử dụng?

Trong một bài viết gây chấn động vừa được đăng tải trên trang web cá nhân, Dario Amodei – CEO của Anthropic, công ty đứng sau chatbot Claude – đã công khai thừa nhận một sự thật khó tin: không ai thực sự hiểu rõ cách AI hoạt động. Tuyên bố này đến từ người đứng đầu một trong những phòng thí nghiệm trí tuệ nhân tạo hàng đầu thế giới, khiến nhiều người ngạc nhiên và lo ngại về công nghệ đang thay đổi cuộc sống hàng ngày của chúng ta.
” Khi một hệ thống AI tạo sinh thực hiện một việc gì đó, như tóm tắt một tài liệu tài chính, chúng ta không hề biết, ở mức độ cụ thể hay chính xác, tại sao nó đưa ra những lựa chọn đó – tại sao nó chọn từ ngữ này thay vì từ ngữ khác, hoặc tại sao đôi khi nó mắc lỗi dù thường xuyên chính xác ,” CEO Anthropic viết.

Dario Amodei – CEO của Anthropic, công ty đứng sau chatbot Claude
Ông tiếp tục thừa nhận rằng những người ngoài ngành AI có thể ngạc nhiên khi biết rằng ngay cả những người xây dựng công nghệ cũng ” không hiểu cách hoạt động của chính những sáng tạo AI của họ” và bất kỳ ai lo ngại về sự thiếu hiểu biết này đều “có quyền lo lắng .”
Để giải quyết vấn đề này, Amodei đã công bố kế hoạch tạo ra một “MRI cho AI” trong thập kỷ tới. Mục tiêu không chỉ là tìm hiểu cơ chế hoạt động của công nghệ, mà còn ngăn chặn bất kỳ mối nguy hiểm không lường trước nào liên quan đến bản chất bí ẩn hiện tại của nó. Theo ông, “sự thiếu hiểu biết này về cơ bản là chưa từng có trong lịch sử công nghệ.”
Điều này phần nào giải thích lý do Amodei và chị gái Daniela rời OpenAI vào cuối năm 2020 giữa những lo ngại về các thực hành an toàn của công ty do Sam Altman điều hành. Cụ thể, họ lo ngại rằng OpenAI đang gạt bỏ những quan ngại về an toàn để theo đuổi lợi nhuận. Amodei cùng năm đồng nghiệp cũ từ OpenAI đã thành lập Anthropic vào năm sau đó với mục tiêu xây dựng AI an toàn hơn – và một phần công việc này dường như tập trung vào việc tìm hiểu cơ chế hoạt động của công nghệ.
Trong những tháng gần đây, Amodei cho biết Anthropic không chỉ tập trung vào việc giúp “điều hướng” AI theo hướng có lợi cho nhân loại, mà còn nghiên cứu “khả năng hấp dẫn” rằng các nhà nghiên cứu cuối cùng có thể hiểu được cách hoạt động bên trong của các hệ thống này ” trước khi các mô hình đạt đến mức độ sức mạnh áp đảo .”

Để minh họa cho những nỗ lực này, CEO Anthropic đã chia sẻ về một thí nghiệm gần đây của công ty. Trong thí nghiệm, một “đội đỏ” cố tình đưa vào một vấn đề trong một mô hình AI (chẳng hạn như xu hướng khai thác lỗ hổng trong một nhiệm vụ) và giao cho các “đội xanh” nhiệm vụ tìm ra điều gì sai với nó. Nhiều đội xanh đã thành công trong việc phát hiện vấn đề, một số thậm chí đã áp dụng hiệu quả các công cụ diễn giải trong quá trình điều tra.
Mặc dù còn nhiều việc phải làm để mở rộng quy mô các “công cụ” này, nhưng thật thú vị khi biết rằng những người tại đối thủ lớn nhất của OpenAI không chỉ đang nỗ lực phát triển AI tiên tiến hơn, mà còn tự giao cho mình nhiệm vụ tìm hiểu lý do và cách thức hoạt động của nó.
“AI mạnh mẽ sẽ định hình vận mệnh của nhân loại,” Amodei kết luận, “và chúng ta xứng đáng hiểu được những sáng tạo của chính mình trước khi chúng biến đổi triệt để nền kinh tế, cuộc sống và tương lai của chúng ta.” Lời cảnh báo này từ người trong cuộc đặt ra câu hỏi về trách nhiệm của các công ty công nghệ trong việc phát triển những hệ thống mà họ chưa thực sự hiểu rõ, đồng thời nhấn mạnh tầm quan trọng của việc nghiên cứu sâu hơn về cách hoạt động nội tại của AI trước khi công nghệ này trở nên quá mạnh để kiểm soát.
Theo
Thanh niên Việt
Copy link
Lấy link
Tạ Đình Phong gây chú ý khi có nhiều hành động thể hiện tình yêu với Vương Phi
Th4
Công an Bình Thuận cảnh báo thủ đoạn lừa đảo khiến tài khoản ngân hàng bị rút sạch tiền
Th4
Mẹ biển – Tập 33: Huệ về quê vì muốn kiếm lợi từ con gái
Th5
[VIETSUB] Cá Mập Khổng Lồ | Cá mập đột biến mất kiểm soát, nguy hiểm cho loài người! | Phim Lẻ YOUKU
Th4
Lỡ Mối Duyên Quê – Đoàn Minh ft Lý Diệu Linh (MV OFFICIAL)
Th5
Dùng AI để đăng thông tin bôi nhọ OPPO, một nhóm người bị tuyên án tù
Th4
Ông Trương Gia Bình: Không đào tạo được nhân lực AI, sẽ đứng ngoài cuộc chơi công nghệ
Th5
Cuộc hội ngộ với Trường Sa của người con liệt sĩ
Th5
CHILLCOVER# THANH XUÂN ! EM TRẢ CHO ANH ? | QUANG HÙNG
Th4
[THUYẾT MINH] Tay Bắn Tỉa: Báo Thù – Sniper Vengeance | Đụng Độ Nhóm Sát Thủ | Phim Lẻ YOUKU
Th5
#nhachaymoingay #voiceeffects ngày mai người ta nấy chồng
Th5
Đồ ăn vặt hàng ngày là kẻ thù thầm lặng gây tổn thương gan
Th4
Độc lạ: TV bỏ túi kiêm luôn… củ sạc, có cả Wi-Fi, giá chỉ vài trăm ngàn đồng
Th4
Bộ Y tế đề nghị xử lý người nổi tiếng vi phạm về quảng cáo thực phẩm
Th4
Samsung Galaxy A26 5G có cơ hội trở thành hoa khôi smartphone dành cho học sinh, sinh viên?
Th4
[THUYẾT MINH] Quái Vật Tập Kích | Quái vật trỗi dậy cuộc chiến sinh tồn bắt đầu |Phim Lẻ YOUKU
Th4
Người Trung Quốc được cảm nhận “sờ tận tay” iPhone 17 Air
Th4
Thumb corn—sweet and sticky corn that's only the size of a finger【滇西小哥】
Th4
Chuông Xoay Tây Tạng Chữa Lành, Xua Tan Tà Khí, Xoay Chuyển Nghiệp Lực MẠNH NHẤT 2023
Th4
Bác sĩ cảnh báo nhiều trẻ uống nhầm hóa chất, hóc xương cá
Th5
Đúng 12h trưa ngày 14/4/2025, 3 con giáp cuộc đời sung sướng, thăng hoa khiến ai cũng ngưỡng mộ
Th4
Hát MASHUP hơn 10 bài HOT trên Tik Tok – Changmie x Tiến Tới
Th4
Tập 172: BÚP BÊ KUMANTHONG & HẬU QUẢ CỦA VIỆC DÙNG BÙA NGẢI ( Minigame chào xuân)
Th4
Top 3 kiểu tóc cứ cắt là đẹp mà cô nàng nào cũng nên thử
Th5
Mark Zuckerberg bị chính co-founder Instagram cáo buộc ‘bóp nghẹt’ ứng dụng, cả đế chế chỉ thiên vị mỗi Meta
Th4
Review UONEVIC Series 6 PRO Tương Thích Android IOS
Th4
Điều nhỏ bé kỳ diệu: Độc thân thì có sao? – Khi hạnh phúc không cần phải có đôi
Th4
Mua xe sang Maybach chạy taxi công nghệ
Th4
Lương 15 triệu không đủ mua trà sữa cho tôi nhưng bạn trai cứ đòi cưới sớm
Th4
Mỹ Nhân (Orinn Remix) – Đinh Đại Vũ | Nhạc Trẻ Remix EDM Tiktok Gây Nghiện Hay Nhất
Th4
Đăng ký nhận thông tin, nhận về điện thoại Galaxy S Mới miễn phí, tổng giải thưởng đến 60 triệu
Th5
Đỗ Thị Hà như người khổng lồ trên sân pickleball, cặp chân 1m11 gây choáng ngợp
Th4
Tỉnh Bắc Giang có mong muốn đặc biệt với FPT
Th4
Phim Ma Thái Lan Mới Nhất Thuyết Minh | Vụ Mất Tích Bí Ẩn Full HD | Phim Thái Lan Hay Nhất
Th4
[ENG SUN]《开始推理吧》完整版第10期”非常打工人”(上):郭麒麟周深在线洗脚 | The Truth S1
Th5
ENG SUB【Hidden Master 侠客行不通】EP09 | A world of martial arts, the rise of a hero | WeTV
Th4
Hạ Long: Hoàn thành lấy ý kiến cử tri về việc sắp xếp các đơn vị hành chính cấp xã
Th4
Ăn xoài có giảm cân không? Nghiên cứu mới tiết lộ những lợi ích đáng ngạc nhiên
Th4
Bài học One UI 7 khiến người dùng bị kêu gọi tránh mua điện thoại Galaxy
Th5
Solo Guitar Cực Chill – Âm Nhạc Thư Giãn Giúp Bạn Tỉnh Táo Và Sảng Khoái | Ánh Trang Official
Th5
PT-BR | Throne of Seal | Episódio 154 | WeTV
Th4
Không có công nghệ, khen Nhật nhưng quyết nói không với công nghệ Nhật, nền kinh tế thứ 4 châu Á làm đường sắt cao tốc 16 tỷ USD thế nào?
Th4
Laptop Asus TUF Gaming vượt trội ưu đãi giá chỉ từ 17.690.000 đồng
Th5
Ảnh Tạ Đình Phong với mẹ hoa hậu ‘gây sốt’ cõi mạng, đẳng cấp sau 25 năm
Th5
#单依纯 清唱#胡彦斌 《月光》!绝美转音完美诠释 连#毛不易 #李雪琴 都听醉了!#毛雪汪 #综艺 #娱乐 #music
Th4
Thời gian ơi! Kể chuyện – Tình đời nghệ sĩ: Khi hào quang và nước mắt song hành
Th4
BÍ MẬT TRONG VƯỜN NHÀ NỘI – Truyện Ma Đình Soạn Về Hồn Oan Dưới Gốc Cây Cau
Th4
《Kebetulan Yang Manis》《榜上佳婿》Rekap penyelesaian video WangZiQi dan LuYuXiao Mencari pasangan takdir
Th5
Vì sao Android không chạy theo xu hướng camera đơn của iPhone 16e?
Th5
Hôn nhân viên mãn của Mai Thu Huyền
Th4
‘Á hậu giật chồng’ thông báo giải nghệ
Th4
‘Anh trai’ Rhyder gặp vấn đề về sức khỏe
Th4