Khi chúng ta không hiểu rõ công cụ của mình, liệu nó có an toàn để sử dụng?

Trong một bài viết gây chấn động vừa được đăng tải trên trang web cá nhân, Dario Amodei – CEO của Anthropic, công ty đứng sau chatbot Claude – đã công khai thừa nhận một sự thật khó tin: không ai thực sự hiểu rõ cách AI hoạt động. Tuyên bố này đến từ người đứng đầu một trong những phòng thí nghiệm trí tuệ nhân tạo hàng đầu thế giới, khiến nhiều người ngạc nhiên và lo ngại về công nghệ đang thay đổi cuộc sống hàng ngày của chúng ta.
” Khi một hệ thống AI tạo sinh thực hiện một việc gì đó, như tóm tắt một tài liệu tài chính, chúng ta không hề biết, ở mức độ cụ thể hay chính xác, tại sao nó đưa ra những lựa chọn đó – tại sao nó chọn từ ngữ này thay vì từ ngữ khác, hoặc tại sao đôi khi nó mắc lỗi dù thường xuyên chính xác ,” CEO Anthropic viết.

Dario Amodei – CEO của Anthropic, công ty đứng sau chatbot Claude
Ông tiếp tục thừa nhận rằng những người ngoài ngành AI có thể ngạc nhiên khi biết rằng ngay cả những người xây dựng công nghệ cũng ” không hiểu cách hoạt động của chính những sáng tạo AI của họ” và bất kỳ ai lo ngại về sự thiếu hiểu biết này đều “có quyền lo lắng .”
Để giải quyết vấn đề này, Amodei đã công bố kế hoạch tạo ra một “MRI cho AI” trong thập kỷ tới. Mục tiêu không chỉ là tìm hiểu cơ chế hoạt động của công nghệ, mà còn ngăn chặn bất kỳ mối nguy hiểm không lường trước nào liên quan đến bản chất bí ẩn hiện tại của nó. Theo ông, “sự thiếu hiểu biết này về cơ bản là chưa từng có trong lịch sử công nghệ.”
Điều này phần nào giải thích lý do Amodei và chị gái Daniela rời OpenAI vào cuối năm 2020 giữa những lo ngại về các thực hành an toàn của công ty do Sam Altman điều hành. Cụ thể, họ lo ngại rằng OpenAI đang gạt bỏ những quan ngại về an toàn để theo đuổi lợi nhuận. Amodei cùng năm đồng nghiệp cũ từ OpenAI đã thành lập Anthropic vào năm sau đó với mục tiêu xây dựng AI an toàn hơn – và một phần công việc này dường như tập trung vào việc tìm hiểu cơ chế hoạt động của công nghệ.
Trong những tháng gần đây, Amodei cho biết Anthropic không chỉ tập trung vào việc giúp “điều hướng” AI theo hướng có lợi cho nhân loại, mà còn nghiên cứu “khả năng hấp dẫn” rằng các nhà nghiên cứu cuối cùng có thể hiểu được cách hoạt động bên trong của các hệ thống này ” trước khi các mô hình đạt đến mức độ sức mạnh áp đảo .”

Để minh họa cho những nỗ lực này, CEO Anthropic đã chia sẻ về một thí nghiệm gần đây của công ty. Trong thí nghiệm, một “đội đỏ” cố tình đưa vào một vấn đề trong một mô hình AI (chẳng hạn như xu hướng khai thác lỗ hổng trong một nhiệm vụ) và giao cho các “đội xanh” nhiệm vụ tìm ra điều gì sai với nó. Nhiều đội xanh đã thành công trong việc phát hiện vấn đề, một số thậm chí đã áp dụng hiệu quả các công cụ diễn giải trong quá trình điều tra.
Mặc dù còn nhiều việc phải làm để mở rộng quy mô các “công cụ” này, nhưng thật thú vị khi biết rằng những người tại đối thủ lớn nhất của OpenAI không chỉ đang nỗ lực phát triển AI tiên tiến hơn, mà còn tự giao cho mình nhiệm vụ tìm hiểu lý do và cách thức hoạt động của nó.
“AI mạnh mẽ sẽ định hình vận mệnh của nhân loại,” Amodei kết luận, “và chúng ta xứng đáng hiểu được những sáng tạo của chính mình trước khi chúng biến đổi triệt để nền kinh tế, cuộc sống và tương lai của chúng ta.” Lời cảnh báo này từ người trong cuộc đặt ra câu hỏi về trách nhiệm của các công ty công nghệ trong việc phát triển những hệ thống mà họ chưa thực sự hiểu rõ, đồng thời nhấn mạnh tầm quan trọng của việc nghiên cứu sâu hơn về cách hoạt động nội tại của AI trước khi công nghệ này trở nên quá mạnh để kiểm soát.
Theo
Thanh niên Việt
Copy link
Lấy link
20 năm xứng đáng là ‘lá cờ đầu’ của y tế miền Tây
Cựu sáng lập OnePlus ra mắt điện thoại mới có thiết kế độc dị, giá chỉ hơn 5 triệu nhưng camera “thay” được ống kính
Met Gala 2025: Lisa ‘không quần’ khoe vòng 3 cực cháy – Jennie ‘tuyệt đối điện ảnh’
Điểm hẹn tài năng – Tập 1: Những khoảnh khắc tỏa sáng của 12 thí sinh
Hòa Tấu Guitar Vô Thường Tình Khúc Rumba -Nhạc Không Lời Hay Cho Cafe Sáng Nhẹ Nhàng Sảng Khoái
Bổ sung nhiều kẽm giúp tăng sinh lý?
|#chillcover | Người yêu cũ có người yêu mới | quang hùng
2 cách nạp tiền điện thoại online và offline cho mọi nhà mạng
《八十一难》爆改西游记爆金句我真的哭死!#八十一难 #喜人奇妙夜
TOP 7 máy vắt cam giá rẻ, chất lượng bán chạy nhất cho mọi gia đình
Kiếp nạn mới của Bạch Tuyết
Nhận định, soi tỷ lệ Fiorentina vs Celje 23h45 ngày 17/4, UEFA Conference League
GTA 6 lại hoãn phát hành: Rockstar dời lịch đến năm 2026?
Động thái cứng rắn của NSƯT, Đại tá Phạm Cường khi bị cho quảng cáo ‘lố’ viên uống xương khớp
LIÊN KHÚC NHẠC TRẺ DISCO SÔI ĐỘNG REMIX 2024 – TOÀN BÀI HAY
Những chặng đường bụi bặm: Hậu ngã xuống hố phân nhưng nhất định không nhận sự giúp đỡ của ông Nhân
Bộ Công an đề nghị huỷ quyết định không khởi tố vụ án hình sự và tiếp tục điều tra, xử lý vụ tai nạn giao thông tại Trà Ôn, tỉnh Vĩnh Long
Hướng dẫn tải Gmail về máy tính Win 10/11 chi tiết nhất
3 mẫu iPhone này sẽ khiến người hâm mộ nhìn với con mắt khác
Phim tài liệu 'Giữa vòng vây quân thù': Bộ phim cảm động về nhà tình báo Phạm Ngọc Thảo
OpenAI hứng chỉ trích vì bản cập nhật GPT-4o gây tranh cãi
PT-BR | Swallowed Star | Episódio 166 | WeTV
MỆNH LỆNH TỬ THẦN [Thuyết Minh] – Steven Seagal | Phim Hành Động Mỹ Chiếu Rạp 2024
[THUYẾT MINH] Cuộc Chiến Sinh Tử | Vạch trần bóng tối, triệt phá mai thúy! | Phim Lẻ YOUKU
Cựu tiếp viên hàng không tiết lộ 3 món không bao giờ nên gọi trên máy bay
em của quá khứ cover quang hùng
Vì sao đàn ông IQ cao có ít người yêu?
Khuyến mãi ngày vàng, ưu đãi ngập tràn, nạp thẻ VinaPhone ưu đãi đến 20%
Thủ tướng chủ trì phiên họp Chính phủ về 5 dự án luật quan trọng
Ngày mới với tin tức sức khỏe: Bài tập đơn giản cực tốt cho người lớn tuổi
Chế độ ăn mới nổi liên quan đến tỷ lệ ung thư thấp đáng kinh ngạc
[ Tập 1434 ] ĐỨA CON RỂ SÁT NHÂN – Chuyện Tâm Linh
Giai Điệu Âm Nhạc Thư Giãn Tuyệt Đẹp, Giúp Thư Giãn Đầu Óc – Peace Your Mind – Relaxing Music
Giải pháp điều trị bệnh lý tim mạch tiên tiến
Dòng người nhích từng chút một chờ được chiêm bái xá lợi Đức Phật một lần
Trung Quốc phát hiện kho báu chưa từng thấy, trữ lượng 35 triệu tấn: Hoa Kỳ có cần lo lắng?
Bác sĩ chia sẻ các loại rau lá xanh giàu canxi
thỏ đẻ trứng
Triệu Lộ Tư gây tranh cãi sau phát ngôn ‘ốm cũng trang điểm mỗi ngày’
Meta ứng dụng AI để phát hiện người dùng mạng xã hội khai man tuổi
Sony Xperia 1 VII lộ ảnh thực tế trước ngày ra mắt: Có jack cắm tai nghe 3.5mm, thiết kế màn hình “không khiếm khuyết”, chip Snapdragon 8 Elite
He falls for her although he can’t see her🥰#TheRiseofNing #锦绣安宁 #ZhangWanyi #RenMin #shorts
Barcelona áp đảo Real Madrid mùa 2024/2025: Toàn thắng El Clasico, dẫn đầu mọi mặt trận
Có nên mua máy ép chậm không? Nên mua loại nào tốt nhất?
Âm nhạc thiên nhiên dịu êm, giúp thư giãn giảm căng thẳng mệt mỏi #nature #sounds #waterfallsounds
LẶNG LẼ TỔN THƯƠNG QUANG HÙNG
Phim tài liệu 'Những người hát bè trầm': Bản anh hùng ca thầm lặng của lực lượng Hậu cần – Kỹ thuật trong kháng chiến
MU chi 100 triệu mua cặp sao Inter Milan
Phát huy giá trị văn hóa, lịch sử nơi “đất thép thành đồng”
Con gái Khánh Thi ‘đốn tim’ với bộ ảnh diện áo cờ đỏ sao vàng
Mẹ biển – Tập 28: Nhận ra con trai, Đại liền đuổi Quân khỏi bè cá
Dùng chứng minh thư giả hẹn hò nhiều nữ sinh, ép phá thai, giảng viên bị sa thải