ChatGPT Agent – Trợ lý ảo của Open AI có thể “điều khiển máy tính” tự động như con người


Sinh Nhật Phong Vũ

PV Tech News – OpenAI ra mắt ChatGPT Agent, trợ lý ảo AI có khả năng thao tác máy tính tự động như con người, từ việc tạo slide đến chạy mã, hứa hẹn thay đổi cách con người tương tác với máy tính.

OpenAI tiếp tục khẳng định vị thế tiên phong trong lĩnh vực trí tuệ nhân tạo bằng việc ra mắt một tác nhân AI mới mang tên ChatGPT Agent. Đây là một trợ lý ảo có khả năng tự động thao tác trên máy tính thay mặt người dùng bằng cách hiểu và thực hiện các yêu cầu được viết bằng ngôn ngữ tự nhiên. Bước tiến mạnh mẽ này đã đánh dấu nỗ lực biến ChatGPT từ một chatbot đơn thuần thành một “trợ lý hành động” thực sự. Cùng Phong Vũ Tech News tìm hiểu chi tiết hơn về thông tin này trong nội dung dưới đây!

Mục lục

I. ChatGPT Agent  hoạt động như thế nào?

ChatGPT Agent là sự kết hợp giữa các công nghệ mà OpenAI đã phát triển và thử nghiệm trước đây. Tác nhân này được xây dựng dựa trên khả năng điều hướng web như Operator, tổng hợp thông tin như Deep Research và thao tác phần mềm qua API. Người dùng chỉ cần nhập yêu cầu bằng ngôn ngữ tự nhiên, chẳng hạn như “hãy tạo giúp tôi một bản thuyết trình so sánh ba đối thủ cạnh tranh chính” và ChatGPT Agent sẽ tự động tìm thông tin, lập kế hoạch, xây dựng nội dung, rồi tạo bản trình chiếu có thể chỉnh sửa được.

Chatgpt Agent Là Công Cụ Tổng Hợp Các Tính Năng Mà Openai Đã Phát Triển Trên Các Công Cụ Ai Khác
Chatgpt Agent Là Công Cụ Tổng Hợp Các Tính Năng Mà Openai Đã Phát Triển Trên Các Công Cụ Ai Khác (Nguồn: Internet)

OpenAI đã trình diễn một loạt ví dụ minh họa cho sức mạnh của ChatGPT Agent, chẳng hạn như lên kế hoạch và mua nguyên liệu cho một bữa sáng kiểu Nhật dành cho bốn người. Đây không phải là một tác vụ đơn giản, nó đòi hỏi khả năng tìm kiếm công thức phù hợp, tính toán khẩu phần, tra cứu nguyên liệu cần thiết, so sánh giá, chọn nơi mua hàng và tiến hành thanh toán.

Bên cạnh đó, ChatGPT Agent còn có thể truy cập vào các dịch vụ như Gmail hoặc GitHub, thực thi mã trong môi trường terminal, và sử dụng API để tương tác với phần mềm của bên thứ ba. Tất cả được thực hiện theo chuỗi hành động thông minh và logic, gần như mô phỏng cách con người thao tác.

Xem video minh họa ChatGPT Agent hoạt động trong clip dưới đây:

II. Sức mạnh vượt trội của mô hình nền tảng

Theo thông tin từ OpenAI, ChatGPT Agent được xây dựng trên một mô hình AI mới có hiệu suất vượt trội so với các phiên bản trước. Trong bài kiểm tra cuối cùng của Humanity, một kỳ thi tổng hợp với hàng ngàn câu hỏi thuộc hơn 100 lĩnh vực, mô hình này đạt điểm 41,6%, gần gấp đôi mức điểm của các mô hình o3 và o4-mini. Đặc biệt, trong bài thi FrontierMath – một bài kiểm tra toán học cực kỳ khó, ChatGPT Agent đạt điểm 27,4% khi có quyền truy cập các công cụ hỗ trợ như thiết bị đầu cuối. Đây là con số rất ấn tượng nếu so với điểm 6,3% của các mô hình trước đó.

Chatgpt Agent Hoạt Động Với Hiệu Suất Vượt Trội
Chatgpt Agent Hoạt Động Với Hiệu Suất Vượt Trội (Nguồn: Internet)

Tính năng mạnh mẽ cũng đồng nghĩa với nguy cơ bị lạm dụng. Nhận thức được điều này, OpenAI đã áp dụng nhiều biện pháp bảo vệ nghiêm ngặt cho ChatGPT Agent. Đầu tiên, công ty vô hiệu hóa hoàn toàn tính năng bộ nhớ (memory) cho tác nhân này nhằm ngăn chặn việc lưu lại các đoạn hội thoại trước đó, điều có thể bị khai thác để đánh cắp thông tin nhạy cảm. Ngoài ra, mọi yêu cầu gửi đến Agent đều được quét bởi hệ thống giám sát thời gian thực để phát hiện nội dung liên quan đến sinh học, đặc biệt là trong lĩnh vực vũ khí sinh học hoặc hóa học. Nếu phát hiện dấu hiệu rủi ro, phản hồi của AI sẽ được kiểm duyệt thêm một lần nữa để đảm bảo an toàn tuyệt đối.

III. Tiềm năng và thách thức trong thế giới thực

Mặc dù ChatGPT Agent mang lại nhiều hứa hẹn, nhưng các nhà phát triển vẫn thừa nhận rằng công nghệ tác nhân AI nói chung vẫn đang trong giai đoạn non trẻ. Các phiên bản trước đây của Google, Perplexity hay thậm chí chính OpenAI đều gặp khó khăn trong việc xử lý các tác vụ đời thực có nhiều biến số. Tuy nhiên, OpenAI tin rằng ChatGPT Agent lần này đã vượt qua những giới hạn trước đó, mở ra khả năng thực hiện được các hành động thực tế với độ tin cậy cao hơn. Việc tác nhân có thể kết hợp giữa xử lý ngôn ngữ, phân tích thông tin, ra quyết định và hành động trực tiếp giúp ChatGPT Agent tiến gần hơn đến khái niệm “trợ lý ảo thực thụ” mà người dùng mong đợi.

Chatgpt Agent Vẫn Cần Được Nghiên Cứu Và Phát Triển Thêm
Chatgpt Agent Vẫn Cần Được Nghiên Cứu Và Phát Triển Thêm (Nguồn: Internet)

IV. Kết luận

Sự ra đời của ChatGPT Agent mở ra tương lai nơi AI không chỉ phản hồi văn bản mà còn thực hiện hành động cụ thể trên máy tính thay con người. Từ việc quản lý email, tạo tài liệu đến tương tác với phần mềm, AI sẽ dần trở thành một trợ lý kỹ thuật số toàn diện. Tuy nhiên, để đạt đến mức độ tin cậy cao trong thực tế, các tác nhân AI cần tiếp tục được cải thiện về độ chính xác, an toàn và khả năng thích ứng với các tình huống phức tạp.

Bài viết liên quan:

  • Hướng dẫn dùng chatGPT tạo Mindmap và Flow Chart nhanh chóng
  • Cách xóa lịch sử chatGPT, xóa toàn bộ lịch sử trò chuyện
  • ChatGPT đã có thể truy cập Google Drive, Dropbox

Để lại một bình luận