nội dung

Những bước tiến lớn trong lĩnh vực trí tuệ nhân tạo (AI) luôn thu hút sự chú ý của giới công nghệ. Mới đây, ChatGPT đã chính thức phát hành phiên bản AI GPT OSS, mang lại sức mạnh vượt trội, có thể cạnh tranh ngang ngửa với GPT-4o. Cùng Phong Vũ Tech News khám phá những tính năng và ứng dụng đầy tiềm năng của model này trong bài viết dưới đây!
Mục lục
I. Giới thiệu về GPT-OSS: Mô hình AI mở tiên tiến và hiệu quả cao
ChatGPT vừa chính thức giới thiệu GPT-OSS-120b và GPT-OSS-20b – hai mô hình ngôn ngữ tiên tiến với trọng số mở, mang đến hiệu năng vượt trội với chi phí thấp. Phát hành theo giấy phép Apache 2.0 linh hoạt, các mô hình này được tối ưu hóa để triển khai hiệu quả trên phần cứng của người dùng, vượt trội hơn nhiều so với open model có cùng kích thước trong các tác vụ lập luận phức tạp.

GPT-OSS được đào tạo bằng cách học tập tăng cường (RLHF) và kết hợp những kỹ thuật đột phá của OpenAI, bao gồm cả O3 và các hệ thống tiên phong khác. Trong đó:
- GPT-OSS-120b: Đạt hiệu năng gần tương đương với OpenAI O4-mini về khả năng tư duy cốt lõi và có thể hoạt động hiệu quả trên một GPU 80GB duy nhất.
- GPT-OSS-20b: Mang lại kết quả tương đương với OpenAI O3-mini trên các bài kiểm tra đối chuẩn thông thường vàcó thể chạy trên các thiết bị biên chỉ cần 16 GB bộ nhớ.
Có thể thấy, cả hai mô hình đều có khả năng sử dụng công cụ mạnh mẽ, tương tác tốt với các hàm few-shot và thực hiện suy luận CoT (Chain-of-Thought) hiệu quả. Theo các bộ đánh giá độc lập như Tau-Bench và HealthBench, model này thậm chí còn vượt trội hơn cả OpenAI O1 và GPT-4o.
Đặc biệt, GPT-OSS cũng hoàn toàn tương thích với API Phản hồi của ChatGPT. Từ đó cho phép nhà phát triển tận dụng tối đa khả năng tuân thủ hướng dẫn, sử dụng công cụ mạnh mẽ như tìm kiếm web hay thực thi mã Python.
II. GPT-OSS: AI mở mạnh mẽ, an toàn và tối ưu
An toàn là một yếu tố cốt lõi trong quá trình phát triển GPT-OSS. Các mô hình đã trải qua quy trình huấn luyện và đánh giá an toàn nghiêm ngặt, với một phiên bản của GPT-OSS-120b được tinh chỉnh đặc biệt theo Khung Chuẩn bị sẵn sàng. Dựa trên các tiêu chí an toàn nội bộ, GPT-OSS hoạt động tương đương với các mô hình hàng đầu của OpenAI, mang đến cho nhà phát triển một tiêu chuẩn an toàn tương tự như các mô hình độc quyền mới nhất.

ChatGPT cũng đang hợp tác với các đối tác lớn như AI Sweden, Orange và Snowflake để khám phá các ứng dụng thực tế của mô hình nguồn mở. Từ lưu trữ tại chỗ để bảo mật dữ liệu đến tinh chỉnh cho các bộ dữ liệu chuyên biệt.
Việc phát hành GPT-OSS thể hiện cam kết của ChatGPT trong việc trao quyền cho mọi người – từ nhà phát triển cá nhân, doanh nghiệp lớn đến chính phủ – có thể chạy và tùy chỉnh AI trên cơ sở hạ tầng riêng của họ. Cùng với các mô hình có sẵn trên API, giờ đây nhà phát triển có thể tự do lựa chọn hiệu suất, chi phí và độ trễ phù hợp nhất cho mọi quy trình làm việc.
III. Kiến trúc và phương pháp huấn luyện của GPT-OSS
Để đạt được hiệu suất vượt trội và tối ưu hóa chi phí, các mô hình GPT-OSS được xây dựng trên một nền tảng kiến trúc tiên tiến và trải qua quy trình huấn luyện phức tạp. Dưới đây là những điểm nổi bật về cách OpenAI tạo ra các model AI nguồn mở mạnh mẽ:

1. Huấn luyện trước mô hình GPT-OSS
GPT-OSS là mô hình ngôn ngữ có trọng số mở đầu tiên kể từ sau GPT-2. Model sẽ được huấn luyện với các kỹ thuật tiên tiến nhất, tập trung vào khả năng suy luận và hiệu quả khi triển khai trong nhiều môi trường sử dụng khác nhau. Mỗi mô hình sử dụng kiến trúc Bộ chuyển đổi hỗn hợp nhiều chuyên gia (MoE), giúp giảm lượng tham số cần thiết cho mỗi lần xử lý, từ đó tăng hiệu quả. Cụ thể:
- GPT-OSS-120b có tổng cộng 117 tỷ tham số, nhưng chỉ kích hoạt 5.1 tỷ tham số cho mỗi token đầu vào.
- GPT-OSS-20b có tổng cộng 21 tỷ tham số, chỉ kích hoạt 3.6 tỷ tham số cho mỗi token.
Chúng còn sử dụng nhiều kỹ thuật khác như định vị xoay chiều (RoPE) để mã hóa vị trí, hỗ trợ độ dài ngữ cảnh lên tới 128 nghìn token, giúp xử lý những đoạn văn bản rất dài.
2. Huấn luyện hậu kỳ
Sau giai đoạn huấn luyện ban đầu, các GPT-OSS được tinh chỉnh bằng quy trình tương tự như o4-mini, bao gồm tinh chỉnh có giám sát và học tăng cường. Mục tiêu là giúp các mô hình này tuân thủ Đặc tả Mô hình của OpenAI và dạy chúng cách suy luận Chuỗi Tư duy (Chain-of-Thought) trước khi đưa ra câu trả lời.
Đặc biệt, giống như các o-series trong API, GPT-OSS hỗ trợ 3 mức độ suy luận: thấp, trung bình và cao. Các nhà phát triển có thể dễ dàng lựa chọn mức độ này bằng cách thêm một câu đơn giản vào phần thông báo hệ thống, giúp cân bằng giữa hiệu suất và độ trễ để phù hợp với từng tác vụ cụ thể.
IV. Kết quả đánh giá và hiệu suất vượt trội của GPT-OSS
OpenAI đã tiến hành đánh giá GPT-OSS-120b và GPT-OSS-20b dựa trên các bộ tiêu chuẩn học thuật phổ biến, đo lường khả năng lập trình, toán học, y tế và sử dụng công cụ. Model này được so sánh với các mô hình suy luận khác của OpenAI như O3, O3-mini và O4-mini.

Kết quả cho thấy, GPT-OSS-120b không chỉ vượt trội hơn OpenAI o3-mini mà còn đạt được hiệu năng ngang bằng hoặc vượt qua OpenAI o4-mini trong nhiều lĩnh vực:
- Lập trình thi đấu (Codeforces)
- Giải quyết vấn đề tổng quát (MMLU và HLE)
- Sử dụng công cụ (TauBench)
- Các bài kiểm tra về y tế (HealthBench) và toán học thi đấu (AIME 2024 & 2025).


Ngoài ra, GPT-OSS-20b dù có kích thước nhỏ hơn, nhưng vẫn cho thấy hiệu quả đáng kinh ngạc. Mô hình này đạt hiệu suất ngang bằng hoặc tốt hơn OpenAI o3-mini trên các bài đánh giá, đặc biệt là trong lĩnh vực toán học thi đấu và y tế.
V. Cách thức truy cập và sử dụng GPT-OSS
GPT-OSS-120b và GPT-OSS-20b đều có thể được tải xuống miễn phí từ Hugging Face. Để tối ưu hóa việc sử dụng, các mô hình này đã được lượng tử hóa sẵn ở định dạng MXFP4. Điều này cho phép GPT-OSS-120b chạy chỉ với 80GB bộ nhớ, còn GPT-OSS-20b chỉ yêu cầu 16GB, giúp tiết kiệm đáng kể chi phí phần cứng.
Mô hình còn được huấn luyện hậu kỳ theo định dạng câu lệnh Harmony. OpenAI cũng đã cung cấp mã nguồn công cụ kết xuất Harmony bằng cả Python và Rust, cùng với các công cụ mẫu để nhà phát triển có thể dễ dàng sử dụng.

Ngoài ra, OpenAI đã triển khai tham chiếu để chạy suy luận với PyTorch và nền tảng Metal của Apple. Do đó, GPT-OSS sẽ hoạt động linh hoạt trên nhiều môi trường khác nhau: tại chỗ (on-premise), trên thiết bị (on-device) hoặc thông qua các nhà cung cấp bên thứ ba.
OpenAI sẽ hợp tác với các nền tảng triển khai hàng đầu như Hugging Face, Azure, vLLM, AWS, Fireworks và nhiều đối tác khác để đảm bảo nhà phát triển dễ dàng tiếp cận các mô hình này. Về phần cứng, họ sẽ kết hợp với NVIDIA, AMD, Cerebras và Groq để tối ưu hóa hiệu suất trên nhiều hệ thống.
Ngoài ra, Microsoft cung cấp phiên bản tối ưu hóa GPU của GPT-OSS-20B trên Windows, hỗ trợ suy luận cục bộ qua ONNX Runtime và khả dụng qua Foundry Local, AI Toolkit for VS Code. Các nhà phát triển có thể tinh chỉnh và triển khai mô hình trong môi trường riêng hoặc sử dụng nền tảng API của OpenAI để tích hợp dễ dàng.
VI. Kết luận
GPT-OSS ra đời không chỉ là một bước tiến công nghệ mà còn là một quyết định chiến lược trong cuộc đua AI. Với sức mạnh ngang ngửa các mô hình độc quyền hàng đầu nhưng lại hoàn toàn miễn phí và linh hoạt, GPT-OSS hứa hẹn sẽ thúc đẩy mạnh mẽ sự sáng tạo và đổi mới trong cộng đồng nhà phát triển. Đừng quên tiếp tục theo dõi Phong Vũ Tech News để cập nhật những xu hướng công nghệ AI mới nhất!
Theo: OpenAI
Bài viết liên quan:
- ChatGPT ghi nhận 2,5 tỷ truy vấn/ngày, Google sắp “hết thời”?
- ChatGPT Agent – Trợ lý ảo của Open AI có thể “điều khiển máy tính” tự động như con người
- Hàng nghìn cuộc trò chuyện chatGPT bị rò rỉ trên Google
Thể Thao
Zubimendi rực sáng, Arsenal thắng ‘ba sao’
Th9
Công Nghệ
Zalo thu phí zCloud trên iPhone đắt hơn Android, người dùng hỏi tại sao vậy?
Th8
Công Nghệ
Zalo ra thông báo quan trọng tới hàng chục triệu người dùng: Ai cũng nên cập nhật sớm, tránh mất quyền lợi
Th8
Công Nghệ
Zalo ra thông báo mới nhất: Tất cả công dân Việt Nam cần cập nhật ngay để không bị mất quyền lợi
Th9
Công Nghệ
Zalo có thay đổi mới, người dùng cần biết kẻo mất quyền lợi
Th8
Công Nghệ
Zalo cán mốc 78,3 triệu người dùng, đặt Viettel, VNPT, MobiFone trước ‘bẫy đường ống’
Th9
Thể Thao
Yu Zidi, thần đồng Trung Quốc 12 tuổi thay đổi bơi lội thế giới
Th8
Công Nghệ
YouTube triển khai AI xác minh độ tuổi người dùng từ tháng 8/2025
Th8
Công Nghệ
YouTube thử nghiệm AI tự chỉnh sửa video của người dùng
Th9
Công Nghệ
YouTube tặng 2 tháng Premium cho người dùng với 1 điều kiện
Th9
Công Nghệ
YouTube khai tử mục Thịnh hành
Th7
Công Nghệ
YouTube hạn chế việc dùng chung gói Premium Family
Th9
Công Nghệ
YouTube đã tiếp cận hơn 55 triệu người dùng từ 18 tuổi trở lên tại Việt Nam
Th8
Công Nghệ
YouTube bắt đầu “càn quét” tài khoản chia sẻ Premium Family không hợp lệ
Th9
Công Nghệ
YouTube bắt đầu “càn quét” tài khoản chia sẻ Premium Family không hợp lệ
Th9
Sức Khỏe
Yoga là gì? Các loại yoga phổ biến và công dụng khi tập yoga
Th9
Radio My
Yêu thương cho đi
Th9
Radio My
Yêu say đắm 2 năm, chàng trai ‘bỏ chạy’ sau 3 tháng sống thử
Th8
Radio My
Yêu người khác khi đang ly thân, có bị xem là ngoại tình?
Th9
Radio My
Yêu lại từ đầu
Th9
Radio My
Yêu cô gái 1m2, chàng trai Thanh Hóa vượt 1.300km về ở rể và cái kết
Th9
Thời Sự
Yêu cầu kiểm điểm vụ đề xuất lấy biệt thự trong di tích làm chỗ ở cho Phó giám đốc Sở
Th8
Thời Sự
Yên Bài: Vững bước phát triển, khẳng định vị thế sau sáp nhập
Th8
Công Nghệ
YBY1 lập kỳ tích vô địch cả hai hạng mục tại Đấu Trường Hỗn Chiến Mùa 2
Th8
Thể Thao
Yamal tỏa sáng, Barca đánh bại Mallorca ở vòng 1 La Liga 2025-2026
Th8
Thể Thao
Yamal lập cú đúp mừng áo số 10, Barca thắng to
Th8
Thể Thao
Yamal lập công, Barca ra quân tưng bừng nhờ…trọng tài
Th8
Thể Thao
Yamal khiến đối thủ đốt đền, Barca thoát hiểm phút bù giờ
Th8
Thể Thao
Yamal ghi bàn trong tình huống gây tranh cãi, Barcelona vẫn đứt mạch toàn thắng
Th9
Thể Thao
Yamal chói sáng, Barca đoạt cúp Joan Gamper
Th8
Thời Sự
Ý thức của người dân có chuyển biến tích cực
Th8
Thông Tin Tiêu Dùng
Y pháp và pháp y khác nhau như thế nào?
Th9
Ẩm Thực
Xuýt xoa cá hấp mắm gừng thơm lừng góc bếp
Th8
Thời Sự
Xuyên đêm đưa chuyên cơ từng chở Bác Hồ sang Triển lãm quốc gia
Th8
Thời Sự
Xưởng mất điện cả ngày bỗng cháy đỏ rực trong đêm, khói bốc cao hàng chục mét
Th8
Thời Sự
Xứng đáng với trọng trách, tạo dấu ấn đặc biệt trong lòng Nhân dân
Th9
Giải Trí
Xúc động ước nguyện tuổi 80 của NSND Bạch Tuyết
Th8
Giải Trí
Xúc động ngắm nhìn hình ảnh ‘Những người con của Tổ quốc’
Th8
Radio My
Xúc động lời dặn của bố chồng tương lai, cô gái vượt 1.200km về Nghệ An làm dâu
Th8
Thời Sự
Xúc động lễ chia tay thầy Lê Bá Khánh Trình, 4 tiến sĩ đàn hát ‘Thời thanh niên sôi nổi’
Th8
Thời Sự
Xúc động khoảnh khắc các biên đội trực thăng kéo cờ Đảng, cờ Tổ quốc bay trên Quảng trường Ba Đình
Th8
Thời Sự
Xúc động hình ảnh hàng trăm giáo viên tình nguyện đến vùng lũ dọn dẹp trường lớp
Th8
Giải Trí
Xúc động hàng triệu người hòa giọng Quốc ca trong ngày 2/9
Th9
Radio My
Xúc động cha già gánh gần 80kg đặc sản, vượt hơn 600km đến thăm con cháu
Th9
Sức Khỏe
Xuất huyết não có hồi phục được không? Thời gian và yếu tố ảnh hưởng đến khả năng phục hồi
Th9
Công Nghệ
Xuất hiện iPhone 17 Pro nhái chạy Android: Thiết kế y hệt, cũng có Dynamic Island nhưng nhìn là biết hàng “đểu”
Th8
Thể Thao
Xuất hiện đội bóng Anh giải cứu Hojlund, MU reo vui
Th8
Thời Sự
Xuất hiện ‘hố tử thần’ trên quốc lộ nối Quảng Ngãi – Đà Nẵng
Th8
Thể Thao
Xuân Son, Duy Mạnh có hành động ý nghĩa trong ngày 2/9
Th9
Thể Thao
Xuân Son trở lại Việt Nam, báo tin cực vui với HLV Kim Sang Sik
Th9
Thông Tin Tiêu Dùng
Người xưa dặn 3 thứ này dù thích cũng không được mang về nhà
Th9
Thông Tin Tiêu Dùng
3 loại cây hợp cả 5 mệnh, cực tốt cho gia đình nhiều người xung khắc, trồng trong nhà vừa đẹp vừa giàu
Th9
Thông Tin Tiêu Dùng
Cô hồn lùi xa, tháng 8 âm lịch tới hãy làm việc này để đón tài lộc, vận may khởi sắc
Th9
Thông Tin Tiêu Dùng
Tháng 7 dọn dẹp nhà cửa rất tốt nhưng phải tránh 3 điều này kẻo đại kỵ phong thủy làm hao tài tổn lộc
Th8
Thời Sự
‘Anh Tạ’ phim Mưa đỏ và nhạc sĩ Nguyễn Văn Chung khiến học sinh phấn khích
Th9
Sức Khỏe
‘Bất lực’, không thể ‘chiều’ vợ chỉ vì uống 1 thứ để bồi bổ
Th8
Thông Tin Tiêu Dùng
‘Bất ngờ Vĩnh Long’ từ cuộc thi ‘Chuyện của những dòng sông’
Th9
Thời Sự
‘Bí mật’ bên trong chiếc túi màu nâu sẫm bỏ quên giữa trưa ở sân bay Nội Bài
Th8