nội dung

Những bước tiến lớn trong lĩnh vực trí tuệ nhân tạo (AI) luôn thu hút sự chú ý của giới công nghệ. Mới đây, ChatGPT đã chính thức phát hành phiên bản AI GPT OSS, mang lại sức mạnh vượt trội, có thể cạnh tranh ngang ngửa với GPT-4o. Cùng Phong Vũ Tech News khám phá những tính năng và ứng dụng đầy tiềm năng của model này trong bài viết dưới đây!
Mục lục
I. Giới thiệu về GPT-OSS: Mô hình AI mở tiên tiến và hiệu quả cao
ChatGPT vừa chính thức giới thiệu GPT-OSS-120b và GPT-OSS-20b – hai mô hình ngôn ngữ tiên tiến với trọng số mở, mang đến hiệu năng vượt trội với chi phí thấp. Phát hành theo giấy phép Apache 2.0 linh hoạt, các mô hình này được tối ưu hóa để triển khai hiệu quả trên phần cứng của người dùng, vượt trội hơn nhiều so với open model có cùng kích thước trong các tác vụ lập luận phức tạp.

GPT-OSS được đào tạo bằng cách học tập tăng cường (RLHF) và kết hợp những kỹ thuật đột phá của OpenAI, bao gồm cả O3 và các hệ thống tiên phong khác. Trong đó:
- GPT-OSS-120b: Đạt hiệu năng gần tương đương với OpenAI O4-mini về khả năng tư duy cốt lõi và có thể hoạt động hiệu quả trên một GPU 80GB duy nhất.
- GPT-OSS-20b: Mang lại kết quả tương đương với OpenAI O3-mini trên các bài kiểm tra đối chuẩn thông thường vàcó thể chạy trên các thiết bị biên chỉ cần 16 GB bộ nhớ.
Có thể thấy, cả hai mô hình đều có khả năng sử dụng công cụ mạnh mẽ, tương tác tốt với các hàm few-shot và thực hiện suy luận CoT (Chain-of-Thought) hiệu quả. Theo các bộ đánh giá độc lập như Tau-Bench và HealthBench, model này thậm chí còn vượt trội hơn cả OpenAI O1 và GPT-4o.
Đặc biệt, GPT-OSS cũng hoàn toàn tương thích với API Phản hồi của ChatGPT. Từ đó cho phép nhà phát triển tận dụng tối đa khả năng tuân thủ hướng dẫn, sử dụng công cụ mạnh mẽ như tìm kiếm web hay thực thi mã Python.
II. GPT-OSS: AI mở mạnh mẽ, an toàn và tối ưu
An toàn là một yếu tố cốt lõi trong quá trình phát triển GPT-OSS. Các mô hình đã trải qua quy trình huấn luyện và đánh giá an toàn nghiêm ngặt, với một phiên bản của GPT-OSS-120b được tinh chỉnh đặc biệt theo Khung Chuẩn bị sẵn sàng. Dựa trên các tiêu chí an toàn nội bộ, GPT-OSS hoạt động tương đương với các mô hình hàng đầu của OpenAI, mang đến cho nhà phát triển một tiêu chuẩn an toàn tương tự như các mô hình độc quyền mới nhất.

ChatGPT cũng đang hợp tác với các đối tác lớn như AI Sweden, Orange và Snowflake để khám phá các ứng dụng thực tế của mô hình nguồn mở. Từ lưu trữ tại chỗ để bảo mật dữ liệu đến tinh chỉnh cho các bộ dữ liệu chuyên biệt.
Việc phát hành GPT-OSS thể hiện cam kết của ChatGPT trong việc trao quyền cho mọi người – từ nhà phát triển cá nhân, doanh nghiệp lớn đến chính phủ – có thể chạy và tùy chỉnh AI trên cơ sở hạ tầng riêng của họ. Cùng với các mô hình có sẵn trên API, giờ đây nhà phát triển có thể tự do lựa chọn hiệu suất, chi phí và độ trễ phù hợp nhất cho mọi quy trình làm việc.
III. Kiến trúc và phương pháp huấn luyện của GPT-OSS
Để đạt được hiệu suất vượt trội và tối ưu hóa chi phí, các mô hình GPT-OSS được xây dựng trên một nền tảng kiến trúc tiên tiến và trải qua quy trình huấn luyện phức tạp. Dưới đây là những điểm nổi bật về cách OpenAI tạo ra các model AI nguồn mở mạnh mẽ:

1. Huấn luyện trước mô hình GPT-OSS
GPT-OSS là mô hình ngôn ngữ có trọng số mở đầu tiên kể từ sau GPT-2. Model sẽ được huấn luyện với các kỹ thuật tiên tiến nhất, tập trung vào khả năng suy luận và hiệu quả khi triển khai trong nhiều môi trường sử dụng khác nhau. Mỗi mô hình sử dụng kiến trúc Bộ chuyển đổi hỗn hợp nhiều chuyên gia (MoE), giúp giảm lượng tham số cần thiết cho mỗi lần xử lý, từ đó tăng hiệu quả. Cụ thể:
- GPT-OSS-120b có tổng cộng 117 tỷ tham số, nhưng chỉ kích hoạt 5.1 tỷ tham số cho mỗi token đầu vào.
- GPT-OSS-20b có tổng cộng 21 tỷ tham số, chỉ kích hoạt 3.6 tỷ tham số cho mỗi token.
Chúng còn sử dụng nhiều kỹ thuật khác như định vị xoay chiều (RoPE) để mã hóa vị trí, hỗ trợ độ dài ngữ cảnh lên tới 128 nghìn token, giúp xử lý những đoạn văn bản rất dài.
2. Huấn luyện hậu kỳ
Sau giai đoạn huấn luyện ban đầu, các GPT-OSS được tinh chỉnh bằng quy trình tương tự như o4-mini, bao gồm tinh chỉnh có giám sát và học tăng cường. Mục tiêu là giúp các mô hình này tuân thủ Đặc tả Mô hình của OpenAI và dạy chúng cách suy luận Chuỗi Tư duy (Chain-of-Thought) trước khi đưa ra câu trả lời.
Đặc biệt, giống như các o-series trong API, GPT-OSS hỗ trợ 3 mức độ suy luận: thấp, trung bình và cao. Các nhà phát triển có thể dễ dàng lựa chọn mức độ này bằng cách thêm một câu đơn giản vào phần thông báo hệ thống, giúp cân bằng giữa hiệu suất và độ trễ để phù hợp với từng tác vụ cụ thể.
IV. Kết quả đánh giá và hiệu suất vượt trội của GPT-OSS
OpenAI đã tiến hành đánh giá GPT-OSS-120b và GPT-OSS-20b dựa trên các bộ tiêu chuẩn học thuật phổ biến, đo lường khả năng lập trình, toán học, y tế và sử dụng công cụ. Model này được so sánh với các mô hình suy luận khác của OpenAI như O3, O3-mini và O4-mini.

Kết quả cho thấy, GPT-OSS-120b không chỉ vượt trội hơn OpenAI o3-mini mà còn đạt được hiệu năng ngang bằng hoặc vượt qua OpenAI o4-mini trong nhiều lĩnh vực:
- Lập trình thi đấu (Codeforces)
- Giải quyết vấn đề tổng quát (MMLU và HLE)
- Sử dụng công cụ (TauBench)
- Các bài kiểm tra về y tế (HealthBench) và toán học thi đấu (AIME 2024 & 2025).


Ngoài ra, GPT-OSS-20b dù có kích thước nhỏ hơn, nhưng vẫn cho thấy hiệu quả đáng kinh ngạc. Mô hình này đạt hiệu suất ngang bằng hoặc tốt hơn OpenAI o3-mini trên các bài đánh giá, đặc biệt là trong lĩnh vực toán học thi đấu và y tế.
V. Cách thức truy cập và sử dụng GPT-OSS
GPT-OSS-120b và GPT-OSS-20b đều có thể được tải xuống miễn phí từ Hugging Face. Để tối ưu hóa việc sử dụng, các mô hình này đã được lượng tử hóa sẵn ở định dạng MXFP4. Điều này cho phép GPT-OSS-120b chạy chỉ với 80GB bộ nhớ, còn GPT-OSS-20b chỉ yêu cầu 16GB, giúp tiết kiệm đáng kể chi phí phần cứng.
Mô hình còn được huấn luyện hậu kỳ theo định dạng câu lệnh Harmony. OpenAI cũng đã cung cấp mã nguồn công cụ kết xuất Harmony bằng cả Python và Rust, cùng với các công cụ mẫu để nhà phát triển có thể dễ dàng sử dụng.

Ngoài ra, OpenAI đã triển khai tham chiếu để chạy suy luận với PyTorch và nền tảng Metal của Apple. Do đó, GPT-OSS sẽ hoạt động linh hoạt trên nhiều môi trường khác nhau: tại chỗ (on-premise), trên thiết bị (on-device) hoặc thông qua các nhà cung cấp bên thứ ba.
OpenAI sẽ hợp tác với các nền tảng triển khai hàng đầu như Hugging Face, Azure, vLLM, AWS, Fireworks và nhiều đối tác khác để đảm bảo nhà phát triển dễ dàng tiếp cận các mô hình này. Về phần cứng, họ sẽ kết hợp với NVIDIA, AMD, Cerebras và Groq để tối ưu hóa hiệu suất trên nhiều hệ thống.
Ngoài ra, Microsoft cung cấp phiên bản tối ưu hóa GPU của GPT-OSS-20B trên Windows, hỗ trợ suy luận cục bộ qua ONNX Runtime và khả dụng qua Foundry Local, AI Toolkit for VS Code. Các nhà phát triển có thể tinh chỉnh và triển khai mô hình trong môi trường riêng hoặc sử dụng nền tảng API của OpenAI để tích hợp dễ dàng.
VI. Kết luận
GPT-OSS ra đời không chỉ là một bước tiến công nghệ mà còn là một quyết định chiến lược trong cuộc đua AI. Với sức mạnh ngang ngửa các mô hình độc quyền hàng đầu nhưng lại hoàn toàn miễn phí và linh hoạt, GPT-OSS hứa hẹn sẽ thúc đẩy mạnh mẽ sự sáng tạo và đổi mới trong cộng đồng nhà phát triển. Đừng quên tiếp tục theo dõi Phong Vũ Tech News để cập nhật những xu hướng công nghệ AI mới nhất!
Theo: OpenAI
Bài viết liên quan:
- ChatGPT ghi nhận 2,5 tỷ truy vấn/ngày, Google sắp “hết thời”?
- ChatGPT Agent – Trợ lý ảo của Open AI có thể “điều khiển máy tính” tự động như con người
- Hàng nghìn cuộc trò chuyện chatGPT bị rò rỉ trên Google
Công Nghệ
Trên tay tai nghe Shokz OpenFit 2+: Âm thanh đỉnh cao với thiết kế mở, pin siêu bền Duy Linh 15 phút trước
Th8
Công Nghệ
AI trở thành trọng tâm tại giải thưởng Better Choice Awards 2025
Th8
Thời Sự
Phát triển phường Tây Hồ thành trung tâm dịch vụ, du lịch của Thủ đô
Th8
Thể Thao
Lịch thi đấu bóng đá hôm nay 8/8
Th8
Thời Sự
Hơn 300 triệu của cô gái Hà Nội ‘bốc hơi’ sau khi nhận việc với ‘hãng thời trang’
Th8
Công Nghệ
Vivo Y39 5G: Sự lựa chọn phù hợp cho học sinh, sinh viên có hỗ trợ 5G, NFC và pin “trâu” 6.500mAh
Th8
Thể Thao
Làm thế nào cựu sao trở thành ứng cử viên Quả Bóng Vàng?
Th8
Công Nghệ
Nubia Air lộ diện hoàn toàn: Thiết kế mỏng nhẹ, chip Unisoc, camera 50MP
Th8
Công Nghệ
Vietcombank thông báo: Đừng bấm vào nếu nhận tin nhắn có nội dung sau!
Th8
Công Nghệ
CEO OpenAI sốc trước GPT-5: “Tôi vô dụng khi so với nó”
Th8
Thời Sự
‘Hạn bà chằn’ ở TPHCM kết thúc, Biển Đông sắp đón vùng áp thấp mới
Th8
Radio My
Bé gái 3 tuổi mặc bỉm, đi chân trần chạy trên phố giữa đêm khuya để tìm mẹ
Th8
Công Nghệ
vivo Y39 5G: Điện thoại “bền từ trong ra ngoài”, dùng mượt lên đến 50 tháng
Th8
Thời Sự
Kẻ giả danh công an lúng túng trước sự thú nhận của cô gái ‘tay vịn’
Th8
Thể Thao
Arsenal thua bẽ bàng ngày Gyokeres chào sân Emirates
Th8
Thời Sự
Bộ GD-ĐT hướng dẫn dạy học 2 buổi/ngày, không cố định buổi 1 sáng, buổi 2 chiều
Th8
Công Nghệ
Làm thế nào để chọn đồng hồ thời trang phù hợp đi du lịch mùa hè này?
Th8
Thời Sự
Đoàn kết, đồng lòng vận hành bộ máy mới theo hướng tăng hiệu năng, hiệu lực, hiệu quả
Th8
Thời Sự
Tài xế taxi có thể bị phạt tới 10 triệu đồng nếu có các hành vi này
Th8
Thể Thao
Liverpool chuyển nhượng Bradley Barcola 100 triệu euro
Th8
Radio My
Phát hiện vợ ngoại tình, chồng lặng lẽ ‘tung đòn thù’ khiến cả nhà chết lặng
Th8
Thể Thao
Nhận định, soi tỷ lệ Newcastle vs Atletico 23h00ngày 9/8, giao hữu mùa hè 2025
Th8
Công Nghệ
Galaxy Buds 3 FE lộ ảnh render chính thức, dự kiến ra mắt tháng 9
Th8
Công Nghệ
Mã độc rút trộm tiền nhắm vào người dùng Việt, nên cảnh giác với ứng dụng này
Th8
Công Nghệ
Kioxia ra mắt ổ cứng SSD 245TB dung lượng cao nhất thế giới
Th8
Thời Sự
Xã Phú Xuyên đẩy nhanh tiến độ cấp đổi thẻ đảng viên
Th8
Thời Sự
Nạn nhân kép của những vụ ‘bắt cóc online’ bị đánh gục bởi cái ‘bẫy tâm lý’
Th8
Thể Thao
Nhận định bóng chuyền nữ U21 Việt Nam vs Indonesia: Thắng trận đầu
Th8
Công Nghệ
ChatGPT Plus từng có giá 1.5 triệu nay được tặng miễn phí 100% nhanh tay nhận ưu đãi ngay bạn ơi
Th8
Công Nghệ
YouTube triển khai AI xác minh độ tuổi người dùng từ tháng 8/2025
Th8
Thời Sự
Trang trọng Lễ thượng cờ kỷ niệm 58 năm Ngày thành lập ASEAN
Th8
Thể Thao
Bị MU nẫng Sesko, Newcastle ký Nicolas Jackson giá đắt đỏ
Th8
Giải Trí
Ca sĩ Nguyên Vũ bật khóc giữa họp báo, nói: ‘Tôi cần tình bạn’
Th8
Công Nghệ
Lenovo Xiaoxin Pro GT và Xiaoxin Pad 12.1 ra mắt: Tablet chơi game giá rẻ thiết kế đẹp, hiệu năng mạnh, giá
Th8
Thể Thao
Nhận định, soi tỷ lệ MU vs Fiorentina 19h45 ngày 9/8, giao hữu mùa hè 2025
Th8
Công Nghệ
Mẹo quay highlight Liên Quân cực dễ giúp bạn lưu giữ khoảnh khắc chiến đấu ấn tượng nhất
Th8
Công Nghệ
ChatGPT tặng miễn phí model AI GPT OSS, sức mạnh ngang ngửa GPT-4o
Th8
Thời Sự
Vụ nhóm người chặn taxi, đuổi phụ nữ bế con ra khỏi xe: PGĐ Sở thông tin bất ngờ
Th8
Thể Thao
De Paul, Suarez thay Messi tỏa sáng giúp Inter Miami thắng tưng bừng
Th8
Giải Trí
Gilberto Silva cùng nhiều nghệ sĩ, KOLs khuấy động sự kiện Pháo đài lấm bẩn
Th8
Radio My
Về già không sợ cô đơn, tuổi 60 về hưu tôi nhận ra 5 điều để có hạnh phúc
Th8
Công Nghệ
“Người Việt đón nhận sản phẩm Việt”: Thông điệp được nhấn mạnh tại Better Choice Awards 2025
Th8
Công Nghệ
Người dùng iPhone có nguy cơ cao hơn trước lừa đảo trực tuyến?
Th8
Giải Trí
Đảo duy nhất ở Việt Nam có thể khiến bạn chạm vào “địa ngục” lẫn “thiên đường”, dành cho người không thích đông đúc
Th8
Thời Sự
Được tặng món quà 4 chân đặc biệt, hot TikToker không dám nhận
Th8
Thể Thao
McTominay được đề cử Quả bóng vàng, cái tát đau cho MU
Th8
Radio My
22 năm tìm con, ngày đoàn tụ, cha chết lặng vì bố mẹ nuôi con là đồng nghiệp cũ
Th8
Thể Thao
Đội bóng của Fabregas đấm đá nhau gây sốc với đối thủ Liga dù chỉ đá giao hữu
Th8
Công Nghệ
vivo V50 Lite thiết kế siêu đẹp, pin trâu 6.500 mAh kèm sạc nhanh 90 W, giá bao tốt, ưu đãi trả chậm 0%
Th8
Công Nghệ
Công an đã cảnh báo nhiều lần, người phụ nữ Hà Nội vẫn chuyển khoản 340 triệu đồng cho lừa đảo
Th8
Giải Trí
Ẩn mình giữa núi rừng Lào Cai có một phiên chợ đông khách nườm nượp, thu hút nhờ tập trung tinh hoa ẩm thực Tây Bắc
Th8
Thời Sự
Hiện trường tan hoang sau trận lũ kinh hoàng khiến 12 người chết và mất tích
Th8
Công Nghệ
ASUS ra mắt loạt laptop AI mỏng nhẹ và hiệu năng cao cho mùa tựu trường 2025
Th8
Giải Trí
Lộc trời xưa mọc đầy rừng không ai hái, nay là đặc sản chị em lùng mua, giá cực cao vẫn hết hàng vèo vèo
Th8
Ẩm Thực
Hướng dẫn cách nấu lẩu đuôi bò thuốc bắc đơn giản tại nha
Th8
Thời Sự
Phó giám đốc ở Quảng Ninh có nồng độ cồn khi lái xe gây tai nạn
Th8
Công Nghệ
iOS 18.6 beta RC ra mắt: Toàn bộ những điểm mới và thay đổi
Th8
Ẩm Thực
Rau đặc sản ở miền Bắc trồng 1 lần hái cả năm, ăn bổ lại ngon
Th7