ChatGPT tặng miễn phí model AI GPT OSS, sức mạnh ngang ngửa GPT-4o

Posted on 08/08/2025 by Quang Hùng Media

nội dung

1 I. Giới thiệu về GPT-OSS: Mô hình AI mở tiên tiến và hiệu quả cao
2 II. GPT-OSS: AI mở mạnh mẽ, an toàn và tối ưu
3 III. Kiến trúc và phương pháp huấn luyện của GPT-OSS
- 3.1 1. Huấn luyện trước mô hình GPT-OSS
- 3.2 2. Huấn luyện hậu kỳ
4 IV. Kết quả đánh giá và hiệu suất vượt trội của GPT-OSS
5 V. Cách thức truy cập và sử dụng GPT-OSS
6 VI. Kết luận

Những bước tiến lớn trong lĩnh vực trí tuệ nhân tạo (AI) luôn thu hút sự chú ý của giới công nghệ. Mới đây, ChatGPT đã chính thức phát hành phiên bản AI GPT OSS, mang lại sức mạnh vượt trội, có thể cạnh tranh ngang ngửa với GPT-4o. Cùng Phong Vũ Tech News khám phá những tính năng và ứng dụng đầy tiềm năng của model này trong bài viết dưới đây!

Mục lục

Toggle

I. Giới thiệu về GPT-OSS: Mô hình AI mở tiên tiến và hiệu quả cao

ChatGPT vừa chính thức giới thiệu GPT-OSS-120b và GPT-OSS-20b – hai mô hình ngôn ngữ tiên tiến với trọng số mở, mang đến hiệu năng vượt trội với chi phí thấp. Phát hành theo giấy phép Apache 2.0 linh hoạt, các mô hình này được tối ưu hóa để triển khai hiệu quả trên phần cứng của người dùng, vượt trội hơn nhiều so với open model có cùng kích thước trong các tác vụ lập luận phức tạp.

Openai Ra Mắt Gpt-Oss Với Hai Mô Hình Reasoning Mới (Nguồn: Internet)

GPT-OSS được đào tạo bằng cách học tập tăng cường (RLHF) và kết hợp những kỹ thuật đột phá của OpenAI, bao gồm cả O3 và các hệ thống tiên phong khác. Trong đó:

GPT-OSS-120b: Đạt hiệu năng gần tương đương với OpenAI O4-mini về khả năng tư duy cốt lõi và có thể hoạt động hiệu quả trên một GPU 80GB duy nhất.
GPT-OSS-20b: Mang lại kết quả tương đương với OpenAI O3-mini trên các bài kiểm tra đối chuẩn thông thường vàcó thể chạy trên các thiết bị biên chỉ cần 16 GB bộ nhớ.

Có thể thấy, cả hai mô hình đều có khả năng sử dụng công cụ mạnh mẽ, tương tác tốt với các hàm few-shot và thực hiện suy luận CoT (Chain-of-Thought) hiệu quả. Theo các bộ đánh giá độc lập như Tau-Bench và HealthBench, model này thậm chí còn vượt trội hơn cả OpenAI O1 và GPT-4o.

Đặc biệt, GPT-OSS cũng hoàn toàn tương thích với API Phản hồi của ChatGPT. Từ đó cho phép nhà phát triển tận dụng tối đa khả năng tuân thủ hướng dẫn, sử dụng công cụ mạnh mẽ như tìm kiếm web hay thực thi mã Python.

II. GPT-OSS: AI mở mạnh mẽ, an toàn và tối ưu

An toàn là một yếu tố cốt lõi trong quá trình phát triển GPT-OSS. Các mô hình đã trải qua quy trình huấn luyện và đánh giá an toàn nghiêm ngặt, với một phiên bản của GPT-OSS-120b được tinh chỉnh đặc biệt theo Khung Chuẩn bị sẵn sàng. Dựa trên các tiêu chí an toàn nội bộ, GPT-OSS hoạt động tương đương với các mô hình hàng đầu của OpenAI, mang đến cho nhà phát triển một tiêu chuẩn an toàn tương tự như các mô hình độc quyền mới nhất.

Chúng Được Đánh Giá An Toàn Kỹ Lưỡng, Đảm Bảo Tiêu Chuẩn An Toàn Cao Nhất (Nguồn: Internet)

ChatGPT cũng đang hợp tác với các đối tác lớn như AI Sweden, Orange và Snowflake để khám phá các ứng dụng thực tế của mô hình nguồn mở. Từ lưu trữ tại chỗ để bảo mật dữ liệu đến tinh chỉnh cho các bộ dữ liệu chuyên biệt.

Việc phát hành GPT-OSS thể hiện cam kết của ChatGPT trong việc trao quyền cho mọi người – từ nhà phát triển cá nhân, doanh nghiệp lớn đến chính phủ – có thể chạy và tùy chỉnh AI trên cơ sở hạ tầng riêng của họ. Cùng với các mô hình có sẵn trên API, giờ đây nhà phát triển có thể tự do lựa chọn hiệu suất, chi phí và độ trễ phù hợp nhất cho mọi quy trình làm việc.

III. Kiến trúc và phương pháp huấn luyện của GPT-OSS

Để đạt được hiệu suất vượt trội và tối ưu hóa chi phí, các mô hình GPT-OSS được xây dựng trên một nền tảng kiến trúc tiên tiến và trải qua quy trình huấn luyện phức tạp. Dưới đây là những điểm nổi bật về cách OpenAI tạo ra các model AI nguồn mở mạnh mẽ:

Cả Hai Mô Hình Gpt-Oss Đều Được Thiết Kế Để Cân Bằng Giữa Khả Năng Suy Luận (Reasoning) Và Khả Năng Triển Khai Thực Tế (Nguồn: Internet)

1. Huấn luyện trước mô hình GPT-OSS

GPT-OSS là mô hình ngôn ngữ có trọng số mở đầu tiên kể từ sau GPT-2. Model sẽ được huấn luyện với các kỹ thuật tiên tiến nhất, tập trung vào khả năng suy luận và hiệu quả khi triển khai trong nhiều môi trường sử dụng khác nhau. Mỗi mô hình sử dụng kiến trúc Bộ chuyển đổi hỗn hợp nhiều chuyên gia (MoE), giúp giảm lượng tham số cần thiết cho mỗi lần xử lý, từ đó tăng hiệu quả. Cụ thể:

GPT-OSS-120b có tổng cộng 117 tỷ tham số, nhưng chỉ kích hoạt 5.1 tỷ tham số cho mỗi token đầu vào.
GPT-OSS-20b có tổng cộng 21 tỷ tham số, chỉ kích hoạt 3.6 tỷ tham số cho mỗi token.

Chúng còn sử dụng nhiều kỹ thuật khác như định vị xoay chiều (RoPE) để mã hóa vị trí, hỗ trợ độ dài ngữ cảnh lên tới 128 nghìn token, giúp xử lý những đoạn văn bản rất dài.

2. Huấn luyện hậu kỳ

Sau giai đoạn huấn luyện ban đầu, các GPT-OSS được tinh chỉnh bằng quy trình tương tự như o4-mini, bao gồm tinh chỉnh có giám sát và học tăng cường. Mục tiêu là giúp các mô hình này tuân thủ Đặc tả Mô hình của OpenAI và dạy chúng cách suy luận Chuỗi Tư duy (Chain-of-Thought) trước khi đưa ra câu trả lời.

Đặc biệt, giống như các o-series trong API, GPT-OSS hỗ trợ 3 mức độ suy luận: thấp, trung bình và cao. Các nhà phát triển có thể dễ dàng lựa chọn mức độ này bằng cách thêm một câu đơn giản vào phần thông báo hệ thống, giúp cân bằng giữa hiệu suất và độ trễ để phù hợp với từng tác vụ cụ thể.

IV. Kết quả đánh giá và hiệu suất vượt trội của GPT-OSS

OpenAI đã tiến hành đánh giá GPT-OSS-120b và GPT-OSS-20b dựa trên các bộ tiêu chuẩn học thuật phổ biến, đo lường khả năng lập trình, toán học, y tế và sử dụng công cụ. Model này được so sánh với các mô hình suy luận khác của OpenAI như O3, O3-mini và O4-mini.

Hai Mô Hình Lần Lượt Đạt Điểm Cao Hơn Các Đối Thủ Mã Nguồn Mở Và Các Model Trước Đó (Nguồn: Openai)

Kết quả cho thấy, GPT-OSS-120b không chỉ vượt trội hơn OpenAI o3-mini mà còn đạt được hiệu năng ngang bằng hoặc vượt qua OpenAI o4-mini trong nhiều lĩnh vực:

Lập trình thi đấu (Codeforces)
Giải quyết vấn đề tổng quát (MMLU và HLE)
Sử dụng công cụ (TauBench)
Các bài kiểm tra về y tế (HealthBench) và toán học thi đấu (AIME 2024 & 2025).

Câu Hỏi Khoa Học Cấp Độ Gpqa Diamond (Tools) (Nguồn: Openai)

Ngoài ra, GPT-OSS-20b dù có kích thước nhỏ hơn, nhưng vẫn cho thấy hiệu quả đáng kinh ngạc. Mô hình này đạt hiệu suất ngang bằng hoặc tốt hơn OpenAI o3-mini trên các bài đánh giá, đặc biệt là trong lĩnh vực toán học thi đấu và y tế.

V. Cách thức truy cập và sử dụng GPT-OSS

GPT-OSS-120b và GPT-OSS-20b đều có thể được tải xuống miễn phí từ Hugging Face. Để tối ưu hóa việc sử dụng, các mô hình này đã được lượng tử hóa sẵn ở định dạng MXFP4. Điều này cho phép GPT-OSS-120b chạy chỉ với 80GB bộ nhớ, còn GPT-OSS-20b chỉ yêu cầu 16GB, giúp tiết kiệm đáng kể chi phí phần cứng.

Mô hình còn được huấn luyện hậu kỳ theo định dạng câu lệnh Harmony. OpenAI cũng đã cung cấp mã nguồn công cụ kết xuất Harmony bằng cả Python và Rust, cùng với các công cụ mẫu để nhà phát triển có thể dễ dàng sử dụng.

Gpt-Oss-120B Và Gpt-Oss-20B Hiện Có Thể Tải Xuống Miễn Phí Trên Hugging Face (Nguồn: Internet)

Ngoài ra, OpenAI đã triển khai tham chiếu để chạy suy luận với PyTorch và nền tảng Metal của Apple. Do đó, GPT-OSS sẽ hoạt động linh hoạt trên nhiều môi trường khác nhau: tại chỗ (on-premise), trên thiết bị (on-device) hoặc thông qua các nhà cung cấp bên thứ ba.

OpenAI sẽ hợp tác với các nền tảng triển khai hàng đầu như Hugging Face, Azure, vLLM, AWS, Fireworks và nhiều đối tác khác để đảm bảo nhà phát triển dễ dàng tiếp cận các mô hình này. Về phần cứng, họ sẽ kết hợp với NVIDIA, AMD, Cerebras và Groq để tối ưu hóa hiệu suất trên nhiều hệ thống.

Ngoài ra, Microsoft cung cấp phiên bản tối ưu hóa GPU của GPT-OSS-20B trên Windows, hỗ trợ suy luận cục bộ qua ONNX Runtime và khả dụng qua Foundry Local, AI Toolkit for VS Code. Các nhà phát triển có thể tinh chỉnh và triển khai mô hình trong môi trường riêng hoặc sử dụng nền tảng API của OpenAI để tích hợp dễ dàng.

VI. Kết luận

GPT-OSS ra đời không chỉ là một bước tiến công nghệ mà còn là một quyết định chiến lược trong cuộc đua AI. Với sức mạnh ngang ngửa các mô hình độc quyền hàng đầu nhưng lại hoàn toàn miễn phí và linh hoạt, GPT-OSS hứa hẹn sẽ thúc đẩy mạnh mẽ sự sáng tạo và đổi mới trong cộng đồng nhà phát triển. Đừng quên tiếp tục theo dõi Phong Vũ Tech News để cập nhật những xu hướng công nghệ AI mới nhất!

Theo: OpenAI

Bài viết liên quan:

ChatGPT ghi nhận 2,5 tỷ truy vấn/ngày, Google sắp “hết thời”?
ChatGPT Agent – Trợ lý ảo của Open AI có thể “điều khiển máy tính” tự động như con người
Hàng nghìn cuộc trò chuyện chatGPT bị rò rỉ trên Google

Truc Tiep Arsenal 3 0 Nottingham Forest Zubimendi Lap Cu Dup H2 1850

Thể Thao