Trong bối cảnh trí tuệ nhân tạo (AI) đang bùng nổ trên toàn cầu, Việt Nam vừa chính thức giới thiệu phiên bản thử nghiệm đầu tiên của nền tảng ViGen – một nỗ lực hợp tác giữa Trung tâm Đổi mới Sáng tạo Quốc gia (NIC), tập đoàn Meta và tổ chức AI for Vietnam.
Dự án này khởi động từ tháng 3/2025 và đã nhanh chóng thu hút sự đồng hành của nhiều đối tác lớn như NVIDIA, Viettel, Viện Công nghệ thông tin thuộc Viện Hàn lâm Khoa học và Công nghệ Việt Nam, Đại học Bách khoa, Học viện Bưu chính Viễn thông.
ViGen là bước đi cụ thể nhằm thực hiện Chiến lược quốc gia về nghiên cứu, phát triển và ứng dụng AI đến năm 2030. Mục đích của dự án là tạo ra bộ dữ liệu tiếng Việt mã nguồn mở, chất lượng cao cho các mô hình ngôn ngữ lớn (LLM), giúp các mô hình AI hiểu rõ hơn về ngôn ngữ, văn hóa và xã hội Việt Nam.

Ngay trong giai đoạn đầu, ViGen đã đạt 3 dấu mốc quan trọng, bao gồm Primer 1.0, bộ dữ liệu tiền huấn luyện tiếng Việt mở lớn nhất từ trước đến nay, gồm 50 tỷ token được chọn lọc kỹ lưỡng từ hơn 150 tỷ token thô.
Bộ dữ liệu bao phủ từ kiến thức mầm non đến đại học, giúp huấn luyện các mô hình AI đạt năng lực tương đương “một sinh viên tốt nghiệp đại học loại giỏi, vừa có kiến thức, vừa có năng lực tư duy”.
ViGen cũng giới thiệu 5 khung đánh giá (benchmark). Với hơn 10.000 mẫu kiểm tra, các khung này đo năng lực AI ở nhiều mặt như kiến thức, tư duy logic, lập trình, khả năng hiểu văn hóa và ngôn ngữ Việt.
Cuối cùng là nền tảng ViGen phiên bản beta. Đây là một không gian mở, cho phép người dân đăng nhập bằng VNeID để đóng góp dữ liệu (văn bản, giọng nói, video…), đồng thời tích hợp cơ chế “thi đua – khen thưởng” để khuyến khích cộng đồng tham gia.
Ông Trần Việt Hùng – nhà sáng lập AI for Vietnam – nhấn mạnh: “Nếu xây dựng những bộ dữ liệu này từ đầu, chúng ta sẽ rất chậm so với các nước đã đầu tư rất nhiều và đi trước”.
Giới thiệu về sản phẩm này
Độ chính xác đo: + / - 0,5% FS
Dung sai bù đầu lạnh: + /- 2 độ C (có thể được sửa đổi
bằng phần mếm trong 0 ~ 50 độ C)
Độ phân giải: 14 bit
Chu ky lấy mẫu: 0,5 giây
Quyền lực: AC 100-240V 50 / 60HZ
Giá trị quá trình (PV), Giá trị cài đặt (SV)
<iểm soát PIN (bao gồm ON / OFF, PID loại bước và PID liêr
tỤc)
Điều khiển tự điều chỉnh
Đầu ra rơ le: công suất tiếp xúc 250V AC 3A (tải điện3ộ điều khiển nhiệt độ PID REX-C100, với cặp nhiệt
Do đó, dự án lựa chọn cách tiếp cận hoàn toàn mới: toàn dân cùng xây dựng bộ dữ liệu này. “Chúng ta có 100 triệu người nói tiếng Việt, khi cùng nhau đóng góp, tốc độ sẽ rất nhanh và đây là một sáng kiến đầu tiên trên thế giới”.
Về phía Meta, Giám đốc Chính sách Công và Sản phẩm, Khu vực Châu Á – Thái Bình Dương Philip Chua cho rằng: “Việc ra mắt nền tảng ViGen là một cột mốc quan trọng, thể hiện niềm tin rằng AI mã nguồn mở có thể giúp các nhà nghiên cứu, doanh nghiệp Việt xây dựng giải pháp thực sự am hiểu văn hóa và giá trị Việt Nam”.
Ông chia sẻ, dữ liệu mở không chỉ phục vụ nghiên cứu trong nước mà còn tạo điều kiện để Việt Nam góp tiếng nói trên bản đồ AI toàn cầu.
Phó Giám đốc NIC Võ Xuân Hoài, cũng khẳng định: “Nền tảng ViGen thể hiện rõ vai trò của hợp tác công – tư trong việc thực hiện mục tiêu khoa học, công nghệ và đổi mới sáng tạo quốc gia. Chúng ta đang xây dựng không chỉ công nghệ, mà còn nền tảng cho tăng trưởng bền vững dựa trên AI”.
Điểm đặc biệt của ViGen là tính mở và tính cộng đồng. Người dân có thể trực tiếp tham gia bằng cách tải dữ liệu lên hệ thống. Dữ liệu sau đó được xử lý và lọc để đưa vào bộ huấn luyện.
Người đóng góp được ghi nhận công sức, thậm chí có thể đổi thưởng. Đây là cách tiếp cận mới, biến việc “xây dữ liệu” khô khan thành một hoạt động có tính tương tác và vui vẻ.
Tải VPBank
Theo lộ trình ba năm, ViGen sẽ tiếp tục mở rộng: năm 2026 bổ sung bộ dữ liệu tinh chỉnh, công cụ hỗ trợ lập trình viên và tổ chức các cuộc thi AI cấp quốc gia; đến năm 2027 sẽ cập nhật dữ liệu và phát triển các công cụ nâng cao để ứng dụng AI sâu rộng trong doanh nghiệp.
Với sự tham gia của cả doanh nghiệp, viện nghiên cứu, trường đại học và người dân, ViGen được kỳ vọng sẽ biến AI thành công cụ thiết thực cho từng người Việt.
Như lời ông Philip Chua, “Chúng tôi hy vọng đây sẽ là nền tảng quan trọng cho hệ sinh thái AI Việt Nam. Dự án ViGen sẽ thúc đẩy hợp tác, hỗ trợ phát triển các giải pháp dành cho Việt Nam, do Việt Nam dẫn dắt và thúc đẩy tăng trưởng kinh tế cho khu vực”.



Bài viết gợi ý
- Mời làm việc chủ quán bán vài xiên nướng tính giá 760.000 đồng cho khách Lào
Ngày 15/7, ông Hoàng Công Thanh - Chủ tịch UBND phường An Hải (TP Đà Nẵng) cho biết, địa phương đã mời làm việc đối với chủ quán vỉa hè bị tố bán đồ ăn vặt giá "trên trời". Theo đó, ngay sau khi tiếp nhận thông tin phản ánh, chiều 14/7, lực lượng chức năng phường An Hải đã đến kiểm tra hộ kinh doanh của ...
- Sau gần 2 năm mua lại Nova F&B, ‘đại gia’ nổi tiếng tp.HCM có tên trong danh sách nợ thuế, nợ BHXH, nợ tiền thuê nhà hàng tỷ đồng
- Tuyển Thái Lan thắng Saudi Arabia kịch tính để giành chức vô địch, Madam Pang thổ lộ niềm vui
- Đặc sản nướng thơm lừng ở Pù Luông, níu chân du khách giữa rừng xanh
- 5 nguyên tắc phòng tránh sét đánh
- Hướng dẫn cách đổi nhạc chuông iPhone trên iOS 26 cực tiện lợi bạn nên thử
- Những vị trí đắc địa "săn" ảnh biên đội bay luyện tập mừng Quốc khánh 2/9
- Diễn viên phim 700 tỷ U50 vẫn phong độ, giữ kín đời tư tuyệt đối suốt 20 năm