Viettel tung “vũ khí” AI 120 tỷ tham số, kỹ sư Việt Nam làm được điều đặc biệt

TIN MỚI

    Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) vừa công bố kết quả huấn luyện mô hình ngôn ngữ lớn chuyên biệt cho tiếng Việt mang tên VT-Super-120B-A12B, sở hữu quy mô lên tới 120 tỷ tham số.

    Tham số là thước đo độ lớn và khả năng xử lý thông tin phức tạp của một hệ thống AI. Con số 120 tỷ đặt sản phẩm của Viettel vào nhóm các mô hình có quy mô lớn hiện nay.

    Qua các bài kiểm tra tiêu chuẩn, mô hình này ghi nhận độ chính xác nằm trong nhóm dẫn đầu thị trường quốc tế khi so sánh với các hệ thống có cùng độ lớn.

    Một điểm sáng về mặt kỹ thuật là mô hình này được tối ưu để hiểu sâu ngôn ngữ bản địa mà không làm suy giảm khả năng xử lý tiếng Anh sẵn có.

    Đồng thời, đội ngũ kỹ sư Việt Nam đã khắc phục thành công lỗi quên kiến thức cũ (catastrophic forgetting) — một rào cản phổ biến khi nạp thêm dữ liệu mới cho các hệ thống trí tuệ nhân tạo.

    Ông Nguyễn Mạnh Quý, Giám đốc Viettel AI, nhận định: “AI đang chuyển từ vai trò hỗ trợ sang lớp hạ tầng công nghệ mới. Quốc gia nào làm chủ được mô hình, dữ liệu và năng lực huấn luyện sẽ có lợi thế tạo ra những hệ thống phục vụ đúng nhu cầu phát triển của mình. Với Viettel, làm chủ LLM tiếng Việt là bước đi cốt lõi để hình thành các giải pháp AI chủ quyền có khả năng đồng hành thực sự cùng các tổ chức, doanh nghiệp Việt Nam.”

    Công thức huấn luyện từ nguồn dữ liệu thuần Việt

    Để xây dựng hệ thống này, Viettel AI lựa chọn sử dụng kiến trúc mở toàn cầu NVIDIA Nemotron 3 Super làm nền tảng ban đầu nhờ ưu thế xử lý các văn bản dài, giúp AI không bị mất mạch thông tin khi phân tích cùng lúc nhiều tài liệu hoặc các cuộc hội thoại phức tạp.

    Từ nền tảng đó, các kỹ sư Viettel trực tiếp làm chủ quá trình huấn luyện chuyên sâu cho tiếng Việt thông qua ba giai đoạn bằng nguồn dữ liệu thực tế trong nước.

    Đầu tiên là giai đoạn mở rộng tri thức bản địa, hệ thống được nạp kho dữ liệu thô khổng lồ bao gồm văn bản hành chính, quy trình nghiệp vụ doanh nghiệp và ngữ cảnh giao tiếp thực tế tại Việt Nam để AI làm quen với ngôn ngữ bản xứ.

    Tiếp theo là tinh chỉnh khả năng suy luận bằng phương pháp huấn luyện có giám sát nhằm nâng cao tư duy logic, giúp AI hiểu đúng yêu cầu và ngữ cảnh cụ thể.

    Cuối cùng, phương pháp học tăng cường được áp dụng để kiểm soát và nâng cao độ chính xác của câu trả lời trước khi đưa vào thực tế. Việc làm chủ quy trình này giúp Viettel có thể linh hoạt điều chỉnh các giải pháp AI theo đúng nhu cầu thực tế của từng tổ chức, doanh nghiệp nội địa.

    Ứng dụng thực tế và hạ tầng đám mây

    Thành công về mặt chỉ số công nghệ hiện đang được Viettel chuyển hóa thành các giải pháp thương mại. Mô hình 120 tỷ tham số này là hạt nhân cốt lõi để đơn vị phát triển hệ thống AI Agent (Trợ lý AI) cho người Việt, gồm những trợ lý ảo thế hệ mới có thể tự thực hiện một chuỗi công việc liên hoàn thay vì chỉ trả lời từng câu lệnh đơn lẻ.

    image7 1780631452910 17806314532531553639401

    Ứng dụng thực tế đầu tiên là dự án Trợ lý AI Pháp luật quy mô đại chúng. Nhờ mô hình mới, trợ lý ảo này có khả năng phân tích hồ sơ, đối chiếu các quy định pháp luật hiện hành và đưa ra gợi ý xử lý chính xác hơn cho người dùng.

    Định hướng tiếp theo của Viettel là đưa công nghệ này vào các lĩnh vực hành chính công, dịch vụ khách hàng tự động và phân tích dữ liệu doanh nghiệp.

    Để đảm bảo các mô hình vận hành an toàn và bảo mật cao ngay trong nước, Viettel Solutions cũng đã hợp tác và chính thức trở thành Đối tác đám mây của NVIDIA (NVIDIA Cloud Partner).

    Nguồn Trang : https://cafef.vn/viettel-tung-vu-khi-ai-120-ty-tham-so-ky-su-viet-nam-lam-duoc-dieu-dac-biet-188260605105201781.chn

    Để lại một bình luận