Cho dù siêu tiết kiệm tài nguyên, mô hình AI mới của DeepSeek lại có hiệu năng ngang ngửa các mô hình AI tốt nhất hiện nay.

Ngành công nghiệp trí tuệ nhân tạo thế giới đang chứng kiến một cuộc cách mạng thầm lặng khi startup AI Trung Quốc DeepSeek vừa tung ra phiên bản cập nhật mô hình R1-0528 cùng với một biến thể nhỏ gọn có thể hoạt động trên chỉ một card đồ họa duy nhất, thách thức trực tiếp các ông lớn công nghệ Mỹ như OpenAI và Google.

Sự kiện này đánh dấu một bước ngoặt quan trọng trong cuộc đua AI toàn cầu, khi DeepSeek một lần nữa chứng minh rằng không nhất thiết phải đầu tư hàng tỷ đô la và sử dụng hàng chục card đồ họa siêu mạnh mới có thể tạo ra những mô hình AI đẳng cấp thế giới.

Phiên bản cập nhật R1-0528 mà DeepSeek công bố trên nền tảng Hugging Face được mô tả là một “nâng cấp nhỏ” nhưng mang lại những cải tiến đáng kể. Mô hình mới đã giảm tới 45-50% tỷ lệ “ảo giác” – hiện tượng AI tạo ra thông tin sai lệch hoặc không chính xác, đồng thời nâng cao khả năng xử lý các tác vụ phức tạp, đưa hiệu suất của nó gần hơn với các mô hình suy luận hàng đầu như o3 của OpenAI và Gemini 2.5 Pro của Google.

DeepSeek lại gây chấn động thế giới với mô hình AI mới: Thông minh hơn, chạy được trên một GPU duy nhất - Ảnh 1.

Điều đặc biệt ấn tượng hơn cả là phiên bản “chưng cất” DeepSeek-R1-0528-Qwen3-8B, được xây dựng dựa trên nền tảng mô hình Qwen3-8B của Alibaba. Trong khi mô hình R1 đầy đủ với 685 tỷ tham số cần khoảng một chục card đồ họa 80GB để vận hành, phiên bản nhỏ gọn này chỉ yêu cầu một GPU với 40-80GB RAM, tương đương với một card Nvidia H100 duy nhất.

Không chỉ tiết kiệm tài nguyên tính toán, mô hình nhỏ gọn này còn thể hiện hiệu suất vượt trội khi đánh bại Google Gemini 2.5 Flash trong bộ câu hỏi toán học thử thách AIME 2025 và gần như sánh ngang với mô hình Phi 4 reasoning plus mới nhất của Microsoft trong bài kiểm tra kỹ năng toán học HMMT.

Thành công của DeepSeek đang làm lung lay những niềm tin cơ bản về ngành AI. Trước đây, cộng đồng công nghệ tin rằng để phát triển AI tiên tiến cần phải có nguồn đầu tư khổng lồ và sức mạnh tính toán vượt trội. Tuy nhiên, startup có trụ sở tại Hàng Châu này đã chứng minh rằng có thể tạo ra các mô hình AI đẳng cấp thế giới với chi phí thấp hơn đáng kể.

DeepSeek lại gây chấn động thế giới với mô hình AI mới: Thông minh hơn, chạy được trên một GPU duy nhất - Ảnh 2.

Vô cùng nhỏ gọn nhưng hiệu năng của DeepSeek-R1-0528 vẫn ngang ngửa các mô hình AI tốt nhất hiện nay

Sự xuất hiện của R1 phiên bản đầu vào tháng Giêng đã tạo ra làn sóng toàn cầu, khiến cổ phiếu của các công ty công nghệ ngoài Trung Quốc giảm mạnh và buộc các đối thủ phải điều chỉnh chiến lược. Google đã giới thiệu các gói dịch vụ Gemini giảm giá, trong khi OpenAI cắt giảm chi phí và phát hành mô hình o3 Mini ít tốn tài nguyên tính toán hơn.

Phiên bản cập nhật mới không chỉ cải thiện khả năng suy luận mà còn mở rộng phạm vi ứng dụng. DeepSeek cho biết mô hình hiện có thể viết sáng tạo các bài luận, tiểu thuyết và nhiều thể loại khác, cùng với khả năng cải tiến trong việc tạo mã front-end và nhập vai. Những cải tiến này được phát hành dưới giấy phép MIT khoan dung, cho phép sử dụng thương mại không hạn chế.

Thành công của DeepSeek cũng mang ý nghĩa địa chính trị sâu sắc, khi nó chứng minh rằng các lệnh cấm xuất khẩu công nghệ của Mỹ nhằm kìm hãm sự phát triển AI của Trung Quốc không đạt được hiệu quả như mong đợi. Điều này đặt ra những câu hỏi lớn về hiệu quả của các biện pháp kiểm soát công nghệ trong bối cảnh toàn cầu hóa.

Hiện tại, DeepSeek vẫn được kỳ vọng sẽ phát hành mô hình R2 – người kế nhiệm của R1, mặc dù kế hoạch ban đầu cho tháng Năm đã bị hoãn lại. Với những thành tựu đã đạt được, startup AI này đang khẳng định vị thế của mình như một thế lực không thể bỏ qua trong cuộc đua công nghệ toàn cầu, đồng thời mở ra những khả năng mới cho việc dân chủ hóa công nghệ AI khi làm cho nó trở nên dễ tiếp cận hơn với những tổ chức có nguồn lực hạn chế.