Khẳng định “Trung Quốc không thể mãi là người đi sau”, một thiên tài công nghệ khiến thế giới chấn động, gây sốc cho Thung lũng Silicon và Phố Wall


Trên trường quốc tế, Liang Wenfeng được coi là một doanh nhân công nghệ đáng gờm, có tiềm năng vượt qua cả những lãnh đạo công nghệ Mỹ như Sam Altman, người sáng lập OpenAI, và định hình lại cuộc cạnh tranh Mỹ – Trung.

 - Ảnh 1.

Cách đây không lâu, ít ai ở Trung Quốc biết đến Mililing, một ngôi làng xa xôi ở Quảng Đông. Nhưng mọi thứ đã thay đổi từ đầu năm nay, khi hàng trăm du khách đổ về mỗi ngày để tri ân Liang Wenfeng , nhà sáng lập 40 tuổi của công ty khởi nghiệp trí tuệ nhân tạo (AI) DeepSeek, người đã trở thành người hùng vì mang lại lợi thế cho Trung Quốc trong cuộc đua công nghệ với Mỹ.

Người dân địa phương, nhiều người cùng họ Liang, đã dựng các quầy hàng gần ngôi nhà thời thơ ấu của ông để bán đồ lưu niệm và đồ uống, bao gồm nước mía “trạng nguyên” – một cách gọi nhằm vinh danh người đứng đầu kỳ thi đình.

Trên trường quốc tế, Liang được coi là một doanh nhân công nghệ đáng gờm, có tiềm năng vượt qua cả những lãnh đạo công nghệ Mỹ như Sam Altman, người sáng lập OpenAI, và định hình lại cuộc cạnh tranh Mỹ – Trung. “Trung Quốc không thể mãi là người đi sau” , Liang từng chia sẻ trong một cuộc phỏng vấn với tờ 36Kr (Trung Quốc) vào năm 2024.

Kể từ khi DeepSeek gây sốc cho Thung lũng Silicon và Phố Wall với mô hình suy luận mạnh mẽ vào tháng 1, Liang Wenfeng đã trở thành một trong những nhân vật có ảnh hưởng nhất tại Trung Quốc, tương tự như các nhà khoa học hạt nhân và tên lửa của thập niên 1950-1960, những người đã giúp thúc đẩy lợi thế chiến lược của quốc gia.

Câu chuyện của Liang đã truyền cảm hứng mạnh mẽ cho những người trẻ trên khắp Trung Quốc, những người coi ông là biểu tượng của việc vượt qua khó khăn để đạt thành công nhờ tài năng và sự chăm chỉ. Một người dân làng Mililing giấu tên nói với Yangcheng Evening News rằng Liang rất tài năng từ nhỏ.

DeepSeek, có trụ sở tại Hàng Châu, đã gây chấn động trên toàn cầu nhờ phát triển các mô hình AI với chi phí chỉ bằng một phần nhỏ so với các công ty công nghệ Mỹ như OpenAI, Google và Meta Platforms. Công ty này, được tách ra từ quỹ đầu tư định lượng High-Flyer của Lương vào năm 2023, đã làm thay đổi nhận thức rằng AI chỉ dành cho các Big Tech với nguồn lực khổng lồ.

Sự đột phá của DeepSeek đã khiến giá cổ phiếu của gã khổng lồ bán dẫn Nvidia và các cổ phiếu liên quan đến AI sụt giảm, đồng thời làm dấy lên cuộc tranh luận về cạnh tranh kinh tế và địa chính trị giữa Mỹ và Trung Quốc trong phát triển công nghệ AI.

Ngày 20/1/2025, DeepSeek ra mắt mô hình DeepSeek R1, được ca ngợi vì khả năng cạnh tranh với các mô hình tiên tiến như GPT-4 của OpenAI, Llama của Meta và Gemini của Google, nhưng chỉ tốn 5,6 triệu USD để phát triển, thấp hơn nhiều so với hàng trăm triệu, thậm chí hàng tỷ USD mà các công ty Mỹ chi cho công nghệ AI. Mô hình này, cùng với DeepSeek V3 ra mắt vào tháng 12/2024, đã vượt qua hoặc ngang bằng với các sản phẩm cạnh tranh trong nhiều bài kiểm tra chuẩn ngành, bất chấp các hạn chế của Mỹ về xuất khẩu chip AI tiên tiến sang Trung Quốc.

DeepSeek tuyên bố đã sử dụng chip H800 của Nvidia, loại không bị cấm ở Trung Quốc, để gửi thông điệp rằng phần cứng cao cấp nhất không phải là yếu tố duy nhất để nghiên cứu AI tiên tiến.

Sự thành công của DeepSeek không chỉ nằm ở chi phí thấp. Công ty đã chọn mô hình mã nguồn mở, cho phép mã nguồn được chia sẻ công khai để các nhà phát triển trên toàn cầu sử dụng và sửa đổi. Lương Văn Phong, trong một cuộc phỏng vấn hiếm hoi với Waves năm ngoái, nói rằng mã nguồn mở giống như “một thực tiễn văn hóa, hơn là một thực tiễn kinh doanh,” mang lại “sức mạnh mềm” cho công ty.

Quyết định này đã giúp DeepSeek thúc đẩy sự đổi mới toàn cầu, như nhà khoa học máy tính đoạt giải Turing Andrew Yao Chi-chih từ Đại học Thanh Hoa nhận xét tại một sự kiện bên lề Hội nghị Thượng đỉnh Hành động AI ở Paris: “Vì các mô hình của DeepSeek là mã nguồn mở, chúng sẽ mang lại lợi ích cho cộng đồng AI toàn cầu, giúp tất cả chúng ta cùng tiến bộ công nghệ”.

Liang, từng tốt nghiệp Đại học Chiết Giang với bằng kỹ thuật thông tin điện tử và khoa học máy tính, có xuất thân khác biệt so với nhiều doanh nhân AI Mỹ đến từ Thung lũng Silicon. Trước DeepSeek, ông đồng sáng lập High-Flyer, một quỹ đầu tư định lượng sử dụng AI để phân tích dữ liệu tài chính và đưa ra quyết định đầu tư.

Năm 2019, High-Flyer trở thành quỹ đầu tư định lượng đầu tiên ở Trung Quốc huy động được hơn 100 tỷ nhân dân tệ (13 tỷ USD). Từ năm 2019, Lương đã chi 200 triệu nhân dân tệ để mua 1.100 GPU và đến năm 2021, quỹ này đầu tư 1 tỷ nhân dân tệ vào cụm siêu máy tính Fire-Flyer 2 với sức mạnh 1.550 petaflops, theo tài liệu của High-Flyer.

Khác với các gã khổng lồ công nghệ Trung Quốc như Baidu hay Alibaba, Liang tập trung tuyển dụng các tài năng trẻ, chủ yếu là sinh viên tốt nghiệp và nghiên cứu sinh tiến sĩ từ các trường hàng đầu như Đại học Bắc Kinh và Thanh Hoa, thay vì các kỹ sư dày dạn kinh nghiệm.

Trong một phỏng vấn với 36Kr năm 2023, ông cho biết hầu hết các vai trò kỹ thuật cốt lõi tại DeepSeek được đảm nhiệm bởi sinh viên mới tốt nghiệp hoặc người có một đến hai năm kinh nghiệm, phù hợp với triết lý ưu tiên năng lực hơn kinh nghiệm. Đội ngũ này, kết hợp với các chuyên gia văn học và khoa học xã hội để xây dựng dữ liệu huấn luyện chất lượng cao, đã giúp DeepSeek tạo ra các phản hồi AI với sự tinh tế và tính nhân văn, theo cựu nhân viên và các nhà phân tích.

Sự nổi tiếng của Liang tăng vọt sau khi tham dự các hội nghị cấp cao. Ngày 20/1/2025, ông phát biểu tại một hội thảo kín do Thủ tướng Lý Cường chủ trì, và ngày 17/2, ông gặp Chủ tịch Tập Cận Bình tại một hội thảo khác. Tuy nhiên, Lương giữ thái độ kín tiếng, không nhận phỏng vấn công khai kể từ khi DeepSeek R1 ra mắt, chỉ xuất hiện với tư cách đồng tác giả trong một bài nghiên cứu về “Native Sparse Attention”, được công bố ngày 16/2/2025 trên arXiv, tập trung vào việc nâng cao hiệu quả xử lý dữ liệu lớn của các mô hình AI.

DeepSeek cũng đối mặt với những thách thức. Úc đã cấm sử dụng DeepSeek trên thiết bị và hệ thống chính phủ vì lo ngại an ninh quốc gia, trong khi Ý chặn ứng dụng DeepSeek từ ngày 30/1/2025 do lo ngại bảo vệ dữ liệu. Nhiều cơ quan bảo vệ dữ liệu toàn cầu yêu cầu DeepSeek làm rõ cách xử lý thông tin cá nhân, vốn được lưu trữ trên máy chủ tại Trung Quốc. Một số ý kiến, như giám đốc điều hành Scale AI Alexandr Wang, nghi ngờ DeepSeek sở hữu 50.000 chip H100 của Nvidia, điều có thể vi phạm kiểm soát xuất khẩu của Mỹ, dù không có bằng chứng cụ thể.

Dù vậy, Liang vẫn tập trung vào nghiên cứu trí tuệ nhân tạo tổng quát (AGI) – các hệ thống vượt qua con người trong hầu hết các nhiệm vụ kinh tế. Theo một nguồn tin thân cận, DeepSeek không vội huy động vốn hay tham gia hoạt động thương mại mới, ưu tiên nâng cao hiệu quả mô hình với nguồn lực tối thiểu. “Liệu đây có phải lựa chọn khôn ngoan và có thể duy trì nghiên cứu bao lâu, chỉ thời gian mới trả lời được,” nguồn tin nói.