News :
Kết quả Conference League: Đội bóng của Premier League bất ngờ nhận thất bại Dragon Raja ReRise: Bí kíp đạt rank S siêu đơn giản trong minigame Maze của Nibelungen Hướng về Đại hội XIV của Đảng: Ý kiến đóng góp tâm huyết từ cán bộ cơ sở Khách Tây thử món mì ở Hà Nội có nước dùng đen sẫm, loại trứng ‘chưa từng thấy’ Cựu giảng viên đại học vào tù ra tội vì lừa đảo, làm giả con dấu Lịch thi đấu bóng đá hôm nay 23/10 Chương trình Y ở ĐH Y khoa Phạm Ngọc Thạch bị dừng có mức học phí 230 triệu/năm Đám cưới ở Ninh Bình có 7 ‘siêu nhân’ đến tặng quà, cả làng bật cười thích thú Tập luyện để khỏe, ai ngờ suy thận: Bác sĩ chỉ ra sai lầm nhiều người đang mắc ‘Bốc thuốc’ gì chặn rủi ro khi ngân hàng vi phạm phát hành trái phiếu? Mẫu Quyết định chấm dứt hợp đồng lao động không báo trước thông dụng nhất hiện nay có dạng thế nào? Ngâm giấm với gừng, mẹo hay mang lại lợi ích to lớn, ai không biết quá tiếc VIFA EXPO 2026 sẽ diễn ra từ ngày 8 – 11/3/2026 tại TP.HCM Dự báo thời tiết 23/10/2025: Hà Nội cao nhất chỉ 23 độ, Đà Nẵng lo mưa lớn lịch sử Doanh nhân Nguyễn Viết Vương hôn hoa hậu Đỗ Thị Hà trong lễ đón dâu sáng 22/10 Trường tiểu học ở Hà Nội tổ chức lại bữa ăn bán trú sau vụ hơn 180 em nghỉ học Phòng khám đa khoa Tâm Anh Cầu Giấy khai trương tại Hà Nội 8 loại thực phẩm ‘kỵ’ nồi chiên không dầu 5 kiêng kỵ phong thủy cửa chính, để “hút tiền thiên hạ”, thuận lợi đường công danh tài lộc Không khí lạnh áp chế, bão số 12 tan và áp thấp nhiệt đới suy yếu nhanh HLV Polking tuyên bố CAHN thắng đại diện Australia ở Cúp châu Á Chạy bộ 30 phút hay đi bộ 60 phút tốt hơn? Câu trả lời có chút bất ngờ Cách tính Thần số học theo ngày sinh, để xem đường đời của bạn tốt hay xấu Smartphone vừa chơi game mượt, vừa chụp ảnh đẹp là đây: Chip Snapdragon 8 Elite Gen 5, camera lắp được ống kính rời, pin 7.200mAh nhưng giá thì “giật mình” Quan điểm: Chiếc mặt nạ hồi sinh ở Emirates Sống Tiệm tạp hóa cháy ngùn ngụt trong đêm, người đàn ông không kịp thoát thân Nhận định bóng đá Real Madrid vs Juventus, vòng bảng Cúp C1 Mẹ bầu 27 tuổi phát hiện mắc bệnh giang mai, cách cô bị lây khiến ai cũng rùng mình Mẹo làm hành phi vàng ươm, để lâu vẫn giòn rụm, thơm nức Mẹo làm hành phi vàng ươm, để lâu vẫn giòn rụm, thơm nức Nhận định, soi tỷ lệ Al Ittihad vs Al Hilal 01h00 ngày 25/10, vòng 6 Saudi Pro League Một ngân hàng lớn cảnh báo khách hàng: Khi chuyển tiền phải xác thực sinh trắc học, không được bỏ qua thao tác này! Giếng xưa (Phần 2) Đại biểu Quốc hội đề nghị đổi mới mô hình quản trị văn hóa gắn với tái cấu trúc bộ máy nhà nước Anh, tình đầu… Ít ai biết sự tích về món phở cuốn trứ danh Hà Nội: Quán ăn đầu tiên phát minh ra xuất sắc được Michelin vinh danh Việt Nam tiếp tục có bản quyền giải bóng rổ Nhà nghề Mỹ Chanh xanh hay chanh vàng: Loại nào tốt hơn cho sức khỏe? Ân ái “khỏe hơn” nếu biết ăn theo chế độ này Mang hình hài nữ suốt 21 năm, xét nghiệm bỗng phát hiện là đàn ông khiến cả gia đình sững sờ Bí quyết làm tóp mỡ giòn rụm, thơm lừng, ăn không ngấy Trên tay iQOO 15: Điện thoại mới của vivo với chip Snapdragon 8 Elite Gen 5, pin 7.000mAh, có tính năng của flagship 30 triệu nhưng giá chỉ bằng một nửa Nhật Bản nhắm mục tiêu sở hữu mô hình AI ‘Made in Japan’, vận hành hoàn toàn bằng dữ liệu trong nước Tập trung tháo gỡ những điểm nghẽn trong giải quyết vụ việc phá sản Người dân Đà Nẵng gọi ai nếu nước dâng trong đêm do ảnh hưởng bão số 12? Lamine Yamal bám dính bạn gái sau trận Barca đại thắng Olympiakos Vắc xin Covid-19 có thể kích hoạt hệ miễn dịch chống lại ung thư Người đàn ông 37 tuổi suýt mất nửa lá gan vì ăn cá Không phải X300, đây mới là mẫu điện thoại vivo đang được người dùng “săn lùng”

Nhật Bản nhắm mục tiêu sở hữu mô hình AI ‘Made in Japan’, vận hành hoàn toàn bằng dữ liệu trong nước


Chính quyền Tokyo muốn hỗ trợ việc phát triển mô hình nội địa “sử dụng dữ liệu Nhật Bản” nhằm tránh phụ thuộc vào các mô hình từ Mỹ hoặc Trung Quốc.

Nhật Bản Nhắm Mục Tiêu Sở Hữu Mô Hình Ai 'Made In Japan', Vận Hành Hoàn Toàn Bằng Dữ Liệu Trong Nước- Ảnh 1.

Khi các mô hình ngôn ngữ lớn (LLM) như OpenAI GPT hay các phiên bản của Google DeepMind được phát hành rộng rãi, thị trường Nhật Bản – với ngôn ngữ, văn hoá và bối cảnh riêng – bắt đầu nhận ra một điều: muốn tạo ra AI hiệu quả và phù hợp, chỉ “nhập khẩu” mô hình ngoại quốc thôi thì chưa đủ. Thay vào đó, việc thu thập và huấn luyện với dữ liệu bản địa mới chính là con đường khả thi trong ngôn ngữ riêng.

Một trong những cái tên nổi bật trong cuộc đua này là SoftBank Corp. (SB), thông qua công ty con SB Intuitions Corp., đang đẩy mạnh phát triển các mô hình tiếng Nhật chuyên biệt — sử dụng cơ sở hạ tầng AI “khổng lồ” và dữ liệu huấn luyện nội địa. Ví dụ, họ công bố vừa riển khai hệ thống tính toán với hơn 10.000 GPU và sức mạnh tới 13,7 exa-flops trên nền tảng DGX SuperPOD của NVIDIA Corporation  và sẽ sử dụng tài nguyên đó để huấn luyện mô hình “Sarashina” chuyên tiếng Nhật.

Thế mạnh nằm ở “điểm yếu” mà nhiều mô hình quốc tế đối mặt: tiếng Nhật vốn có cấu trúc, cách diễn đạt, văn hoá và ngữ cảnh rất khác tiếng Anh. Các mô hình LLM phát triển chủ yếu cho tiếng Anh thường gặp khó trong việc xử lý tiếng Nhật một cách “mượt” hoặc chính xác về ngữ nghĩa, ngôn ngữ giao tiếp và bối cảnh văn hoá. Vì vậy, các nhà phát triển ở Nhật nhận ra rằng nếu lấy dữ liệu tiếng Nhật chất lượng cao — như hội thoại nội địa, văn bản quảng cáo, sáng tác tiếng Nhật, hội thoại thực tế, vị thế cạnh tranh hoàn toàn có thể được cải thiện.

Trong bối cảnh này, Chính phủ Nhật đóng vai trò xúc tác quan trọng. Theo báo cáo, chính quyền Tokyo muốn hỗ trợ việc phát triển mô hình nội địa “sử dụng dữ liệu Nhật Bản” nhằm tránh phụ thuộc vào các mô hình từ Mỹ hoặc Trung Quốc — lý do không chỉ là kỹ thuật mà còn liên quan tới chủ quyền dữ liệu, bảo mật thông tin và đảm bảo mô hình trả lời đúng theo bối cảnh văn hoá/văn bản Nhật.

Những nỗ lực thực tế đã bắt đầu mang dấu ấn cụ thể: công ty quảng cáo Dentsu Inc., cùng với Dentsu Digital và SoftBank, công bố dự án nghiên cứu chung để tạo ra LLM chuyên về sáng tạo nội dung quảng cáo tiếng Nhật — dự án sử dụng dữ liệu từ các copywriter nội địa phối hợp với mô hình “Sarashina”.

Nhật Bản Nhắm Mục Tiêu Sở Hữu Mô Hình Ai 'Made In Japan', Vận Hành Hoàn Toàn Bằng Dữ Liệu Trong Nước- Ảnh 2.

Tuy vậy, hành trình này không hề dễ dàng. Thách thức đầu tiên nằm ở chi phí: việc thu thập, gắn nhãn và xử lý hàng nghìn giờ hội thoại đòi hỏi một hạ tầng khổng lồ và đội ngũ chuyên gia ngôn ngữ học công nghệ cao. Hơn nữa, Nhật Bản phải đối mặt với tình trạng thiếu nhân lực AI – vấn đề mà chính Thủ tướng từng cảnh báo sẽ trở thành điểm nghẽn lớn nếu không được giải quyết.

Bên cạnh đó, quy mô vẫn là một rào cản. Các mô hình như GPT-4 của OpenAI hay Gemini của Google được huấn luyện trên hàng nghìn tỷ tham số. Việc bắt kịp quy mô đó gần như bất khả thi với nguồn lực hạn chế của Nhật Bản. Vì thế, các công ty trong nước phải chọn hướng đi tối ưu: tập trung vào ngữ cảnh tiếng Nhật, tạo ra mô hình “vừa đủ lớn để hữu dụng, vừa đủ nhỏ để hiệu quả”.

Thế nhưng, chính sự khác biệt đó lại có thể là chìa khóa. Trong bối cảnh thế giới ngày càng lo ngại về quyền riêng tư và chủ quyền dữ liệu, việc sở hữu mô hình AI “Made in Japan”, vận hành hoàn toàn bằng dữ liệu trong nước, giúp Tokyo có lợi thế cả về pháp lý lẫn đạo đức. Nó đảm bảo rằng các hệ thống AI trong nước – từ trợ lý ảo chính phủ, chatbot y tế đến dịch vụ tài chính – đều tuân thủ chuẩn mực văn hóa và luật pháp Nhật.

Các chuyên gia nhận định, nếu SoftBank thành công, Nhật Bản có thể trở thành một trung tâm AI khu vực châu Á – không phải bằng việc cạnh tranh về quy mô, mà bằng việc định hình xu hướng “AI bản địa hóa”, nơi mỗi quốc gia tự phát triển mô hình riêng phản ánh ngôn ngữ và văn hóa của mình. “AI không thể chỉ nói ngôn ngữ của Silicon Valley. Nó phải nói ngôn ngữ của người dân nơi nó phục vụ,” một kỹ sư của SB Intuitions chia sẻ trên Nikkei.

Theo: Nikkei Asia

Tags

mô hình AI Nhật Bản

Để lại một bình luận