OpenAI ra mắt Chat GPT-4.1, mạnh hơn GPT-4o & rẻ hơn đến 26%


Mới đây, OpenAI ra mắt Chat GPT-4.1 – thế hệ kế tiếp của dòng mô hình ngôn ngữ mạnh mẽ, thay thế cho GPT-4o ra mắt vào năm ngoái. Động thái này không chỉ thể hiện bước tiến công nghệ mới mà còn là phản ứng rõ ràng trước làn sóng cạnh tranh đang tăng nhiệt, đặc biệt là từ các đối thủ châu Á như DeepSeek của Trung Quốc – một mô hình được đánh giá cao nhờ khả năng tiết kiệm chi phí.

GPT-4.1 được thiết kế với những nâng cấp đáng kể, không chỉ vượt trội GPT-4o ở gần như mọi mặt mà còn có giá rẻ hơn đến 26%. Với mức giá chỉ 2 USD cho mỗi triệu token đầu vào và 8 USD cho mỗi triệu token đầu ra, GPT-4.1 trở thành lựa chọn hấp dẫn trong bối cảnh các công ty đang phải cắt giảm chi tiêu nhưng vẫn muốn tận dụng trí tuệ nhân tạo vào các tác vụ phức tạp.

Openai Ra Mat Chat Gpt 4 1

Điểm nổi bật nhất trong lần ra mắt này chính là khả năng xử lý lên tới 1 triệu token trong cùng một lần nhập liệu – một bước nhảy vọt so với giới hạn 128.000 token trước đó của GPT-4o. Bước phát triển này tương đương với việc mô hình có thể xử lý đến hơn 750.000 từ – đủ để phân tích toàn bộ một tiểu thuyết dày cộp như Chiến tranh và Hòa bình chỉ trong một lần. OpenAI cho biết họ đã huấn luyện GPT-4.1 để hiểu ngữ cảnh dài tốt hơn, bỏ qua thông tin gây nhiễu và đưa ra phản hồi đáng tin cậy, bất kể độ dài đoạn văn bản.

Không chỉ ra mắt phiên bản tiêu chuẩn, OpenAI còn giới thiệu hai mô hình mới là GPT-4.1 Mini và GPT-4.1 Nano. Trong đó, GPT-4.1 Mini nhắm tới các nhà phát triển muốn tiết kiệm chi phí thử nghiệm, còn GPT-4.1 Nano được định vị là mô hình nhỏ gọn, nhanh nhất và tiết kiệm nhất từ trước đến nay của hãng – chỉ 0,10 USD cho mỗi triệu token đầu vào và 0,40 USD cho token đầu ra.

Theo chia sẻ từ CFO Sarah Friar, GPT-4.1 là một phần trong chiến lược dài hạn của OpenAI nhằm xây dựng một “kỹ sư phần mềm tự động” – một mô hình có thể viết mã, kiểm thử, sửa lỗi và tạo tài liệu cho toàn bộ ứng dụng từ đầu đến cuối. Công ty nhấn mạnh rằng họ đã tối ưu GPT-4.1 theo phản hồi từ cộng đồng lập trình viên, giúp mô hình thực thi chính xác định dạng, tuân thủ thứ tự phản hồi, và sử dụng công cụ một cách nhất quán, giảm thiểu chỉnh sửa thừa thãi trong lập trình thực tế.

Về hiệu suất, GPT-4.1 toàn phần thể hiện tốt hơn GPT-4o và GPT-4o Mini trên nhiều thước đo lập trình, bao gồm chuẩn SWE-bench. Tuy nhiên, điểm số mà GPT-4.1 đạt được dao động từ 52% đến 54,6% trên phiên bản SWE-bench Verified – thấp hơn một chút so với Gemini 2.5 Pro của Google (63,8%) và Claude 3.7 Sonnet của Anthropic (62,3%).

Openai Ra Mat Chat Gpt 4 2

Tuy có nhiều cải tiến, OpenAI vẫn thẳng thắn thừa nhận GPT-4.1 không hoàn toàn hoàn hảo. Trong một số thử nghiệm, độ chính xác của mô hình giảm rõ rệt khi làm việc với ngữ cảnh siêu dài – từ 84% ở mức 8.000 token xuống còn khoảng 50% khi xử lý 1 triệu token. Bên cạnh đó, mô hình có xu hướng “quá literal” – hiểu nghĩa đen nhiều hơn – đòi hỏi người dùng cần prompt rõ ràng, cụ thể hơn để có kết quả như mong đợi.

Hiện tại, GPT-4.1 đã được triển khai qua API dành cho nhà phát triển, tuy nhiên vẫn chưa được tích hợp vào nền tảng ChatGPT. Công nghệ này cho thấy OpenAI đang tập trung vào việc phục vụ giới kỹ thuật và lập trình viên, thay vì người dùng phổ thông trong giai đoạn đầu phát hành.

Một điểm đáng chú ý nữa là trong bối cảnh giới công nghệ đang chờ đợi GPT-5, CEO Sam Altman thông báo rằng phiên bản này sẽ bị trì hoãn vài tháng do việc tích hợp tính năng và tối ưu hóa chưa đạt kỳ vọng. Trước đó, GPT-5 được kỳ vọng ra mắt vào tháng 5 năm nay.

Bài viết liên quan:

  • OpenAI ra mắt mô hình GPT-4.5 thế hệ mới cho người dùng ChatGPT
  • Chat GPT 4.0 là gì? Cách dùng ChatGPT 4.0 để viết nội dung chất lượng cao chỉ trong 5 phút
  • OpenAI thay đổi kế hoạch: GPT-5 bị lùi lịch, nhường đường cho các phiên bản mini
Card Màn Hình Vga Nividia Rtx 5070 Ti