Start-up AI Trung Quốc StepFun ra mắt Step 3.5 Flash, một mô hình nhỏ gọn nhưng được cho là có thể cạnh tranh hiệu năng suy luận và tác vụ “agent” với nhiều hệ thống lớn hơn, qua đó làm nóng cuộc đua AI tại Trung Quốc.
Động thái này nhấn mạnh xu hướng tối ưu hiệu quả thay vì chỉ tăng quy mô tham số, trong bối cảnh các công ty AI Trung Quốc liên tục tung bản cập nhật, còn hệ sinh thái chip nội địa cũng đẩy mạnh tương thích để triển khai nhanh các mô hình mới.
- StepFun giới thiệu Step 3.5 Flash, mô hình nhỏ nhưng nhắm đến hiệu năng suy luận và tác vụ agent.
- StepFun nói mô hình đạt kết quả nổi bật ở nhiều bài benchmark suy luận, cạnh tranh với các hệ lớn hơn.
- Công ty ưu tiên logic, cửa sổ ngữ cảnh và tốc độ; đồng thời vừa huy động 5 tỷ RMB (~720 triệu USD).
Step 3.5 Flash nhắm đến hiệu năng suy luận dù quy mô nhỏ
Step 3.5 Flash được StepFun giới thiệu như một mô hình nhỏ gọn nhưng vẫn cạnh tranh về suy luận, lập trình và tác vụ “agent”, dù có ít tham số hơn nhiều mô hình lớn đang nổi tại Trung Quốc.
StepFun quảng bá Step 3.5 Flash AI trong bối cảnh thị trường có những mô hình “khổng lồ” như Kimi K2.5 và DeepSeek V3.2, mỗi mô hình được mô tả ở mức 1 nghìn tỷ tham số. Trong AI, tham số là các “đơn vị thông tin” giúp mô hình học và suy luận; quy mô lớn thường gắn với kỳ vọng hiệu năng tốt hơn, nhưng cũng kéo theo chi phí và độ trễ triển khai.
Theo StepFun, Step 3.5 Flash tỏ ra hữu ích hơn trong một số bài đánh giá, đặc biệt ở suy luận, lập trình máy tính và khả năng tạo “intelligent agents” (agent có thể thực hiện tác vụ với mức độ tự chủ và thông minh khác nhau). Công ty định vị đây là lựa chọn thực dụng cho các kịch bản cần phản hồi nhanh, chạy hiệu quả và có thể “hành động” thay vì chỉ trả lời.
StepFun cho biết mô hình đạt kết quả tốt nhất trên bốn bài benchmark suy luận khác nhau, gồm AIME 2025 và IMOAnswerBench (cùng một số bài khác). Công ty nói các kết quả này vượt các dòng sản phẩm từ DeepSeek, Moonshot AI, Zhipu AI và MiniMax, và nêu đối thủ cạnh tranh đáng kể là hệ thống thuộc Microsoft/OpenAI.
Thiết kế ưu tiên logic, cửa sổ ngữ cảnh và tốc độ
StepFun nói họ chấp nhận các “đánh đổi” trong thiết kế để tối ưu logic, cửa sổ ngữ cảnh và tốc độ, nhằm phục vụ thế giới ứng dụng do AI agent dẫn dắt.
Theo StepFun, định hướng phát triển không tập trung vào “kích thước gây chú ý”, mà nhắm đến khả năng triển khai thực tế. Zhu Yibo, CTO kiêm đồng sáng lập, cho biết ba yếu tố được ưu tiên là năng lực logic, kích thước cửa sổ ngữ cảnh và tốc độ xử lý, coi đây là nền tảng để mô hình vận hành hiệu quả trong các luồng công việc dạng agent.
Công ty cũng nêu kinh nghiệm từ các mô hình lớn trước đó: thời gian huấn luyện kéo dài khiến lịch bàn giao thường chậm hơn dự kiến. Vì vậy, một mô hình nhỏ gọn hơn nhưng “ra kết quả đúng và nhanh” được xem là phù hợp hơn cho nhiều kịch bản thương mại, đặc biệt khi sản phẩm cần lặp nhanh, cập nhật liên tục và triển khai trên hạ tầng tính toán hữu hạn.
“Năng lực logic, kích thước cửa sổ ngữ cảnh và tốc độ là những gì quan trọng nhất với chúng tôi.”
– Zhu Yibo, CTO và đồng sáng lập StepFun
Khả năng vận hành agent là trọng tâm cạnh tranh
StepFun nhấn mạnh thế mạnh của Step 3.5 Flash đến từ hành vi dạng agent, giúp suy luận logic diễn ra hiệu quả hơn trong các tác vụ có nhiều bước và cần hành động.
Zhu Yibo từng viết rằng sức mạnh của Step 3.5 Flash xuất phát từ đúng lĩnh vực mà công ty quan tâm nhất: hành vi dựa trên agent, cho phép suy luận logic hoạt động hiệu quả. Điều này hàm ý mô hình được tinh chỉnh để lập kế hoạch, thực thi, kiểm tra và lặp lại, thay vì chỉ tối ưu điểm số ngôn ngữ tổng quát.
Trong thực tế ứng dụng, “agent-based” thường gắn với các tác vụ như: viết và chạy mã, gọi công cụ, truy xuất dữ liệu, tổng hợp kết quả, hoặc tự động hóa quy trình. StepFun đặt mô hình trong bối cảnh “AI-agent dominated world”, nơi hệ thống cần kết hợp suy luận, ngữ cảnh dài và tốc độ để hoàn thành chuỗi hành động.
Hệ sinh thái chip Trung Quốc điều chỉnh để tương thích kiến trúc mới
Một số hãng bán dẫn Trung Quốc, gồm Huawei và MetaX, được cho là đã điều chỉnh phần cứng để tương thích với kiến trúc phần cứng mới của StepFun, phản ánh mức độ tin tưởng vào hiệu quả vận hành.
StepFun cho biết các công ty bán dẫn Trung Quốc, bao gồm Huawei và MetaX, đã sửa đổi phần cứng chip để tương thích với kiến trúc phần cứng mới mà StepFun sử dụng. Dù không nêu chi tiết kỹ thuật, thông tin này cho thấy mục tiêu của StepFun không chỉ là mô hình, mà còn là khả năng triển khai tối ưu trên hạ tầng tính toán trong nước.
Thời điểm ra mắt trùng làn sóng cập nhật AI dịp Tết Nguyên đán
StepFun tung sản phẩm trong giai đoạn nhiều công ty Trung Quốc chuẩn bị trình diễn nguyên mẫu và cập nhật mô hình mới quanh Tết Nguyên đán, khiến cạnh tranh tăng tốc.
Bài viết mô tả thời điểm công bố diễn ra khi số lượng sản phẩm và bản thử nghiệm mới tăng lên trong dịp Tết Nguyên đán, gắn với hoạt động phát triển và ra mắt công nghệ của các doanh nghiệp Trung Quốc. Đồng thời, Alibaba và Moonshot AI cũng thông báo sẽ phát hành bản cập nhật mô hình, còn Zhipu và MiniMax được đề cập là vẫn đang trong quá trình phát triển sản phẩm.
StepFun huy động 5 tỷ RMB, tương đương khoảng 720 triệu USD
StepFun vừa hoàn tất vòng gọi vốn B++ trị giá 5 tỷ RMB (~720 triệu USD), cho thấy niềm tin của nhà đầu tư vào hướng đi mô hình nhỏ, nhanh và dễ triển khai.
Theo thông tin công bố, StepFun đã huy động 5 tỷ RMB, tương đương khoảng 720 triệu USD, trong vòng B++. Vòng này bao gồm các tổ chức được chính phủ tài trợ và những công ty nổi tiếng khác, phản ánh kỳ vọng rằng các mô hình nhỏ nhưng hiệu quả có thể chiếm ưu thế trong thị trường AI Trung Quốc, nơi chi phí triển khai và tốc độ ra mắt sản phẩm thường quyết định khả năng cạnh tranh.
Những câu hỏi thường gặp
Step 3.5 Flash là gì?
Step 3.5 Flash là mô hình AI nhỏ gọn do StepFun (Thượng Hải) ra mắt, được định vị để cạnh tranh về suy luận, lập trình và tác vụ agent dù có ít tham số hơn nhiều mô hình lớn trên thị trường.
Vì sao StepFun tập trung vào mô hình nhỏ thay vì mô hình 1 nghìn tỷ tham số?
StepFun cho rằng hiệu quả triển khai quan trọng hơn quy mô, vì mô hình lớn thường mất nhiều thời gian huấn luyện và dễ chậm lịch ra mắt; họ ưu tiên logic, cửa sổ ngữ cảnh và tốc độ cho các kịch bản AI agent.
StepFun nói Step 3.5 Flash nổi bật ở điểm nào?
Công ty cho biết mô hình đạt kết quả tốt ở nhiều benchmark suy luận (nêu ví dụ AIME 2025, IMOAnswerBench), đồng thời hữu ích trong suy luận, viết mã và xây dựng agent, cạnh tranh với các hệ thống có quy mô lớn hơn.
StepFun đã gọi vốn bao nhiêu và để làm gì?
StepFun công bố đã huy động 5 tỷ RMB, xấp xỉ 720 triệu USD, trong vòng B++, với sự tham gia của các tổ chức được chính phủ tài trợ và các công ty khác, nhằm tăng nguồn lực phát triển và thương mại hóa mô hình.



