阶跃星辰Step3.5Flash是否考虑

今天阶跃星辰发布的Step3.5Flash在这个体量下的表现优异,并且性能基本全面优于Minimax m2.1,并且速度非常快,基本保持300tokens/s,Iflow是否考虑加入,用于中等或轻量任务,以及分配给Subagent。

类别 评测集 Step 3.5 Flash GLM 4.7 Deepseek v3.2 Kimi K2 Thinking Gemini 3 Pro GPT 5.2
推理 (Reasoning) AIME 2025 97.3 95.7 93.1 96.1 95.0 100.0
IMOAnswerBench 85.4 82.0 78.3 81.8 83.3 86.3
HMMT 2025 (Avg. Feb and Nov) 96.2 95.3 91.4 95.4 95.4 97.1
代码 (Coding) SWE-bench Verified 74.4 73.8 73.1 76.8 76.2 80.0
Terminal-Bench 2.0 51.0 41.0 46.4 50.8 54.2 54.0
LiveCodeBench-V6 86.4 84.9 83.3 85.0 90.7 87.7
智能体 (Agent) $\tau^2$-Bench 88.2 87.4 80.3 74.3 90.7 84.1
BrowseComp (w/ Context Manager) 69.0 67.5 67.6 74.9 59.2 65.8
xbench-DeepSearch (2025.10) 54.0 35.0 - 40.0 - 75.0

全面领先?那为什么好像没人评测?

这个好像确实不错,但我不知道是不是刷榜的。
不过minimax2.5和glm5也快要来了。
最近模型迭代的速度越来越快了


我在英伟达上测试了一下,这个模型总体来说是非常好用的,NVIDIA NIM | Try NVIDIA NIM APIs

1 个赞

我也用nvidia测试了一下,初印象不错,感觉至少不低于m2.1。

在iflow里面,/auth
选择3 OpenAI Compatible API
然后分别填入这三个

1. url:https://integrate.api.nvidia.com/v1
2. api key(需要自己在官网 https://build.nvidia.com/ 申请)
3. 模型名称:stepfun-ai/step-3.5-flash

就可以使用了。


这个模型速度和性能都相当不错。
不知道心流能不能接入,但在这之前,我还是更希望k2.5先接入。

你可以自己反重力接入

反重力接的是哪个呢?
你指的是k2.5吧。其实我觉得英伟达的小模型挺快的,minimax和step都是,glm都可以接受,只有k2.5巨慢。
我感觉iflow接入k2.5应该快了吧,我还是等等官方。

反重力是谷歌的,哪有kimi和step模型?