今天真的是国产大模型的“春晚”!除了 GLM-5,MiniMax 2.5 也在今天正式发布了!
现在压力给到了三巨头这边:
- MiniMax 2.5:今日黑马,官方号称各项指标均有突破。
- GLM-5:迭代速度惊人,Agent 意识和编程细节好评如潮。
- Kimi 2.5:大家最熟悉的伙伴,虽然之前有过长思考Bug,但升级后表现依然坚挺。
各位社区大佬们,不要等了,爆肝测起来!
1. 谁的逻辑推导更硬核?
2. 谁在复杂 Agent 任务场景下完成度更高?
3. 谁的响应速度和抗压能力更强?
欢迎大家带图评论,分享实测 PK 数据。国产模型大乱斗,你站哪一个?

