国产大模型春晚继续!MiniMax 官方今日正式发布了 M2.5 模型,这是一款专为真实生产力、特别是“智能体编程”而生的重量级新品。
==========================================
核心定位:从执行者到“架构师”
==========================================
● 架构师思维:M2.5 支持任务分解与自主逻辑规划,具备解决 0 到 1 系统级设计的能力。
● 效率飞跃:解决复杂任务的轮次消耗比前代降低 20%,不仅快,而且“路径”更成熟。
● 超长输出:单次可稳定输出 1.5w - 2w Tokens 的高质量长文本。
==========================================
榜单霸主:多项全球第一
==========================================
● 编程之王:在 Multi-SWE-Bench 测评中以 51.3% 的胜率登顶全球榜首,超越了 Claude 4.6 和 Gemini 3 Pro。
● 工具调用:BFCL 分数 from M2.1 的 37.4 飙升至 76.8,跨越式提升。
● 综合办公:在处理 Word、PPT、Excel 建模等任务中展现了极高的交付能力。
==========================================
商业模式创新:无限使用
==========================================
● 成本普惠:MiniMax 率先打破算力桎梏,推出了极具竞争力的“无限使用”模式,降低了开发者部署复杂 Agent 的门槛。
==========================================
总结
==========================================
MiniMax-M2.5 的发布,标志着国产模型在智能体自动交付、复杂编程任务上达到了世界顶级水平。配合其极具杀伤力的价格策略,它将成为构建高效率 Agent 的核心引擎。
来源:MiniMax 官方博客 (minimax.io/news/minimax-m25)




