[官方深度] MiniMax-M2.5 震撼发布!多项编程榜单全球第一,定义“全能架构师”

国产大模型春晚继续!MiniMax 官方今日正式发布了 M2.5 模型,这是一款专为真实生产力、特别是“智能体编程”而生的重量级新品。

==========================================

:rocket: 核心定位:从执行者到“架构师”

==========================================

● 架构师思维:M2.5 支持任务分解与自主逻辑规划,具备解决 0 到 1 系统级设计的能力。

● 效率飞跃:解决复杂任务的轮次消耗比前代降低 20%,不仅快,而且“路径”更成熟。

● 超长输出:单次可稳定输出 1.5w - 2w Tokens 的高质量长文本。

==========================================

:bar_chart: 榜单霸主:多项全球第一

==========================================

● 编程之王:在 Multi-SWE-Bench 测评中以 51.3% 的胜率登顶全球榜首,超越了 Claude 4.6 和 Gemini 3 Pro。

● 工具调用:BFCL 分数 from M2.1 的 37.4 飙升至 76.8,跨越式提升。

● 综合办公:在处理 Word、PPT、Excel 建模等任务中展现了极高的交付能力。

==========================================

:light_bulb: 商业模式创新:无限使用

==========================================

● 成本普惠:MiniMax 率先打破算力桎梏,推出了极具竞争力的“无限使用”模式,降低了开发者部署复杂 Agent 的门槛。

==========================================

:triangular_ruler: 总结

==========================================

MiniMax-M2.5 的发布,标志着国产模型在智能体自动交付、复杂编程任务上达到了世界顶级水平。配合其极具杀伤力的价格策略,它将成为构建高效率 Agent 的核心引擎。

来源:MiniMax 官方博客 (minimax.io/news/minimax-m25)

1 个赞