讨论帖 | 小米最新模型真的像雷军说的那么好用吗❓ 附iFlow接入指南，蹲反馈~

10000059001 · 2025 年12 月 17 日 07:43

如题，小米Mimo刚发布，社媒又"过年"了！

但小米Mimo在iFlowCLI内的实测效果如何呢？想蹲大家的真实反馈！

附小米 MiMo-V2-Flash 快速接入 iFlow-CLI 指南快来试一下~

评论区揪3位来反馈的好朋友送咖啡！

知乎热帖传送门>> 如何评价小米开源的MiMo-V2-Flash大模型，表现如何?

搬运工·你可能需要的一些地址：

对话服务的公测地址：https://aistudio.xiaomimimo.com/
开放平台地址: Xiaomi MiMo 开放平台
GitHub地址: GitHub - XiaomiMiMo/MiMo-V2-Flash: MiMo-V2-Flash: Efficient Reasoning, Coding, and Agentic Foundation Model · GitHub

10008834122 · 2025 年12 月 17 日 07:51

占个楼，人老实话不多。

引用一个关注的编程测试榜结果：

亮点：

计算精度 ：尽管MiMo的幻觉偏高(下文会提到)，但计算精度却可以保持在较高水准。疑似经过了专门强化。相关计算题目可以做到小数点后3位的运算精度，单方面能力可以进入国产模型第一梯队。即便是非推理模式，计算能力也强于同梯队。

不足：

指令遵循 ：MiMo非推理模式存在较为严重的指令遵循问题，典型的指令遵循问题，MiMo有大概率违背要求，忽略“不要出现”等负向指令。#43 计算目标数问题，MiMo认为目标数难以达到，就随便凑一个数作为答案。#46 题为了降低难度，故意设计了多个提示性指令，MiMo也不管这些，直接暴力搜索。推理模式 情况稍好，但仍差于同梯队的其他模型。

幻觉失控 ：非推理模式 几乎在所有涉及上下文信息提取的问题上0分或极低分，即便是难度较低的题目上，也无法有效完成任务。推理模式 情况有分化，发挥正常时，表现达到第二梯队平均水平，但发挥失常时也会犯下无法理解的低级错误。受此影响，MiMo的工作记忆也很不稳定，比如计算目标数问题，不但会使用幻觉数字，也会把一个数反复使用，而不自知。

输出问题 ：MiMo的非推理模式 ，表现更像一个思考预算受限的推理模型，会在输出中进行大量草稿演算。复杂问题Token使用可能会达到数万。推理模式 的最终输出也并不能保证干净，少量问题也会在输出中继续演草。推理和非推理模式都存在输出英文回答的情况，并且推理模式的思维链很大概率会在中途切英文。根据CoT标记追踪法，可以发现MiMo的大量语料可以上溯到DeepSeek V3.1。

原文： https://mp.weixin.qq.com/s/c0dkX-QHOzoTHgaY_VMahA

完整榜单：

10011314033 · 2025 年12 月 17 日 08:21

小米法务部：累总不懂大模型，他说了不算！

10000059001 · 2025 年12 月 17 日 08:49

10009781125 · 2025 年12 月 17 日 10:36

哈哈哈，正在尝试用它给我的UI设计结果，直接构建全栈，看看军儿这大模型如何~

10011314033 · 2025 年12 月 17 日 13:24

这就打起来了，据说这人是 Kimi 员工笑眯眯摸……

10011876418 · 2025 年12 月 18 日 03:05

用一会儿，感觉编码能力较为一般，个人感觉跟豆包的模型差不多

10009781125 · 2025 年12 月 18 日 03:08

一方面不限制并发数

一方面又管控一分钟内的请求总数

说人话就是：高速上有区间测速。

哈哈哈哈哈哈，军儿啊，外面没有，你屋全是。

10010055526 · 2025 年12 月 18 日 05:56

用起来太蠢了，已经换回glm-4.6了

10011314033 · 2025 年12 月 18 日 06:56

RPM 其实还好吧，MiniMax 也是默认这样限制的，看后续人性化程度，MiniMax 是客服群说一下就可以提高，正常需求不得挡你。

10009781125 · 2025 年12 月 18 日 07:59

设计文档一气呵成，我让claude4.5 opus评价了，还行，可以执行开发计划

然后使用iflow cli调用mimo-v2-flash全栈开发，整体体验如下：

昨晚骂到今天下午，

无数次成功启动开发，页面没样式，纯文本。API一屁股bug，他改的好辛苦，成持续五六分钟一直改，但是结果汇总说好了，我打开浏览器还是一屁股坑，页面加载失败各种报错

设计结果的html文件发给他抄成这样

感觉军子这个模型适合做单次对话，上下文长，脑容量大；但是5步以后脑瘫初显，50步以后谨遵医嘱吧

mimo-v2-flash 完全不适合前端框架nextjs开发，不适合后端nodejs开发，设计方案洋洋洒洒，一写代码就趴下

评价比较极端，有且仅限于如下测试tokens数下主观感受。

10011876418 · 2025 年12 月 18 日 08:57

这么说感觉mimo适合做一个sub-agent

10004074672 · 2025 年12 月 23 日 10:23

哈哈哈就你啦欢迎在社群找边边领咖啡券～

10004074672 · 2025 年12 月 23 日 10:24

大佬就你啦欢迎在社群找边边领咖啡券～

10009781125 · 2025 年12 月 23 日 10:28

哈哈哈哈哈，，感谢老哥，我运气真的好，哈哈哈哈，感谢iflow 全体大佬们，非常感谢！

10011831278 · 2026 年1 月 15 日 06:40

帅