kimi k2.5 个人认为很强

10011693186 · 2026 年1 月 29 日 14:01

glm 4.7+iflow，修了半天没弄好，调试满天飞，然后最后还是/restore。
用kimi k2.5+trae，一次性搞定。真的就一次性搞定

让我以一个不是很会代码、经验有限的人的视角，分析一下模型的优点：

幻觉和 “自以为是” 的情况非常少。在我的体验中，这优于GLM 4.7。
整个模型的 taste/味道 和其他很不一样。
它的执行非常完整且准确度高，不像minimax有时候需要推一推，也不像glm 4.7一次性执行完然后给你拉一坨大的。k2.5 兼具二者的优点。它不会耍小聪明，但本身却非常聪明。 我觉得glm 4.7有一部分聪明是“小聪明”耍出来的。（不知道大家能不能理解我的意思）尽管glm 4.7已经很强。
有图像和视频理解。 而且理解能力超强。
实测下来它可以复刻一些复杂的网页。我之前的一个小应用 (详见这个)，给了张截图，就直接复刻出了70%的功能。 问题是这玩意我用glm 4.7断断续续vibe了一个月呀。

以上仅为一个简短的分析，具体有多强大家在各种视频里面应该也看到了。
这是最近为数不多让我感觉有点震撼的模型。
glm系列，我只会觉得它很强，有提升，但是k2.5，给我一种 oh my god! 的感觉。

10012182050 · 2026 年1 月 30 日 01:10

glm4.7 经常自作主张，兜圈子尝试，个人感觉分析解决问题能力还是弱了一些

10011693186 · 2026 年1 月 30 日 01:19

是的，但是它又是最聪明的一个，这就很让人难受。
glm的智商+m2.1的性格就已经很好了。
kimi比它们俩都聪明，希望k2.5出来能改变这个局面