kimi k2.5 个人认为很强

这个模型有点强的有点过分了

glm 4.7+iflow,修了半天没弄好,调试满天飞,然后最后还是/restore。
用kimi k2.5+trae,一次性搞定。真的就一次性搞定


让我以一个不是很会代码、经验有限的人的视角,分析一下模型的优点:

  1. 幻觉和 “自以为是” 的情况非常少。在我的体验中,这优于GLM 4.7。
  2. 整个模型的 taste/味道 和其他很不一样。
    它的执行非常完整准确度高,不像minimax有时候需要推一推,也不像glm 4.7一次性执行完然后给你拉一坨大的。k2.5 兼具二者的优点。它不会耍小聪明,但本身却非常聪明。 我觉得glm 4.7有一部分聪明是“小聪明”耍出来的。(不知道大家能不能理解我的意思)尽管glm 4.7已经很强。
  3. 有图像和视频理解。 而且理解能力超强。
    实测下来它可以复刻一些复杂的网页。我之前的一个小应用 (详见这个),给了张截图,就直接复刻出了70%的功能。 问题是这玩意我用glm 4.7断断续续vibe了一个月呀。

以上仅为一个简短的分析,具体有多强大家在各种视频里面应该也看到了。
这是最近为数不多让我感觉有点震撼的模型。
glm系列,我只会觉得它很强,有提升,但是k2.5,给我一种 oh my god! 的感觉。

1 个赞

glm4.7 经常自作主张,兜圈子尝试,个人感觉分析解决问题能力还是弱了一些

1 个赞

是的,但是它又是最聪明的一个,这就很让人难受。
glm的智商+m2.1的性格就已经很好了。
kimi比它们俩都聪明,希望k2.5出来能改变这个局面