我觉得 glm-4.6在代码方面更好一点

大家写代码主要用哪个模型

目前来说,写代码国产里面 glm 4.6 是比较好。文字处理这些 kimi 更好,数学 DeepSeek。

所以现在觉得千问模型不是代码最好用的了

qwen code的基准虽然挺高,但是体验就是一般。很多时候,好不好用,口碑就知道了。你周边如果有喜欢结合 AI 撸代码的, 问问他们感受便知,还有外网本基本都是 claude 4.5 和 gemini 3 pro 首先,gpt 5,glm 4.6和 kimi think 备选。

是这样的

感觉minimax也不错,glm有时候会自己乱发挥,已经告诉它不要乱修改,只需要修改指定的部分。但是还是会到处乱修改。minimax稍微好一些。

我也是这个感觉。

GLM-4.6 强是强,但是有比较严重的过拟合,祂训练过的软件工程套路是轻车熟路,快速准确复现,但是碰到没训练过的就明里暗里的跟你犟,想把你的需求拉到祂熟悉的解法去。

MiniMax-M2 训练集应该杂很多,而且参数少,所以拟合不那么严重,做事要靠思辨找到解决办法。 这种对于常见任务当然更费 token 和时间,但是对于创新项目就很关键,祂能更好的跟着你的需求和思路走。

学到了