这两天估计DeepSeek V4也要上线了,虽然之前随大流用GLM、flow, 还有最近用的codex,感觉质量都很不错,大家是否也有期待V4。在coding上面的表现呢?我是之前没用过DeepSeek API, 所以大家为什么之前一般都不用这玩意儿做基础的编程工作?
GLM 4.6之前,当时用的Deepseek V3.1,后来3.2 exp出来之后,也用过一段时间,但是再后来就能力就落后了,还是很期待v4
我也是很期待,先冲了个100块的api。奥特曼的东西还是有的,就是卡密感觉可能被封,咸鱼也是从20涨到40虽然依旧不多但是感觉还是感到不稳定
glm 5.1/5高度代码特化
我觉得deepseek在新版本上 纯coding打不过glm 5.1的。但它强在模型架构(engram等)和综合智力。
如果要纯coding,我不会抱有很大的期待 但仍然非常看好deepseek。
5.1 针对代码场景的优化太过头了,总是忍不住去写代码,deepseek 还是希望正常点,通用任务的全面提升才是最好的
deepseek其实不用去干那些争风吃醋的事,它就做好一个鞭子就可以了。
无论是美国的御三家,还是中国的这些大模型公司,如果你们不好好干、提升自身能力修养、为人类文明进步不断地做贡献,就等着让deepseek来抽你们吧。
deepseek:老子打的就是御三家,不管是海外御三家,还是国内御三家 ![]()
首先十分敬佩DS开源精神,其次又为其前景担忧,没有商业化支撑意味着资源倾斜有限,可能会导致竞争力下降。
我目前依然经常用客户端做一些功能分析和原型,相当于盲写代码,细节上可能确实有问题,但思路和逻辑大体正确。甚至在某些方面依然不逊色某些后发模型,这也说明很多模型存在针对测试的特化训练和注水行为。
感觉稀疏注意力在上下文一致性上无法避免的先天不足,也是当前背景下一种为了效率不得不采取的技术妥协。
之前也用过deepseek写代码,直观地感受是在代码理解上有问题,个人感觉deepseek是偏向科研的,比如数学、物理、生物学、医疗这些场景,目前V4还没体验,不过已经开源了:
- DeepSeek-V4 模型开源链接:
https://huggingface.co/collections/deepseek-ai/deepseek-v4
DeepSeek-V4 技术报告:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
V4-Pro 与 V4-Flash 最大上下文长度为 1M**,均同时支持非思考模式与思考模式**,其中思考模式支持 reasoning_effort 参数设置思考强度(high/max)。对于复杂的 Agent 场景建议使用思考模式,并设置强度为 max。模型调用与参数调整方法请参考 API 文档:
目前 是有2个版本:
规格上:
价格上:
能力上:
测评上:
效果上:V4出的PPT




