网页版
app版
昨天就听说灰度了三种模式,快速、专家、视觉,今天我这里有专家了,还没有视觉的
看来DeepSeek V4接近完成发布的状态了,而且终于要支持多模态了!
应该是,可能发布还要一段时间。
昨天思考就变成边搜边思考了,今天一打开就多了个专家模式
现在它自己说知识截至 2025 年 5 月,但是对一些最近的新技术好像也有所了解,不知道是猜的还是有用来训练 ![]()
看来上周崩就是在准备这个了
但这个专家模式, 不能参考文件啊
我发现专家模式的知识量和效果会好一些。但两者的速度差不多。
这就很好玩了,说明参数量相差不大?
搞不好是参数量不变的情况下 外挂了engram之类的
这个专家模式在 karminski牙医 的 鞭炮测试里面 在我这里拿到了当前单次最佳
(超越glm5/5turbo,kimi k2.5/qwen 3.5/seed)
流畅度和物理效果可以说顶级。
而且我试了两次,都很顶级。
不代表真实软件工程能力 但逻辑性和整体智力肯定上升了。
期待正式发布了,再把国内这些价格打一打(严厉的D老师) ![]()
而且我听说之前DeepSeek V4在训练的时候,就是完全适配昇腾去的(所以才延迟了这么久?),如果是的话,是不是可以大幅缓解国内算力严重不足的问题
所以需要更久的时间来配置吧
哈哈哈,又是以一己之力,准备把华为芯片上位
上一次是一己之力拉开开源旗帜
是的,感觉这家公司跟别的公司都不是一个画风 ![]()
哈哈哈,目标非商业化,一个理想主义团队
真的 respect
包蒸的
开源的核心价值不只是开放性,更是对执着于探索的这个理念的传承,这个理念有一句更容易理解的名句:我为人人,人人为我。
这里附上一篇文章,可以这么理解,仁者无敌。
确实,仁者无敌
一些消息说v4在4月下旬发布。
不保证准确,但我觉得大差不差