讯飞星辰 从 TokenPlan 转为 CodingPlan -套餐上新实况

建议大家近期不要入坑,glm-5 是 128k 的上下文,glm5不能使用工具,TPM 限制很高,几乎2个请求就报错。

更新之前的TokenPlan:

更新之后的 CodingPlan:

从昨天上新到今天的客户使用实况:

**> 我昨天第一时间买了套餐,第1次请求就报错,第2次请求也报错,我马上提了工单,官方人员让我加群

这里分享聊天截图不是为了吃瓜,而是请大家在近期理性入坑,客观看待,官方之后如果修复好了,想必也是> 个不错的选择**

实况:

工单:

jd从昨天晚上到现在,速度都很快了,也是加限制了应该,昨天是偶尔遇到rpm limit(开多个subagent),今天是一个主agent,每把起手一个rpm或tpm limit,但是几秒后就恢复接着跑

反正相比之前的完全不可用状态,现在是好很多了,至少能用了,不知道工作日工作时间怎么样,能不能保持住了

2 个赞

京东毕竟是国内大厂,还是要脸面的 :grinning_face_with_smiling_eyes:

1 个赞

看来不用花7.9骂一个月了 :face_with_peeking_eye:

1 个赞

今天上午10点,整整3天,官方终于解决了一系列问题,包括 glm 等模型无法调用工具的问题,而在此之前,群里的佬哥 给出了一个临时的解决方案,是一个python脚本 和 详细的说明文档,可以学习一下思路,以备不时之需。

讯飞-glm-5.1-无法调用工具-临时解决方案:

目前官方建议 将 glm-5.1 的上下文大小设置在96k以内,以减轻服务器压力

这也太差了

CodingPlan 只支持 chat 模式,不支持 response模式

CodingPlan 高峰期:早9点到11点,14点到16点。

CodingPlan 请求速率:120次/小时,TPM:100W(1m)

整体体验感觉咋样?ali code plan停了,准备找个新的

最近开始严格限制并发了,基本上每把都要碰到tpm或rpm limit,需要自动重试几次才能通过

我这里体验的过的四个云厂商的coding plan,腾讯>阿里>百度>京东

腾讯和阿里差距不是特别大,速度差不太多,感觉腾讯的模型更聪明一点

腾讯好像是按tokens,按tokens我感觉限制太大了

我说的是腾讯的coding plan,不是后边那个Token plan,不过现在coding plan似乎抢不到,主推token了

嗯coding plan的7.9是量化模型吗?能感觉出来不

腾讯的glm5,我感觉比阿里的稍微聪明一点,两个速度差不多
和iflow提供的差不多,感觉不出来量化不量化

所以我说 综合来说 价格呀 用量速度智商啊。腾讯的目前都是最好的,除了抢不到以外 没别的毛病了

2 个赞

glm什么时候成腾讯的了

腾讯coding paln里的glm

好的,那过几天试试看腾讯的

官网不会告诉你的:无忧版(入门版) TPM只有50M,专业版 与 高效版是 100M

每分钟50M,跑几步就卡掉,一秒一卡,十分潇洒,一顿一停,十分有型。