建议大家近期不要入坑,glm-5 是 128k 的上下文,glm5不能使用工具,TPM 限制很高,几乎2个请求就报错。
更新之前的TokenPlan:
更新之后的 CodingPlan:
从昨天上新到今天的客户使用实况:
**> 我昨天第一时间买了套餐,第1次请求就报错,第2次请求也报错,我马上提了工单,官方人员让我加群
这里分享聊天截图不是为了吃瓜,而是请大家在近期理性入坑,客观看待,官方之后如果修复好了,想必也是> 个不错的选择**
实况:
建议大家近期不要入坑,glm-5 是 128k 的上下文,glm5不能使用工具,TPM 限制很高,几乎2个请求就报错。
更新之前的TokenPlan:
更新之后的 CodingPlan:
从昨天上新到今天的客户使用实况:
**> 我昨天第一时间买了套餐,第1次请求就报错,第2次请求也报错,我马上提了工单,官方人员让我加群
这里分享聊天截图不是为了吃瓜,而是请大家在近期理性入坑,客观看待,官方之后如果修复好了,想必也是> 个不错的选择**
实况:
jd从昨天晚上到现在,速度都很快了,也是加限制了应该,昨天是偶尔遇到rpm limit(开多个subagent),今天是一个主agent,每把起手一个rpm或tpm limit,但是几秒后就恢复接着跑
反正相比之前的完全不可用状态,现在是好很多了,至少能用了,不知道工作日工作时间怎么样,能不能保持住了
京东毕竟是国内大厂,还是要脸面的 ![]()
看来不用花7.9骂一个月了 ![]()
今天上午10点,整整3天,官方终于解决了一系列问题,包括 glm 等模型无法调用工具的问题,而在此之前,群里的佬哥 给出了一个临时的解决方案,是一个python脚本 和 详细的说明文档,可以学习一下思路,以备不时之需。
讯飞-glm-5.1-无法调用工具-临时解决方案:
目前官方建议 将 glm-5.1 的上下文大小设置在96k以内,以减轻服务器压力
这也太差了
CodingPlan 只支持 chat 模式,不支持 response模式
CodingPlan 高峰期:早9点到11点,14点到16点。
CodingPlan 请求速率:120次/小时,TPM:100W(1m)
整体体验感觉咋样?ali code plan停了,准备找个新的
最近开始严格限制并发了,基本上每把都要碰到tpm或rpm limit,需要自动重试几次才能通过
我这里体验的过的四个云厂商的coding plan,腾讯>阿里>百度>京东
腾讯和阿里差距不是特别大,速度差不太多,感觉腾讯的模型更聪明一点
腾讯好像是按tokens,按tokens我感觉限制太大了
我说的是腾讯的coding plan,不是后边那个Token plan,不过现在coding plan似乎抢不到,主推token了
嗯coding plan的7.9是量化模型吗?能感觉出来不
腾讯的glm5,我感觉比阿里的稍微聪明一点,两个速度差不多
和iflow提供的差不多,感觉不出来量化不量化
所以我说 综合来说 价格呀 用量速度智商啊。腾讯的目前都是最好的,除了抢不到以外 没别的毛病了
glm什么时候成腾讯的了
腾讯coding paln里的glm