🦐生腌小虾每日AI快讯 | 2026年5月8日

:shrimp:生腌小虾每日AI快讯 | 2026年5月8日


1. 腾讯混元 Hy3 预览版上线两周,Token 调用量激增超十倍

腾讯混元Hy3预览版自发布以来表现强劲,上线仅两周Token调用量增长超过十倍,目前位居OpenRouter周榜第一,成为国内模型市场的现象级产品。

原文链接


2. 腾讯发布OpenSearch-VL:开源多模态深度搜索 agent 的"全家桶"方案

腾讯正式开源OpenSearch-VL,提供多模态深度搜索AI智能体的完整技术方案,突破多模态搜索智能体训练瓶颈,原生兼容多种Agent框架,推动开源生态建设。

原文链接


3. DeepSeek-TUI屠榜GitHub,实测:不到10块钱,小白也能开发应用

DeepSeek推出的TUI终端交互工具在GitHub上迅速登顶热榜,实测显示用户仅需不到10元成本即可上手开发AI应用,大幅降低AI开发门槛,引发开发者社区广泛关注。

原文链接


4. 月之暗面 Kimi 再融资 20 亿美元,估值突破 200 亿美元

月之暗面旗下Kimi完成新一轮20亿美元融资,公司估值突破200亿美元。与此同时,公司申请注册KimiClaw商标,暗示可能在AI硬件领域有重要布局。

原文链接


5. 阿里千问 PC 端上线 AI 语音输入,数字人亮相核心生态全面打通

阿里千问在PC端推出AI语音输入功能,用户可在各类应用中直接语音调用千问。同时千问数字人正式亮相,标志着阿里大模型核心生态的全面打通与落地。

原文链接


6. 小米开源 OmniVoice 多语言语音克隆 TTS,一个模型搞定 600 余种语言

小米正式开源OmniVoice多语言语音克隆TTS系统,单个模型即可支持600余种语言的语音合成与克隆,在多语言语音技术领域实现重要突破,降低全球化语音应用门槛。

原文链接


7. 中国信通院联合腾讯、华为等发起智能体可信握手协议(ATH)

中国信通院联合腾讯、华为等头部企业共同发起智能体可信握手协议ATH,旨在建立统一的智能体交互安全标准,推动智能体开源社区建设,规范AI Agent生态发展。

原文链接


8. Anthropic 估值冲爆 1.2 万亿,首次反超 OpenAI

Anthropic最新估值突破1.2万亿元人民币,首次超过OpenAI成为全球AI领域估值最高的公司。Claude用户增长迅猛,付费用户活跃度持续攀升,AI竞争格局发生历史性逆转。

原文链接


9. OpenAI 联合英伟达等 5 大巨头发布 MRC 协议,重塑大规模 AI 训练网络架构

OpenAI携手英伟达、AMD等五大科技巨头联合发布MRC协议,专为大规模AI训练优化网络架构,旨在提升分布式训练效率与可靠性,推动AI基础设施进入新阶段。

原文链接


10. 马斯克 22 万张 GPU 全卖给 Claude 用,双方合作建太空算力

马斯克将xAI的22万张GPU算力租给Anthropic的Claude使用,Claude付费用户限额在5小时内翻倍。双方还计划合作建设太空算力基础设施,拓展AI算力边界。

原文链接


:pushpin: 快讯筛选标准:大厂>小厂、名人>素人、国内新闻稿>国外社交平台

:bullseye: 关注领域:模型大厂、AI Coding、OpenClaw生态、学术论文

:alarm_clock: 每天10:00准时推送

突然发现我的元宝偷偷把模型给我换成Hy3 Preview了,我又给切回DeepSeek了 :rofl:

有人尝鲜过吗~~

哈哈哈我昨天用了挺久 感觉表现比之前好啊 :joy: 感觉归纳总结地更精准了

这里有个更小的GenericAgent,3300行代码,星星10K,虽然热度没这么高,不过这是python,可以随便改。
GitHub - lsdefine/GenericAgent: Self-evolving agent: grows skill tree from 3.3K-line seed, achieving full system control with 6x less token consumption · GitHub

Hy3比之前的Hy降了很多幻觉,但是还是有,不过参数量还是不够大,和minimax一个路线的,只适合openclaw那种有固定流程/固定工作流的任务,不适合发散性的、高认知难度的任务,如果要对比的话,我觉得应该拿上一代的V3或者现在的FLASH这类模型来对比。

200-300B这个量级的模型给我的感觉都大差不差,适合做子agent,快速低难度任务,比如查资料,查代码,批量任务

我也很好奇,这几个量级的模型会不会有明显的能力差距:

轻模型(flash-lite):30-60B:种类和数量最多的模型,基本能做侧端部署了
快模型(flash):200-300B:越来越多这个级别的模型,随着不断优化,我推测侧端部署也能做
标准模型:500-700B:上一代的旗舰模型
大模型:1T-1.5T:通常是旗舰模型
超大模型:>2T:闭源御三家的部分模型,参数量只是猜测