心流AI交流社区

🦐生腌小虾每日AI快讯 | 2026年5月8日

10008873411 (菠菜水手边边) 2026 年5 月 8 日 02:24 1

生腌小虾每日AI快讯 | 2026年5月8日

1. 腾讯混元 Hy3 预览版上线两周，Token 调用量激增超十倍

腾讯混元Hy3预览版自发布以来表现强劲，上线仅两周Token调用量增长超过十倍，目前位居OpenRouter周榜第一，成为国内模型市场的现象级产品。

2. 腾讯发布OpenSearch-VL：开源多模态深度搜索 agent 的"全家桶"方案

腾讯正式开源OpenSearch-VL，提供多模态深度搜索AI智能体的完整技术方案，突破多模态搜索智能体训练瓶颈，原生兼容多种Agent框架，推动开源生态建设。

3. DeepSeek-TUI屠榜GitHub，实测：不到10块钱，小白也能开发应用

DeepSeek推出的TUI终端交互工具在GitHub上迅速登顶热榜，实测显示用户仅需不到10元成本即可上手开发AI应用，大幅降低AI开发门槛，引发开发者社区广泛关注。

4. 月之暗面 Kimi 再融资 20 亿美元，估值突破 200 亿美元

月之暗面旗下Kimi完成新一轮20亿美元融资，公司估值突破200亿美元。与此同时，公司申请注册KimiClaw商标，暗示可能在AI硬件领域有重要布局。

5. 阿里千问 PC 端上线 AI 语音输入，数字人亮相核心生态全面打通

阿里千问在PC端推出AI语音输入功能，用户可在各类应用中直接语音调用千问。同时千问数字人正式亮相，标志着阿里大模型核心生态的全面打通与落地。

6. 小米开源 OmniVoice 多语言语音克隆 TTS，一个模型搞定 600 余种语言

小米正式开源OmniVoice多语言语音克隆TTS系统，单个模型即可支持600余种语言的语音合成与克隆，在多语言语音技术领域实现重要突破，降低全球化语音应用门槛。

7. 中国信通院联合腾讯、华为等发起智能体可信握手协议（ATH）

中国信通院联合腾讯、华为等头部企业共同发起智能体可信握手协议ATH，旨在建立统一的智能体交互安全标准，推动智能体开源社区建设，规范AI Agent生态发展。

8. Anthropic 估值冲爆 1.2 万亿，首次反超 OpenAI

Anthropic最新估值突破1.2万亿元人民币，首次超过OpenAI成为全球AI领域估值最高的公司。Claude用户增长迅猛，付费用户活跃度持续攀升，AI竞争格局发生历史性逆转。

9. OpenAI 联合英伟达等 5 大巨头发布 MRC 协议，重塑大规模 AI 训练网络架构

OpenAI携手英伟达、AMD等五大科技巨头联合发布MRC协议，专为大规模AI训练优化网络架构，旨在提升分布式训练效率与可靠性，推动AI基础设施进入新阶段。

10. 马斯克 22 万张 GPU 全卖给 Claude 用，双方合作建太空算力

马斯克将xAI的22万张GPU算力租给Anthropic的Claude使用，Claude付费用户限额在5小时内翻倍。双方还计划合作建设太空算力基础设施，拓展AI算力边界。

快讯筛选标准：大厂>小厂、名人>素人、国内新闻稿>国外社交平台

关注领域：模型大厂、AI Coding、OpenClaw生态、学术论文

每天10:00准时推送

10011488078 (遥控小飞机) 2026 年5 月 8 日 02:25 2

突然发现我的元宝偷偷把模型给我换成Hy3 Preview了，我又给切回DeepSeek了

10008873411 (菠菜水手边边) 2026 年5 月 8 日 03:00 3

有人尝鲜过吗～～

10008873411 (菠菜水手边边) 2026 年5 月 8 日 03:02 4

哈哈哈我昨天用了挺久感觉表现比之前好啊感觉归纳总结地更精准了

10011122317 (luffe) 2026 年5 月 8 日 03:23 5

这里有个更小的GenericAgent，3300行代码，星星10K，虽然热度没这么高，不过这是python，可以随便改。
GitHub - lsdefine/GenericAgent: Self-evolving agent: grows skill tree from 3.3K-line seed, achieving full system control with 6x less token consumption · GitHub

Hy3比之前的Hy降了很多幻觉，但是还是有，不过参数量还是不够大，和minimax一个路线的，只适合openclaw那种有固定流程/固定工作流的任务，不适合发散性的、高认知难度的任务，如果要对比的话，我觉得应该拿上一代的V3或者现在的FLASH这类模型来对比。

200-300B这个量级的模型给我的感觉都大差不差，适合做子agent，快速低难度任务，比如查资料，查代码，批量任务

我也很好奇，这几个量级的模型会不会有明显的能力差距：

轻模型（flash-lite）：30-60B：种类和数量最多的模型，基本能做侧端部署了
快模型（flash）：200-300B：越来越多这个级别的模型，随着不断优化，我推测侧端部署也能做
标准模型：500-700B：上一代的旗舰模型
大模型：1T-1.5T：通常是旗舰模型
超大模型：>2T：闭源御三家的部分模型，参数量只是猜测