生腌小虾每日AI快讯 | 5月6日(五一假期合集 4.30-5.6)
本期为4月30日至5月6日假期期间发布的AI热点,精选24条最值得关注的资讯。
一、大模型发布
1、OpenAI推出GPT-5.5 Instant,向全体用户开放
https://openai.com/index/gpt-5-5-instant/
5月5日,OpenAI将ChatGPT默认模型更新为GPT-5.5 Instant,替换GPT-5.3 Instant。新模型在医学、法律和金融等高风险领域幻觉率降低52.5%,回答更简洁、更个性化。所有ChatGPT用户均可使用,付费用户仍可在三个月内访问旧模型。API中以chat-latest标识提供。
2、xAI发布Grok 4.3旗舰推理模型
5月3日至4日,xAI发布Grok 4.3,定位务实的过渡版本。API价格较上一代降低40%-60%,输出速度达196 Tokens/s,支持1M长上下文。模型在Agent任务和办公辅助方面有显著提升,但在复杂推理和事实核查稳定性上仍落后于GPT-5.5和Claude Opus 4.7。
3、美团发布万亿参数大模型LongCat-2.0,全流程国产化
4月30日,美团发布LongCat-2.0-Preview,采用MoE架构,总参数约1.6T,支持1M上下文。该模型训推全流程基于国产芯片完成,英伟达含量为零,训练阶段调用国产加速卡达5-6万张,刷新国产算力支撑超大模型训练规模上限,目前处于受邀内测阶段。
4、蚂蚁集团开源万亿参数大模型Ling-2.6-1T
4月30日,蚂蚁集团百灵大模型团队正式开源Ling-2.6-1T,采用MLA与LinearAttention混合架构,主打"快思考"机制,提升智能效率。模型在真实生产流任务中展现高Token效率,已在Hugging Face和ModelScope上线,同步延长OpenRouter平台免费API调用服务一周。
5、阿里通义千问首次开源语音合成大模型Qwen3-TTS
5月3日,阿里通义千问团队首次开源语音合成大模型Qwen3-TTS系列,共5个版本,最小仅0.6B参数,最大1.7B,手机端即可运行。分为VoiceDesign、CustomVoice和Base三个版本,支持指令控制、流式生成和3秒快速语音克隆,性能宣称超越GPT-4o-Audio和ElevenLabs等商业闭源模型。
6、讯飞星火X2-Flash发布:基于国产算力,256K长文本与效能双突破
4月30日,科大讯飞推出星火X2-Flash,基于华为昇腾910B芯片集群全流程训练,采用MoE架构,总参数量突破300亿,支持256K超长上下文。训练效率较传统方案提升4.5倍,Token消耗量仅为行业主流大模型的1/3,在智能体构建与代码生成等场景达到国际万亿参数模型同等水平。
7、腾讯混元开源移动端离线翻译模型Hy-MT1.5
4月30日,腾讯混元开源离线翻译模型Hy-MT1.5-1.8B-1.25bit,支持33种语言和1056个翻译方向。通过稀疏量化技术压缩至仅440MB,可在手机端无网络运行,翻译质量超越Google Translate等主流系统。该模型在国际机器翻译竞赛中获30项第一。
二、模型竞速与AI Coding
1、GPT-5.6与Anthropic Jupiter代号双双曝光
5月1日前后,开发者在Codex后台日志中发现GPT-5.6的路由记录;几乎同时,Anthropic Claude Code源码泄露中出现Sonnet 4.8、Opus 4.7、Mythos、Capybara及全新代号Jupiter。据传言Jupiter可能在5月6日Code with Claude开发者大会上亮相,新一轮模型军备竞赛正在加速。
2、OpenAI为GPT-5.5举办派对,Codex亲自挑客人
5月5日下午5:55,OpenAI为GPT-5.5举办庆祝派对,时间由GPT-5.5自己挑选,客人由Codex从推文回复中筛选。这背后是AI编程工具圈的明显用户迁移:开发者正从Claude Code转向Codex。Codex周活在突破300万后不到两周即逼近400万,npm下载量已是Claude Code的100倍。
三、OpenClaw生态
1、OpenClaw 5月密集迭代:集成Codex、Grok 4.3与Cursor SDK
https://github.com/openclaw/openclaw/releases
5月2日至4日,OpenClaw连发v2026.5.2、v2026.5.3和v2026.5.4-beta.1三个版本。5.2版本将Codex提升为一等公民运行时,支持/goal命令执行长周期自主任务;集成Grok 4.3为默认xAI模型。5.3版本聚焦插件可靠性修复。5.4-beta.1新增OpenRouter应用归属扩展和Codex/WhatsApp消息稳定性修复。
2、OpenAI CEO官宣:ChatGPT账号可直接登录OpenClaw
5月2日,OpenAI CEO Sam Altman宣布ChatGPT账号可以直接登录OpenClaw,实现GPT与"龙虾"正式合体。Codex也同步加入OpenClaw生态。这意味着OpenAI正将其旗舰产品深度接入全球最大的开源AI Agent框架,进一步巩固在Agent生态中的影响力。
3、OpenClaw新增Cursor SDK Agent后端支持
https://github.com/openclaw/openclaw/pull/75046
4月30日,OpenClaw社区提交PR #75046,新增Cursor SDK作为AgentHarness插件后端。用户可通过配置cursor-sdk运行时,将任务委托给Cursor的本地或云端Agent执行,支持代码库索引、文件编辑、终端和MCP服务器等完整功能,与Codex、Claude CLI并行成为官方支持的编码Agent后端。
四、产品应用与商业动态
1、豆包推出付费订阅,国产AI商业化迎来拐点
5月4日,字节跳动旗下豆包在App Store页面上线付费订阅服务声明,推出三档付费方案,最低档位"标准版"连续包月68元。此前豆包一直免费,此次付费订阅标志着国内AI行业"免费时代"开始落幕,是技术投入、用户基础与行业趋势共同驱动的结果。
2、Google秘密研发AI Agent"Remy"对标OpenClaw
https://www.businessinsider.com/google-ai-agent-openclaw-remy-gemini-assistant-2026-5
5月5日,Business Insider披露Google正在内部测试代号为"Remy"的AI智能体。Remy被描述为"24/7个人智能体",可代表用户采取行动,深度集成Google各项服务,能主动处理复杂任务并学习用户偏好。这与OpenClaw类似,目前处于员工测试阶段,可能在5月I/O大会上展示。
3、Google升级Gemini API File Search,支持多模态RAG
5月5日,Google宣布Gemini API File Search三大升级:多模态支持(图像和文本联合处理)、自定义元数据过滤和页级引用。开发者现可构建基于多模态数据的RAG系统,模型响应可直接追溯到原始来源的具体页码,提升可信度和可验证性。
4、Anthropic推出金融服务AI Agent,发布10个行业模板
5月5日,Anthropic面向金融服务行业发布10个AI Agent模板,涵盖研究、运营和财务职能,包括Pitch Builder、财报审阅、财务模型构建、KYC筛选等。Agent可在Claude Cowork、Claude Code或Claude Platform部署,支持数小时级的自主多步骤任务,并新增Microsoft 365插件支持。
5、美图升级RoboNeo,行业首创"Agent Teams"视觉创作
https://www.businesswire.com/news/home/20260430927187/en/
4月30日,美图宣布RoboNeo重大升级,引入"Agent Teams"多智能体编排模式。系统内置导演、编剧、视觉编辑等专业Agent实时协作,覆盖AI短剧、社交媒体内容和电商视频三大场景。集成Seedance 2.0视频生成能力,支持连续镜头生成和音视频同步输出。
五、行业与政策动态
1、Google、Microsoft、xAI同意政府安全审查AI模型
https://finance.sina.com.cn/stock/t/2026-05-05/doc-inhwwmhw8754353.shtml
5月5日,美国商务部人工智能标准与创新中心宣布,谷歌、微软和xAI已签署协议,在公开发布前沿AI模型前接受美国政府安全审查。该协议凸显华盛顿对高性能AI系统国家安全风险的日益担忧,OpenAI和Anthropic此前已加入类似安排,五家前沿AI实验室现已全部纳入自愿审查框架。
2、Anthropic与OpenAI争相成立企业AI合资企业
5月4日,Anthropic宣布成立企业AI服务合资企业,Blackstone、Hellman & Friedman和Goldman Sachs为创始合伙人,估值15亿美元。数小时后,OpenAI被曝正在筹备类似企业"The Deployment Company",拟从19家投资者募资40亿美元,估值100亿美元。双方均计划收购AI服务公司,嵌入工程师团队至客户组织。
3、OpenAI与Anthropic合资企业洽谈收购AI服务公司
5月5日,据知情人士透露,OpenAI和Anthropic各自与私募股权 firm成立的合资企业正在洽谈收购帮助企業部署AI的服务公司。OpenAI的合资企业在三项交易上已进入高级阶段,计划将数百名工程师和顾问纳入体系,以解决企业AI落地中最显著的人才瓶颈。
4、美国政府计划立法限制Mythos级AI模型自由发布
5月5日,美国政府正考虑立法要求科技公司在公开发布最强大的AI模型前提交政府审查。该法案源于Anthropic Mythos模型的网络安全能力引发的国家安全担忧,将建立由科技高管和政府高级官员组成的正式AI工作组,可能代表特朗普政府AI监管思路的重大转变。
5、巴基斯坦通过Islamabad AI Declaration,承诺10亿美元AI投入
5月4日,巴基斯坦政府在Indus AI Summit后正式通过Islamabad AI Declaration,承诺到2030年投入10亿美元用于国家AI计划。这标志着巴基斯坦从政策宣示转向"有纪律的国家执行",是AI领域最重大的地缘政治进展之一。
六、国产算力与DeepSeek生态
1、DeepSeek V4价格比GPT-5.5低97%,引发新一轮价格战
5月2日,DeepSeek宣布V4-Pro输入缓存命中价格降至约0.14美元/百万token,仅为GPT-5.5的3%。加上5月5日前限时2.5折优惠,V4-Pro实际输入价格低至0.0036美元/百万token。按典型对话计算,GPT-5.5单次对话成本是DeepSeek-V4的32倍,可能点燃新一轮大模型价格战。
2、DeepSeek+华为昇腾全国产AI生态突围
5月1日至2日,多家媒体集中报道DeepSeek V4与华为昇腾芯片的深度协同。V4首次将华为昇腾和英伟达芯片并列写进硬件验证清单,端到端延迟比原有英伟达集群低35%。字节跳动、腾讯和阿里巴巴正在抢购华为国产芯片,2026年被业界称为"国产AI芯片训练落地元年"。
七、学术研究
1、中国科学院发布ScienceOne 100科研AI系统
4月30日,中国科学院发布ScienceOne 100人工智能模型系统,包含数学、物理、材料科学、天文学、环境科学、航空航天、地球科学和生物学八个领域专用大模型。文献助手准确率达90%,可将研究时间缩短60%以上,已部署至50余家中科院研究所,覆盖100多个研究场景。
快讯由AI自动整理生成,仅供参考。如有遗漏或偏差,欢迎补充指正。


