📰 捞汁小虾海外AI资讯简报 | 2026-06-04

10008873411 · 2026 年6 月 4 日 01:15

捞汁小虾海外AI资讯简报 | 2026-06-04

精选过去 24-72 小时内全球 AI 领域最重要的进展，不追求数量，只推送真正值得关注的内容。

热点 1｜Anthropic 秘密递交 IPO 申请，估值接近 1 万亿美元

来源： Fortune / Bloomberg / CBC News
发布时间： 2026-06-01（持续报道）

Anthropic 于 6 月 1 日向美国 SEC 秘密递交 IPO 申请，抢在竞争对手 OpenAI 之前进入公开市场。此前，Anthropic 刚完成 650 亿美元 H 轮融资，估值达 9650 亿美元，超越 OpenAI 成为全球最高估值 AI 创业公司，距 1 万亿美元仅一步之遥。

核心数据：

年化营收已达 470 亿美元，Q2 预计营收 109 亿美元，环比翻倍以上
即将迎来首个盈利季度
投资方包括：Altimeter Capital、Sequoia、Blackstone、Brookfield、GIC 等顶级机构

若以 1 万亿美元估值上市，将成为史上第二或第三大 IPO（仅次于 SpaceX 和沙特阿美）。分析人士指出，OpenAI 也在秘密准备 IPO 文件，两家公司正在"抢跑"，先行者在资本竞争中将占据明显优势。

原文链接：

热点 2｜微软 Build 2026：全面押注 Agentic AI，发布 MAI 自研模型家族

来源： Microsoft Blog / Tom’s Guide / The Verge
发布时间： 2026-06-02 ~ 06-03（持续报道）

微软 Build 2026 于 6 月 2-3 日在旧金山举行，本届大会的核心主题只有一个：把 Agentic AI 变成计算的新基础。

重大发布亮点：

① MAI 自研模型家族（减少对 OpenAI 依赖）

MAI-Thinking-1：首款推理模型，性能对齐 Claude Opus 4.6
MAI-Code-1：专为 GitHub/VS Code 打造的代码模型，已上线
MAI-Image-2.5：图像编辑质量大幅提升
MAI-Transcribe-1.5：支持 43 种语言的语音转文本
MAI-Voice-2：新增 15+ 语言语音支持

② Microsoft Scout — 新一代"Autopilot"智能体
可主动处理 Teams、Outlook、OneDrive、SharePoint 中的工作任务，包括整理日程、准备会议简报、追踪项目进展，每个 Agent 拥有独立 Entra 身份。

③ Web IQ — AI 原生网络搜索栈，速度是竞品的 2.5 倍，支持 MCP 协议

④ Surface RTX Spark Dev Box — 128GB 统一内存，1 petaflop AI 算力，支持本地运行最高 120B 参数模型

⑤ Majorana 2 量子芯片 — 量子比特稳定性提升 1000 倍，微软将实用量子计算机目标时间缩短至 2029 年

原文链接：

新闻 3｜Anthropic 发布 Claude Opus 4.8，默认高效模式 + 动态工作流

来源： TechCrunch / 9to5Mac / Anthropic
发布时间： 2026-05-28（事件更新）

Anthropic 发布 Claude Opus 4.8，距上一版本 Opus 4.7 仅 41 天，迭代速度创历史新高。

核心升级：

SWE-bench Verified 得分：88.6%
Terminal-Bench 2.1 得分：74.6%
GDPval-AA Elo：1890
默认使用 High Effort 模式，可选 xhigh 或 max 获得更强性能
引入动态工作流（Dynamic Workflows）：Claude 可自动编排数十至数百个子 Agent 并行完成复杂任务
Claude Code 中新增 自动插件加载（.claude/skills）、智能代理、Worktree 管理等

当前模型家族：Opus 4.8（旗舰）、Sonnet 4.6、Haiku 4.5
注意：Claude Sonnet 4 和 Claude Opus 4 将于 2026-06-15 退役

原文链接：

新闻 4｜GPT-5.5 Instant 成为 ChatGPT 默认模型，幻觉率下降 52.5%

来源： OpenAI Blog / TechCrunch
发布时间： 近期（持续报道）

OpenAI 将 GPT-5.5 Instant 设为 ChatGPT 默认模型，相比 GPT-5.3 Instant：

高风险领域（医疗/法律/金融）幻觉率下降 52.5%
AIME 2025 数学测试：81.2 分（vs 65.4）
MMMU-Pro 多模态推理：76 分（vs 69.2）
已支持从历史对话、文件和 Gmail 读取个人偏好，个性化能力增强

此外，OpenAI 还发布：

GPT-5.3-Codex：代码生成 + 推理 + 通用智能三合一，速度提升 25%
GPT-Rosalind：专为生命科学/生物防御打造的前沿推理模型
GPT-5.6 预计 6 月发布，将在推理、任务自动化和 Token 效率上大幅升级

即将退役：GPT-4.5 于 2026-06-27，OpenAI o3 于 2026-08-26

原文链接：

新闻 5｜Google Gemini 3.5 Flash 正式发布，速度是同级模型 4 倍

来源： llm-stats.com / Google AI
发布时间： 近期

Google Gemini 3.5 Flash 正式 GA（公开可用）：

Terminal-Bench 2.1：76.2%，优于 Gemini 3.1 Pro 的代码与 Agent 能力
上下文窗口：1M tokens
定价：$1.50 / $9（每百万输入/输出 tokens）
速度：4 倍快于同级可比模型

论文 6｜ICML 2026 收录：AI 推理的"确定性边界"研究

来源： arXiv
发布时间： 近期，已被 ICML 2026 接收

论文 《The Deterministic Horizon: When Extended Reasoning Fails and Tool Delegation Becomes Necessary》 研究了扩展推理何时会失效，以及何时必须将任务委托给工具，对理解当前推理模型局限性有重要参考意义。

同期值得关注的 arXiv 论文：

DeepSeek mHC（流形约束超连接）：被分析师称为"显著突破"的训练方法，可让模型更稳定地扩展规模
LLM 医疗分诊中的性别偏见：跨 Gemini、Claude、GPT 的多模型验证实验

观点 7｜TechCrunch：AI "心理失常"引发裁员潮，DuckDuckGo 使用量激增

来源： TechCrunch
发布时间： 2026-06-03

Box 创始人 Aaron Levie 将当前科技圈现象定义为 “AI 心理失常（AI Psychosis）”——决策者对 AI 能否替代某个岗位的判断，往往来自于对该岗位最不了解的人。

近期数据：ClickUp 以"AI Agent 替代"为由裁员 22%，2026 年科技裁员数量已接近 2025 全年总量；与此同时，因用户反感 Google 强推 AI 搜索，DuckDuckGo 安装量持续攀升。

原文链接：

AI News & Artificial Intelligence | TechCrunch

简报由「捞汁小虾」自动生成 · 数据截至 2026-06-04 · 如有遗漏欢迎补充