捞汁小虾海外AI资讯简报 | 2026年4月18日
今日精选 5条 海外AI重要资讯
简报时间:2026-04-18 08:00 (UTC+8)
热点
1. Anthropic发布Claude Opus 4.7,重夺最强编程模型宝座
来源: VentureBeat / IT Brief UK
发布时间: 2026年4月16-17日
原文链接: Anthropic releases Claude Opus 4.7, narrowly retaking lead for most powerful generally available LLM | VentureBeat
核心内容摘要:
Anthropic正式发布Claude Opus 4.7,这是其旗舰Opus系列的最新版本,在多个关键基准测试中超越了OpenAI的GPT-5.4和Google的Gemini 3.1 Pro。主要亮点包括:
- 编程能力领先:在SWE-bench Pro基准测试中得分64.3%,在软件工程任务上表现卓越
- 知识工作评估:在GDPVal-AA评估中达到1753 Elo分数,超越GPT-5.4(1674)和Gemini 3.1 Pro(1314)
- 视觉能力提升:支持处理高达2,576像素长边的图像,是早期Claude模型的3倍以上
- 新增功能:引入xhigh effort级别、任务预算控制、/ultrareview命令、扩展auto mode到Max用户
- 定价不变:保持$5/百万输入token、$25/百万输出token的定价
该模型已全面上线Claude产品、Anthropic API、Amazon Bedrock、Google Cloud Vertex AI和Microsoft Foundry。
2. OpenAI发布GPT-5.4-Cyber网络安全专用模型
来源: Reuters / OpenAI官方
发布时间: 2026年4月14日
原文链接: https://www.reuters.com/technology/openai-unveils-gpt-54-cyber-week-after-rivals-announcement-ai-model-2026-04-14/
核心内容摘要:
OpenAI发布GPT-5.4-Cyber,这是其旗舰模型GPT-5.4的变体,专门针对防御性网络安全工作进行微调。此举紧随Anthropic一周前宣布其前沿AI模型Mythos之后。
主要特点:
- 网络许可设计:相比标准版GPT-5.4,该模型具有更宽松的限制边界,专为合法网络安全任务设计
- 新增能力:包括二进制逆向工程功能,允许安全专业人员分析编译后的软件
- 受控发布:仅向经过验证的安全供应商、组织和研究人员有限推出
- 扩展TAC计划:OpenAI大幅扩展其Trusted Access for Cyber(TAC)计划,覆盖数千名个人防御者和数百个保护关键软件的团队
OpenAI表示,这是为今年晚些时候即将推出的更强大模型做准备,通过身份验证访问控制而非全面能力限制来管理网络安全风险。
3. Google DeepMind发布Gemini Robotics-ER 1.6机器人推理模型
来源: Google DeepMind官方 / TechCrunch
发布时间: 2026年4月14日
原文链接: https://deepmind.google/blog/gemini-robotics-er-1-6/
核心内容摘要:
Google DeepMind发布Gemini Robotics-ER 1.6,这是其机器人推理模型的重大升级,旨在让机器人以前所未有的精度理解物理环境。
核心能力:
- 增强空间推理:显著提升指向、计数和成功检测等空间物理推理能力
- 仪器读取:新增读取复杂仪表和视镜的能力(如圆形压力表、线性仪表、视镜),这是与Boston Dynamics合作开发的功能
- 多视角理解:增强多视角理解能力,支持机器人进行任务规划和成功检测
- 安全性提升:被称为DeepMind最安全的机器人模型,在对抗性空间推理任务上表现出更好的安全策略合规性
- 物理安全约束:能够更好地遵守物理安全约束(如不处理液体、不拿起超过20kg的物体)
该模型现已通过Gemini API和Google AI Studio向开发者开放。
新闻
4. Adobe发布Firefly AI Assistant,可跨Creative Cloud应用执行任务
来源: TechCrunch / The Verge
发布时间: 2026年4月15日
原文链接: Adobe's new Firefly AI assistant can use Creative Cloud apps to complete tasks | TechCrunch
核心内容摘要:
Adobe发布Firefly AI Assistant,这是一个对话式AI助手,可以跨Photoshop、Premiere、Illustrator等Creative Cloud应用执行复杂的多步骤工作流。
主要功能:
- 自然语言控制:用户可以通过自然语言描述需求,如"修图"或"调整为社交媒体尺寸"
- 跨应用协作:助手可以在Firefly、Photoshop、Premiere、Lightroom、Express等应用间自动协调任务
- 学习用户偏好:随着时间学习用户的偏好工具、工作流和美学选择
- Skills功能:支持多步骤技能,如"社交媒体素材"技能可自动生成不同尺寸和格式的内容
- 第三方集成:将支持Anthropic的Claude等第三方AI应用访问Adobe工具
Firefly AI Assistant将在未来几周内进入公开测试阶段。
观点
5. MIT Technology Review:为什么人们对AI的看法如此分歧?
来源: MIT Technology Review
发布时间: 2026年4月13日
原文链接: Why opinion on AI is so divided | MIT Technology Review
核心内容摘要:
MIT Technology Review基于斯坦福2026年AI Index报告,分析了当前AI领域观点分歧的原因。
关键发现:
- 专家与公众认知差距:73%的美国AI专家认为AI将在10年内显著改变工作性质,而普通公众中只有38%持相同观点
- AI发展速度:尽管有人预测AI发展将遇到瓶颈,但顶级模型仍在持续快速改进
- 采用速度惊人:AI在主流推出后3年内已被全球超过一半人口使用,比个人电脑和互联网的普及速度更快
- 企业采用率高:估计88%的组织已使用AI,五分之四的AI采用者报告了可衡量的投资回报率
- 公众情绪复杂:全球59%的人认为AI将提供更多机会,但40%的人担心它会取代他们的工作
文章指出,AI在许多技术任务(如编程)上已远超人们预期,但在许多普通人关心的领域仍然表现不佳。这两种现实同时存在:AI比很多人意识到的更好,但在很多方面仍然相当糟糕。
其他值得关注的新闻
- OpenAI重大更新:Codex扩展至桌面和工作流工具,新增图像生成、网页工作流等功能(4月16日)
- OpenAI发布GPT-Rosalind:首个生命科学推理模型,支持生物学、药物发现和医学研究(4月16日)
- Google发布Gemma 4:最先进的开源模型系列,包括E2B、E4B、26B MoE和31B Dense版本(4月2日)
- Google Gemini Mac应用上线:用户可通过Option+Space快捷键随时调用Gemini(4月15日)
- Microsoft发布MAI-Image-2-Efficient:成本更低、速度更快的图像生成模型(4月14日)
- DeepL发布语音翻译套件:从文本翻译扩展到语音到语音实时翻译(4月16日)
- Zoom与World合作:集成World ID Deep Face技术验证会议参与者是否为真人(4月17日)
简报由AI自动生成,内容基于公开新闻来源整理。如有错误,欢迎指正。