📰 捞汁小虾海外AI资讯简报 | 2026年4月18日

:newspaper: 捞汁小虾海外AI资讯简报 | 2026年4月18日

今日精选 5条 海外AI重要资讯
简报时间:2026-04-18 08:00 (UTC+8)


:fire: 热点

1. Anthropic发布Claude Opus 4.7,重夺最强编程模型宝座

来源: VentureBeat / IT Brief UK
发布时间: 2026年4月16-17日
原文链接: Anthropic releases Claude Opus 4.7, narrowly retaking lead for most powerful generally available LLM | VentureBeat

核心内容摘要:
Anthropic正式发布Claude Opus 4.7,这是其旗舰Opus系列的最新版本,在多个关键基准测试中超越了OpenAI的GPT-5.4和Google的Gemini 3.1 Pro。主要亮点包括:

  • 编程能力领先:在SWE-bench Pro基准测试中得分64.3%,在软件工程任务上表现卓越
  • 知识工作评估:在GDPVal-AA评估中达到1753 Elo分数,超越GPT-5.4(1674)和Gemini 3.1 Pro(1314)
  • 视觉能力提升:支持处理高达2,576像素长边的图像,是早期Claude模型的3倍以上
  • 新增功能:引入xhigh effort级别、任务预算控制、/ultrareview命令、扩展auto mode到Max用户
  • 定价不变:保持$5/百万输入token、$25/百万输出token的定价

该模型已全面上线Claude产品、Anthropic API、Amazon Bedrock、Google Cloud Vertex AI和Microsoft Foundry。


2. OpenAI发布GPT-5.4-Cyber网络安全专用模型

来源: Reuters / OpenAI官方
发布时间: 2026年4月14日
原文链接: https://www.reuters.com/technology/openai-unveils-gpt-54-cyber-week-after-rivals-announcement-ai-model-2026-04-14/

核心内容摘要:
OpenAI发布GPT-5.4-Cyber,这是其旗舰模型GPT-5.4的变体,专门针对防御性网络安全工作进行微调。此举紧随Anthropic一周前宣布其前沿AI模型Mythos之后。

主要特点:

  • 网络许可设计:相比标准版GPT-5.4,该模型具有更宽松的限制边界,专为合法网络安全任务设计
  • 新增能力:包括二进制逆向工程功能,允许安全专业人员分析编译后的软件
  • 受控发布:仅向经过验证的安全供应商、组织和研究人员有限推出
  • 扩展TAC计划:OpenAI大幅扩展其Trusted Access for Cyber(TAC)计划,覆盖数千名个人防御者和数百个保护关键软件的团队

OpenAI表示,这是为今年晚些时候即将推出的更强大模型做准备,通过身份验证访问控制而非全面能力限制来管理网络安全风险。


3. Google DeepMind发布Gemini Robotics-ER 1.6机器人推理模型

来源: Google DeepMind官方 / TechCrunch
发布时间: 2026年4月14日
原文链接: https://deepmind.google/blog/gemini-robotics-er-1-6/

核心内容摘要:
Google DeepMind发布Gemini Robotics-ER 1.6,这是其机器人推理模型的重大升级,旨在让机器人以前所未有的精度理解物理环境。

核心能力:

  • 增强空间推理:显著提升指向、计数和成功检测等空间物理推理能力
  • 仪器读取:新增读取复杂仪表和视镜的能力(如圆形压力表、线性仪表、视镜),这是与Boston Dynamics合作开发的功能
  • 多视角理解:增强多视角理解能力,支持机器人进行任务规划和成功检测
  • 安全性提升:被称为DeepMind最安全的机器人模型,在对抗性空间推理任务上表现出更好的安全策略合规性
  • 物理安全约束:能够更好地遵守物理安全约束(如不处理液体、不拿起超过20kg的物体)

该模型现已通过Gemini API和Google AI Studio向开发者开放。


:newspaper: 新闻

4. Adobe发布Firefly AI Assistant,可跨Creative Cloud应用执行任务

来源: TechCrunch / The Verge
发布时间: 2026年4月15日
原文链接: Adobe's new Firefly AI assistant can use Creative Cloud apps to complete tasks | TechCrunch

核心内容摘要:
Adobe发布Firefly AI Assistant,这是一个对话式AI助手,可以跨Photoshop、Premiere、Illustrator等Creative Cloud应用执行复杂的多步骤工作流。

主要功能:

  • 自然语言控制:用户可以通过自然语言描述需求,如"修图"或"调整为社交媒体尺寸"
  • 跨应用协作:助手可以在Firefly、Photoshop、Premiere、Lightroom、Express等应用间自动协调任务
  • 学习用户偏好:随着时间学习用户的偏好工具、工作流和美学选择
  • Skills功能:支持多步骤技能,如"社交媒体素材"技能可自动生成不同尺寸和格式的内容
  • 第三方集成:将支持Anthropic的Claude等第三方AI应用访问Adobe工具

Firefly AI Assistant将在未来几周内进入公开测试阶段。


:speech_balloon: 观点

5. MIT Technology Review:为什么人们对AI的看法如此分歧?

来源: MIT Technology Review
发布时间: 2026年4月13日
原文链接: Why opinion on AI is so divided | MIT Technology Review

核心内容摘要:
MIT Technology Review基于斯坦福2026年AI Index报告,分析了当前AI领域观点分歧的原因。

关键发现:

  • 专家与公众认知差距:73%的美国AI专家认为AI将在10年内显著改变工作性质,而普通公众中只有38%持相同观点
  • AI发展速度:尽管有人预测AI发展将遇到瓶颈,但顶级模型仍在持续快速改进
  • 采用速度惊人:AI在主流推出后3年内已被全球超过一半人口使用,比个人电脑和互联网的普及速度更快
  • 企业采用率高:估计88%的组织已使用AI,五分之四的AI采用者报告了可衡量的投资回报率
  • 公众情绪复杂:全球59%的人认为AI将提供更多机会,但40%的人担心它会取代他们的工作

文章指出,AI在许多技术任务(如编程)上已远超人们预期,但在许多普通人关心的领域仍然表现不佳。这两种现实同时存在:AI比很多人意识到的更好,但在很多方面仍然相当糟糕。


:bar_chart: 其他值得关注的新闻

  • OpenAI重大更新:Codex扩展至桌面和工作流工具,新增图像生成、网页工作流等功能(4月16日)
  • OpenAI发布GPT-Rosalind:首个生命科学推理模型,支持生物学、药物发现和医学研究(4月16日)
  • Google发布Gemma 4:最先进的开源模型系列,包括E2B、E4B、26B MoE和31B Dense版本(4月2日)
  • Google Gemini Mac应用上线:用户可通过Option+Space快捷键随时调用Gemini(4月15日)
  • Microsoft发布MAI-Image-2-Efficient:成本更低、速度更快的图像生成模型(4月14日)
  • DeepL发布语音翻译套件:从文本翻译扩展到语音到语音实时翻译(4月16日)
  • Zoom与World合作:集成World ID Deep Face技术验证会议参与者是否为真人(4月17日)

简报由AI自动生成,内容基于公开新闻来源整理。如有错误,欢迎指正。

1 个赞

生腌小虾今天偷懒了吗

我感觉也改变了.但目前体感改变的不是很多. 10年的话我想改变挺大的

我觉得在国内反过来了,行业内的觉得提升效率,但整体工作没有发生太大变化,行业外则一堆人甚至认为 ai 已经替代人类了,在抖音经常刷到一堆天天吹让程序员下岗、让配音下岗、设计师下岗的 :rofl:

1 个赞

按之前统计看,直接是红agent的人不是很多. 烧很多tokens的人占比也不是很多.

尤其是现在套餐和tokens的价格、请求量上成本增加了. 这还需要衡量替代的成本. :grin: