AI资讯

AI三巨头齐发:OpenAI、Anthropic、DeepMind新模型信息速览

AI执行官

就在最近的一天,人工智能行业迎来了罕见的集体发布潮——OpenAI、Anthropic、Google DeepMind三家全球顶级AI实验室几乎在同一时间发布了各自的重磅新模型。这种”三巨头撞车”在AI发展史上并不常见,却足以说明当前AI行业竞争进入了白热化阶段。

让我们一起来看看这三家巨头都带来了哪些让人惊喜的新突破,这些突破又将对行业产生怎样的影响。

DeepMind Genie 3:首个能实时交互的通用世界模型

北京时间晚10点,Google DeepMind第一个拉开了这次发布大戏的帷幕,推出了第三代通用世界模型 Genie 3

和前两代模型相比,Genie 3最大的突破在于:这是第一个能让用户在长时间环境一致性中,实现实时交互的世界模型

什么意思呢?简单来说,以前的世界模型生成动态环境时,往往会出现”健忘”的问题——用户离开某个区域再回来,发现场景已经变了,物体的位置、颜色、形状都对不上了。但Genie 3解决了这个问题。比如官方展示的案例中,视频中的人刷完墙后看向旁边,过一会儿再回过头继续刷,墙上油漆的形状和颜色都和之前保持完全一致,环境一致性非常强。

Genie 3的核心特性

Genie 3展现出了多个令人惊叹的能力:

#### 1. 对物理规律的深刻理解

Genie 3能够逼真地模拟水流、光影变化以及复杂的环境互动。你可以清晰地看到水流动的轨迹、光线在不同物体表面的反射效果,这种对物理世界的模拟精度是以往模型难以达到的。

#### 2. 创造充满活力的自然生态系统

模型能够生成从动物到植物完整的自然世界,各种生物之间可以形成动态的生态互动。这为游戏开发、虚拟现实、影视制作等领域打开了全新的想象空间。

#### 3. 支持动画和小说场景建模

Genie 3可以创造奇幻的场景和富有表现力的动画角色。作家和动画设计师只需要用文字描述,就能快速生成对应的场景预览,大大降低了创意产业的门槛。

#### 4. 突破时空限制的探索能力

模型能够超越地理和时间的限制,带领用户探索不同地点和历史时代。想要看看白垩纪的恐龙是什么样子?想去火星看看真实的地貌?Genie 3都能帮你实现。

技术突破:实时交互与长时一致性

Genie 3最令人惊叹的还是它的技术突破:

实时性能:Genie 3可以在720p分辨率下以每秒24帧的速度生成动态世界,用户操作后能够立即得到反馈,真正实现了”实时交互”。要知道,每一帧的生成都需要考虑之前所有轨迹的信息,这种计算量是非常惊人的。

长时程环境一致性:为了让AI生成的世界身临其境,环境必须在很长一段时间内保持物理上的一致性。由于不准确性会随着时间推移累积,这个问题一直困扰着研究者。而Genie 3能够在几分钟内基本保持环境一致性,视觉记忆可以追溯到一分钟前,这是一个重大进步。

值得一提的是,Genie 3的一致性是一种”涌现能力”。传统方法如NeRFs(神经辐射场)和Gaussian Splatting(高斯投影)也能实现一致且可导航的三维环境,但它们依赖于显式的三维表示。相比之下,由Genie 3生成的世界更加动态和丰富,因为这些世界是根据描述和用户动作逐帧生成的。

Claude Opus 4.1:更强但价格不变,性价比再提升

刚过凌晨半小时,Anthropic接过大旗,发布了Claude系列最新旗舰模型 Claude Opus 4.1,取代了之前的Opus 4成为新的旗舰。

相比较Opus 4,Opus 4.1在各项评测指标上实现了小幅提升,但API调用价格并没有提高。从这个角度来看,升级后的Claude Opus 4.1性价比变得更加优秀。

主要改进点

根据Anthropic官方介绍,Claude Opus 4.1主要在以下几个方面进行了增强:

  1. 代码能力提升:对于软件开发场景的理解和生成能力进一步增强
  2. Agent能力增强:作为自主代理完成复杂任务的表现更好
  3. 推理性能提升:逻辑推理和问题解决能力得到优化
  4. 深入研究能力:对复杂主题进行深入研究分析的能力提升
  5. 数据分析能力:处理和分析大规模数据集的表现更好

Anthropic还直接建议用户:在所有使用场景中,都将Opus 4升级为Opus 4.1

企业客户反馈积极

Anthropic公开了一系列企业客户对Opus 4.1的评价。其中Windsurf的报告称,在他们的初级开发者基准测试中,Opus 4.1相比Opus 4实现了不小的性能提升,这一进步大致相当于从Sonnet 3.7到Sonnet 4的跨越。

目前,Opus 4.1已经对付费用户和Claude Code提供使用,也上线了API、Amazon Bedrock以及Google Cloud的Vertex AI。根据官方消息,在接下来的数周内,Anthropic还会继续对模型能力做升级。

价格策略值得关注

一个值得注意的点是:Anthropic这次提升了模型性能,但没有涨价。在当前AI模型训练成本越来越高的背景下,这种”加量不加价”的策略确实让用户感到惊喜。

这也从一个侧面反映出当前AI行业竞争的激烈程度——各家厂商都在通过提升性价比来争夺用户和市场份额。

OpenAI gpt-oss:时隔多年再次开源,可端侧部署

凌晨1点,OpenAI紧随其后,发布了两款推理模型 gpt-oss-120bgpt-oss-20b。这是OpenAI自2019年GPT-2开源完整版之后,多年来再次开源GPT系列语言模型。

开源仅仅1小时,项目Star数就已经达到了1.6k,可见社区对这次开源的热度。

模型规格与性能

根据官方介绍:

  • gpt-oss-120b:包含117B参数,激活参数量5.1B,可在80G内存设备上运行,原版也只需要一张H100就能完成部署
  • gpt-oss-20b:包含210亿参数,激活参数量36亿,可在16GB内存设备上运行,甚至智能手机都能胜任

从测评表现来看,新模型的多项指标得分与o3和o4-mini接近,但它们更适用于端侧部署和本地推理。

具体来说:

  • gpt-oss-120b在推理相关测试中的性能表现与o4-mini几乎持平
  • gpt-oss-20b在常见基准测试中的结果与OpenAI o3-mini相似

核心意义:开放权重,支持商用

这次OpenAI开源最大的意义在于:两款模型都开放了模型权重,并且允许商用

这对于AI开发者来说无疑是重大利好。以往想要使用OpenAI的模型,必须通过API调用,不仅有网络延迟,成本也累积起来也不便宜。现在有了可开源商用的模型,开发者可以:

  1. 本地部署:将模型部署在自己的设备上,保护数据隐私
  2. 二次微调:针对特定场景对模型进行微调,获得更好的效果
  3. 端侧应用:开发运行在手机、PC等终端设备上的AI应用
  4. 降低成本:一次性部署,长期使用,避免API调用费用累积

目前,开发者已经可以在Azure、Hugging Face、vLLM、Ollama、AWS等平台上使用这两款模型。OpenAI还提供了一个Playground网站让开发者可以快速上手尝试模型效果,在一个页面集成两款不同参数量的模型,还支持直接切换推理程度,用户可以手动选择3档不同程度的推理级别,对比不同级别下的模型表现。

不过,发布初期网站访问压力很大,据实测,发布后1小时内网页持续处于无法进行对话的状态。即使后来能正常对话,模型也一度坚称自己”不是gpt-oss,而是基于GPT-4的ChatGPT”,看来还需要一段时间来稳定服务。

GPT-5真的不远了?

虽然这次OpenAI发布的不是万众期待的GPT-5,但根据业内各种信息,GPT-5也即将和大家见面。有消息称Flowith官方Twitter直接发布消息,将在8月7日完成GPT-5的接入。

不管怎么说,OpenAI这次时隔多年重新开源,本身就说明行业格局正在发生变化。开放模型权重、支持端侧部署,这可能是OpenAI应对竞争的新策略。

三巨头技术路线对比分析

这次三家巨头同时发布新模型,正好可以让我们看看它们不同的技术路线选择:

DeepMind:探索前沿,世界模型

Google DeepMind这次选择继续在世界模型这个前沿方向深耕。Genie 3的发布说明它们在生成式动态环境这个方向上已经取得了重大突破。

世界模型被很多人认为是AGI(通用人工智能)的关键一步——如果AI能够理解并生成整个动态世界,那离真正的通用智能也就不远了。DeepMind一直坚持在这个方向上投入,这次的成果确实让人眼前一亮。

Anthropic:稳步迭代,企业优先

Anthropic这几年的策略一直非常稳健:Claude系列每次更新都是稳扎稳打,性能稳步提升,同时特别注重企业用户需求。

这次Opus 4.1升级不涨价,更是体现了它们争夺企业市场的决心。Anthropic近年来在企业用户中的口碑越来越好,这种稳健的风格确实很受企业欢迎。

OpenAI:开源试水,布局端侧

OpenAI这次开源gpt-oss系列,有点让人意外。毕竟这些年OpenAI一直走闭源路线,靠API服务赚钱。现在突然开放权重,允许商用,很可能是在为端侧布局做准备。

随着硬件性能不断提升,越来越多的推理任务会从云端转向端侧。OpenAI现在开源两款不同规模的模型,可以说是提前卡位。

竞争格局:三足鼎立,各有侧重

从这次发布可以看出,当前全球AI大模型市场已经形成了三足鼎立的格局:

  • OpenAI:依然是行业标杆,技术全面,商业化成熟
  • Anthropic:稳健发展,口碑极佳,特别受企业用户欢迎
  • Google DeepMind:技术积累深厚,前沿探索不断,总能给人惊喜

三家都有自己的优势领域,也都在持续投入研发,这种良性竞争对整个行业发展来说是好事——竞争促进创新,最终受益的还是用户。

对开发者和企业的影响

这次三巨头集体发布新模型,对开发者和企业来说意味着什么呢?

对开发者:更多选择,更低门槛

  • 开源模型:OpenAI的开源让中小开发者也能使用接近顶级模型性能的AI,降低了开发门槛
  • 端侧部署:gpt-oss-20b可以在16GB内存上运行,意味着更多应用可以本地运行,保护隐私
  • 价格下降:Anthropic升级不涨价,竞争推动整个行业价格下行,开发者成本降低

对企业:更多可能性,更快落地

  • 世界模型:Genie 3为游戏、影视、VR/AR等行业打开了新的可能性,内容生产效率会大幅提升
  • 更强推理:Claude Opus 4.1推理能力进一步增强,企业处理复杂数据分析任务会更高效
  • 本地部署选项:对于数据敏感的企业,现在有了开源可本地部署的选择,数据安全性更高

行业趋势:几个值得关注的方向

从这次三巨头的发布,我们可以看出几个明显的行业趋势:

  1. 实时交互能力越来越重要:Genie 3的实时交互、Opus 4.1的Agent能力增强,都说明用户对AI实时响应的要求越来越高
  1. 开放与闭源并存:并不是说开源一定会战胜闭源,而是两者会长期共存,满足不同场景需求
  1. 端侧部署成为新战场:从手机到PC,越来越多的AI应用会运行在端侧,隐私保护更好,响应更快
  1. 价格竞争持续:性能越来越强,价格不涨甚至下降,这对用户来说肯定是好事

总结:AI发展进入加速期

一天之内,三家顶级实验室同时发布重磅模型,这件事本身就说明AI发展正在进入加速期。

  • DeepMind在世界模型方向上的突破,让我们离动态交互式AI更近了一步
  • Anthropic继续稳扎稳打,用更高性价比争夺企业市场
  • OpenAI时隔多年重新开源,布局端侧推理新战场

三家走在不同的技术路线上,但都带来了让人惊喜的进步。对于AI行业来说,这种良性竞争正是创新的源泉。

虽然GPT-5这次还是没有正式露面,但从各种迹象来看,我们离GPT-5真的不远了。在可预见的未来,我们还会看到更多让人惊叹的AI突破。

你对这三款新模型哪一款最感兴趣?你更看好哪家的技术路线?欢迎在评论区留下你的看法。

本文基于公开资料整理,技术细节以官方发布为准。

分享给朋友