国产大模型双响炮！千问3.7-Max登顶第一，谷歌Gemini Spark开启Agent时代

5月20日，AI圈两件大事同日发生！

5月20日，注定是AI历史上又一个值得记住的日子——

一边是阿里云峰会在杭州召开，千问3.7-Max旗舰模型正式亮相，一举拿下”国产第一”；另一边是谷歌I/O 2026第二天的发布，Gemini Spark全天候AI助手正式登场。

两场发布会，一个共同的关键词：AI Agent。

这意味着什么？意味着AI不再只是”你问它答”的聊天机器人，而是能自己干活、自己规划、自己执行的智能助手。普通人用AI的方式，即将彻底改变。

阿里巴巴在2026阿里云峰会上正式发布Qwen3.7-Max，这是千问旗舰模型近三个月内的第三次重大迭代（3.5→3.6→3.7），迭代速度创行业纪录。

评测维度	表现	超越对象
全球大模型盲测总榜	国产第一	Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1
编程能力（Terminal Bench 2.0）	69.7分	DeepSeek-v4-pro-Max、Claude-Opus4.6
推理能力（GPQA Diamond等）	领先	Claude-Opus4.6及所有国产模型
指令遵循（IFBench）	79.1分	创下新高
办公自动化（SpreadSheetBench）	87分	顶尖水平

测试中，Qwen3.7-Max在一个从未见过的硬件平台（平头哥真武M890芯片）上，从零开始独立完成推理内核优化任务：

更关键的是，模型在运行超过30小时后仍能发现有效优化点，甚至主动发起了一次关键的架构重设计。这种”不知疲倦、自主进化”的能力，正是AI Agent时代的核心特征。

除了千问3.7-Max，阿里云峰会还带来了两个重磅产品：

阿里还发布了基于M890的128卡超节点服务器，128张AI芯片组成一台计算机，通信时延低至百纳秒级。

这是阿里云17年来首次在官网之外推出全新产品官网。千问云的首页没有导航列表，只有一行prompt指令——因为它的主要用户不是人，而是AI Agent。

同一时间，谷歌I/O 2026也在持续发力。继Day 1发布Gemini 3.5 Flash和Gemini Omni之后，Day 2的焦点是Gemini Spark——一个能24小时不间断工作的AI助手。

Gemini Spark将于下周首先向美国Google AI Ultra订阅用户开放，Ultra套餐价格从每月250美元降至200美元。

三件大事，对普通人意味着什么？

5月20日这天，中国和美国两家科技巨头同时把矛头指向了同一个方向——AI Agent。

千问3.7-Max证明了中国大模型已经具备自主完成复杂任务的能力；Gemini Spark则展示了AI助手从”被动回答”走向”主动执行”的未来。

对普通人来说，这不是遥远的技术竞赛，而是实实在在的工具升级。当AI可以自己干活的时候，你要做的不再是学会操作AI，而是学会给AI布置任务。

这，就是AI Agent时代的新技能。