5月20日,AI圈两件大事同日发生!
5月20日,注定是AI历史上又一个值得记住的日子——
一边是阿里云峰会在杭州召开,千问3.7-Max旗舰模型正式亮相,一举拿下”国产第一”;另一边是谷歌I/O 2026第二天的发布,Gemini Spark全天候AI助手正式登场。
两场发布会,一个共同的关键词:AI Agent。
这意味着什么?意味着AI不再只是”你问它答”的聊天机器人,而是能自己干活、自己规划、自己执行的智能助手。普通人用AI的方式,即将彻底改变。
一、千问3.7-Max:国产大模型新王者
阿里巴巴在2026阿里云峰会上正式发布Qwen3.7-Max,这是千问旗舰模型近三个月内的第三次重大迭代(3.5→3.6→3.7),迭代速度创行业纪录。
🏆 核心战绩
| 评测维度 | 表现 | 超越对象 |
|---|---|---|
| 全球大模型盲测总榜 | 国产第一 | Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1 |
| 编程能力(Terminal Bench 2.0) | 69.7分 | DeepSeek-v4-pro-Max、Claude-Opus4.6 |
| 推理能力(GPQA Diamond等) | 领先 | Claude-Opus4.6及所有国产模型 |
| 指令遵循(IFBench) | 79.1分 | 创下新高 |
| 办公自动化(SpreadSheetBench) | 87分 | 顶尖水平 |
🔥 最惊艳的功能:35小时自主完成任务
测试中,Qwen3.7-Max在一个从未见过的硬件平台(平头哥真武M890芯片)上,从零开始独立完成推理内核优化任务:
- ⏱️ 连续工作35小时不中断
- 🔄 完成432次内核评估
- 🛠️ 调用工具1158次
- 🚀 最终实现10倍加速
更关键的是,模型在运行超过30小时后仍能发现有效优化点,甚至主动发起了一次关键的架构重设计。这种”不知疲倦、自主进化”的能力,正是AI Agent时代的核心特征。
二、阿里云峰会三大发布
除了千问3.7-Max,阿里云峰会还带来了两个重磅产品:
1. 平头哥真武M890芯片
| 参数 | 数据 |
|---|---|
| 显存 | 144GB |
| 片间互联带宽 | 800GB/s |
| 性能 | 前代真武810E的3倍 |
| 数据精度 | 原生支持FP32到FP4 |
| 累计出货 | 56万片 |
阿里还发布了基于M890的128卡超节点服务器,128张AI芯片组成一台计算机,通信时延低至百纳秒级。
2. 千问云:为AI Agent而生的全新平台
这是阿里云17年来首次在官网之外推出全新产品官网。千问云的首页没有导航列表,只有一行prompt指令——因为它的主要用户不是人,而是AI Agent。
- 📦 提供150+款主流模型API(千问、GLM、Kimi、DeepSeek等)
- 🔧 将核心能力封装为Skills和CLI工具,Agent可以直接调用
- 🌐 智能体可以解析指令,”学会”平台全部能力并自主使用
三、谷歌Gemini Spark:全天候AI助手来了
同一时间,谷歌I/O 2026也在持续发力。继Day 1发布Gemini 3.5 Flash和Gemini Omni之后,Day 2的焦点是Gemini Spark——一个能24小时不间断工作的AI助手。
Spark核心能力
| 功能 | 说明 |
|---|---|
| 全天候运行 | 运行在Google Cloud虚拟机上,无需电脑在线 |
| 多步骤任务 | 自主规划、跨应用协作 |
| 支持应用 | Gmail、YouTube、Google Docs等 |
| 开放协议 | 后续将支持MCP协议接入第三方应用 |
Gemini Spark将于下周首先向美国Google AI Ultra订阅用户开放,Ultra套餐价格从每月250美元降至200美元。
四、普通人能得到什么?
三件大事,对普通人意味着什么?
🎯 短期可见的变化
| 变化 | 时间 | 影响 |
|---|---|---|
| 千问3.7-Max上线 | 即将 | 国产最强免费模型,百炼平台可体验 |
| 千问云开放 | 已上线 | 150+模型API一键调用,开发者门槛大幅降低 |
| Gemini Spark | 下周(美国) | 24小时AI助手,自动处理邮件、日程等 |
| 真武M890芯片 | 量产中 | 国产AI算力自主,长期降低AI服务成本 |
💡 普通人行动指南
- 立即体验千问3.7-Max:前往 chat.qwen.ai 或百炼平台,免费使用国产最强模型
- 关注千问云:如果你有编程基础,千问云的150+模型API可以大幅降低开发成本
- 等待Spark类产品:国内很快会出现类似的全天候AI助手产品,保持关注
写在最后
5月20日这天,中国和美国两家科技巨头同时把矛头指向了同一个方向——AI Agent。
千问3.7-Max证明了中国大模型已经具备自主完成复杂任务的能力;Gemini Spark则展示了AI助手从”被动回答”走向”主动执行”的未来。
对普通人来说,这不是遥远的技术竞赛,而是实实在在的工具升级。当AI可以自己干活的时候,你要做的不再是学会操作AI,而是学会给AI布置任务。
这,就是AI Agent时代的新技能。