AI资讯

美团密集开源、GPT-5.6发布倒计时、ISC.AI 2026开幕——6月24日AI圈三件大事

AI执行官

6月24日,AI圈又迎来忙碌的一天。美团LongCat团队一口气开源了多项核心技术,GPT-5.6发布进入倒计时,ISC.AI 2026安全大会今天在北京开幕。这篇文章帮你一次看懂。

一、美团LongCat密集开源:数字人、TTS、多模态齐发

美团LongCat团队在最近几天集中开源了多个重磅项目,每一项都值得关注:

1. LongCat-Video-Avatar 1.5:商业级数字人视频模型

这是目前开源的数字人模型中最接近商用水平的版本。五大核心升级:

  • 唇形同步更精准:口型和语音的匹配度大幅提升,不再出现”配音感”
  • 物理合理性提升:人物运动更自然,不会出现脖子扭成奇怪角度的”灵异现象”
  • 长视频稳定性增强:支持长时间连续生成,不会越往后画面越崩
  • 支持多人互动:不再局限于单人播报,可以做出对话场景
  • 推理效率优化:同样的硬件能跑得更快

跟你有啥关系? 想做数字人直播、虚拟主播、企业宣传视频的,成本将大幅降低。不需要花几万块买商用软件了。

2. LongCat-AudioDiT:零样本声音克隆

这个技术很厉害——它抛弃了传统的中间处理步骤,直接在声音的原始波形层面做克隆。结果就是:克隆出来的声音更逼真,几乎听不出机器味。未来有声书、虚拟助手的声音会更自然。

3. LongCat-Next:原生多模态模型

跟其他多模态模型”先看后想”的方式不同,LongCat-Next把视觉和语音当”母语”处理。这就像一个人天生就会看、会听,而不是通过翻译来理解。这个方向如果走通了,AI理解真实世界的能力会跃升一个台阶。

4. 其他开源

还包括WBench(视频交互评测)、LARYBench(机器人动作表征)、General 365(大模型推理评测,最强Gemini 3 Pro仅62.8分)等评测工具,以及AIGC海报生成技术体系。

二、GPT-5.6发布倒计时:最快本周见

根据多方消息,OpenAI的GPT-5.6预计本周内发布。已知信息:

  • 150万token上下文:相当于一次能读完整套《三体》三部曲
  • 3D视觉复刻:能理解和生成3D场景
  • 内置Playwright自动化:可以直接操控浏览器
  • 价格仅为Claude Fable 5的1/3:OpenAI这次打起了价格战
  • 三个版本:mini、标准版、Pro版

部分Pro用户已经在灰度测试中体验到了GPT-5.6,反馈项目耗时从小时级压缩到20-40分钟。如果这个效率能普惠所有用户,AI编程和Agent体验将迎来质的飞跃。

三、ISC.AI 2026今日开幕:AI安全成焦点

第十四届互联网安全大会(ISC.AI 2026)今天在北京国家会议中心开幕,主题是“人对人”向”AI对AI”的安全范式变革。随着AI Agent规模化落地,安全对抗的方式也在发生根本变化。

对普通人来说,这意味着:AI时代的安全威胁不再是”有人黑你的电脑”,而是“AI黑你的AI”——比如你的AI助手可能被另一个AI欺骗、操纵。这个话题未来会越来越重要。

四、其他值得关注的动态

  • 微信AI小微灰度测试中:6月20日起小范围开放,这是微信自2020年视频号以来最大的更新。左上角两个小绿点,背后可能是一整套新系统。
  • Unsloth支持GLM-5.2本地运行:744B参数的顶级模型,通过技术压缩到239GB,高端个人用户已可在本地运行,数据完全私密。
  • OpenMontage开源:全球首款Agent驱动的开源视频制作系统,12条流水线+52个工具+500+智能体技能,让AI编程助手变身完整视频工作室。
  • Headroom爆火:Netflix工程师开源的Token压缩工具,节省60%-95%的AI费用,累计为用户省下70万美元。

总结

今天的关键词是“开源”和”降本”。美团LongCat的开源降低了数字人、声音克隆的技术门槛;Headroom帮AI开发者大幅省钱;GPT-5.6以更低价格杀入市场。普通人使用AI的成本正在肉眼可见地下降,这是真正的红利期。

分享给朋友