
来源:AI寒武纪
距离上一届I/O又过了一年。
Google CEO在开场就定了基调:过去这一年,AI行业进入了新阶段,人们不再只关心技术本身,而是想看到AI真正为日常产品带来价值。Google的回答,是今天这场发布会。

token数量:从480万亿到3千万亿
衡量AI采用规模,token是一个直观的指标。
两年前,Google旗下各产品每月处理的token总量是9.7万亿。去年I/O时,这个数字增长到约480万亿。今年,直接跳到每月超过3.2千万亿(quadrillion),增长了7倍。

开发者和企业侧的数据同样亮眼:
每月使用Google模型构建应用的开发者超过850万
模型API目前每分钟处理约190亿token
过去12个月,超过375家Google Cloud客户各自处理了超过1万亿token
产品规模:13款产品用户破十亿
Google目前有13款产品月活用户超过10亿,其中5款超过30亿。
Search依然是覆盖范围最广的AI产品入口。AI Overviews月活已超过25亿。AI Mode作为Search有史以来最大的升级,上线仅一年月活就突破10亿,人们对它的使用方式也在变化,从单条查询逐渐演变成持续对话。
Gemini app去年I/O时月活4亿,今年已超过9亿,翻了一倍多,日请求量增长超过7倍。其中Nano Banana图像生成模型已累计生成超过500亿张图片。
对话式AI进入更多产品
Ask YouTube
YouTube上有大量视频,但找到真正相关的内容并不容易。Ask YouTube重新设计了这一体验,不只是展示匹配的视频,还会直接跳到视频中最相关的片段。目前正在开始测试,今年夏天将在美国全面推出。
Docs Live
Google Docs新增语音功能Docs Live。以前用Gemini写文档需要输入明确的指令,现在只要对着麦克风把想法说出来,Gemini会自动整理成文档。未来还将支持直接用声音新建和编辑文档。Docs Live今年夏天向订阅用户推出,同期Gmail和Keep也将加入语音功能。
Ask Maps
Maps迎来十年来最大升级,其中包括Ask Maps功能,支持更复杂、更长的问题。
基础设施:资本支出从310亿到1800亿美元
支撑这些产品规模运转,需要大规模基础设施投入。
2022年,Google每年的资本支出是310亿美元。今年预计达到约1800亿至1900亿美元,大约是当年的6倍。
芯片层面,Google在Cloud Next上发布了第八代TPU,首次采用双芯片策略,训练和推理各有专属架构:
TPU 8t用于大规模预训练,原始算力约为上一代的3倍。结合JAX和Pathways,训练不再受限于单个数据中心,可以跨多个站点分布式训练,全球可调用超过100万块TPU,构成全球最大训练集群。模型训练时间从数月缩短到数周。
TPU 8i专为推理设计,在速度上做了全面优化。两款芯片的能效均比上一代提升约2倍。

新模型:Gemini Omni与Gemini 3.5 Flash
Gemini Omni

AI正在从预测文字转向模拟现实。Gemini Omni是Google新发布的多模态世界模型,可以接受任意模态的输入,生成任意模态的输出。首发版本以视频输出为主,后续会支持图像和文字。Gemini Omni Flash今天起可以在Gemini app、Google Flow和YouTube Shorts上体验,开发者和企业客户也将在未来几周通过API获得访问权限。

1)用自然语言编辑视频
Omni支持通过对话逐步编辑视频,每一条指令都建立在上一条的基础上,角色保持一致,物理规律成立,场景前后连贯。
2)物理理解与世界知识
Omni对重力、动能、流体动力学等物理规律有更准确的直觉理解,生成的场景物理表现更真实。同时,它还能调用Gemini的历史、科学和文化背景知识,把语言、图像和含义连接起来,而不只是模式匹配。
3)任意输入组合
Omni支持把图片、文字、视频、音频同时作为参考输入,生成统一风格的输出。
4)数字Avatar
用户可以用Omni创建自己的数字Avatar,生成看起来和听起来都像自己的视频。在修改视频中的音频和语音方面,Google表示还在测试
不过有网友初步测试发现,omini的视频生成很拉胯,和seedance2.0差的比较远
Gemini 3.5 Flash
Google今天推出Gemini 3.5 Flash,定位为将前沿智能与行动能力相结合的新一代模型。
与3.1 Pro相比,3.5 Flash在多项基准测试上领先,具体包括:Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和MCP Atlas(83.6%),在多模态理解上CharXiv Reasoning达到84.2%。其中GDPVal专门衡量现实世界中具有经济价值的任务,进步尤为明显。速度方面,输出token每秒是其他前沿模型的4倍

3.5 Flash配合Antigravity可以调度多个子Agent协同工作,处理规模化的复杂任务
前端生成能力依旧非常能打,在多模态基础上,3.5 Flash还能生成更丰富的交互式网页UI和图形,比如直接在AI Studio中为一篇研究论文生成交互式动画。
价格方面,3.5 Flash的成本不到同等前沿模型的一半。Google给出了一个估算:头部企业每天处理约1万亿token,如果将80%的工作负载从其他前沿模型切换到3.5 Flash,每年可以节省超过10亿美元。
Gemini 3.5 Flash今天起对所有用户和API开放。Gemini 3.5 Pro目前在Google内部使用,下个月推出。
Google内部数据显示,借助Antigravity平台和3.5 Flash,AI开发工具的token处理量从3月份的每天5000亿,已经翻倍增长至如今每天超过3万亿。
Antigravity 2.0:Agent开发平台
Antigravity原本是一个AI编程环境,现在正在扩展为一个完整的自主AI Agent开发和管理平台。
Antigravity 2.0是一个新的独立桌面应用,作为Agent交互的中心,用户可以在其中协调各类Agent处理不同任务。在速度上,这个版本使用了专门优化的Flash版本,比其他前沿模型快12倍。Antigravity 2.0 和 Codex 长的简直一模一样,😂
Antigravity用户今天起可以开始体验。详细内容见官方介绍:
https://deepmind.google/technologies/antigravity/
Gemini Spark:24小时运行的个人AI Agent
Gemini app即将推出个人AI Agent——Gemini Spark,在用户授权下代替用户在数字世界中采取行动。
几个关键特点:
• 运行在Google Cloud专用虚拟机上,7×24小时持续运行,不需要保持电脑开着
• 由Gemini 3.5和Antigravity驱动,可以在后台轻松处理长周期任务
• 从Google自有工具开始整合,未来几周通过MCP接入第三方工具
• 支持在Gemini app中交互,未来也可以通过邮件和即时通讯使用
• 在Android上,可以通过新UI空间Android Halo查看Agent的实时进度,今年晚些时候上线
• 今年夏天晚些时候,Spark将直接在Chrome中运行,成为跨网页的Agent浏览器
本周起Spark向受信测试用户开放,下周Beta版向美国Google AI Ultra订阅用户推出。
Search进入Agent时代
Search也在向Agent方向进化。
信息Agent:用户可以设置个性化AI Agent在后台持续运行,在合适的时机主动找到所需信息并协助采取行动。今年夏天起向Google AI Pro和Ultra订阅用户推出。
生成式UI:结合Gemini 3.5 Flash和Antigravity,Search将为每个问题动态生成定制化界面,包括个性化布局和交互式视觉内容。今年夏天向所有用户免费开放。
持久化自定义看板:对于需要持续追踪的长期任务,Search可以为用户构建专属看板或追踪工具,类似为特定任务定制的迷你应用。未来几个月起向美国Google AI Pro和Ultra订阅用户开放。
其他发布内容
Daily Brief:Gemini app即将推出的开箱即用Agent,整合收件箱、日历和任务,生成个性化的每日摘要,不只是汇总信息,还会做优先级排序、整理和下一步建议,以便于快速浏览的形式呈现。
Google Flow:今天向所有用户推出新Agent,可以在用户参与和控制下规划并处理复杂任务。支持在Flow中直接vibe code各类创意工具,例如视频特效设计、手绘动画或文字叠加工具。
Google Pics:基于最新Nano Banana模型的AI图像创建和编辑工具。它将图片中每个元素视为独立对象而非平面图像,支持对特定细节进行精确创建、替换和调整。目前向受信测试用户开放,今年夏天晚些时候向Workspace中的Google AI Pro和Ultra订阅用户推出。
智能眼镜:去年初次亮相的AI眼镜产品有了更多细节,分为音频眼镜(耳机形态,语音提示)和显示眼镜(可显示信息)两种,均支持免提使用Gemini。音频眼镜今年秋天率先上市。
Gemini for Science:面向科学研究的AI工具集,整合了Gemini的深度推理和研究能力、Deep Think和Deep Research,并新增了可以将Antigravity等Agent平台连接到超过30个主要生命科学数据库和工具的Science Skills。用户可以在Google Labs申请试用Gemini for Science实验功能,Science Skills今天起在Github和Antigravity中直接可用。

从TPU 8i到Gemini 3.5,再到Antigravity和Spark,Google在这届I/O上所呈现的,是一套从芯片到应用全面朝Agent方向演进的完整体系。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。