欧稽里得
命题 XIV — 大语言模型

Google I/O 2026 一文看尽:Pichai 在 Mountain View 摔出来的 24 张牌

2026 年 5 月 19 日,Shoreline Amphitheatre 的两小时 keynote 结束。

今年的 I/O 没有炫万亿参数,没有比谁更聪明。Pichai 只在台上反复讲一个词:Agent

模型、芯片、IDE、搜索、邮箱、文档、购物、眼镜——所有产品线都被改造成"代理人能跑的工作台"。这是 Google 把"AI 助手"升级成"AI 员工"的总动员。

我把 Day 1 全程整理成了 13 层,按层级铺给你。看完这一篇,你不会错过任何主要发布。

Sundar Pichai I/O 2026 keynote


开场:先看几个数字,理解 Google 现在的"体量"

在讲具体产品之前,Pichai 抛出来一串数字,是理解今年所有发布的底色。

指标 2026 年最新值 含义
Google 全模型月处理 token 3.2 quadrillion(3.2 × 10¹⁵) 7 倍同比增长
API 每分钟处理 token 190 亿 实时全球流量
月活开发者 超过 850 万 在 Google AI 平台上活跃构建
Gemini App MAU 9 亿 全球月活
Search AI Overviews MAU 25 亿 Search 中 AI 摘要的覆盖人数
AI Mode in Search MAU 10 亿 Search 完整 AI 对话模式
Nano Banana 已生成图片数 超过 500 亿张 自上线累计
SynthID 水印内容 超过 1000 亿 图像+视频累计
企业客户单月处理 token > 1 万亿的客户 超过 375 家 Google Cloud 企业用量
年度 Capex(资本支出) $1800–1900 亿 比 2022 年的 $310 亿涨了 6 倍

最后那一项才是真正的炸点:Google 一年砸 $1900 亿建数据中心和芯片,相当于一年盖一个台积电+三星的总和。这是把整个公司压上去做 Agent 基础设施的姿态。

keynote 现场博文页


第一层 · 模型:3.5 Flash + 3.5 Pro + Omni Flash + Gemma 4

Day 1 一口气放了四个模型,分别打四个生态位。

Gemini 3.5 Flash — 今天就能用的"主力机"

TechCrunch 对 Gemini 3.5 Flash 的拆解 TechCrunch:“Google bets its next AI wave on agents, not chatbots.” Gemini 3.5 Flash 的定位被业界普遍解读为 agent-first。

  • 当天可用:Gemini App、Search AI Mode、Gemini API、AI Studio 全部默认切换
  • 综合能力反超上一代 3.1 Pro(Google 官方表述),编码与 agent 类基准提升最大
  • Google 官方口径:输出速度约为同档前沿模型的 4 倍,价格不到对手一半

Artificial Analysis 对 Gemini 3.5 Flash 的独立评估 Artificial Analysis 独立评估:Intelligence Index 55 分,排名第五。MMMU-Pro 84% 是评测史上最高分。

第三方独立评测 Artificial Analysis 给出的关键数字:智能指数 55 分,排名 #5;MMMU-Pro 多模态拿到 84%——是该评测有史以来最高;输出速度 280+ tok/s,比上代 Gemini 3 Flash 快约 70%。

关于这颗模型的完整拆解、benchmark、定价场景,我已经另写了一篇深度解析。

Gemini 3.5 Pro — 下个月发布,留给推理党

Pichai 现场确认:3.5 Pro 还在内测,6 月放出。定位是"极限推理",给最复杂的多步任务用。Flash 主要拼"够聪明 + 极快极便宜",Pro 拼"上限"。

Gemini Omni Flash — 多模态生成的"任何输入到任何输出"

Gemini Omni 官方页面 “Introducing Gemini Omni.” Google 把它定义为"can create anything from any input"——视频是起点,图像和文本随后。

这是 Day 1 在创作工具上最大的炸点。

  • 输入:图片 / 音频 / 视频 / 文本,任意组合
  • 输出:起步是视频,后续会上图像和文本
  • 关键能力:不是简单拼贴,是跨模态推理——理解物理、文化、历史,再渲染出有连贯叙事的视频
  • 自然语言迭代:可以一句话改一句话调,保持人物/场景/光照连续
  • 时长:每次最长 10 秒(Google 说这是产品决策,不是技术上限——因为绝大多数用户先做的就是社媒短视频)
  • 今天起:Gemini App、Google Flow、YouTube Shorts、YouTube Create 全平台铺开
  • API:未来几周向开发者和企业开放

TechCrunch 对 Omni 的报道 TechCrunch 现场报道:Gemini Omni “turns images, audio, and text into video — and that’s just the start.”

Gemma 4 — 开源权重续命

开发者主题演讲里顺手发了 Gemma 4 —— Google 的开源权重模型最新版,进入了官方的 Android Bench 排行榜。给本地部署/微调党的福利。


第二层 · 基础设施:第八代 TPU 的双胞胎

TPU 8 双芯片公告 “Two chips for the agentic era.” 第八代 TPU 拆成训练 + 推理两个 SKU。

Google 终于把第八代 TPU 拆成两颗芯片,对应训练和推理两种工作负载:

型号 用途 卖点
TPU 8t 训练(training) 单芯片算力是上一代的近 3 倍,scale-up 带宽更大,可在百万颗 TPU规模上横向训练
TPU 8i 推理(inference) 内存带宽更大,专为延迟敏感的 agent 间高频调用优化

两颗芯片都给到 每瓦性能提升约 2 倍。年内向 Google Cloud 客户全量铺开,加入 AI Hypercomputer 软硬件栈。

TPU 8 详情

为什么要拆?Pichai 给的逻辑很简单:agent 时代 inference 量级会爆炸——一个用户的一次请求,背后是几十个 agent 互相调用、互相推理。再用一颗通用 TPU 服务所有工作负载,已经撑不住了。


第三层 · 开发者平台:Antigravity 2.0 + Managed Agents + 一票 Studio 升级

开发者主题演讲汇总 I/O 2026 开发者主题演讲博文。一整页全是 agent 工具链。

Antigravity 2.0 + CLI + SDK

Gemini CLI 被彻底废掉——继任者 Antigravity 2.0 是一整套桌面 + 命令行 + SDK 的 Agent 编排平台。今天全球免费上线,6 月 18 日 Gemini CLI 停服

口号:从"AI 助手"升级到"AI Harness"(操作系统)。多 agent 并行、动态子任务、跨平台终端沙箱、凭证脱敏、Git policy 全套都内置。

这块的完整拆解我已另写了一篇深度文。

Managed Agents — 一行 API 调出云端 agent

通过 Gemini API 单次调用,就能在 Google Cloud 上自动配置一个带远程沙箱的完整 agent,零基础设施配置。这是 Gemini Spark 后端架构的基础。

AI Studio 大升级

  • 原生 Kotlin 支持:直接在 AI Studio 里写 Android App
  • 一键 Cloud Run 部署:项目可直接接 Firebase
  • 导出到 Antigravity:在 AI Studio 起的项目能无缝接到 Antigravity 工作流里

Android 开发者套件

  • Android CLI:稳定版发布,让 agent 直接调 Android Studio 全能力
  • Android Skills:复杂迁移最佳实践(Jetpack Compose / Navigation 3)开源
  • Android Bench:专给 Android 开发任务排名的 LLM leaderboard
  • Migration Agent:把 React Native、Web 框架、iOS 代码转成原生 Kotlin

Web 开发者套件

  • WebMCP:把 MCP 协议带到开放 Web,让 agent 在浏览器里跑——Chrome 149 起 origin trial
  • Chrome DevTools for Agents:agent 写完代码可以实时验证 / 调试 / 优化
  • HTML-in-Canvas:可以做沉浸式 3D 体验同时保留无障碍能力

第四层 · 个人 AI 应用:Gemini App 变成"代理人"

9to5Google 报道 Gemini App 重设计 9to5Google 标题里的关键词全堆出来了:Neural Expressive 重设计、3.5 Flash、24/7 Spark agent、Daily Brief——这是 Gemini App 今年最大一次升级。

Gemini Spark — 24/7 云端个人代理

这是消费级 agent 的"主角"。不需要你电脑开着,跑在 Google Cloud 专属虚拟机上,通过 MCP 协议接入 Gmail / Docs / Calendar / Tasks 以及第三方应用。

  • 本周向 trusted tester 开放
  • 下周向美国区 Google AI Ultra($100 和 $200 两档)订阅者开放 Beta
  • 今夏:上 Chrome,变成"agentic browser"

Spark 的详细体验、AP2 协议、与 ChatGPT Operator 的对比我另写了一篇深度文。

Daily Brief — 每日通报

把 Gmail、Calendar、Tasks 拢起来出一份个性化早报,告诉你今天最该处理什么,并直接建议下一步。从今天起向美国区 AI Plus / Pro / Ultra 全档订阅者开放。

Gemini Live — 内联对话模式

不用切到全屏,对话直接在卡片里展开。配合 Gmail Live / Docs Live,Google 在所有产品里推"嘴对话"这种交互。

Neural Expressive — Gemini App 视觉重塑

Gemini App 进入 agentic 时代 “The Gemini app becomes more agentic, delivering proactive, 24/7 help.” Google 在 UI 上给它加了流体动效、高饱和度配色、haptics 和新的胶囊形 prompt box。


第五层 · 搜索:Information Agents 与 Generative UI

Search 在 I/O 2026 的更新 Search I/O 2026 更新博文。10 亿 MAU 的 AI Mode 这次后端切到 3.5 Flash。

Search 是 Google 现金牛,它怎么改造直接说明 Google 的态度。

Information Agents — 帮你"盯着网"的后台代理

24 小时不间断扫博客、新闻、社交、实时金融体育数据,只盯你定义的那个问题——一旦相关信息变了,主动给你推送综合总结,并提供后续行动入口。

今夏先给 AI Pro / Ultra 订阅者 上。

Generative UI — Search 不再只返回链接

这是结构性变化:Search 直接调用 Antigravity 和 Gemini 3.5 Flash 的 agentic 编码能力,临时画一个 mini-app 给你——表格、图表、交互可视化、模拟器都能现做现卖。

Search 的生成式 UI 示例 Search 可以临时"渲染"自定义 dashboard 与交互组件。今夏向所有人免费开放。

Custom Dashboards — Search 里的"小应用"

针对持续追踪的任务(健身、投资组合、项目状态),Search 可以建一个可持续返回、可累积进度的自定义 dashboard。先给 AI Pro / Ultra(美国区)。

搜索框本身变得动态——会根据你的意图自动展开 / 联想 / 推荐

AI Mode 升级为 3.5 Flash 驱动

10 亿 MAU 的 AI Mode 这次后端切换到了 Gemini 3.5 Flash,体感更快、更准。


第六层 · Workspace:所有应用都加上 “Live”

Workspace 更新 “New ways to create and get stuff done in Google Workspace.” Docs / Gmail / Keep 全部上 Live 语音流。

Docs Live & Gmail Live & Keep Live

  • Docs Live:用嘴写文档——你随便 brain dump,它整理成像样的初稿
  • Gmail Live:用语音搜邮件,AI 综合汇报
  • Keep Live:把零散语音笔记整理成结构化内容

今夏向订阅者开放

Google Pics — 用 Nano Banana 的图像创作工具

Workspace 新加一个图像创作 + 设计应用,后端用 Nano Banana 模型。trusted tester 现已开放,今夏向 AI Pro / Ultra 订阅者放出。

AI Inbox

针对 Gmail 智能收件箱的升级,向 AI Plus / Pro 档延伸。


第七层 · YouTube:Ask YouTube + Omni 进 Shorts

Ask YouTube

把 Gemini AI Search 引入 YouTube——你可以问复杂问题,YouTube 返回结构化、可交互的回答,引用具体视频和时间点。今夏在美国全量铺开。

YouTube Shorts × Gemini Omni

Omni Flash 直接进 Shorts Remix 和 Create App,对 YouTube 用户免费。Google 这一刀直接砍向 TikTok 的视频创作工作流。


第八层 · 购物:Universal Cart + 两条新协议

Universal Cart Google Shopping 推出 Universal Cart 和 agentic 商业协议。

Universal Cart — 跨平台购物车

不管你在 Search 里搜、在 Gemini 里聊、在 YouTube 上看、在 Gmail 里收到促销,所有"想买"的东西汇总到一个购物车里

它会自动:

  • 找折扣 / 价格历史 / 缺货补货提醒
  • 检查兼容性(比如 PC 配件、电池、镜头)
  • 整合支付积分和忠诚度信息

今夏 Search + Gemini App(美国区)先上,YouTube / Gmail 随后。

UCP + AP2 协议

  • Universal Commerce Protocol (UCP):Google 提的电商互操作标准
  • Agent Payments Protocol (AP2):用加密签名的"Mandate"管理 agent 消费——给 AI 一个预算,让它在范围内自主下单,每笔有防篡改审计

AP2 首先集成进 Gemini Spark。Google 在这里悄悄地把"agent 经济"的底层标准也铺上了。


第九层 · Android:Gemini Intelligence + Halo

Android Gemini Intelligence “A smarter, more proactive Android with Gemini Intelligence.” Android 的定位从"操作系统"变成"intelligence system"。

Gemini Intelligence — Android 进入"智能系统"

定位变了:Android 不再只是操作系统,而是**“intelligence system”**。先从 Galaxy S26 和 Pixel 10 起步,今夏开始铺开,年内扩到手表、汽车、眼镜、笔电。

能力包:

  • 多步任务自动化:跨 app 一条龙——叫车 / 点单 / 找邮件附件→建购物车
  • 屏幕和图像即上下文:长按电源键,AI 把屏幕内容变成可执行任务
  • Rambler:把你嘴里碎碎念的语音消息润色成正式表达
  • Custom widgets:用自然语言画自己的桌面小组件

Android Halo — 状态栏多了一只"光环"

9to5Google 报道 Android Halo 9to5Google: “Google teases mysterious ‘Android Halo’ at I/O, coming ’later this year’.” 状态栏左上角会出现一颗发光圆环—— Gemini sparkle 的形态。

这是 Android 上专门给 agent 设计的新 UI 空间:屏幕顶部出现一条 halo(光环),实时显示 agent(比如 Spark)正在做什么、进度多少。年内推出。

Android Authority 对 Halo 的拆解 Android Authority 给出的解读:“Google’s new way to keep AI agents from feeling sneaky.” 这个 UI 实际上是 agent 的"透明度通道"——让你知道 AI 在背后替你做了什么。

理解 Halo 最核心的一点:当 Spark 在后台 24/7 帮你订外卖、回邮件、扫论文的时候,你需要一个时刻能看见它在做什么的入口。Halo 就是 Google 给 Android agent 时代准备的"任务栏 + 通知中心"。

其他 Android 改进

  • Gemini-powered Chrome on Android 工具
  • 反诈骗保护升级
  • Pause Point —— 防 doomscroll,让你刷一会儿就主动暂停
  • 新 3D emoji
  • Android Auto + Google Maps 3D 视图升级、车道引导更准
  • AirDrop 兼容:扩展到更多设备,新增云端 QR 码文件传输(跨 iPhone)

第十层 · 硬件:Android XR 智能眼镜

Android Authority 对 Android XR 眼镜的现场报道 Android Authority 现场报道:Samsung × Google × Gentle Monster × Warby Parker 四方合作的智能眼镜首发亮相。

Samsung × Gentle Monster × Warby Parker

智能眼镜终于不只是"概念片"——Google 和 Samsung + Qualcomm 联手,请来Gentle Monster(设计感)和 Warby Parker(大众路线)做时尚合作。

智能眼镜实拍 Gentle Monster 走的是"潜水镜"既视感的厚框前卫风,Warby Parker 是更接近日常黑框眼镜的低调款。

两个形态:

  • Audio glasses:今年秋天先发——耳边耳语式提示,Gemini 语音助手
  • Display glasses:第二阶段——在视野里实时叠加信息

Google 官方智能眼镜公告 Google 官方公告:“Intelligent eyewear with Gemini is coming this fall.”

核心能力:

  • 实时翻译(语音 + 文字标牌)
  • 导航 / 通知摘要 / 第一人称拍摄
  • 同时兼容 Android 手机和 iPhone(这一点意外但关键,Google 不打算把眼镜限定在自家手机生态)

售价和具体发售日 Google 这次没说。秋季在美国市场首发。


第十一层 · 科学:Gemini for Science

给科研人员的专用 agent

整合 30+ 主流生命科学数据库和工具,可以做文献阅读、跨数据库交叉验证、实验设计辅助。在 Google Labs 和 GitHub 同时上线。

定位类似一个"科研版 Cursor"——Google 想抢临床和生物医药这块的 agent 工作流。


第十二层 · 可信度:SynthID 进入主战场

SynthID + C2PA Content Credentials 全产品铺开

  • SynthID 检测扩展到 Search 和 Chrome——你浏览网页时可以看到内容是不是 AI 生成的
  • 加入 C2PA Content Credentials 标准,验证原始 vs 改动过的内容
  • 新合作方:OpenAI / Kakao / Eleven Labs 加入水印体系

Google 的潜台词很清楚——AI 内容真假难辨这个事,平台自己要担起来。这是给监管和广告主的定心丸。


第十三层 · 钱:定价结构大改

Google AI 订阅更新 “Introducing a $100 AI Ultra plan.” 这次定价改革影响所有付费用户。

这是非常实际的变化,影响每个付费用户。

档位 旧价 新价 关键差异
AI Free $0 $0 多模型,限额
AI Plus $7.99 $7.99 2x 用量,200GB
AI Pro $19.99 $19.99 4x 用量,Pro 模型
AI Ultra(入门档) $100/月(新增) 5x Pro 的用量上限,Spark + Antigravity 优先,20TB 存储,YouTube Premium
AI Ultra(旗舰档) $250 $200(降价) 20x Pro 的用量上限,完全相同的功能

定价博文细节 Google One 副总裁 Shimrit Ben-Yair 亲自发的官方博文里写着:旗舰档 $250 → $200,“the exact same capabilities … now at a lower cost.”

Compute-Used 计费模型

不再按"每天 N 次请求"计费,改成按算力消耗——一个简单问答和一次百万 token 重构耗的不是一个数量级。配额每 5 小时刷新,用完不会断服,会自动降级模型继续工作。

$250 → $200,无功能差别

引用官方原话:“the exact same capabilities — including a 20X higher usage limit in the Gemini app and Google Antigravity than our Pro plan — now at a lower cost.”

翻译:Google 在主动让利。$50/月 一年下来就是 $600,已经是认真的让步。背后逻辑大概是:要把 Spark / Antigravity / Omni 这些产品的用户基数做起来,需要先把订阅门槛压下去。


友媒怎么看:业界普遍判断

Tom’s Guide 现场直播 Tom’s Guide 的现场直播总结:Gemini Spark 与智能眼镜是今年最受关注的两件事。

Tom’s Guide 详细汇总

9to5Google 全清单 9to5Google 的 “Everything Google announced at I/O 2026” 是目前最全的第三方汇总之一,几乎所有发布都点到了。

业界对今年 I/O 的几乎一致评价:这不是模型炫技的一年,是 Google 整个生态调头的一年

  • TechCrunch 的标题已经把态度写明了:“Google bets its next AI wave on agents, not chatbots.”
  • 9to5Google 的总结侧重生态:Gemini App 大重构、Android Halo、智能眼镜——三件事都指向同一件事,“AI 在后台 24/7 跑”
  • Tom’s Guide 重点关注消费体验,把 Spark 和智能眼镜列为头条。
  • Android Authority 对 Halo 的判断很犀利:“Google’s new way to keep AI agents from feeling sneaky.” 这一句话点穿了 agent 时代的核心矛盾——你不希望 AI 在后台偷偷做事,所以需要一只看得见的"眼睛"。

收束:从"AI 工具"到"AI 操作系统"

如果给 I/O 2026 Day 1 做一个 elevator pitch,可以这么概括:

Google 不再卖"更聪明的助手",开始卖"能干活的员工"。

  • 模型层(Flash / Omni / Gemma 4)把"算"的能力做到便宜又快
  • 基础设施层(TPU 8t/8i)把"跑"的成本做到能扛 agent 经济的体量
  • 开发者层(Antigravity / Managed Agents / AI Studio)把"管"的工具做到能编排多 agent
  • 应用层(Spark / Daily Brief / Universal Cart / Information Agents)把"用"的体验做到无感后台
  • 标准层(AP2 / UCP / WebMCP / SynthID)把"信"的协议也铺上了

每一层都为同一件事服务——让 agent 在真实世界里干活:买东西、发邮件、写代码、做研究、订咖啡、画视频、读论文。

OpenAI 走的是"一个超级模型 + 一个对话框"路线,Anthropic 走的是"深度推理 + 长上下文"路线。Google 这次摊牌了:它要做"AI 时代的 Windows + iOS + Android"——一个端到端的代理人操作系统

野心很大。落不落得了,看接下来这一年的产品质量、生态合作、和定价稳不稳。但至少今天,Google 把全部筹码都推到桌中央了


附录 · I/O 2026 Day 1 完整发布清单

按层级整理,方便保存对照。所有日期均为 2026 年。

模型

  1. Gemini 3.5 Flash —— 今日上线
  2. Gemini 3.5 Pro —— 6 月发布
  3. Gemini Omni Flash —— 今日上线(视频生成)
  4. Gemma 4 —— 开源权重发布

基础设施

  1. TPU 8t(训练)—— 年内 GA
  2. TPU 8i(推理)—— 年内 GA

开发者平台

  1. Antigravity 2.0(桌面 + CLI + SDK)—— 全球免费上线
  2. Gemini CLI 停服 —— 6 月 18 日
  3. Managed Agents(Gemini API)—— 立即可用
  4. AI Studio 升级(Kotlin / Cloud Run / Antigravity 导出)
  5. Android CLI —— 稳定版
  6. Android Skills —— 开源
  7. Android Bench —— LLM 排行榜
  8. Migration Agent —— RN/iOS → Kotlin
  9. WebMCP —— Chrome 149 origin trial
  10. Chrome DevTools for Agents
  11. HTML-in-Canvas —— origin trial

应用:Gemini App

  1. Gemini Spark —— 下周 Beta(AI Ultra 美国区)
  2. Daily Brief —— 今日上线(AI Plus/Pro/Ultra)
  3. Gemini Live —— 内联对话
  4. Neural Expressive UI —— 全新视觉

搜索

  1. Information Agents —— 今夏(AI Pro/Ultra)
  2. Generative UI —— 今夏免费
  3. Custom Dashboards —— 今夏(AI Pro/Ultra)
  4. Intelligent Search Box —— 滚动上线
  5. AI Mode 切换到 3.5 Flash —— 今日

Workspace

  1. Docs Live / Gmail Live / Keep Live —— 今夏
  2. Google Pics(Nano Banana 驱动)—— 今夏
  3. AI Inbox 扩展 —— 今夏

YouTube

  1. Ask YouTube —— 今夏(美国区)
  2. Gemini Omni 进 Shorts / Create —— 本周

购物

  1. Universal Cart —— 今夏(美国 Search + Gemini)
  2. Universal Commerce Protocol(UCP)—— 协议发布
  3. Agent Payments Protocol(AP2)—— 集成 Spark

Android & 硬件

  1. Gemini Intelligence —— 今夏(Galaxy S26 + Pixel 10 起)
  2. Android Halo —— 年内
  3. Rambler / Custom Widgets —— 滚动上线
  4. Android XR 智能眼镜(Samsung + Qualcomm + Gentle Monster + Warby Parker)—— 今秋
  5. Pause Point / 3D Emoji / Maps 3D / 跨 iPhone 文件传输 —— Android 17

科学

  1. Gemini for Science —— Labs + GitHub 上线

可信度

  1. SynthID 扩展到 Search 和 Chrome
  2. C2PA Content Credentials 集成
  3. OpenAI / Kakao / Eleven Labs 加入水印体系

订阅与定价

  1. AI Ultra $100 新档(5x Pro)—— 今日
  2. AI Ultra $200 降价(从 $250,20x Pro)—— 今日
  3. Compute-Used 计费模型 —— 5 小时刷新,超额降级

I/O 2026 的牌算是打完了。剩下的,看 Google 在接下来 12 个月,能不能让这套 agent 操作系统真正跑起来。


主要来源

本文引用了大量 Google 官方页面与友媒报道,涉及来源包括:

  • 🎤 Sundar Pichai Keynote 文字稿与 Google AI / Search / Workspace / Android 各官方博客
  • 🚀 Antigravity 官网 · 💎 Gemini App 与订阅页 · 🧪 AI for Developers · 🧠 Google DeepMind
  • 📊 Artificial Analysis · 🏆 Arena Leaderboard 等第三方评测
  • 📰 9to5Google · TechCrunch · Tom’s Guide · Android Authority · The Decoder · VentureBeat · SiliconAngle