命题 XIV — 大语言模型

Google I/O 2026 一文看尽：Pichai 在 Mountain View 摔出来的 24 张牌

2026·05·19约 7,537 字16 MIN

2026 年 5 月 19 日，Shoreline Amphitheatre 的两小时 keynote 结束。

今年的 I/O 没有炫万亿参数，没有比谁更聪明。Pichai 只在台上反复讲一个词：Agent。

模型、芯片、IDE、搜索、邮箱、文档、购物、眼镜——所有产品线都被改造成"代理人能跑的工作台"。这是 Google 把"AI 助手"升级成"AI 员工"的总动员。

我把 Day 1 全程整理成了 13 层，按层级铺给你。看完这一篇，你不会错过任何主要发布。

Sundar Pichai I/O 2026 keynote

开场：先看几个数字，理解 Google 现在的"体量"

在讲具体产品之前，Pichai 抛出来一串数字，是理解今年所有发布的底色。

指标	2026 年最新值	含义
Google 全模型月处理 token	3.2 quadrillion（3.2 × 10¹⁵）	7 倍同比增长
API 每分钟处理 token	190 亿	实时全球流量
月活开发者	超过 850 万	在 Google AI 平台上活跃构建
Gemini App MAU	9 亿	全球月活
Search AI Overviews MAU	25 亿	Search 中 AI 摘要的覆盖人数
AI Mode in Search MAU	10 亿	Search 完整 AI 对话模式
Nano Banana 已生成图片数	超过 500 亿张	自上线累计
SynthID 水印内容	超过 1000 亿	图像+视频累计
企业客户单月处理 token > 1 万亿的客户	超过 375 家	Google Cloud 企业用量
年度 Capex（资本支出）	$1800–1900 亿	比 2022 年的 $310 亿涨了 6 倍

最后那一项才是真正的炸点：Google 一年砸 $1900 亿建数据中心和芯片，相当于一年盖一个台积电+三星的总和。这是把整个公司压上去做 Agent 基础设施的姿态。

keynote 现场博文页

第一层 · 模型：3.5 Flash + 3.5 Pro + Omni Flash + Gemma 4

Day 1 一口气放了四个模型，分别打四个生态位。

Gemini 3.5 Flash — 今天就能用的"主力机"

TechCrunch 对 Gemini 3.5 Flash 的拆解 TechCrunch：“Google bets its next AI wave on agents, not chatbots.” Gemini 3.5 Flash 的定位被业界普遍解读为 agent-first。

当天可用：Gemini App、Search AI Mode、Gemini API、AI Studio 全部默认切换
综合能力反超上一代 3.1 Pro（Google 官方表述），编码与 agent 类基准提升最大
Google 官方口径：输出速度约为同档前沿模型的 4 倍，价格不到对手一半

Artificial Analysis 对 Gemini 3.5 Flash 的独立评估 Artificial Analysis 独立评估：Intelligence Index 55 分，排名第五。MMMU-Pro 84% 是评测史上最高分。

第三方独立评测 Artificial Analysis 给出的关键数字：智能指数 55 分，排名 #5；MMMU-Pro 多模态拿到 84%——是该评测有史以来最高；输出速度 280+ tok/s，比上代 Gemini 3 Flash 快约 70%。

关于这颗模型的完整拆解、benchmark、定价场景，我已经另写了一篇深度解析。

Gemini 3.5 Pro — 下个月发布，留给推理党

Pichai 现场确认：3.5 Pro 还在内测，6 月放出。定位是"极限推理"，给最复杂的多步任务用。Flash 主要拼"够聪明 + 极快极便宜"，Pro 拼"上限"。

Gemini Omni Flash — 多模态生成的"任何输入到任何输出"

Gemini Omni 官方页面 “Introducing Gemini Omni.” Google 把它定义为"can create anything from any input"——视频是起点，图像和文本随后。

这是 Day 1 在创作工具上最大的炸点。

输入：图片 / 音频 / 视频 / 文本，任意组合
输出：起步是视频，后续会上图像和文本
关键能力：不是简单拼贴，是跨模态推理——理解物理、文化、历史，再渲染出有连贯叙事的视频
自然语言迭代：可以一句话改一句话调，保持人物/场景/光照连续
时长：每次最长 10 秒（Google 说这是产品决策，不是技术上限——因为绝大多数用户先做的就是社媒短视频）
今天起：Gemini App、Google Flow、YouTube Shorts、YouTube Create 全平台铺开
API：未来几周向开发者和企业开放

TechCrunch 对 Omni 的报道 TechCrunch 现场报道：Gemini Omni “turns images, audio, and text into video — and that’s just the start.”

Gemma 4 — 开源权重续命

开发者主题演讲里顺手发了 Gemma 4 —— Google 的开源权重模型最新版，进入了官方的 Android Bench 排行榜。给本地部署/微调党的福利。

第二层 · 基础设施：第八代 TPU 的双胞胎

TPU 8 双芯片公告 “Two chips for the agentic era.” 第八代 TPU 拆成训练 + 推理两个 SKU。

Google 终于把第八代 TPU 拆成两颗芯片，对应训练和推理两种工作负载：

型号	用途	卖点
TPU 8t	训练（training）	单芯片算力是上一代的近 3 倍，scale-up 带宽更大，可在百万颗 TPU规模上横向训练
TPU 8i	推理（inference）	内存带宽更大，专为延迟敏感的 agent 间高频调用优化

两颗芯片都给到 每瓦性能提升约 2 倍。年内向 Google Cloud 客户全量铺开，加入 AI Hypercomputer 软硬件栈。

TPU 8 详情

为什么要拆？Pichai 给的逻辑很简单：agent 时代 inference 量级会爆炸——一个用户的一次请求，背后是几十个 agent 互相调用、互相推理。再用一颗通用 TPU 服务所有工作负载，已经撑不住了。

第三层 · 开发者平台：Antigravity 2.0 + Managed Agents + 一票 Studio 升级

开发者主题演讲汇总 I/O 2026 开发者主题演讲博文。一整页全是 agent 工具链。

Antigravity 2.0 + CLI + SDK

Gemini CLI 被彻底废掉——继任者 Antigravity 2.0 是一整套桌面 + 命令行 + SDK 的 Agent 编排平台。今天全球免费上线，6 月 18 日 Gemini CLI 停服。

口号：从"AI 助手"升级到"AI Harness"（操作系统）。多 agent 并行、动态子任务、跨平台终端沙箱、凭证脱敏、Git policy 全套都内置。

这块的完整拆解我已另写了一篇深度文。

Managed Agents — 一行 API 调出云端 agent

通过 Gemini API 单次调用，就能在 Google Cloud 上自动配置一个带远程沙箱的完整 agent，零基础设施配置。这是 Gemini Spark 后端架构的基础。

AI Studio 大升级

原生 Kotlin 支持：直接在 AI Studio 里写 Android App
一键 Cloud Run 部署：项目可直接接 Firebase
导出到 Antigravity：在 AI Studio 起的项目能无缝接到 Antigravity 工作流里

Android 开发者套件

Android CLI：稳定版发布，让 agent 直接调 Android Studio 全能力
Android Skills：复杂迁移最佳实践（Jetpack Compose / Navigation 3）开源
Android Bench：专给 Android 开发任务排名的 LLM leaderboard
Migration Agent：把 React Native、Web 框架、iOS 代码转成原生 Kotlin

Web 开发者套件

WebMCP：把 MCP 协议带到开放 Web，让 agent 在浏览器里跑——Chrome 149 起 origin trial
Chrome DevTools for Agents：agent 写完代码可以实时验证 / 调试 / 优化
HTML-in-Canvas：可以做沉浸式 3D 体验同时保留无障碍能力

第四层 · 个人 AI 应用：Gemini App 变成"代理人"

9to5Google 报道 Gemini App 重设计 9to5Google 标题里的关键词全堆出来了：Neural Expressive 重设计、3.5 Flash、24/7 Spark agent、Daily Brief——这是 Gemini App 今年最大一次升级。

Gemini Spark — 24/7 云端个人代理

这是消费级 agent 的"主角"。不需要你电脑开着，跑在 Google Cloud 专属虚拟机上，通过 MCP 协议接入 Gmail / Docs / Calendar / Tasks 以及第三方应用。

本周向 trusted tester 开放
下周向美国区 Google AI Ultra（$100 和 $200 两档）订阅者开放 Beta
今夏：上 Chrome，变成"agentic browser"

Spark 的详细体验、AP2 协议、与 ChatGPT Operator 的对比我另写了一篇深度文。

Daily Brief — 每日通报

把 Gmail、Calendar、Tasks 拢起来出一份个性化早报，告诉你今天最该处理什么，并直接建议下一步。从今天起向美国区 AI Plus / Pro / Ultra 全档订阅者开放。

Gemini Live — 内联对话模式

不用切到全屏，对话直接在卡片里展开。配合 Gmail Live / Docs Live，Google 在所有产品里推"嘴对话"这种交互。

Neural Expressive — Gemini App 视觉重塑

Gemini App 进入 agentic 时代 “The Gemini app becomes more agentic, delivering proactive, 24/7 help.” Google 在 UI 上给它加了流体动效、高饱和度配色、haptics 和新的胶囊形 prompt box。

第五层 · 搜索：Information Agents 与 Generative UI

Search 在 I/O 2026 的更新 Search I/O 2026 更新博文。10 亿 MAU 的 AI Mode 这次后端切到 3.5 Flash。

Search 是 Google 现金牛，它怎么改造直接说明 Google 的态度。

Information Agents — 帮你"盯着网"的后台代理

24 小时不间断扫博客、新闻、社交、实时金融体育数据，只盯你定义的那个问题——一旦相关信息变了，主动给你推送综合总结，并提供后续行动入口。

今夏先给 AI Pro / Ultra 订阅者 上。

Generative UI — Search 不再只返回链接

这是结构性变化：Search 直接调用 Antigravity 和 Gemini 3.5 Flash 的 agentic 编码能力，临时画一个 mini-app 给你——表格、图表、交互可视化、模拟器都能现做现卖。

Search 的生成式 UI 示例 Search 可以临时"渲染"自定义 dashboard 与交互组件。今夏向所有人免费开放。

Custom Dashboards — Search 里的"小应用"

针对持续追踪的任务（健身、投资组合、项目状态），Search 可以建一个可持续返回、可累积进度的自定义 dashboard。先给 AI Pro / Ultra（美国区）。

搜索框本身变得动态——会根据你的意图自动展开 / 联想 / 推荐。

AI Mode 升级为 3.5 Flash 驱动

10 亿 MAU 的 AI Mode 这次后端切换到了 Gemini 3.5 Flash，体感更快、更准。

第六层 · Workspace：所有应用都加上 “Live”

Workspace 更新 “New ways to create and get stuff done in Google Workspace.” Docs / Gmail / Keep 全部上 Live 语音流。

Docs Live & Gmail Live & Keep Live

Docs Live：用嘴写文档——你随便 brain dump，它整理成像样的初稿
Gmail Live：用语音搜邮件，AI 综合汇报
Keep Live：把零散语音笔记整理成结构化内容

均今夏向订阅者开放。

Google Pics — 用 Nano Banana 的图像创作工具

Workspace 新加一个图像创作 + 设计应用，后端用 Nano Banana 模型。trusted tester 现已开放，今夏向 AI Pro / Ultra 订阅者放出。

AI Inbox

针对 Gmail 智能收件箱的升级，向 AI Plus / Pro 档延伸。

第七层 · YouTube：Ask YouTube + Omni 进 Shorts

Ask YouTube

把 Gemini AI Search 引入 YouTube——你可以问复杂问题，YouTube 返回结构化、可交互的回答，引用具体视频和时间点。今夏在美国全量铺开。

YouTube Shorts × Gemini Omni

Omni Flash 直接进 Shorts Remix 和 Create App，对 YouTube 用户免费。Google 这一刀直接砍向 TikTok 的视频创作工作流。

第八层 · 购物：Universal Cart + 两条新协议

Google Shopping 推出 Universal Cart 和 agentic 商业协议。

Universal Cart — 跨平台购物车

不管你在 Search 里搜、在 Gemini 里聊、在 YouTube 上看、在 Gmail 里收到促销，所有"想买"的东西汇总到一个购物车里。

它会自动：

找折扣 / 价格历史 / 缺货补货提醒
检查兼容性（比如 PC 配件、电池、镜头）
整合支付积分和忠诚度信息

今夏 Search + Gemini App（美国区）先上，YouTube / Gmail 随后。

UCP + AP2 协议

Universal Commerce Protocol (UCP)：Google 提的电商互操作标准
Agent Payments Protocol (AP2)：用加密签名的"Mandate"管理 agent 消费——给 AI 一个预算，让它在范围内自主下单，每笔有防篡改审计

AP2 首先集成进 Gemini Spark。Google 在这里悄悄地把"agent 经济"的底层标准也铺上了。

第九层 · Android：Gemini Intelligence + Halo

Android Gemini Intelligence “A smarter, more proactive Android with Gemini Intelligence.” Android 的定位从"操作系统"变成"intelligence system"。

Gemini Intelligence — Android 进入"智能系统"

定位变了：Android 不再只是操作系统，而是**“intelligence system”**。先从 Galaxy S26 和 Pixel 10 起步，今夏开始铺开，年内扩到手表、汽车、眼镜、笔电。

能力包：

多步任务自动化：跨 app 一条龙——叫车 / 点单 / 找邮件附件→建购物车
屏幕和图像即上下文：长按电源键，AI 把屏幕内容变成可执行任务
Rambler：把你嘴里碎碎念的语音消息润色成正式表达
Custom widgets：用自然语言画自己的桌面小组件

Android Halo — 状态栏多了一只"光环"

9to5Google 报道 Android Halo 9to5Google: “Google teases mysterious ‘Android Halo’ at I/O, coming ’later this year’.” 状态栏左上角会出现一颗发光圆环—— Gemini sparkle 的形态。

这是 Android 上专门给 agent 设计的新 UI 空间：屏幕顶部出现一条 halo（光环），实时显示 agent（比如 Spark）正在做什么、进度多少。年内推出。

Android Authority 对 Halo 的拆解 Android Authority 给出的解读：“Google’s new way to keep AI agents from feeling sneaky.” 这个 UI 实际上是 agent 的"透明度通道"——让你知道 AI 在背后替你做了什么。

理解 Halo 最核心的一点：当 Spark 在后台 24/7 帮你订外卖、回邮件、扫论文的时候，你需要一个时刻能看见它在做什么的入口。Halo 就是 Google 给 Android agent 时代准备的"任务栏 + 通知中心"。

其他 Android 改进

Gemini-powered Chrome on Android 工具
反诈骗保护升级
Pause Point —— 防 doomscroll，让你刷一会儿就主动暂停
新 3D emoji
Android Auto + Google Maps 3D 视图升级、车道引导更准
AirDrop 兼容：扩展到更多设备，新增云端 QR 码文件传输（跨 iPhone）

第十层 · 硬件：Android XR 智能眼镜

Android Authority 对 Android XR 眼镜的现场报道 Android Authority 现场报道：Samsung × Google × Gentle Monster × Warby Parker 四方合作的智能眼镜首发亮相。

Samsung × Gentle Monster × Warby Parker

智能眼镜终于不只是"概念片"——Google 和 Samsung + Qualcomm 联手，请来Gentle Monster（设计感）和 Warby Parker（大众路线）做时尚合作。

智能眼镜实拍 Gentle Monster 走的是"潜水镜"既视感的厚框前卫风，Warby Parker 是更接近日常黑框眼镜的低调款。

两个形态：

Audio glasses：今年秋天先发——耳边耳语式提示，Gemini 语音助手
Display glasses：第二阶段——在视野里实时叠加信息

Google 官方智能眼镜公告 Google 官方公告：“Intelligent eyewear with Gemini is coming this fall.”

核心能力：

实时翻译（语音 + 文字标牌）
导航 / 通知摘要 / 第一人称拍摄
同时兼容 Android 手机和 iPhone（这一点意外但关键，Google 不打算把眼镜限定在自家手机生态）

售价和具体发售日 Google 这次没说。秋季在美国市场首发。

第十一层 · 科学：Gemini for Science

给科研人员的专用 agent

整合 30+ 主流生命科学数据库和工具，可以做文献阅读、跨数据库交叉验证、实验设计辅助。在 Google Labs 和 GitHub 同时上线。

定位类似一个"科研版 Cursor"——Google 想抢临床和生物医药这块的 agent 工作流。

第十二层 · 可信度：SynthID 进入主战场

SynthID + C2PA Content Credentials 全产品铺开

SynthID 检测扩展到 Search 和 Chrome——你浏览网页时可以看到内容是不是 AI 生成的
加入 C2PA Content Credentials 标准，验证原始 vs 改动过的内容
新合作方：OpenAI / Kakao / Eleven Labs 加入水印体系

Google 的潜台词很清楚——AI 内容真假难辨这个事，平台自己要担起来。这是给监管和广告主的定心丸。

第十三层 · 钱：定价结构大改

Google AI 订阅更新 “Introducing a $100 AI Ultra plan.” 这次定价改革影响所有付费用户。

这是非常实际的变化，影响每个付费用户。

档位	旧价	新价	关键差异
AI Free	$0	$0	多模型，限额
AI Plus	$7.99	$7.99	2x 用量，200GB
AI Pro	$19.99	$19.99	4x 用量，Pro 模型
AI Ultra（入门档）	—	$100/月（新增）	5x Pro 的用量上限，Spark + Antigravity 优先，20TB 存储，YouTube Premium
AI Ultra（旗舰档）	$250	$200（降价）	20x Pro 的用量上限，完全相同的功能

定价博文细节 Google One 副总裁 Shimrit Ben-Yair 亲自发的官方博文里写着：旗舰档 $250 → $200，“the exact same capabilities … now at a lower cost.”

Compute-Used 计费模型

不再按"每天 N 次请求"计费，改成按算力消耗——一个简单问答和一次百万 token 重构耗的不是一个数量级。配额每 5 小时刷新，用完不会断服，会自动降级模型继续工作。

$250 → $200，无功能差别

引用官方原话：“the exact same capabilities — including a 20X higher usage limit in the Gemini app and Google Antigravity than our Pro plan — now at a lower cost.”

翻译：Google 在主动让利。$50/月一年下来就是 $600，已经是认真的让步。背后逻辑大概是：要把 Spark / Antigravity / Omni 这些产品的用户基数做起来，需要先把订阅门槛压下去。

友媒怎么看：业界普遍判断

Tom’s Guide 现场直播 Tom’s Guide 的现场直播总结：Gemini Spark 与智能眼镜是今年最受关注的两件事。

Tom’s Guide 详细汇总

9to5Google 全清单 9to5Google 的 “Everything Google announced at I/O 2026” 是目前最全的第三方汇总之一，几乎所有发布都点到了。

业界对今年 I/O 的几乎一致评价：这不是模型炫技的一年，是 Google 整个生态调头的一年。

TechCrunch 的标题已经把态度写明了：“Google bets its next AI wave on agents, not chatbots.”
9to5Google 的总结侧重生态：Gemini App 大重构、Android Halo、智能眼镜——三件事都指向同一件事，“AI 在后台 24/7 跑”。
Tom’s Guide 重点关注消费体验，把 Spark 和智能眼镜列为头条。
Android Authority 对 Halo 的判断很犀利：“Google’s new way to keep AI agents from feeling sneaky.” 这一句话点穿了 agent 时代的核心矛盾——你不希望 AI 在后台偷偷做事，所以需要一只看得见的"眼睛"。

收束：从"AI 工具"到"AI 操作系统"

如果给 I/O 2026 Day 1 做一个 elevator pitch，可以这么概括：

Google 不再卖"更聪明的助手"，开始卖"能干活的员工"。

模型层（Flash / Omni / Gemma 4）把"算"的能力做到便宜又快
基础设施层（TPU 8t/8i）把"跑"的成本做到能扛 agent 经济的体量
开发者层（Antigravity / Managed Agents / AI Studio）把"管"的工具做到能编排多 agent
应用层（Spark / Daily Brief / Universal Cart / Information Agents）把"用"的体验做到无感后台
标准层（AP2 / UCP / WebMCP / SynthID）把"信"的协议也铺上了

每一层都为同一件事服务——让 agent 在真实世界里干活：买东西、发邮件、写代码、做研究、订咖啡、画视频、读论文。

OpenAI 走的是"一个超级模型 + 一个对话框"路线，Anthropic 走的是"深度推理 + 长上下文"路线。Google 这次摊牌了：它要做"AI 时代的 Windows + iOS + Android"——一个端到端的代理人操作系统。

野心很大。落不落得了，看接下来这一年的产品质量、生态合作、和定价稳不稳。但至少今天，Google 把全部筹码都推到桌中央了。

附录 · I/O 2026 Day 1 完整发布清单

按层级整理，方便保存对照。所有日期均为 2026 年。

模型

Gemini 3.5 Flash —— 今日上线
Gemini 3.5 Pro —— 6 月发布
Gemini Omni Flash —— 今日上线（视频生成）
Gemma 4 —— 开源权重发布

基础设施

TPU 8t（训练）—— 年内 GA
TPU 8i（推理）—— 年内 GA

开发者平台

Antigravity 2.0（桌面 + CLI + SDK）—— 全球免费上线
Gemini CLI 停服 —— 6 月 18 日
Managed Agents（Gemini API）—— 立即可用
AI Studio 升级（Kotlin / Cloud Run / Antigravity 导出）
Android CLI —— 稳定版
Android Skills —— 开源
Android Bench —— LLM 排行榜
Migration Agent —— RN/iOS → Kotlin
WebMCP —— Chrome 149 origin trial
Chrome DevTools for Agents
HTML-in-Canvas —— origin trial

应用：Gemini App

Gemini Spark —— 下周 Beta（AI Ultra 美国区）
Daily Brief —— 今日上线（AI Plus/Pro/Ultra）
Gemini Live —— 内联对话
Neural Expressive UI —— 全新视觉

搜索

Information Agents —— 今夏（AI Pro/Ultra）
Generative UI —— 今夏免费
Custom Dashboards —— 今夏（AI Pro/Ultra）
Intelligent Search Box —— 滚动上线
AI Mode 切换到 3.5 Flash —— 今日

Workspace

Docs Live / Gmail Live / Keep Live —— 今夏
Google Pics（Nano Banana 驱动）—— 今夏
AI Inbox 扩展 —— 今夏

YouTube

Ask YouTube —— 今夏（美国区）
Gemini Omni 进 Shorts / Create —— 本周

购物

Universal Cart —— 今夏（美国 Search + Gemini）
Universal Commerce Protocol（UCP）—— 协议发布
Agent Payments Protocol（AP2）—— 集成 Spark

Android & 硬件

Gemini Intelligence —— 今夏（Galaxy S26 + Pixel 10 起）
Android Halo —— 年内
Rambler / Custom Widgets —— 滚动上线
Android XR 智能眼镜（Samsung + Qualcomm + Gentle Monster + Warby Parker）—— 今秋
Pause Point / 3D Emoji / Maps 3D / 跨 iPhone 文件传输 —— Android 17

科学

Gemini for Science —— Labs + GitHub 上线

可信度

SynthID 扩展到 Search 和 Chrome
C2PA Content Credentials 集成
OpenAI / Kakao / Eleven Labs 加入水印体系

订阅与定价

AI Ultra $100 新档（5x Pro）—— 今日
AI Ultra $200 降价（从 $250，20x Pro）—— 今日
Compute-Used 计费模型 —— 5 小时刷新，超额降级

I/O 2026 的牌算是打完了。剩下的，看 Google 在接下来 12 个月，能不能让这套 agent 操作系统真正跑起来。

主要来源

本文引用了大量 Google 官方页面与友媒报道，涉及来源包括：

🎤 Sundar Pichai Keynote 文字稿与 Google AI / Search / Workspace / Android 各官方博客
🚀 Antigravity 官网 · 💎 Gemini App 与订阅页 · 🧪 AI for Developers · 🧠 Google DeepMind
📊 Artificial Analysis · 🏆 Arena Leaderboard 等第三方评测
📰 9to5Google · TechCrunch · Tom’s Guide · Android Authority · The Decoder · VentureBeat · SiliconAngle

∎