Google I/O 2026 重點匯報

一句話結論

這不是一次單純的模型升級，而是 Google 把 Gemini 從「聊天與生成工具」往「能持續執行任務的代理基礎設施」推進。最核心的兩個模型是 Gemini 3.5 Flash 和 Gemini Omni Flash：前者負責高速、低成本、長流程 agent/coding；後者把 Gemini 的多模態理解接到影片生成與影片編輯。

最重要的發布

3.2Q+Google 宣稱每月跨產品處理 token 超過 3.2 quadrillion。

8.5M+每月使用 Google 模型建構 app/體驗的開發者。

900M+Gemini app 月活，較去年 I/O 的 400M 翻倍以上。

1B+AI Mode in Search 一年內突破 10 億月活。

New model family

Gemini 3.5

首發：Gemini 3.5 Flash。官方定位是「frontier intelligence with action」，主打 coding、agentic tasks、長流程任務與互動式 UI/圖形生成。

今天已在 Gemini app、AI Mode in Search、Google Antigravity、Gemini API、AI Studio、Android Studio、Gemini Enterprise 上線。
官方稱在 Terminal-Bench 2.1、GDPval-AA、MCP Atlas、CharXiv Reasoning 等 benchmark 表現強，且輸出速度比其他 frontier models 快 4 倍。
Gemini 3.5 Pro 正在內部使用，官方說下個月推出。
與 Antigravity 搭配時，Google 把它描述成可部署多個 subagents 的引擎。

New multimodal model

Gemini Omni

首發：Gemini Omni Flash。官方說它能「create anything from any input」，第一階段從影片輸出開始。

可把 text、image、video、audio 等輸入結合，產生或編輯影片。
主打以自然語言做多輪影片編輯、維持角色/場景一致、改善物理與世界知識。
今天起在 Gemini app、Google Flow、YouTube Shorts/YouTube Create 逐步推出。
API 會在未來幾週提供給開發者和企業。

不是今天新發布、但與 I/O 脈絡相關的模型

Gemma 4

Gemma 4 已在 2026-04-02 發布，I/O 議程中有「Gemma open model family」相關 session。它是 Apache 2.0 的開放模型家族，主打 on-device/edge agent、多步驟 planning、工具呼叫、128K context，並可透過 LiteRT-LM 跑在 Android、iOS、desktop、WebGPU、Raspberry Pi 5 等環境。

Nano Banana / Google Pics

Workspace 的新工具 Google Pics 建在最新 Nano Banana image model 上，重點不是單純生圖，而是物件分割、局部編輯、圖中文字修改/翻譯、Slides/Drive 整合與協作 canvas。

Benchmark / Ranking

有 benchmark，而且官方非常刻意把 Gemini 3.5 Flash 放在「frontier intelligence + high speed」這個敘事裡。不過截至本報告更新時，我只找到 Google 官方引用 Artificial Analysis 圖表，尚未找到 Artificial Analysis 自己公開、可抓取的 Gemini 3.5 Flash 獨立排名頁，所以不能嚴格寫成「AA 官方排行榜第幾名」。

76.2%Terminal-Bench 2.1，官方稱是 coding / terminal agentic benchmark。

1656GDPval-AA Elo，官方用來代表 real-world economically valuable tasks。

83.6%MCP Atlas，官方列為 agentic/tool-use 類 benchmark。

84.2%CharXiv Reasoning，官方稱 3.5 Flash 在 multimodal understanding 領先。

對照對象：官方明確說 Gemini 3.5 Flash 在幾乎所有 benchmark 上優於 Gemini 3.1 Pro，並且 intelligence/output-speed 圖中與 GPT-5.5、Claude Opus 4.7 等 frontier models 放在同一張 Artificial Analysis scatter plot 比較。
速度：Google 宣稱 3.5 Flash 的 output tokens per second 比其他 frontier models 快 4 倍；Antigravity 裡還有更優化版本，官方 keynote 稱可達 12 倍速度。
成本：官方敘事是「frontier-level capability at less than half the price of comparable frontier models」，但公開頁面未提供完整 token 價格表。
排名解讀：Google 官方說它落在 Artificial Analysis index 的右上象限，代表高 intelligence + 高 output speed；這是官方引用 AA 指標，不等於我已驗證 AA 官網完整 leaderboard 排名。

產品層更新

Gemini app

推出 Neural Expressive redesign，回覆不再只是文字牆，而是把重點、圖像、timeline、互動視覺化放進回覆。Daily Brief 會讀取 Gmail、Calendar、Tasks 做每日摘要；Gemini Spark 是 24/7 personal agent，先給 trusted testers，接著給美國 AI Ultra beta。

AI Mode 全球預設升級到 Gemini 3.5 Flash。Search box 變成可輸入文字、圖片、檔案、影片、Chrome tabs 的 AI 入口。Information agents 會在背景監控 web、news、social、finance、shopping、sports 等資訊，夏季先給 Pro/Ultra。

Antigravity

Antigravity 2.0 被定位成 agent-first development platform，不只協助寫 code，而是讓多個 agents 在桌面 app、CLI、SDK 與 harness 中協作執行長任務。

Workspace

Docs Live、Gmail Live、Keep voice features 讓使用者用語音 brainstorm、搜尋 inbox、整理筆記。AI Inbox 擴展到 Plus/Pro，增加個人化回覆草稿、檔案入口、任務管理。

Flow / YouTube

Google Flow 加入 Gemini Omni Flash、Flow Agent、Flow Tools；YouTube 方向則包含 Ask YouTube、Shorts remix 與 Omni 影片能力。

Safety / provenance

內容真偽與浮水印

Google 強調 SynthID 已水印超過 1000 億張圖片/影片與 6 萬年音訊，並把 SynthID 驗證擴展到 Search、Chrome、Gemini app。OpenAI、Kakao、ElevenLabs 也會採用 SynthID；Google Cloud 另外推出 AI Content Detection API 給企業做 synthetic media 偵測與標籤。

Strategic read

戰略解讀

Google 這次押注的是「速度 x 工具呼叫 x 分發面」：3.5 Flash 降低 agent 成本與延遲，Search/Gemini/Workspace/Android/Chrome 提供預裝入口，Antigravity/AI Studio/API 讓開發者補上生態。這會直接碰撞 OpenAI、Anthropic、Perplexity、Canva、Adobe、Cursor 類產品的邊界。

X 社群反應

我用 fcrawl X 搜尋抓了即時樣本，但中途遇到 SearchTimeline queue rate limit，所以以下是可取得樣本的定性整理，不把它解讀成完整民調。

1. 最多人興奮的是 Gemini 3.5 Flash

多數貼文聚焦在「4 倍輸出速度」、「coding/agent benchmark 超過 3.1 Pro」、「今天就能用」。Sundar Pichai 的貼文提到 3.5 Flash 已在 Antigravity、產品與 API 可用，該貼文在抓取時約有 1.8K likes、181 reposts、68.7K views。

社群語氣大多是：如果 Flash 真的同時保留速度、成本與 frontier-level intelligence，agent 工作流會更可行。

2. Gemini Omni 讓創作者很有感，但也有質疑聲

創作者與 AI 影片圈對「影片可用自然語言多輪編輯」、「YouTube Shorts/Flow 直接上線」很興奮；但也有貼文覺得 Gemini Omni 展示時間短、效果沒有想像中震撼，稱 I/O 整體偏平。

3. Agentic shift 被視為真正主菜

不少貼文把這次 I/O 解讀成從 chatbot 轉向 digital labor/agent infrastructure。尤其是 Spark、Information agents、Antigravity、Search 生成 mini apps，被看成 Google 利用既有產品入口，把 agent 帶進日常工作流。

4. 可用性與地區限制仍是討論點

日本社群有整理「現在能用」與「之後才開」的清單：Gemini 3.5 Flash、Omni Flash、AI Mode 升級、Neural Expressive 等較快；Spark、Daily Brief、部分 Search booking/mini apps 則多為美國或付費方案優先。

值得後續追蹤

Gemini 3.5 Pro：官方說下個月推出，會決定 Google 是否能在高推理/長任務規劃上追上或超過對手。
Omni API：未來幾週開給開發者後，才看得出實際影片品質、價格、限制、濫用防護與可商用程度。
Antigravity 2.0：如果 desktop app、CLI、SDK 與 subagent harness 成熟，會直接挑戰既有 AI coding IDE。
Search agents：Search 變成可建立 agents/mini apps 的入口，對 SEO、內容分發、垂直搜尋與比價平台影響很大。
SynthID 跨公司採用：OpenAI、ElevenLabs、Kakao 加入是大訊號，但真正價值取決於跨平台驗證是否順手且可信。

Google 把 I/O 2026 定調成「agentic Gemini era」：新模型、代理人、搜尋與創作工具全面上線