Google I/O 2026 · 新聞與模型匯報

Google 把 I/O 2026 定調成「agentic Gemini era」:新模型、代理人、搜尋與創作工具全面上線

根據 Google 官方發布、媒體報導與 X 社群樣本整理。研究時間以台北時間 2026-05-20 凌晨、Google I/O 第一天內容為準。

官方確認:2 個新模型家族 重點:Gemini 3.5 Flash + Gemini Omni Flash 主軸:agent、Search、Flow、Workspace X 樣本:即時搜尋受 rate limit 限制

一句話結論

這不是一次單純的模型升級,而是 Google 把 Gemini 從「聊天與生成工具」往「能持續執行任務的代理基礎設施」推進。最核心的兩個模型是 Gemini 3.5 FlashGemini Omni Flash:前者負責高速、低成本、長流程 agent/coding;後者把 Gemini 的多模態理解接到影片生成與影片編輯。

最重要的發布

3.2Q+Google 宣稱每月跨產品處理 token 超過 3.2 quadrillion。
8.5M+每月使用 Google 模型建構 app/體驗的開發者。
900M+Gemini app 月活,較去年 I/O 的 400M 翻倍以上。
1B+AI Mode in Search 一年內突破 10 億月活。
New model family

Gemini 3.5

首發:Gemini 3.5 Flash。官方定位是「frontier intelligence with action」,主打 coding、agentic tasks、長流程任務與互動式 UI/圖形生成。

  • 今天已在 Gemini app、AI Mode in Search、Google Antigravity、Gemini API、AI Studio、Android Studio、Gemini Enterprise 上線。
  • 官方稱在 Terminal-Bench 2.1、GDPval-AA、MCP Atlas、CharXiv Reasoning 等 benchmark 表現強,且輸出速度比其他 frontier models 快 4 倍。
  • Gemini 3.5 Pro 正在內部使用,官方說下個月推出。
  • 與 Antigravity 搭配時,Google 把它描述成可部署多個 subagents 的引擎。
New multimodal model

Gemini Omni

首發:Gemini Omni Flash。官方說它能「create anything from any input」,第一階段從影片輸出開始。

  • 可把 text、image、video、audio 等輸入結合,產生或編輯影片。
  • 主打以自然語言做多輪影片編輯、維持角色/場景一致、改善物理與世界知識。
  • 今天起在 Gemini app、Google Flow、YouTube Shorts/YouTube Create 逐步推出。
  • API 會在未來幾週提供給開發者和企業。

不是今天新發布、但與 I/O 脈絡相關的模型

Gemma 4

Gemma 4 已在 2026-04-02 發布,I/O 議程中有「Gemma open model family」相關 session。它是 Apache 2.0 的開放模型家族,主打 on-device/edge agent、多步驟 planning、工具呼叫、128K context,並可透過 LiteRT-LM 跑在 Android、iOS、desktop、WebGPU、Raspberry Pi 5 等環境。

Nano Banana / Google Pics

Workspace 的新工具 Google Pics 建在最新 Nano Banana image model 上,重點不是單純生圖,而是物件分割、局部編輯、圖中文字修改/翻譯、Slides/Drive 整合與協作 canvas。

Benchmark / Ranking

有 benchmark,而且官方非常刻意把 Gemini 3.5 Flash 放在「frontier intelligence + high speed」這個敘事裡。不過截至本報告更新時,我只找到 Google 官方引用 Artificial Analysis 圖表,尚未找到 Artificial Analysis 自己公開、可抓取的 Gemini 3.5 Flash 獨立排名頁,所以不能嚴格寫成「AA 官方排行榜第幾名」。

76.2%Terminal-Bench 2.1,官方稱是 coding / terminal agentic benchmark。
1656GDPval-AA Elo,官方用來代表 real-world economically valuable tasks。
83.6%MCP Atlas,官方列為 agentic/tool-use 類 benchmark。
84.2%CharXiv Reasoning,官方稱 3.5 Flash 在 multimodal understanding 領先。

產品層更新

推出 Neural Expressive redesign,回覆不再只是文字牆,而是把重點、圖像、timeline、互動視覺化放進回覆。Daily Brief 會讀取 Gmail、Calendar、Tasks 做每日摘要;Gemini Spark 是 24/7 personal agent,先給 trusted testers,接著給美國 AI Ultra beta。
AI Mode 全球預設升級到 Gemini 3.5 Flash。Search box 變成可輸入文字、圖片、檔案、影片、Chrome tabs 的 AI 入口。Information agents 會在背景監控 web、news、social、finance、shopping、sports 等資訊,夏季先給 Pro/Ultra。
Antigravity 2.0 被定位成 agent-first development platform,不只協助寫 code,而是讓多個 agents 在桌面 app、CLI、SDK 與 harness 中協作執行長任務。
Docs Live、Gmail Live、Keep voice features 讓使用者用語音 brainstorm、搜尋 inbox、整理筆記。AI Inbox 擴展到 Plus/Pro,增加個人化回覆草稿、檔案入口、任務管理。
Google Flow 加入 Gemini Omni Flash、Flow Agent、Flow Tools;YouTube 方向則包含 Ask YouTube、Shorts remix 與 Omni 影片能力。
Safety / provenance

內容真偽與浮水印

Google 強調 SynthID 已水印超過 1000 億張圖片/影片與 6 萬年音訊,並把 SynthID 驗證擴展到 Search、Chrome、Gemini app。OpenAI、Kakao、ElevenLabs 也會採用 SynthID;Google Cloud 另外推出 AI Content Detection API 給企業做 synthetic media 偵測與標籤。

Strategic read

戰略解讀

Google 這次押注的是「速度 x 工具呼叫 x 分發面」:3.5 Flash 降低 agent 成本與延遲,Search/Gemini/Workspace/Android/Chrome 提供預裝入口,Antigravity/AI Studio/API 讓開發者補上生態。這會直接碰撞 OpenAI、Anthropic、Perplexity、Canva、Adobe、Cursor 類產品的邊界。

X 社群反應

我用 fcrawl X 搜尋抓了即時樣本,但中途遇到 SearchTimeline queue rate limit,所以以下是可取得樣本的定性整理,不把它解讀成完整民調。

1. 最多人興奮的是 Gemini 3.5 Flash

多數貼文聚焦在「4 倍輸出速度」、「coding/agent benchmark 超過 3.1 Pro」、「今天就能用」。Sundar Pichai 的貼文提到 3.5 Flash 已在 Antigravity、產品與 API 可用,該貼文在抓取時約有 1.8K likes、181 reposts、68.7K views。

社群語氣大多是:如果 Flash 真的同時保留速度、成本與 frontier-level intelligence,agent 工作流會更可行。

2. Gemini Omni 讓創作者很有感,但也有質疑聲

創作者與 AI 影片圈對「影片可用自然語言多輪編輯」、「YouTube Shorts/Flow 直接上線」很興奮;但也有貼文覺得 Gemini Omni 展示時間短、效果沒有想像中震撼,稱 I/O 整體偏平。

3. Agentic shift 被視為真正主菜

不少貼文把這次 I/O 解讀成從 chatbot 轉向 digital labor/agent infrastructure。尤其是 Spark、Information agents、Antigravity、Search 生成 mini apps,被看成 Google 利用既有產品入口,把 agent 帶進日常工作流。

4. 可用性與地區限制仍是討論點

日本社群有整理「現在能用」與「之後才開」的清單:Gemini 3.5 Flash、Omni Flash、AI Mode 升級、Neural Expressive 等較快;Spark、Daily Brief、部分 Search booking/mini apps 則多為美國或付費方案優先。

值得後續追蹤

主要來源

  1. Google Blog: I/O 2026 collection
  2. Sundar Pichai keynote transcript
  3. Gemini 3.5: frontier intelligence with action
  4. Introducing Gemini Omni
  5. A new era for AI Search
  6. Workspace updates: Docs Live, Google Pics, AI Inbox, Spark
  7. SynthID and content verification updates
  8. Google Developers Blog: Gemma 4
  9. TechCrunch: Gemini 3.5 Flash and agents
  10. The Verge: five biggest Gemini app changes
  11. 9to5Google: Gemini app redesign, Spark, Daily Brief
  12. X: Sundar Pichai on Gemini 3.5 Flash
  13. X: Google on Gemini 3.5 Flash
  14. X: Gemini app update thread