JackYi | Eyes觀察筆記

Google I/O 2025 懶人包(JackYi | Eyes觀察筆記)


Listen Later

作者資訊一次看:https://linktr.ee/jackyieyes
個人網站:reurl.cc/jG8mEp
Instagram(IG):instagram.com/jack_yi_0617
Youtube(YT):youtube.com/@jackyieyes
Facebook(FB):facebook.com/jackyi0617
全平台播放:https://open.firstory.me/user/cmb1k9q3508hj01y7336x5n6o/platforms

目前旗下可使用或即將推出的產品/功能:
Gemini App

  • 每月活躍使用者超過 4 億。
  • 包含了多種 AI 功能 。
  • 已搭載最新的 2.5 Pro 模型 。
  • Gemini Live: 提供互動和自然的語音對話,已在 Android 和 iOS 上免費推出 。
  • 現已包含相機和螢幕分享功能 。
  • 未來幾週將可以連接到 Calendar, Maps, Keep, Tasks 等應用程式 。
  • Deep Research: 現已支援上傳自己的檔案來引導研究代理,並將很快支援在 Google Drive 和 Gmail 中進行研究 。
  • Canvas: Gemini 的互動式共同創作空間,可以將詳細報告轉換為網頁、資訊圖表、測驗或定制 Podcast 。也可用於編寫程式碼並建立互動式模擬 。
  • Agent Mode: 一種新的模式,允許 Gemini App 在後台自動執行多步驟任務,例如尋找公寓或安排參觀 。實驗版本即將對訂閱者推出 。

Google Search

  • AI Overviews: 自去年推出以來,每月使用者超過 15 億。
  • AI Mode: 一種全新的、經過重新構想的搜尋體驗,由 Gemini 2.5 驅動。
  • 現已開始在美國向所有人推出 。
  • 包含深層次推理、複雜分析和資料視覺化功能(將於今年夏天推出體育和金融問題的分析與視覺化) 。
  • 包含 Agentic capabilities,能夠自動完成任務,例如尋找活動門票、餐廳預訂和當地服務預約(即將推出) 。
  • Search Live: 將 Project Astra 的即時功能引入 AI 模式,通過相機實時識別環境並提供幫助 。
  • 包含新的 虛擬試穿 (try-on) 功能,可幫助您在線上購物時查看服裝在您身上的效果(今天開始在 labs 中試用,新視覺購物功能將於未來幾個月推出) 。
  • 包含新的 Agentic checkout 功能,可以在價格下降時通知您,並自動為您購買商品(未來幾個月推出) 。
  • Gemini 2.5 將於本週開始進入 Search,同時為 AI Overviews 和 AI Mode 提供支援 。

開發者工具與 API

  • Gemini API: 支援超過 700 萬開發者使用。
  • 電腦使用能力 (Computer use capabilities) 將通過 Gemini API 向開發者提供,例如 Automation Anywhere 和 UiPath 正在使用(今年夏天將更廣泛提供) 。
  • Text-to-speech capabilities: 新增了首次支援兩種聲音的多語種支援(Multi-voice support),今天開始在 Gemini API 中提供。
  • Native audio dialogue: 2.5 Flash 的預覽版將於今天稍晚在 live API 中提供,用於建立更自然的對話體驗 。
  • Thought summaries: 在 2.5 Pro 和 Flash 中通過 Gemini API 和 Vertex AI 提供 。
  • Thinking budgets: 2.5 Flash 已推出,2.5 Pro 也將在未來幾週內推出,讓使用者控制模型思考使用的代幣數量 。
  • Deep Think Mode: 2.5 Pro Deep Think 模式將通過 Gemini API 提供給可信測試者 。
  • Gemini SDK: 現已與 Anthropic 的 MCP (model context protocol) 工具相容 。

創意生成工具

  • Imagine 4: Google 最新的圖像生成模型,圖片更豐富、細節更細膩,並顯著改進了文字和排版能力,現已在 Gemini App 中提供 。
  • 還有一個速度快 10 倍的 Imagine 4 快速版本 。
  • V3: 全新的影片生成模型,視覺品質更高,對物理的理解更強,並新增了 原生音訊生成 能力(聲音效果、背景音、對話),今天開始提供 。
  • Lyria 2: 高保真音樂和專業級音訊生成模型,現已對企業、YouTube 創作者和音樂人提供 。
  • Flow: 一款新的 AI 電影製作工具,結合了 V3、Imagine 和 Gemini 的能力,專為創意人士打造,今天推出 。Ultra 訂閱者可使用 .
  • Synth ID: 將隱形浮水印嵌入生成的媒體中,已為超過 100 億內容添加浮水印 。新的 Synth ID 偵測器(能識別圖像、音訊、文字或影片中是否包含 Synth ID)今天開始向早期測試者推出 。

程式設計輔助工具

  • 更新後的 2.5 Pro 在 WebDev Arena 編碼排行榜上排名第一。
  • 2.5 Pro 獲得了許多頂級程式設計平台的喜愛,在 Cursor 上是增長最快的模型。
  • Jules: 異步程式碼代理,可以自動修復錯誤、進行更新,集成到 GitHub 中處理大型程式碼庫中的複雜任務(例如更新 Node.js 版本),現已進入公共測試階段 。
  • Gemini Diffusion 在程式碼生成方面也表現出色 。

跨裝置與新形式

  • Project Starline / Google Beam: 新的 AI 第一視訊通訊平台,使用 AI 將 2D 視訊流轉換為逼真的 3D 體驗,首批裝置將於今年稍晚提供給早期客戶,與 HP 合作 。即時語音翻譯功能已整合到 Google Meet 中,英語和西班牙語現對訂閱者提供,未來幾週將推出更多語言,今年稍晚將對企業推出 。
  • Android XR: 專為頭戴式裝置和眼鏡設計的 Android 平台,Android 應用程式可在其上運行 。
  • Samsung Project Muhan: 第一款 Android XR 裝置,將於今年稍晚發售 。
  • Android XR 眼鏡: 輕便設計,配備相機、麥克風、揚聲器和可選的鏡內顯示器,與手機協同工作,讓 Gemini 的能力無處不在 。原型機已由可信測試者使用,今年稍晚將對開發者開放 。
  • 已與 Gentle Monster 和 Warby Parker 成為首批 Android XR 眼鏡合作夥伴 。

Google AI 訂閱計劃:

  • Google AI Pro: 全球可用,提供更高等級的 AI 產品、更高的使用限制和特殊功能(原名 Gemini Advanced) 。
  • Google AI Ultra: 專為追求尖端 AI 的使用者設計,提供最高的使用限制、最早的新功能和產品訪問權限,以及 YouTube Premium 和大量儲存空間,今天已在美國推出,即將全球推出 。Ultra 訂閱者可以使用 2.5 Pro Deep Think 模式(準備好後),以及 Flow(今天可用) 。

AlphaFold 3: 可預測所有生命分子結構和相互作用的模型,已釋出 。



Powered by Firstory Hosting
...more
View all episodesView all episodes
Download on the App Store

JackYi | Eyes觀察筆記By JackYi