作者資訊一次看:https://linktr.ee/jackyieyes
個人網站:reurl.cc/jG8mEp
Instagram(IG):instagram.com/jack_yi_0617
Youtube(YT):youtube.com/@jackyieyes
Facebook(FB):facebook.com/jackyi0617
全平台播放:https://open.firstory.me/user/cmb1k9q3508hj01y7336x5n6o/platforms
目前旗下可使用或即將推出的產品/功能:
Gemini App
- 每月活躍使用者超過 4 億。
- 包含了多種 AI 功能 。
- 已搭載最新的 2.5 Pro 模型 。
- Gemini Live: 提供互動和自然的語音對話,已在 Android 和 iOS 上免費推出 。
- 現已包含相機和螢幕分享功能 。
- 未來幾週將可以連接到 Calendar, Maps, Keep, Tasks 等應用程式 。
- Deep Research: 現已支援上傳自己的檔案來引導研究代理,並將很快支援在 Google Drive 和 Gmail 中進行研究 。
- Canvas: Gemini 的互動式共同創作空間,可以將詳細報告轉換為網頁、資訊圖表、測驗或定制 Podcast 。也可用於編寫程式碼並建立互動式模擬 。
- Agent Mode: 一種新的模式,允許 Gemini App 在後台自動執行多步驟任務,例如尋找公寓或安排參觀 。實驗版本即將對訂閱者推出 。
Google Search
- AI Overviews: 自去年推出以來,每月使用者超過 15 億。
- AI Mode: 一種全新的、經過重新構想的搜尋體驗,由 Gemini 2.5 驅動。
- 現已開始在美國向所有人推出 。
- 包含深層次推理、複雜分析和資料視覺化功能(將於今年夏天推出體育和金融問題的分析與視覺化) 。
- 包含 Agentic capabilities,能夠自動完成任務,例如尋找活動門票、餐廳預訂和當地服務預約(即將推出) 。
- Search Live: 將 Project Astra 的即時功能引入 AI 模式,通過相機實時識別環境並提供幫助 。
- 包含新的 虛擬試穿 (try-on) 功能,可幫助您在線上購物時查看服裝在您身上的效果(今天開始在 labs 中試用,新視覺購物功能將於未來幾個月推出) 。
- 包含新的 Agentic checkout 功能,可以在價格下降時通知您,並自動為您購買商品(未來幾個月推出) 。
- Gemini 2.5 將於本週開始進入 Search,同時為 AI Overviews 和 AI Mode 提供支援 。
開發者工具與 API
- Gemini API: 支援超過 700 萬開發者使用。
- 電腦使用能力 (Computer use capabilities) 將通過 Gemini API 向開發者提供,例如 Automation Anywhere 和 UiPath 正在使用(今年夏天將更廣泛提供) 。
- Text-to-speech capabilities: 新增了首次支援兩種聲音的多語種支援(Multi-voice support),今天開始在 Gemini API 中提供。
- Native audio dialogue: 2.5 Flash 的預覽版將於今天稍晚在 live API 中提供,用於建立更自然的對話體驗 。
- Thought summaries: 在 2.5 Pro 和 Flash 中通過 Gemini API 和 Vertex AI 提供 。
- Thinking budgets: 2.5 Flash 已推出,2.5 Pro 也將在未來幾週內推出,讓使用者控制模型思考使用的代幣數量 。
- Deep Think Mode: 2.5 Pro Deep Think 模式將通過 Gemini API 提供給可信測試者 。
- Gemini SDK: 現已與 Anthropic 的 MCP (model context protocol) 工具相容 。
創意生成工具
- Imagine 4: Google 最新的圖像生成模型,圖片更豐富、細節更細膩,並顯著改進了文字和排版能力,現已在 Gemini App 中提供 。
- 還有一個速度快 10 倍的 Imagine 4 快速版本 。
- V3: 全新的影片生成模型,視覺品質更高,對物理的理解更強,並新增了 原生音訊生成 能力(聲音效果、背景音、對話),今天開始提供 。
- Lyria 2: 高保真音樂和專業級音訊生成模型,現已對企業、YouTube 創作者和音樂人提供 。
- Flow: 一款新的 AI 電影製作工具,結合了 V3、Imagine 和 Gemini 的能力,專為創意人士打造,今天推出 。Ultra 訂閱者可使用 .
- Synth ID: 將隱形浮水印嵌入生成的媒體中,已為超過 100 億內容添加浮水印 。新的 Synth ID 偵測器(能識別圖像、音訊、文字或影片中是否包含 Synth ID)今天開始向早期測試者推出 。
程式設計輔助工具
- 更新後的 2.5 Pro 在 WebDev Arena 編碼排行榜上排名第一。
- 2.5 Pro 獲得了許多頂級程式設計平台的喜愛,在 Cursor 上是增長最快的模型。
- Jules: 異步程式碼代理,可以自動修復錯誤、進行更新,集成到 GitHub 中處理大型程式碼庫中的複雜任務(例如更新 Node.js 版本),現已進入公共測試階段 。
- Gemini Diffusion 在程式碼生成方面也表現出色 。
跨裝置與新形式
- Project Starline / Google Beam: 新的 AI 第一視訊通訊平台,使用 AI 將 2D 視訊流轉換為逼真的 3D 體驗,首批裝置將於今年稍晚提供給早期客戶,與 HP 合作 。即時語音翻譯功能已整合到 Google Meet 中,英語和西班牙語現對訂閱者提供,未來幾週將推出更多語言,今年稍晚將對企業推出 。
- Android XR: 專為頭戴式裝置和眼鏡設計的 Android 平台,Android 應用程式可在其上運行 。
- Samsung Project Muhan: 第一款 Android XR 裝置,將於今年稍晚發售 。
- Android XR 眼鏡: 輕便設計,配備相機、麥克風、揚聲器和可選的鏡內顯示器,與手機協同工作,讓 Gemini 的能力無處不在 。原型機已由可信測試者使用,今年稍晚將對開發者開放 。
- 已與 Gentle Monster 和 Warby Parker 成為首批 Android XR 眼鏡合作夥伴 。
Google AI 訂閱計劃:
- Google AI Pro: 全球可用,提供更高等級的 AI 產品、更高的使用限制和特殊功能(原名 Gemini Advanced) 。
- Google AI Ultra: 專為追求尖端 AI 的使用者設計,提供最高的使用限制、最早的新功能和產品訪問權限,以及 YouTube Premium 和大量儲存空間,今天已在美國推出,即將全球推出 。Ultra 訂閱者可以使用 2.5 Pro Deep Think 模式(準備好後),以及 Flow(今天可用) 。
AlphaFold 3: 可預測所有生命分子結構和相互作用的模型,已釋出 。
Powered by Firstory Hosting