Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
《AI報報報》是一檔 每天更新、專為忙碌的你打造的 AI 新聞快報節目。給你沒聽過但快爆紅的 AI 趨勢,我們都用 最精簡、最有料、最有趣的方式報給你聽。 每天只要 3~5 分鐘,帶你掌握全世界的 AI 新聞,上班、吃飯、搭車都能聽,一點也不浪費時間。 跟上 AI 時代,從《AI報報報》開始! 🔔 記得訂閱,天天都有新消息! P... more
May 10, 2025EP-35 全球首款AI生成多人遊戲誕生,Multiverse全部開源,單機可玩,成本不到1500美元EnigmaLabsAI 開發的 Multiverse 專案,這是一個旨在建立 AI 多人世界模型 的開源計畫。 文件提供關於 專案概觀、程式碼安裝與執行說明,以及 用於訓練其核心模型的步驟。 Multiverse 由一個模擬遊戲的 降噪模型 和一個提高解析度的 升採樣模型 組成。 此外,頁面也連結了 相關的技術資源,並提供用於模型訓練的 賽車遊戲資料集。 頁面結構顯示這是一個 公開的軟體專案,並包含導覽、儲存庫詳細資訊以及社群活動資訊。 github:https://github.com/EnigmaLabsAI/multiverse 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more8minPlay
May 09, 2025EP-34 中國好聲音公司與階躍星辰 合作開源的 AI 音樂模型「音躍 ACE-Step」一款名為 ACE-Step 的新型開源音樂生成模型,旨在成為音樂 AI 的基礎模型。 其核心目標是透過整合擴散模型、深度壓縮自動編碼器和輕量級線性 Transformer,克服現有技術在生成速度、音樂連貫性和可控性之間的權衡問題,實現 顯著提升的生成速度 與 更優異的音樂品質及歌詞對齊。 ACE-Step 的應用場景,例如語音克隆和歌詞編輯,並坦誠地列出了 目前的限制,包括輸出不穩定性和在特定風格上的不足,同時展望了未來的改進方向。 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more9minPlay
May 09, 2025EP-33 字節開源了,DeerFlow基於LangChain和LangGraph框架的一款智慧研究助手DeerFlow,基於LangChain和LangGraph框架的一款智慧研究助理 支援動態任務迭代、MCP無縫整合、自動生成研究計畫、人機協作,甚至是播客、PPT生成 它把語言模型與網路搜尋、爬蟲和Python程式碼執行等工具結合在一起,以快速提供深入且全面的報告 github:https://github.com/bytedance/deer-flow 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more8minPlay
May 09, 2025EP-32 Google 暴跌! AI搜尋開始吞噬市場,Apple 瑟瑟發抖 Google 搜尋業務面臨的重大挑戰,尤其是來自人工智慧驅動的搜尋引擎。 影片討論了 蘋果執行長 Eddy Cue 的證詞,證實 Safari 瀏覽器的搜尋流量首次下降,部分歸因於 AI 競爭。 專家分析這對 Alphabet (Google 母公司) 股票 和其核心搜尋廣告業務的潛在影響,有人認為這代表著該公司面臨新的生存威脅,因為年輕用戶轉向 AI 服務而非傳統搜尋結果。 此外,影片也提及 Google 與蘋果之間高達數十億美元的預設搜尋引擎協議,以及這項協議在反壟斷審判中可能面臨的風險,此風險同時影響 Google 的收入和蘋果的服務營收。 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more5minPlay
May 09, 2025EP-31 騰訊剛剛放出了一款視訊生成框架:HunyuanCustom,其核心是客製化影片生成能力,看起來效果不輸閉源模型騰訊剛放出來一款影片產生框架:HunyuanCustom,其核心是客製化影片產生能力,看起來效果不輸閉源模型 用來產生商品廣告、教育場景,或是個性影片製作都不錯 它由HunyuanVideo-13B支持,可以基於多模態輸入生成高度可控和一致的定制視頻 能根據像是文字、圖像、音訊、視訊等各種條件,精確的控制生成視訊的內容、主體、動作和場景,視訊中主體的身份一致性保持的非常好 支援單主體視頻定制,根據文字提示生成包含特定主體的視頻 也多主體視頻定制,根據文本提示生成包含多個主體的視頻,並可以控制每個主體的動作和交互 還有音頻驅動視頻定制,以及視頻驅動視頻定制 github:https://github.com/Tencent/HunyuanCustom 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more8minPlay
May 08, 2025EP-30 學生免費使用Google One AI Premium方案這個新來源說明了一項限時優惠,美國學生可以在2025年6月30日前註冊,免費使用Google One AI Premium方案直到2026年6月30日。此方案包含Gemini Advanced,這是一個強大的AI模型,可提供考試準備、寫作輔助和家庭作業支援等功能。此外,該方案還提供2 TB的雲端儲存空間,並可使用NotebookLM Plus和Whisk等工具,以及在Google應用程式中直接使用Gemini。學生必須年滿18歲,持有有效的**.edu電子郵件地址**進行驗證,並在2025年8月31日前再次驗證學生身分才能享有完整優惠期。 https://gemini.google/students/ 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more6minPlay
May 07, 2025EP-29 ComfyUI 大改版,支援超多市面大廠閉源模型,只要用 API超級方便,不用切來切去 ComfyUI 新的原生 API 節點的推出,使用者現在可以直接在 ComfyUI 內存取各種 付費模型 API,例如 Veo2、Flux Ultra 和 Stable Image Ultra。 這項更新使 ComfyUI 能夠作為一個「自動化引擎」使用非本地模型以獲得更好的結果。此外,ComfyUI 也推出了全新的品牌形象,包括 新的標誌和配色方案,這些設計旨在反映其作為嚴肅創意工具的成長,同時保留其開放、可修改的特性。 使用者可以透過更新軟體、購買點數,並在模板中找到並執行這些新的 API 節點。 https://blog.comfy.org/p/comfyui-native-api-nodes 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more7minPlay
May 07, 2025EP-28 Google的Gemini 2.5 Pro預覽版(I/O版)的搶先體驗版提前出來了!是2.5 Pro的升級版,建構互動式的Web應用能力是其強項Google的Gemini 2.5 Pro預覽版(I/O版)的搶先體驗版提前出來了!是2.5 Pro的升級版,建構互動式的Web應用能力是其強項 使用單一提示詞可以創建豐富的網路應用程式、遊戲、模擬等 這次更新除了UI開發之外,還有程式碼轉換、程式碼編輯以及開發複雜的智能體工作流程等 在WebDev Arena排行榜上比上一個版本提升了147個Elo積分 目前可透過Google AI Studio、Vertex AI,以及Gemini應用程式使用,Gemini中的Canvas也是Gemini 2.5 Pro提供的支持 部落格:https://blog.google/products/gemini/gemini-2-5-pro-updates/ 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more6minPlay
May 07, 2025EP-27 新出的一款端對端AI語音模型:Voila,全雙工能同時聽和說,低延遲,預置百萬種語音 也支援ASR、TTS以及多語言語音翻譯新出的一款端對端AI語音模型:Voila,全雙工能同時聽說,低延遲,預置百萬種語音也支援ASR、TTS以及多語言語音翻譯 端對端架構,支援全雙工的低延遲中斷,延遲195毫秒,超人類平均回應時間 能夠即時自主對話,持續性間歇、推理以及主動回應,透過文字指令可以定義說話者的身份以及語氣等特徵 模型:https://huggingface.co/collections/maitrix-org/voila-67e0d96962c19f221fc73fa5 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more5minPlay
May 07, 2025EP-26 NVIDIA 發的首款語音辨識模型:Parakeet TDT 0.6B V2,核心能力是它精確的詞級時間預測,還能自動加上標點符號和大小寫入英偉達發的第一款語音辨識模型:Parakeet TDT 0.6B V2,核心能力是它精確的詞級時間預測,還能自動加上標點符號和大小寫入 6個參數,可以準確預測單字的時鐘,主要用於英語識別 可以一次處理24分鐘的長錄音,不用分段處理 在口語數字和歌曲歌詞上表現也比較好 用於語音助理、佔領、字幕生成以及語音分析平台都可以 模型:https://huggingface.co/nvidia/parakeet-tdt-0.6b-v2 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more9minPlay