Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
《AI報報報》是一檔 每天更新、專為忙碌的你打造的 AI 新聞快報節目。給你沒聽過但快爆紅的 AI 趨勢,我們都用 最精簡、最有料、最有趣的方式報給你聽。 每天只要 3~5 分鐘,帶你掌握全世界的 AI 新聞,上班、吃飯、搭車都能聽,一點也不浪費時間。 跟上 AI 時代,從《AI報報報》開始! 🔔 記得訂閱,天天都有新消息! P... more
May 27, 2025EP-65 一個用語言互動的無人機控制研究計畫:UAV-Flow,透過語言指令實現無人機的精確控制,直接說話就能飛**一個用語言互動的無人機控制研究計畫:UAV-Flow,透過語言指令實現無人機的精確控制,直接說話就能飛** UAV-Flow是第一個專注於精細動作控制的系統,過去的研究主要集中在遠距離導航控制 UAV-Flow主要專注於語言引導的精細動作控制,無人機根據語言指示可執行更複雜、更精準的近距離動作 例如,用說話的方式,讓它繞樹飛行,在車的左側降落等,更適合一般人使用 其用「模仿學習」的方法來訓練無人機,就是說讓無人機「模仿」經驗豐富的飛行員是怎麼飛的,把飛行員的飛行軌跡和對應的語言指令結合起來,讓無人機學習 由於無人機機載運算能力的限制,UAV-Flow搞了一套地空協同部署策略,把複雜的運算任務放在地面站完成,解決在無人機上部署大規模AI模型的問題 支援固定命令集和開放詞彙命令集 專案頁:https://prince687028.github.io/UAV-Flow/ 代碼應該後續會放出來 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more7minPlay
May 26, 2025EP-64 一套LLM幻覺偵測工具:uqlm,給了多種評測方式來偵測AI輸出幻覺,可以根據不同的場景選擇適合的方法**一套LLM幻覺檢測工具:uqlm,給了多種評測方式來檢測AI輸出幻覺,可以根據不同的場景選擇合適的方法** 1.黑盒評分器,透過多次產生並比較相同提示的回復來評估一致性。就反覆問同一個問題,如果每次回答的核心意思不一致或差異很大,表示它可能在瞎編 2.白盒評分器,利用token機率估計不確定性。看看LLM對自己答案中每個部分的自信程度,如果它對某個字或句子很不確定,就表示這部分內容可能有問題 3.專家評審法 (LLM 作為評審評分器),使用一個或多個 LLM評估原始LLM回應的可靠性,就是找其他LLM來評判答案的可靠性 4.綜合評估法 (整合評分器),結合以上幾種方法進行綜合評估 github:https://github.com/cvs-health/uqlm 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more8minPlay
May 25, 2025EP-63 Google基於Gemma 3的多模態醫療模型:MedGemma,可根據醫學影像和病歷描述產生診斷報告**Google基於Gemma 3的多模態醫療模型:MedGemma,可根據醫學影像和病歷描述產生診斷報告** 它在胸部X光片、皮膚病圖像、眼科圖像、病理切片等大量醫療數據上進行了預訓練和微調 可以看圖說話,給一張X光片,讓它用文字描述圖像內容;讓它回答關於醫學的問題;或給它一些醫學影像和相關病歷信息,讓它產生一份診斷報告 兩個版本, 4B 多模態版,支援圖像和文字 27B 純文字版 性能都優於其基礎模型 應用場景可以用於醫學影像分類;視覺問答,看X光片、看看皮膚照片、看眼底照片、看病理切片;報告生成等等;可做為開發醫療AI應用的起點 模型:https://huggingface.co/collections/google/medgemma-release-680aade845f90bec6a3f60c4 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more4minPlay
May 23, 2025EP-62 Manus類agent卷瘋了,又出來一款ii-agent開源框架,擅長建構跨多個領域工作流程的agent,能獨立執行複雜任務已成為Agent標配**Manus類agent卷瘋了,又出來一款ii-agent開源框架,擅長建構跨多個領域工作流程的agent,能獨立執行複雜任務已成為Agent標配** 其技能涵蓋研究與核查、內容產生、資料分析視覺化、軟體開發、工作流程自動化、問題解決6個面向 可以用它來做筆記、寫文章、做研究、分析資料、寫程式碼、建立網站、自動化工作流程、故障排除等等,基本上日常工作涵蓋的差不多了 ii-agent整合了搜尋引擎、程式碼編輯器、命令列終端機等工具,使得它可以處理更複雜的任務,具備持續學習和適應能力 給了命令列介面和網頁介面兩種互動方式。目前正在開發針對PDF、音訊、影像、視訊、幻燈片等不同模態的處理能力 github:https://github.com/Intelligent-Internet/ii-agent 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more7minPlay
May 23, 2025EP-61 最強編寫代碼大模型 Claude 4介紹https://claude.ai/new 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more7minPlay
May 22, 2025EP-60 紅杉資本:這次市場規模比雲端轉型大一個數量級,學會「隨機性思維」與「管理 AI Agents」」加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more10minPlay
May 21, 2025EP-59 Google I/O '2025 主題演講 Google I/O 大會的演講稿,內容圍繞著 Google 在人工智慧 (AI) 領域的最新進展。演講者詳細介紹了 Gemini 模型的性能提升、應用擴展以及其在 搜尋、影像生成、影片創作、機器人等方面的整合。此外,演講稿也涵蓋了 AI 驅動的新產品和功能,例如 Project Starline 的 Beam 視訊通訊平台、Project Astra 的通用 AI 助理、Project Mariner 的網路互動代理,以及針對開發者的 AI 工具和 API。最後,演講中也討論了 AI 在協助身心障礙者、災害應變等方面的潛力,並預告了 Android XR 眼鏡等新硬體產品。 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more7minPlay
May 21, 2025EP-58 Google 開發的全新 AI 製片工具Flow是一款由 Google 開發的全新 AI 製片工具,專為搭配其先進模型 Veo、Imagen 和 Gemini 使用而設計。Flow 旨在透過提供如攝影機控制、場景建構器和資產管理等功能,協助創作者輕鬆製作出具電影感的短片和場景。此工具是 VideoFX 的演變,目前已開放給訂閱 Google AI Pro 或 Ultra 方案的美國使用者,未來將陸續開放給更多國家。此外,Google 也與多位電影製作人合作,探索 AI 在電影敘事中的潛力,並將他們的意見整合到 Flow 的開發中。 https://blog.google/technology/ai/google-flow-veo-ai-filmmaking-tool/ 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more8minPlay
May 21, 2025EP-57 微軟Microsoft Build 2025 強調人工智慧為開發者帶來的新平台轉變微軟執行長薩蒂亞·納德拉在 Build 2025 開場演講中,強調人工智慧(AI)為開發者帶來的新平台轉變。他深入探討了包括 GitHub Copilot 在內的 AI 工具如何提升開發者效率,並宣布 Microsoft 365 Copilot 的最新進展,特別是在代理程式和多代理程式協調方面的突破。演講還介紹了 Azure AI Foundry,作為支援各類 AI 工作負載的全面應用程式伺服器,並宣布與 OpenAI、Mistral 和 XAI 等公司在模型選擇和基礎設施方面的合作。此外,演講展示了 Windows AI Foundry 和 MCP 協定,強調在客戶端設備上實現 AI 功能的重要性,最後則展示了 AI 在科學研究和教育等不同領域的實際應用,展現了微軟對賦予全球開發者權力以塑造 AI 驅動的未來的願景。 https://youtu.be/ceV3RsG946s?si=DJBvU1swQS_7FxXu 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more7minPlay
May 20, 2025EP-56 Google NotebookLM 的 Sparks 影片 Google NotebookLM 將推出的新功能 「Sparks」影片摘要,此功能旨在將使用者文件或研究報告自動轉換為短影片。 文章指出,此項技術仰賴 Gemini2.5Pro 的多模態能力以及 Deep Research 功能,能夠快速生成包含文字、圖片和音訊的結構化影片。 報導也分析了「Sparks」在 教育、研究與內容創作 等多個領域的應用潛力及其對 AI內容生成 領域的影響,同時提及可能引發的版權與原創性爭議。 加入免費會員,更新資訊不漏接: https://open.firstory.me/join/cma3mukjr127j01w5h4m56giw 小額贊助支持本節目: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw 留言告訴我你對這一集的想法: https://open.firstory.me/user/cma3mukjr127j01w5h4m56giw/comments Powered by Firstory Hosting...more7minPlay