
Sign up to save your podcasts
Or
5 月中旬 GPT-4o 的发布,让人与 AI 的交互,从对话框的文本交流加速推进到了音视频多模态的实时互动。
本期节目,我们邀请到实时互动 AI 创业者史业民。他结合了自己的一手研发经验,深度分析了 GPT-4o 在多模态、实时交互、情感语音的新能力和能力边界,分享了 GPT-4o 正在催生的潜在场景和新机会。史业民还从开发者视角,提出了面向开发者的 GPT-4o 和面向用户的 ChatGPT 能力可能存在区别的提醒,以及在开发多模态 AI 产品时需要注意到的技术细节。
从对话框到音视频,多模态的实时互动 AI 已成趋势。希望本期节目能对你有所启发。
3.2
55 ratings
5 月中旬 GPT-4o 的发布,让人与 AI 的交互,从对话框的文本交流加速推进到了音视频多模态的实时互动。
本期节目,我们邀请到实时互动 AI 创业者史业民。他结合了自己的一手研发经验,深度分析了 GPT-4o 在多模态、实时交互、情感语音的新能力和能力边界,分享了 GPT-4o 正在催生的潜在场景和新机会。史业民还从开发者视角,提出了面向开发者的 GPT-4o 和面向用户的 ChatGPT 能力可能存在区别的提醒,以及在开发多模态 AI 产品时需要注意到的技术细节。
从对话框到音视频,多模态的实时互动 AI 已成趋势。希望本期节目能对你有所启发。
452 Listeners
320 Listeners
924 Listeners
251 Listeners
427 Listeners
456 Listeners
73 Listeners
272 Listeners
351 Listeners
263 Listeners
8 Listeners
73 Listeners
291 Listeners
45 Listeners
269 Listeners