
Sign up to save your podcasts
Or
历史上每一次人机交互的革命,都成就了一家伟大的公司,今天我们正站在新的十字路口。当理想同学用“三模型架构”成为首个“真正可用”的语音助手,当语音输入强大到在游戏中被视为“作弊”,我们正处在一个剧烈的范式转换前夜。本期节目,我们与怒喵科技李楠一起,揭示本地模型与语音交互如何改变我们几十年来拥抱屏幕的“病态”并回归自然。
欢迎收听脑放电波和 AI谬论 的串台节目
03:37 - Part 1:理想同学的“三模型”架构,与游戏里的“语音外挂”
理想同学为何比 Siri 好用100倍?这背后是本地模型、智舱模型与云端模型协同工作的降维打击。当云端延迟还在0.8秒挣扎,理想同学已凭借端侧AI的百毫秒级响应,实现了“用了就回不去”的丝滑体验。怒喵尝试将这种能力复刻到PC上,发现语音输入在FPS游戏里竟能化身“作弊器”,手残党也能秒开爆闪、精准打药。这证明了新交互范式的巨大优势:你再也不用去记那些复杂的快捷键,更不需要翻看任何说明教程了!
27:42 - Part 2:语音输入法正在“逆袭”:从质疑TNT到爱上语音打字
2024年,一款语音输入法竟能融资3600万美元?我们从质疑老罗的TNT,到如今在工位上全天使用语音输入。无论是能自动去除口癖、智能排版的Wispr Flow,还是微信悄悄上线的“整理文字”功能,都预示着语音输入的时代已经到来。然而,今天的软件和操作系统,都还没有为模型准备好——这正是巨大的机会所在。此外,我们还分享了你身边就能用到的其他优秀工具与技巧,以及为什么端侧模型也有机会成为云端大模型一样的“行业黄金”。
58:24 - Part 3:人与模型的互动反常识:告别一键生成,拥抱“说得越多越好”
别再迷信“一键生成XX”的AI产品了,那大多是无法深入使用的“垃圾”。无论是Grok-4还是其他大模型,它们拥有强大的“Coder”能力,却缺乏“软件工程”能力。真正的价值诞生于深度交互:你给AI五万字,它能为你压缩出八千字的精华;让AI辅助整理会议纪要,它帮你强化关键细节而不是纯靠AI输出。从语音交互开始,我们正在告别过去几十年拥抱屏幕的病态,成为一个真正自然的人。
欢迎订阅脑放电波,2024/25苹果播客周度推荐节目、小宇宙累计10次编辑推荐单集、2024CPA播客中文奖年度科技数码类播客
欢迎在评论区留言发表你对 语音交互/人机交互 的感受与看法,我们将选取其中三位评论送出脑放电波定制周边:一把酷酷的金属电路板尺子
对于节目话题的更多观点,获取更多未呈现在节目中的扩展阅读,欢迎添加脑放电波小助手微信(BrainAMP01)加群参与讨论,后续会发布本期节目的文字稿
人物:
节目中用到的音乐:来自monkeyman535的90's Rock Style,地址freesound.org;来自kjartan_abel的Berlin Town,地址freesound.org;基于 CC BY 4.0 DEED 使用。
脑放电波往期节目精选(搜索关键词可收听)
脑放电波是一档关注科技前沿、品牌营销和个人成长的谈话类节目。每期带给您一个有趣有据的话题,帮您在信息严重过载的现代世界小幅自我迭代。您可以在小宇宙、苹果播客或者其他泛用型播客客户端搜索“脑放电波”找到并关注我们,如果您对本期节目有任何疑问,欢迎您给我们留言,如果您觉得这期内容对你有所帮助,欢迎您关注点赞收藏转发,这对我们非常重要。
4.6
1010 ratings
历史上每一次人机交互的革命,都成就了一家伟大的公司,今天我们正站在新的十字路口。当理想同学用“三模型架构”成为首个“真正可用”的语音助手,当语音输入强大到在游戏中被视为“作弊”,我们正处在一个剧烈的范式转换前夜。本期节目,我们与怒喵科技李楠一起,揭示本地模型与语音交互如何改变我们几十年来拥抱屏幕的“病态”并回归自然。
欢迎收听脑放电波和 AI谬论 的串台节目
03:37 - Part 1:理想同学的“三模型”架构,与游戏里的“语音外挂”
理想同学为何比 Siri 好用100倍?这背后是本地模型、智舱模型与云端模型协同工作的降维打击。当云端延迟还在0.8秒挣扎,理想同学已凭借端侧AI的百毫秒级响应,实现了“用了就回不去”的丝滑体验。怒喵尝试将这种能力复刻到PC上,发现语音输入在FPS游戏里竟能化身“作弊器”,手残党也能秒开爆闪、精准打药。这证明了新交互范式的巨大优势:你再也不用去记那些复杂的快捷键,更不需要翻看任何说明教程了!
27:42 - Part 2:语音输入法正在“逆袭”:从质疑TNT到爱上语音打字
2024年,一款语音输入法竟能融资3600万美元?我们从质疑老罗的TNT,到如今在工位上全天使用语音输入。无论是能自动去除口癖、智能排版的Wispr Flow,还是微信悄悄上线的“整理文字”功能,都预示着语音输入的时代已经到来。然而,今天的软件和操作系统,都还没有为模型准备好——这正是巨大的机会所在。此外,我们还分享了你身边就能用到的其他优秀工具与技巧,以及为什么端侧模型也有机会成为云端大模型一样的“行业黄金”。
58:24 - Part 3:人与模型的互动反常识:告别一键生成,拥抱“说得越多越好”
别再迷信“一键生成XX”的AI产品了,那大多是无法深入使用的“垃圾”。无论是Grok-4还是其他大模型,它们拥有强大的“Coder”能力,却缺乏“软件工程”能力。真正的价值诞生于深度交互:你给AI五万字,它能为你压缩出八千字的精华;让AI辅助整理会议纪要,它帮你强化关键细节而不是纯靠AI输出。从语音交互开始,我们正在告别过去几十年拥抱屏幕的病态,成为一个真正自然的人。
欢迎订阅脑放电波,2024/25苹果播客周度推荐节目、小宇宙累计10次编辑推荐单集、2024CPA播客中文奖年度科技数码类播客
欢迎在评论区留言发表你对 语音交互/人机交互 的感受与看法,我们将选取其中三位评论送出脑放电波定制周边:一把酷酷的金属电路板尺子
对于节目话题的更多观点,获取更多未呈现在节目中的扩展阅读,欢迎添加脑放电波小助手微信(BrainAMP01)加群参与讨论,后续会发布本期节目的文字稿
人物:
节目中用到的音乐:来自monkeyman535的90's Rock Style,地址freesound.org;来自kjartan_abel的Berlin Town,地址freesound.org;基于 CC BY 4.0 DEED 使用。
脑放电波往期节目精选(搜索关键词可收听)
脑放电波是一档关注科技前沿、品牌营销和个人成长的谈话类节目。每期带给您一个有趣有据的话题,帮您在信息严重过载的现代世界小幅自我迭代。您可以在小宇宙、苹果播客或者其他泛用型播客客户端搜索“脑放电波”找到并关注我们,如果您对本期节目有任何疑问,欢迎您给我们留言,如果您觉得这期内容对你有所帮助,欢迎您关注点赞收藏转发,这对我们非常重要。
24 Listeners
119 Listeners
109 Listeners
320 Listeners
24 Listeners
176 Listeners
184 Listeners
53 Listeners
272 Listeners
351 Listeners
263 Listeners
4 Listeners
314 Listeners
12 Listeners
51 Listeners