
Sign up to save your podcasts
Or


自从 ChatGPT 横空出世,几乎所有关于大模型的讨论都离不开 Transformer,那 Transformer 架构也支撑了这一轮生成式 AI 的快速发展。然而在 Transformer 架构的背后,行业也遇到了难以回避的瓶颈:推理和训练成本居高不下,长上下文能力依赖庞大的显存和算力,端侧部署和商业落地困难。Transformer 的困境让神经网络的另一条路径重新被审视——那就是RNN,循环神经网络。
本期人物
主要话题
延伸阅读
Mamba 架构
LSTM(Long Short-Term Memory)
MoE 模型
XR(Extended Reality)
幕后制作
商业合作
🌍「Knock Knock 世界」特别节目上线!
加入声动活泼
关于声动活泼
Special Guest: 罗璇.
By 声动活泼4.7
173173 ratings
自从 ChatGPT 横空出世,几乎所有关于大模型的讨论都离不开 Transformer,那 Transformer 架构也支撑了这一轮生成式 AI 的快速发展。然而在 Transformer 架构的背后,行业也遇到了难以回避的瓶颈:推理和训练成本居高不下,长上下文能力依赖庞大的显存和算力,端侧部署和商业落地困难。Transformer 的困境让神经网络的另一条路径重新被审视——那就是RNN,循环神经网络。
本期人物
主要话题
延伸阅读
Mamba 架构
LSTM(Long Short-Term Memory)
MoE 模型
XR(Extended Reality)
幕后制作
商业合作
🌍「Knock Knock 世界」特别节目上线!
加入声动活泼
关于声动活泼
Special Guest: 罗璇.

22 Listeners

114 Listeners

328 Listeners

27 Listeners

473 Listeners

190 Listeners

56 Listeners

12 Listeners

290 Listeners

14 Listeners

368 Listeners

296 Listeners

8 Listeners

38 Listeners

23 Listeners

313 Listeners

49 Listeners

52 Listeners

32 Listeners