
Sign up to save your podcasts
Or
自从 ChatGPT 横空出世,几乎所有关于大模型的讨论都离不开 Transformer,那 Transformer 架构也支撑了这一轮生成式 AI 的快速发展。然而在 Transformer 架构的背后,行业也遇到了难以回避的瓶颈:推理和训练成本居高不下,长上下文能力依赖庞大的显存和算力,端侧部署和商业落地困难。Transformer 的困境让神经网络的另一条路径重新被审视——那就是RNN,循环神经网络。
本期人物
主要话题
延伸阅读
Mamba 架构
LSTM(Long Short-Term Memory)
MoE 模型
XR(Extended Reality)
幕后制作
商业合作
🌍「Knock Knock 世界」特别节目上线!
加入声动活泼
关于声动活泼
Special Guest: 罗璇.
4.7
173173 ratings
自从 ChatGPT 横空出世,几乎所有关于大模型的讨论都离不开 Transformer,那 Transformer 架构也支撑了这一轮生成式 AI 的快速发展。然而在 Transformer 架构的背后,行业也遇到了难以回避的瓶颈:推理和训练成本居高不下,长上下文能力依赖庞大的显存和算力,端侧部署和商业落地困难。Transformer 的困境让神经网络的另一条路径重新被审视——那就是RNN,循环神经网络。
本期人物
主要话题
延伸阅读
Mamba 架构
LSTM(Long Short-Term Memory)
MoE 模型
XR(Extended Reality)
幕后制作
商业合作
🌍「Knock Knock 世界」特别节目上线!
加入声动活泼
关于声动活泼
Special Guest: 罗璇.
21 Listeners
109 Listeners
321 Listeners
459 Listeners
27 Listeners
183 Listeners
53 Listeners
11 Listeners
273 Listeners
13 Listeners
345 Listeners
23 Listeners
264 Listeners
7 Listeners
36 Listeners
51 Listeners
312 Listeners
46 Listeners
30 Listeners