AI Podcast

DeepSpeed-MoE:推进专家混合推理和训练,助力下一代人工智能规模


Listen Later

本次播客深入探讨了DeepSpeed-MoE,这是一个端到端的专家混合(MoE)训练和推理解决方案,旨在解决大型MoE模型在实际应用中的挑战。讨论涵盖了新颖的MoE架构设计、模型压缩技术以及高度优化的推理系统,这些技术显著降低了MoE模型的推理延迟和成本。
...more
View all episodesView all episodes
Download on the App Store

AI PodcastBy weedge