Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
September 29, 2025深入探索DeepSeek-V3.2-Exp:稀疏注意力如何提升长上下文效率?11 minutesPlay本期AI电台FM将深入探讨DeepSeek-AI最新推出的实验性稀疏注意力模型DeepSeek-V3.2-Exp。我们将揭秘其核心技术——DeepSeek稀疏注意力(DSA)如何通过闪电索引器和精细化令牌选择机制,在保持模型性能的同时,显著提升长上下文场景下的训练和推理效率。从架构设计到训练策略,再到实战评估,weedge专家将为您带来全面而生动的解读。...moreShareView all episodesBy weedgeSeptember 29, 2025深入探索DeepSeek-V3.2-Exp:稀疏注意力如何提升长上下文效率?11 minutesPlay本期AI电台FM将深入探讨DeepSeek-AI最新推出的实验性稀疏注意力模型DeepSeek-V3.2-Exp。我们将揭秘其核心技术——DeepSeek稀疏注意力(DSA)如何通过闪电索引器和精细化令牌选择机制,在保持模型性能的同时,显著提升长上下文场景下的训练和推理效率。从架构设计到训练策略,再到实战评估,weedge专家将为您带来全面而生动的解读。...more
本期AI电台FM将深入探讨DeepSeek-AI最新推出的实验性稀疏注意力模型DeepSeek-V3.2-Exp。我们将揭秘其核心技术——DeepSeek稀疏注意力(DSA)如何通过闪电索引器和精细化令牌选择机制,在保持模型性能的同时,显著提升长上下文场景下的训练和推理效率。从架构设计到训练策略,再到实战评估,weedge专家将为您带来全面而生动的解读。
September 29, 2025深入探索DeepSeek-V3.2-Exp:稀疏注意力如何提升长上下文效率?11 minutesPlay本期AI电台FM将深入探讨DeepSeek-AI最新推出的实验性稀疏注意力模型DeepSeek-V3.2-Exp。我们将揭秘其核心技术——DeepSeek稀疏注意力(DSA)如何通过闪电索引器和精细化令牌选择机制,在保持模型性能的同时,显著提升长上下文场景下的训练和推理效率。从架构设计到训练策略,再到实战评估,weedge专家将为您带来全面而生动的解读。...more
本期AI电台FM将深入探讨DeepSeek-AI最新推出的实验性稀疏注意力模型DeepSeek-V3.2-Exp。我们将揭秘其核心技术——DeepSeek稀疏注意力(DSA)如何通过闪电索引器和精细化令牌选择机制,在保持模型性能的同时,显著提升长上下文场景下的训练和推理效率。从架构设计到训练策略,再到实战评估,weedge专家将为您带来全面而生动的解读。