Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
March 06, 2025ZeRO: 内存优化实现万亿参数模型训练4 minutesPlay本次播客深入探讨了微软提出的ZeRO技术,该技术通过消除数据和模型并行训练中的内存冗余,显著提高了训练速度并增加了可高效训练的模型大小。...moreShareView all episodesBy weedgeMarch 06, 2025ZeRO: 内存优化实现万亿参数模型训练4 minutesPlay本次播客深入探讨了微软提出的ZeRO技术,该技术通过消除数据和模型并行训练中的内存冗余,显著提高了训练速度并增加了可高效训练的模型大小。...more
March 06, 2025ZeRO: 内存优化实现万亿参数模型训练4 minutesPlay本次播客深入探讨了微软提出的ZeRO技术,该技术通过消除数据和模型并行训练中的内存冗余,显著提高了训练速度并增加了可高效训练的模型大小。...more