AI Podcast

AI Radio FM - 高效人工智能实践


Listen Later

本期播客讨论了在工业应用中训练和部署高效大型语言模型(LLMs)的实用方法。主题包括知识蒸馏、模型压缩技术(如量化和剪枝),以及在实际部署中优化硬件和提高推理速度的策略。
...more
View all episodesView all episodes
Download on the App Store

AI PodcastBy weedge