
Sign up to save your podcasts
Or


本视频由人工智能专家 Andrej Karpathy 主讲,面向大众全面且深入地介绍了像 ChatGPT 这样的大语言模型背后的运作原理。视频从数据收集、预训练(Pre-training)、神经网络结构(Transformer 模型)和推理生成(Inference),一直讲到强化学习带来的最新“推理思考”能力。Karpathy 旨在帮助观众建立正确的思维模型,了解 AI 是如何生成的,以及它的优势、局限性和在实际工作中的最佳应用方法(如作为工具使用并时刻验证其结果)。简单来说,这是一场带你从零开始看懂大语言模型前沿技术的保姆级硬核科普。
By 张开虎本视频由人工智能专家 Andrej Karpathy 主讲,面向大众全面且深入地介绍了像 ChatGPT 这样的大语言模型背后的运作原理。视频从数据收集、预训练(Pre-training)、神经网络结构(Transformer 模型)和推理生成(Inference),一直讲到强化学习带来的最新“推理思考”能力。Karpathy 旨在帮助观众建立正确的思维模型,了解 AI 是如何生成的,以及它的优势、局限性和在实际工作中的最佳应用方法(如作为工具使用并时刻验证其结果)。简单来说,这是一场带你从零开始看懂大语言模型前沿技术的保姆级硬核科普。