Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
February 12, 2025s1: 简单测试时缩放5 minutesPlay本播客讨论了一种新的语言建模方法,该方法使用额外的测试时计算来提高性能。我们介绍了 s1K,这是一个包含 1000 个问题的数据集,并开发了预算强制来控制测试时计算。...moreShareView all episodesBy weedgeFebruary 12, 2025s1: 简单测试时缩放5 minutesPlay本播客讨论了一种新的语言建模方法,该方法使用额外的测试时计算来提高性能。我们介绍了 s1K,这是一个包含 1000 个问题的数据集,并开发了预算强制来控制测试时计算。...more
February 12, 2025s1: 简单测试时缩放5 minutesPlay本播客讨论了一种新的语言建模方法,该方法使用额外的测试时计算来提高性能。我们介绍了 s1K,这是一个包含 1000 个问题的数据集,并开发了预算强制来控制测试时计算。...more