张小珺Jùn|商业访谈录

76. 王小川返场谈o1与强化学习:摸到了一条从快思考走向慢思考的路


Listen Later

在过去两集节目中,关于OpenAI o1和AGI范式转移,我们先是推出了一集预言,之后推出了一集解析。在一个新范式来临的临界点上,我们希望听到更多来自业界不同视角的声音。哪怕这些声音是切片的、冲突的,我们都希望当做一种记忆和留存收集起来。

今天这期是王小川的返场。

王小川在创业开始就关注到强化学习并且很早开始公开谈论。他曾说,大模型代表快思考,它叫“学”;强化学习是慢思考,它叫“思”。“学”和“思”两个系统最终会走向融合。除了o1,王小川也聊了聊强化学习在一个特定场景——医疗——中的应用。

我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)
  • 01:30 大模型是“学而不思则罔”,强化学习是“思而不学则殆”
  • 03:45 Sam Altman被宫斗下课与强化学习大神Noam Brown的动态
  • 05:45 OpenAI o1是范式升级,摸到了一条从快思考走向慢思考的道路
  • (DIKW模型:Data – Information – Knowledge – Wisdom)
  • 08:18 怎么看o1隐藏思维过程,有人破解o1思维链会被警告要封号?
  • 09:04 从以语言为核心走向思维链,分两阶段运行增加泛化性
  • 11:38 强化学习 vs 监督学习
  • 16:39 除了数学和代码以外,医疗是可以用强化学习提升的领域
  • 19:55 之前做强化学习实验没有CoT(思维链),今天更强调CoT了
  • 22:16 复现o1 vs 复现GPT-4
  • 26:30 未来几年将从强化学习范式走向写代码解决问题新范式
  • 28:35 做“水涨船高的应用”,不只是“沿途下蛋的应用”
  • 31:35 创业公司要走出大厂射程,在射程内你是没什么好活的

【更多信息】

联络我们:微博@张小珺-Benita,小红书@张小珺jùn

更多信息欢迎关注公众号:张小珺

...more
View all episodesView all episodes
Download on the App Store

张小珺Jùn|商业访谈录By 张小珺

  • 4.5
  • 4.5
  • 4.5
  • 4.5
  • 4.5

4.5

33 ratings


More shows like 张小珺Jùn|商业访谈录

View all
疯投圈 by 黄海、Rio

疯投圈

113 Listeners

创业内幕 Startup Insider by 纪源小馆

创业内幕 Startup Insider

42 Listeners

三五环 by 刘飞Lufy

三五环

45 Listeners

硅谷101 by 硅谷101

硅谷101

198 Listeners

硅谷101|中国版 by 泓君Jane

硅谷101|中国版

56 Listeners

商业就是这样 by 商业就是这样

商业就是这样

292 Listeners

大小马聊科技 by 大小马聊科技

大小马聊科技

5 Listeners

Web3 101 by Web3 101

Web3 101

24 Listeners

半拿铁 | 商业沉浮录 by 潇磊&刘飞

半拿铁 | 商业沉浮录

323 Listeners

42章经 by KaiQu

42章经

12 Listeners

起朱楼宴宾客 by 大卫翁

起朱楼宴宾客

52 Listeners

厚雪长波 by 雪球官方账号

厚雪长波

10 Listeners

知本论 by 知本论

知本论

4 Listeners

高能量 by 李翔李翔

高能量

32 Listeners

小Lin说 by 小Lin说

小Lin说

52 Listeners