张小珺Jùn|商业访谈录

76. 王小川返场谈o1与强化学习:摸到了一条从快思考走向慢思考的路


Listen Later

在过去两集节目中,关于OpenAI o1和AGI范式转移,我们先是推出了一集预言,之后推出了一集解析。在一个新范式来临的临界点上,我们希望听到更多来自业界不同视角的声音。哪怕这些声音是切片的、冲突的,我们都希望当做一种记忆和留存收集起来。

今天这期是王小川的返场。

王小川在创业开始就关注到强化学习并且很早开始公开谈论。他曾说,大模型代表快思考,它叫“学”;强化学习是慢思考,它叫“思”。“学”和“思”两个系统最终会走向融合。除了o1,王小川也聊了聊强化学习在一个特定场景——医疗——中的应用。

我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)
  • 01:30 大模型是“学而不思则罔”,强化学习是“思而不学则殆”
  • 03:45 Sam Altman被宫斗下课与强化学习大神Noam Brown的动态
  • 05:45 OpenAI o1是范式升级,摸到了一条从快思考走向慢思考的道路
  • (DIKW模型:Data – Information – Knowledge – Wisdom)
  • 08:18 怎么看o1隐藏思维过程,有人破解o1思维链会被警告要封号?
  • 09:04 从以语言为核心走向思维链,分两阶段运行增加泛化性
  • 11:38 强化学习 vs 监督学习
  • 16:39 除了数学和代码以外,医疗是可以用强化学习提升的领域
  • 19:55 之前做强化学习实验没有CoT(思维链),今天更强调CoT了
  • 22:16 复现o1 vs 复现GPT-4
  • 26:30 未来几年将从强化学习范式走向写代码解决问题新范式
  • 28:35 做“水涨船高的应用”,不只是“沿途下蛋的应用”
  • 31:35 创业公司要走出大厂射程,在射程内你是没什么好活的

【更多信息】

联络我们:微博@张小珺-Benita,小红书@张小珺jùn

更多信息欢迎关注公众号:张小珺

...more
View all episodesView all episodes
Download on the App Store

张小珺Jùn|商业访谈录By 张小珺

  • 4.5
  • 4.5
  • 4.5
  • 4.5
  • 4.5

4.5

27 ratings


More shows like 张小珺Jùn|商业访谈录

View all
疯投圈 by 黄海、Rio

疯投圈

109 Listeners

声东击西 by ETW Studio

声东击西

316 Listeners

创业内幕 Startup Insider by 纪源小馆

创业内幕 Startup Insider

42 Listeners

What's Next|科技早知道 by 声动活泼

What's Next|科技早知道

177 Listeners

硅谷101 by 硅谷101

硅谷101

164 Listeners

硅谷101|中国版 by 泓君Jane

硅谷101|中国版

52 Listeners

商业就是这样 by 商业就是这样

商业就是这样

272 Listeners

晚点聊 LateTalk by 晚点 LatePost

晚点聊 LateTalk

23 Listeners

大小马聊科技 by 大小马聊科技

大小马聊科技

4 Listeners

起朱楼宴宾客 by 大卫翁

起朱楼宴宾客

45 Listeners

半拿铁 | 商业沉浮录 by 潇磊&刘飞

半拿铁 | 商业沉浮录

289 Listeners

高能量 by 李翔李翔

高能量

27 Listeners

知本论 by 知本论

知本论

4 Listeners

厚雪长波 by 雪球官方账号

厚雪长波

8 Listeners

42章经 by KaiQu

42章经

9 Listeners