OnBoard!

EP 53. AI Agent会取代程序员吗?硬核对话硅谷顶尖研究员与AI独角兽:软件开发的未来,Agent的技术本质


Listen Later

今年上半年 AI 领域最大的热点,除了 OpenAI 的 Sora 之外,当然就是——AI程序员!与 Github Copilot 的代码补全不同,AI Agent 公司 Cognition Labs 和其产品 Devin,宣称世界上第一位“AI 软件工程师”,拥有全栈技能,通过一个指令就能完成整个开发过程。可以端到端构建和部署程序。成立不到半年,估值就高达 20 亿美金!相应的,从Princeton SWE-agent, 到开源项目OpenDevin 这些直接竞争者,到Replit, Augment 等独角兽玩家,都纷纷进入这个领域。这是新的泡沫,还是不远的未来?

Hello World, who is OnBoard!?

这一期我们邀请的三位来自硅谷的嘉宾,在这个领域都太有发言权了!有著名的软件开发云平台独角兽 Replit 的 AI 产品核心成员,有 Agent 领域数个奠基之作的顶尖研究员,还有 ex-Google Deepmind, 现任明星 AI 编程辅助独角兽公司 Augment 的早期核心研究员。

借着小酒,我们长达两个多小时的对话,畅聊了你最关心的话题:

AI 会取代工程师吗?

AI取代了一部分软件开发需求之后,会如何重塑软件开发?

Devin 是否能代表 AI Agent 应用开发的方向?

Agent 产品未来还会迎来怎样的提升?基础大模型的边界在哪里?

最后,生成式 AI 对个人职业和社会会产生怎样的深远影响?

这或许是市面上你能听到的对于这个话题最深入的讨论(之一?!)——还有,结尾有来自 Princeton 高材生的彩蛋!

Enjoy!

嘉宾介绍:

  • 李珎:Replit AI 团队负责 AI Coding agent,ex- startup 创始人, ex- Googler。Replit 成立于 2016 年,是一个基于浏览器的 IDE,允许用户在多种编程语言中编写、运行和分享代码。2023 年$97.4M 的 B 轮,投资人包括 A16Z,Khosla Ventures、Coatue 等,估值 $1.16B
  • 姚顺雨:普林斯顿大学博士,清华大学获学士。他在Agent 领域发表了一系列非常有影响力的论文:从有奠基意义的 ReAct,Tree of Thoughts, 到成为行业标准的基于 GitHub 的代码能力评估数据集 SWE-Bench,到首个开源AI 程序开发 agent 项目 SWE-agent,是绝对的天才研究员!
  • 赵宇哲:Augment 任 AI 研究员,曾在Google Brain(现Google Deepmind)任 Staff Research Engineer,主要研究方向是语言模型预训练,指令训练,神经检索和检索增强语言模型。Augment 成立于 2022 年,是一家为提供企业级全栈式 AI 编程助手的初创公司,由硅谷著名老牌风投 Sutter Hill Ventures 孵化(Snowflake也诞生于此),并在最新一轮获得由Index Ventures、Lightspeed Venture Partners 和 Google 前 CEO Eric Schmidt 等领投的 2.5 亿美金融资,估值接近 10 亿美金。

OnBoard! 主持

  • Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学
  • 高宁:前美元 VC 投资人,Global SaaS 社区及服务组织 Linkloud 联创,公众号我思锅我在 (ID: thinkxcloud) 主理人。| 即刻:High寧

我们都聊了什么

03:30 三位嘉宾背景、如何进入AI领域以及最近常用的AI产品。

20:26 Replit是如何设计AI产品的,背后逻辑是什么?

28:58 Replit需要训练Coding专属模型的原因是什么?

34:04 训练代码或数学等专属模型的目的是什么?

37:50 现在Coding模型跟基础大模型的能力相比有什么差异?

40:51 Coding模型的训练方法对基础大模型的训练还有什么启发?

45:26 为什么Replit当初选择构建自己的IDE,以及对后来AI功能设计的影响在哪里?

51:01 为什么Augment选择以插件的形态服务专业程序员,以及难点在哪里?

55:27 为什么RAG能更好理解企业级Codebase的需求?

58:13 使用RAG的过程中最有挑战的地方在哪里,以及如何保证准确率?

63:38 Augment如何将服务企业的产品标准化?

67:04 为什么短时间内具有更长Context的大模型仍无法替代RAG?

69:57 为什么没有针对Coding能力好的Benchmark,以及SWE-Bench诞生的背景?

73:48 什么是SWE-Agent,以及Agent解决了什么问题?

78:50 为什么SWE-Agent或Devin相比RAG的准确率有很大提升?

81:33 SWE-Agent跟Devin的差异在哪里?

83:12 往后这类Coding agent的准确率提升会在哪里?

86:50 回顾Agent领域的发展,其中有哪些重要里程碑?

93:01 是否有必要训练针对Agent的大模型?

98:37 Replit是如何探索Coding agent的?

102:03 对Devin印象最深刻的是什么,还有什么是不知道的?

105:43 Devin现在的用户画像可能是谁?

109:45 为什么Coding agent能力提升不仅在大模型上,还需在产品化上?

116:46 顺雨最新一篇解决奥数问题的研究对Coding模型有什么启发?

120:31 现在基础大模型的能力提升还在哪里,还有哪些是我们不知道的?

122:15 大模型是否具备System 2的慢思考能力,以及我们如何实现?

127:13 关于Multi-agent,Replit在做怎样的探索?

131:13 如何定义Multi-agent系统,什么情况下需要?

135:08 要实现Multi-agent环境,具体会面临什么挑战?

137:31 展望未来,AI编程究竟会如何重塑软件开发流程?

145:45 基于语言模型的Agent带来的社会影响有哪些,人类真的会被替代吗?

158:56 最后,快问快答:今年研究的小目标、业余爱好和短期内AI最期待的事件?

165:14 彩蛋!来自顺雨的一段RAP,欢迎来到“宇宙中心”!

我们提到的公司或产品

  • Devin
  • SWE-Agent
  • Augment
  • Sierra | The Conversational AI Platform
  • Replit
  • Buildspace
  • Heygen | AI Video Generator
  • Fiverr - Freelance Services Marketplace
  • Magic.dev
  • Scale AI: Accelerate the Development of AI Applications
  • RAG: Retrieval-Augmented Generation
  • Voyage AI
  • OpenDevin: Code Less, Make More
  • Adept AI
  • imbue

我们提到的论文或文章

  • SWE-bench
  • BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
  • LaMDA: our breakthrough conversation technology
  • Measuring Massive Multitask Language Understanding
  • Synergizing Reasoning and Acting in Language Models
  • Cognitive Architectures for Language Agents
  • Tree of Thoughts: Deliberate Problem Solving with Large Language Models
  • ReAct: Synergizing Reasoning and Acting in Language Models
  • Can Language Models Solve Olympiad Programming?
  • Announcing Replit AI for All
  • Introducing Multiplayer AI Chat
  • Replit AI Manifesto
  • AI Agent Code Execution API
  • princeton-nlp.github.io
  • The Worlds I See: Curiosity, Exploration, and Discovery at the Dawn of AI

欢迎我们的微信公众号,了解更多中美软件、AI与创业投资的干货内容!

M小姐研习录 (ID: MissMStudy)

我思锅我在(ID: Thinkxcloud)

欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。

OnBoard! 终于成立听友群啦!新年新气象,加入Onboard听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes, 发送你的姓名、公司和职位,小助手会拉你进群。期待你来!

...more
View all episodesView all episodes
Download on the App Store

OnBoard!By Monica Xie

  • 5
  • 5
  • 5
  • 5
  • 5

5

37 ratings


More shows like OnBoard!

View all
疯投圈 by 黄海、Rio

疯投圈

109 Listeners

三五环 by 刘飞Lufy

三五环

44 Listeners

科技乱炖 by DAO

科技乱炖

24 Listeners

What's Next|科技早知道 by 声动活泼

What's Next|科技早知道

178 Listeners

硅谷101 by 硅谷101

硅谷101

184 Listeners

硅谷101|中国版 by 泓君Jane

硅谷101|中国版

53 Listeners

商业就是这样 by 商业就是这样

商业就是这样

272 Listeners

晚点聊 LateTalk by 晚点 LatePost

晚点聊 LateTalk

23 Listeners

大小马聊科技 by 大小马聊科技

大小马聊科技

4 Listeners

起朱楼宴宾客 by 大卫翁

起朱楼宴宾客

51 Listeners

半拿铁 | 商业沉浮录 by 潇磊&刘飞

半拿铁 | 商业沉浮录

291 Listeners

张小珺Jùn|商业访谈录 by 张小珺

张小珺Jùn|商业访谈录

27 Listeners

高能量 by 李翔李翔

高能量

30 Listeners

知本论 by 知本论

知本论

4 Listeners

42章经 by KaiQu

42章经

9 Listeners