活动预告🥳:4 月 26 日,我们会请到 sheet0.com 创始人文锋做一场线下活动,大家记得翻到 shownotes 末尾查看报名信息!
关于 Agent 这个话题,我自己有一些核心在思考的问题,相信这些也是很多人同样会有疑问的地方,这期播客中我们就这些问题展开了讨论,并基本得到了一些答案:
1)怎么定义 Agent,Agent 最重要的是什么
2)今天的 Agent 和两年前的 Agent 的区别是什么
3)如何简单快速理解 Function Call,Coding Agent,MCP,A2A,Computer Use,Browser Use 等概念
4)不同方式的区别是什么,有什么优劣之分吗
5)怎么看通用 Agent 和垂直 Agent 的区别,终局是什么
6)AI Coding 和 Agent 最终会是一件事吗,或者二者会有什么关联
7)Workflow 和 Agent 的区别和终局
8)RL 这件事在 Agent 里的重要程度是什么,一家公司(尤其是做 Agent 的创业公司)到底该如何使用 RL
9)大模型自身的 Agent 比如 OpenAI Operator 和其他应用产品的区别是什么,最终市场形态会怎样
10)如何快速判断一家 Agent 公司做得好不好
另外,在整段讨论中,本期嘉宾文锋基于长时间对 Agent 的研究和实操,还提出了很多理解和分析 Agent 的框架和关键要素,以及在接近结尾部分留下了让我非常有启发的一句话:AI Coding 是大模型的灵巧手。
【人类博物馆】
导游:曲凯,42章经创始人
33 号珍藏:王文锋,Agent builder,sheet0.com Founder & CEO,连续创业者,有近十年 AI、Data Infra 产品设计和 Coding 经验。sheet0.com 已开放 waiting list 申请,即将内测。
【时光机】
- 00:47 Agent 三要素:LLM、Context、Tool Use
- 1:17 这波 Agent 和过去两年的区别是什么?
- 2:30 怎么理解 Agent 中的 Context?
- 4:21 快速理解 Tool Use 的不同方案
- 4:40 代码调用支线:Function Call、MCP、A2A 之间的区别是什么?
- 6:35 模拟人类支线:浏览器是大模型能调用的最重要的工具
- 7:07 两条支线各有优缺点,也可以混合起来
- 10:27 Manus、Devin、Genspark 各用的什么方案?
- 12:25 Browser Use 的核心价值是给用户提供「安全感」
- 14:19 AI Coding 和 Agent 最终会殊途同归吗?
- 16:15 Agent 的终局会走向通用还是垂直?
- 17:17 脱离了 RL,Agent 就不成立了
- 19:15 所以 Agent 创业公司该如何使用 RL?
- 22:54 一个非共识理解:聊天框 + 场景推荐 UI 界面就是最好的交互形态
- 31:54 Sheet0 是一个怎样的 Agent 产品?
- 34:15 怎么把任务执行的准确率做到了 100%?
- 35:39 Workflow 会被 Agent 颠覆掉吗?
- 36:49 不同 Agent 的核心区别是什么?
- 39:05 AI Coding 是大模型的「灵巧手」
- 41:41 Agent 有两大「信任」命题
- 44:22 分享一个预测 Agent 未来发展的思考框架
- 47:33 如何快速判断一家 Agent 公司做得好不好?
【Reference】
文锋推荐大家都读一读强化学习之父 Richard Sutton 的《Reinforcement Learning:An Introduction》
【活动预告🥳】
4 月 26 日,我们会请到文锋做一场线下活动,感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流!
【The gang that made this happen】
- 制作人:陈皮、Celia
- 剪辑:陈皮
- Bgm:Mondo Bongo - Joe Strummer & The Mescaleros