进入2025年,AI Agent仿佛按下了加速键:从OpenAI推出自助浏览器Operator,到Manus爆火出圈并获7500万美元融资。究竟是什么引爆了这轮AI Agent的热潮?
代码能力的提升为AI Agent的奠定了基础,RFT(强化学习微调)带来了大模型的“AlphaGo”时刻,嘉宾甚至都感叹“时代变了,开发产品成本低得有点恐怖”。但通用AI Agent是否真的是未来?数据壁垒、用户认知成本以及网络效应的缺失,都可能成为其发展的桎梏。 或许,更具前景的是那些深耕垂直领域的“小而美”的Agent?本期节目,我们将一同探讨AI Agent的核心技术、热门产品体验、创业机会与挑战,以及AI Agent的未来将走向何方?
陶芳波,MindVerse心识宇宙创始人
侯泰羽(Kolento Hou),纽约大学本科应用心理学,AI产品经理
RFT推动的Agent热潮
00:05 AI Agent进展大事件以及爆发三大核心原因
04:55 机器学习视角下的Agent进化
06:36 RFT(强化学习微调)技术促使Agent在2025年具有智能
08:10 大语言模型的AlphaGo时刻:不仅具有思考能力,还根据环境反馈调整学习
11:04 过去半年新趋势:Agent在环境中完成任务
14:27 OpenAI Operator买菜的体验:速度慢、准确率不高
17:32 内化工作流:新一代Agent能做出临场反应
20:55 创造虚拟环境:Scrapybara帮我买秋裤
22:39 Cursor与Windsurf编程Agent为何出圈?
26:11 AI创业门槛降低,可以做平台上那些小而美的Agent
32:53 Manus擅长广度,Deep Research擅长深度
38:05 Agent爆火背后的秘密:Sonnet 3.5代码质量的提升
40:57 比训练更重要?Evaluation的三代进化
44:02 SFT更便宜,RFT效果更优,行业会如何选择?
48:45 在关键场景请求人类对齐:Replit和Fellou的优秀交互体验
50:13 最看好Cursor,有成为通用Agent的潜力
52:25 Vantel:每周帮保险经纪人省10小时的保险垂类Agent
53:29 Sweetspot:换了八九个邮箱也要用的,辅助申请资助类Agent
54:23 Gamma:秒杀Canva的PPT设计类Agent
57:48 做的200多个Agent中,商业化成功的案例
59:20 “越做发现问题越多”:离普通人每天使用Agent仍有距离
RFT:Reinforcement Fine-Tuning,强化学习微调
SFT:Supervised Fine-Tuning,监督学习微调
MCP:Model Context Protocol,模型上下文协议
泓君
【后期】
AMEI
【运营】
Anticipating a New Day - Stationary Sign
City Phases STEMS INSTRUMENTS - John Abbot
Hidden Agenda
Clockmaker's Daydream - 369
公众号:硅谷101
收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐
其他平台:YouTube|Bilibili 搜索「硅谷101播客」
联系我们:
[email protected]Special Guests: 侯泰羽 and 陶芳波.