Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
June 29, 2026007. 伯克利 忙秋阳:AI 做科研,人类做什么?本期嘉宾忙秋阳在过去的一年经历了三个大的转变:从相信人类智慧无法战胜的算法竞赛世界级选手,到坦然接受 AI 在算法上超越了他;从利用算法研究计算的自动化,到利用 AI 研究算法研究的自动化;从小而美的小组科研,到大成本、大规模的大团队作战。他行为的变化背后是认知的转变:过去,人类自己提出问题,也自己解决问题,自己设计算法,处理数据,设计实验。而现在,AI 面对人类提出的问题,正在自动化解决问题这件事本身。秋阳带领团队发表的 FrontierCS,就是一个测试 AI 面对开放性问题解决能力的数据集,Frontier 的意思是边界,他想要探索 AI 代替人类科研的边界在哪里,随着 AI 和人类分工边界的移动,人类在科研探索中还要扮演什么角色?本期 AI 实话实说,我们和秋阳聊了算法竞赛、Frontier CS、开放式科研、合成数据、AI for Science,以及一个更大的问题:如果 ...去小宇宙查看完整单集简介在小宇宙查看该单集文稿...more1h 52minPlay
June 18, 2026006. 再访姚巍然:医疗Agent能替真人干活吗?硅谷 AI 的节奏飞旋,一月如一年,时隔四个月,我们再度访谈 ActAVA AI 的联合创始人姚巍然。只为问出一个核心问题:在医疗健康领域,AI Agent 是否可以替真人干活?Claude Code、Codex 这类工具所带来的深度变革已经改写了软件工程这个行业。但是一旦把AI外推到其他的行业中,质疑的声音总是接踵而至——AI是否可以在具体和复杂的沟通与规定场景下替代人类。本期嘉宾巍然的答案是:不行!至少现在还不能......巍然团队最近发布了一个面向医疗工作流的 Agent Benchmark:χ-Bench。它测试的是 AI Agent 能不能自动化端到端、长链条、政策密集的医疗流程,比如 prior authorization、utilization management 和 care management。这个 benchmark 虽然只是针对医疗领域,但是它对于其他行业应...去小宇宙查看完整单集简介在小宇宙查看该单集文稿...more1h 33minPlay
June 13, 2026005. 姚巍然:从 Salesforce 出走,做 Cursor for Healthcare医疗是个大问题。在美国,这个问题集中体现在高昂的医疗支出和不公平的保险理赔。医疗产业中三大关键角色:病人、医院和保险公司之间需要大量繁琐、重复、敏感的行政工作。本期嘉宾姚巍然,是 Activa AI 的 co-founder。博士期间,他研究 causal AI;在 Salesforce AI Research,他很早参与了 AI Agent 和deep research agent 等方向;现在,他把这些经验带进了医疗行业,试图做一件很难但很现实的事:把医疗系统里的行政工作,用 AI Agent 自动化。这期节目里,我们从他的个人经历聊到 Salesforce 为什么没有成为 Agent 时代的先锋,从 Cursor 为什么好用聊到“Cursor for Healthcare”到底是什么意思,从美国医疗系统里的 payer/provider 结构聊到保险拒赔、AI 公正性、责任归属和...去小宇宙查看完整单集简介在小宇宙查看该单集文稿...more1h 57minPlay
January 22, 2026003. MIT Alex Gu: AI 做数学能代替数学家吗?今年 1 月 13 号,在 arxiv 出现了一篇论文(2601.07222),它证明了代数几何里的一个新定理,特别的是,这篇文章中的一个重要证明是由谷歌的 Gemini 模型生成的。文章作者之一,美国数学学会主席 Ravi Vakil 教授评价道,Gemini 的证明严格、正确,优雅,并不是已有文献的重组。教授表示,如果这个证明是他本人做出来的,他也会因此觉得自豪。类似的新闻我们最近听到得越来越多,就比如说,菲尔兹奖得主陶哲轩是 AI 数学的忠实用户和倡导者,自己也参与了用 AI 加上形式化验证来解决数学问题的工作。本期嘉宾 Alex Gu 就是陶哲轩在 AI 数学上的合作者之一,他所在的 8 人创业公司 Math, Inc 邀请了陶与他们合作,共同开发他们的 AI 形式化数学 Agent 高斯,并在 1月 16 号刚刚完成了对超椭圆曲线的黎曼猜想及其证明的形式化。本期 AI 实话实...去小宇宙查看完整单集简介在小宇宙查看该单集文稿...more1h 49minPlay
January 18, 2026002. 和龚珊三、姚锦炜聊聊扩散语言模型大家熟悉的语言模型,比如 chatgpt ,采取的是自回归(autoregressive,AR)的生成方式,一句话从第一个字开始,一个字一个字地生成,一直到最后一个字。Diffusion 语言模型,扩散语言模型,则没有严格的顺序,也没有一次生成字数的限制,每一次可以在句子的各个位置生成任意数量的文字。所以它被叫做非自回归(non autoregressive)。扩散语言模型正在受到学术界和工业界的极大关注。本期 AI 实话实说,我们邀请了龚珊三,姚锦炜两位参与过 diffusion LM 研究和开发工作的同学,共同探讨扩散语言模型的过去、现在和将来。珊三是港大博士生,从 22 年起深耕 diffusion LM,发表了早期有代表性的 diffusion LM Diffuseq,提出了将自回归语言模型转化为 diffusion LM 的方法,还在 Apple 训练了 7B 用于代码生...去小宇宙查看完整单集简介在小宇宙查看该单集文稿...more2h 7minPlay
January 03, 2026001. 和 SGLang RL Lead 赵晨阳聊聊 AI Infra 和开源社区这是 AI 实话实说的第一期节目,我们请到了赵晨阳。晨阳本科毕业于清华大学,目前是 UCLA PhD on leave。他从 2024 年 7 月份开始参与主流 LLM 推理引擎 SGLang 的开发,是 SGLang 的核心贡献者和 RL lead,现在也和 SGLang 的许多开发者一起在 RadixArk AI 创业,继续做开源 AI Infra,开发开源 RL 框架 Miles。嘉宾主页:zhaochenyang20.github.io/Chayenne嘉宾小红书:我,吉他,猫,LLM。欢迎关注节目同名小红书 AI 实话实说 加入群组参与互动,关注同名微信公众号获取文字内容。跳转精彩内容00:01:34 嘉宾自我介绍00:02:20 为什么从做算法变成做 Infra?00:10:00 做 infra 是为了最大化 impact?00:12:30 存在 bug 的...去小宇宙查看完整单集简介在小宇宙查看该单集文稿...more1h 40minPlay