OnBoard!

EP 36. 对话Deepmind, 英伟达大语言模型专家(上):AI Agent智能体与开源LLM的应用、挑战与未来


Listen Later

承诺大家的大波AI上新来啦!这次的嘉宾是Monica一直期待的重磅组合,能听到AI领域如此一线的核心从业者的分享,真是太难得了。这次在硅谷创新腹地,毗邻 Stanford 的 Palo Alto 线下录制, 不知不觉就聊了近三个小时,我们分成上下期,方便大家收听!

Hello World, who is OnBoard!?

两位AI研究者都在OpenAI 工作过。Nvidia 资深研究员 Jim Fan,是Twitter 上AI领域的顶尖KOL,连亚马逊的创始人 Jeff Bezos 都在关注,几乎每一条twitter 分析都是必读文章。戴涵俊是Google Deepmind 的资深研究员,更是Google 大语言模型的深度参与者。再次来串台的硅谷上市公司华人高管,硅谷徐老师, 持续高质量输出。

上期的内容,我们围绕最近AI领域最火的话题,Generative Agents(生成式智能体)。两位AI研究员都对这个领域有最一线的研究和实践经验,我们深入探讨了从AutoGPT开始,Generative Agents 从技术到应用,都有哪些新的进展、技术和场景的挑战,由此延伸到开源与闭源大语言模型的竞争格局。

跟EP35 Monica 与另一位AI研究员符尧的访谈对比听听就发现,Generative Agents 这个前沿领域,显然还有很多尚未有共识的地方。

下一期,我们会讨论更多AI领域核心话题,包括多模态模型,机器人应用落地,AI对saas的影响,LLM发展史,未来畅想等等,更是不容错过。赶紧关注Onboard!

几位嘉宾都是长期在美国工作生活,夹杂英文在所难免,不接受抱怨。Enjoy!

嘉宾介绍

Jim Fan(推特:@DrJimFan),Nvidia 高级 AI 研究科学家,曾在OpenAI工作,Stanford PhD 李飞飞实验室

戴涵俊(推特:@hanjundai),Google Deepmind 资深研究员,深度参与 Google 大语言模型项目,曾在OpenAI工作,Georgia Tech PhD

硅谷徐老师(推特:@h0wie_xu),硅谷连续创业者、人工智能高管、斯坦福商学院客座讲师,「科技早知道」主播 |微信公众号:硅谷云| AI博客:howiexu.substack.com

主持:Monica(推特:Monica_XieY):美元VC投资人,前 AWS 硅谷团队+AI创业公司打工人,公众号:M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学

在粗糙简陋的 studio 顺利完成3小时录制!

Hanjun 的霸气车牌!

我们都聊了什么

02:50 几位嘉宾自我介绍,最近看到了什么有意思的AI项目

05:51 Hanjun @Google Deepmind: 最近发表的 speculative decoding 工作如何提升模型速度

09:14 Jim Fan @Nvidia: 为什么AI agents 是值得关注的方向,基于agents 有什么应用

12:42 什么是 AI agents? 好的 Agents 需要怎样的核心能力

16:54 企业场景落地 AI Agents 应用,主要有哪些挑战?

25:18 AI Agents 目前落地的挑战,是由底层基础模型的能力决定的吗?

35:56 如何看待目前 AI Agents 不同的实现方式?Adept AI 的形态会被取代吗?

39:57 未来工具使用更多是 AI agents 来完成,对于应用生态意味着什么?

48:18 Llama 2 开源对于LLM生态意味着什么?底层基础模型会赢家通吃吗?

56:58 如何理解开源和闭源模型的壁垒?

68:24 我们需要领域专有模型吗?

我们提到的内容

  • Hanjun 提到的论文:Accelerating Large Language Model Decoding with Speculative Sampling
  • Jim 的论文: Voyager: An Open-Ended Embodied Agent with Large Language Models
  • Jim 提到的论文:Generative Agents: Interactive Simulacra of Human Behavior
  • 开源项目 Auto-GPT: An experimental open-source attempt to make GPT-4 fully autonomous
  • Llama 2: Meta 开源的大语言模型
  • Adept.ai: a new way to use computers. Transformer 论文作者创办
  • Character AI
  • Jim 提到的基于大语言模型的游戏:病娇AI女友
  •  MPT-7B (MosaicML Pretrained Transformer): MosaicML 发布的可商用开源大语言模型
  • Anthropic: Transformer 论文作者创立的大语言模型公司
  • Harvey:为律所设计的生成式AI工具
  • 讨论 Google 等大厂LLM竞争壁垒的文章 ($$):Google "We Have No Moat, And Neither Does OpenAI"

重点词汇

  • RLHF (Reinforcement Learning with Human Feedback): 人类反馈的强化学习 - 一种AI模型通过人类反馈与传统的强化学习结合来学习的方法。
  • Fine tuning: 微调 - 在特定的数据集上进一步训练预训练的机器学习模型,使其适应特定任务的过程。
  • Hallucination: 幻觉 - 在AI中,指的是模型生成不在输入中的信息,可能导致输出不准确。
  • Multi-modal model: 多模态模型 - 能够理解和处理多种类型数据(如文本、图像和声音)的模型。
  • Embodied AI: 具体化的人工智能 - 通过物理或虚拟的身体与环境互动的AI系统,例如机器人或虚拟代理。
  • Quantization: 量化 - 限制用于表示数字的位数的过程,有助于减小机器学习模型的大小并加速计算。
  • Mixture-of-experts (MoE): 专家混合模型 - 一种机器学习方法,其中模型的不同部分专门处理不同类型的数据或任务。
  • Inference: 推断 - 已训练的AI模型基于所提供的数据预测结果的过程。
  • Reasoning: 推理能力 - AI系统根据信息或一组事实得出结论的能力。
  • NPC (Non-Player Character): 非玩家角色
  • RPA (Robotic Process Automation): 机器人流程自动化
  • First class citizen: 一等公民

欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容!

M小姐研习录 (ID: MissMStudy)

大家的点赞、评论、转发是对我们最好的鼓励!

如果你能在小宇宙上点个赞,Apple Podcasts 上给个五星好评,就能让更多的朋友看到我们努力制作的内容,打赏请我们喝杯咖啡,就给你比心!

有任何心得和建议,也欢迎在评论区跟我们互动~

...more
View all episodesView all episodes
Download on the App Store

OnBoard!By Monica Xie

  • 5
  • 5
  • 5
  • 5
  • 5

5

38 ratings


More shows like OnBoard!

View all
疯投圈 by 黄海、Rio

疯投圈

115 Listeners

声东击西 by ETW Studio

声东击西

327 Listeners

创业内幕 Startup Insider by 纪源小馆

创业内幕 Startup Insider

42 Listeners

三五环 by 刘飞Lufy

三五环

43 Listeners

不合时宜 by 不合时宜TheWeirdo

不合时宜

260 Listeners

忽左忽右 by JustPod

忽左忽右

473 Listeners

东腔西调 by 大观天下志

东腔西调

131 Listeners

商业就是这样 by 商业就是这样

商业就是这样

290 Listeners

知行小酒馆 by 有知有行

知行小酒馆

370 Listeners

声动早咖啡 by 声动活泼

声动早咖啡

295 Listeners

半拿铁 | 商业沉浮录 by 潇磊&刘飞

半拿铁 | 商业沉浮录

312 Listeners

42章经 by KaiQu

42章经

13 Listeners

起朱楼宴宾客 by 大卫翁

起朱楼宴宾客

52 Listeners

厚雪长波 by 雪球官方账号

厚雪长波

8 Listeners

小Lin说 by 小Lin说

小Lin说

51 Listeners