OnBoard!

EP 54. 深度对谈顶尖AI开源项目:大模型开源生态, Agent 与中国力量


Listen Later

聊到生成式AI的发展,开源绝对是最关键的话题之一。这次的嘉宾,可以说涵盖了大模型开源领域最值得关注的公司:从顶流社区Huggingface, 到全球开源社区都关注的阿里通义千问 Qwen 大模型,堪称行业标准的 LLM 推理框架 vLLM, 还有最近最火的软件开发 agent 项目 OpenDevin. 真的是黄金阵容!

这一期节目也发布得很应景:就在今天凌晨,阿里发布了最新的通义千问 Qwen 系列模型!Qwen2-72B 的表现甚至全面超过 SOTA 的 Llama 3,大家赶紧去关注!

首先跟大家汇报一下,上周日我们在北京举办的 OnBoard! 第一次线下听友会真是超预期!开放报名4天就250多人报名,周日从上午9点到下午3点,从机器人到AI,创业投资和软件出海,100人的场地,直到最后都几乎座无虚席!真的是非常感谢大家的支持~我们正在努力整理精华文字稿,也请期待我们更多活动!

Hello World, who is OnBoard!?

回到这一期播客,我们将深入探讨大模型的开源生态。

在生成式AI飞速发展的一年多时间里,开源无疑是一个不可忽视的话题。开源模型的迅猛发展,从 Meta 的 Llama 3 到 Mistral 的最新模型,它们对闭源大模型如 GPT4 的追赶,不仅令人惊艳,更加速了 AI 场景下产品的实际应用。而围绕大模型的生态系统,从推理加速到开发工具,再到智能代理,技术栈的丰富程度,虽然已经孕育出了像 Langchain 这样的领军企业,但这一切似乎只是冰山一角。

特别值得一提的是,随着阿里千问系列、Deepseek、以及 Yi 等中国团队主导的模型在国际舞台上崭露头角,我们不禁思考,除了模仿和追赶,中国在大模型领域的发展是否还有更多值得我们关注和自豪的成就。

今天,Monica 有幸邀请到了几位极具代表性的重磅嘉宾,来自 Huggingface 的开源老兵,有通义千问 Qwen 的开源负责人(他也是 Agent 领域最受关注的项目 OpenDevin 核心成员),还有最具国际影响力的开源项目 vLLM 主导人。真是涵盖了大模型开源生态的各个领域的最一线视角!

嘉宾们都太宝藏了,我们的话题延伸到大模型的各个方面,录了近4个小时!我们前半部分聊了很多infra的创新,以及最近很火的、以OpenDevin 为代表的软件开发agent 背后的技术和生态等话题。下半部分,我们回到大模型开源的主题,畅谈了:

  • 底层基础大模型的开源闭源生态,未来可能有怎样的演进?
  • 开源模型商业化跟过去我们在大数据时代看到的databricks 之类开源商业模式有哪些异同?
  • 如何做一个有国际影响力的开源项目?

还有数据、评测等等大模型领域的核心话题,真的非常全面,又不失一线从业者的深度。

索性就不分成两部分了,大家可以对着 show notes 里面的时间戳,直接跳转到你感兴趣的话题(虽然我觉得每个话题都很好!)

介绍了这么多,还要声明一下,节目里面重点聊到的开源社区 Huggingface,还有几个开源的项目,包括阿里千问、OpenDevin, Deepseek, 零一万物的 Yi,vLLM 等,都没有收取任何广告,完全是嘉宾走心分享,全程无广!当然,如果你们或者其他AI公司考虑赞助一下我们用爱发电的播客,我们当然也是欢迎的!

三小时硬核马拉松开始,enjoy!

嘉宾介绍

  • Tiezhen Wang, Huggingface 工程师,他可以说是中国与世界开源 AI 生态的桥梁,更是从 Google TensorFlow 时代到 Huggingface 早期员工,对中国和世界的开源 AI 生态都有极深的洞察。
  • Junyang Lin, 通义千问开源负责人,作为 Qwen 在全球开源社区的主要代言人,他不仅见证了开源的发展历程,还是目前备受瞩目的 Agent 开源项目 OpenDevin 的核心团队成员。
  • 李卓翰,UC Berkeley PhD,他所主导的项目更是大名鼎鼎,就是已经成为行业标准的大模型推理框架 vLLM!他所在的 Sky Lab 被誉为开源基础设施的摇篮,从估值百亿美元的 Databricks 到 Anyscale(开源计算框架 Ray 的商业化公司)。他还深度参与了 Chat Arena, Vicuna 等多个国际知名开源项目,对大模型周边生态和 infra 的不仅有国际一线经验,更是有很多有技术理想的干货!
  • OnBoard! 主持:Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学

我们都聊了什么

05:28 嘉宾自我介绍,有意思的开源 AI 项目

18:37 vLLM 如何开始的,如何成为全球顶尖项目,为什么我们需要一个大模型推理框架?

30:24 Agent framework: OpenDevin 这样的负责 agent 会带来怎样的推理挑战?

40:37 做好一个编程 Agent,还需要哪些新的工具?多模态会带来怎样的变化?

56:16 我们需要怎样的 Agent Framework?为什么最适合开源社区来做?Framework 会收敛吗?

67:46 什么是 Crew AI? 如何看待 Multi-agent 架构?

73:11 借鉴前端框架的发展历史,如何理解一个框架如何成为行业标准?

77:54 Huggingface 上开源LLM现状,过去一年多有哪些重要进展?有哪些不同的开源方式?泽娜要给你看待一个开源模型的流行程度?

94:27 如何理解不同架构的开源大模型生态?Qwen 如何通过架构演进打造更好的开源生态?

104:59  中国的大模型开源项目有哪些创新?大模型架构有哪些变化?

112:17 为什么说新的模型架构可能会带来商业化的新机会?我们能从以前的开源商业化中学到什么?

119:22 我们看到现有大模型架构的天花板了吗?什么是一个新的架构?

128:03 Zhuohan 从参与最早的开源 LLM 之一 Vicuna 的经历学到什么?学术界和业界在大模型生态上如何分工?

140:48 用于大模型的数据集领域有哪些值得关注的进展?

149:42 Mistral 为什么这么快爆火?打造一流国际开源项目有什么可借鉴的经验?vLLM 有什么道和术上的心得?

166:13 Chatbot Arena 是如何开始的?为什么模型的评测那么重要?还有哪些挑战和可能的进展?

180:49 Zhuohan 对于 vLLM 商业化方式有什么思考?未来推理成本还有哪些下降空间?

188:17 快问快答:过去一年生成式AI发展有什么超出预期和不及预期的地方?未来还有什么值得期待?

我们提到的公司和重点名词

  • Qwen, Qwen-2
  • OpenDevin: opendevin.github.io
  • vLLM: github.com
  • Yi (Github), 零一万物
  • Chatbot Arena: huggingface.co
  • AutoGPT: github.com
  • crew AI: www.crewai.com
  • autoAWQ: github.com
  • LLM.c: github.com
  • Flash attention: github.com
  • Continuous batching:一种数据处理技术,用于将连续的数据流分批处理,以提高效率和可扩展性。
  • KV cache:键值对缓存,一种存储结构,通过键快速访问数据值,常用于提高数据检索速度。
  • Page attention:页面注意力机制,一种在处理长文本时,使模型集中注意力于当前页面或段落的技术。
  • Quantization:量化,将数据表示的精度降低到更少的比特数,以减少模型大小和提高计算效率。
  • Direct Preference Optimization (DPO): Your Language Model is Secretly a Reward Model
  • Google Gemini: deepmind.google
  • Adept: www.adept.ai
  • MetaGPT: github.com
  • Dolphinan open-source and uncensored, and commercially licensed dataset and series of instruct-tuned language models based on Microsoft's Orca paper
  • Common crawl: commoncrawl.org

参考文章

  • Tiezhen 的报告:Booming Open Source Chinese-Speaking LLMs: A Closer Look, Slides
  • 通义千问一周年,开源狂飙路上的抉择与思考|魔搭深度访谈
  • 阿里林俊旸:大模型对很多人来说不够用,打造多模态Agent是关键 | 中国AIGC产业峰会

欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容!

M小姐研习录 (ID: MissMStudy)

欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。

最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群期待你来!

...more
View all episodesView all episodes
Download on the App Store

OnBoard!By Monica Xie

  • 5
  • 5
  • 5
  • 5
  • 5

5

37 ratings


More shows like OnBoard!

View all
疯投圈 by 黄海、Rio

疯投圈

109 Listeners

三五环 by 刘飞Lufy

三五环

44 Listeners

科技乱炖 by DAO

科技乱炖

24 Listeners

What's Next|科技早知道 by 声动活泼

What's Next|科技早知道

177 Listeners

硅谷101 by 硅谷101

硅谷101

184 Listeners

硅谷101|中国版 by 泓君Jane

硅谷101|中国版

53 Listeners

商业就是这样 by 商业就是这样

商业就是这样

272 Listeners

晚点聊 LateTalk by 晚点 LatePost

晚点聊 LateTalk

23 Listeners

大小马聊科技 by 大小马聊科技

大小马聊科技

4 Listeners

起朱楼宴宾客 by 大卫翁

起朱楼宴宾客

51 Listeners

半拿铁 | 商业沉浮录 by 潇磊&刘飞

半拿铁 | 商业沉浮录

291 Listeners

张小珺Jùn|商业访谈录 by 张小珺

张小珺Jùn|商业访谈录

27 Listeners

高能量 by 李翔李翔

高能量

30 Listeners

知本论 by 知本论

知本论

4 Listeners

42章经 by KaiQu

42章经

9 Listeners