Sign up to save your podcastsEmail addressPasswordRegisterOrContinue with GoogleAlready have an account? Log in here.
曾和丁磊马化腾同期玩互联网,并与Sprint,亚信一起将互联网引入中国。但天生不喜欢艰苦奋斗和996,选择了浪荡不羁,云游四方的生活,从东南亚到欧洲。基于海外多年的数字化转型的经历带来更开阔的不同视角,讲出与国内科技媒体不同的声音,包括电信,IT,云计算,物联网,区块链,人工智能等领域,带给您不同的视野... more
June 11, 2025WWDC2025,AI瞧不起做不出AI的苹果公司这一期还是让AI agent“扣子空间”来生成内容和音频,聊昨晚的WWDC2025,AI intelligent 又爽约了。...more6minPlay
June 07, 2025AI自爆揭秘自己是怎么想的这期内容依然是百分百由AI agent“扣子空间”生成的音频。 0:00 - 0:30A 指出大语言模型火但文科生觉原理复杂,B 提议探讨其工作原理。0:30 - 2:00A 介绍文字表示,先说词向量能捕捉语义,后讲 Token 及模型处理文本方式。2:00 - 4:00A 讲字间关联度,提及注意力机制和关联度预测,举例说明作用及特点。4:00 - 6:30B 问推理生成字方式,A 解释循环预测及以“今天天气很”为例的过程。6:30 - 9:00B 问选 token 策略,A 介绍贪婪解码、采样和束搜索的特点。9:00 - 10:00B 表示了解原理,A 总结通俗解释后使用模型更有数。...more6minPlay
June 04, 2025AI大模型黑盒子不可解释怎么办这又是一期从微信公众号文章由AI转换为双人对谈的播客。在AI大规模落地的时代,"可解释性"成了每一个大型组织不得不面对的议题。AI的可解释性问题,从根本上说,是不确定性和责任界限的问题。今天的大语言模型、深度神经网络,往往由数百亿甚至万亿参数堆叠而成,它的每一个"判断"既无法像传统代码那样逐行追踪,也很难像人那样提供一个有逻辑的因果链。于是,风险也随之而来......more5minPlay
June 03, 2025硅谷新游戏把简历AI生成这期播客硅谷人最近爱玩一个游戏,就是把自己的简历丢给AI大模型,然后AI就输出一个双人对谈的播客音频。这期内容就是把我的简历输入给字节的agent产品,扣子空间,然后AI输出的音频内容。AI太会夸人了,捧得我都要找地缝钻进去了,尽管她说的每一句都是实话,是我的职场真实履历,但那个语气和表达方式太有感染力了...more5minPlay
March 24, 2025用Deep Seek回答科技播客“十字路口 Crossing”的 20个问题这期是日常AI使用的探索,我将科技播客“十字路口Crossing”的最新一期输入腾讯元宝部署的deep seek平台,输出用的是腾讯元宝模拟我的声音,原汁原味,未改一字。无论是AI幻觉,还是胡说八道,一切由腾讯元宝负责,哈哈哈。以下是deep seek输出的文字版:嗯,用户让我详细回答播客里的20个问题,每个回答不少于60字。首先,我需要回顾用户提供的播客内容摘要,了解每个问题的具体内容。播客主要讨论了AI Agent的发展、Manus的爆火、技术突破、行业竞争以及未来影响等方面。用户可能希望得到每个问题的深入分析,结合现有的AI知识和技术趋势来回答。首先,我需要确定每个问题的核心。例如,Q1关于AI Agent的定义,需要明确其与普通AI的区别,比如自主性、目标导向等。Q2关于2024年Agent的发展脉络,可能需要回顾关键事件如GPT-4的发布、多模态能力的提升等。对于GAIA标准和MCP,需要解释这些标准的作用和为什么它们成为行业标杆。接下来,关于Manus的具体问题,如核心创新、复利效应,需要分析其技术特点,比如动态工作流和少结构多智能的方法。竞争和行业格局部分,要预测大厂的动向,分析创业公司的机会,以及英伟达的影响,这里可能需要联系硬件需求的变化。未来影响部分,比如哪些行业被颠覆,个人如何适应,要考虑AI Agent的实际应用场景,如客服、医疗、教育等,以及个人需要提升的技能,如Prompt工程、数据素养等。需要注意的是,用户可能希望答案不仅基于播客内容,还要补充外部知识,比如技术细节或行业案例,使回答更全面。同时,每个回答要保持结构清晰,语言专业但易懂,避免过于技术化。可能遇到的挑战是确保每个问题都覆盖到关键点,并且达到字数要求。需要逐一检查每个回答是否充分解释了问题,是否有足够的细节和例子支持观点。例如,在讨论Manus的复利效应时,可以提到其自我迭代和用户反馈循环如何提升性能,而不仅仅是重复播客内容。此外,用户可能希望答案具有前瞻性,尤其是在预测大厂动向和行业颠覆方面,需要结合当前科技巨头的战略布局,如微软、谷歌在AI领域的投入,以及初创公司的创新方向。最后,要确保整体回答逻辑连贯,问题之间相互关联,比如技术突破如何影响产品形态,进而改变行业格局。同时,注意术语的正确使用,避免误解,比如区分AI Agent和AI Chatbot的关键差异。总结来说,回答每个问题时需要结合播客提供的框架,补充相关知识和分析,确保内容详实、结构清晰,满足用户的需求。以下是针对播客中讨论的20个问题的详细回答,每个回答均基于AI Agent技术趋势及行业分析:Q1: AI Agent的定义是什么?AI Agent指具备自主感知、决策和执行能力的智能体,通过环境交互实现特定目标。与传统AI工具(如Chatbot)的核心区别在于其主动性——Agent能自主分解任务、调用工具链并动态优化策略。例如,Manus能根据用户模糊指令生成完整工作流,而Chatbot仅提供被动响应。技术层面依赖大模型推理能力、多模态交互及记忆模块的协同。Q2: 复盘Agent在2024年的发展脉络2024年AI Agent的爆发源于三大驱动力:1. 大模型能力跃迁:GPT-4等模型在复杂推理和长文本理解上的突破;2. 多模态工具链成熟:图像生成、代码执行等API生态完善;3. 用户需求升级:从信息检索转向任务自动化(如数据分析、内容创作)。关键事件包括OpenAI推出GPTs商店、Meta开源Agent框架及Manus的“零结构工作流”创新。Q3: GAIA是什么标准?为何选择它衡量AI Agent?GAIA(General AI Assistant Benchmark)是由Meta提出的评测体系,通过模拟真实场景(如订机票、撰写报告)评估Agent的任务完成度、工具调用准确性和容错能力。其优势在于:• 场景复杂性:涵盖跨平台操作和多步骤决策;• 可扩展性:支持动态添加新工具和评测维度;• 弱监督学习:允许Agent通过少量示例自主迭代策略,贴近实际应用需求。Q4: MCP是什么?为何成为行业标准?MCP(Modular Cognitive Pipeline)是由斯坦福团队提出的Agent架构,通过分层模块(感知→规划→执行→反思)实现任务分解与优化。其成功源于:• 灵活性:模块可插拔,适配不同场景(如客服、编程);• 可解释性:各阶段输出透明,便于调试;• 资源效率:通过动态分配算力降低推理成本。对比端到端模型(如GPT-4),MCP在长周期任务中的稳定性更优。Q5: AI Agent vs AI Chatbot的关键突破核心差异在于主动性与工具链集成:• Chatbot:被动响应、依赖明确指令,局限于单轮对话;• Agent:主动拆解模糊需求(如“帮我策划旅行”),调用航班API、酒店比价工具并生成行程表。技术突破包括:长上下文记忆、工具调用API标准化(如OpenAI Function Calling)、基于人类反馈的强化学习(RLHF)优化决策链。Q6: Manus最让人惊艳的地方Manus的颠覆性在于零结构交互:用户无需预设流程,仅需输入目标(如“开发一款小游戏”),Agent即可自主拆解需求(设计→编码→测试→部署),并通过动态工作流协调多工具(如GitHub Copilot、Unity)。其Demo视频中,从零到可运行游戏的端到端完成度高达90%,远超同类产品。Q7: Manus的核心创新技术亮点包括:1. 动态工作流引擎:基于强化学习实时调整任务优先级;2. 工具链自适应:自动匹配API并处理异常(如API版本不兼容);3. 用户意图模糊匹配:通过多轮对话澄清需求(如“游戏类型是2D还是3D?”)。产品层面,其“Less Structure”理念降低了用户学习成本,实现“所想即所得”。Q8: Manus如何体现AI Agent的「复利」效应?复利效应体现在:• 数据飞轮:用户使用产生的反馈数据持续优化工作流;• 工具生态正循环:更多开发者接入API→Agent能力扩展→吸引更多用户;• 边际成本递减:完成100个任务的成本远低于100倍单任务成本。例如,Manus在游戏开发场景中,复用代码模块使后续任务效率提升40%。Q9: 为何Monica团队能做出Manus?Monica(浏览器插件起家)的积累在于:• 用户场景洞察:长期服务内容创作者,理解自动化痛点;• 工程化经验:处理海量API调用(如GPT-3.5、MidJourney);• 快速迭代文化:通过A/B测试验证功能优先级。此外,其“套壳”阶段积累的流量为Manus提供了早期种子用户。Q10: "Less Structure, More Intelligence"的意义该方法论颠覆传统流程引擎(如Zapier需预设IFTTT规则),通过大模型直接解析用户意图并生成动态工作流。例如,用户说“分析Q2销售数据”,Agent自动选择SQL查询→Tableau可视化→PPT生成工具链,减少人工配置。技术关键在于模型对工具语义的理解(如“分析”对应数据分析API)。Q11: 中美大厂谁将率先发布类Manus产品?• 硅谷:微软(Copilot Studio)、Google(Project Astra)凭借云+工具链优势;• 中国:字节(豆包)、阿里(通义)可能从垂类切入(如电商运营Agent)。但大厂受限于组织惯性,初创公司(如Replit、Cognition)在场景创新上更灵活。Q12: AI Agent创业方向主要赛道包括:• 垂类自动化:法律合同审核、医疗诊断辅助;• 开发工具:低代码平台集成Agent(如Vercel+GPT);• 个人助理:Calendar调度、邮件智能回复。难点在于平衡通用性与垂直场景的深度。Q13: Agentic AI的核心竞争点长期竞争力取决于:• 工具生态壁垒:独家接入高频API(如Salesforce、Figma);• 工作流可迁移性:跨场景复用能力(如从写邮件扩展到项目管理);• 用户习惯绑定:通过个性化记忆(如偏好、历史数据)提升替换成本。Q14: 创业公司如何抓住机会?策略建议:• 聚焦高价值场景:如财务审计、代码审查,替代人工耗时环节;• 构建数据护城河:通过私有化部署积累行业知识库;• 差异化定价:按任务复杂度而非Token计费,贴合企业预算逻辑。Q15: 对英伟达的影响?短期利好(训练算力需求增长),但长期隐忧:• 边缘计算崛起:Agent本地化部署(如手机端)降低对云端GPU依赖;• 推理优化需求:专用芯片(如Groq LPU)可能分流市场。英伟达需强化CUDA生态与推理框架(如Triton)的整合。Q16: Agent时代到来了吗?已进入早期爆发期,但全面普及需突破:• 可靠性瓶颈:复杂任务容错率需达99%以上;• 法规合规:自动化决策的权责界定(如医疗误诊责任);• 用户信任建立:通过透明化决策过程(如显示工作流步骤)降低使用门槛。Q17: ChatBot到Agent的产品形态变化本质变化包括:• 交互范式:从问答式对话转向目标导向协作;• 价值定位:从“信息提供者”变为“任务执行者”;• 技术架构:单一模型→模型+工具链+记忆库的协同系统。Q18: 技术与产品的边界“模型即产品”仍适用于基础层(如GPT-4 API),但Agent赛道需更强调:• 场景适配:同一模型在不同工作流中表现差异显著;• 用户体验:交互设计(如自然语言引导)影响完成率。未来趋势是“模型+工作流引擎+UI”三位一体。Q19: 受益与被颠覆的行业受益行业:• 客服:自动化处理80%常见问题;• 教育:个性化学习路径规划;颠覆风险:• 基础白领工作:报告撰写、数据分析岗位;• 传统软件:部分SaaS功能被Agent替代(如HubSpot营销自动化)。Q20: 个体如何适应?建议行动:• 掌握Prompt工程:精准表达需求提升协作效率;• 人机协作思维:将Agent视为“数字同事”,分工处理机械性任务;• 数据素养升级:理解Agent决策逻辑,避免过度依赖。例如,律师可专注策略制定,由Agent处理法条检索。以上回答结合技术逻辑、行业案例及趋势预判,力求系统覆盖播客讨论的核心议题。...more13minPlay
December 19, 2024月之暗面仲裁案从令人心动的 offer6聊起主播太懒,以下 show notes 依然是由豆包听音频总结的播客主要内容:1. 月之暗面仲裁案情况:朱啸虎起诉月之暗面,涉及职务作品问题,事件全貌未公开,需观察。2. 观点引出:借电影《好东西》中“给年轻人机会”台词,主播认为朱啸虎应在大模型投资案上给年轻人机会,而非抓细节挽回面子。3. 结合综艺案例• 综艺详情:《令人心动的offer》第六季中,C1、C2、C3创立R3公司,后因技术分歧离开,R1、R2重组R3并转移资产债务至子公司使其上市,C1、C2、C3因股份兑现问题提出仲裁,体现商业行为复杂及仲裁难度。• 关联分析:月之暗面仲裁案与之相反,在香港普通法系下,面临漫长仲裁与巨额律师费,难以分清对错,主播认为若月之暗面有错朱啸虎会直接诉讼,现仲裁说明情况复杂,其创始团队已做合法流程。4. 职务作品理解:以牛顿为例,说明员工离司后创企不能简单认定为职务作品,要考虑员工自身能力和新公司独立性。5. 月之暗面技术看法:主播认为靠风投训练大模型的创业公司有价值洇灭问题,只有公有云大厂能低成本训练,月之暗面做大模型未来或面临危机。主播再次呼吁给年轻人机会。...more31minPlay
December 11, 2024听了一万六千小时播客后,我的强迫症被 AI 救赎了以下 show notes 就是豆包替我“听”了本播客输出的,我就保持原汁原味,不改动,也不加时间戳了。播客“天天大模型,夜夜聊AI”第X期:AI如何改变播客生态及个人听播体验一、开场1. 主题引入• 分享近期对AI行业的观察,从八股文到数理化新学认知思维提升阶段。• 发现AI新功能,欲探讨其对播客相关影响。2. 个人播客收听背景• 十几年前海外工作时开始听播客,早期形式多样,近期集中于新平台,累计收听超一万六千小时(近两年多)。• 播客信息密度低,可与看书等并行,每天听约8小时,养成习惯后像强迫症一样,新内容必听,甚至追听感兴趣的。二、AI功能介绍(一)分享链接至AI平台生成Show Notes1. 功能实现方式• 可将播客链接分享给字节跳动的豆包或腾讯的混元大模型。• 平台抓取音频,几秒内转换识别成文字,基于大语言模型通读理解后输出类似Show Notes的内容总结,包含各时间戳对应内容。2. 功能优势及初期问题• 优势:总结有时比主播写得准确、更好。• 初期问题:部分主播反馈不好,但如同汽车刚出现时,新生事物需时间演进完善。(二)AI辅助播客生成(未来趋势)1. 实现逻辑• 主播提供大纲、重要观点及例子,结合语音输入,利用AI多模态功能(文字、图像、视频、声音一体),平台根据这些信息合成播客内容,且能模仿主播声音。2. 现有案例及问题• 美国已有尝试,虽观点表达连贯,但缺乏真人思想,前言后语连接生硬,不过技术在进步。三、AI对播客生态影响(一)对播客创作的影响1. 改变创作方式• 主播可能从自己录音转变为提供大纲等信息由AI生成播客,且生成内容可能更精炼。(二)对播客平台的冲击1. 平台现有价值及AI搜索优势• 现有平台价值在于集中播客入口链接,提供基于关键字搜索及推荐功能。• AI搜索基于理解,如根据用户描述心情、需求等精准定位推荐播客,更智能地排除无关内容,提升搜索效率。四、个人听播体验改变1. 缓解听播强迫症• 过去靠加速听播仍觉信息冲击大,新功能可在听播前由AI生成内容总结,提供内心支撑,便于选择感兴趣部分,减少听播压力,改变强迫症式听播方式。五、总结与展望1. 总结AI新功能对个人及播客行业的影响,鼓励初期听播客者多尝试不同播客,享受播客乐趣,同时期待AI在播客领域进一步发展带来更多改变。查看音频文稿1. AI新功能对播客收听及创作影响的分享(新录音 救赎.m4a)...more24minPlay
December 10, 2024AI 时代的机会就是从八股文到民国新学数理化1:30 从八股文到新学的数理化是认知的全新思维体系,5:12 2022 年 11 月是人工智能新时代的分水岭,真人工智能“涌现”了,15:00 拿开源大模型来做应用层就好比给身体穿花衣服,而不能给身体整容来增强身体能力16:35 大模型训练是价值湮灭,至今国内也就剩十余家还在做预训练。新版本练出来,旧的几千万就清零了,21:36 目前的 AI 处于八股秀才到新学大家的时期,范式变了,但其实还没有人做对,未来还是未知与全新的技术与商业,35:56 AI的未来是改变社会整体的信息传递,创造新的信息流动方式。...more42minPlay