Seventy3

By 任雨山

73播客，名字取材于Sheldon最喜欢的数字，内容由NotebookLM生成，每天跟随AI读AI业界论文。... more

Download on the App Store

Download on the App Store

Get it on Google Play

FAQs about Seventy3:

How many episodes does Seventy3 have?

The podcast currently has 625 episodes available.

Seventy3 episodes:

July 27, 2025 【第300期】（中文）NdLinear：多维深度学习新范式
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
NdLinear: Don't Flatten! Building Superior Neural Architectures by Preserving N-D Structure
Summary
“NdLinear is All You Need for Representation Learning”这篇论文提出了一种名为NdLinear的新型线性变换，旨在解决传统神经网络中多维数据处理的挑战。该方法通过独立地对每个维度进行操作，而不是将输入数据扁平化，从而保留了关键的跨维度信息。研究表明，NdLinear能够显著提升表示能力和参数效率，使其可以作为现有深度学习架构（如Transformer、RNN和CNN）中标准线性层的即插即用替代品。通过在...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
9min
July 26, 2025 【第299期】（中文）SWE-PolyBench：多语言代码智能体基准测试
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
SWE-PolyBench: A multi-language benchmark for repository level evaluation of coding agents
Summary
该论文介绍了 SWE-PolyBench，这是一个针对代码代理的多语言基准测试，旨在弥补现有评估工具的局限性。它包含了 Java、JavaScript、TypeScript 和 Python 等多种语言的 2110 个实例，涵盖了错误修复、功能添加和代码重构等任务。通过评估领先的开源代码代理，研究发现当前代理在不同语言间的表现不均衡，并且在处理复杂问题时面临挑战。此外，该工作还引入了基于语法树分析的新指标，以更全面地评估代码代理在理解和...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
10min
July 25, 2025 【第298期】（中文）DocAgent：自动化代码文档生成的多智能体系统
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
DocAgent: A Multi-Agent System for Automated Code Documentation Generation
Summary
DocAgent是一种新颖的多智能体系统，旨在通过模拟人类工作流程来自动化高质量代码文档的生成。该系统首先使用“导航器”模块对代码库进行依赖感知拓扑排序，确保在处理组件之前先处理其依赖项，从而实现增量上下文构建。接着，“阅读器”、“搜索器”、“编写器”和“验证器”等专业智能体在“协调器”的协调下，协作分析代码、检索所需信息、生成文档草稿并进行质量评估，形成一个迭代改进的过程。为了全面评估生成文档的质量，研究人员提出了一个多维度评估框架，衡量文档的完整性（结构化符合标准）、实用性（语义质量...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
10min
July 24, 2025 【第297期】（中文）AgentA/B：基于LLM的自动化可扩展网页A/B测试
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents
Summary
该论文介绍了 AgentA/B，这是一个利用大型语言模型（LLM）驱动的自主代理的新颖系统，旨在革新网络 A/B 测试。传统 A/B 测试依赖大量人工流量且耗时，而 AgentA/B 通过模拟用户行为克服了这些限制。该系统能生成具有不同虚拟用户身份的 LLM 代理，使其与真实网页进行交互，并提供快速、可扩展且经济高效的用户体验评估。通过在 Amazon.com 上的案例研究，作者表明 AgentA/B 可以有效地模拟类似人类的购物行为，并区分细微的界面设计差异。
原文链接：...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
12min
July 23, 2025 【第296期】（中文）d1: 扩散LLM的强化学习推理
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
d1: Scaling Reasoning in Diffusion Large Language Models via Reinforcement Learning
Summary
这篇研究论文探讨了如何提升扩散大语言模型（dLLMs）的推理能力，此类模型与传统的自回归（AR）LLMs不同，采用非自回归的粗到细文本生成方式。作者提出了 d1 框架，通过结合监督微调（SFT）和一种名为 diffu-GRPO 的新型强化学习（RL）算法来训练预训练的掩码 dLLMs。实验结果表明，与基线模型及单独的 SFT 或 diffu-GRPO 方法相比，d1 显著提升了模型在数学和逻辑推理任务上的表现。此外，该研究还讨论了随机掩码等设计选择如何提高训练效率和稳定...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
10min
July 22, 2025 【第295期】（中文）GUI-R1: GUI智能体的强化微调
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
GUI-R1: A Generalist R1-Style Vision-Language Action Model For GUI Agents
Summary
该来源介绍了一个名为 GUI-R1 的新型强化学习框架，旨在增强大型视觉语言模型 (LVLM) 在处理图形用户界面 (GUI) 代理任务方面的能力。与现有主要依赖监督微调 (SFT) 的方法不同，GUI-R1 采用规则驱动的强化微调 (RFT)，仅需极少量高质量数据（比 SFT 少 0.02% 的数据）即可在多种平台（如 Windows、Linux、macOS、Android 和 Web）上实现卓越性能。通过统一的动作空间规则建模和可验证的奖励函数，GUI-R1 显著提升了模型在高层 GU...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
9min
July 21, 2025 【第294期】（中文）NoProp：无需反向传播或前向传播的神经网络训练方法
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
NoProp: Training Neural Networks without Back-propagation or Forward-propagation
Summary
这篇研究论文介绍了一种名为 NoProp 的新型神经网络训练方法，该方法不依赖传统的反向传播或正向传播机制。与通过层级抽象学习的典型深度学习模型不同，NoProp 借鉴了扩散模型和流匹配方法，使每个层独立学习去噪带噪声的目标。实验结果表明，在图像分类基准测试中，NoProp 的表现优于其他不使用反向传播的方法，并且在计算上更高效，所需的 GPU 内存更少。作者认为，这项工作为开发不学习层次表示的无梯度学习方法开启了新的可能性。
原文链接：https://arxiv.org/a...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
10min
July 20, 2025 【第293期】（中文）LightPROF：知识图谱上大型语言模型的轻量推理框架
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
LightPROF: A Lightweight Reasoning Framework for Large Language Model on Knowledge Graph
Summary
这篇研究论文介绍了 LightPROF，一个为知识图谱问答（KGQA）设计的轻量级、高效提示学习推理框架。该框架旨在解决大型语言模型（LLMs）在处理复杂知识图谱信息时面临的知识更新延迟和资源消耗高等挑战。LightPROF 采用“检索-嵌入-推理”流程，通过一个创新的知识适配器，将知识图谱中的文本和结构信息转化为LLM友好的软提示，从而使小型LLMs也能高效、准确地执行多跳推理任务。实验结果表明，LightPROF 在性能上超越了现有方法，同时显著降低了输入...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
10min
July 19, 2025 【第292期】（中文）AI Scientist-v2：代理树搜索自动化科学发现
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search
Summary
本报告介绍了The AI Scientist-v2，这是一个显著改进的自动化科学发现框架，旨在克服其前身The AI Scientist-v1的局限性。v2版本通过引入代理树搜索、视觉语言模型（VLM）反馈和并行实验执行，增强了系统的自主性、灵活性和科学探索深度。研究人员提交了由The AI Scientist-v2完全生成的三份手稿给ICLR的一个同行评审研讨会，其中一份获得了足以被接受的评审分数。这份手稿及其同行评审意见被详细地作为案例研究，揭示了该系...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
7min
July 18, 2025 【第291期】（中文）attention sinks：LLMs倾向于将大部分注意力集中在第一个token
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
Why do LLMs attend to the first token?
Summary
本研究探讨大型语言模型 (LLMs) 中“注意力槽”（attention sinks）现象的潜在原因和效用。注意力槽是指LLMs倾向于将大部分注意力集中在序列的第一个标记上，即使该标记语义不重要。作者认为，这种机制是LLMs为了避免“过度混合”信息而采取的一种策略，过度混合可能导致表示崩溃，降低模型性能。通过理论分析和实验验证，研究表明，随着模型规模和上下文长度的增加，注意力槽变得更强，这支持了其作为稳定信息传播机制的作用。此外，文章还分析了预训练设置对注意力槽形成的影响，指出即使移除起始标记，模型也会在第一个可用标记上形成注意力槽。
原文链接：https:...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
8min

FAQs about Seventy3:

How many episodes does Seventy3 have?

The podcast currently has 625 episodes available.