Seventy3

By 任雨山

73播客，名字取材于Sheldon最喜欢的数字，内容由NotebookLM生成，每天跟随AI读AI业界论文。... more

Download on the App Store

Download on the App Store

Get it on Google Play

FAQs about Seventy3:

How many episodes does Seventy3 have?

The podcast currently has 625 episodes available.

Seventy3 episodes:

July 07, 2025 【第280期】（中文）RQI：超分辨率图像评估新视角
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
Rethinking Image Evaluation in Super-Resolution
Summary
该论文探讨了图像超分辨率（SR）领域中人类感知评估与现有量化评估之间日益增长的不一致性。作者们认为，现有SR数据集中“地面实况（GT）”图像的质量不佳是导致这种评估偏差的一个关键因素。文章通过系统性分析，揭示了GT质量如何影响SR模型的评估结果，并指出即使GT图像质量较差，也可能导致模型输出在感知上优于GT。为解决这一问题，研究提出了一种名为相对质量指数（RQI）的新型感知质量度量，旨在更准确地反映图像对之间的相对质量差异，并证明了其在与人类偏好保持一致性方面的优越性。这项工作为未来SR数据集的构建、模型的开发以及评估指标的设计提供了重要的...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
11min
July 06, 2025 【第279期】（中文）无反向传播的高效量化扩散模型个性化
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
Efficient Personalization of Quantized Diffusion Model without Backpropagation
Summary
此篇研究论文介绍了一种名为 ZOODiP 的新型框架，旨在在内存受限的环境中高效地个性化扩散模型。该方法通过量化扩散模型并利用零阶优化，在无需反向传播的情况下实现微调，从而显著减少了内存消耗。为了克服零阶优化的局限性，ZOODiP 引入了 Subspace Gradient (SG) 来处理梯度噪声，并提出了 Partial Uniform Timestep Sampling (PUTS) 来优化训练过程中的时间步选择。实验结果表明，ZOODiP 在大幅降低内存需求的同时，仍能实...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
9min
July 05, 2025 【第278期】（中文）CLS-RL：一种基于规则的强化学习方法
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning
Summary
这篇研究论文探讨了多模态大型语言模型（MLLMs）在图像分类中的少样本微调问题。研究指出，传统的监督微调（SFT）可能导致灾难性遗忘，甚至降低性能。为解决此问题，研究团队提出了CLS-RL，这是一种基于规则的强化学习方法，利用可验证的信号（如类别名称）作为奖励来优化MLLMs，并鼓励模型在回答前进行思考。此外，论文还引入了No-Thinking-CLS-RL，该方法通过移除思考过程并强制模型直接输出答案，在某些情况下取得了更好的性能，同时显著缩短...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
7min
July 04, 2025 【第277期】（中文）Fin-R1：金融推理大型语言模型
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning
Summary
文本介绍了 Fin-R1，一个专门为金融领域推理任务设计的大型语言模型。该模型旨在解决金融数据碎片化、推理逻辑不可控以及业务泛化能力弱等核心问题。通过构建一个包含**高质量思维链（CoT）的金融数据集 Fin-R1-Data，并采用监督微调（SFT）和强化学习（RL）**的两阶段训练框架，Fin-R1 在多个权威金融基准测试中展现出卓越性能，尤其在处理金融推理任务方面表现突出。该研究强调了其在金融合规和智能投顾等实际应用中的强大自动化推理和决策能力。
原文链接：ht...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
9min
July 04, 2025 【第276期】（中文）Scale-wise Distillation
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
本期开启中文播客
今天的主题是：
Scale-wise Distillation of Diffusion Models
Summary
这篇研究介绍了 SWD（Scale-wise Distillation），一个用于扩散模型的逐尺度蒸馏框架，它利用下一尺度预测的思想来加速图像生成。传统扩散模型在高分辨率下计算成本高昂，而 SWD 允许模型在较低分辨率下启动生成，然后逐步提高样本分辨率，同时保持性能并显著降低计算量。作者通过分析潜在空间的频谱，论证了在高噪声水平下，模型可以在较低分辨率空间中有效工作。SWD 还引入了一种新颖的补丁损失，以确保与目标分布的更精细相似性，并在实验中展示了其在文本到图像生成任务中优于现有方法的效率和质量。
原文链接：https://ar...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
11min
July 02, 2025 【第275期】InfiniteYou：身份保留图像生成
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity
Summary
这项研究介绍了InfiniteYou (InfU)，一个用于身份保留图像生成的新颖框架，它利用先进的扩散Transformer (DiT)技术来解决现有方法的不足。InfU的核心是InfuseNet，它通过残差连接将身份特征注入DiT基模型，从而提高身份相似性并保持生成能力。该框架还采用了多阶段训练策略，包括预训练和监督微调，使用合成的单人多样本（SPMS）数据，以改善文本-图像对齐、图像质量和美观性。此外，InfU被设计成即插即用，可以与现有插件和方法兼容，为更广泛的社区做出了贡献，并在身份相似...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
12min
July 02, 2025 【第274期】Vision-R1
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
Vision-R1: Evolving Human-Free Alignment in Large Vision-Language Models via Vision-Guided Reinforcement Learning
Summary
本研究提出Vision-R1，这是一种旨在通过强化学习（RL）提高多模态大型语言模型（MLLMs）推理能力的方法。文章解决了现有MLLMs在复杂推理任务中表现不佳的问题，因为它们缺乏人类认知过程中的结构化推理步骤。Vision-R1通过利用现有MLLM和DeepSeek-R1构建高质量的多模态思维链（CoT）数据集进行冷启动初始化。为了解决优化挑战，研究者引入了渐进式思维抑制训练（PTST）策略，该策略在RL训...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
16min
June 30, 2025 【第273期】Diffusion-4K：超高分辨率图像生成
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
Diffusion-4K: Ultra-High-Resolution Image Synthesis with Latent Diffusion Models
Summary
本论文介绍了 Diffusion-4K，这是一个旨在直接生成超高分辨率图像的新框架，解决了现有模型通常局限于较低分辨率的挑战。它通过创建名为 Aesthetic-4K 的4K图像数据集来弥补公共数据集的不足，该数据集包含高质量图像和由 GPT-4o 生成的详细文本描述。此外，Diffusion-4K 引入了新的评估指标，如 GLCM Score 和压缩比，以更好地衡量图像的精细细节和纹理。该框架还提出了一种基于小波的微调方法，能够与现有的潜在扩散模型（如 SD3 和 Flux...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
12min
June 29, 2025 【第272期】SimpleRL-Zoo：Zero RL推理能力
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
SimpleRL-Zoo: Investigating and Taming Zero Reinforcement Learning for Open Base Models in the Wild
Summary
本研究探讨了零强化学习（RL）对不同基础模型（包括Llama3-8B、Mistral-7B/24B和Qwen系列模型）推理能力的影响。研究发现，通过调整奖励和控制查询难度等策略，RL训练能显著提高模型的推理准确性和响应长度。值得注意的是，该研究首次在非Qwen系列的小型模型中观察到“顿悟时刻”（aha moment），即模型认知行为（如验证和回溯）的显著提升。此外，文章还指出，严格的格式奖励会阻碍模型探索，而训练数据难度必须与模型能力匹配...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
12min
June 28, 2025 【第271期】FFN Fusion
Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法方向，让大家跟着AI一起进步。
今天的主题是：
FFN Fusion: Rethinking Sequential Computation in Large Language Models
Summary
该论文介绍了一种名为FFN Fusion的新型优化技术，旨在提高大型语言模型的推理效率。通过识别并整合变压器架构中连续的馈送网络（FFN）层，该方法将顺序计算转化为并行操作，从而显著减少推理延迟和每令牌成本。研究人员利用这种技术开发了Ultra-253B-Base模型，该模型在保持或超越原始大型模型性能的同时，实现了显著的速度提升和更低的内存占用。此外，该研究还探讨了不同模型层之间的依赖关系，为未来的模型架构设计和优化方向提供了新的见解，甚至表明整个变压器块也能在某些情况下并行化。
原文链接：h...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
...more
24min

FAQs about Seventy3:

How many episodes does Seventy3 have?

The podcast currently has 625 episodes available.