January 18, 2025

2025.01.17 | OmniThink提升机器写作深度与新颖性，扩散模型推理扩展提升生成质量。

Listen Later

8 minutes

本期的 12 篇论文如下：

[00:26] 🧠 OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking（OmniThink：通过思考扩展机器写作的知识边界）

[01:06] 🔍 Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps（扩散模型推理时扩展：超越去噪步骤的扩展）

[01:37] 🩺 Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators（探索高级患者模拟器中的问诊与诊断关系）

[02:09] 🎨 SynthLight: Portrait Relighting with Diffusion Model by Learning to Re-render Synthetic Faces（SynthLight：基于扩散模型的人像重光照技术——通过重新渲染合成人脸学习）

[02:48] 🤖 FAST: Efficient Action Tokenization for Vision-Language-Action Models（FAST：视觉-语言-动作模型的高效动作标记化方法）

[03:23] 🔍 Learnings from Scaling Visual Tokenizers for Reconstruction and Generation（从视觉分词器的扩展中学习重建与生成）

[04:01] 🧠 Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models（迈向大型推理模型：基于大语言模型的强化推理研究综述）

[04:35] 🧹 The Heap: A Contamination-Free Multilingual Code Dataset for Evaluating Large Language Models（堆：一个无污染的多语言代码数据集用于评估大型语言模型）

[05:15] 🤖 RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation（RLHS：通过事后模拟缓解RLHF中的错位问题）

[05:54] 🎨 AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation（AnyStory：面向统一单主体与多主体个性化的文本到图像生成）

[06:36] 🎨 CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation（CaPa：用于高效4K纹理网格生成的雕刻与绘制合成框架）

[07:18] 🎥 Do generative video models learn physical principles from watching videos?（生成视频模型是否通过观看视频学习物理原理？）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

...more

View all episodes

View all episodes

Download on the App Store

Download on the App Store

Get it on Google Play

HuggingFace 每日AI论文速递

By duan

5

22 ratings

January 18, 2025

2025.01.17 | OmniThink提升机器写作深度与新颖性，扩散模型推理扩展提升生成质量。

Listen Later

8 minutes

本期的 12 篇论文如下：

[00:26] 🧠 OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking（OmniThink：通过思考扩展机器写作的知识边界）

[01:06] 🔍 Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps（扩散模型推理时扩展：超越去噪步骤的扩展）

[01:37] 🩺 Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators（探索高级患者模拟器中的问诊与诊断关系）

[02:09] 🎨 SynthLight: Portrait Relighting with Diffusion Model by Learning to Re-render Synthetic Faces（SynthLight：基于扩散模型的人像重光照技术——通过重新渲染合成人脸学习）

[02:48] 🤖 FAST: Efficient Action Tokenization for Vision-Language-Action Models（FAST：视觉-语言-动作模型的高效动作标记化方法）

[03:23] 🔍 Learnings from Scaling Visual Tokenizers for Reconstruction and Generation（从视觉分词器的扩展中学习重建与生成）

[04:01] 🧠 Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models（迈向大型推理模型：基于大语言模型的强化推理研究综述）

[04:35] 🧹 The Heap: A Contamination-Free Multilingual Code Dataset for Evaluating Large Language Models（堆：一个无污染的多语言代码数据集用于评估大型语言模型）

[05:15] 🤖 RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation（RLHS：通过事后模拟缓解RLHF中的错位问题）

[05:54] 🎨 AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation（AnyStory：面向统一单主体与多主体个性化的文本到图像生成）

[06:36] 🎨 CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation（CaPa：用于高效4K纹理网格生成的雕刻与绘制合成框架）

[07:18] 🎥 Do generative video models learn physical principles from watching videos?（生成视频模型是否通过观看视频学习物理原理？）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

...more

More shows like HuggingFace 每日AI论文速递

硅谷101|中国版 by 泓君Jane

硅谷101|中国版

56 Listeners

商业就是这样 by 商业就是这样

商业就是这样

292 Listeners

声动早咖啡 by 声动活泼

声动早咖啡

293 Listeners

思文，败类 by 思文败类

思文，败类

157 Listeners

不开玩笑 Jokes Aside by 不开玩笑JokesAside

不开玩笑 Jokes Aside

136 Listeners

人民公园说AI by JustSayAI

人民公园说AI

7 Listeners

數創實驗室 - AI時代的學習指南 by Vincent在數創

數創實驗室 - AI時代的學習指南

1 Listeners

AI可可AI生活 by fly51fly

AI可可AI生活

0 Listeners