July 04, 2025

2025.07.03 | 多模态模型提升短视频理解；动画生成保持颜色一致。

6 minutes

本期的 9 篇论文如下：

[00:21] 🎬 Kwai Keye-VL Technical Report（Kwai Keye-VL 技术报告）

[01:02] 🎨 LongAnimation: Long Animation Generation with Dynamic Global-Local Memory（LongAnimation：基于动态全局-局部记忆的长期动画生成）

[01:50] 👁 Depth Anything at Any Condition（任意条件下的深度感知）

[02:28] 🤖 A Survey on Vision-Language-Action Models: An Action Tokenization Perspective（视觉-语言-动作模型综述：一种动作Token化的视角）

[03:11] 🪄 FreeMorph: Tuning-Free Generalized Image Morphing with Diffusion Model（FreeMorph：基于扩散模型的免调参通用图像渐变）

[03:51] 🖼 Locality-aware Parallel Decoding for Efficient Autoregressive Image Generation（面向高效自回归图像生成的局部感知并行解码）

[04:33] 🎬 STR-Match: Matching SpatioTemporal Relevance Score for Training-Free Video Editing（STR-Match: 匹配时空相关性得分的免训练视频编辑方法）

[05:14] 📊 MARVIS: Modality Adaptive Reasoning over VISualizations（MARVIS：基于可视化的模态自适应推理）

[05:51] 🗣 JAM-Flow: Joint Audio-Motion Synthesis with Flow Matching（JAM-Flow：基于流匹配的联合音频-运动合成）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

...more

View all episodes

By duan

22 ratings

July 04, 2025

2025.07.03 | 多模态模型提升短视频理解；动画生成保持颜色一致。

6 minutes

本期的 9 篇论文如下：

[00:21] 🎬 Kwai Keye-VL Technical Report（Kwai Keye-VL 技术报告）

[01:02] 🎨 LongAnimation: Long Animation Generation with Dynamic Global-Local Memory（LongAnimation：基于动态全局-局部记忆的长期动画生成）

[01:50] 👁 Depth Anything at Any Condition（任意条件下的深度感知）

[02:28] 🤖 A Survey on Vision-Language-Action Models: An Action Tokenization Perspective（视觉-语言-动作模型综述：一种动作Token化的视角）

[03:11] 🪄 FreeMorph: Tuning-Free Generalized Image Morphing with Diffusion Model（FreeMorph：基于扩散模型的免调参通用图像渐变）

[03:51] 🖼 Locality-aware Parallel Decoding for Efficient Autoregressive Image Generation（面向高效自回归图像生成的局部感知并行解码）

[04:33] 🎬 STR-Match: Matching SpatioTemporal Relevance Score for Training-Free Video Editing（STR-Match: 匹配时空相关性得分的免训练视频编辑方法）

[05:14] 📊 MARVIS: Modality Adaptive Reasoning over VISualizations（MARVIS：基于可视化的模态自适应推理）

[05:51] 🗣 JAM-Flow: Joint Audio-Motion Synthesis with Flow Matching（JAM-Flow：基于流匹配的联合音频-运动合成）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

...more

More shows like HuggingFace 每日AI论文速递

View all

硅谷101|中国版

56 Listeners

商业就是这样

292 Listeners

声动早咖啡

293 Listeners

思文，败类

156 Listeners

不开玩笑 Jokes Aside

136 Listeners

人民公园说AI

7 Listeners

數創實驗室 - AI時代的學習指南

1 Listeners

AI可可AI生活

0 Listeners

Share 2025.07.03 | 多模态模型提升短视频理解；动画生成保持颜色一致。

Sign up to save your podcasts

2025.07.03 | 多模态模型提升短视频理解；动画生成保持颜色一致。

2025.07.03 | 多模态模型提升短视频理解；动画生成保持颜色一致。

More shows like HuggingFace 每日AI论文速递

硅谷101|中国版

商业就是这样

声动早咖啡

思文，败类

不开玩笑 Jokes Aside

人民公园说AI

數創實驗室 - AI時代的學習指南

AI可可AI生活