<ul><li><a href='https://arxiv.org/abs/2212.09748'>Scalable Diffusion Models with Transformers</a></li><li><a href='https://arxiv.org/abs/2308.09936'>BLIVA: A Simple Multimodal LLM for Better Handling of Text-Rich Visual Questions</a></li><li><a href='https://arxiv.org/abs/2308.09592'>StableVideo: Text-driven Consistency-aware Diffusion Video Editing</a></li><li><a href='https://arxiv.org/abs/2305.07015'>Exploiting Diffusion Prior for Real-World Image Super-Resolution</a></li></ul><a rel="payment" href="https://www.buzzsprout.com/2207765/support">Support the show</a>

Scalable Diffusion Models with TransformersBLIVA: A Simple Multimodal LLM for Better Handling of Text-Rich Visual QuestionsStableVideo: Text-driven Consistency-aware Diffusion Video EditingExploiting Diffusion Prior for Real-World Image Super-ResolutionSupport the show

<ul><li><a href="https://arxiv.org/abs/2212.09748" rel="noopener noreferrer">Scalable Diffusion Models with Transformers</a></li><li><a href="https://arxiv.org/abs/2308.09936" rel="noopener noreferrer">BLIVA: A Simple Multimodal LLM for Better Handling of Text-Rich Visual Questions</a></li><li><a href="https://arxiv.org/abs/2308.09592" rel="noopener noreferrer">StableVideo: Text-driven Consistency-aware Diffusion Video Editing</a></li><li><a href="https://arxiv.org/abs/2305.07015" rel="noopener noreferrer">Exploiting Diffusion Prior for Real-World Image Super-Resolution</a></li></ul><a href="https://www.buzzsprout.com/2207765/support" rel="noopener noreferrer">Support the show</a>

August 24th, 2023 - Revolutionizing Pixels and Prose: Breakthroughs in Diffusion Models, Multimodal Language Learning, and Media Editing

A curated podcast covering the latest machine learning developments, text, and audio is generated using AI.

Science

A curated podcast covering the latest machine learning developments, text, and audio is generated using AI.

Share August 24th, 2023 - Revolutionizing Pixels and Prose: Breakthroughs in Diffusion Models, Multimodal Language Learning, and Media Editing

Sign up to save your podcasts

August 24th, 2023 - Revolutionizing Pixels and Prose: Breakthroughs in Diffusion Models, Multimodal Language Learning, and Media Editing

August 24th, 2023 - Revolutionizing Pixels and Prose: Breakthroughs in Diffusion Models, Multimodal Language Learning, and Media Editing