
Sign up to save your podcasts
Or


Send us a text
In der heutigen Sendung tauchen wir ein in die faszinierende Welt der End-to-End multimodalen Modelle, die Text und Audio nahtlos verarbeiten.
Wir gehen auf Gazelle https://tincans.ai/slm3 ein SLM ein und sprechen über die Paper:
AudioChatLlama: Towards General-Purpose Speech Abilities for LLMs https://arxiv.org/pdf/2311.06753.pdf
und SLM: Bridge the thin gap between speech and text foundation models https://arxiv.org/pdf/2310.00230.pdf
Support the show
By Sigurd Schacht, Carsten LanquillonSend us a text
In der heutigen Sendung tauchen wir ein in die faszinierende Welt der End-to-End multimodalen Modelle, die Text und Audio nahtlos verarbeiten.
Wir gehen auf Gazelle https://tincans.ai/slm3 ein SLM ein und sprechen über die Paper:
AudioChatLlama: Towards General-Purpose Speech Abilities for LLMs https://arxiv.org/pdf/2311.06753.pdf
und SLM: Bridge the thin gap between speech and text foundation models https://arxiv.org/pdf/2310.00230.pdf
Support the show

61 Listeners

198 Listeners

110 Listeners

9 Listeners

15 Listeners

13 Listeners

60 Listeners

327 Listeners

9 Listeners

114 Listeners

18 Listeners

4 Listeners

1 Listeners

1 Listeners