
Sign up to save your podcasts
Or


Send us Fan Mail
In der heutigen Sendung steigen wir noch einmal in die Welt der multimodalen Modelle ein. Diesmal sprechen wir über das Bindeglied zwischen dem uni-modalen Bildverarbeitungsmodell und dem uni-modalen Sprachverarbeitungsmodell, den Q-Former. Q-Former sind eine effiziente Methode, das Training von multimodalen Modellen durchzuführen. Wir diskutieren die Architektur, Vorteile, Nachteile und Wirkweisen.
Support the show
By Sigurd Schacht, Carsten LanquillonSend us Fan Mail
In der heutigen Sendung steigen wir noch einmal in die Welt der multimodalen Modelle ein. Diesmal sprechen wir über das Bindeglied zwischen dem uni-modalen Bildverarbeitungsmodell und dem uni-modalen Sprachverarbeitungsmodell, den Q-Former. Q-Former sind eine effiziente Methode, das Training von multimodalen Modellen durchzuführen. Wir diskutieren die Architektur, Vorteile, Nachteile und Wirkweisen.
Support the show

62 Listeners

189 Listeners

104 Listeners

10 Listeners

16 Listeners

12 Listeners

67 Listeners

339 Listeners

12 Listeners

136 Listeners

19 Listeners

5 Listeners

1 Listeners

1 Listeners