
Sign up to save your podcasts
Or


Send us a text
In der heutigen Sendung steigen wir noch einmal in die Welt der multimodalen Modelle ein. Diesmal sprechen wir über das Bindeglied zwischen dem uni-modalen Bildverarbeitungsmodell und dem uni-modalen Sprachverarbeitungsmodell, den Q-Former. Q-Former sind eine effiziente Methode, das Training von multimodalen Modellen durchzuführen. Wir diskutieren die Architektur, Vorteile, Nachteile und Wirkweisen.
Support the show
By Sigurd Schacht, Carsten LanquillonSend us a text
In der heutigen Sendung steigen wir noch einmal in die Welt der multimodalen Modelle ein. Diesmal sprechen wir über das Bindeglied zwischen dem uni-modalen Bildverarbeitungsmodell und dem uni-modalen Sprachverarbeitungsmodell, den Q-Former. Q-Former sind eine effiziente Methode, das Training von multimodalen Modellen durchzuführen. Wir diskutieren die Architektur, Vorteile, Nachteile und Wirkweisen.
Support the show

61 Listeners

199 Listeners

111 Listeners

9 Listeners

16 Listeners

13 Listeners

59 Listeners

324 Listeners

9 Listeners

114 Listeners

17 Listeners

4 Listeners

1 Listeners

1 Listeners