
Sign up to save your podcasts
Or


Google's AI-lab Deepmind heeft een nieuwe AI-technologie gepresenteerd die audio kan genereren op basis van videobeeld. Het AI-model analyseert videopixels en kan daar zelf audio aan toevoegen. Dat lijkt ook te werken met lipsynchronisatie, is in voorbeelden te zien.
De V2A (video-to-audio) technologie werkt in combinatie met het nieuwe AI-model Veo, van Google, dat video's kan genereren. Dat was tot nu toe altijd een stille video, maar daar kan nu ook audio aan worden toegevoegd. Google toont onder meer een video waarbij gitaarpingels klinken bij een video van gitaarspel.
Het meest opvallende voorbeeld is met animatiefiguurtjes die tegen elkaar praten. Het AI-model kan daarbij spraak toevoegen. Volgens Google is de technologie nog niet heel goed, en moet er nog een hoop aan gebeuren.
Verder in deze Tech Update:
See omnystudio.com/listener for privacy information.
By BNR Nieuwsradio5
33 ratings
Google's AI-lab Deepmind heeft een nieuwe AI-technologie gepresenteerd die audio kan genereren op basis van videobeeld. Het AI-model analyseert videopixels en kan daar zelf audio aan toevoegen. Dat lijkt ook te werken met lipsynchronisatie, is in voorbeelden te zien.
De V2A (video-to-audio) technologie werkt in combinatie met het nieuwe AI-model Veo, van Google, dat video's kan genereren. Dat was tot nu toe altijd een stille video, maar daar kan nu ook audio aan worden toegevoegd. Google toont onder meer een video waarbij gitaarpingels klinken bij een video van gitaarspel.
Het meest opvallende voorbeeld is met animatiefiguurtjes die tegen elkaar praten. Het AI-model kan daarbij spraak toevoegen. Volgens Google is de technologie nog niet heel goed, en moet er nog een hoop aan gebeuren.
Verder in deze Tech Update:
See omnystudio.com/listener for privacy information.

11 Listeners

9 Listeners

13 Listeners

4 Listeners

210 Listeners

11 Listeners

47 Listeners

6 Listeners

94 Listeners

13 Listeners

48 Listeners

10 Listeners

18 Listeners

168 Listeners

67 Listeners

10 Listeners

15 Listeners

3 Listeners