Electric Sheep® AI Podcast

006 - Meta stellt sein neues Text-to-Speech Modell Voicebox vor


Listen Later

NEWS

️ Meta stellt sein neues Text-to-Speech Modell Voicebox vor
Meta erhöht die Schlagzahl ihrer KI Ankündigungen. Nachdem wir letzte Woche gesehen haben wie Meta im Text-to-Music Bereich Google angreift, kommt diese Woche ein neues Text-to-Speech Modell an den Start. Allerdings hält der Konzern den public release zurück, weil sie bisher noch zu viele Möglichkeiten für Missbrauch des Modells sehen. Insbesondere beeindruckend an der Tool Suite ist der Multilanguage Ansatz, mit dem man die eigene Stimme eine von aktuell 6 Sprachen sprechen lassen kann. Nach eigenen Angaben soll das Modell zudem rund 20x schneller operieren als die Competition. Noch ist nicht klar ob Meta auch hier seine Open Source Strategie weiter fortführt und wir werden sicherlich zum public release wieder darüber berichten.

️ TikTok gibt 1 Milliarde $ für KI Chips von nVidia aus
Die Chip Knappheit im AI Space spitzt sich zu und wird nicht gerade einfacher dadurch dass die großen Milliarden Konzerne massiv in Hardware investieren. Nun hat die Muttergesellschaft hinter TikTok, Bytedance, eine Milliarde $ in Ki Chips von nVidia investiert. Das entspricht wiederum rund 100.000 GPU. Eine schwindelerregende Zahl, wenn man bedenkt das ChatGPT auf rund 10.000 GPU trainiert wurde. TikToks Fußabdruck im KI Game wird damit nur noch größer werden.

️ Stability AI stellt neue Version von Stable Diffusion vor
Die neue Version von Stable Diffusion SDXL 0.9 verbessert die Ergebnisse des Text-to-Image Modells teils drastisch. Der Detailgrad, die Komposition und weitere Aspekte der digitalen Bildgebung scheinen deutlich besser zu sein als in der vorherigen Version. Die Beispiele auf der Website sprechen Bände. Die besten Ergebnisse im Text-to-Image Bereich sind jedoch nach wie vor mit Adobe Firefly zu erzielen.

 Midjourney v 5.2 ist da! Zoom Out als Highlight Feature
Auch Midjourney ist in einer Version erschienen, die neben jeder Menge Verbesserungen auch ein neues Feature mitbringt, das sofort zum Twitter und Reddit Hit wurde. Mit dem Zoom Out Feature lassen sich, ähnlich wie mit generative fill von Adobe, Bilder beliebig erweitern. Hier nun als dynamischer Zoom Out von einem Bild. Das Rennen um das fortgeschrittenste Text-to-Image Modell bleibt weiter spannend.

TOOLS

 Buildalesson.org - Mit diesem Tool könnt ihr aus Videos in nur wenigen Klicks Test oder Kursinhalte generieren.

 Huggingface QR Art Generator - Die Zeiten hässlicher QR Codes sind vorbei. Mit dem Modell von Hugging Face könnt ihr ästhetisch ansprechende Codes für eure Kampagnen erstellen. Tolle Beispiele gibt es hier zu sehen.

 Leetresumes - Mit diesem KI Tool könnt ihr euren bestehenden Lebenslauf optimieren, Cover Letter erstellen oder euer LinkedIn Profil verbessern.


Wie immer gilt, liked, subscribed, drückt die Glocke und vor allem, macht mit, indem ihr Fragen, Kritik und Anregungen an [email protected] schickt, oder nutzt die Voice Messaging Funktion auf Spotify.

Besucht Electric Sheep® auf www.electric-sheep.ai oder auf LinkedIn. Falls ihr keine KI News verpassen wollt, abonniert doch hier auch den Email Newsletter.

__________________________________________

Music from #Uppbeat (free for Creators!):

https://uppbeat.io/t/pecan-pie/night-gatherings

License code: DGBLDOP86EGUCSC4

...more
View all episodesView all episodes
Download on the App Store

Electric Sheep® AI PodcastBy Sebastian Moritz