programmier.bar – der Podcast für App- und Webentwicklung

Deep Dive 208 – AI & Audio mit Georg Holzmann


Listen Later

Wie hat dir die Folge gefallen?
Gut 👍
Schlecht 👎
(Keine Anmeldung erforderlich)


Auphonic gehört für viele Podcast-Workflows längst zum Standard, aber wie baut man eigentlich ein Produkt, das Audio automatisch „gut“ klingen lässt? In dieser Deep-Dive-Folge sprechen wir mit Georg Holzmann über die Entstehungsgeschichte hinter Auphonic und warum die Idee ursprünglich aus einem ganz einfachen Problem kam: schlechte Audioqualität bei Podcasts.

Aus einem Mix von Audio-Engineering, Informatik und Machine Learning entsteht ein Tool, das heute Millionen Nutzer:innen einsetzen. Wir schauen uns an, wie sich das Produkt von ersten Klassifikatoren hin zu komplexeren AI-Modellen entwickelt hat und warum Auphonic schon lange vor dem aktuellen AI-Boom auf diese Technologien gesetzt hat.

Wir sprechen darüber, wie unterschiedliche Komponenten wie Noise Reduction, De-Essing, Equalizing und Loudness-Normalisierung zusammenspielen und warum gerade die Balance zwischen Sprache und Musik eine besondere Herausforderung ist. Dabei wird schnell klar: Viele Probleme lassen sich technisch objektiv lösen, andere bleiben zwangsläufig subjektiv – etwa beim „richtigen“ Klang einer Stimme. Genau hier wird spannend, wie Auphonic versucht, sinnvolle Defaults zu liefern und gleichzeitig genug Flexibilität für unterschiedliche Use Cases zu bieten.

Ein großer Teil der Folge dreht sich um die technische Umsetzung: Statt eines großen „Alleskönner“-Modells setzt Auphonic auf viele spezialisierte Modelle und klassische Signalverarbeitung in Kombination. Wir klären, warum dieser modulare Ansatz im Audio-Bereich sinnvoll ist, welche Rolle unterschiedliche Modellarchitekturen spielen und wie Trainingsdaten überhaupt entstehen – inklusive der Herausforderung, gute Ziel-Daten zu finden und daraus künstlich „schlechte“ Beispiele zu generieren. Außerdem werfen wir einen Blick auf die Infrastruktur dahinter: von GPU-Servern bei Hetzner über eigene Trainingshardware auf einem Bio-Bauernhof bis hin zu Queue-basierten Processing-Pipelines.

Zum Abschluss geht es um Produktentscheidungen und den Markt: Wie entwickelt man ein Pricing für ein AI-Produkt, das mit steigender Modellkomplexität immer teurer werden kann? Warum war es ein Vorteil, früh gestartet zu sein? Und welche Rolle spielt der aktuelle AI-Hype überhaupt in einem Bereich, der schon lange vorher stark von Machine Learning geprägt war? Wir sprechen außerdem darüber, warum vollautomatische, AI-generierte Podcasts bisher keine große Rolle spielen und warum Menschen am Ende vielleicht doch lieber anderen Menschen zuhören.


Schreibt uns!
Schickt uns eure Themenwünsche und euer Feedback: [email protected]

Folgt uns!
Bleibt auf dem Laufenden über zukünftige Folgen und virtuelle Meetups und beteiligt euch an Community-Diskussionen.

Bluesky
Instagram
LinkedIn
Meetup
YouTube

Musik: Hanimo

...more
View all episodesView all episodes
Download on the App Store

programmier.bar – der Podcast für App- und WebentwicklungBy programmier.bar


More shows like programmier.bar – der Podcast für App- und Webentwicklung

View all
Bits und so by Undsoversum GmbH

Bits und so

26 Listeners

Freak Show by Metaebene Personal Media - Tim Pritlove

Freak Show

9 Listeners

Apfelfunk by Malte Kirchner & Jean-Claude Frick

Apfelfunk

7 Listeners

c’t uplink - der IT-Podcast aus Nerdistan by c’t Magazin

c’t uplink - der IT-Podcast aus Nerdistan

10 Listeners

heiseshow by heise online

heiseshow

2 Listeners

Logbuch:Netzpolitik by Metaebene Personal Media - Tim Pritlove

Logbuch:Netzpolitik

5 Listeners

Computer und Kommunikation by Deutschlandfunk

Computer und Kommunikation

9 Listeners

kurz informiert by heise online by heise online

kurz informiert by heise online

2 Listeners

Mac & i - der Apple-Podcast by Mac & i

Mac & i - der Apple-Podcast

0 Listeners

Bit-Rauschen: Der Prozessor-Podcast von c’t by c't Magazin

Bit-Rauschen: Der Prozessor-Podcast von c’t

0 Listeners

KI verstehen by Deutschlandfunk

KI verstehen

12 Listeners

Der KI-Podcast by ARD

Der KI-Podcast

19 Listeners

KI-Update – ein heise-Podcast by Isabel Grünewald, heise online

KI-Update – ein heise-Podcast

5 Listeners

Passwort - der Podcast von heise security by Dr. Christopher Kunz, Sylvester Tremmel

Passwort - der Podcast von heise security

3 Listeners

Darknet Diaries Deutsch by heise online

Darknet Diaries Deutsch

0 Listeners