Einfach Komplex – Der Software- und IT-Podcast

LLMs (Large Language Models) & Transformer-Architektur #71


Listen Later

In dieser Folge werfen wir zunächst einen Blick auf neuronale Netze und erklären dann den Prozess der Entwicklung und das Training von LLMs (Large Language Models). LLMs sind leistungsstarke KI-Modelle, die entwickelt wurden, um menschenähnliche Texte zu verstehen und zu generieren. Ihre Grundlage bilden Transformer-Architekturen, die erstmals 2017 im wegweisenden Paper "Attention is All You Need" von Google eingeführt wurden. Diese Architektur hat das Feld des Machine Learnings revolutioniert, da sie es Modellen ermöglicht, kontextuelle Abhängigkeiten effizienter zu erfassen und dadurch präzisere Vorhersagen und generative Ergebnisse zu liefern.

Heute gibt es eine Vielzahl von LLMs, darunter OpenAI's GPT-Modelle, Googles BERT und T5 und Meta's LLaMA. Einige Modelle, wie OpenAI's GPT-4, sind multimodal, was bedeutet, dass sie nicht nur mit Texten, sondern auch mit Bildern arbeiten können. Diese Modelle kommen in unterschiedlichsten Anwendungsbereichen zum Einsatz, von Übersetzungen und Chatbots bis hin zur automatisierten Textgenerierung und Datenanalyse. Trotz ihrer beeindruckenden Leistungsfähigkeit gibt es Herausforderungen, insbesondere bei ethischen Fragen, der Reduktion von Bias und dem verantwortungsvollen Einsatz der Technologie.

----

Einfach Komplex ist ein Podcast von Heisenware.

Alle Infos und Kontakte findest du im Linktree

⁠⁠⁠⁠⁠https://linktr.ee/heisenware⁠⁠⁠

und unter

https://heisenware.com

----

⁠Dr. Burkhard Heisen⁠⁠ und ⁠⁠Gerrit Meyer⁠⁠ sprechen heute über:

(00:00) Neuronale Netze

(13:00) Sprachmodelle trainieren

(21:30) Funktionsweise LLM

(28:30) Tokens

(34:30) Embeddings

(41:30) Attention / Transformer

(47:30) Finetuning und Trainingsdaten

(57:30) KI-Tools und Anpassung auf eigene Daten

...more
View all episodesView all episodes
Download on the App Store

Einfach Komplex – Der Software- und IT-PodcastBy Dr. Burkhard Heisen, Gerrit Meyer, Heisenware


More shows like Einfach Komplex – Der Software- und IT-Podcast

View all
Bits und so by Undsoversum GmbH

Bits und so

25 Listeners

c’t uplink - der IT-Podcast aus Nerdistan by c’t Magazin

c’t uplink - der IT-Podcast aus Nerdistan

6 Listeners

heiseshow by heise online

heiseshow

2 Listeners

Computer und Kommunikation by Deutschlandfunk

Computer und Kommunikation

10 Listeners

digital kompakt | Digitale Strategien für morgen by Joel Kaczmarek

digital kompakt | Digitale Strategien für morgen

7 Listeners

kurz informiert by heise online by heise online

kurz informiert by heise online

1 Listeners

Doppelgänger by Philipp Glöckler, Philipp Klöckner

Doppelgänger

10 Listeners

F.A.Z. Künstliche Intelligenz by Frankfurter Allgemeine Zeitung

F.A.Z. Künstliche Intelligenz

0 Listeners

Aha! Zehn Minuten Alltags-Wissen by WELT

Aha! Zehn Minuten Alltags-Wissen

31 Listeners

KI verstehen by Deutschlandfunk

KI verstehen

8 Listeners

Der KI-Podcast by ARD

Der KI-Podcast

18 Listeners

KI-Update – ein heise-Podcast by Isabel Grünewald, heise online

KI-Update – ein heise-Podcast

2 Listeners

Passwort - der Podcast von heise security by Dr. Christopher Kunz, Sylvester Tremmel

Passwort - der Podcast von heise security

3 Listeners

Handelsblatt KI-Briefing - Das News-Update zu Künstlicher Intelligenz by Larissa Holzki

Handelsblatt KI-Briefing - Das News-Update zu Künstlicher Intelligenz

2 Listeners

Wie geht's? mit Robin Gosens by Robin Gosens

Wie geht's? mit Robin Gosens

5 Listeners