Einfach Komplex – Der Software- und IT-Podcast

LLMs (Large Language Models) & Transformer-Architektur #71


Listen Later

In dieser Folge werfen wir zunächst einen Blick auf neuronale Netze und erklären dann den Prozess der Entwicklung und das Training von LLMs (Large Language Models). LLMs sind leistungsstarke KI-Modelle, die entwickelt wurden, um menschenähnliche Texte zu verstehen und zu generieren. Ihre Grundlage bilden Transformer-Architekturen, die erstmals 2017 im wegweisenden Paper "Attention is All You Need" von Google eingeführt wurden. Diese Architektur hat das Feld des Machine Learnings revolutioniert, da sie es Modellen ermöglicht, kontextuelle Abhängigkeiten effizienter zu erfassen und dadurch präzisere Vorhersagen und generative Ergebnisse zu liefern.

Heute gibt es eine Vielzahl von LLMs, darunter OpenAI's GPT-Modelle, Googles BERT und T5 und Meta's LLaMA. Einige Modelle, wie OpenAI's GPT-4, sind multimodal, was bedeutet, dass sie nicht nur mit Texten, sondern auch mit Bildern arbeiten können. Diese Modelle kommen in unterschiedlichsten Anwendungsbereichen zum Einsatz, von Übersetzungen und Chatbots bis hin zur automatisierten Textgenerierung und Datenanalyse. Trotz ihrer beeindruckenden Leistungsfähigkeit gibt es Herausforderungen, insbesondere bei ethischen Fragen, der Reduktion von Bias und dem verantwortungsvollen Einsatz der Technologie.


Einfach Komplex ist ein Podcast von Heisenware. Alle Infos und Kontakte findest du im Linktree:

⁠⁠⁠⁠⁠https://linktr.ee/heisenware⁠⁠⁠


⁠Dr. Burkhard Heisen⁠⁠ und ⁠⁠Gerrit Meyer⁠⁠ sprechen heute über:

(00:00) Neuronale Netze

(13:00) Sprachmodelle trainieren

(21:00) Funktionsweise LLM

(28:00) Tokens

(34:00) Embeddings

(41:00) Attention / Transformer

(47:00) Finetuning und Trainingsdaten

(57:00) KI-Tools und Anpassung auf eigene Daten

...more
View all episodesView all episodes
Download on the App Store

Einfach Komplex – Der Software- und IT-PodcastBy Heisenware, Dr. Burkhard Heisen, Gerrit Meyer


More shows like Einfach Komplex – Der Software- und IT-Podcast

View all
c’t uplink - der IT-Podcast aus Nerdistan by c’t Magazin

c’t uplink - der IT-Podcast aus Nerdistan

5 Listeners

heiseshow by heise online

heiseshow

2 Listeners

Der Apfelplausch by Lukas Gehrer und Roman Van Genabith

Der Apfelplausch

0 Listeners

kurz informiert by heise online by heise online

kurz informiert by heise online

2 Listeners

Finanzfluss Podcast by Finanzfluss

Finanzfluss Podcast

29 Listeners

Mac & i - der Apple-Podcast by Mac & i

Mac & i - der Apple-Podcast

0 Listeners

Wegen guter Führung - Der ehrliche Führungspodcast by Harvard Business manager

Wegen guter Führung - Der ehrliche Führungspodcast

3 Listeners

Geld ganz einfach - von Saidi by Finanztip

Geld ganz einfach - von Saidi

8 Listeners

Bit-Rauschen: Der Prozessor-Podcast von c’t by c't Magazin

Bit-Rauschen: Der Prozessor-Podcast von c’t

1 Listeners

F.A.Z. Künstliche Intelligenz by Frankfurter Allgemeine Zeitung

F.A.Z. Künstliche Intelligenz

0 Listeners

{ungeskriptet} - Gespräche, die dich weiter bringen by Ben Berndt

{ungeskriptet} - Gespräche, die dich weiter bringen

16 Listeners

KI-Update – ein heise-Podcast by Isabel Grünewald, heise online

KI-Update – ein heise-Podcast

5 Listeners

KI verstehen by Deutschlandfunk

KI verstehen

7 Listeners

Der KI-Podcast by ARD

Der KI-Podcast

12 Listeners

Passwort - der Podcast von heise security by Dr. Christopher Kunz, Sylvester Tremmel

Passwort - der Podcast von heise security

3 Listeners