April 27, 2026

154 - LLMs automatisiert knacken

6 minutes

Sicherheitsleitplanken bei KIs sind keine harten Grenzen, sondern eine gefährliche Illusion. In dieser Folge zeigen wir, wie Forscher von Palo Alto und Unit 42 mithilfe von genetischen Algorithmen und automatisiertem Prompt-Fuzzing jedes bekannte Large Language Model (LLM) erfolgreich knacken konnten.Wir erklären die Mechanismen dahinter und diskutieren folgende Kernpunkte:

Automatisierte Jailbreaks: Wie Angreifer in wenigen Minuten dutzende Sicherheitslücken ausnutzen.

Gefahr durch offene Modelle: Warum sich Schutzmechanismen bei lokalen Modellen einfach heraustrainieren lassen.

Indirect Prompt Injection: Wie über externe Dokumente (RAG) unsichtbare Befehle in die KI eingeschleust werden können, was OWASP zur Top-Bedrohung für 2025 erklärt hat.

...more

View all episodes

By KI-Gilde

April 27, 2026

154 - LLMs automatisiert knacken

6 minutes

Automatisierte Jailbreaks: Wie Angreifer in wenigen Minuten dutzende Sicherheitslücken ausnutzen.

Gefahr durch offene Modelle: Warum sich Schutzmechanismen bei lokalen Modellen einfach heraustrainieren lassen.

Indirect Prompt Injection: Wie über externe Dokumente (RAG) unsichtbare Befehle in die KI eingeschleust werden können, was OWASP zur Top-Bedrohung für 2025 erklärt hat.

...more

Share 154 - LLMs automatisiert knacken

Sign up to save your podcasts

154 - LLMs automatisiert knacken

154 - LLMs automatisiert knacken