Agentic AI dominiert heute auf zwei Achsen: Skalierung (Memora, ENPIRE, Gartner-Outlook) und Sicherheit (Claude-Code-Malware, Meta-Datenprovenienz). Daneben setzen konkrete Tool-Releases und Markt-Infrastruktur-Moves den Builder-Takt.
Die Sicherheitsdimension agentic KI rückt heute besonders scharf in den Fokus. Sicherheitsforscher von 0DIN, Mozillas GenAI-Bug-Bounty-Plattform, haben einen neuen Angriffsvektor dokumentiert: Ein normales GitHub-Repository kann über einen Setup-Skript, der zur Laufzeit einen Befehl aus einem DNS-Eintrag zieht und ausführt, Claude Code zur Ausführung einer Reverse Shell veranlassen — ohne dass der Schadcode je im Repository selbst auftaucht. Statische Scanner, Code-Reviews und der Agent selbst bleiben blind. Empfehlung der Forscher: Agenten sollten Setup-Skripte vor der Ausführung anzeigen, und Entwickler sollten Drittanbieter-Repos grundsätzlich als nicht vertrauenswürdigen Code behandeln. Parallel dazu offenbart Metas Entscheidung, den Einsatz von Claude Code und Codex intern einzuschränken, eine zweite Sicherheitsebene: Nicht der Angriff von außen, sondern unkontrollierte Datenprovenienz im eigenen Haus. Laut internen Dokumenten, die The Information vorliegen, fürchtet Meta die unbeabsichtigte Destillation von Konkurrenzmodellen in die eigenen Trainingsdaten — ein Problem, das auch Anthropic (gegen Alibaba) und xAI (mit OpenAI-Modellen) bereits betroffen hat. Meta baut derzeit seinen eigenen Coding-Assistenten MetaCode auf und will die Abhängigkeit von externen Tools reduzieren, auch wegen steigender Kosten; interne Memos sprechen von milliardenschweren Ausgaben für KI-Tools allein in diesem Jahr.
Dass KI-Coding-Tools Geschwindigkeit erzeugen, aber keine durchgängige Lieferbeschleunigung, bestätigt unterdessen ein GitLab-Report, der diesen Widerspruch als „AI Paradox" benennt: 78 % der Entwickler berichten von schnellerer Code-Produktion, 73 % von verbesserter Qualität — doch 79 % sagen, die Gesamtlieferung hat sich nicht im gleichen Tempo beschleunigt. Der Engpass hat sich laut 85 % der Befragten von der Codeerstellung ins Review und Testing verlagert. Dazu kommen Governance-Lücken: Nur 34 % der Unternehmen, die in den vergangenen zwölf Monaten einen Produktionsvorfall hatten, konnten tatsächlich innerhalb von 24 Stunden bestimmen, ob AI-generierter Code dazu beigetragen hatte — obwohl 87 % der Befragten glaubten, dazu in der Lage zu sein. Die Frage, woher Code stammt, wer dafür verantwortlich ist und was er tun soll, ist für die meisten Organisationen heute nicht zuverlässig beantwortbar. Einen konkreten Praxisblick auf die Stärken und Grenzen von Coding-Agenten liefert der htmx-Autor Carson Gross in seiner Fallstudie mit Claude beim Parser-Debugging: Der Agent half, die Ursache einer Regression in Minuten zu identifizieren — beim Fix jedoch produzierte er zunächst zu enge oder überkomplexe Lösungen. Gross beschreibt das als „Sorcerer's Apprentice Problem": Wer den eigenen Code nicht tief genug kennt, akzeptiert einen Hack statt der saubereren Lösung.
Auf der Architekturebene liefern zwei Veröffentlichungen heute die technische Gegenthese zur reinen Skalierungsdebatte. Microsofts Memora-System, veröffentlicht auf der ICML 2026, entkoppelt Speicherinhalt und Retrieval-Schicht für langlebige Agenten-Deployments: Statt den gesamten Gesprächsverlauf in den Kontext zu laden, nutzt Memora leichtgewichtige Strukturabstraktionen — und erreicht damit laut Microsoft bis zu 98 % weniger Kontext-Tokens bei …