KI-Regulierung gerät auf beiden Seiten des Atlantiks unter Druck – während die USA staatliche Regeln aushebeln wollen, verbietet England KI in Gerichtsaussagen. Dazu: neue Agenten-Modelle, lokale Inferenz-Benchmarks und ein RSI-Labor, das die Compute-Logik der Branche herausfordert.
Die regulatorische Tektonik verschiebt sich auf beiden Seiten des Atlantiks – und zwar in entgegengesetzte Richtungen. In Washington hat das US-Repräsentantenhaus einen Gesetzesentwurf vorgelegt, der einzelnen Bundesstaaten untersagen würde, eigene KI-Regulierungen zu erlassen – ein Schritt, der den regulatorischen Flickenteppich beseitigen, zugleich aber strenge Verbraucherschutzregeln etwa Kaliforniens aushebeln würde. Passend dazu verlässt Sriram Krishnan das Weiße Haus Ende Juni: Der Senior Policy Advisor für KI, der zuvor bei Microsoft, Twitter und Andreessen Horowitz tätig war, hatte die Administrations-KI-Agenda mitgeprägt – darunter den AI Action Plan, der Rechenzentrumsausbau über Regulierung und Sicherheit priorisierte, sowie eine Executive Order zur Bekämpfung staatlicher KI-Regeln. Nach dem Abgang von David Sacks ist Krishnan damit eine weitere Schlüsselfigur, die das Feld verlässt, wenngleich er laut Washington Post plant, eine externe Institution zu gründen, um weiterhin Einfluss auf Trumps KI-Politik zu nehmen. In England läuft die Entwicklung in die andere Richtung: Behörden haben der Polizei in England und Wales angewiesen, KI bei der Erstellung von Gerichtsaussagen vorläufig zu stoppen – ein Signal, dass Legal-AI-Tools im Justizsystem unter verschärften Compliance-Druck geraten.
Während die Politik über Leitplanken streitet, liefern die Labs neue Fakten. Alibaba hat Qwen3.7-Plus veröffentlicht, ein multimodales Modell, das visuelle Wahrnehmung, GUI-Bedienung und Coding in einem einzigen Agenten-Loop vereint. In Demos ließ das Modell einen Agenten über elf Stunden autonom eine App mit mehr als 10.000 Codezeilen entwickeln und die native macOS-Stocks-App eigenständig nachbauen. Auf GUI-Benchmarks wie AndroidWorld und ScreenSpot Pro übertrifft Qwen3.7-Plus laut Alibabas eigenen Messungen Konkurrenzmodelle – bei reinen Reasoning-Benchmarks wie MedXpertQA-MM bleibt es hinter Gemini 3.1 Pro zurück. Das Modell ist proprietär und über Alibaba Cloud verfügbar. Deutlich radikaler setzt die japanische Startup Sakana AI an: Das Unternehmen hat das Sakana AI RSI Lab gegründet, eine Forschungsgruppe für rekursive Selbstverbesserung. Der Ansatz: statt immer größerer Modelle mit massivem Compute-Einsatz setzt Sakana auf evolutionäre Optimierung, bei der KI-Agenten aktiv an ihren eigenen technischen Grundlagen arbeiten und Code für ihre eigenen Architekturen schreiben. Ein Vorläufer-Projekt, The AI Scientist, schrieb laut Sakana ein Paper, das ein Peer-Review-Verfahren bestand – die zugrundeliegende Forschung wurde im März 2026 in Nature veröffentlicht. Das RSI-Labor skizziert einen Vier-Phasen-Fahrplan, der auf moderate Compute-Ressourcen ausgelegt ist – eine direkte Herausforderung an das Skalierungsparadigma der großen US-Labs.
Für Entwickler, die Modelle lokal betreiben, liefert die Community derweil ernüchternde Befunde: Ein Community-Benchmark zu Gemma 4 31B zeigt, dass Googles offizielles QAT-Q4_0-Quantisierungsformat auf wikitext-2 nur 50,43 % Top-1-Accuracy gegenüber der Q8_0-Referenz erreicht, während das klassische Q4_K_M-Format 66,06 % erzielt – ein Ergebnis, das Googles implizitem QAT-Versprechen widerspricht und unabhängige Reproduktion …