Drei Achsen dominieren heute: Agentenarchitektur tritt in die operative Phase (OpenAI, xAI, DeepSeek), Open-Source-Fundamente für Vision und Coding konsolidieren sich, und die KI-Chip-Lieferkette bekommt ein Signal aus Amsterdam.
Die operative Wende in der KI-Architektur lässt sich diese Woche an einer Handvoll konkreter Produktentscheidungen ablesen. OpenAIs Workspace Agents und GPT-5.5 stehen dabei im Zentrum: Das Unternehmen verlagert ChatGPT von einem individuellen Produktivitätswerkzeug zu einem geteilten organisatorischen Substrat — Codex-gestützte Agenten, die in Unternehmensumgebungen leben, über Tools wie ChatGPT und Slack operieren, Berechtigungen respektieren, Kontext speichern und lang laufende Workflows ausführen. Die Benchmark-Erzählung wird dabei fast zur Nebensache; was zählt, ist das Modell als Runtime. Gleichzeitig integriert OpenAI Codex als eigenständiges Modell in GPT-5.5 und konsolidiert damit Coding-Fähigkeiten ins Hauptmodell — potenziell günstigere Token-Kosten, aber weniger Spezialisierung für Entwickler, die auf ein dediziertes Coding-Modell gesetzt hatten. Die programmatische Verdichtung setzt sich fort: xAI verhandelt offenbar über eine Partnerschaft mit Cursor, dem KI-nativen Code-Editor, der sich vom Novelty-Tool zur Infrastruktur entwickelt hat. Code ist das ideale Agentenumfeld — explizit, testbar, komposierbar, ökonomisch wertvoll. Wer die Feedback-Schleife aus Vorschlag, Edit, Ausführung und Verifikation kontrolliert, besitzt eine der strategisch wichtigsten Oberflächen im KI-Stack.
Den Druck von unten illustrieren DeepSeek V4 und Kimi 2.6: Das open- und semi-offene Modell-Ökosystem komprimiert die Frontier-Grenze schneller als erwartet. Der Wettbewerb verlagert sich weg von Chat-Qualität hin zu Long-Context-Performance, Coding-Zuverlässigkeit, Tool-Use und Latenz — also genau den Dimensionen, die für agentenbasierte Workflows entscheidend sind. Dass OpenAI gleichzeitig fünf Leitprinzipien für die AGI-Entwicklung veröffentlicht — Demokratisierung, Empowerment, universeller Wohlstand, Resilienz und ein fünftes Prinzip —, ist vor diesem Kontext kein reines PR-Manöver: Sam Altman adressiert explizit das Risiko, dass Superintelligenz Macht in den Händen weniger Unternehmen konzentriert, und formuliert das Gegenprogramm als dezentralisierte Verteilung. Die normative Rahmensetzung kommt in dem Moment, in dem operative KI-Systeme in institutionelle Prozesse einwachsen.
Während die Agentenarchitektur auf der Applikationsebene reift, konsolidieren sich darunter die Open-Source-Fundamente für spezialisierte Wahrnehmungsaufgaben. Metas Sapiens2 ist das deutlichste Beispiel: Das Foundation Model für menschzentrierte Computer-Vision wurde auf einem kuratierten Datensatz von 1 Milliarde Menschenbildern trainiert, deckt Modellgrößen von 0,4 bis 5 Milliarden Parametern ab und arbeitet nativ in 1K-Auflösung mit hierarchischen Varianten bis 4K. Es löst fünf Aufgaben — Pose, Segmentierung, Surface Normals, Pointmap und Albedo — in einem einzigen Backbone, was Infrastrukturaufwand für AR/VR-, Avatar- und Körper-Tracking-Anwendungen erheblich reduziert. Ergänzend dazu zeigt das CHAI-Framework aus CMU, wie strukturierte Human-AI-Kollaboration — durch SFT, DPO und Inference-Time Scaling auf Basis des Qwen3-VL-Modells — Open-Source-Videosprachmodelle auf das Niveau geschlossener Systeme wie Gemini-3.1-Pro hebt. Datensätze, Benchmarks und Code sind öffentlich verfügbar. Die Botschaft ist konsistent: Die Open-Source-Schic…