Microsoft dominiert heute mit On-Device-Modellen, Agent-Governance und Compliance-Tools — parallel schärft sich die Builder-Debatte: KI-Agenten produzieren Code schneller als Teams ihn verantworten können.
Microsofts Build 2026 war kein gewöhnliches Produktupdate, sondern eine strategische Ansage: Der Konzern demonstriert, dass er die gesamte KI-Stack-Kontrolle von der Modellebene bis zur Governance-Schicht beansprucht. Im Zentrum steht MAI-Thinking-1, das erste eigene Reasoning-Flaggschiff-Modell des Unternehmens — trainiert laut Microsoft „from the ground up on clean data, without distillation from third-party models". Wie Simon Willison detailliert nachrecherchierte, ist die Datenlage allerdings komplizierter: Das technische Paper offenbart, dass MAI-Thinking-1 tatsächlich ein 1-Billion-Parameter-MoE-Modell mit 35 Milliarden aktiven Parametern ist und auf einem proprietären Web-Crawl sowie Common Crawl basiert — dieselben Lizenzprobleme wie bei anderen großen LLMs. Daneben stellte Microsoft sieben weitere Modelle vor, darunter MAI-Code-1-Flash, das direkt in GitHub Copilot und Visual Studio Code integriert ist, sowie MAI-Transcribe-1.5, das laut dem Unternehmen fünfmal schneller als Konkurrenzmodelle arbeitet.
Die eigentliche Substanz von Build 2026 liegt jedoch in der Governance-Infrastruktur. Mit der Agent Control Specification (ACS) stellt Microsoft eine Open-Source-Governance-Schicht für KI-Agenten vor, die fragmentierte System-Prompt-Hacks und Custom-Checks durch auditierbare Policy-Dateien ersetzt. Die Spezifikation greift an mehreren „Interception Points" im Agenten-Workflow ein — vor einem Tool-Call, nach dem Tool-Return und vor der finalen Antwort — und unterstützt Plug-ins für LangChain, AutoGen, CrewAI, Semantic Kernel sowie die Agents SDKs von OpenAI und Anthropic. Ergänzt wird ACS durch ASSERT, ein Open-Source-Framework für applikationsspezifisches Testing: Entwickler beschreiben erwünschtes Verhalten in Klarsprache, ASSERT generiert daraus automatisch Testfälle und zeichnet die Pfade fehlgeschlagener Runs auf — für kontinuierliches Monitoring auch nach dem Deployment. „If you don't understand the behavior of the AI system, it's really hard to know if it's meeting your organization's bar", sagte Microsofts Chief Product Officer of Responsible AI, Sarah Bird.
Diese Governance-Ambition trifft auf eine Entwicklerwelt, die mit der schieren Geschwindigkeit von Agenten-generiertem Code kämpft. Gergely Orosz vom Pragmatic Engineer beobachtet, dass Entwickler mit KI-Agenten doppelt so viel Code produzieren wie noch vor sechs Monaten — mit entsprechenden Folgen für Qualität, Zuverlässigkeit und technische Schulden. Die Zahlen aus der Infrastruktur bestätigen den Druck: GitHub COO Kyle Daigle spricht von 275 Millionen Commits pro Woche, was einem Jahrespfad von 14 Milliarden Commits entspricht — Coding-Agents wuchsen auf GitHub im Jahr 2026 um 1.400 Prozent. Das hat Folgen für die Plattform-Infrastruktur, für CI/CD-Systeme und für Open-Source-Maintainer, die mit Fluten KI-generierter Pull Requests konfrontiert werden. Daigle skizziert, wie Trust-Modelle und Entwicklungsprozesse für eine agentendominierte Welt grundlegend umgebaut werden müssen.
Parallel zum Microsoft-Ökosystem entwickelt sich die On-Device-Front: HCompany hat mit Holo3.1 eine Familie von Computer-Use-Modellen (0,8B bis 35B-A3B) veröffentlicht, die vollständig lokal auf Consumer-Hardware betrieben werden können — dank FP8-, NVFP4- und Q4-GGUF-Checkpoints ohn…