Agent-Infrastruktur und Open-Source-Modelle dominieren heute: Google und OpenAI schieben Governance- und Autonomie-Features für produktive Agenten nach, während IBM und Peanut die offene Modell-Landschaft neu sortieren. Dazu: Cerebras' IPO-Vorstoß, ein brutales Benchmark-Signal für Bild-Apps und Jack Clarks 2028-These.
Die Woche steht im Zeichen produktionsreifer Agent-Infrastruktur — und der Frage, wer die Kontrolle darüber behält. Google hat auf dem Cloud Next '26 in Las Vegas mit der Gemini Enterprise Agent Platform einen folgenreichen Schritt getan: Governance ist kein Zusatzmodul mehr, sondern fester Bestandteil der Architektur. Jeder Agent erhält eine kryptografische Identität für Traceability und Auditing, der Agent Gateway übernimmt die Aufsicht über Interaktionen zwischen Agenten und Unternehmensdaten. Der Kontext dazu ist ernüchternd: Laut einem OutSystems-Survey haben 97 % der Organisationen bereits Agentic-AI-Strategien erkundet, doch nur 36 % verfügen über einen zentralisierten Governance-Ansatz — und nur 12 % nutzen eine zentrale Plattform zur Kontrolle von AI-Sprawl. Gartner verortet Agentic AI aktuell am Peak of Inflated Expectations; zwischen 86 % und 89 % der Pilots haben laut unabhängigen Analysen nie echte Produktionsreife erreicht. Googles Antwort ist architektonisch kohärent — verlangt aber, wie Bain & Company nach dem Event festhielt, eine deutlich tiefere Bindung an Googles Stack.
Parallel dazu arbeitet OpenAI an der anderen Seite desselben Problems: nicht Governance, sondern Autonomie. Die Symphony-Spezifikation ermöglicht es Agents, automatisch Tickets aus dem Projektmanagement-Tool Linear zu bearbeiten, ohne dass Entwickler jede Session überwachen müssen. Der adressierte Engpass ist explizit menschliche Aufmerksamkeit — nicht Modellkapazität. Wer beides zusammendenkt, erkennt das eigentliche Spannungsfeld: Autonomie skaliert nur, wenn Governance mitläuft. Einen praktischen Entscheidungsrahmen für den Weg dorthin liefert ein Architektur-Leitfaden zu Single- vs. Multi-Agent-Systemen: Single-Agents genügen für fokussierte Aufgaben, während komplexe Workflows mit parallelen Spezialisierungen — Retrieval, Coding, Verifikation, Testing — Multi-Agent-Architekturen erfordern, die nach dem ReAct-Muster (Reasoning + Acting) operieren.
Die offene Modell-Landschaft wird derweil an zwei Fronten neu sortiert. IBM hat die Granite-4.1-Familie in den Größen 3B, 8B und 30B unter Apache-2.0-Lizenz veröffentlicht — kommerzielle Nutzung ohne Restriktionen. Unsloth hat allein für das 3B-Modell 21 GGUF-quantisierte Varianten bereitgestellt, die zwischen 1,2 GB und 6,34 GB liegen und damit ressourcenbeschränkte Deployments abdecken. Im Bereich Text-to-Image deutet sich eine ähnliche Verschiebung an: Ein anonymes Modell namens Peanut rangiert bereits auf Platz 8 der Artificial Analysis Text to Image Arena; die Open Weights sollen bald folgen und würden Peanut zum führenden Open-Source-Text-to-Image-Modell vor Z-Image Turbo, Qwen-Image und FLUX.2 [dev] machen. Dass visuelle Modelle gerade besondere Dynamik erzeugen, belegt ein Appfigures-Report: Bildmodell-Releases treiben 6,5× mehr App-Downloads als klassische Modell-Updates. ChatGPT gewann nach Einführung des GPT-4o-Bildmodells rund 12 Millionen inkrementelle Installs in 28 Tagen — und 70 Millionen Dollar Bruttoumsatz. Geminis Nano-Banana-Release brachte zwar mehr als 22 Millionen Zusatz-Downloads, aber nur 181.000 Dollar Umsatz im selben Zeitfenster. Die Konversionslogik von D…