Infrastruktur-Wettrüsten dominiert: OpenAIs 1-GW-Rechenzentrum, Anthropics IPO-Vorbereitung und neue Chips setzen die Rahmenbedingungen. Daneben: konkrete Builder-Patterns für Agenten, RAG und Coding-Workflows.
Die Kapitalmarkt-Dimension des KI-Wettrüstens bekommt eine neue Koordinate: Anthropic hat vertraulich einen S-1-Börsenprospekt bei der SEC eingereicht — ein IPO bleibt von Marktbedingungen abhängig, Aktienanzahl und Ausgabepreis stehen noch nicht fest. Der Schritt öffnet dem Claude-Betreiber grundsätzlich die Option auf öffentliche Kapitalmarktfinanzierung. Auf der Hardware-Seite verschiebt sich derweil das Kräfteverhältnis bei offenen Modellen: Nvidias Nemotron 3 Ultra belegt laut Benchmark-Plattform Artificial Analysis mit 48 Punkten den Spitzenplatz unter den offenen US-Modellen — vor Gemma 4 31B (39) und gpt-oss-120b (33). Der Rückstand gegenüber führenden chinesischen Open-Source-Modellen bleibt indes bestehen: Kimi K2.6 kommt auf 54 Punkte, das stärkste geschlossene Modell Opus 4.8 auf 61. Nemotron 3 Ultra soll ab 4. Juni auf Hugging Face und OpenRouter verfügbar sein. Ergänzt wird das Chip-Bild durch Intels Ankündigung auf der Computex 2026: Die Crescent Island GPU auf Arc-Xe-3P-Basis bietet bis zu 480 GB LPDDR5X-VRAM bei einem TDP von 350 Watt — ohne HBM, was bei speicherbandbreitenintensiven Workloads Effizienzabstriche bedeutet, aber neue Möglichkeiten für große lokale Modelle eröffnet.
Während die Infrastruktur-Debatte auf Chip- und Cloud-Ebene weiterläuft, verdichtet sich das Bild auf der Distributions-Seite: OpenAI stellt Frontier-Modelle und Codex nun als Generally Available auf AWS bereit — Enterprise-Teams können damit über bestehende AWS-IAM-Kontrollen und Beschaffungsprozesse auf die Modelle zugreifen, ohne separaten OpenAI-Vertrag. Für Compliance-getriebene Organisationen ist das eine relevante Reibungsreduktion. Auf der Anwendungsseite demonstriert GM, wie weit industrielle KI-Integration bereits gediehen ist: FEA-Simulationsläufe, die bisher 15 Stunden dauerten, laufen jetzt in einer Minute, berichtet GM-CPO Sterling Anderson. Das ermöglicht eine Breite von Iterationen, die mit klassischen Methoden schlicht nicht möglich war — und steht exemplarisch für das, was Anderson als "dritten Epoch" des Ingenieurwesens bezeichnet: den Kollaps bisher sequenzieller Entwicklungsfunktionen in einen gemeinsamen, probabilistischen Prozess.
Für Builder, die Agenten-Systeme produktiv einsetzen wollen, liefert der aktuelle Zyklus zwei wichtige konzeptionelle Korrekturen. IBM Research argumentiert in einer Analyse zu Agent Logic als Schlüssel für skalierbare Enterprise-KI, dass reine LLM-Ansätze in Enterprise-Workflows systematisch scheitern: Softwareprimitiven wie Wissensgraphen und Programm-Analyse-Bibliotheken, die auf der Agenten-Schicht operieren, sollen den Token-Verbrauch gegenüber reinen LLM-Ansätzen um bis zu 30× senken und gleichzeitig die Qualität steigern. Parallel dazu zieht ein Grundsatztext zu RAG und dem ML-Toolkit eine scharfe Trennlinie: RAG ist kein Machine-Learning-Problem — wer Hyperparameter-Sweeps und Train/Test-Splits auf ein Retrieval-System anwendet, optimiert am falschen Objekt. Der Autor illustriert das an einem Team, das sechs Monate lang an Optuna-Sweeps, einem Custom-Reranker und einem fein-getunten Embedding-Modell arbeitete, ohne die Produktionsgenauigkeit zu verbessern — der eigentliche Bug lag im Parser.
Auf der Werkzeug-Ebene konkretisieren sich die Coding-Workflows: Ein Praxisleitfade…