Anthropics 65-Mrd.-Mega-Runde und Opus 4.8 dominieren den Tag — dazu wächst der Druck auf AI-Teams, Token-Kosten zu rechtfertigen, während neue Infra-Moves bei AWS, Cloudflare und Google Pay den Agenten-Stack formen.
Der Mega-Finanzierungsrunde folgen handfeste Zahlen: Anthropic meldet einen Run-Rate-Umsatz von 47 Milliarden Dollar — nach 9 Mrd. Ende 2025, 14 Mrd. im Februar und 30 Mrd. im April. Simon Willison weist darauf hin, dass diese Zahlen gegenüber Investoren rechtlich bindend sind und eine Lüge Wertpapierbetrug bedeuten würde; die endgültigen Zahlen werden spätestens beim IPO-Filing sichtbar. Parallel dazu schloss Anthropic die 65-Mrd.-Series-H bei einer Post-Money-Bewertung von 965 Mrd. Dollar, geführt von Altimeter, Dragoneer, Greenoaks und Sequoia, mit 15 Mrd. Dollar von Hyperscalern inklusive Amazon. Damit überholt das Unternehmen nach eigener Darstellung OpenAI in zentralen Kennzahlen wie Bewertung und Umsatzwachstum. Als Randnotiz zu den Ausmaßen unkontrollierten Einsatzes vermeldet Axios anonym, ein einzelner Unternehmenskunde habe nach fehlenden Nutzungslimits auf Claude-Lizenzen einen halben Milliarden Dollar in einem einzigen Monat ausgegeben.
Zum Kapitalereignis gesellt sich ein Produkt-Update: Claude Opus 4.8 erscheint zum selben Preis wie sein Vorgänger, mit einem Fast Mode, der nun 2,5-fache Geschwindigkeit bei dreifach niedrigeren Kosten gegenüber Opus 4.7 bietet. Auf dem Browser-Agenten-Benchmark Online-Mind2Web erreicht das Modell 84 Prozent — ein deutlicher Sprung gegenüber Opus 4.7 und GPT-5.5 laut einem der Tester. Auf dem Legal Agent Benchmark erzielt es als erstes Modell über 10 Prozent auf dem All-Pass-Standard. Noch bedeutsamer für den längeren Horizont sind die Dynamic Workflows in Claude Code: Die Funktion, derzeit in Research Preview, erlaubt das Spawnen von hunderten parallelen Subagenten und war laut Anthropic die Grundlage für Jarred Sumners 750.000-LOC-Rewrite des Bun-Projekts von Zig nach Rust in sechs Tagen. Diese Fähigkeit zur massiven Parallelisierung ist mehr als ein Feature-Update — sie ist eine Operationalisierung der These, die TheSequence als neues Skalierungsgesetz beschreibt: Die wichtige Recheneinheit verschiebt sich vom einzelnen Forward-Pass zur Schleife, zu Systemen, die revidieren, simulieren und verbessern können.
Der Agent-Stack, der solche Workloads trägt, wird gleichzeitig auf mehreren Ebenen umgebaut. AWS lanciert eine neue Generation von OpenSearch Serverless, die Compute von Storage entkoppelt und auf null skaliert, wenn Agenten inaktiv sind — bisher war mindestens eine laufende Instanz Pflicht. Die Plattform integriert nativ Vercel und Kiro und adressiert Verkehrsmuster, für die klassische Infrastruktur nicht ausgelegt ist. Cloudflare beziffert Bot-Traffic auf bereits 31 Prozent aller HTTP-Anfragen in den letzten sechs Monaten; der Übergang zu mehrheitlich nicht-menschlichem Traffic wird für die erste Jahreshälfte 2027 erwartet. Auf der Zahlungsseite bereitet Google Pay mit dem Universal Commerce Protocol und einem neuen MCP-Server die Infrastruktur für autonome Agenten-Transaktionen vor: Statt visueller Checkout-Seiten kommunizieren Agenten künftig über eine API-Schicht, abgesichert durch geräteübergreifende biometrische Authentifizierung als Human-in-the-Loop-Mechanismus. Auf der Effizienzseite des Stacks liefert Perplexity AI mit einem in Rust neu geschriebenen Unigram-Tokenizer eine fünffach niedrigere p50-Latenz gegenüber der Hugging-Face-Implementierung und senk…