Episodio 342.
L'era dei token illimitati e dell'IA gratis per tutti è giunta al termine. In questa puntata analizzo la drastica inversione a U di Meta, passata in pochi mesi dalla competizione interna a chi consumava più token (il cosiddetto tokenmaxxing) alla creazione della dashboard di controllo AI Gateway per imporre tetti massimi di spesa ed eliminare le costose licenze esterne di Claude.
Attraverso i dati inediti di SemiAnalysis, spiego la matematica insostenibile che si nasconde dietro gli abbonamenti flat di OpenAI e Anthropic, dove un piano pro da duecento dollari può costare ai gestori fino a 14.000$ di calcolo reale se sfruttato a fondo.
Infine, analizzo la nascita della tecnica del routing dei carichi di lavoro e l'incredibile impatto economico del modello open-source cinese DeepSeek, capace di abbattere le bollette aziendali di oltre cento volte, ridefinendo per sempre la sostenibilità finanziaria della tecnologia.
Per chi volesse approfondire:
https://www.theinformation.com/articles/tokenminimizing-meta-moves-curb-employee-ai-usage-ai-costs-reach-billions
https://x.com/SemiAnalysis_/status/2064815042374074396
🔵Seguimi su Telegram: https://t.me/ilpigreco314
e su 🟣Instagram: https://www.instagram.com/ilpigreco/