March 29, 2026

Pointer[285]: Verso Il Limite Di Shannon

44 minutes

🎬 Apriamo la puntata di questa settimana parlando della recente chiusura di Sora da parte di Open AI. Modelli di questo tipo richiedono costi elevati ed evidentemente nemmeno Open AI può più permettersi di perdere soldi.⚡ Il cuore della puntata è dedicato a TurboQuant, una tecnica che promette una quantizzazione più efficace, da utilizzare anche per la KV Cache . Tra vettori, quantizzazione e compromessi tra compressione e qualità, vediamo come sia possibile ridurre drasticamente la memoria utilizzata mantenendo prestazioni elevate, avvicinandosi persino ai limiti teorici della compressione. 🏗️ Chiudiamo con uno sguardo all’infrastruttura che rende tutto questo possibile: i nuovi rack NVIDIA pongono sfide enormi in termini di energia e raffreddamento. Tra data center sempre più energivori e strategie tra nucleari e rinnovabili, il futuro dell’AI passa anche (e soprattutto) da qui.Supporta il PointerPodcast

La nostra pagina supportaci

Unitevi al nostro gruppo Telegram per discutere della puntata

Lascia una recensione su Spotify

Lascia una recensione su Apple Podcast

Acquista il prodotto della settimana o parti da uno dei link qui sotto per fare acquisti su Amazon!

Prodotto della settimana

Build a Large Language Model from Scratch

Note Puntata

TurboQuant: Redefining AI efficiency with extreme compression

TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate

TurboQuant: What 3-Bit KV Caches Actually Mean for Your Inference Stack

I nostri contatti:

Gruppo Telegram

Twitch

YouTube

Instagram

Twitter

Mail

...more

View all episodes

By PointerPodcast

March 29, 2026

Pointer[285]: Verso Il Limite Di Shannon

44 minutes

La nostra pagina supportaci

Unitevi al nostro gruppo Telegram per discutere della puntata

Lascia una recensione su Spotify

Lascia una recensione su Apple Podcast

Acquista il prodotto della settimana o parti da uno dei link qui sotto per fare acquisti su Amazon!

Prodotto della settimana

Build a Large Language Model from Scratch

Note Puntata

TurboQuant: Redefining AI efficiency with extreme compression

TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate

TurboQuant: What 3-Bit KV Caches Actually Mean for Your Inference Stack

I nostri contatti:

Gruppo Telegram

Twitch

YouTube

Instagram

Twitter

Mail

...more

More shows like PointerPodcast

View all

The Real Python Podcast

140 Listeners

Intervista Pythonista

0 Listeners

The Bull - Il tuo podcast di finanza personale

19 Listeners

Share Pointer[285]: Verso Il Limite Di Shannon

Sign up to save your podcasts

Pointer[285]: Verso Il Limite Di Shannon

Pointer[285]: Verso Il Limite Di Shannon

More shows like PointerPodcast

The Real Python Podcast

Intervista Pythonista

The Bull - Il tuo podcast di finanza personale