🍌 Abbiamo aperto la puntata con un momento tutto dedicato al gaming: Eugenio ha iniziato a giocare a Donkey Kong Bananza, l’ultima perla firmata Nintendo, perfetta per queste giornate d’estate. 🧮 Giusto in tempo per la registrazione, OpenAI ha fatto notizia: uno dei suoi nuovi modelli ha risolto 5 problemi su 6 all’Olimpiade Internazionale della Matematica, guadagnandosi una medaglia d’oro. Un traguardo importante che segna un passo avanti nel ragionamento su compiti complessi, lontani dai soliti benchmark facilmente verificabili. 🛡️Abbiamo poi commentato le novità su Big Sleep, l’agente AI sviluppato da Google per scoprire vulnerabilità nel software. Questa volta ha individuato un bug in una versione già rilasciata di SQLite, evitando potenziali exploit e dimostrando come l’intelligenza artificiale possa davvero rafforzare la sicurezza. 🧠 Per chiudere, ci siamo immersi nel tema del prompt injection: una tecnica che in questo caso è stata usata in modo diverso dal solito. Alcuni autori hanno nascosto comandi dentro i loro paper per ottenere valutazioni migliori. Ma esistono soluzioni? Abbiamo visto come Meta stia sperimentando modelli robusti contro questi attacchi.Supporta il PointerPodcast
Unitevi al nostro gruppo Telegram per discutere della puntataLascia una recensione su SpotifyLascia una recensione su Apple PodcastNote della puntata
Google Says AI Agent Thwarted Exploitation of Critical VulnerabilityA summer of security: empowering cyber defenders with AICVE-2025-6965 DetailScientists hide messages in papers to game AI peer review‘Positive review only’: Researchers hide AI prompts in papersIl confronto fatto su XIt’s On Like - La maglia di Donkey KongI nostri contatti:
Gruppo TelegramLinkedInTwitchYouTubeInstagramTwitterMail