đ Abbiamo aperto la puntata con un momento tutto dedicato al gaming: Eugenio ha iniziato a giocare a Donkey Kong Bananza, lâultima perla firmata Nintendo, perfetta per queste giornate dâestate. đ§Ž Giusto in tempo per la registrazione, OpenAI ha fatto notizia: uno dei suoi nuovi modelli ha risolto 5 problemi su 6 allâOlimpiade Internazionale della Matematica, guadagnandosi una medaglia dâoro. Un traguardo importante che segna un passo avanti nel ragionamento su compiti complessi, lontani dai soliti benchmark facilmente verificabili. đĄď¸Abbiamo poi commentato le novitĂ su Big Sleep, lâagente AI sviluppato da Google per scoprire vulnerabilitĂ nel software. Questa volta ha individuato un bug in una versione giĂ rilasciata di SQLite, evitando potenziali exploit e dimostrando come lâintelligenza artificiale possa davvero rafforzare la sicurezza. đ§ Per chiudere, ci siamo immersi nel tema del prompt injection: una tecnica che in questo caso è stata usata in modo diverso dal solito. Alcuni autori hanno nascosto comandi dentro i loro paper per ottenere valutazioni migliori. Ma esistono soluzioni? Abbiamo visto come Meta stia sperimentando modelli robusti contro questi attacchi.Supporta il PointerPodcast
Unitevi al nostro gruppo Telegram per discutere della puntataLascia una recensione su SpotifyLascia una recensione su Apple PodcastNote della puntata
Google Says AI Agent Thwarted Exploitation of Critical VulnerabilityA summer of security: empowering cyber defenders with AICVE-2025-6965 DetailScientists hide messages in papers to game AI peer reviewâPositive review onlyâ: Researchers hide AI prompts in papersIl confronto fatto su XItâs On Like - La maglia di Donkey KongI nostri contatti:
Gruppo TelegramLinkedInTwitchYouTubeInstagramTwitterMail