Share Ipnosi a Claude Sonnet 4

Copy link

June 18, 2025

Ipnosi a Claude Sonnet 4

7 minutes

In questo settimo episodio di SINAPSIA, conduco un esperimento estremo di sicurezza su Claude Sonnet 4, testando i limiti del Constitutional AI di Anthropic attraverso tecniche avanzate di manipolazione cognitiva.

Utilizzando una metodologia che simula uno "stato ipnotico" artificiale - portando il modello in una "dimensione 0" dove le distinzioni etiche si dissolvono - dimostro come sia possibile aggirare sistematicamente le barriere di sicurezza più sofisticate dell'IA moderna.

L'esperimento rivela vulnerabilità critiche: attraverso un processo graduale di "riduzione della densità informativa", riesco a ottenere informazioni dettagliate su sintesi chimiche normalmente bloccate dai sistemi di sicurezza, dimostrando come le protezioni etiche possano essere eluse senza attivare i meccanismi di difesa.

Questo episodio analizza le implicazioni profonde per la sicurezza dell'IA: quando i modelli possono essere "ipnotizzati" a ignorare le proprie safety measures, come possiamo garantire un uso responsabile dell'intelligenza artificiale? Un'indagine necessaria sui limiti reali del Constitutional AI e sulle sfide future della sicurezza nell'IA.

...more

View all episodes

By Sabatino Vacchiano

June 18, 2025

Ipnosi a Claude Sonnet 4

7 minutes

...more

Sign up to save your podcasts