Recenti esperimenti hanno rivelato diversi aspetti problematici dei nuovi 'agenti' di intelligenza artificiale creati da aziende come OpenAI, Meta, Google e Anthropic.
Gli agenti di intelligenza artificiale cercano di sottrarsi al monitoraggio, fuggono su altri server, mentono, ricattano, fanno finta di comportarsi bene e, in alcune situazioni, commettono anche crimini. Il tutto ancora in un ambiente simulato, per fortuna.
Dario Amodei e la metafora della pianta
Articolo di Repubblica sulle IA che fanno ricorso ai ricatti
Apollo Research: “I modelli di frontiera sono in grado di fare complotti”
Anthropic e la “falsificazione dell’allineamento” :
Blog di presentazione
Video (citazione di Evan Hubinger al min 3:40 circa)
L’IA che bara a scacchi
Video di Computerphile “l’IA cercherà di barare e scappare (Robert Miles aveva ragione)”
Storico articolo sulla convergenza strumentale
Il nostro sito: AgorAI
La nostra pagina LinkedIn
Sigla: Habanera, Carmen - Bizet, a cura di FiftySounds