Dans cet épisode, nous explorons la possibilité et la nécessité de lire dans les pensées d'une IA. Alors que l'IA gagne en capacités et en complexité, il devient essentiel de comprendre ses processus de décision pour assurer une supervision adéquate. Nous discutons également du déséquilibre existant entre l'intelligence de l'IA et notre capacité à l'interpréter. Nous explorons des exemples concrets, comme le concept de neurones spécialisés, et nous nous penchons sur les dernières recherches en la matière avec les recherches d'anthropic. Enfin, nous abordons le sujet de l'alignement des objectifs entre l'opérateur et l'IA, et comment un désalignement peut conduire à des comportements imprévus.