gnakale hacker

IA Constitutionnelle : Comment programmer des valeurs dans une machine ?


Listen Later

Dans cet épisode, nous explorons comment l'intelligence artificielle peut apprendre à s'auto-superviser grâce au concept de "Constitutional AI". Contrairement aux méthodes traditionnelles qui dépendent de milliers de labels humains, cette approche repose sur une "constitution" composée de principes écrits en langage naturel pour guider le comportement du modèle. Nous détaillons le processus en deux étapes : une phase d'apprentissage supervisé où l'IA critique et révise ses propres réponses, et une phase d'apprentissage par renforcement basée sur le feedback de l'IA (RLAIF). Découvrez comment cette méthode permet de créer des assistants qui ne sont pas seulement inoffensifs, mais aussi non évasifs, capables d'expliquer leurs objections face à des requêtes malveillantes. Nous abordons également les défis de la transparence, notamment l'utilisation du "Chain-of-Thought" (chaîne de pensée) pour rendre le raisonnement de l'IA explicite et vérifiable pour les humains


Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

...more
View all episodesView all episodes
Download on the App Store

gnakale hackerBy GNAKALE HACKER