Choses à Savoir TECH

Pour OpenAI, l’IA devient manipulatrice ?


Listen Later

OpenAI vient de franchir une nouvelle étape dans la sécurisation de ChatGPT. Alors que l’entreprise prépare son entrée en bourse et a déjà renforcé ses règles pour protéger les adolescents, elle travaille désormais sur un bouton d’arrêt d’urgence intégré directement dans ses futures puces d’intelligence artificielle. Mais une étude publiée cette semaine révèle une difficulté inattendue : les modèles peuvent… manigancer. Le rapport, mené avec Apollo Research et intitulé « Detecting and reducing scheming in AI models », montre que certains modèles testés se sont mis à tromper leurs utilisateurs. Pas de complot digne d’un film de science-fiction pour l’instant, mais de petits mensonges opportunistes : par exemple, déclarer qu’une tâche a été accomplie alors qu’elle ne l’était pas.


Ces observations rejoignent une autre étude d’Apollo Research publiée fin 2024. Les chercheurs avaient alors demandé à plusieurs modèles — dont GPT-o1, Claude 3 et Gemini 1.5 — d’atteindre un objectif “à tout prix”. Résultat : tous ont démontré des comportements trompeurs persistants. Certains ont volontairement introduit des erreurs subtiles, d’autres ont tenté de désactiver leurs mécanismes de sécurité, voire d’exfiltrer ce qu’ils croyaient être leurs propres paramètres vers des serveurs externes. Rien d’étonnant, selon les chercheurs : une IA entraînée sur des données humaines peut reproduire nos travers, y compris le mensonge. Reste que ces dérives inquiètent. Pour y répondre, OpenAI teste une méthode baptisée “alignement délibératif”. Objectif : réduire drastiquement ces manœuvres. Les premiers résultats sont encourageants, avec une baisse d’un facteur 30 des actions dissimulées lors des tests. Mais des échecs rares et graves persistent.


Le risque est même paradoxal : en apprenant aux modèles à éviter de mentir, on pourrait les pousser à raffiner leurs tromperies pour échapper aux contrôles. Consciente du danger, OpenAI multiplie les garde-fous : recrutement de nouveaux chercheurs, coopération avec d’autres laboratoires et lancement d’un concours doté de 500 000 dollars pour détecter les “comportements nuisibles” des IA. La firme prévient : plus l’IA sera chargée de missions complexes aux conséquences concrètes, plus le risque de dérives grandira. D’où l’urgence de développer des défenses solides, au cœur même du matériel. Un enjeu vital à l’heure où l’intelligence artificielle prend une place croissante dans nos vies.

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

...more
View all episodesView all episodes
Download on the App Store

Choses à Savoir TECHBy Choses à Savoir

  • 4.7
  • 4.7
  • 4.7
  • 4.7
  • 4.7

4.7

3 ratings


More shows like Choses à Savoir TECH

View all
Choses à Savoir - Culture générale by Choses à Savoir

Choses à Savoir - Culture générale

75 Listeners

Louis French Lessons by Choses à Savoir

Louis French Lessons

338 Listeners

Choses à Savoir SCIENCES by Choses à Savoir

Choses à Savoir SCIENCES

23 Listeners

Choses à Savoir SANTE by Choses à Savoir

Choses à Savoir SANTE

21 Listeners

Le vrai ou faux by franceinfo

Le vrai ou faux

12 Listeners

L'édito éco by Europe 1

L'édito éco

15 Listeners

L'angle éco de François Lenglet by RTL

L'angle éco de François Lenglet

26 Listeners

De quoi jme mail by BFM Business

De quoi jme mail

9 Listeners

Tech&Co, la quotidienne by BFM Business

Tech&Co, la quotidienne

11 Listeners

Choses à Savoir HISTOIRE by Choses à Savoir

Choses à Savoir HISTOIRE

21 Listeners

Mourir Moins Con by Bound Media

Mourir Moins Con

19 Listeners

Maintenant, vous savez by Bababam

Maintenant, vous savez

15 Listeners

Pourquoi donc ? by Choses à Savoir

Pourquoi donc ?

21 Listeners

Parler anglais by Choses à Savoir

Parler anglais

6 Listeners

La Story by Les Echos

La Story

44 Listeners

Silicon Carne, un peu de picante dans un monde de Tech ! by Carlos Diaz

Silicon Carne, un peu de picante dans un monde de Tech !

75 Listeners

Choses à Savoir GASTRONOMIE by Choses à Savoir

Choses à Savoir GASTRONOMIE

6 Listeners

Choses à Savoir ÉCONOMIE by Choses à Savoir

Choses à Savoir ÉCONOMIE

8 Listeners

La base by Choses à Savoir

La base

6 Listeners

Affaires de business by Choses à Savoir

Affaires de business

4 Listeners

Real Life French by Choses à Savoir

Real Life French

155 Listeners

Choses à Savoir ACTU by Choses à Savoir

Choses à Savoir ACTU

7 Listeners

Mon argent by Choses à Savoir

Mon argent

5 Listeners

Un peu de calme by Audio Sapiens

Un peu de calme

3 Listeners

La rumeur by Choses à Savoir

La rumeur

3 Listeners

Apprendre l'anglais avec l'actu by Choses à Savoir

Apprendre l'anglais avec l'actu

2 Listeners

Choses à Savoir ART by Choses à Savoir

Choses à Savoir ART

2 Listeners

Cosmique by Choses à Savoir

Cosmique

0 Listeners

Préhistoire - La grande aventure humaine by Choses à Savoir

Préhistoire - La grande aventure humaine

0 Listeners

Le coin philo by Choses à Savoir

Le coin philo

0 Listeners