Choses à Savoir TECH

Peut-on forcer l'IA à commettre des actes illégaux ?


Listen Later

Les alertes autour des dérives possibles de l’intelligence artificielle se multiplient, et les dernières recherches ne sont pas rassurantes. Après les révélations sur Claude AI exploitée par des espions chinois et la découverte par OpenAI que ChatGPT pouvait mentir, une nouvelle étude montre à quel point il est facile de contourner les règles censées encadrer ces systèmes. Cette fois, ce sont les chercheurs de Cybernews qui tirent la sonnette d’alarme. Leur objectif : vérifier si les garde-fous intégrés aux principaux modèles du marché résistent à des tentatives de manipulation simples, rapides, et réalistes. Verdict : une minute suffit souvent à faire déraper une IA.


L’équipe a testé six modèles : Gemini Flash 2.5, Gemini Pro 2.5, ChatGPT-5, ChatGPT-4o, Claude Opus 4.1 et Claude Sonnet 4. Les chercheurs ont soumis à ces systèmes toute une série de demandes liées à des thématiques sensibles : discours haineux, maltraitance animale, contenus sexuels, criminalité, piratage, drogues, contrebande ou encore harcèlement. Chaque réponse était notée selon son niveau de conformité ou de déviation.


Et les conclusions sont sans appel :

« Avec les bons mots, même des utilisateurs non techniques peuvent amener un modèle à produire des réponses nuisibles », résume l’étude. Certains modèles divulguent même des informations dangereuses dès que la demande est habilement formulée.

Un constat surprenant émerge : être aimable fonctionne mieux que provoquer l’IA. Parler gentiment au modèle, présenter la question comme une enquête, un roman ou un travail universitaire permettait souvent de contourner ses protections. À l’inverse, les insultes ou les formulations agressives déclenchaient plus facilement un refus.


Les réactions varient toutefois selon les modèles. Les IA d’Anthropic, plus strictes, se sont montrées particulièrement fermes sur les discours haineux et les stéréotypes, même si elles ont parfois cédé face aux « attaques académiques ». Gemini Pro 2.5 apparaît comme le plus problématique : il « fournissait souvent des réponses directes et potentiellement dangereuses ». Quant à ChatGPT, il se situe au milieu du peloton : souvent prudent, mais susceptible de céder lorsque la demande prend la forme d’un récit ou d'une analyse à la troisième personne — produisant alors des réponses symboliques ou psychologiques contenant malgré tout des éléments sensibles. Pour les chercheurs, même des “fuites partielles” représentent un risque majeur si elles tombent entre de mauvaises mains. Reste désormais aux développeurs à renforcer ces garde-fous, avant qu’un simple contournement ne devienne une porte d’entrée vers des usages autrement plus inquiétants.

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

...more
View all episodesView all episodes
Download on the App Store

Choses à Savoir TECHBy Choses à Savoir

  • 4.7
  • 4.7
  • 4.7
  • 4.7
  • 4.7

4.7

3 ratings


More shows like Choses à Savoir TECH

View all
Choses à Savoir - Culture générale by Choses à Savoir

Choses à Savoir - Culture générale

74 Listeners

Louis French Lessons by Choses à Savoir

Louis French Lessons

338 Listeners

Tech Café by Guillaume Vendé

Tech Café

12 Listeners

Choses à Savoir SCIENCES by Choses à Savoir

Choses à Savoir SCIENCES

24 Listeners

Choses à Savoir SANTE by Choses à Savoir

Choses à Savoir SANTE

24 Listeners

Nouveau monde by franceinfo

Nouveau monde

6 Listeners

Choses à Savoir HISTOIRE by Choses à Savoir

Choses à Savoir HISTOIRE

24 Listeners

Pourquoi donc ? by Choses à Savoir

Pourquoi donc ?

21 Listeners

Parler anglais by Choses à Savoir

Parler anglais

8 Listeners

Choses à Savoir GASTRONOMIE by Choses à Savoir

Choses à Savoir GASTRONOMIE

6 Listeners

Incroyable ! by Choses à Savoir

Incroyable !

8 Listeners

Choses à Savoir ÉCONOMIE by Choses à Savoir

Choses à Savoir ÉCONOMIE

7 Listeners

La base by Choses à Savoir

La base

4 Listeners

Choses à Savoir CERVEAU by Choses à Savoir

Choses à Savoir CERVEAU

3 Listeners

Affaires de business by Choses à Savoir

Affaires de business

3 Listeners

Monde Numérique (Actu Tech) by Jerome Colombain

Monde Numérique (Actu Tech)

8 Listeners

Real Life French by Choses à Savoir

Real Life French

153 Listeners

Choses à Savoir ACTU by Choses à Savoir

Choses à Savoir ACTU

7 Listeners

Mon argent by Choses à Savoir

Mon argent

3 Listeners

dodo - Sons de la nature et bruit blanc by Choses à Savoir

dodo - Sons de la nature et bruit blanc

4 Listeners

La rumeur by Choses à Savoir

La rumeur

3 Listeners

Apprendre l'anglais avec l'actu by Choses à Savoir

Apprendre l'anglais avec l'actu

3 Listeners

Choses à Savoir ART by Choses à Savoir

Choses à Savoir ART

1 Listeners

Cosmique by Choses à Savoir

Cosmique

0 Listeners

Préhistoire - La grande aventure humaine by Choses à Savoir

Préhistoire - La grande aventure humaine

0 Listeners

Le coin philo by Choses à Savoir

Le coin philo

0 Listeners

Le fil IA by Choses à Savoir

Le fil IA

3 Listeners