Choses à Savoir TECH

Peut-on forcer l'IA à commettre des actes illégaux ?


Listen Later

Les alertes autour des dérives possibles de l’intelligence artificielle se multiplient, et les dernières recherches ne sont pas rassurantes. Après les révélations sur Claude AI exploitée par des espions chinois et la découverte par OpenAI que ChatGPT pouvait mentir, une nouvelle étude montre à quel point il est facile de contourner les règles censées encadrer ces systèmes. Cette fois, ce sont les chercheurs de Cybernews qui tirent la sonnette d’alarme. Leur objectif : vérifier si les garde-fous intégrés aux principaux modèles du marché résistent à des tentatives de manipulation simples, rapides, et réalistes. Verdict : une minute suffit souvent à faire déraper une IA.


L’équipe a testé six modèles : Gemini Flash 2.5, Gemini Pro 2.5, ChatGPT-5, ChatGPT-4o, Claude Opus 4.1 et Claude Sonnet 4. Les chercheurs ont soumis à ces systèmes toute une série de demandes liées à des thématiques sensibles : discours haineux, maltraitance animale, contenus sexuels, criminalité, piratage, drogues, contrebande ou encore harcèlement. Chaque réponse était notée selon son niveau de conformité ou de déviation.


Et les conclusions sont sans appel :

« Avec les bons mots, même des utilisateurs non techniques peuvent amener un modèle à produire des réponses nuisibles », résume l’étude. Certains modèles divulguent même des informations dangereuses dès que la demande est habilement formulée.

Un constat surprenant émerge : être aimable fonctionne mieux que provoquer l’IA. Parler gentiment au modèle, présenter la question comme une enquête, un roman ou un travail universitaire permettait souvent de contourner ses protections. À l’inverse, les insultes ou les formulations agressives déclenchaient plus facilement un refus.


Les réactions varient toutefois selon les modèles. Les IA d’Anthropic, plus strictes, se sont montrées particulièrement fermes sur les discours haineux et les stéréotypes, même si elles ont parfois cédé face aux « attaques académiques ». Gemini Pro 2.5 apparaît comme le plus problématique : il « fournissait souvent des réponses directes et potentiellement dangereuses ». Quant à ChatGPT, il se situe au milieu du peloton : souvent prudent, mais susceptible de céder lorsque la demande prend la forme d’un récit ou d'une analyse à la troisième personne — produisant alors des réponses symboliques ou psychologiques contenant malgré tout des éléments sensibles. Pour les chercheurs, même des “fuites partielles” représentent un risque majeur si elles tombent entre de mauvaises mains. Reste désormais aux développeurs à renforcer ces garde-fous, avant qu’un simple contournement ne devienne une porte d’entrée vers des usages autrement plus inquiétants.

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

...more
View all episodesView all episodes
Download on the App Store

Choses à Savoir TECHBy Choses à Savoir

  • 4.7
  • 4.7
  • 4.7
  • 4.7
  • 4.7

4.7

3 ratings


More shows like Choses à Savoir TECH

View all
Choses à Savoir - Culture générale by Choses à Savoir

Choses à Savoir - Culture générale

75 Listeners

Louis French Lessons by Choses à Savoir

Louis French Lessons

338 Listeners

Choses à Savoir SCIENCES by Choses à Savoir

Choses à Savoir SCIENCES

23 Listeners

Choses à Savoir SANTE by Choses à Savoir

Choses à Savoir SANTE

21 Listeners

Le vrai ou faux by franceinfo

Le vrai ou faux

12 Listeners

L'édito éco by Europe 1

L'édito éco

15 Listeners

L'angle éco de François Lenglet by RTL

L'angle éco de François Lenglet

26 Listeners

De quoi jme mail by BFM Business

De quoi jme mail

9 Listeners

Tech&Co, la quotidienne by BFM Business

Tech&Co, la quotidienne

11 Listeners

Choses à Savoir HISTOIRE by Choses à Savoir

Choses à Savoir HISTOIRE

21 Listeners

Mourir Moins Con by Bound Media

Mourir Moins Con

19 Listeners

Maintenant, vous savez by Bababam

Maintenant, vous savez

15 Listeners

Pourquoi donc ? by Choses à Savoir

Pourquoi donc ?

21 Listeners

Parler anglais by Choses à Savoir

Parler anglais

6 Listeners

La Story by Les Echos

La Story

44 Listeners

Silicon Carne, un peu de picante dans un monde de Tech ! by Carlos Diaz

Silicon Carne, un peu de picante dans un monde de Tech !

75 Listeners

Choses à Savoir GASTRONOMIE by Choses à Savoir

Choses à Savoir GASTRONOMIE

6 Listeners

Choses à Savoir ÉCONOMIE by Choses à Savoir

Choses à Savoir ÉCONOMIE

8 Listeners

La base by Choses à Savoir

La base

6 Listeners

Affaires de business by Choses à Savoir

Affaires de business

4 Listeners

Real Life French by Choses à Savoir

Real Life French

155 Listeners

Choses à Savoir ACTU by Choses à Savoir

Choses à Savoir ACTU

7 Listeners

Mon argent by Choses à Savoir

Mon argent

5 Listeners

Un peu de calme by Audio Sapiens

Un peu de calme

3 Listeners

La rumeur by Choses à Savoir

La rumeur

3 Listeners

Apprendre l'anglais avec l'actu by Choses à Savoir

Apprendre l'anglais avec l'actu

2 Listeners

Choses à Savoir ART by Choses à Savoir

Choses à Savoir ART

2 Listeners

Cosmique by Choses à Savoir

Cosmique

0 Listeners

Préhistoire - La grande aventure humaine by Choses à Savoir

Préhistoire - La grande aventure humaine

0 Listeners

Le coin philo by Choses à Savoir

Le coin philo

0 Listeners