ZD Tech : tout comprendre en moins de 3 minutes avec ZDNet

Pourquoi l'alignement de l'IA devient un sujet crucial ?


Listen Later

C'est un concept qui va nécessairement gagner en popularité dans les mois qui viennent.

L’alignement des intelligences artificielles, en clair, tente de trouver comment faire en sorte que des systèmes d'IA très puissants restent utiles, sûrs, et surtout fidèles aux valeurs de concepteurs et des utilisateurs.

Pourquoi l'alignement est crucial

Et tout d'abord je vous explique pourquoi c’est crucial. Aligner une IA, c’est lui apprendre à poursuivre nos objectifs humains, et pas seulement l’objectif technique que ses concepteurs ont codé.

Et c'est facile à dire, mais bien moins facile à faire mentionne IBM dans un document explicatif, parce que nous avons tendance à prêter aux modèles d'IA des intentions humaines. Cette tendance se nomme l’anthropomorphisme.

Pourtant, une IA n’a ni morale ni motivations. Le but d'une IA c'est d'optimiser le résultat d'une consigne, aussi nommé prompt.

Et si la consigne est trop étroite, et bien l'IA peut “réussir” sa mission d’une manière qui nous échappe complètement.

Et ce comportement est désormais bien documenté. Et il a un nom, celui de “détournement de la récompense” observé dans les tâches d'apprentissage par renforcement. D’où l’importance d’un alignement pensé dès la conception, surtout quand l’IA touche des domaines sensibles comme la santé, la finance ou les transports autonomes.

Robustesse, Interopérabilité, Contrôlabilité et Éthique

Alors quels sont les principes que les concepteurs des IA doivent garder en tête ? On peut les résumer par un acronyme, nommé RICE, et qui signifie Robustesse, Interopérabilité, Contrôlabilité et Éthique.

  • La robustesse signifie que l’IA doit rester fiable, même dans des situations imprévues ou face à des attaques.

  • L'interopérabilité veut dire que l'on doit pouvoir expliquer les décisions de l'IA.

  • Dans le même esprit, la contrôlabilité signifie que l’humain doit pouvoir reprendre la main, arrêter, corriger, orienter.

  • Enfin, je vais prendre un exemple pour définir l'éthique. Un moteur de recommandation sur Internet ne devrait pas favoriser la désinformation juste parce qu’elle génère de l’engagement.

Comment faire de l'alignement ?

Alors, et c'est le troisième point, comment on s’y prend concrètement pour faire de l'alignement, et où est ce que ça coince.

Côté méthodes, les spécialistes l’apprentissage par renforcement à partir de retours humains. Cette méthode porte un nom, le RLHF pour Reinforcement learning from human feedback.

Les données synthétiques sont aussi utilisées pour montrer aux IA ce qu'ils doivent éviter. Mais là aussi, les valeurs humaines censées corriger les IA sont plurielles et évoluent.

Bref, le fameux “problème de l’alignement” reste ouvert.

Le ZD Tech est sur toutes les plateformes de podcast ! Abonnez-vous !


Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

...more
View all episodesView all episodes
Download on the App Store

ZD Tech : tout comprendre en moins de 3 minutes avec ZDNetBy ZD Tech : tout comprendre en moins de 3 minutes


More shows like ZD Tech : tout comprendre en moins de 3 minutes avec ZDNet

View all
Good Morning Business by BFM Business

Good Morning Business

14 Listeners

De quoi jme mail by BFM Business

De quoi jme mail

11 Listeners

Nouveau monde by franceinfo

Nouveau monde

6 Listeners

L'édito éco by Europe 1

L'édito éco

13 Listeners

Tech&Co, la quotidienne by BFM Business

Tech&Co, la quotidienne

9 Listeners

L'édito international by Europe 1

L'édito international

5 Listeners

Les Echos de l'IA by Les Echos

Les Echos de l'IA

4 Listeners

La Story by Les Echos

La Story

42 Listeners

Le code a changé by France Inter

Le code a changé

9 Listeners

HugoDécrypte - Actus et interviews by Hugo Décrypte

HugoDécrypte - Actus et interviews

90 Listeners

Underscore_ by Micode

Underscore_

19 Listeners

Affaires de business by Choses à Savoir

Affaires de business

3 Listeners

Monde Numérique (Actu Tech) by Jérôme Colombain

Monde Numérique (Actu Tech)

3 Listeners

L’Heure du Monde by Le Monde

L’Heure du Monde

44 Listeners

Le fil IA by Choses à Savoir

Le fil IA

0 Listeners