Choses à Savoir TECH

Whisper, de la reconnaissance vocale dans 99 langues ?


Listen Later

Vous commencez à connaître Open AI, cette entreprise spécialisée dans l'intelligence artificielle a qui l'on doit notamment le programme DALL-E, qui génère des œuvres arts grâce à du texte. Et bien la dernière innovation d'Open AI n'a rien à voir avec l'art cette fois, puisqu'il s'agit d'un système de reconnaissance vocale en accès libre, destiné aux chercheurs et aux développeurs.

Open AI lance aujourd'hui un programme open-source baptisé Whisper, permettant de transformer la voix en texte pour l’anglais, mais aussi pour d’autres langues. Autre spécificité le distinguant de la concurrence, le fait de ne pas tenir compte de bruits de fond, par exemple de la musique, quand la personne ne parle pas. D'après l'entreprise, le Whisper est aussi capable de détecter automatiquement la langue parlée. Dans le détail, l’audio entrant est découpé en blocs de 30 secondes, lesquels sont ensuite convertis en spectrogrammes. L’architecture de Whisper fonctionne sur un principe simple d’encodage/décodage pour chaque bloc. Pour cela, OpenAI a entraîné son IA avec 680 000 heures de données, dont les deux tiers correspondant à des contenus en anglais avec une transcription en anglais, le reste correspondant à 98 autres langues apprises par le système.

À noter qu'il existe déjà de nombreux systèmes de reconnaissance vocale automatique. Mais à en croire OpenAI, les modèles utilisés dans Whisper seraient plus robustes pour le traitement des accents, des bruits de fond et des jargons techniques. Une étude de l’Université de Stanford datant de 2019 suggère que les systèmes d’Amazon, Apple, Google, IBM et Microsoft afficheraient un taux d’erreur quasiment deux fois plus élevé pour les utilisateurs noirs que pour les utilisateurs blancs, soit 41 erreurs en moyenne tous les cent mots, contre 21 erreurs pour les autres. Chez les femmes, le nombre d’erreurs est en moyenne de 30 contre 17. OpenAI insiste aussi sur des écarts de performances selon les différents accents et dialectes. Si Whisper vous intéresse, son code est disponible en libre accès sur Github et peut être intégré dans n'importe quel autre programme avec quelques réglages selon l'usage imaginé par la suite.

Étude de Stanford : https://fairspeech.stanford.edu/

Github : https://github.com/openai/whisper


Faits Divers sur Apple Podcast / Spotify / Deezer / Google Podcast / Castbox

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

...more
View all episodesView all episodes
Download on the App Store

Choses à Savoir TECHBy Choses à Savoir

  • 4.7
  • 4.7
  • 4.7
  • 4.7
  • 4.7

4.7

3 ratings


More shows like Choses à Savoir TECH

View all
Choses à Savoir - Culture générale by Choses à Savoir

Choses à Savoir - Culture générale

72 Listeners

Louis French Lessons by Choses à Savoir

Louis French Lessons

338 Listeners

Tech Café by Guillaume Vendé

Tech Café

12 Listeners

Choses à Savoir SCIENCES by Choses à Savoir

Choses à Savoir SCIENCES

24 Listeners

Choses à Savoir SANTE by Choses à Savoir

Choses à Savoir SANTE

19 Listeners

Nouveau monde by franceinfo

Nouveau monde

9 Listeners

Choses à Savoir HISTOIRE by Choses à Savoir

Choses à Savoir HISTOIRE

19 Listeners

Pourquoi donc ? by Choses à Savoir

Pourquoi donc ?

21 Listeners

Parler anglais by Choses à Savoir

Parler anglais

7 Listeners

Choses à Savoir GASTRONOMIE by Choses à Savoir

Choses à Savoir GASTRONOMIE

6 Listeners

Incroyable ! by Choses à Savoir

Incroyable !

8 Listeners

Choses à Savoir ÉCONOMIE by Choses à Savoir

Choses à Savoir ÉCONOMIE

7 Listeners

La base by Choses à Savoir

La base

5 Listeners

Choses à Savoir CERVEAU by Choses à Savoir

Choses à Savoir CERVEAU

2 Listeners

Affaires de business by Choses à Savoir

Affaires de business

3 Listeners

Monde Numérique (Actu Tech) by Jerome Colombain

Monde Numérique (Actu Tech)

5 Listeners

Real Life French by Choses à Savoir

Real Life French

154 Listeners

Choses à Savoir ACTU by Choses à Savoir

Choses à Savoir ACTU

7 Listeners

Mon argent by Choses à Savoir

Mon argent

3 Listeners

dodo - Sons de la nature et bruit blanc by Choses à Savoir

dodo - Sons de la nature et bruit blanc

3 Listeners

La rumeur by Choses à Savoir

La rumeur

3 Listeners

Apprendre l'anglais avec l'actu by Choses à Savoir

Apprendre l'anglais avec l'actu

2 Listeners

Choses à Savoir ART by Choses à Savoir

Choses à Savoir ART

1 Listeners

Cosmique by Choses à Savoir

Cosmique

0 Listeners

Préhistoire - La grande aventure humaine by Choses à Savoir

Préhistoire - La grande aventure humaine

0 Listeners

Le coin philo by Choses à Savoir

Le coin philo

0 Listeners

Le fil IA by Choses à Savoir

Le fil IA

2 Listeners