Monde Numérique (Actu Tech)

đŸŽ€ Interview – L’IA qui reconnaĂźt toutes les voix : Pyannote rĂ©volutionne la diarisation


Listen Later

La technologie française Pyannote est devenue l'outil IA indispensable pour comprendre "qui" parle dans un enregistrement audio. De la transcription d'interviews au doublage de vidéos, de nombreuses applications sont possibles.

Interview : Vincent Molina, cofondateur de PyannoteEn quoi consiste votre technologie de "diarisation" ?

La diarisation consiste Ă  identifier les locuteurs dans un enregistrement audio. Avec Pyannote Audio, nous avons dĂ©veloppĂ© une technologie capable de reconnaĂźtre des voix qu’elle n’a jamais entendues, quelle que soit la langue, ce qui reprĂ©sente une difficultĂ© scientifique majeure. L’histoire de Pyannote remonte Ă  prĂšs de 15 ans : mon cofondateur, chercheur au CNRS, avait lancĂ© une bibliothĂšque open source devenue la rĂ©fĂ©rence mondiale, avec plus de 150 000 utilisateurs. Depuis un an et demi, nous avons bĂąti une sociĂ©tĂ© pour porter ces avancĂ©es et proposer des modĂšles commerciaux dĂ©jĂ  utilisĂ©s en production.

Quels sont les principaux cas d’usage ?

Notre brique technologique s’intĂšgre dans de nombreux pipelines audio : transcription d’interviews, rendez-vous mĂ©dicaux, audiences judiciaires, rĂ©unions d’entreprise
 partout oĂč il faut identifier qui parle. Nous sommes aussi trĂšs prĂ©sents dans le doublage, le sous-titrage ou l’entraĂźnement de grands modĂšles audio. TrĂšs souvent, on nous associe Ă  des outils de transcription comme Whisper pour obtenir un traitement complet de la voix. Notre rĂŽle, c’est d’indiquer prĂ©cisĂ©ment quand une voix apparaĂźt, ce qui est essentiel pour synchroniser une voix de synthĂšse ou des sous-titres. Et tout cela fonctionne avec des modĂšles suffisamment lĂ©gers pour tourner sur un tĂ©lĂ©phone, et bientĂŽt sur un Raspberry Pi.

Jusqu’oĂč peut aller l’analyse de la voix ?

La voix transporte bien plus que des mots : prosodie, rythme, chevauchements, indices contextuels
 Sans aller jusqu’à interprĂ©ter les sentiments — notion trop subjective d’un pays Ă  l’autre — nous pouvons fournir des mĂ©tadonnĂ©es riches qui aident Ă  comprendre la dynamique d’un Ă©change. Pour l’instant, la plupart des usages sont en traitement diffĂ©rĂ©, mais nous prĂ©parons une bascule vers le temps rĂ©el : retranscriptions d’évĂ©nements, analyses en direct, signaux d’intensitĂ© vocale, etc.

-----------
♄ Soutien :
https://mondenumerique.info/don
đŸ—žïž Newsletter :
https://mondenumerique.substack.com

Hébergé par Audiomeans. Visitez audiomeans.fr/politique-de-confidentialite pour plus d'informations.

...more
View all episodesView all episodes
Download on the App Store

Monde Numérique (Actu Tech)By Jerome Colombain

  • 5
  • 5
  • 5
  • 5
  • 5

5

4 ratings


More shows like Monde Numérique (Actu Tech)

View all
Le rendez-vous Tech - RDV Tech by NotPatrick

Le rendez-vous Tech - RDV Tech

41 Listeners

Tech Café by Guillaume Vendé

Tech Café

13 Listeners

On refait le Mac - ORLM by ORLM.tv by Electric Dreams

On refait le Mac - ORLM

2 Listeners

L'angle éco de François Lenglet by RTL

L'angle éco de François Lenglet

23 Listeners

De quoi jme mail by BFM Business

De quoi jme mail

12 Listeners

Tech&Co, la quotidienne by BFM Business

Tech&Co, la quotidienne

13 Listeners

Les Echos de l'IA by Les Echos

Les Echos de l'IA

3 Listeners

C dans l'air by France Télévisions

C dans l'air

127 Listeners

Apple, différemment by Audrey Couleau et Mat alias @profduweb

Apple, différemment

3 Listeners

Silicon Carne, un peu de picante dans un monde de Tech ! by Carlos Diaz

Silicon Carne, un peu de picante dans un monde de Tech !

76 Listeners

Choses Ă  Savoir TECH by Choses Ă  Savoir

Choses Ă  Savoir TECH

3 Listeners

iWeek (la semaine Apple) by Benjamin VINCENT

iWeek (la semaine Apple)

5 Listeners

Underscore_ by Micode

Underscore_

20 Listeners

Sortie de veille by MacGeneration

Sortie de veille

3 Listeners

Le fil IA by Choses Ă  Savoir

Le fil IA

3 Listeners