Monde Numérique (Actu Tech)

đŸŽ€ Interview – L’IA qui parle (et Ă©coute) en temps rĂ©el (Patrick PĂ©rez, Kyutai)


Listen Later

Le patron du laboratoire français Kyutai détaille les avancées spectaculaires de ses IA vocales open source : interaction fluide, traduction en temps réel et synthÚse vocale à la volée.

Interview : Patrick Pérez, directeur général de KyutaiUn laboratoire à but non lucratif pour une IA ouverte

Kyutai est un centre de recherche sur l’intelligence artificielle Ă  but non lucratif, fondĂ© en 2023 grĂące au mĂ©cĂ©nat de Xavier Niel, Rodolphe SaadĂ© et Eric Schmidt, ancien CEO de Google.
L’objectif : faire progresser la recherche fondamentale sur les grands modĂšles d’IA et partager les rĂ©sultats en open source, du code aux modĂšles, pour stimuler l’écosystĂšme scientifique mondial.
Patrick Pérez, son directeur, le souligne : « nous ne faisons pas de produit, mais de la science ».

Moshi : la premiĂšre IA vocale vraiment naturelle

Le premier projet emblématique de Kyutai, Moshi, est une IA conversationnelle sans tour de parole imposé. Elle comprend et répond en temps réel, peut couper la parole à bon escient et saisit les nuances émotionnelles de la voix.
Une innovation majeure : Moshi ne passe pas par une transcription textuelle, prĂ©servant ainsi le timbre, l’émotion et les intonations. Open-sourcĂ© en 2024, le modĂšle a dĂ©jĂ  Ă©tĂ© tĂ©lĂ©chargĂ© plusieurs millions de fois et inspire de nouveaux projets comme SĂ©same, qui rĂ©utilise certaines de ses briques.

Ibiki : la traduction simultanée façon interprÚte

DĂ©voilĂ© au Sommet mondial de l’IA au Grand Palais en 2025, Ibiki traduit une conversation en simultanĂ©, tout en prĂ©servant la voix originale de l’orateur.
Ce modÚle, capable de fonctionner sur un smartphone, représente une avancée majeure face aux systÚmes propriétaires comme Meta AI ou OpenAI.
Encore au stade de prototype, Ibiki dĂ©montre la maturitĂ© de la recherche française en matiĂšre d’IA vocale temps rĂ©el et de traduction instantanĂ©e expressive.

Unmute : la synthÚse vocale à la volée

Avec Unmute, Kyutai repousse encore les limites : la synthĂšse vocale s’effectue en mĂȘme temps que le texte est gĂ©nĂ©rĂ© par un modĂšle de langage (LLM).
Ce procĂ©dĂ© permet une rĂ©ponse instantanĂ©e et naturelle, sans latence perceptible. Ces avancĂ©es ouvrent la voie Ă  de nouvelles expĂ©riences immersives — assistants vocaux, mĂ©dias parlants ou interfaces interactives.
C’est aussi l’un des chantiers clĂ©s de l’IA « multimodale », qui marie texte, son et vision dans un mĂȘme flux de communication.

Le futur : multimodalité et accessibilité

Kyutai poursuit ses recherches sur la multimodalitĂ©, visant Ă  crĂ©er des IA capables d’interprĂ©ter voix, texte, images et vidĂ©os en temps rĂ©el.
Certaines de ces briques sont déjà utilisées par le média La Provence pour convertir ses articles en audio expressif.
Une application concrĂšte de la mission de Kyutai : rendre la recherche ouverte, utile et inclusive, tout en dĂ©montrant que l’innovation europĂ©enne peut rivaliser avec les gĂ©ants amĂ©ricains.

-----------
♄ Soutien :
https://mondenumerique.info/don
đŸ—žïž Newsletter :
https://mondenumerique.substack.com

Hébergé par Audiomeans. Visitez audiomeans.fr/politique-de-confidentialite pour plus d'informations.

...more
View all episodesView all episodes
Download on the App Store

Monde Numérique (Actu Tech)By Jerome Colombain

  • 5
  • 5
  • 5
  • 5
  • 5

5

4 ratings


More shows like Monde Numérique (Actu Tech)

View all
Le rendez-vous Tech - RDV Tech by NotPatrick

Le rendez-vous Tech - RDV Tech

41 Listeners

Tech Café by Guillaume Vendé

Tech Café

13 Listeners

On refait le Mac - ORLM by ORLM.tv by Electric Dreams

On refait le Mac - ORLM

2 Listeners

L'angle éco de François Lenglet by RTL

L'angle éco de François Lenglet

23 Listeners

De quoi jme mail by BFM Business

De quoi jme mail

12 Listeners

Tech&Co, la quotidienne by BFM Business

Tech&Co, la quotidienne

13 Listeners

Les Echos de l'IA by Les Echos

Les Echos de l'IA

3 Listeners

C dans l'air by France Télévisions

C dans l'air

126 Listeners

Apple, différemment by Audrey Couleau et Mat alias @profduweb

Apple, différemment

3 Listeners

Silicon Carne, un peu de picante dans un monde de Tech ! by Carlos Diaz

Silicon Carne, un peu de picante dans un monde de Tech !

76 Listeners

Choses Ă  Savoir TECH by Choses Ă  Savoir

Choses Ă  Savoir TECH

3 Listeners

iWeek (la semaine Apple) by Benjamin VINCENT

iWeek (la semaine Apple)

5 Listeners

Underscore_ by Micode

Underscore_

20 Listeners

Sortie de veille by MacGeneration

Sortie de veille

3 Listeners

Le fil IA by Choses Ă  Savoir

Le fil IA

3 Listeners