IFTTD - If This Then Dev

#338.src - Evaluation de GenAI: Pourquoi l'évaluation de l'IA n'a rien d'automatique avec Louis Pinsard


Listen Later


"La solution à tout, pour moi, c'est une complémentarité de technologie. Mais pour ça, il faut comprendre les limites de chacune."

Le D.E.V. de la semaine est Louis Pinsard, cofondateur et CTO chez Dialog. On plonge dans les coulisses de l'évaluation des modèles d'intelligence artificielle générative appliqués au e-commerce. Louis partage comment son équipe adapte tests A/B, datasets et observabilité pour améliorer les performances des assistants IA. Ils abordent la difficulté des tests unitaires face au non-déterminisme des LLM et la nécessité de nouvelles pratiques, notamment contre les hallucinations. Un échange pragmatique sur l'humain derrière la tech et l'importance de garder un esprit critique face à la hype GenAI.

Chapitrages

00:01:00 : Introduction à l'IA Générative

00:01:30 : Présentation de Louis

00:01:53 : Être AI First

00:05:10 : Évaluation des Modèles

00:09:09 : Outils d'Observabilité

00:09:53 : Tests Unitaires en IA

00:12:28 : Agents et Workflow

00:17:55 : Évaluation des Réponses

00:18:29 : Évaluation et Labellisation

00:23:08 : Démarche de Recherche

00:26:09 : L'Importance des ML Engineers

00:28:45 : Conversion vs Qualité

00:34:54 : Gestion des Hallucinations

00:39:00 : Normes de Qualité

00:43:34 : Humanisation des Réponses

00:47:02 : Recommandations et Conclusion

Liens évoqués pendant l'émission

Thomas Walter : Comment j'ai codé 2 mois de features en 3 semaines

**Restez compliant !**

Cet épisode est soutenu par Vanta, la plateforme de Trust Management qui aide les entreprises à automatiser leur sécurité et leur conformité.

Avec Vanta, se mettre en conformité avec des standards comme SOC 2, ISO 27001 ou HIPAA devient plus rapide, plus simple, et surtout durable.
Plus de 10 000 entreprises dans le monde utilisent déjà Vanta pour transformer leurs obligations de sécurité en véritable moteur de croissance.
👉 Découvrez-en plus et réservez votre démo gratuite sur vanta.com/IFTTD

🎙️ Soutenez le podcast If This Then Dev ! 🎙️ Chaque contribution aide à maintenir et améliorer nos épisodes. Cliquez ici pour nous soutenir sur Tipeee 🙏

Archives | Site | Boutique | TikTok | Discord | Twitter | LinkedIn | Instagram | Youtube | Twitch | Job Board |

Hébergé par Audiomeans. Visitez audiomeans.fr/politique-de-confidentialite pour plus d'informations.

...more
View all episodesView all episodes
Download on the App Store

IFTTD - If This Then DevBy Bruno Soulez | Orso Media

  • 5
  • 5
  • 5
  • 5
  • 5

5

3 ratings


More shows like IFTTD - If This Then Dev

View all
Le rendez-vous Tech - RDV Tech by NotPatrick

Le rendez-vous Tech - RDV Tech

41 Listeners

Tech Café by Guillaume Vendé

Tech Café

13 Listeners

On refait le Mac - ORLM by ORLM.tv by Electric Dreams

On refait le Mac - ORLM

2 Listeners

De quoi jme mail by BFM Business

De quoi jme mail

12 Listeners

Tech&Co, la quotidienne by BFM Business

Tech&Co, la quotidienne

11 Listeners

Génération Do It Yourself by Matthieu Stefani | Orso Media

Génération Do It Yourself

114 Listeners

Apple, différemment by Audrey Couleau et Mat alias @profduweb

Apple, différemment

2 Listeners

La Martingale by Orso Media

La Martingale

24 Listeners

Le Panier by Laurent Kretz | Orso Media

Le Panier

11 Listeners

Speakeasy by /influx by /influx

Speakeasy by /influx

4 Listeners

Silicon Carne, un peu de picante dans un monde de Tech ! by Carlos Diaz

Silicon Carne, un peu de picante dans un monde de Tech !

75 Listeners

Pitch Pong by Orso Media

Pitch Pong

1 Listeners

Choses à Savoir TECH by Choses à Savoir

Choses à Savoir TECH

3 Listeners

Mediarama by François Defossez | COSA

Mediarama

1 Listeners

Underscore_ by Micode

Underscore_

21 Listeners

Monde Numérique (Actu Tech) by Jerome Colombain

Monde Numérique (Actu Tech)

7 Listeners

Comptoir IA 🎙️🧠🤖 by Nicolas Guyon

Comptoir IA 🎙️🧠🤖

4 Listeners

Le code a changé by France Inter

Le code a changé

11 Listeners