Prompt and Play

La IA es como TINDER: No te fíes


Listen Later

¿Por qué cada semana sale una IA que dice ser "99% perfecta" y luego falla en lo básico? 🤔

Hoy en Prompt & Play traducimos al español cómo funcionan realmente los exámenes de inteligencia artificial (MMLU, GSM8K, GDPval). Hablamos de por qué las IAs están haciendo "trampa" en los tests del colegio y por qué el nuevo examen de OpenAI es sospechoso de ser "juez y parte".

Las gráficas de rendimiento son la foto de perfil de Tinder, pero la realidad es la cita a ciegas.

Escucha este episodio antes de creer en el próximo hype tecnológico.

¡Dale al botón de seguir para más traducciones del mundo tech al mundo real!

...more
View all episodesView all episodes
Download on the App Store

Prompt and PlayBy Idir Ouhab