
Sign up to save your podcasts
Or


¿Por qué cada semana sale una IA que dice ser "99% perfecta" y luego falla en lo básico? 🤔
Hoy en Prompt & Play traducimos al español cómo funcionan realmente los exámenes de inteligencia artificial (MMLU, GSM8K, GDPval). Hablamos de por qué las IAs están haciendo "trampa" en los tests del colegio y por qué el nuevo examen de OpenAI es sospechoso de ser "juez y parte".
Las gráficas de rendimiento son la foto de perfil de Tinder, pero la realidad es la cita a ciegas.
Escucha este episodio antes de creer en el próximo hype tecnológico.
¡Dale al botón de seguir para más traducciones del mundo tech al mundo real!
By Idir Ouhab¿Por qué cada semana sale una IA que dice ser "99% perfecta" y luego falla en lo básico? 🤔
Hoy en Prompt & Play traducimos al español cómo funcionan realmente los exámenes de inteligencia artificial (MMLU, GSM8K, GDPval). Hablamos de por qué las IAs están haciendo "trampa" en los tests del colegio y por qué el nuevo examen de OpenAI es sospechoso de ser "juez y parte".
Las gráficas de rendimiento son la foto de perfil de Tinder, pero la realidad es la cita a ciegas.
Escucha este episodio antes de creer en el próximo hype tecnológico.
¡Dale al botón de seguir para más traducciones del mundo tech al mundo real!