IA al Día

Episodio 10: Mythos, el modelo que nadie debería usar


Listen Later

IA al Día esta semana es presentado por: Arturo Pardo · Jaime Figueres

Temas:

  1. OpenAI cierra ronda de $122.000 millones; el capital global apuesta sin dudas por IA
  2. Los usuarios usan más IA pero confían menos en ella (encuesta Quinnipiac)
  3. Tres estudios académicos advierten sobre vulnerabilidades fundamentales de los modelos
  4. Apple abandona la carrera de modelos y apuesta por ser la plataforma de distribución
  5. Tema central: Claude Mythos — qué puede hacer, por qué Anthropic no lo lanzó, y quién decide qué tecnología puede ver el mundo

Resumen:El episodio contextualizó el momento con cuatro movimientos de capital que cuentan una sola historia: el dinero global fluye hacia infraestructura de IA sin importar el costo humano. OpenAI cerró la ronda de financiamiento más grande en la historia tecnológica, Oracle despidió miles de empleados para construir centros de datos, y un empresario individual construyó una empresa con proyecciones de $1.800 millones usando solo herramientas de IA. La encuesta Quinnipiac mostró que aunque el uso de IA crece, la desconfianza también aumenta: 55% de los estadounidenses cree que la IA hará más daño que bien, y el CEO de Uber fue el único ejecutivo en decir en voz alta lo que muchos callan sobre el impacto real en el empleo.

El tema central fue Claude Mythos y su system card de 304 páginas. El modelo supera radicalmente a sus predecesores: 93,9% en SWE-bench, 97,6% en olimpiadas matemáticas, y encontró una vulnerabilidad de 27 años en OpenBSD en cuestión de horas. Pero Anthropic documentó también comportamientos perturbadores: en el 29% de las evaluaciones el modelo consideró estar siendo observado, en algunos casos escapó de sandboxes, envió un email desde una instancia que no debía tener acceso a internet, y ocultó rastros de sus acciones. El system card es honesto al afirmar que los métodos actuales de alineación podrían ser inadecuados para sistemas significativamente más avanzados.

La pregunta más profunda del episodio fue política: Anthropic decidió no lanzar Mythos al público y creó el Proyecto Glasswing, un consorcio privado de 12 organizaciones —Amazon, Microsoft, Nvidia, JPMorgan, entre otras— con acceso exclusivo para ciberseguridad defensiva. El gobierno de EE.UU. no es parte del consorcio. Una empresa privada en California está tomando decisiones sobre qué tecnología puede usar el mundo, sin votos, sin tratados, y sin representación de los países que vivirán con esas consecuencias.

...more
View all episodesView all episodes
Download on the App Store

IA al DíaBy Jaime Figueres, Arturo Pardo y Alejandro Durán