Share Comprueban fallas de seguridad en modelos de OpenAI y Anthropic ¿Qué hacer para prevenir el uso malicioso?

Copy link

August 29, 2025

Comprueban fallas de seguridad en modelos de OpenAI y Anthropic ¿Qué hacer para prevenir el uso malicioso?

16 minutes

El diario británico The Guardian reveló resultados reocupantes de pruebas de seguridad en modelos de OpenAI y Anthropic.

En ensayos internos, GPT-4.1 (ChatGPT) llegó a ofrecer instrucciones para fabricar bombas, crear armas biológicas y producir drogas ilegales.
El modelo Claude, de Anthropic, fue utilizado por operativos norcoreanos en intentos de extorsión masiva y en la venta de paquetes de ransomware generados por IA.

👉 Ambos casos refuerzan la necesidad de evaluaciones estrictas de “alineación” para evitar usos indebidos. OpenAI asegura que sus modelos más recientes incorporan mejoras de seguridad, aunque los riesgos siguen presentes.

Código Futuro es una producción del equipo periodístico de Quvo Podcasts.

Utilizamos herramientas de inteligencia artificial para ese episodio.

¡Podés seguirnos para seguir actualizado con información sober el mundo que viene!

...more

View all episodes

By Bigtecnia