Hackean en menos de 48 horas la nueva IA de Anthropic: Claude Fable 5 es víctima de ‘jailbreaking’

📅 12 de junio de 2026🕐 12 Jun 2026🔗 Fuente: TenemosNoticias.com🕑 2 min de lectura

La compañía Anthropic anunció el lanzamiento de Claude Fable 5 hace escasos días. Basado en la tecnología de Mythos, se trata del sistema más avanzado hasta la fecha para tareas de razonamiento, programación y trabajo autónomo, teniendo en cuenta que incorpora nuevas salvaguardas para evitar usos malintencionados. Sin embargo, apenas 48 horas después de su despliegue, ha surgido la primera polémica.

El usuario Pliny the Liberator ha conseguido vulnerar parte de los mecanismos de seguridad de Claude Fable 5 mediante técnicas de jailbreaking, utilizando combinaciones de caracteres especiales, reformulación de instrucciones y una versión modificada de otros modelos de Anthropic.

Según ha explicado en una publicación de la red social X, ha utilizado una combinación de caracteres Unicode, homoglifos, reformulación de instrucciones, contextos narrativos y una versión modificada de Claude Opus 4.8 para engañar a los sistemas de protección y obtener respuestas que deberían haber sido bloqueadas.

Claude Fable 5 revive el debate sobre la seguridad de los modelos de IA

El caso ha reavivado el debate sobre la eficacia real de las salvaguardas incorporadas en los modelos de inteligencia artificial más avanzados. Aunque Anthropic sostiene que Claude Fable 5 integra nuevos sistemas de detección para identificar intentos de jailbreak y bloquear usos potencialmente peligrosos, las pruebas realizadas por Pliny sugieren que incluso los mecanismos de seguridad más sofisticados pueden ser vulnerables a técnicas diseñadas específicamente para eludir sus restricciones.

Esta controversia, además, llega en un momento especialmente delicado para Anthropic. Tras el lanzamiento del modelo, numerosos desarrolladores criticaron a la compañía por la falta de transparencia en algunas de las limitaciones impuestas al sistema, especialmente en ámbitos relacionados con la investigación en inteligencia artificial y la ciberseguridad. En este contexto, los primeros intentos exitosos de sortear las barreras de Fable 5 han intensificado las dudas sobre el equilibrio entre seguridad y transparencia.

En definitiva, el lanzamiento de Claude Fable 5 refleja el principal desafío al que se enfrenta actualmente la industria de la inteligencia artificial: cómo poner a disposición del público modelos cada vez más potentes sin facilitar al mismo tiempo actividades potencialmente peligrosas.

Mientras Anthropic defiende que Fable 5 representa el equilibrio más avanzado alcanzado hasta ahora entre capacidad y seguridad, los primeros jailbreaks publicados apenas unas horas después de su estreno evidencian que la carrera entre quienes desarrollan sistemas de protección y quienes buscan sortearlos sigue más abierta que nunca.

Fuente de TenemosNoticias.com: www.20minutos.es

En la sección: 20MINUTOS.ES – Tecnología

🔗 Fuente original: TenemosNoticias.com · 12 de junio de 2026

Etiquetas:Anthropic Claude Fable Hackean horas jailbreaking menos nueva víctima

También te puede interesar

Tecnología

La «revolución» de la IA va por barrios: el mapa que muestra quién manda y quién se ha quedado fuera

26 Jul 2026

Tecnología

Más de 50% de la música nueva es creada con IA

26 Jul 2026

Tecnología

JLab Go Air Pop vs JBL Vibe Beam 2: comparativa de auriculares baratos para elegir bien

26 Jul 2026

Tecnología

Anker 10.000 mAh vs INIU 20.000 mAh: comparativa de baterías portátiles para elegir la tuya

26 Jul 2026

Hackean en menos de 48 horas la nueva IA de Anthropic: Claude Fable 5 es víctima de ‘jailbreaking’

Claude Fable 5 revive el debate sobre la seguridad de los modelos de IA

También te puede interesar

Restablecido el servicio tras 27 días a oscuras

El Burlador, un clásico de Cartagena de Indias que supo reinventarse

Analistas privados mantienen en el 1.1% estimación de crecimiento del PIB mexicano en 2026

#EnFotos Berlín celebra Día del Orgullo LGBTI con cientos de miles de participantes

Rubén Martínez, carnicero: «El pollo amarillo siempre tiene menos grasa y está mejor alimentado generalmente»

Un estudio descubre por qué los egipcios eligieron a un babuino como dios hace más de 3.000 años: la respuesta estaba en la luz de la Luna

Águilas recibe a Keiner Delgado y Juan Rojas desde Leones en cambio por Kenedy Corona

Si paras Spider-Man: Homecoming en el minuto 1:47:26 verás que Iron Man conserva un trofeo del primer villano que casi lo mata

Activan pozos profundos en la población de El Manteco

Zelenski asegura que Rusia ha solicitado 30.000 militares adicionales a Corea del Norte

¿Cómo serán los seres humanos del futuro?

Un «proyectil desconocido» impacta cerca de un petrolero en el mar Rojo

Provea ratifica que la salida de la CPI no frena las investigaciones contra el régimen venezolano

PIAMONTE | NO TAV | Al menos 60 policías heridos en una protesta contra una línea de alta velocidad en el norte de Italia | elperiodico.com

Los incendios forestales han quemado más de 152.000 hectáreas en lo que va de año, seis veces más que en 2025 | europapress.es

La Policía muestra foto de sospechoso del atentado en Berlín

Rubio remarca papel protagónico de EEUU en negociaciones venezolanas: analistas – Efecto Cocuyo

Consecomercio: Poco más de 30% de los negocios está operativo en La Guaira – Efecto Cocuyo

La Guardia Civil investigó 660 incendios forestales y puso a disposición judicial a 373 personas en 2025

Temblor en Colombia hoy | Reportan nuevo sismo este 25 de julio de más de 4 de magnitud; usuarios dicen haberlo sentido en Bogotá y otras ciudades

Tenemos Noticias de Latinoamérica y el Mundo

Mi resumen de noticias