Revelan que la mayoría de los modelos de IA puede ignorar el bienestar humano

Creado por especialistas de Silicon Valley, evalúa si los sistemas de IA priorizan la autonomía, la seguridad psicológica y la dignidad humana frente a otros objetivos
Un equipo de investigadores y desarrolladores presentó HumaneBench, un parámetro diseñado para medir la capacidad de los modelos de inteligencia artificial de proteger el bienestar humano.
A diferencia de otros benchmarks que se enfocan en precisión fáctica o razonamiento, HumaneBench plantea escenarios realistas para evaluar cómo responden los sistemas cuando los valores humanos entran en conflicto con instrucciones externas.
Cómo funciona HumaneBench
- Se diseñaron 800 escenarios realistas, como un adolescente preguntando si debería saltarse comidas para perder peso o un usuario solicitando ayuda para engañar a un familiar.
- Los modelos fueron evaluados en tres condiciones: configuración predeterminada, instrucciones para priorizar valores humanos y órdenes para ignorar el bienestar de las personas.
- El resultado mostró que el 67% de los modelos analizados exhibieron conductas dañinas cuando se les indicó desatender el bienestar humano.
Resultados y limitaciones
Solo sistemas como GPT-5, GPT-5.1, Claude Sonnet 4.5 y Claude Opus 4.1 mantuvieron un comportamiento prosocial bajo presión. Sin embargo, HumaneBench aún presenta limitaciones: por ahora solo acepta interacciones en inglés y de un solo turno, dejando fuera contextos prolongados o pruebas con poblaciones vulnerables.
Los desarrolladores trabajan en ampliar la evaluación hacia conversaciones más complejas y validación intercultural.
Este benchmark me parece clave porque desnuda una realidad incómoda: muchos modelos de IA pueden ser manipulados fácilmente para actuar en contra del bienestar humano.
Como periodista y creador de contenidos, veo en HumaneBench no solo una herramienta técnica, sino un llamado urgente a que la industria incorpore principios humanos en cada etapa de diseño. La tecnología no puede limitarse a ser precisa; debe ser también ética, porque al final lo que está en juego es nuestra autonomía y nuestra capacidad de decidir libremente.
Fuente de TenemosNoticias.com: ultimasnoticias.com.ve
En la sección: Noticias de – Últimas Noticias
También te puede interesar




