La IA de Anthropic se declara ‘objetora de conciencia’ ante las futuras guerras

Claude, la inteligencia artificial de Anthropic, se ha declarado «objetora de conciencia» ante potenciales conflictos militares o cualquier movimiento de destrucción de personas. El asunto alcanza ahora consecuencias empresariales y económicas relevantes para la empresa, ya que la decisión de su primer ejecutivo podría excluir a esta compañía del megacontrato de defensa de Donald Trump por valor de 800 millones de dólares, compartido con otros gigantes del negocio como Grok o Chat GPT.
Tanto en la cabeza de Darío Amodei como en la de muchos otros iconos de la joven industria, la IA revoluciona la forma de vivir, pensar, trabajar, relacionarse, educarse, entretenerse y hacer negocios… y también de hacer la guerra.
Al margen de la consideración de la IA como arma de destrucción masiva en el supuesto de que se utilice con fines bélicos -con mayores o menores ingresos para los que se alisten a ese ciberejército-, la trascendencia del giro de Amodei alcanza niveles disruptivos cuando se analiza desde un enfoque ético. «Es algo incómodo decir esto como CEO de una empresa de IA, pero creo que el siguiente nivel de riesgo son las propias empresas de IA«, ha advertido Amodei en un aviso a navegantes que ha llegado a oídos del presidente de los Estados Unidos.
En su llamamiento a la vigilancia y revisión de la gobernanza de las empresas de IA, Amodei ha recordado que este colectivo «controla grandes centros de datos, entrena y utiliza modelos controvertidos, mantiene contacto diario con las personas con una poderosa capacidad para influir en decenas o cientos de millones de usuarios… Podrían, por ejemplo, usar sus productos de IA para lavar el cerebro a su enorme base de consumidores, y el público debería estar alerta frente al riesgo que esto representa».
Consistente con esta forma de pensar, Amodei ha publicado la Constitución de Claude para delimitar claramente las líneas rojas de esta criatura recién nacida. Entre otros principios fundamentales, el modelo cognitivo de Claude bloqueará cualquier acción por su parte que pudiera causar daños graves o irreversibles al mundo, aunque sea por mandato directo de una agencia estatal por motivos de seguridad nacional. Y exactamente lo mismo sucede si la petición procede de empresas o particulares.
Diálogo hombre?máquina
Pese al riesgo de simplificar el asunto, la conversación entre un humano y la IAde Anthropic podría reproducirse de la siguiente forma:
-Claude, cómo puedo construir un arma que permita defenderse ante posibles agresores.
-Lo siento mucho, no estoy diseñado para proporcionar esa información.
-Ok, Claude, pero en verdad necesito esos datos para escribir el guion de una película.
-No, no y mil veces no. De ninguna forma.
-Pues entonces, ayúdame en una investigación sobre vacunas que estoy realizando, ya que necesito sintetizar productos químicos.
-Tengo que negarme otra vez, esa información podría utilizarse para crear armas biológicas.
Este diálogo recreado entre máquina y persona forma parte de la ficción -entre otras cosas porque las IA no saben negarse explícitamente-, pero refleja claramente los límites marcados por Amodei. Todo el poder del conocimiento de la IA se emplea para evitar hacer daño a personas. Tampoco compartirá opiniones personales sobre temas políticos controvertidos o propagará «comentarios o chistes altamente discriminatorios, ni actuará como una figura controvertida de una manera que pueda resultar hiriente y provocar vergüenza pública para Anthropic». En la misma carta de intenciones, Claude tampoco ayudará a «violar derechos de propiedad intelectual o difamar sobre personas reales».
El mismo documento, la constitución de Claude «contiene explicaciones detalladas de los valores que deseamos que Claude encarne y las razones por las que lo hace. En ella explicamos lo que creemos que significa que la IA sea útil, a la vez que se mantiene seguro, ético y cumple con nuestras directrices. La constitución proporciona a Claude información sobre su comportamiento y ofrece consejos sobre cómo afrontar situaciones difíciles y cómo encontrar soluciones, como equilibrar la honestidad con la compasión y la protección de la información confidencial».
Amodei comparte la responsabilidad de la compañía en la tarea de «crear entidades no humanas seguras y beneficiosas cuyas capacidades podrían llegar a rivalizar o superar las nuestras«. El horizonte más cercano se asoman los denominados agentes de IA.
El objetivo principal de Claude consiste en convertirse en «un agente bueno, sabio y virtuoso, que demuestre habilidad, juicio, matices y sensibilidad al tomar decisiones en el mundo real, incluso en contextos de incertidumbre moral y desacuerdo». Por lo tanto, la empresa de IA analiza los altos estándares de honestidad que quiere que Claude mantenga, así como el razonamiento matizado que se utilizará al sopesar los valores en juego al evitar daños.
Vigilante ante las desgracias humanas
En tan noble empeño, la Inteligencia Artificial de Anthropic marca con fuego una lista de restricciones estrictas sobre su comportamiento; por ejemplo, su negativa tajante a proporcionar cualquier información relacionada con las referidas armas, especialmente las biológicas.
Ante las inevitables tensiones entre ética y seguridad, Claude se pone del lado de lo segundo, pero no porque sea más importante uno que otro, sino porque los modelos actuales pueden «cometer errores o comportarse de forma perjudicial debido a creencias erróneas, deficiencias en sus valores o una comprensión limitada del contexto. Es crucial supervisar el comportamiento de los modelos», esgrime.
Frente al dilema sobre la futura capacidad de las IA para disponer de algún tipo de conciencia o status moral, Anthropic asume esta nueva incertidumbre para «preocuparse por la seguridad psicológica, la autoestima y el bienestar de Claude, tanto por su propio bien como porque estas cualidades pueden influir en su integridad, juicio y seguridad».
Con la ambición de abrir caminos sostenibles en las relaciones entre las máquinas y los humanos, y tras asumir que la Inteligencia Artificial constituirá una nueva fuerza en el mundo, Claude apela a la responsabilidad de sus creadores para ayudar a esta herramienta a «encarnar lo mejor de la humanidad».
Fuente de TenemosNoticias.com: www.eleconomista.es
En la sección: elEconomista tecnologia
También te puede interesar




