Palaeographicum, la IA que descifra 5 millones de caracteres cuneiformes en 5 minutos

Las piezas que los museos exponen en sus vitrinas solo representan una pequeña parte de sus fondos. En las entrañas de los museos de todo el mundo duermen, desperdigados y silenciosos, documentos y estatuas, cerámicas y yelmos, fragmentos de tejido y objetos rituales. Y, para el caso, los fragmentos de 30.000 tablillas de arcilla hititas. Algunas son contratos comerciales, otras recogen cartas diplomáticas o las instrucciones de un ritual sagrado. El problema es que muchos de estos fragmentos se encuentran desperdigados entre las distintas colecciones y nadie puede determinar, a simple vista, qué piezas encajan entre sí.
Ahora, un equipo de investigadores de la Universidad de Würzburg y la Academia de Ciencias y Literatura de Maguncia ha presentado una herramienta de inteligencia artificial llamada Palaeographicum que promete transformar radicalmente este panorama. Según los estudiosos y desarrolladores, esta IA es capaz de rastrear, comparar y clasificar la escritura individual de cada escriba hitita a partir de una colección de 70.000 fotografías que recoge más de cinco millones de caracteres cuneiformes. Lo que antes requería días o semanas, podría resolverse en cinco minutos.
La ambición del proyecto va más allá de reducir los tiempos de trabajo. Sus impulsores sueñan con reconstruir algo inédito: una historia social de la cultura escrita hitita en la que pueda trazarse la trayectoria profesional de cada escriba a través de su caligrafía. Para entender cómo la IA puede lograr algo semejante, hay que comprender primero la complejidad descomunal del sistema de escritura que trata de leer.
Palaeographicum es una IA capaz de rastrear, comparar y clasificar decenas de miles de fragmentos de tablillas cuneiformes hititas desperdigados en los museos de todo el mundo.

Un signario de 375 caracteres inciso en barro
La escritura cuneiforme es uno de los sistemas de comunicación más complejos que ha inventado la humanidad. Los hititas, que dominaron Anatolia durante el segundo milenio antes de nuestra era, utilizaban un repertorio de 375 signos cuneiformes, cada uno presionado con un punzón sobre arcilla húmeda. Algunos de esos signos representaban sílabas (es decir, representaciones gráficas de unidades o grupos fonéticos); otros, palabras enteras (los denominados logogramas).
Sin embargo, la mayoría de esas tablillas se han fragmentado con el tiempo. Esos fragmentos, dispersos por el mundo, se incorporaron en las colecciones de los museos sin que nadie supiera exactamente a qué texto original pertenecían. Reconstruir los textos originales, por tanto, exige identificar qué trozos forman parte de una misma tablilla. Eso, a su vez, requiere comparar la caligrafía individual de cada escriba. Según los responsables del proyecto, aunque el cuneiforme fuera un sistema estandarizado, cada copista dejaba su impronta personal en la tablilla. Algunos, por ejemplo, extraían el punzón con tal energía que dejaban pequeñas rebabas en la arcilla.
Detectar esas diferencias a simple vista es difícil, tanto por el número ingente de fragmentos como por la calidad de las fotografías de las tablillas. La IA, sin embargo, parece capaz de salvar estos obstáculos.
Este modelo de IA forma parte de un proyecto más amplio de catalogación y captura 3D de los artefactos inscritos de la civilización hitita.
25 años construyendo el mayor archivo digital hitita
Palaeographicum es el último eslabón de una cadena de innovaciones que el equipo de Würzburg-Maguncia lleva construyendo desde hace un cuarto de siglo. Hace 25 años, Gernot Wilhelm y Gerfrid Müller fundaron el Hethitologie-Portal Mainz, un catálogo digital con los 30.000 fragmentos de tablillas hititas conocidos hasta el momento.
Hace una década, el mismo equipo presentó una herramienta capaz de capturar en 3D las características individuales de los caracteres cuneiformes. Se buscaba así facilitar la reconstrucción asistida por ordenador de las tablillas. En 2023, llegó TLHdig, un buscador que permite explorar los textos hititas tanto en el original cuneiforme como en transliteración.
La IA Palaeographicum representa el siguiente paso. Su modelo de inteligencia artificial se desarrolló entre 2018 y 2023 en el marco del proyecto CuKa (Computer-assisted cuneiform analysis), financiado por la DFG alemana, en colaboración con la Universidad Técnica de Dortmund. Los ingenieros Christopher Rest y Eugen Rusakov lideraron el desarrollo del modelo, mientras que la filóloga Turna Somel se encargó de anotar el material de entrenamiento y de evaluar los resultados.

Cómo la IA aprende a reconocer la letra de un escriba desaparecido
Palaeographicum funciona de un modo que resulta intuitivo una vez explicado. La herramienta analiza las fotografías digitalizadas de las tablillas del Hethitologie-Portal e identifica en ellas los signos cuneiformes individuales. A continuación, busca en toda la colección los signos escritos de forma idéntica o similar, los recorta de las fotografías y los agrupa en tablas de imágenes para que el investigador pueda compararlos. Según los hititólogos, Palaeographicum está cambiando radicalmente el trabajo, pues permite ahorrar miles de horas.
La utilidad de la herramienta, además, va más allá de la identificación de escribas. Como las tablillas hititas nunca suelen llevar fecha, reconocer la evolución de la escritura a lo largo del tiempo puede contribuir a datar los distintos fragmentos.

Una IA que se entrena sin parar
Una de las características más notables del Palaeographicum es su carácter abierto. Los responsables siguen reentrenando la IA de forma continua y a menudo incorporan las peticiones de los usuarios en el desarrollo de la herramienta, siempre que sean técnicamente viables y mejoren el trabajo de todos. En su versión actual, Palaeographicum facilita el acceso a 70.000 fotografías con más de 5.000.000 de caracteres cuneiformes. Es el mayor archivo digital de escritura cuneiforme hitita del mundo.
La herramienta analiza las fotos, identifica en ellas los signos cuneiformes individuales y busca en la colección los signos escritos de forma idéntica o muy similar.

El sueño: trazar la carrera de cada escriba hitita
El objetivo final del proyecto resulta todavía más ambicioso: entrenar la IA hasta el punto de que sea capaz de reconocer automáticamente la caligrafía de cada escriba. No se trata de una tarea sencilla, porque, tal y como sucede en el presente, un mismo amanuense podía escribir de forma diferente según las circunstancias. La letra de alguien que trabaja con calma en su scriptorium no tiene nada que ver con los trazos apresurados de quien redacta un informe durante una inspección de campo. Si ese objetivo se alcanza, se podría obtener una imagen más precisa de lo que produjeron los escribas individuales a lo largo de su carrera profesional y, en consecuencia, compilar una historia social de la cultura escrita hitita.
Fuente de TenemosNoticias.com: muyinteresante.okdiario.com
En la sección: Muy Interesante
También te puede interesar




