Traducir los «lenguajes animales» para poder entenderlos mediante técnicas de la IA
Algunos científicos creen que las modernas tecnologías pueden ayudarnos a entendernos mejor con los animales, en el sentido literal. Y es que del mismo modo que la inteligencia artificial nos ayuda a traducir idiomas, crear fotografías, charlar con avatares imaginarios o planificar un viaje en coche como si lo hiciéramos con un guía, la idea es ir mucho más allá.
Partiendo de la idea de que hay cierta universalidad entre todos los «lenguajes» de las diferentes especies, y que las IA pueden en cierto modo encontrar patrones y abstraerse para sintetizar ciertos conceptos, la idea sería usar esas herramientas para traducir lo que dicen al lenguaje humano. Así podríamos entender lo que dicen entre ellos, o quizá lo que puedan decirnos a nosotros o incluso comunicarnos con ellos mejor que con sonidos y gestos como hacemos ahora.
El lenguaje de los animales
En otros animales, como los perros, chimpancés o delfines, sabemos de sus capacidades para entender el lenguaje humano, memorizar o incluso imitarnos con silbidos. El hecho de que en el caso más básico una IA pueda distinguir a los individuos por sus sonidos –por ejemplo, a unos miembros de una familia de cachalotes de otros– es una buena señal.
La IA que interpreta y traduce
Las inteligencias artificiales más modernas, como las que se emplean en sistemas de traducción, se basan en el aprendizaje automático (machine learning), una técnica capaz de clasificar las palabras o sonidos (sus unidades básicas) en grupos diferentes. Cuando se aplica a idiomas humanos con un corpus de datos suficientemente grande –libros, noticias, textos de foros, vídeos, programas de radio y demás–, son una gran herramienta que se utiliza de forma estadística para conseguir traducciones casi ideales. ¿Podríamos conseguir un corpus similar de algún lenguaje animal? ¿Algo que pudiera entonces dividirse en palabras y significados, fonemas y reglas de composición?
Con las inteligencias artificiales generativas, como los populares GPT y ChatGPT, la «máquina» no sabe mucho de gramática o del verdadero significado de las palabras. Es como los ordenadores que pueden ganar a cualquier campeón al ajedrez: no entienden cómo jugar al ajedrez, sólo imitan lo que ven siguiendo las reglas. En el caso del lenguaje, las IA generativas básicamente trocean la información en tokens o pequeños valores (de dos o tres letras) que luego pueden enlazar estadísticamente, con pesos y sesgos positivos y negativos. Comparando los tokens de unos y otros idiomas se encuentran las equivalencias. Esto sirve no solo para conseguir buenas traducciones; también ayuda a que se expresen en nuestro propio idioma de forma natural, creíble y correcta.
Aprendizaje automático pero supervisado
Parte de la dificultad de todo el proceso de aprendizaje automático es que alguien debe supervisar los primeros pasos de la IA, lo que se conoce como aprendizaje automático supervisado. Es algo parecido a verificar que, en una frase como «En un lugar de la… ____», la palabra más correcta es «Mancha», o que «perro» está bien clasificado como animal, pero «silla» no. Una vez superados esos inicios, el resto es mucho más automático.
El proceso, pero aplicado al lenguaje de las ballenas, lo explican en sus trabajos los científicos de Project, una de las iniciativas que trabaja en este campo, dividiéndolo en cuatro áreas:
- Biología – Estudiar las ballenas con drones aéreos y submarinos, sensores, GPS y analizar su dinámica social, comportamiento y demás.
- Procesamiento de datos – Grabación, identificación de individuos, anotación automática, filtrado de datos, etcétera.
- Aprendizaje automático – Crear un modelo de «lenguaje de las ballenas», enlazar el comportamiento con el lenguaje y finalmente contar con una especie de «chatbot balleno».
- Lingüística – Estudio de la fonología, morfología, semántica y adquisición del lenguaje.
Curiosamente si algún día consiguiéramos descifrar los idiomas de todos estos grupos de animales podríamos acabar disponiendo de una especie de «traductor universal» para hablar entre todos los seres vivos que son capaces de comunicarse y habitan nuestro planeta.