Dos empresas del ámbito de la inteligencia artificial, IBM y Hugging Face se han unido junto con la NASA para crear las bases de un modelo de información geoespacial con todos los datos posibles. La idea es unificar en un único lugar datos sobre el planeta Tierra con la última tecnología para mejorar las investigaciones sobre los cambios climáticos de diferentes regiones, los fenómenos atmosféricos y otros que puedan mejorar el bienestar y seguridad en todo el planeta.
Dentro del campo de la inteligencia artificial Hugging Face es un nombre quizá menos conocido que ChatGPT o OpenAI, pero tiene un gran recorrido. Los expertos consideran que sus modelos de IA para el ámbito del aprendizaje automático, los transformadores de aprendizaje profundo y el lenguaje natural son de gran calidad. Además, todos ellos son de código abierto, lo cual facilita que más desarrolladores trabajen sobre ellos y sea fáciles adaptarlos a otros proyectos. Por su parte IBM añade experiencia y prestigio, y cuenta con Watson X y Watson.AI en su familia de productos, que normalmente están orientados a entornos empresariales complejos y que ahora han adaptado para esta nueva tarea.
Información geoespacial, datos masivos
El principal reto de este proyecto es la gigantesca cantidad de datos geoespaciales que deben analizar los científicos, empresas y organizaciones. Además de todos los terabytes que ya existen con mapas y detalles geográficos hay que sumar todos los datos de observaciones climáticas y, según ha calculado la NASA, los científicos contarán con unos 250.000 terabytes adicionales en 2024. Eso son 250 petabytes, una cantidad nada desdeñable y difícil de procesar y analizar.
La idea es que NASA y IBM trabajen con esos datos geoespaciales y los pongan a disposición del público y los investigadores a través de los modelos y herramientas de Hugging Face. De este modo se pueden combinar los datos más fiables con los que se cuenta sobre nuestro planeta con herramientas más sencillas y de uso común, capaces de tener más impacto en los problemas del día a día. Este efecto a veces se convierte en un multiplicador al dar lugar a nuevas herramientas y proyectos, ampliando así su alcance.
El primer paso: estudiar inundaciones e incendios
Una de las primeras pruebas realizadas por el equipo consistió en analizar los datos obtenidos del satélite LandStat Sentinel-2 durante un año sobre los Estados Unidos. Este satélite toma fotografías de la superficie de la Tierra y recoge otros datos en 13 bandas del espectro electromagnético. Pero el proceso tradicional requiere que sean personas las que marquen qué áreas de la superficie son cultivos, árboles y demás antes de que se puedan analizar.
Con el nuevo modelo, y de cara a comparar resultados, por un lado se realizó un etiquetado y análisis convencional, y por otro con las herramientas de IBM y Hugging Face para automatizar el reconocimiento visual. Esta herramienta, llamada internamente Prithvi, es una especie de «versión IA» capaz de realizar básicamente las mismas tareas. La mejora a la hora de realizar el seguimiento de áreas de cultivos, bosques, deforestación e incendios se calculó en un 15% y sólo se necesitaron la mitad de los datos, algo habitual cuando se crean este tipo de modelos de IA.
En un vídeo de demostración del modelo geoespacial puede verse el modelo en acción: cómo se pueden seleccionar diversas ubicaciones y capas sobre el mapa, cómo se procesan y reconocen áreas –por ejemplo, las más afectadas por recientes inundaciones– y cómo se pueden hacer comparaciones por fechas.
IA abierta, ciencia abierta
Los responsables del proyecto consideran que este modelo para la observación de la Tierra es un gran ejemplo de la combinación de los conceptos de la Inteligencia Artificial Abierta y la Ciencia Abierta. En ambos se trata de que todo sea transparente y accesible para más usuarios, científicos y empresas, y también que todo sea más simple, de modo que se mejore la colaboración global para el bien de todos.