Entrenar una IA para batir a todos los humanos en las carreras de coches de los videojuegos

Uno de los más legendarios y competitivos juegos de carreras más creativos es Trackmania, de Ubisoft Nadeo. Es un videojuego de acción en el que se premia la precisión, en el que hay emocionantes eliminatorias por tiempos y competiciones online contra cientos de otros jugadores. Es curiosamente un entorno en el que los jugadores humanos son capaces de vencer a muchos bots que tal vez conduzcan bien, pero no con tanta precisión ni seguridad como los humanos.

Un YouTuber llamado Yosh, que lleva más de 17 años jugando a Trackmania decidió comprobar si era posible utilizar una red neuronal y el aprendizaje por refuerzo que se emplea en las IAs actuales para entrenar al «coche perfecto de Trackmania». Su teoría era la filosofía de que «cuanto más se entrena, mejor se vuelve» y aunque para una IA el proceso también es lento y delicado, tras tres años de duro esfuerzo parece que lo consiguió.

Entrenar una IA paso a paso

Todo el proceso de concepción, entrenamiento y programación y también los «ensayos y errores» pueden verse en un vídeo que Yosh fue grabando a lo largo de nada más y nada menos que tres años. Es un ejercicio sumamente didáctico para aprender cómo funciona esta última tecnología como si se tratara de un juego.

Lo que puede verse es básicamente:

Lo interesante con las redes neuronales es que se pueden crear miles de copias y ver cuál aprende mejor, que es lo interesante del proceso, tal y como se ve en el vídeo en el que circulan «coches fantasma». En el duro camino del aprendizaje la red neuronal comienza con una tendencia muy insistente por chocarse contra los bordes del circuito, pero va haciendo pequeñas variaciones en las acciones al azar. Lo que funciona, «sobrevive», lo que no funciona, se descarta.

Tras permitir que la «selección natural» elija a los coches que consiguen superar la prueba y completar el circuito –miles de generaciones después– todo está listo para los refinamientos. En este punto, como puede verse, el piloto humano todavía puede ganar con cierta facilidad al coche automático en una carrera relativamente sencilla.

El refinamiento de la IA

Las mejoras que se pueden introducir en la red neuronal incluyen más información, como por ejemplo qué ruedas del coche están tocando el suelo y cuáles están derrapando, el mantener una distancia hasta el centro de la pista, la distancia hasta la siguiente curva y, la más relevante de todas: el uso de los frenos. Con todos estos valores la IA ya es capaz de superar al piloto humano sin demasiados problemas.

Pero todo esto sucede en un circuito bastante sencillo, con bordes en los que los coches rebotan y donde no hay demasiada competitividad. Entonces comienza otra fase interesante: complicar el circuito en una especie de «laberinto elevado» donde salirse un poco de la pista significa caer y perder el juego.

Con toda la información a su alcance, incluyendo el contacto de las ruedas y los derrapes, la IA es capaz de apurar en las curvas, rascando segundos al cronómetro poco a poco, mientras mantiene la máxima velocidad posible. Aquí la IA también acaba superando al piloto humano al cabo de unas pocas horas de entrenamiento; ya no se necesitan semanas o meses como al principio.

Como puede verse, el proceso de entrenar una IA de este tipo no es sencillo: hay que intentar recoger la información clave para que se pueda procesar (pero no más, que puede ralentizar el proceso y tal vez no servir de mucho) y evitar conflictos entre las recompensas a corto plazo y largo plazo, para al mismo tiempo simplificar todo el proceso.

Con el tiempo, estas redes neuronales son capaces de adaptarse no solo a los entornos de prueba sino también a situaciones para las que no se ha entrenado inicialmente. Es algo tan palpable en el mundo real como en el universo de las carreras de videojuegos de Trackmania, donde hay cientos de circuitos de aspecto completamente diferente y donde los escenarios y reglas pueden cambiar, pero que ahora las IA también pueden tener bajo control.

Últimas entradas de Microsiervos

Volvo C40 Recharge

Descubre nuestro primer crossover eléctrico puro con interior libre de cuero y con Google integrado. Ya puedes solicitarlo hoy mismo online.

¡Descúbrelo!