Entrenar una IA para batir a todos los humanos en las carreras de coches de los videojuegos

Uno de los más legendarios y competitivos juegos de carreras más creativos es Trackmania, de Ubisoft Nadeo. Es un videojuego de acción en el que se premia la precisión, en el que hay emocionantes eliminatorias por tiempos y competiciones online contra cientos de otros jugadores. Es curiosamente un entorno en el que los jugadores humanos son capaces de vencer a muchos bots que tal vez conduzcan bien, pero no con tanta precisión ni seguridad como los humanos.

Un YouTuber llamado Yosh, que lleva más de 17 años jugando a Trackmania decidió comprobar si era posible utilizar una red neuronal y el aprendizaje por refuerzo que se emplea en las IAs actuales para entrenar al «coche perfecto de Trackmania». Su teoría era la filosofía de que «cuanto más se entrena, mejor se vuelve» y aunque para una IA el proceso también es lento y delicado, tras tres años de duro esfuerzo parece que lo consiguió.

Entrenar una IA paso a paso

Todo el proceso de concepción, entrenamiento y programación y también los «ensayos y errores» pueden verse en un vídeo que Yosh fue grabando a lo largo de nada más y nada menos que tres años. Es un ejercicio sumamente didáctico para aprender cómo funciona esta última tecnología como si se tratara de un juego.

Lo que puede verse es básicamente:

Cada coche está controlado por una red neuronal mediante aprendizaje por refuerzo.
La red neuronal recibe diversa información de estado (distancias, velocidad, etcétera) cada 0,1 segundos.
Como respuesta, se pueden realizar acciones: girar el volante, frenar, acelerar.

Lo interesante con las redes neuronales es que se pueden crear miles de copias y ver cuál aprende mejor, que es lo interesante del proceso, tal y como se ve en el vídeo en el que circulan «coches fantasma». En el duro camino del aprendizaje la red neuronal comienza con una tendencia muy insistente por chocarse contra los bordes del circuito, pero va haciendo pequeñas variaciones en las acciones al azar. Lo que funciona, «sobrevive», lo que no funciona, se descarta.

Tras permitir que la «selección natural» elija a los coches que consiguen superar la prueba y completar el circuito –miles de generaciones después– todo está listo para los refinamientos. En este punto, como puede verse, el piloto humano todavía puede ganar con cierta facilidad al coche automático en una carrera relativamente sencilla.

El refinamiento de la IA

Las mejoras que se pueden introducir en la red neuronal incluyen más información, como por ejemplo qué ruedas del coche están tocando el suelo y cuáles están derrapando, el mantener una distancia hasta el centro de la pista, la distancia hasta la siguiente curva y, la más relevante de todas: el uso de los frenos. Con todos estos valores la IA ya es capaz de superar al piloto humano sin demasiados problemas.

Pero todo esto sucede en un circuito bastante sencillo, con bordes en los que los coches rebotan y donde no hay demasiada competitividad. Entonces comienza otra fase interesante: complicar el circuito en una especie de «laberinto elevado» donde salirse un poco de la pista significa caer y perder el juego.

Con toda la información a su alcance, incluyendo el contacto de las ruedas y los derrapes, la IA es capaz de apurar en las curvas, rascando segundos al cronómetro poco a poco, mientras mantiene la máxima velocidad posible. Aquí la IA también acaba superando al piloto humano al cabo de unas pocas horas de entrenamiento; ya no se necesitan semanas o meses como al principio.

Como puede verse, el proceso de entrenar una IA de este tipo no es sencillo: hay que intentar recoger la información clave para que se pueda procesar (pero no más, que puede ralentizar el proceso y tal vez no servir de mucho) y evitar conflictos entre las recompensas a corto plazo y largo plazo, para al mismo tiempo simplificar todo el proceso.

Con el tiempo, estas redes neuronales son capaces de adaptarse no solo a los entornos de prueba sino también a situaciones para las que no se ha entrenado inicialmente. Es algo tan palpable en el mundo real como en el universo de las carreras de videojuegos de Trackmania, donde hay cientos de circuitos de aspecto completamente diferente y donde los escenarios y reglas pueden cambiar, pero que ahora las IA también pueden tener bajo control.

Últimas entradas de Microsiervos

Deja un comentario sobre "Entrenar una IA para batir a todos los humanos en las carreras de coches de los videojuegos" Cancelar respuesta

Nos encantará conocer vuestra opinión, pero indicaros que los comentarios están moderados, y no aparecerán inmediatamente en la página al ser enviados. Evitemos las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, y procuremos que las opiniones estén relacionadas con lo que se comenta en esta entrada.

Comentario

Volvo Car España, S.L.U. almacenaremos y procesaremos tus datos personales de acuerdo a nuestro aviso legal y política de privacidad. En Volvo Car España, S.L.U. también compartiremos tus datos personales con nuestra Red de Concesionarios y Talleres Oficiales, quien los procesará y hará seguimiento de tu solicitud. Enviando esta solicitud, aceptas este proceso.

Nuestros clientes y amigos reciben la mejor información, campañas y promociones de Volvo Cars, a través de medios electrónicos. Al seleccionar una o varias de las casillas de abajo, consiento recibir futuras comunicaciones de Volvo Car España y/o nuestra Red de Concesionarios por el canal seleccionado.

Enviado esta solicitud, consientes el procesamiento de tus datos.

Nombre *

Correo electrónico *

Web

Innovación

Entrenar una IA para batir a todos los humanos en las carreras de coches de los videojuegos

Entrenar una IA paso a paso

El refinamiento de la IA

Últimas entradas de Microsiervos

Álvaro Ibañez

Volvo C40 Recharge

Deja un comentario sobre "Entrenar una IA para batir a todos los humanos en las carreras de coches de los videojuegos" Cancelar respuesta