Drones de carreras inteligentes capaces de batir a los campeones humanos
Un equipo del Grupo de Robótica y Percepción de la Universidad de Zurich ha conseguido batir con un desarrollo mediante inteligencia artificial a tres campeones humanos en las carreras de drones. El trabajo, publicado en la prestigiosa revista Nature describe el uso del aprendizaje por refuerzo profundo en este tipo de ágiles vehículos aéreos. Es un concepto que ya se había utilizado en los videojuegos de carreras de coches, donde las máquinas también lograron superar a los humanos hace tiempo.
Drones con vistas en primera persona
En las carreras se utiliza un circuito amplio en una nave de gran tamaño, en este caso de una superficie de 30 por 30 metros y 8 metros de altura, con unos 75 metros de recorrido en total, en el que se sitúan unas puertas cuadradas de pequeñas dimensiones que los drones deben atravesar. Podría decirse que es un poco como en las pruebas de esquí o de aviación acrobática. Los competidores no sólo deben atravesar todas las puertas en el orden correcto; además deben hacerlo en el menor tiempo posible, dado que compiten por parejas, unos contra otros. Cada carrera son tres vueltas al circuito, un uno-contra-uno trepidante.
Carreras muy exigentes
La velocidad a la que vuelan los cuadricópteros de carreras suele superar los 100 km/h y las fuerzas que experimentas son de más de cinco veces su propio peso, con fuertes fuerzas G más allá de la aceleración de la gravedad.
¿Cómo funciona un dron de carreras inteligente?
El dron del Grupo de Robótica, llamado Swift consta de dos módulos. Como otros sistemas robóticos similares, se entrena previamente en simulaciones antes de «saltar a la arena».
- El primer módulo es el llamado sistema de percepción que transforma todos los datos que se reciben, visuales y de inercia, en una representación más simple en forma de datos numéricos. Es lo que llaman «conversión de muchas dimensiones a pocas dimensiones», una especie de simplificación para poder «digerir» tanta información.
- El segundo módulo es el sistema de control que a partir de la representación de esos datos produce los comandos de control que se envían a los motores para dirigir el dron hacia su próximo objetivo. Esta es la parte que se entrena previamente con un simulador y aprendizaje mediante refuerzo profundo (deep learning).
En la simulación, el dron realiza miles y miles de vueltas al circuito para afinar todos esos parámetros. Para que no se diga, a los competidores humanos se les permitió practicar durante una semana completa en el circuito real en cuestión.
Una competición accidentada
Aunque sobre el papel y las simulaciones todo es limpio y cristalino en la realidad las carreras son un poco más accidentadas. Si los drones chochan entre sí o con las puertas y caen al suelo, pueden continuar la carrera, siempre que retrocedan para completar el paso por las puertas en el orden correcto. Si ambos quedan incapacitados, el que haya llegado más lejos queda declarado ganador.
Aunque Swift consiguió ganar a los tres campeones humanos (ganando 5 de 9, 4 de 7 y 6 de 9) un 40% de las veces que perdió fue por colisiones con los contrincantes, otro 40% por chocar contra las puertas y un 20% simplemente por ser más lento. Pero también consiguió el récord al mejor tiempo de todas las carreras, superando a todos los pilotos humanos.
Un detalle curioso es que aunque Swift es más rápido a lo largo de la carrera de competición, no lo es en todas las zonas del recorrido ni en todos los momentos. Es más rápido en cuanto a «tiempo de reacción» al arrancar, acelerar y en los giros bruscos, pero los pilotos humanos son más elegantes y rápidos en giros como la curva en «S» de mitad del circuito. El promedio favorece a Swift, que en este sentido resulta más versátil.