Una pequeña compañía llamada Physical Intelligence (π) trabaja en llevar a la práctica de forma eficiente un concepto relacionado con la IA denominado inteligencia física generalista. Consiste básicamente en sistemas inteligentes –como pequeños mecanismos robots, fijos o móviles– capaces de realizar más de una tarea, a diferencia de los robots de las cadenas de montaje, las aspiradoras caseras o los limpiadores de fondos de piscina, que sólo son capaces de hacer una cosa.
Fácil para los humanos, difícil para los robots
Uno de los retos a los que se enfrenta el primer robot prototipo de la compañía, llamado π0 (pi cero) es realizar tareas humanas cotidianas que para nosotros resultan sencillas aunque aburridas: doblar camisetas, poner una lavadora o limpiar una mesa tras una comida. Para las máquinas son tareas increíblemente complejas por el manejo de diversos materiales, lo diferente que es cada situación de una tarea a la siguiente o la necesidad de manejar varios objetos a la vez (como abrir una puerta mientras se mete una prenda de ropa).
El enfoque generalista del que hay que dotar a estos robots, esa inteligencia física generalista, se basa en integrar diversos aspectos como son la visión, el lenguaje y la ejecución de las acciones de modo que se puedan llevar a cabo las tareas que surjan o se ordenan. El entrenamiento se realiza con varios robots distintos, en este caso unas 7 configuraciones distintas, unos con ruedas, otros fijos.
Para poder cumplir con todas las instrucciones cotidianas que puede recibir, el π0 se entrena con 68 tareas distintas: doblar ropa, montar cajas, recoger mesas y basuras, reemplazar toallas de papel, calentar túpers de comida en el microondas, empaquetar huevos, preparar bolsas con latas y paquetes de alimentos… Hasta es capaz de sacar las tostadas recién hechas de la tostadora. El asistente perfecto con el que todos hemos soñado alguna vez.
En total, se realiza un preentrenamiento de unas 10.000 horas manipulando todo tipo de objetos y navegando por diversos escenarios. Entrenamiento que muchas veces puede realizarse en simuladores a alta velocidad, sin necesidad de hacerlo físicamente.
Capacidades técnicas punteras
El π0 utiliza diversas técnicas para ejecutar todas las tareas que se le encomiendan. Entre otras, incluye:
- Captación de datos mediante un modelo de visión preentrenado.
- Utilización de un modelo de lenguaje para comprender las órdenes.
- Análisis del estado del robot y sus articulaciones, para orientarse mejor.
- Acciones motoras continuas en las tareas complejas que requieren mucha destreza.
- Capacidad para enviar 50 órdenes por segundo a los diversos motores para realizar todas las acciones.
- Especialización: se le añaden conocimientos adicionales para ajustar el modelo para las tareas concretas que puede realizar (ej. montaje de cajas).
Cuando la tecnología se comporta con humanidad
Ver al π0 deambular por el laboratorio es toda una experiencia. En un escenario de mentirijillas montado como una vivienda normal y corriente, el π0 se desplaza por un entorno en el que hay una lavadora y una secadora, un par de mesas, cocina, nevera… Los movimientos son lentos pero seguros, con cierto toque de humanidad incluso siendo el robot dos brazos muy mecánicos e incluso un poco intimidantes. (Nota: los vídeos de la web de Physical Intelligence tienen un poco de truco porque están acelerados entre ×2 y ×,10).
Cuando recoge la ropa a veces falla y se le cae; en esos casos simplemente lo reintenta, como haría cualquier persona. El trabajo con los dos brazos robóticos está perfectamente coordinado: pueden doblar la ropa como nosotros –con gestos muy, muy humanos– o sujetar una cafetera con una de las pinzas que hacen de manos mientras con la otra vierte el café. En la tarea de empaquetar huevos en una huevera los movimientos son también realmente curiosos, con reintentos al cogerlos y cierta brusquedad calculada al depositarlos en los huecos de la huevera, donde no se sigue un orden en particular.
Los avances en cada uno de los aspectos individuales que hacen funcionar este tipo de robots avanzan a pasos agigantados: en visión artificial, en entendimiento del lenguaje, en el propio entrenamiento… Todo ello llevará a que poco a poco sean cada vez más capaces y a que esa ansiada inteligencia física generalista vaya volviéndose más práctica. Tanto que quizá podamos tener algún día cercano a estos pequeños compañeros a nuestro alrededor realizando las tareas en el hogar.