Dall•E 2: una inteligencia artificial que genera imágenes artísticas a partir de textos
El nuevo juguete de OpenAI, el grupo especializado en inteligencia artificial amigable se llama Dall•E 2 (pronunciado «Dalí 2», en un juego de palabras con el nombre del pintor surrealista y el robot Wall•E de la película de animación de Pixar). Se trata de un software capaz de crear cualquier ilustración artística, pintura o fotografía con imágenes realistas a partir de una descripción en forma de texto.
Lo más llamativo es que cuando se está hablando de «cualquier imagen» es realmente «cualquiera». Aquí se puede poner la imaginación como límite, dado que cualquier descripción es válida, mientras tenga un mínimo de sentido. De hecho, las pequeñas sutilezas se incorporan como variaciones de las imágenes principales y variando un poco los términos que se utilizan para «explicarlas» se pueden en cierto modo «afinar» las imágenes.
Entonces dirige sus búsquedas en esa dirección. Luego se pueden añadir más variaciones a la descripción, casi hasta el infinito:
- Un astronauta montando a caballo…
- …dibujado a lápiz
- …al estilo de Andy Warhol.
A partir de este punto cualquier creación pasa a ser posible. Los expertos en inteligencia artificial, artistas y cualquiera al que le interesen mínimamente estos temas están frotándose las manos pensando en qué tipo de textos escribir para poner a Dall•E 2 a prueba.
Como los primeros desarrolladores ya tienen acceso a la herramienta han dejado entrever algunos ejemplos curiosos, que añadidos a los que ha dado a conocer OpenAI resultan, cuando menos, asombrosos.
Descripciones como «Un sillón con aspecto de kiwi» o «Una pintura como la joven de la perla» dan resultados convincentes. Otras más divertidas como «Pintura del gato naranja Otto Von Garfield, conde de of Bismarck-Schönhausen, Duque de Lauenburgo, Ministro de Prusia, con uniforme militar, degustando su comida favorita, lasaña», dan idea de que también funcionan (!) (esa idea loca es de @TheDividendReport).
Incluso los «Ositos de peluche bajo el agua con tecnología de los 90» (@CodeOrg) producen resultados «literalmente» perfectos, podría decirse sin temor a dudas.
Como todo vale, el resultado va desde imágenes tan imposibles que sólo pueden ser arte, en muchos casos fotorrealista, a algunos resultados imperfectos que permiten entender un poco cómo ha aprendido Dall•E 2 y cómo se comporta. Algunas pruebas que hice fueron un tanto frustrantes, imposible conseguir una imagen decente de «una Estatua de la Libertad de madera» o de un «Golden Gate de cristal», básicamente por la lejanía de la perspectiva; tampoco conseguí un «reloj al estilo de M.C. Escher».
Sus creadores también han incorporado en los algoritmos lo que denominan «medidas de seguridad» para ahorrarse polémicas e incluso problemas legales. Son principalmente tres:
- El sistema no puede generar imágenes potencialmente dañinas (violentas, de odio, de contenido político o sólo para adultos).
- Las imágenes no incluyen rostros con gran detalle, en especial de personajes famosos.
- Un sistema de supervisión humana como filtro adicional para evitar esas imágenes potencialmente dañinas.
Se puede seguir la evolución de Dall•E 2 a través de la web de OpenAI y ver muchos más ejemplos de su creatividad, originalidad y posibilidades en su cuenta de Instagram: @OpenAIDallE.