Dall•E 2: una inteligencia artificial que genera imágenes artísticas a partir de textos

El nuevo juguete de OpenAI, el grupo especializado en inteligencia artificial amigable se llama Dall•E 2 (pronunciado «Dalí 2», en un juego de palabras con el nombre del pintor surrealista y el robot Wall•E de la película de animación de Pixar). Se trata de un software capaz de crear cualquier ilustración artística, pintura o fotografía con imágenes realistas a partir de una descripción en forma de texto.

Lo más llamativo es que cuando se está hablando de «cualquier imagen» es realmente «cualquiera». Aquí se puede poner la imaginación como límite, dado que cualquier descripción es válida, mientras tenga un mínimo de sentido. De hecho, las pequeñas sutilezas se incorporan como variaciones de las imágenes principales y variando un poco los términos que se utilizan para «explicarlas» se pueden en cierto modo «afinar» las imágenes.

Dall•E 2 entiende la relación entre imágenes y textos mediante un proceso llamado difusión, que consiste en comenzar con una imagen de puntos de colores que se van manipulando, poco a poco, hasta que empiezan a surgir patrones reconocibles que coinciden con la descripción dada.

Entonces dirige sus búsquedas en esa dirección. Luego se pueden añadir más variaciones a la descripción, casi hasta el infinito:

A partir de este punto cualquier creación pasa a ser posible. Los expertos en inteligencia artificial, artistas y cualquiera al que le interesen mínimamente estos temas están frotándose las manos pensando en qué tipo de textos escribir para poner a Dall•E 2 a prueba.

Como los primeros desarrolladores ya tienen acceso a la herramienta han dejado entrever algunos ejemplos curiosos, que añadidos a los que ha dado a conocer OpenAI resultan, cuando menos, asombrosos.

Descripciones como «Un sillón con aspecto de kiwi» o «Una pintura como la joven de la perla» dan resultados convincentes. Otras más divertidas como «Pintura del gato naranja Otto Von Garfield, conde de of Bismarck-Schönhausen, Duque de Lauenburgo, Ministro de Prusia, con uniforme militar, degustando su comida favorita, lasaña», dan idea de que también funcionan (!) (esa idea loca es de @TheDividendReport).

Incluso los «Ositos de peluche bajo el agua con tecnología de los 90» (@CodeOrg) producen resultados «literalmente» perfectos, podría decirse sin temor a dudas.

Como todo vale, el resultado va desde imágenes tan imposibles que sólo pueden ser arte, en muchos casos fotorrealista, a algunos resultados imperfectos que permiten entender un poco cómo ha aprendido Dall•E 2 y cómo se comporta. Algunas pruebas que hice fueron un tanto frustrantes, imposible conseguir una imagen decente de «una Estatua de la Libertad de madera» o de un «Golden Gate de cristal», básicamente por la lejanía de la perspectiva; tampoco conseguí un «reloj al estilo de M.C. Escher».

Entre las críticas, quienes ya lo han probado hablan de cierta dificultad para «afinar» mejor los resultados y de cierta falta de entendimiento en cuanto a los detalles de composición de las imágenes (posiciones, relaciones, fondos, etcétera), aunque otros betatesters aseguran que entiende las relaciones de aspecto, profundidad, y demás. ¿Respeta Dall•E 2 todos los temas relacionados con los copyrights de las imágenes con que se ha alimentado? Esto se ha tenido en cuenta y parece ser uno de sus fuertes, porque casi todos los resultados, incluyendo los de «con el estilo de…» se parecen a los de ciertos autores, pero en todas las imágenes los detalles son distintos, desde pinturas clásicas a fotografías conocidas.

Sus creadores también han incorporado en los algoritmos lo que denominan «medidas de seguridad» para ahorrarse polémicas e incluso problemas legales. Son principalmente tres:

Se puede seguir la evolución de Dall•E 2 a través de la web de OpenAI y ver muchos más ejemplos de su creatividad, originalidad y posibilidades en su cuenta de Instagram: @OpenAIDallE.

Últimas entradas de Microsiervos

Volvo C40 Recharge

Descubre nuestro primer crossover eléctrico puro con interior libre de cuero y con Google integrado. Ya puedes solicitarlo hoy mismo online.

¡Conócelo!