Innovación

Dall•E 2: una inteligencia artificial que genera imágenes artísticas a partir de textos

El nuevo juguete de OpenAI, el grupo especializado en inteligencia artificial amigable se llama Dall•E 2 (pronunciado «Dalí 2», en un juego de palabras con el nombre del pintor surrealista y el robot Wall•E de la película de animación de Pixar). Se trata de un software capaz de crear cualquier ilustración artística, pintura o fotografía con imágenes realistas a partir de una descripción en forma de texto.

Dall•E 2

Lo más llamativo es que cuando se está hablando de «cualquier imagen» es realmente «cualquiera». Aquí se puede poner la imaginación como límite, dado que cualquier descripción es válida, mientras tenga un mínimo de sentido. De hecho, las pequeñas sutilezas se incorporan como variaciones de las imágenes principales y variando un poco los términos que se utilizan para «explicarlas» se pueden en cierto modo «afinar» las imágenes.

Dall•E 2Dall•E 2 entiende la relación entre imágenes y textos mediante un proceso llamado difusión, que consiste en comenzar con una imagen de puntos de colores que se van manipulando, poco a poco, hasta que empiezan a surgir patrones reconocibles que coinciden con la descripción dada.

Entonces dirige sus búsquedas en esa dirección. Luego se pueden añadir más variaciones a la descripción, casi hasta el infinito:

  • Un astronauta montando a caballo…
  • …dibujado a lápiz
  • …al estilo de Andy Warhol.

A partir de este punto cualquier creación pasa a ser posible. Los expertos en inteligencia artificial, artistas y cualquiera al que le interesen mínimamente estos temas están frotándose las manos pensando en qué tipo de textos escribir para poner a Dall•E 2 a prueba.

Como los primeros desarrolladores ya tienen acceso a la herramienta han dejado entrever algunos ejemplos curiosos, que añadidos a los que ha dado a conocer OpenAI resultan, cuando menos, asombrosos.

Descripciones como «Un sillón con aspecto de kiwi» o «Una pintura como la joven de la perla» dan resultados convincentes. Otras más divertidas como «Pintura del gato naranja Otto Von Garfield, conde de of Bismarck-Schönhausen, Duque de Lauenburgo, Ministro de Prusia, con uniforme militar, degustando su comida favorita, lasaña», dan idea de que también funcionan (!) (esa idea loca es de @TheDividendReport).

Incluso los «Ositos de peluche bajo el agua con tecnología de los 90» (@CodeOrg) producen resultados «literalmente» perfectos, podría decirse sin temor a dudas.

Dall•E 2

Como todo vale, el resultado va desde imágenes tan imposibles que sólo pueden ser arte, en muchos casos fotorrealista, a algunos resultados imperfectos que permiten entender un poco cómo ha aprendido Dall•E 2 y cómo se comporta. Algunas pruebas que hice fueron un tanto frustrantes, imposible conseguir una imagen decente de «una Estatua de la Libertad de madera» o de un «Golden Gate de cristal», básicamente por la lejanía de la perspectiva; tampoco conseguí un «reloj al estilo de M.C. Escher».

Dall•E 2Entre las críticas, quienes ya lo han probado hablan de cierta dificultad para «afinar» mejor los resultados y de cierta falta de entendimiento en cuanto a los detalles de composición de las imágenes (posiciones, relaciones, fondos, etcétera), aunque otros betatesters aseguran que entiende las relaciones de aspecto, profundidad, y demás. ¿Respeta Dall•E 2 todos los temas relacionados con los copyrights de las imágenes con que se ha alimentado? Esto se ha tenido en cuenta y parece ser uno de sus fuertes, porque casi todos los resultados, incluyendo los de «con el estilo de…» se parecen a los de ciertos autores, pero en todas las imágenes los detalles son distintos, desde pinturas clásicas a fotografías conocidas.

Sus creadores también han incorporado en los algoritmos lo que denominan «medidas de seguridad» para ahorrarse polémicas e incluso problemas legales. Son principalmente tres:

  • El sistema no puede generar imágenes potencialmente dañinas (violentas, de odio, de contenido político o sólo para adultos).
  • Las imágenes no incluyen rostros con gran detalle, en especial de personajes famosos.
  • Un sistema de supervisión humana como filtro adicional para evitar esas imágenes potencialmente dañinas.

Se puede seguir la evolución de Dall•E 2 a través de la web de OpenAI y ver muchos más ejemplos de su creatividad, originalidad y posibilidades en su cuenta de Instagram: @OpenAIDallE.

Últimas entradas de Microsiervos

Volvo C40 Recharge

Descubre nuestro primer crossover eléctrico puro con interior libre de cuero y con Google integrado. Ya puedes solicitarlo hoy mismo online.

¡Conócelo!
 

Deja un comentario sobre "Dall•E 2: una inteligencia artificial que genera imágenes artísticas a partir de textos"

Nos encantará conocer vuestra opinión, pero indicaros que los comentarios están moderados, y no aparecerán inmediatamente en la página al ser enviados. Evitemos las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, y procuremos que las opiniones estén relacionadas con lo que se comenta en esta entrada.

Volvo Car España, S.L.U. almacenaremos y procesaremos tus datos personales de acuerdo a nuestro aviso legal y política de privacidad. En Volvo Car España, S.L.U. también compartiremos tus datos personales con nuestra Red de Concesionarios y Talleres Oficiales, quien los procesará y hará seguimiento de tu solicitud. Enviando esta solicitud, aceptas este proceso.

Nuestros clientes y amigos reciben la mejor información, campañas y promociones de Volvo Cars, a través de medios electrónicos. Al seleccionar una o varias de las casillas de abajo, consiento recibir futuras comunicaciones de Volvo Car España y/o nuestra Red de Concesionarios por el canal seleccionado.

Email

Enviado esta solicitud, consientes el procesamiento de tus datos.