Activa las notificaciones para estar al tanto de lo más nuevo en tecnología.

Sin duda la creatividad es uno de los grandes retos para la inteligencia artificial. Ya tenemos suficiente evidencia de que las máquinas son mejores en muchas áreas como en reconocer rostros, objetos, hacer síntesis de imágenes, traducir idiomas (aunque en general aún hay mucho trabajo por hacer en esta área), así como vencer a los grandes jugadores de ajedrez y Go a nivelo mundial. Pero cuando hablamos de creatividad, pareciera que las máquinas no han exhibido sus capacidades artísticas o quizás el problema es que ¿no pueden acaso?

Y que conste que hay muchos esfuerzos de hacer máquinas que exhiban creatividad artística. Por ejemplo, hay computadoras que han aprendido a reconocer estilos artísticos, separarlos del contenido de una imagen y aplicarlo a una nueva. Así, es posible convertir una foto de un paisaje al mejor estilo Van Gogh, por ejemplo. Pero aunque esto nos da pistas importantes para poder entender la naturaleza del estilo artístico, no cuenta como creatividad realmente. El reto es pues, encontrar formas de explotar la inteligencia artificial para propósitos creativos.

Un interesante trabajo de Ahmed Elgammal y el Laboratorio de IA y Arte, de la Universidad de Rutgers, además de la ayuda del laboratorio de IA de Facebook, podría traer nuevas ideas a este problema aún no resuelto.

¿Una inteligencia artificial como la de los humanos?

Este grupo de científicos ha entrenado a una máquina para generar imágenes que son similares a lo que hacen los seres humanos pero que pueden medirse desde otros puntos de vista. Esto vendría a ser una especie de prueba de Turing para ver si una máquina puede “crear una obra artística” y engañar a los seres humanos de manera que piensen que la obra de arte es sólo producto humano y no de la máquina. Así pues, de una serie de imágenes (ver más abajo), ¿podría usted decir cuál está hecha por una máquina y cuál por seres humanos?


¿Podría el lector/lectora, decir qué imágenes son humanas y cuáles generadas por computadora? (*)

Para este desarrollo se basaron en redes neuronales, en un proceso llamado red generativa de adversarios, la cual consiste en dos redes neuronales que juntas inician el proceso de aprendizaje. Una de estas redes usa el algoritmo tradicional para hacer visión por computadora y aprende a reconocer imágenes de cierto tipo. Elgammal y sus colegas usaron la base de datos WikiArt, la cual consiste en 80 mil pinturas de más de 1000 artistas, que datan del siglo 15 hasta finales del siglo XX.

Cada imagen se etiquetó con un estilo artístico. De esta forma la base de datos pudo clasificarse con unas 13 mil imágenes impresionistas, 2000 imágenes cubistas y más de 1000 pinturas del tipo renacentista. La máquina aprende a reconocer estos estilos.

La siguiente etapa es para la otra red neuronal, la cual genera imágenes al azar y muestra estas a la red entrenada, la cual reconoce a cada una con un estilo particular o bien lo rechaza. Produciendo muchas imágenes, esta segunda red neuronal aprende lo que la primera reconoce como arte a través de un proceso de prueba y error. Y después de muchas iteraciones, aprende a producir imágenes con un estilo determinado.

Sin embargo, el equipo no considera que estas imágenes sean creativas porque simplemente están copiando los estilos conocidos de arte. En contraste, un artista humano podría llevar a los límites su propio estilo, produciendo algo nuevo.

Hay muchas hipótesis sobre el proceso creativo que lleva a lo que llamamos finalmente arte. Por ejemplo, una idea muy conocida es un nuevo trabajo artístico cuando este se basa firmemente como una tradición artística. En otras palabras, esto debe ser diferente a lo anterior, pero no demasiado diferente.

Haga sus propias redes neuronales complejas usando Sonnet

En particular, los teóricos dicen que el arte debe estimular al espectador de diversas maneras: “Pueden ser muy significativas las expresiones de novedad, sorpresa, complejidad y ambigüedad, entre otras”, dice Elgammal y colegas.

“La novedad se refiere al grado en el que un estímulo difiere de lo que un observador ha experimentado o visto antes. La sorpresa se refiere al grado de que el estímulo difiere con lo esperado. La sorpresa puede no estar directamente correlacionada con la novedad”, indican os investigadores. Pero sea cual sea el efecto generado en el observador, debe ser un efecto moderado más que extremo. “Muy poco efecto termina considerándose aburrido y mucho efecto genera un sistema de aversión a la obra”, indica Elgammal.

Esto último tiene implicaciones importantes para la forma en que se genera la red, o el agente, cuya meta es generar arte con niveles cada vez mayores para generar en los observadores los efectos sin activar el sistema de aversión. “En otras palabras, el agente trata de generar arte que es novedoso, pero no demasiado novedoso”, comentan Elgammal y colegas.

Los investigadores dicen que han encontrado una manera de hacer esto con su red. Habiendo aprendido a reproducir cierto estilos artísticos, la máquina se pone a punto para producir imágenes que caen en los límites aceptables del arte como un todo, pero maximiza la diferencia de los estilos conocidos. “El agente trata de explorar el espacio creativo desviándose de las normas establecidas del estilo y generando por ende, arte nuevo”, indican los académicos. A esto le llaman una red creativa adversarial.

La prueba del ácido es, por supuesto, cómo los seres humanos reaccionan a este arte generado por la máquina. Para ello, los investigadores mostraron una serie de imágenes, de humanos y máquinas mezcladas, en un sitio web llamado “el turco mecánico”. Algunas de esas pinturas son de la base de datos WikiArt, del expresionismo abstracto así como otras más contemporáneas, del 2016. Estas imágenes representan el pináculo del arte moderno. La razón de usar expresionismo abstracto es que en general se quitan imágenes de personas y objetos, que claramente ayudan a distinguir entre el arte humano y el de máquinas.

De las pinturas y dibujos hiperrealistas

Algunas imágenes se generaron por la propia red, pero otras simplemente son reproducciones del estilo artístico que como hemos dicho, no califican como verdadero arte, pues sólo copian el estilo.

Se cuestionó a diferentes personas sobre estas pinturas y se encontró que los seres humanos son buenos en hallar qué imágenes de expresionismo abstracto fueron hechas por humanos y por máquinas. Pero en el caso de las pinturas del 2016, los observadores no fueron tan capaces para hacer esta distinción.

La gran pregunta es si los procesos generados por Elgammal y Co. se pueden usar para hacer imágenes que se consideren creativas. Hay quien piensa que los procesos algorítmicos generados explotan las vulnerabilidades emocionales humanas. El asunto no parece ser fácil de dilucidar. En cualquier caso, es un nuevo paso en el tema de lo que significa ser artístico y de las capacidades de la IA para resolverlo.

(*) Todas las imágenes fueron creadas por la computadora.

Referencias:CAN: Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms, Technology Review 

Desde la Red…
Comentarios