Activa las notificaciones para estar al tanto de lo más nuevo en tecnología.

Categorizador de imágenes inteligente

Uno de los problemas no resueltos en el cómputo moderno es el catalogar y categorizar imágenes, de manera que si uno busca un tema en...

Uno de los problemas no resueltos en el cómputo moderno es el catalogar y categorizar imágenes, de manera que si uno busca un tema en particular, digamos “playa“, un sistema nos pueda mostrar fotografías de playa, pero no basándose en la descripción que podría aparecer por parte de quien subió la fotografía, o el título de la misma, sino en la imagen por sí misma.

Esta dificultad de categorizar y catalogar fotografías tiene ya muchos años de haberse planteado. Marvin Minsky, en los años setenta, le pidió a un estudiante graduado que como tesis de maestría, tomara una fotografía y escribiese un programa que le dijera qué había en la misma.

Minsky incluso le comentó a dicho estudiante que posiblemente un programa de esta naturaleza podría escribirse en unos tres meses. Al final de cuentas se percató el investigador que la tarea encomendada era poco más que difícil. Sin duda los problemas que nos parecen triviales para el cerebro humano son siempre más difíciles de lo que habíamos pensado, considerando el resolverlos con computadoras.

BUENA CALIDAD ESTÉTICA

Lo que dice nuestro algoritmo: Buenas fotos de personas se detectan cuando la luz es buena, resultando en un “claroscuro”. Cuando el fondo está en su mayor parte oscuro, esto hace que el contraste sea mejor con el sujeto primario.

 

Sin embargo, que sea difícil no quiere decir que no se pueda intentar. Xerox ya tiene un sistema de categorización automático, que primero entiende el contenido de una imagen (sin necesidad de ver etiquetas o tags incluídos en la imagen), y entonces busca filtrar la imagen para ver si la misma cumple con ciertos elementos estéticos, tanto buenos como malos. Por ello es que uno siempre ve las mejores fotografías cuando se hace una búsqueda al respecto. Así, aparte de dar imágenes que se buscan, el sistema da las mejores de acuerdo a ciertos criterios estéticos.

MALA CALIDAD ESTÉTICA

Lo que dice nuestro algoritmo: La luz en estas imágenes (malas), es demasiado directa (flash o del sol). La mayoría de las veces, las expresiones en los rostros no es natural.

Probablemente la idea requiera de mucho más trabajo, pero por lo pronto, parece que estos amigos de Xerox van por buen camino.

 

Comentarios