Esta es la mejor supercomputadora para reconocer imágenes

Se dice que Marvin Minsky, uno de los artífices de la Inteligencia Artificial, le encargó a un estudiante de posgrado un proyecto, el cual trataba de reconocer lo que aparecía en una fotografía. Minsky pensaba -dicen los que aseguran que la anécdota es cierta- que el profesor pensaba que sería un trabajo resuelto en unos tres o cuatro meses. Poco tiempo después debe haber notado la dificultad del problema, el cual tiene que ver además con cuestiones como conocimiento del mundo exterior, asunto que muchas veces quienes se dedican a esta rama del cómputo, no toman muy en cuenta.

La técnica de “aprendizaje profundo” ha realizado ya enormes avances en tecnologías de la voz, reconocimiento de rostros, de imágenes, y del cómo se está transformando la manera en como nos relacionamos con las computadoras. Ahora, la compañía china Baidu ha construido una supercomputadora para acelerar sus investigaciones en el campo de la inteligencia artificial. Baidu ha dicho que ha inventado una poderosa supercomputadora que le da nuevos músculos a una serie de técnicas de inteligencia artificial, dando mucho más poder a la máquina para entender el habla, las imágenes y el lenguaje escrito.

La nueva computadora, llamada Minwa, y localizada en Beijing, tiene 72 procesadores poderosos y 144 procesadores gráficos, conocidos como GPUs. El pasado lunes Biadu dio a conocer un artículo indicando que la computadora se había usado para entrenarse, a través de un software de aprendizaje, el cual habría logrado un nuevo récord en el reconocimiento de imágenes, batiendo la marca previa, anunciada hace poco por Google.

“Nuestra compañía ahora lidera la carrera en la inteligencia de las máquinas”, indica Ren Wu, un científico de Baidu que trabaja en el proyecto de visión embebida, el cual reportó sus hallazgos en la Conferencia que se lleva precisamente sobre este tema en esta semana que está por concluir. El poder computacional de Minwa podría poner a la máquina entre las 300 computadoras más poderosas en el mundo si es que no fuesen especializadas para aprendizaje profundo., indica Wu. “Pienso que esta es la supercomputadora más rápida dedica al aprendizaje profundo”, dijo y agregó “tenemos mucho poder en nuestras manos, mucho más que el de nuestros competidores”.

La técnica es una versión mejorada de una primera aproximación que se estableció hace algunas décadas, en donde los datos se procesan por una red de neuronas artificiales que manejan la información de manera parecida a como creemos el cerebro humano lo hace. El aprendizaje profundo usa una gran red de neuronas, acomodadas en capas jerárquicas, y entrenadas con una colección de datos significativamente más grande, tales como fotos, documentos de texto y voz grabada.

Hasta ahora, los conjuntos de datos y las redes cada vez más grandes hacen que esta tecnología sea cada vez mejor, dice Wu. Sin embargo, un efecto que se ha notado es que los resultados empiezan de pronto a decrecer cuando se usan conjuntos de datos muy grandes. “Una vez que se escalan los datos más allá de cierto punto, no parece encontrarse ninguna mejora”, dice Wu. Sin embargo, con el aprendizaje profundo esto no parece ocurrir. Baidu dice que Minwa tiene una red neuronal que es miles de millones con más conexiones que cualquier otra red neuronal antes construida.

El articulo publicado este lunes pasado describe que la computadora Minwa, en el ImageNet Classification Challenge, logró entrenarse con 1.5 millones de imágenes en 1000 categorías diferentes y entonces se le pidió al software que usando lo aprendido, etiquetara unas 100 mil imágenes más que no había visto con anterioridad. El software se equivocó en tan sólo 4.58 por ciento de las veces. El registro anterior era de 4.82 reportado por Google en marzo de este año. Un mes antes Microsoft había logrado 4.94%, sobrepasando al humano promedio, el cual tiene un 5.1% de error.

Wu dice que Minwa se entrenó usando imágenes de alta definición, las cuales se pusieron de cabeza, se alteraron sus colores, se distorsionaron. Con ello, la precisión del sistema mejoró y se impidió que el sistema fuese demasiado rígido. El resultado es un mejor manejo al manejar fotos del mundo real. Ahora los investigadores chinos quieren encontrar una forma de poner estas redes neuronales que aprenden incluso en los teléfonos celulares y aunque suena un asunto de ciencia ficción, ya mostraron un prototipo de un celular con estas características.

Referencias:

Technology Review (MIT)