huang00

Da la impresión que la industria del cómputo -después de muchos años- empieza a entender que hay algo más que buscar hacer dinero. Si no se les puede dar a los miles de desarrolladores las herramientas adecuadas, a precios razonables, lo más probable es que estas tecnologías mueran prematuramente. De hecho, una gran fuerza de trabajo para las empresas de cómputo son los miles y miles de programadores que hacen sistemas para las plataformas en boga. Por ello, es bueno saber que ahora Microsoft decidió liberar su “caja de herramientas” de aprendizaje profundo y además, ponerlo accesible en GitHub con el código fuente disponible.

La intención de Microsoft es que estas herramientas -que son las que usan sus propios investigadores- aceleren las técnicas de Inteligencia Artificial a un grupo más amplio de programadores. Por ello, ya se puede utilizar libremente el CNTK – Computational Network Toolkit. Los investigadores involucrados en este desarrollo han indicado que la idea es hacer mejoras aceleradas sobre cómo la computadora puede entender el habla humano, por ejemplo, y que las tecnologías anteriores adolescen de ser muy lentas. De acuerdo a Xuedong Huang, especialista en el reconocimiento del habla, en el CNTK, las pruebas internas probaron ser más eficientes que otros toolkits populares que los desarrolladores están usando para crear modelos de aprendizaje profundo en temas como reconocimiento de imágenes y del habla. “El toolkit CNTK es mucho más eficiente que todo lo anterior que hemos visto”, dice Huang. El acelerar las posibilidades de estos sistemas tiene que ver con la dificultad de los problemas que se atacan. Es decir, en el campo del aprendizaje profundo muchas veces se necesitan semanas para hallar algunos resultados que puedan ser interesantes.

En años pasados, el campo del aprendizaje profundo tuvo una explosión en la medida que más investigadores empezaron a correr algortimos de aprendizaje de máquinas usando redes neuronales profundas, las cuales -como sabemos- están inspiradas en los procesos biológicos del cerebro. Muchos investigadores vieron el aprendizaje profundo como un enfoque prometedor para tener una mejor inteligencia artificial.

Microsoft internamente está usando CNTK sobre un conjunto de computadoras poderosas que usan GPUs para el desempeño de los algoritmos. Y aunque los GPUs se crearon para las gráficas por computadora, los investigadores han encontrado que son ideales para procesar el tipo de algoritmos que están liderando los mayores avances en la tecnología: hablar, escuchar y entender el habla, así como reconocer imágenes y movimientos.

Chris Basoglu, un gerente principal en el área de desarrollo en Microsoft, quien ha trabajado con el toolkit, dijo que una de las ventajas de usar CNTK es que puede ser usado por cualquier investigador con un presupuesto limitado, con una sola computadora o por alguien que pueda tener la capacidad de crear su propio clúster de computadoras basadas en GPUs. Los investigadores dicen que se puede escalar en la medida que se ponen más GPUs a trabajar y que esto además, no lo tienen en estos términos de capacidad otros toolkits, dando una ventaja clave a los usuarios que buscan hacer experimentos a largo plazo o cálculos.

Huang por su parte dijo que es importante para su equipo ser capaz de satisfacer las necesidades internas de Microsofr con una herramienta como CNTK, pero que ellos querían dar los mismos recursos a los investigadores para que se pudiesen generar avances similares en el aprendizaje profundo. Por llo han decidido poner esta herramienta con licencias de código abierto de manera que otros investigadores y programadores puedan usarlas.

En abril del año pasado (2015), los investigadores pusieron este toolkit disponible para la investigación académica, vía CodePlex y bajo una licencia de código abierto mucho más restringida. Pero desde este lunes pasado, a través de una licencia más abierta, cualquiera puede usar esta herramienta. Los investigadores dicen que podría ser útil para aquellos que empiezan con el aprendizaje profundo o bien para las compañías ya establecidas que procesan muchos datos en tiempo real. “Con CNTK ellos pueden incorporarse a los próximos parteaguas en la Inteligencia Artificial”, dijo Huang.

Referencias:

CNTK (GitHub) 
Blog (Microsoft)