Los premios a la investigación de Microsoft y el código abierto

Microsoft ha entregado los premios al reto en investigación de código abierto y al mismo tiempo se le ha reconocido a la empresa -con el TCSE Distinguished Synergy Award– por parte del consejo de la IEEE, en reconocimiento a la colaboración con la academia y su compromiso con el software de código abierto.

Microsoft Research tiene ya una historia que 25 años. Nació en 1991 cuando Microsoft, una de las primeras compañías de software creó su propia organización científica para la investigación y desarrollo. Hoy Microsoft Research tiene más de 1000 científicos e ingenieros que trabajan en una amplia variedad de áreas y que colaboran de manera abierta con académicos líderes, gobiernos e investigación industrial para avanzar en “en el estado del arte” en computación y así resolver algunos de los problemas más complejos a través de la innovación tecnológica. Microsoft Research tiene ingenieros en sus laboratorios de Redmond, Washington, Cambridge, Reino Unido, India y Asia.

El premio 2016 dado a Microsoft Research reconoce la manera en como se perciben como una organización abierta de investigación que permite y que incita a sus investigadores a trabajar en colaboración con la academia. Igualmente se le menciona por su compromiso con el software de código abierto.

Michael Ernst, ahora profesor de Ciencias de la Computación e Ingeniería en la Universidad de Washington y ex-investigador en Microsoft Research, hizo este comentario sobre la extensión y el valor del software de código abierto. “Microsoft Research ha hecho docenas de herramientas que ha puesto a disposición de los investigadores que las han usado con mucho interés para evitar tener que reinventar la rueda. Algunas de estas herramientas representan cientos de años-hombre de trabajo. El compartir estas herramientas hace más fácil el reproducir resultados y hacer comparaciones directas -sin lo cual el rigor de la ciencia es imposible. Además, los grandes conjuntos de datos de Microsoft son invaluables. No hay otra fuente dee datos sobre desarrollo de software a esa escala, la cual se haya hecho por practicantes en un tema. Se ha revolucionado nuestro pensamiento así acerca de los estudios empíricos”. en la Universidad de Washington y exinvestigador en Microsoft Research, hizo este comentario sobre la extensión y el valor del software de código abierto. “Microsoft Research ha hecho docenas de herramientas que ha puesto a disposición de los investigadores que las han usado con mucho interés para evitar tener que reinventar la rueda. Algunas de estas herramientas representan cientos de años-hombre de trabajo. El compartir estas herramientas hace más fácil el reproducir resultados y hacer comparaciones directas -sin lo cual el rigor de la ciencia es imposible. Además, los grandes conjuntos de datos de Microsoft son invaluables. No hay otra fuente de datos sobre desarrollo de software a esa escala, la cual se haya hecho por practicantes en un tema. Se ha revolucionado nuestro pensamiento así acerca de los estudios empíricos”.

Es claro que no mucha gente conoce lo que se hace en Microsoft Research y por ello se está buscando promover el trabajo que se realiza en estos centros. Para incrementar la visibilidad se ha hecho el reto de código abierto en Microsoft, cuyas idea era promover a Microsoft Research y sus herramientas de código abierto. Como indica Judith Bishop, Directora de Ciencias de la Computación en Microsoft Research: “Póngase código fuente y datos en manos de estudiantes. Deles libertad de acción, un par de reglas y un pequeño incentivo y entonces, observen cómo construyen con estas herramientas sus ideas”.

En este último reto participaron más de 650 estudiantes de todo el mundo. Akond Rahman, por ejemplo, estudiante de doctorado en ciencias de la computación en la Universidad Estatal de Carolina del Norte, estaba entre los que no sabían de estos recursos a su disposición a través del portal Microsoft Research Open Source Portal, hasta que se enteró del reto convocado por la empresa. La entrada ganadora “Quantifying Semantic Similarity of Software Projects Using Deep Semantic Similarity Model”, fue un proyecto que se mantenía sin avances por la falta de herramientas de aprendizaje de máquinas. Como el propio Rahman puso en el blog: “Un pequeño equipo de ingenieros que trabajan en corporaciones (e instituciones) grandes, están teniendo que empezar desde cero constantemente, pues no llegan a tener acceso a depósitos útiles de software. Si yo pudiese tener acceso a herramientas como redes neuronales de aprendizaje como DSSM para hacer búsquedas semánticas y acomodar los elementos como se debe, los equipos podrían ser capaces de encontrar y reusar el código que otros equipos ya han creado”.

En el reto hubo tres segundos lugares: Varun Agrawal (Georgia Tech), por “OneGroup—Automated Photo Sharing via Facial Recognition”, que usa los servicios cognitivos de Microsoft (conocidos como Proyecto Oxford), para crear una característica para compartir fotos de forma automática que se integran con Microsoft OneDrive y con el API de contactos de Outlook. Optimiza los flujos para compartir de forma que los clientes puedan responder a la pregunta: “¿Cómo compartimos más fácilmente?”.

Saeid Tizpaz Niari (University de Colorado-Boulder), por “CONfidentiality CERTifier, a Modeling and Verification Framework for Program Confidentiality”, que extrae abstracciones transductoras no determinísticas de los programas y usan técnicas para su análisis. Una herramienta prototipo se construyó alrededor de un demostrador automático de teoremas llamado Z3.

Yida Wang (Beijing University of Posts and Telecommunications) por “CNTK on Mac: 2D Object Restoration and Recognition Based on 3D Model”, la cual sintetiza y “renderea” imágenes 2D con o sin fondo, usando la Computational Network Toolkit (CNTK) para entrenar un modelo de segmentación y restauración de la imagen de frente. El código fuente de CNTK’s (que es abierto), se cambió para soportar CNTK en Mac para el reconocimiento de objetos en 3D o en fotos normales.

Como concluye Judith Bishop: “El código abierto es más que un mecanismo para liberar código, es una manera de construir comunidades de usuarios que también son desarrolladores y que les interesa la dirección y la calidad de sus productos, ya sean grandes o pequeños. Con este enfoque que da cierta frescura, los estudiantes pueden jugar de manera importante, creando estas comunidades y siendo ayudados directamente con los productos de Microsoft.

Referencias:

Microsoft Open Source Challenge
Microsoft Research Open Source Portal
i-programmer