Activa las notificaciones para estar al tanto de lo más nuevo en tecnología.

tell-me-dave-00

La síntesis y reconocimiento de voz es algo que desde hace muchos años ha sido estudiado y los sistemas actuales, por ejemplo, SAPI de Microsoft, hacen muy bien esta tarea. Sin embargo, en muchas ocasiones estos comandos hablados deben darse de forma precisa y en más de una ocasión, previo entrenamiento de la voz para que la máquina entienda a quien emite la orden.

Por supuesto que un problema más complejo aún es que el reconocimiento de comandos de voz tenga sentido para la máquina. Por ejemplo, si le digo a la máquina (o a un robot): “dame agua”, es claro que la orden es fácil de entender para cualquier ser humano, pues entiende que estamos pidiendo un vaso con agua, pero para el robot no está claro qué le están pidiendo. ¿Dame agua? ¿Cómo? En los seres humanos, llenamos estas lagunas porque tenemos un conocimiento del mundo exterior y por ende, podemos comprender la orden.

Ahora un equipo de la Universidad de Cornell está haciendo que un robot responda correctamente a los comandos en inglés y cualquiera puede ayudar en esta tarea usando un simulador para dar órdenes a un robot. El proyecto se llama “Tell Me Dave” (“Dime, David”) y de alguna manera nos recuerda a HAL en 2001 Odisea del Espacio.

Por ejemplo, vean en acción al robot PR2 servir un poco de helado, dada la orden: “Pon un poco de café en una taza. Añade helado de tu elección. Añade jarabe de frambuesa a la mezcla”.

Estas órdenes son bastante ambigüas pues no se especifica qué tipo de helado es el que se debe elegir. No se especifican los detalles del tipo de taza a usar o si debe hacerse primero el café y cómo.

El video es bastante impresionante, pero cabe decir que el letrero x35 en el video muestra 35 veces más rápida la acción que como la ejecuta el robot, es decir, es lentísimo. Probablemente para cuando terminó las acciones encomendadas el helado ya se habría derretido. Por supuesto que estos trabajos de investigación son así. Muestran lo que hay que hacer pero en el interín hay que resolver cualquier cantidad de problemas. Por ejemplo, cómo hacer para que el robot vea los objetos y forme en un programa un plan de acción de cómo ejecutar las órdenes.

En el siguiente video, veamos cómo el robot prepara té:

De nuevo, nótese que el video está acelerado porque realiza las órdenes muy lentamente en tiempo real.

Hay que reconocer que el trabajo que se busca hacer a través de las órdenes al robot es colosal en términos de cómputo, porque el programa que controla el robot, amén de entender las órdenes pedidas, tiene que generar un plan para realizar las diferentes órdenes en una secuencia adecuada. El problema es complicado y por eso probablemente, el robot tarda tanto en ejecutar las órdenes. Como sea, es claro que es un proyecto por demás importante en lo que se refiere a Inteligencia Artificial.

Referencias:

Tell Me Dave (sitio web)
i-programmer

Desde la Red…
Comentarios