Cómputo cineasta: este modelo computarizado transforma guiones de películas en animaciones

Los científicos han hecho una serie de avances notables en muchos campos gracias a la computación. Ahora se han interesado en generar poses físicas para crear animaciones realistas.

Estas capacidades podrían ligar mundos apartes, porque es claro que hay un enlace directo entre el lenguaje que describe una acción y la animación física que bien podría lograrse.

Louis-Philippe Morency, profesor asociado del Instituto de Tecnologías del Lenguaje (LTI), junto con Chaitanya Ahuja, un estudiante de doctorado de LTI, están trabajando para llevar este enlace entre los dos modelos, usando una arquitectura neuronal que han llamado Joint Language-to-Pose, o JL2P.

Este modelo permite que las oraciones y los movimientos físicos se enlacen, de manera que se pueda entender cómo el lenguaje se relaciona con la acción, los gestos y los movimientos.

«Pienso que estamos en una etapa temprana de esta investigación, pero desde el modelado, con la inteligencia artificial y la teoría de la perspectiva, estamos en un momento muy emocionante», comenta Morency.
«Por ahora, hablamos de animar caracters virtuales. Eventualmente, este enlace entre lenguaje y gestos podría aplicarse a robots; podríamos ser capaces de decirle a los robots personales lo que queremos hacer», afirma el investigador. «Eventualmente podría ser de otra manera: usar este enlace entre lenguaje y animación de manera que la computadora pudiese decirnos lo que está pasando en un video», añade.

Para crear JL2P, Ahuja usó un enfoque de aprendizaje curricular, que se enfoca en que el modelo primero aprende secuencias sencillas y cortas: «Una persona camina hacia adelante», por ejemplo, para más tarde poder entender «Una persona camina hacia adelante y entonces se da vuelta y regresa de nuevo a dar los pasos ya dados» o bien, «una persona brinca sobre un obstáculo mientras corre».

«Verbos y adverbios describen las acciones, la velocidad o aceleración de la acción, mientras que los nombres y adjetivos describen posiciones y direcciones. La meta última es animar secuencias complejas, con acciones múltiples que ocurren ya sea simultáneamente o en secuencia», describe Ahuja. Por ahora las animaciones son muy burdas y simples.

«La sincronización entre partes del cuerpo es muy importante», dice Morency.
«Cada vez que usted mueve sus piernas, también se mueven sus brazos, su torso y posiblemente su cabeza. La animación del cuerpo necesita coordinar estos componentes diferentes, mientras que al mismo tiempo se logren otras acciones complejas».

Y agregan los científicos:

«Llevar el lenguaje narrativo con una animación compleja es retador y emocionante. Esto es un camino para entender el habla y los gestos», concluyen.