Activa las notificaciones para estar al tanto de lo más nuevo en tecnología.

Megastereo: imágenes panorámicas con profundidad

Las cámaras fotográficas toman imágenes en dos dimensiones. Algunas cámaras hacen algo similar en 3D, en donde el truco es usar dos lentes, grabando la...

disney-images
Las cámaras fotográficas toman imágenes en dos dimensiones. Algunas cámaras hacen algo similar en 3D, en donde el truco es usar dos lentes, grabando la misma imagen, separándola 6 grados (algo así como la distancia entre los ojos), para poder simular la tercera dimensión. Aparentemente la profundidad de una imagen 2D no puede discernirse, pues nos falta información. Sin embargo, Disney Research ha implementado una interesante técnica para adquirir información de profundidad en imágenes 2D lo cual es sin duda un avance notable.

Muchos hemos intentando crear fotos panorámicas. La técnica típica usando una cámara normal es tomar fotos de la imagen que queremos formar y después ir armando la imagen panorámica pegando los fragmentos y haciendo coincidir los límites. Hoy en día hay software para eso. La fotografía computacional tiene algunos algoritmos para hacer este proceso automáticamente, identificando las mismas características en cada foto y entonces, aplicando una transformación que debe tomarse en cuenta cuando se cambia el punto de vista. Para un panorama perfecto se necesita rotar la cámara alrededor de su centro óptico, es decir, rotar la cámara.

Sin embargo, si solamente se rota la cámara sobre sí misma, no se tiene el efecto del paralaje, lo cual hace que el pegar imágenes panorámicas sea más sencillo. Si se quiere información 3D de una secuencia de fotos, se necesita del paralaje. El problema más serio es que el paralaje hace más difícil armar un mosaico panorámico, y éste es precisamente el problema resuelto por los investigadores de Disney.

Los investigadores han generalizado sus métodos a un rango de posiciones de las cámaras, de manera que se pueden hacer diferentes tipos de panorama. Citando al artículo de investigación: “Como se demuestra en nuestros resultados, nuestra contribución resuelve el problema central en las técnicas existentes, tanto para imágenes monoscópicas o estéreo, así como para imágenes con múltiples perspectivas basándose en un método para unir dichas imágenes, como x-slit, pushbroom o cámaras lineales en general”.

El siguiente video muestra las ideas de este trabajo:

Los métodos completos se describen en el artículo técnico que se presentará en la Conferencia de la IEEE sobre Visión por Computadora y Reconocimiento de Patrones (CVPR), que se llevará a cabo los días 25 a 27 de junio, en Portland, Oregon. El algoritmo principal es complejo y requiere de múltiples pasos para llegar a un trabajo final correcto. Esencialmente, el trabajo extra tiene que ver con atender los detalles y usar otras técnicas, igual de sofisticadas, para corregir la distorsión y trabajar sobre la posición de la cámara en cada momento. El primer conjunto de pasos es corregir las imágenes cuando hay distorsión debido a los lentes. Después se hace un muestreo para añadir las partes necesarias para que éstas estén en el panorama final, Esto produce imágenes sin artefactos (ruido visual, pues), y entonces se pueden “coser” las imágenes monoscópicas o en estéreo.

“Hemos demostrado una solución para crear imágenes panorámicas de alta calidad con resolución de megapixeles. Al final hemos hecho dos contribuciones: primero, hemos desarrollado métodos específicos para corregir los datos de entrada. Hemos propuetso técnicas para corregir la orientación de la cámara, remover el paralaje vertical no deseado y así poder obtener una representación compacta. Segundo, hemos usado el flujo óptico para muestrear la resolución de entrada angular para así generar el número óptimo de rayos para la resolución de salida definida, resolviendo así el aliasing”, dicen los investigadores en su artículo.

Si desea más información, hay que leer el documento (ver referencias). probablemente hay muchas aplicaciones a estas nuevas técnicas, pero aún están lejos del poder de cómputo de los teléfonos inteligentes. La fotografía computacional, creemos, apenas está comenzando.

Referencias:

Megastereo: Constructing High-Resolution Stereo Panoramas

Comentarios