Activa las notificaciones para estar al tanto de lo más nuevo en tecnología.

Google permitirá buscar en archivos PDF

No hay duda que Google no descansa en su afán de estar en todos lados y en todas las aplicaciones. Ahora ha anunciado la posibilidad...

No hay duda que Google no descansa en su afán de estar en todos lados y en todas las aplicaciones. Ahora ha anunciado la posibilidad de hacer búsquedas en archivos PDF en la web, usando tecnología de reconocimiento óptico de caracteres (OCR). Google ha dicho que la tecnología OCR no sólo será usada para indizar y buscar en archivos PDF sino que también podrá ser utilizada en las búsquedas de Google Books.

Actualmente Google no incluye en los resultados de sus búsquedas documentos escaneados, porque no hay forma de determinar la naturaleza del contenido de los mismos, pero esto, a decir de la empresa buscadora, va a cambiar. El gigante de las búsquedas dice que está usando tecnología para convertir documentos escaneados en archivos de texto equivalentes, los cuales pueden ser indizados, para responder a búsquedas de los usuarios.

Evin Levey, gerente de producto de Google, ha dicho: “es un paso pequeño, pero importante, en nuestra misión de hacer que toda la información del mundo esté accesible y sea útil“.

La aplicación de la tecnología OCR hacia la web, se espera que ayude también a las búsquedas en Google Book, el controvertido proyecto para escanear libros que Google dio a conocer en la feria del libro de Frankfurt en el 2004. desde entonces, Google ha escaneado una colección de libros, de las bibliotecas más importantes, a razón de 3000 libros por día.

Y aunque el proyecto inicialmente sacó a relucir la problemática de los derechos de autor, Google finalmente ha llegado a un acuerdo con la Asociación de Editores de Norteamérica bajo el cual Google será capaz de expandir el acceso de millones de libros con derechos de autor (aunque en este sentido actualmente no se pueden consultar los libros completos, sólo una porción debido a la restricción de los derechos de autor). Este acuerdo resuelve los problemas legales para que Google pueda seguir su plan de digitalizar, buscar y mostrar no solamente fragmentos de los libros con copyright.

David Drummond, consultor legal de Google indicó que el acuerdo es realmente extraordinario, porque le dará a los lectores en línea, dijo: “acceso a millones de libros con derechos de autor por vez primera. Segundo, creará un nuevo mercado para autores y editores para vender sus trabajos y tercero“, sigue Drummond, “posibilitará que se preserven colecciones valiosas, además de hacerlas accesibles a estudiantes e investigadores“.

Por lo visto Google no se cansa de buscar nuevas maneras de hacer cómputo y de incidir en la vida de los internautas.

Comentarios