Los archivos digitales tienen muchas virtudes: ocupan cero espacio físico (aunque en el mundo virtual pueden ser de muchos megabytes), se mantienen fiel a los originales y en algún momento el acceso a estos contenidos solamente depende de quien los pone accesibles.

Y esto es precisamente el interesante esfuerzo de Archive.org.

El Archivo de Internet, es una sociedad sin fines de lucro que pretende construir una biblioteca digital de los sitios de la red así como de otros tipos de contenidos en forma digital.

El sistema da acceso a investigadores, historiadores, profesionales y aficionados y en general, a todas las personas que puedan acceder a Internet. La misión de Archive.org es finalmente dar acceso universal a todo el conocimiento.

De acuerdo al propio sitio, iniciaron actividades en 1996, archivando al mismísimo Internet, un medio que inevitablemente crecería. Y a diferencia de los medios físicos, por ejemplo, los periódicos, lo que se publica en la red tiende a ser efímero y desaparecer con el tiempo.

Si nadie se preocupa de guardar estos contenidos, evidentemente se perderán. Hoy, a unos 24 años de esta iniciativa, que funciona gracias a la Wayback Machine, se tienen más de 625 bibliotecas de datos.

¿Qué contiene Archive.org?

El archivo web crece constantemente, y aunque los contenidos digitales no requieren espacio físico, si necesitan espacio en los discos duros y otros medios de almacenamiento. Y esto, desde luego, tiende a crecer. Hoy por hoy Archive.org contiene:

  • 330 mil millones de páginas web
  • 20 millones de libros y textos
  • 4.5 millones de grabaciones de audio (incluyendo 180 mil conciertos en vivo)
  • 4 millones de videos (incluyendo 1.6 millones de programas de noticias)
  • 3 millones de imágenes
  • 200 mil programas de computadora

Más aún, cualquiera puede hacerse de una cuenta gratuita para subir contenidos a este gigantesco archivo de Internet. Archive.org trabaja con muchos socios que guardan copias de los contenidos en colecciones especiales.

Libros, videos y más

Archive.org es una biblioteca de contenidos y los libros son muy importantes para ellos. Es claro que el acceso a los libros no es tan masivo como mucha gente quisiera, por lo que se busca que en este sitio se tenga acceso a los libros en formato digital.

Archive.org empezó a digitalizar los libros hace unos 15 años (2005) y hoy escanea unos 1000 libros por día en 28 diferentes lugares en el mundo. Los libros de antes de 1924 están accesibles para descargar y cientos de miles de libros modernos pueden leerse en la «biblioteca abierta«.

También el sitio busca conservar lo efímero de medios como la televisión. Se empezaron a archivar programas de televisión desde el año 2000. En el 2009 decidieron grabar los programas de noticias estadounidenses. Es claro que la intención es que la información además, tenga el contexto adecuado para poderla entender mejor.

Algunas estadísticas notables

Archive.org sirve a millones de personas cada día y es uno de los 300 sitios web más consultados en el mundo. Todo Archive.org ocupa hoy día unos 45 petabytes, en donde se guardan al menos dos copias de cada artículo digital.

El sitio funciona gracias a donativos y al los servicios de digitalización de libros que hacen para los socios del sitio mismo. El sistema respeta, además, la privacidad de las personas y usa los protocolos de seguridad reconocidos.

Estos son algunos de los socios que generosamente aportan recursos a este esfuerzo:

  • Andrew W. Mellon Foundation
  • Council on Library and Information Resources
  • Democracy Fund
  • Federal Communications Commission Universal Service Program for Schools and Libraries (E-Rate)
  • Institute of Museum and Library Services (IMLS)
  • Knight Foundation
  • Laura and John Arnold Foundation
  • National Endowment for the Humanities, Office of Digital Humanities
  • National Science Foundation
  • The Peter and Carmen Lucia Buck Foundation
  • The Philadelphia Foundation
  • Rita Allen Foundation

Cabe señalar que por día, Archive.org recibe entre 3.6 y 4.8 millones de visitas de direcciones únicas. La biblioteca abierta recibe entre medio millón y 600 mil solicitudes de lecturas o descargas por día (de direcciones IP únicas y diferentes).

Para quienes hacen cómputo, podrán hallar un número gigantesco de software del pasado, por ejemplo, los compiladores populares como Turbo Pascal (hasta la versión 5.5), o bien, un sinfín de discos compactos con código en el lenguaje que deseé.

Hay colecciones completas que en su momento costaban sus buenas cantidades de dólares y que ahora cualquiera puede consultar y tener. Y ojo, el software antiguo no necesariamente está sobrepasado. Muchísimos programas se han fundamentado en precisamente el trabajo de los pioneros. Por eso, simplemente, vale la pena.

Archive.org es sin duda uno de los sitios que dan perspectiva a los avances en el planeta.