Bastante, según los expertos. Por un lado, lo que pensamos que es permanente no lo es. Los sistemas de almacenamiento digital pueden volverse ilegibles en tan solo tres a cinco años. Los bibliotecarios y archivistas compiten para copiar cosas en formatos más nuevos. Pero la entropía siempre está ahí, esperando entre bastidores. “Nuestras profesiones y personas a menudo intentan extender la vida normal tanto como sea posible a través de una variedad de técnicas, pero continúa frenando la marea”, dice Joseph Janes, profesor asociado de la Escuela de Información de la Universidad de Washington.
Para complicar las cosas, los archivistas ahora se enfrentan a una avalancha de información sin precedentes. En el pasado, los materiales eran escasos y el espacio de almacenamiento limitado. “Ahora tenemos el problema opuesto”, dice Janes. “Todo está grabado todo el tiempo”.
En principio, esto podría corregir un error histórico. Durante siglos, innumerables personas no han tenido la cultura, el género o la clase socioeconómica adecuada para descubrir, mejorar o preservar su conocimiento o trabajo. Pero la enorme escala del mundo digital ahora presenta un desafío único. Según una estimación de la firma de investigación de mercado IDC del año pasado, la cantidad de datos que las empresas, los gobiernos y las personas crearán en los próximos años será el doble del total de todos los datos digitales generados anteriormente desde el comienzo de la era de la información.
Escuelas enteras dentro de algunas universidades están trabajando para encontrar mejores enfoques para guardar datos bajo su paraguas. El Centro de Datos y Servicios para Humanidades de la Universidad de Basilea, por ejemplo, ha desarrollado una plataforma de software llamada Knora no solo para almacenar los muchos tipos de datos de trabajo humanístico, sino también para garantizar que las personas en el futuro puedan leerlos y usarlos. Sin embargo, el proceso es tenso.
“No podemos salvarlo todo… pero esa no es razón para no hacer lo que podamos”.
andrea ogier
“Haces conjeturas y esperas lo mejor, pero hay conjuntos de datos que se pierden porque nadie sabía que serían útiles”, dice Andrea Ogier, subdirectora y directora de servicios de datos en las bibliotecas universitarias de Virginia Tech.
Nunca hay suficientes personas o dinero para hacer todo el trabajo y los formatos cambian y se multiplican constantemente. “¿Cómo asignar mejor los recursos para preservar las cosas? Porque los presupuestos son tan grandes”, dice Janes. “En algunos casos, esto significa que las cosas se guardan o archivan, pero permanecen allí, no se catalogan ni se procesan, y por lo tanto es casi imposible encontrarlas o acceder a ellas”. En algunos casos, los archivistas finalmente rechazan nuevas colecciones.
Los formatos utilizados para almacenar los datos son en sí mismos temporales. La NASA ha escondido alrededor de 170 cintas de datos sobre el polvo lunar recolectado durante la era Apolo. Cuando los investigadores decidieron usar las cintas a mediados de la década de 2000, no pudieron encontrar a nadie con la máquina IBM 729 Mark 5 de la década de 1960 necesaria para leerlas. Con ayuda, el equipo finalmente localizó uno en condiciones difíciles en el almacén del Museo Australiano de la Computación. Los voluntarios ayudaron a restaurar el coche.
El software también tiene una vida útil. Ogier recuerda haber intentado examinar una antigua hoja de cálculo de Quattro Pro solo para descubrir que no había ningún software disponible que pudiera leerla.