Formato de impresión ¿Hacia una era digital oscura? 2015-02-28- Exclusivas-Reportajes MIGUEL NGEL CRIADO, El Pas En las pocas dcadas que la humanidad lleva inmersa en la era digital ha creado datos como para llenar la memoria de tantos iPad que, apilados, casi llegaran a la Luna. El ritmo de creacin de informacin es tal que, segn un estudio de la corporacin EMC y la consultora IDC, se dobla cada dos aos. Para antes de que acabe la dcada, habr 44 zettabytes de datos (un ZB es igual a un billn de gigabytes) y el montn de tabletas habr ido y vuelto al satlite ms de tres veces. Lo paradjico es que buena parte de esa informacin se perder para las generaciones futuras. El vicepresidente de Google y uno de los padres de internet, Vinton Cerf, alertaba en una conferencia de la Asociacin Estadounidense para el Avance de la Ciencia hace unos das del peligro de que lo creado por esta generacin no deje apenas rastro. En la creencia de su eternidad, el homo digitalis ya no imprimen fotos, las guarda en formato digital, no escribe cartas, sino que enva email, no almacena discos, sube las canciones a la nube. Una creciente parte de su vida se desarrolla en la red: juega en lnea, publica selfies en Facebook y comparte sus pasiones en tuits. Pero lo digital no es tan eterno. El deterioro de los soportes donde se almacena la informacin, la desaparicin de los programas para interpretarla o las limitaciones impuestas por el copyright harn que, para los humanos del futuro, sea inaccesible. De hecho, ni siquiera habr que esperar a que los arquelogos del futuro descubran que, como deca Cerf al Financial Times, los comienzos del siglo XXI son "un agujero negro de informacin". Los primeros efectos de lo que los anglosajones llaman era digital oscura ya se estn notando. El caso de los disquetes ejemplifica el problema planteado por el vicepresidente de Google en toda su complejidad. Fueron el sistema de almacenamiento bsico en los aos 80. En ellos caban tanto las fotos familiares como el trabajo hecho para la clase o los documentos del trabajo. La mayor parte de toda esa informacin ya se ha perdido. Y si an queda algn disquete, es cuando empiezan de verdad los problemas: Habr que encontrar una disquetera que lo lea, rezar para que los datos no se hayan corrompido por el paso del tiempo para que, probablemente, descubrir que el programa para abrir el archivo hace aos que no existe. "Conservo viejos disquetes de 3,5 pulgadas que alojan archivos de texto escritos con un programa que ya no existe y que funcionaba con un Macintosh de 1986", dice el consultor tecnolgico Terry Kuny. Este archivista digital canadiense fue el primero en hablar de este tiempo como una posible edad digital oscura hace ya casi 20 aos. "Qu opciones tengo de que yo, o cualquiera, pueda acceder a esos datos hoy? Incluso si consigo una vieja disquetera, conseguir el sistema operativo y los programas no sera nada fcil en la actualidad. Y si uno no est para decirle a quien lo intente qu hay en esos discos y en qu formato est, el problema ya sera enorme", aade. En 1997, cuando la actual era digital apenas comenzaba, cuando los ordenadores personales solo estaban al alcance los ms pudientes e internet era para una casta, cuando an no exista Google y muchos menos Facebook o Twitter, y Microsoft dominaba el mundo con su Windows 95, Kuny, entonces asesor de la Biblioteca Nacional de Canad dio una conferencia para la Federacin Internacional de Asociaciones de Bibliotecas. Su ttulo era premonitorio: Una era digital oscura? Retos para la conservacin de la informacin electrnica. La visin de Kuny, como la actual de Cerf, est ms vigente que nunca. "No creo que exista un riesgo de que la informacin de nuestro tiempo vaya a quedar inaccesible, creo que es una certeza. Ya est pasando, cada da, en todo tipo de organizacin, para todas las clases de datos", afirma Kuny. De hecho, cree que todo lo relacionado con la conservacin digital est yendo a peor. "Hay mucha ms informacin nacida digital que antes y apenas hay unas pocas instituciones pblicas o privadas que estn activamente implicadas en lidiar con este problema". Enemigos de la memoria digital El primer reto tiene que ver con la fsica. Cualquiera con una edad que haya intentado ver la cinta VHS con el vdeo de su boda sabe del deterioro de los soportes donde se almacenan los datos. La grabacin magntica de la informacin ha sido la dominante en las primeras dcadas de la era digital. An hoy, los discos duros guardan los datos jugando con la polaridad de las partculas y, por esas cosas del magnetismo, los datos acaban por perderse. Si le pas a la NASA, por qu no iba a pasar con el vdeo de la boda? La agencia espacial estadounidense vio como buena parte de las imgenes tomadas por las sondas de la Misin Viking enviadas a Marte en los aos 70 eran irrecuperables. Aunque la NASA transfiri los datos desde las cintas magnticas originales a soportes pticos, hasta el 20% del material no se pudo recuperar. El caso de las sondas Viking ilustra otro de los peligros de que este tiempo se convierta en una edad digital oscura. El 80% de la informacin enviada desde Marte se pudo salvar, pero se guard en un formato y con unos programas que ya no existen. Solo hace un par de aos, una empresa canadiense pudo volver a extraer las imgenes. Hay formatos que parecen que van a durar toda la vida y despus de ella. Es el caso de las imgenes guardadas en formato JPEG o la msica en mp3. Pero y si aparece un nuevo formato mejor y los anteriores caen en desuso? Y es que confiar la preservacin de los datos a la buena fe de las compaas que los crean tiene sus peligros. Como denunci el mes pasado la Fundacin Fronteras Electrnicas (EFF, por sus siglas en ingls) gigantes de los juegos como Electronic Arts cierran los servidores para jugar en lnea con sus ttulos en apenas un ao y medio si el juego no ha tenido el xito que esperaban. Solo en 2014, la industria abandon 65 juegos. Pero, al mismo tiempo, las leyes de copyright impiden que los jugadores mantengan sus propios servidores. Pero el mayor riesgo de que la informacin de este tiempo desaparezca en el futuro est en internet. Como muestra el estudio de IDC sobre el universo digital de 2014, la mayor parte de los datos son alojados en la red. Desde los millones de selfies hasta cada minuto de vdeo subido a YouTube, pasando por los comentarios en Facebook, cada vez ms, la mayor parte de la vida de una persona se encuentra en algn servidor de alguna empresa y no ya en su lbum familiar de fotografas. Se supone que ni Google ni Facebook van a cerrar maana. Incluso cuando cierran algn servicio, como hizo el buscador con Wave, dan un tiempo razonable para que sus usuarios se descarguen todo lo que all tenan. Google, por ejemplo, cuenta con Takeout, un sencillo sistema para hacer una copia de todos los datos creados y alojados en sus servicios. Pero no siempre es as. A comienzos de la dcada pasada, haba una red social mucho ms importante y conocida que Facebook. Se llamaba Friendster y en su mejor momento lleg a tener 100 millones de usuarios. Sin embargo, errores propios y la popularidad de otras alternativas, hicieron que Friendster se hundiera y, con ella, todas las historias, conversaciones, amores y momentos que compartieron sus usuarios. Hoy, la empresa languidece como plataforma de juegos en el sudeste asitico. "Tuvimos mucha suerte de que Internet Archive reaccionara a tiempo y capturara una copia de toda la informacin pblica en Friendster justo antes de que la desactivaran", comenta el experto en redes sociales de la de la Escuela Tcnica Federal de Zrich (ETH), el espaol David Garca. La relevancia que tienen las redes sociales en la vida de hoy, las ha convertido para los cientficos sociales en herramientas fundamentales para estudiar las sociedades humanas. Solo esa copia ha servido a Garca y otros investigadores estudiar fenmenos sociales que afectan a la privacidad, por ejemplo. Uno de esos investigadores sociales es Alan Mislove, de la Universidad Northeastern (EE UU). Mislove ha estudiado a fondo Twitter. En un artculo publicado el ao pasado, comprob que casi el 20% de los tuits publicados en esta red social se haban esfumado. "Es difcil proyectar que pasar con los tuits perdidos en el futuro", aclara. Para Mislove, "los datos de sitios como Twitter y Facebook ofrecen a los investigadores una capacidad sin precedentes para estudiar la sociedad a una escala y granularidad que simplemente eran imposibles antes". Luces contra la edad digital oscura Si existen tantos riesgos, qu se est haciendo para afrontarlos? Las soluciones son tanto tecnolgicas como organizativas y hasta legislativas. Lo ms urgente parece ser el problema de la longevidad de los datos, cmo conservarlos para los que vengan despus. Las tecnologas de almacenamiento no han variado mucho en todo este tiempo. O se graba la informacin en soportes magnticos o, con la ayuda del lser, en discos pticos. Aunque pudiera parecer que el DVD o el Blu-ray son las mejores alternativas, el futuro seguir siendo magntico. "La primavera pasada, IBM y FUJIFILM lograron una densidad de almacenamiento sobre cinta de 85,9 gigabytes por pulgada cuadrada lo que permitira una capacidad de 154 terabytes [un terabyte son 1,000 gigabytes] en un cartucho que cabe en la palma de la mano. Eso es el texto de 154 millones de libros", recuerda el responsable de tecnologas avanzadas de cinta de IBM Research, Mark Lantz. Quiz por eso de que IBM es la nica empresa tecnolgica con ms de un siglo de vida, saben de la importancia de la preservacin de los datos. Para Lantz, la cinta magntica no est muerta ni muchos menos. "En nuestro laboratorio de Zrich estamos trabajando sobre una tecnologa de cinta para la preservacin de los datos a largo plazo", asegura. Con el mantenimiento y conservacin adecuados, la grabacin en soportes magnticos mantiene la informacin intacta durante dcadas. Otra cuestin es la de poder reproducirlos con el paso del tiempo. Ese es el mayor temor que expres Vinton Cerf en su conferencia. Sin las herramientas adecuadas que den contexto a los datos, aunque se conservaran, estos seran ilegibles. Cerf mencion como solucin un proyecto en el que tambin participa IBM. El gigante informtico, junto a la universidad Carnegie Mellon tiene en marcha el proyecto Olive. Su objetivo es crear una especie de imgenes que incluyan todo, los datos del archivo, el programa con el que se cre y hasta el cdigo. Por medio de mquinas virtuales, el contenido se podra ejecutar en cualquier sistema que apareciera en el futuro. A iniciativas como esta ayudara lo que est pidiendo la EFF a las autoridades de EE UU: que en la legislacin sobre copyright se incluya una excepcin que obligue a las empresas que crearon un programa o un juego a liberar su cdigo cuando lo abandonen o, al menos, permitir su obtencin mediante ingeniera inversa. "Todos nosotros debemos convertirnos en nuestros propios bibliotecarios", dice el archivista digital Terry Kuny Pero el mayor reto es conservar toda la informacin acumulada en algo tan grande y dinmico como es la web. Internet Archive es el mayor intento que hay para conservar la memoria de la red. Los robots de esta organizacin rastrean peridicamente la web haciendo copias de las pginas que encuentra y las van guardando. As, si alguna pgina desaparece, siempre habr la posibilidad de recordar como fue. En Espaa, la Biblioteca Nacional ha venido haciendo lo mismo con la ayuda de Internet Archive desde hace aos. Pero el ao pasado fue el primero que, con su propio robot, empezaron a escanear la red espaola. Ya han copiado 140 terabytes entre recursos, pginas web, blogs... Sin embargo, La BNE est a la espera de la aprobacin de un reglamento sobre el depsito legal de publicaciones electrnicas que le permita conservar todo lo que la tecnologa permita de la internet en espaol. Pero evitar que esta sea una edad digital oscura es cosa de cada uno. "Todos nosotros debemos convertirnos en nuestros propios bibliotecarios. Cada uno deber ser el responsable de su vida digital. No podremos salvarlo todo y las cosas que decidamos salvar, deberemos hacerlo con cuidado", alerta Terry Kuny, el mismo que ya lo haca hace 20 aos, mucho antes que Vinton Cerf. Copyright ElPeriodicodeMexico.com