Preservación y conservación del patrimonio digital

Posted on Actualizado enn

En archivística se identifican dos fases en la vida de un documento: una fase activa, durante la cual se debe conservar la integridad de los documentos a lo largo de todas sus utilizaciones, y una fase inactiva, en la que se debe conservar la integridad de los documentos desde su última utilización hasta el momento que la Ley especifique a través de los calendarios de conservación. En el caso de los documentos con valor histórico, esto implica que se deben conservar de forma permanente pero ¿qué pasa con los documentos digitales cuando pasan a la segunda fase?

Por un lado, los soportes propios de los documentos digitales tienen una duración realmente limitada en el tiempo, por ejemplo los soportes magnéticos apenas superan los 10 años de duración fiable, en correctas condiciones de conservación; o los soportes ópticos con una duración estimada superior a los 75 años, que puede reducirse drásticamente en entornos de conservación inadecuados. Pero aun así este no es un problema grave…se tratan de conservación física de los soportes que puede ser solucionado con el recopiado periódico a fin de garantizar su conservación física (refreshing).

El problema más grave es la conservación de la legibilidad de los documentos. Los documentos digitales tienen una gran dependencia del cambiante entorno tecnológico (hardware, software). La obsolescencia tecnológica de los sistemas es más rápida que la degradación física.

Ante este problema, la tendencia es hacia la preservación de los documentos pero cada vez más autosuficientes, independientes de un software concreto, que podrán ser modificados y visualizados por distintos programas a lo largo de su ciclo de vida. La Victorian Electronic Records Strategy (Australia) marcó en su momento la pauta característica de los documentos de conservación a largo plazo.

En este sentido, los metadatos son un elemento esencial para la preservación digital. Mediante los metadatos se puede recoger el contexto completo de creación y de utilización de los documentos informáticos, y esto incluye:

El contexto documental: metadatos descriptivos para la identificación de cada unidad documental, orientados básicamente a su recuperación y uso.

El contexto de utilización: metadatos administrativos o de negocio, generados por el uso y vida del documento, tanto durante su etapa de formación como durante la ejecución de su ciclo de vida.

Principales modelos de metadatos que se están utilizando para la descripción de documentos electrónicos de archivo, y que se incluyen en la categoria de metadatos descriptivos y/o administrativos son:

Estrategias de preservación

Soluciones basadas en la migración:

  • Cambio de medio (reformatting o refreshing). Esta estrategia pretende subsanar la obsolescencia física, y consiste en un recopiado periódico de los documentos digitales a soportes más estables.
  • Compatibilidad retroactiva (backward compatibility). Los programas comerciales permiten a menudo leer documentos creados con versiones anteriores de una misma familia de programas, así como su migración a la versión actual. La compatibilidad retroactiva, sin embargo, está sujeta a los cambios en la estrategia comercial de la empresa productora del software .
  • Interoperabilidad . Programas de distintas empresas pueden compartir los mismos formatos de documento digital.
  • Conversión a formatos estándar . Podemos considerar esta opción una versión extendida de la interoperabilidad, que reduce el coste de la migración contínua. La existencia de formatos estándar es la principal garantía de la conservación de la funcionalidad de los documentos digitales. Sin embargo, los formatos estándar válidos como formato final para la conservación permanente, no siempre pueden ser un formato de trabajo. Esta estrategia, por lo tanto, debe contemplar la utilización de un formato seguro (fiable y auténtico) durante la utilización del documento, cuando tiene valores primarios, e incluir la posibilidad, cuando se quiera disponer el documento para su conservación a largo plazo, de congelar sus valores primarios en un formato estándar.

Sin embargo, las soluciones basadas en la migración no responden a las necesidades de los documentos compuestos, distribuidos y dinámicos, por una serie de razones:

En primer lugar, migrar es una tarea cara, laboriosa y lenta, y requiere numerosos recursos materiales y humanos. Existen básicamente dos tipos de migraciones: la migración periódica relacionada con la duración física de los soportes (reformatting o refreshing), y la migración de un sistema o programa obsoleto a otro manteniendo el aspecto y el contexto (migration). En toda migración se pierden datos, tanto por errores en la grabación como por incompatibilidades entre formatos. Es necesario conseguir un porcentaje aceptable de pérdida de datos, e indicarlo en los documentos migrados. Esta pérdida de datos es especialmente grave en los documentos cifrados, los cuales con una mínima pérdida ya pueden resultar ilegibles.

Un tipo particular de pérdida de datos es el relacionado con la pérdida de funcionalidades o con cambios sustanciales en la apariencia del documento. En este caso es importante tener presente la conceptualización proporcionada por el proyecto PREMIS; el objetivo de la preservación es conservar entidades intelectuales, aunque por motivos de obsolescencia determinadas representaciones de dichas entidades deberán ser substituidas por nuevas representaciones.

Hay que añadir que el curso de la tecnología y su ritmo de obsolescencia son imprevisibles , por lo que cada nueva migración presenta una problemática distinta.

Emulación

El objetivo de este método es conservar la funcionalidad que tienen los documentos cuando son reproducidos por el software original. Esta emulación se puede limitar a conservar la presentación visual de los documentos mediante visores ( viewers ) o bien conservando la imagen electrónica del documento, con formatos como PDF estàndar o PDF/A (ISO 19005). Pero se puede avanzar hacia una opción más completa, intentando conservar una versión reducida del software operacional y los sistemas originales, o bien desarrollando un emulador que reproduzca el funcionamiento de los sistemas originales. Esta opción garantiza la autenticidad de los documentos conservados y la fidelidad de la reproducción, pero al mismo tiempo presenta un importante inconveniente: tanto la versión reducida del software original como el emulador también están sujetos a una progresiva obsolescencia, y su mantenimiento y actualización pueden ser muy difíciles.

Aparte del método concreto que se utilice, existen unas recomendaciones generales para facilitar la conservación de los documentos electrónicos dentro de un archivo digital. Estas son:

  • Utilizar preferentemente los formatos de fichero de uso más extendido, aunque sean formatos propietarios. La solución más recomendable actualmente para los documentos electrónicos administrativos, básicamente textuales, és utilizar PDF/A (ISO 19005. Electronic document file format for long-term preservation – Part 1: Use of PDF 1.4), una versión estàndar del formato PDF especialmente desarrollada para el archivo a largo plazo. Otras opciones a considerar son los formatos ODF (ISO/IEC 26300:2006. Open Document Format for Office Applications v1.0), y también Office Open XML (ISO/IEC DIS 29500. Office Open XML file formats). En documentos en los que no sea necesario conservar la apariencia original,es recomendable la migración a formatos de texto plano o delimitado. Un recurso muy interesante para el asesoramiento sobre los formatos óptimos de preservación para cada tipo de documento se puede encontrar en la Library of Congress (NDIIPP).
  • Cuando no sea posible conservar en el mismo archivo digital los sistemas de claves asociados a los ficheros cifrados, eliminar cualquier tipo de sistema de autentificación y de protección de la confidencialidad (contraseñas, cifrados de firma electrónica o marcas de agua) antes de transferir los documentos al archivo digital.
  • Evitar en lo posible la utilización de estrategias de compresión, y cuando sea necesario utilizar formatos de compresión estándar. No utilizar formatos de compresión que impliquen una pérdida notable de información, sea en texto o en imagen, pues en el futuro podría ser necesario recuperar esa información.
  • Garantizar la trazabilidad de todas las modificaciones que se realicen sobre cada documento. Es necesario que todas las funciones de registro del sistema esten centralizadas para garantizar el control documental.
  • En el momento de crear un documento, y durante cada utilización, recoger el máximo posible de metadatos, especialmente tecnológicos o de preservación. Esta es la clave para preservar el contexto y mantener la unidad del fondo documental digital.

Estudio de caso

Buscar un proceso o trámite que se realice de forma exclusivamente telemática, cuyo desarrollo se conozca con un cierto detalle, y enumerar los documentos electrónicos que produce. Es importante tener presente no únicamente los documentos formalizados, sinó todo tipo de documentos, incluyendo aquellos que únicamente contienen datos estructurados (p.e. mensajería o entradas en bases de datos). Una vez enumerados, valorar el resultado y la posibilidad de preservar todos estos elementos en un archivo digital.

Nombre del procedimiento o trámite:
Alta en base de datos de Empresas (Ayuntamiento de Valdemoro)

Breve descripción del procedimiento o trámite:
Inclusión de datos en la base de datos de Empresas del Ayuntamiento de Valdemoro

Valoración de las posibilidades/dificultades de la conservación:
El trámite seleccionado “Alta en base de datos de Empresas” del Ayuntamiento de Valdemoro ubicado en el siguiente enlace: http://www.valdemoro.es/contenidos/cpcontent.asp?contentid=7728&nodeid=4953 puede darse en forma online, presencial o por teléfono. El Portal de empresas es el sitio que alberga este trámite y los formularios han sido construidos en RDF. Intentando valorar las posibilidades y dificultades de conservación se puede mencionar que los formularios al ser construidos en RDF posiblemente el ingreso de datos ya este anticipando una conservación específicamente resguardando la interoperabilidad de los datos. Aparentemente todos los elementos de este trámite son parte de un archivo digital.

A nivel de posibilidades de conservación:

  • Conservar los formularios como datos estructurados el archivo a largo plazo.
  • Los formularios pueden emplear formatos de compresión estándar ya que no contienen imágenes y así ahorrar espacio.
  • Este tipo de trámite es parte de un conjunto de trámites del Ayuntamiento por lo que es necesario que todas las funciones de registro del sistema estén centralizadas para garantizar el control documental.
  • Si bien todos los datos recogidos serán incorporados en ficheros automatizados es recomendable revisar la utilización al máximo posible de metadatos, especialmente tecnológicos o de preservación.

Enlaces de interés

Digital preservation
Directrices para la creación de un programa de preservación digital

Documentos consultados

Jordi Serra Serra. Artículo 6.3. Preservación y conservación del patrimonio digital [en línea]. En Cristòfol Rovira; Lluís Codina (dir.). Máster en Documentación Digital. Barcelona: Área de Ciencias de la Documentación. Departamento de Comunicación Audiovisual. Universidad Pompeu Fabra, 2009. http://www.documentaciondigital.org

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s