El archivo de la web

Posted on Actualizado enn

¿Se puede hablar de archivo de la Web? ¿Cuáles son las tendencias sobre ese tema? ¿Existen instituciones que archivan la Web? Existen numerosos repositorios digitales en funcionamiento destinados al archivo de Internet y ños más conocidos son también los que dieron los primeros pasos en 1996: el sueco Kulturarw3 y el australiano Pandora; o el repositorio de alcance internacional, Internet Archive. Ahora contamos con más de 50 proyectos en diversas fases de implementación.

Listado de versiones disponibles en Internet Archive desde 1996 de la página web del diario Clarín

Existen dos modelos básicos de políticas de colección que a su vez han generado modelo híbrido. El primero es el modelo integral o exhaustivo que busca la integración automática de la Web a partir de determinados criterios infraestructurales (según el dominio de las páginas web, según la ubicación del servidor informático, etc.). El segundo modelo es el selectivo que compila la Web en base a una política selectiva (un repertorio de recursos digitales correspondientes a las diversas áreas del conocimiento para un espacio geográfico concreto). Estos dos modelos han dejado paso a modelos híbridos, que complementan la captura periódica de un dominio geográfico completo, con acciones selectivas temáticas, ampliando esta cobertura a diversos acontecimientos de interés social o sucesos informativos que generan actividad intensa en las redes.

En la mayoría de los casos han sido impulsores de estos proyectos los organismos nacionales de bibliotecas y archivos, así como universidades, y entidades públicas y privadas.

¿Quién lo hace en la práctica?

Biblioteca Nacional de España (Desde 2009 realiza capturas periódicas del dominio .es a Internet Archive)

PADICAT – Patrimonio Digital de Cataluña (Desde el 2005 se dedica al archivo sistemático de la Internet catalana)

Arquivo da Web Portuguesa (Desde el 2000 lo viene trabajando la Fundação para a Computação Científica Nacional de Portugal)

IIPC – International Internet Preservation Consortium (su misión es compilar, preservar y dar acceso a la información y el conocimiento de Internet para futuras generaciones de todo el mundo, promoviendo el intercambio global y las relaciones internacionales)

Estudio de caso

Realizar una breve comparación de ambos repositorios Web (Pandora e Internet Archive) en base a la búsqueda realizada y la visualización de las páginas web consultadas

Recurso seleccionado

Review of Mental Health Act 1996 and Criminal Law (Mentally Impaired Defendants) Act 1996

En Pandora se realizó la siguiente búsqueda “health 1996” con la finalidad de encontrar algún archivo de esas fechas. El recurso se escogió aleatoriamente. A primera vista la búsqueda en Pandora es más sencilla de realizar que en Internet Archive debido al diseño simple del primer repositorio. Sin embargo en la presentación de resultados en Pandora difiere de la página principal lo que puede confundir a cualquier usuario, mientras que en Internet Archive si bien la pantalla de resultados es distinta a la página de inicio el cambio no es brusco.

En Pandora , al momento de hacer clic en el recurso requerido vuelve al mismo diseño de la pantalla de inicio en lugar de ir al recurso directamente, en el caso de Internet Archive al hacer clic sobre el recurso seleccionado si se dirige a él directamente.

Si bien se trató de recuperar el archivo en la misma fecha que fue archivado, no fue posible ya que fueron archivados en fechas distintas. Sin embargo en Internet Archive se presentaron más problemas como “Página no encontrada”

Conclusión

Ambos repositorios si bien son grandes iniciativas para archivar los contenidos de internet, aun no logran ser amigables para el usuario, por lo menos en este ejercicio, aunque cabe resaltar que Pandora a pesar del cambio de interfaz para búsqueda y recuperación fue mucho más rápido encontrar la página web seleccionada en buenas condiciones, es decir con sus imágenes respectivas, etc.

Ambos repositorios a nivel de interfaz no son muy amigables y por otro lado; y la aparición de páginas no encontradas, sobre todo en Internet Archive es un elemento que puede ser negativo para la experiencia del usuario.

Enlaces de interés


International Internet Preservation Consortium

Webs siempre accesibles: las bibliotecas nacionales y los depósitos digitales nacionales

Directrices para la preservación del patrimonio digital (UNESCO)

Documentos consultados

Ciro Llueca. Artículo 6.8. El archivo de la web [en línea]. En Cristòfol Rovira; Lluís Codina (dir.). Máster en Documentación Digital. Barcelona: Área de Ciencias de la Documentación. Departamento de Comunicación Audiovisual. Universidad Pompeu Fabra, 2009. http://www.documentaciondigital.org

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s