Proyecto “e-Spacio UNED” Repositorio Institucional de la UNED Memoria descriptiva Biblioteca de la UNED 1 ÍNDICE 1. 2. 3. 4. 5. 6. 7. Introducción Qué es un repositorio digital institucional Los contenidos digitales de la UNED “E-Spacio”: el repositorio digital de la UNED Como funciona El repositorio digital y el acceso abierto a la información científica Beneficios para la comunidad universitaria 2 1. INTRODUCCIÓN En abril de 2005, la Biblioteca Central de la UNED presentó al Vicerrector de Investigación una propuesta para la creación de un repositorio digital institucional que recogiera y permitiera el acceso libre a través de Internet a las tesis doctorales de la UNED. La propuesta fue aprobada en Consejo de Gobierno, el día 29 de junio de 2005 Desde entonces, la biblioteca ha mantenido una serie de contactos cuyo resultado ha sido constatar el interés y la necesidad de ampliar el alcance del proyecto inicial más allá de las tesis doctorales. La presente memoria describe el nuevo alcance del proyecto, ahora concebido como una herramienta y un espacio común – eSpacioUNED- en el que recoger, organizar, gestionar, dar acceso, difundir y asegurar la permanencia en el tiempo no sólo de las tesis doctorales, sino de todos aquellos contenidos digitales que constituyen nuestro patrimonio intelectual único. En este momento, la plataforma tecnológica está ya operativa. El proceso de incorporación de las tesis doctorales está en marcha y la biblioteca trabaja con el Departamento de Lenguajes Informáticos y Sistemas para la incorporación al sistema de las publicaciones del Departamento. El repositorio forma parte del Proyecto Madroño e-Ciencia de la Comunidad de Madrid, en el que participan todas las Universidades del Consorcio Madroño y cuyo objetivo es crear una red de repositorios de Universidades de la Comunidad de Madrid y un portal de acceso común a sus contenidos. El repositorio de la UNED, como parte de este proyecto, está financiado en parte por la Comunidad. 2. QUÉ ES UN REPOSITORIO DIGITAL INSTITUCIONAL Un repositorio digital institucional es un conjunto de servicios que la universidad ofrece a los miembros de su comunidad para la gestión, la preservación, el acceso y la difusión a través de Internet de los materiales digitales creados por la Institución y sus miembros. Es, fundamentalmente, un compromiso institucional para el control de estos materiales digitales. En su nivel más básico y fundamental, un repositorio institucional es el reconocimiento de que la actividad intelectual de nuestra universidad estará representada cada vez más en soporte digital y que la principal responsabilidad de la universidad es ejercer el control 3 sobre su producción intelectual, haciéndola accesible, fácilmente recuperable y asegurando su permanencia en el tiempo. Las Instituciones de Educación Superior tienen que gestionar sus contenidos digitales de forma más efectiva y transparente que antes. Actividades en marcha a nivel europeo, como el Proceso de Bolonia, el Espacio Común Europeo de Investigación Científica, el desarrollo del Grid del conocimiento o e-Ciencia, ofrecerán beneficios tangibles a aquellas instituciones que puedan demostrar y explotar sistemas y estrategias de información efectivas. La particular naturaleza de nuestra Universidad, una Universidad nacional a distancia, supone una exigencia y una responsabilidad mayor en relación con la creación y gestión de unos contenidos y servicios digitales que reclaman los miembros de nuestra comunidad y que exigen los niveles de competitividad actual con la introducción generalizada de las nuevas tecnologías en el seno de las Instituciones de Educación Superior. 3. LOS CONTENIDOS DIGITALES DE LA UNED La UNED genera un número creciente, complejo y heterogéneo de contenidos digitales. La biblioteca ha llevado a cabo un análisis de aproximación a los contenidos digitales accesibles a través de nuestro campus virtual. Muchos de ellos han sido localizados en las páginas web departamentales. La mayoría de estos contenidos digitales son accesibles libremente, lo que pone de manifiesto un interés por parte del facultativo de facilitar el acceso, e incrementar su difusión, a su actividad académica e investigadora. Estos contenidos son, en su mayor parte, artículos de revistas y capítulos de libros y las ponencias presentadas en diferentes Congresos y Seminarios, pero también incluyen documentos de trabajo, posters de conferencias, informes técnicos, etc., es decir, un tipo de literatura científica denominada “gris” que encuentra poco o ningún acomodo en los cauces tradicionales de publicación científica. Se han identificado, además, revistas electrónicas editadas por diferentes departamentos, normas, anuarios de investigación, memorias, exámenes y soluciones, trabajos presentados en Congresos organizados por la UNED, guías de curso e iniciativas digitales como el proyecto Manes o el recurso educativo multimedia Cristamine. 4 Finalmente, la UNED tiene una rica colección de objetos digitales audiovisuales formada por los contenidos de TeleUned, RadioUned, la Televisión Educativa, así como un volumen importante de objetos digitales de aprendizaje generados en la actividad de las aulas virtuales en el contexto del E-learning de nuestra universidad. Desgraciadamente, muchos de estos recursos, distribuidos en diferentes colecciones y localizaciones no son fáciles de encontrar. La histórica ausencia de incentivos y mecanismos de coordinación e intercambio de datos entre las diferentes unidades del campus tiene como consecuencia una baja probabilidad de interoperabilidad entre estos recursos distribuidos y una gran dificultad para su recuperación por el usuario medio de nuestra universidad virtual lo que incide negativamente en su grado de utilización y conocimiento. Junto con su falta de accesibilidad, la forma en que están creados y gestionados esos contenidos hace imposible su reutilización para otros usos y otros entornos que aquellos para los que fueron creados. Además, las posibilidades abiertas por las nuevas tecnologías implican una mayor complejidad de la naturaleza de los objetos digitales que se crean, los cuales pueden incluir no sólo objetos convencionales como libros u otros objetos textuales (digitales o digitalizados), datos geoespaciales, imágenes, mapas, etc. sino que se han sumado objetos digitales compuestos, complejos y dinámicos como vídeos, datasets numéricos y su código textual asociado, simulaciones, audios, páginas web etc. A medida que los usuarios se vuelven más sofisticados creando y usando contenidos digitales complejos, los sistemas para su gestión deben también hacerse más sofisticados. Un análisis más profundo revela que la supervivencia a largo plazo de muchos de estos contenidos digitales es cuestionable. Con el tiempo, los intereses de los departamentos y las facultades cambian, como también lo hacen los formatos y las plataformas, y el apoyo a largo plazo así como los procesos necesarios para la preservación digital con frecuencia no forman parte del plan inicial de muchos de esos proyectos digitales. Aunque una gran parte de la producción intelectual digital de nuestra universidad tiene un interés y un valor duradero, multitud de necesidades compitiendo por tiempo y recursos, la falta de documentación adecuada y otras limitaciones, están poniendo en peligro la preservación en el tiempo de este contenido. Con nuevas iniciativas digitales surgiendo constantemente y la aceleración con que se crean estos contenidos digitales, es necesario tomar pronto medidas para evitar su pérdida y preservar el capital intelectual único de nuestra institución. 5 Finalmente, la consideración de nuestro campus digital también tiene como resultado la evidencia de que muchas colecciones digitales potenciales nunca llegan a materializarse. Tecnologías y estándares que cambian, el alto coste de desarrollar y mantener sistemas adecuados, una general incertidumbre sobre mejores prácticas y pocas garantías de éxito son factores que pueden ser muy intimidatorios. 4.- “e-SpacioUNED”: EL INSTITUCIONAL DE LA UNED REPOSITORIO DIGITAL Como respuesta a estas necesidades, la biblioteca propone a la comunidad universitaria de la UNED un repositorio digital que ofrezca una herramienta robusta, fiable, escalable y económica para la gestión de sus contenidos digitales, que asegure una recuperación de la información eficaz, fácil y útil, que permita la reutilización de esos contenidos para diferentes propósitos y contextos, que proporcione un acceso centralizado a todos los recursos de información, que incremente y mejore su visibilidad y difusión y, finalmente, que asegure la conservación de estos contenidos así como su accesibilidad y uso en el tiempo. La biblioteca, después de un análisis y evaluación de los programas disponibles y más implantados en ámbitos similares, ha seleccionado para la implementación de nuestro repositorio digital el programa Fedora (no confundir con el proyecto Fedora patrocinado por Red Hat) como backend y la aplicación Fez como interfaz web de Fedora. Ambos son software libre distribuidos con licencia pública. A nivel institucional, el uso de software libre ofrece tres ventajas claves. En primer lugar, el SL es más adecuado que el software propietario para entornos académicos al ser más fiable, robusto y seguro. Y no es una casualidad, sino consecuencia de su desarrollo abierto. En segundo lugar, su bajísimo coste permite localizar recursos financieros en otras áreas que mejorarían enormemente la utilidad pública de las universidades (infraestructuras, becas, apoyo a la investigación, etc). En tercer lugar, al demandar menores recursos computacionales, se extiende la vida útil de los equipamientos informáticos tanto de las universidades como de los propios estudiantes, evitando ciclos rápidos de obsolescencia y optimizando así las inversiones. A nivel académico, el SL refleja mucho mejor los valores tradicionales de la investigación universitaria desde su propia definición de "libre": 6 libertad para analizar cómo trabaja un programa y adaptarlo a nuestras necesidades, libertad para mejorar un programa y compartir con otros las adaptaciones, beneficiando así a toda la comunidad. Dado que el repositorio institucional debe apoyar a la comunidad universitaria en la consecución de sus diversos objetivos, ello exige que sea capaz de interoperar con otros sistemas, tanto de la propia institución como sistemas externos (sistemas administrativos, portales, otros repositorios) de manera que sus contenidos sean fácilmente extraíbles y reutilizables. Por ello, el repositorio digital de la UNED funciona con protocolos y estándares abiertos, de manera que es potencialmente capaz de ser integrado como un elemento central, en el tejido de gestión de la información de la institución, permitiendo a ésta competir y colaborar de una manera más eficaz y eficiente. Los estándares y protocolos abiertos ofrecen además protección contra la obsolescencia y la inaccesibilidad. Representan una forma segura de almacenar contenidos para recuperaciones futuras, dado que todos son entendidos, documentados y publicados universalmente. No están asociados a costes de licencias y el uso y distribución de estos formatos es gratis. El uso de protocolos abiertos es también una condición para asegurar la interoperabilidad y por tanto el intercambio y transferencia de información. En este sentido, el repositorio digital de la UNED es conforme con el protocolo OAI-PMH lo cual significa que sus contenidos pueden incorporarse a redes de colecciones similares de todo el mundo y ser buscados por los agentes de Internet, como Google, Google Scholar, o servicios OAI como Oaister. . 5.- CÓMO FUNCIONA El repositorio digital “e-SpacioUNED” funciona como un tipo de sistema de gestión de contenidos que, por una parte, contiene y mantiene los contenidos que forman la producción intelectual en soporte digital de la universidad y por otra permite que estos contenidos sean utilizados para soportar los diferentes procesos definidos en la estrategia de información de la institución. Puede contener un amplio conjunto de objetos digitales que pueden usarse de forma flexible para diferentes propósitos y soporta mecanismos de importar, exportar, identificar, almacenar y recuperar los contenidos digitales. Para la carga de contenidos el repositorio utiliza un procedimiento denominado “auto-archivo”, en el que el propio autor (o persona delegada) deposita el documento en el sistema a través de una 7 simple interfaz web, lo cual otorga a éste el control sobre los contenidos que deben incluirse. El repositorio se estructura en “comunidades”; éstas pueden ser cualquier unidad de la Universidad, como un departamento, una facultad, un servicio, un grupo, e incluso un individuo, que genera contenidos de carácter científico, académico o de otro tipo. La comunidad decidirá qué contenidos se incluirán, las condiciones de uso y acceso a los contenidos, así como las distintas funciones que podrán ejercer los miembros de esa comunidad: editar, crear, autorizar, publicar, etc. Los contenidos, dentro de cada comunidad, se organizan en “colecciones”, que son un grupo de contenidos producidos por esa comunidad. Cada comunidad puede crear un número ilimitado de colecciones. Ejemplo de colecciones pueden ser “artículos de revistas”, “conferencias”, “actos académicos”, “guías de curso”, “exámenes”, “emisiones radiofónicas”, etc. El sistema de “auto-archivo”, sin embargo, no excluye la posibilidad de que determinadas comunidades deleguen en la biblioteca para la ingesta y asignación de los metadatos de los documentos que compongan una colección. Aunque la biblioteca propone el repositorio digital institucional como el servicio de archivo, acceso y distribución en línea para todo el campus, se entiende que algunas unidades preferirán crear, mantener y controlar sus propias colecciones digitales. El repositorio institucional ofrecerá un fuerte apoyo para el contenido distribuido, y mediante el intercambio de metadatos entre recursos distribuidos ofrecerá siempre enlaces que permitirán a los usuarios salir instantáneamente del entorno del repositorio y entrar en el esquema de navegación independiente del recurso distribuido o su página web. Respecto a los contenidos, el modelo de objeto digital definido por Fedora soporta la expresión de muchos tipos de objetos digitales, incluyendo documentos (tesis, artículos, libros y revistas, ponencias, etc.), imágenes, objetos de aprendizaje multimedia, datasets, programas de ordenador, datos geoespaciales, mapas, etc., así como objetos digitales compuestos, complejos y dinámicos como vídeos, datasets numéricos y su código textual asociado, simulaciones, audios, páginas web etc. y otras entidades de información compuestas. Fedora permite múltiples presentaciones del objeto digital mediante la aplicación de diferentes hojas de estilo (p.ej. presentar el documento en pdf , html o XML); además, Fedora ofrece unos mecanismos de acceso al objeto digital que permiten transformar 8 dinámicamente el contenido para un uso específico o un contexto determinado (ej. Ofrecer la vista ampliada de una imagen o sólo la tabla de contenidos del documento libro). Fedora también permite definir relaciones entre los objetos digitales de diversas maneras: por ejemplo, un objeto Fedora puede representar una colección y otros objetos que son miembros de esa colección. Puede darse el caso de que un objeto sea considerado parte de otro objeto, una derivación de otro objeto, una descripción de otro objeto o incluso un equivalente de otro objeto. Estas relaciones se definen mediante metadatos que son almacenados junto con el objeto. Fedora proporciona por defecto una ontología [fedora-relsext-ontology.rdfs] que define las diferentes relaciones de los objetos Fedora, pero pueden crearse nuevas o funcionalidades avanzadas de acceso y gestión dentro del repositorio. Algunos ejemplos de usos de metadatos de relaciones incluyen: (1) organizar objetos en colecciones para soportar recolecciones selectivas de los proveedores de servicios OAI; (2) definir relaciones bibliográficas entre objetos tales como “has part”/”is part of”; 3) definir relaciones semánticas entre recursos para registrar cómo los objetos se relacionan con una taxonomía externa o conjunto de estándardes; (4) modelar una capa de red en la que los recursos están enlazados basándose en información contextual; (5) codificar jerarquías naturales de los objetos; (6) establecer relaciones entre objetos de diferentes colecciones, para mostrar, por ejemplo, que un documento particular de una colección también puede ser considerado parte de otra colección. Estamos convencidos de que la extensibilidad de la arquitectura del modelo de objeto digital de Fedora nos permitirá adaptarnos a los rápidos y constantes cambios tecnológicos y a las nuevas formas de contenidos que son inevitables. Al depositar el documento, el sistema genera un identificador único y requiere la creación de los metadatos que permitirán su indización y posterior recuperación. El sistema soporta tres tipos de metadatos: 1. Metadatos administrativos Son aquellos metadatos que describen la historia, los derechos de acceso, las versiones, etc. de cada objeto digital. Los crea el propio sistema. Estos metadatos permiten crear índices para las tareas de gestión interna del repositorio. 2. Metadatos técnicos 9 Describen los formatos y características técnicas del objeto. Son opcionales. Sirven para crear índices tanto para tareas de gestión como para el usuario final. 3. Metadatos descriptivos Describen el contenido intelectual del objeto. Son los metadatos que tradicionalmente crea la biblioteca para describir sus colecciones (autor, título, etc.). Sirven para crear los índices que permitirán la recuperación del objeto (similar a lo que sucede con los catálogos). Por defecto, el sistema incorpora el esquema de metadatos DublínCore, pero se pueden crear o incorporar otros esquemas de metadatos que se adapten mejor a estructuras más complejas y a diferentes necesidades de uso y recuperación, tales como IEEE LOM para los objetos de aprendizaje, MPEG-7 para la descripción de interfaces de contenidos multimedia, etc. Los diferentes esquemas de metadatos utilizados representan los distintos tipos de documentos. Son esquemas XML (XSD) que se presentan al usuario en forma de formulario web HTML lo que permite un alto grado de configuración en la creación de pantallas de interfaces web. La aplicación permite la búsqueda avanzada, búsqueda por materias, por autor, por comunidades y por colecciones. 6.- EL REPOSITORIO DIGITAL Y EL MOVIMIENTO DE ACCESO LIBRE A LA INFORMACIÓN CIENTÍFICA (“Open Access”) Los repositorios institucionales están relacionados con el movimiento denominado “acceso libre a la información científica” (Open Access), en el sentido de que se consideran una de las estrategias (junto con la creación de revistas electrónicas de acceso libre) para permitir el acceso sin restricciones a los resultados de la investigación científica que se lleva a cabo con fondos públicos. El repositorio institucional de la UNED apoya este acceso libre a los contenidos de nuestra Universidad, pero ofrece a sus autores la última decisión sobre su política de acceso y uso de los mismos por parte del usuario final. Sin embargo, para permitir a la Universidad la gestión, distribución y preservación del material depositado en el repositorio institucional, es necesario que cada autor que contribuya ceda una autorización o licencia de depósito, otorgada por el autor a la Universidad no 10 exclusiva e irrevocable para distribuir el contenido de su trabajo, migrar su formato con fines de preservación y mantenimiento del contenido a perpetuidad. La firma de este acuerdo o licencia de depósito no supone, en ningún caso, la pérdida o cesión de los derechos de propiedad intelectual y de copyright del autor, el cual sólo ha hecho una cesión no exclusiva, lo que significa que retiene el control total sobre su trabajo para usarlo y distribuirlo en otros contextos. El Viccerrectorado de Investigación solicitó un informe jurídico a la Asesoría Jurídica de la Universidad para la redacción de esta licencia y estamos a la espera de su informe. Lo que debe quedar claro es que la política de acceso libre a los contenidos del repositorio no perjudica ni contradice en ningún caso los derechos de autor porque los autores conservan estos derechos, escogen qué materiales se depositan y definen las restricciones de acceso y uso de los mismos; la participación en el acceso libre es absolutamente voluntaria. El repositorio no será el propietario de los contenidos sino que sólo tendrá una cesión no exclusiva para proporcionar acceso a los mismos a través de Internet y su preservación. Una comunidad puede decidir permitir sólo el acceso a una de sus colecciones a un determinado grupo de usuarios durante un determinado período de tiempo, por ejemplo. 7.- BENEFICIOS PARA LA COMUNIDAD UNIVERSITARIA La gran ventaja que proporcionan estos sistemas es que ayudan a la Institución a desarrollar un enfoque coherente y coordinado para la captura, identificación, almacenamiento y recuperación de sus contenidos digitales. Un tratamiento gestionado de estos contenidos aumenta las oportunidades para un uso más efectivo de los resultados de la actividad de la Institución y estimula la colaboración entre las diferentes disciplinas y unidades. La posibilidad que ofrecen estos repositorios de reutilizar los contenidos abre un amplio horizonte de aplicaciones, por ejemplo en el ámbito de los objetos de aprendizaje. Por otra parte, suponen un medio de romper el ciclo de silos individuales de conocimiento, ofreciendo un espacio común de almacenamiento con acceso para todos. Un repositorio institucional ofrece la difusión más amplia posible de toda la panoplia completa de la producción intelectual digital generada en una institución, puede incrementar la visibilidad y el prestigio de la institución y demostrar su valor para las fuentes de financiación y subvenciones así como aumentar la visibilidad de sus 11 investigadores, ampliando la difusión y el uso de sus trabajos. Un repositorio institucional puede estimular la innovación, facilitar un análisis cualitativo del trabajo de sus miembros, apoyar las tareas de enseñanza/aprendizaje, servir de sistema de registro de ideas, ofrecer un catálogo del capital intelectual de la institución. Los repositorios institucionales reconocen y dan cabida a los objetos digitales científicos no incluídos en los canales tradicionales de publicación. Finalmente, los repositorios institucionales pueden mejorar la comunicación científica y hacer avanzar la investigación científica permitiendo a los usuarios localizar y recuperar información relevante más rápida y fácilmente. El repositorio institucional ofrece un archivo central de almacenamiento con gestión apropiada de backups y URLs persistentes que se pueden mantener más tiempo y con menos dificultad que aquellas de los usuarios de páginas web. El repositorio institucional facilita un acceso centralizado a la información, tanto a los usuarios internos como externos. Uno de los mayores beneficios de una localización centralizada para todos los diferentes contenidos es que la producción intelectual de nuestra universidad está disponible en un lugar. Las ventajas son dobles: para los miembros de la comunidad universitaria el trabajo de una comunidad (departamento, grupo, individuo....) es representado de forma coherente como un todo contextualizado. Para los usuarios externos, la producción intelectual de la Universidad está disponible en un lugar centralizado, lo cual les permite encontrar, usar y conocer esta información de una forma mucho más efectiva. Las universidades actualmente están llevando cabo cada vez más la compilación y el análisis de su investigación y publicaciones, con fines de evaluación y para obtener financiación. Una base de datos de publicaciones es un recurso valioso para ello. El repositorio institucional permite también generar listas de publicaciones para biografías, curricula vitae o información sobre páginas web del personal; de igual modo, permite generar listas de publicaciones de un grupo o proyecto. También permite establecer procedimientos de citación y estadísticas. Finalmente, una de las mayores ventajas de participar en el repositorio institucional es que el hacerlo permite exponer la producción intelectual de nuestra universidad a una cada vez mayor red de colecciones similares en todo el mundo. Los registros contenidos en el repositorio son recolectados en todo el mundo por herramientas “Open Archives Initiative” (OAI) que promueven una mayor difusión de los contenidos dirigidos a audiencias específicas. 12 APÉNDICE: CUESTIONES TECNOLÓGICAS Para la implementación del repositorio institucional de la UNED la biblioteca ha utilizado el software FEDORA como modelo de objeto digital y servicios de acceso y gestión del mismo. Como interfaz web, utiliza la aplicación FEZ, diseñada como aplicación web para la gestión de los objetos digitales de FEDORA. 6.1 CRITERIOS PARA LA ELECCIÓN DEL MODELO DE OBJETO DIGITAL Para la fase de análisis y evaluación del software se definieron una condiciones mínimas: Flexibilidad o Un modelo de datos que no fuera rígido o Soporte para distintos tipos de media types y objetos digitales complejos. o Que no estuviera encerrado en una plataforma tecnológica (OS, base de datos) o Separación entre contenido, programación y representación (MVC). Es muy importante que el sistema tenga la capacidad de programar la interfaz de forma arbitraria mientras que gestiona las cuestiones del almacenamiento, la preservación y la recuperación de forma independiente. Extensibilidad o Uso de tecnologías modernas (implementado en Java) o Fácil integración con otros sistemas y herramientas o Medios para la extensión/modificación o Soporte de estándares de bibliotecas digitales, particularmente metadatos Sostenibilidad Soportabilidad Costes 6.2 FEDORA (The Flexible Extensible Digital Object and Repository Architecture) Teniendo como punto de partida estas condiciones, se realizó un análisis y evaluación de los programas con mayor implantación en el 13 desarrollo de repositorios institucionales similares en otras Universidades, tanto nacionales como internacionales: E-prints1, Dspace2 y Fedora3. Como resultado de esa evaluación se decidió finalmente utilizar el software FEDORA. Fedora es un software de código abierto distribuido bajo licencia Educational Community License 1.0 (ECL), desarrollado conjuntamente por la Biblioteca de la Universidad de Virginia y la Universidad de Cornell, en Estados Unidos. Actualmente va por la versión 2.1b (noviembre 2005). Software Soporta un modelo de objetos digitales basado en XML 100% Java (Sun Java J2SDK1.4) Tecnologías que soporta: -Apache Tomcat 4.1 y Apache Axis (SOAP) -Xerces 6.5 para el parsing y la validación -Saxon 6.5 para la transformación XSLT -Schematron 1.5 para la validación -MySQL y Mckoi como bases de datos relacionales -Oracle 9i Sistemas operativos: -Windows 2000, NT, XP -Solaris -Linux 1 http://www.eprints.org/ http://sourceforge.net/projects/dspace/ 3 http://www.fedora.info/ 2 14 El sistema del repositorio Fedora El modelo digital de Fedora Fedora es una arquitectura modular construida sobre el principio de que la interoperabilidad y la extensibilidad se consiguen mejor mediante una clara separación entre datos, interfaces y mecanismos (i.e. programas ejecutables). Fedora define un modelo de objeto digital genérico que puede ser utilizado para representar diferentes tipos de objetos, incluidos documentos, imágenes, libros, objetos de aprendizaje multimedia, datasets, vídeos, metadatos etc. Fedora soporta la agregación de uno o más items de contenidos dentro de un objeto digital (es decir, objetos digitales compuestos, como puede ser un artículo que contiene la parte textual, gráficos y metadatos). Los contenidos además pueden ser almacenados tanto localmente en el repositorio o ser llamados desde servidores externos. El modelo es sencillo y flexible de forma que es posible crear distintos tipos de objetos digitales al tiempo que la naturaleza genérica del modelo de Fedora permite gestionar todos los objetos de manera consistente. Por otra 15 parte, Fedora permite establecer relaciones jerárquicas entre objetos a través de los metadatos incluidos en esos objetos. Fedora permite múltiples presentaciones del objeto digital mediante la aplicación de diferentes hojas de estilo (p.ej. presentar el documento en pdf , html o XML); además, Fedora ofrece unos mecanismos de acceso al objeto digital que permiten transformar dinámicamente el contenido para un uso específico o un contexto determinado (ej. Ofrecer la vista ampliada de una imagen o sólo la tabla de contenidos del documento libro). Estos mecanismos se denominan en el sistema “disseminators”. Un “disseminator” es un componente opcional utilizado para extender los puntos de acceso al objeto digital. Detrás del telón] el “disseminator” apunta a un conjunto de métodos que son invocados para producir representaciones virtuales del objeto. Una representación virtual es contenido que no está explícitamente almacenado en un objeto digital, sino que se produce dinámicamente en el momento en que es invocado el servicio. Un “disseminator” define un servicio mediado de la vista de un objeto. En este ejemplo hay dos métodos asociados con el “disseminator”, uno produce la imagen con zoom y otro la imagen con tonos de gris. Ambos métodos requieren una imagen jpg como input, por lo tanto el datastream HIGH es asociado con ese “disseminator” como un parámetro en tiempo de ejecución. El resultado es que el “disseminator” produce dos vistas extra del contenido del objeto. El “disseminator” contiene suficiente información para que el respositorio Fedora pueda mediar automáticamente todas las interacciones con el servicio asociado. Para que ello sea posible, cada “disseminator” está enlazado con uno objeto especial que contiene 16 una descripción del servicio codificado en WSDL (Web Service Description Language). El repositorio Fedora utiliza esta información para ejecutar los servicios invocados apropiados para producir las representaciones virtuales. Desde el punto de vista del cliente, todo el proceso es transparente; el cliente únicamente solicita la representación virtual con el identificador Fedora apropiado. Fedora permite definir relaciones entre los objetos digitales de diversas maneras: por ejemplo, un objeto Fedora puede representar una colección y otros objetos que son miembros de esa colección. Puede darse el caso de que un objeto sea considerado parte de otro objeto, una derivación de otro objeto, una descripción de otro objeto o incluso un equivalente de otro objeto. Estas relaciones se definen mediante metadatos que son almacenados junto con el objeto. Fedora proporciona por defecto una ontología [fedora-relsextontology.rdfs] que define las diferentes relaciones de los objetos Fedora, pero pueden crearse nuevas o funcionalidades avanzadas de acceso y gestión dentro del repositorio. Algunos ejemplos de usos de metadatos de relaciones incluyen: (1) organizar objetos en colecciones para soportar recolecciones selectivas de los proveedores de servicios OAI; (2) definir relaciones bibliográficas entre objetos tales como “has part”/”is part of”; 3) definir relaciones semánticas entre recursos para registrar cómo los objetos se relacionan con una taxonomía externa o conjunto de estándardes; (4) modelar una capa de red en la que los recursos están enlazados basándose en información contextual; (5) codificar jerarquías naturales de los objetos; (6) establecer relaciones entre objetos de diferentes colecciones, para mostrar, por ejemplo, que un documento particular de una colección también puede ser considerado parte de otra colección. Estamos convencidos de que la extensibilidad de la arquitectura del modelo de objeto digital de Fedora nos permitirá adaptarnos a los rápidos y constantes cambios tecnológicos y a las nuevas formas de contenidos que son inevitables. Arquitectura de los servicios Fedora Todas las funciones de Fedora, tanto en el nivel del objeto como del repositorio se exponen como servicios web. El marco del servicio de Fedora está concebido para facilitar la integración de nuevos servicios y funcionalidades sobre el repositorio Fedora. Mientras que el repositorio en sí mismo expone sus funcionalidades como un conjunto de interfaces de servicios web, todas estas interfaces pertenecen a la aplicación web de Fedora que corre en su propio Tomcat. El marco de servicios de Fedora permite construir nuevos servicios en torno al repositorio núcleo como aplicaciones web “stand-alone” que corren independientemente del repositorio Fedora. Esta aproximación aporta dos 17 ventajas fundamentales: (1) permite que se añadan nuevas funcionalidades como servicios modulares que pueden interactuar con el repositorio Fedora y sin embargo no forman parte de este repositorio; (2) facilita el co-desarrollo de nuevos servicios Fedora, dado que cada servicio puede ser desarrollado y conectado de forma independiente a la arquitectura central de Fedora. La arquitectura de Fedora no está construida para ningún workflow o aplicación de usuario final particular. Por ello, Fedora puede funcionar como el substrato de un repositorio genérico sobre el cual se pueden crear muchos tipos de aplicaciones y aprovechar las ventajas, en el futuro, de los desarrollos en servicios web. La capacidad de crecer y cambiar garantiza la longevidad de la arquitectura del modelo digital Fedora. 18 Archivo y preservación de los objetos Las capacidades de archivo y preservación de Fedora incluyen: XML: los objetos XML de Fedora y el esquema sobre el que se basan son preservados durante su carga, almacenamiento y exportación. Versionado del contenido: Fedora permite seguir los cambios y modificaciones de un objeto (el cambio, quién y cuándo se hizo) añadiendo la nueva versión al objeto XML. Este nuevo item se añade en cascada al objeto digital y se numera para mostrar la relación entre el original y la versión. Ello permite recuperar antiguas versiones del objeto realizando una búsqueda por fecha/hora o la versión más actualizada si no se incluye el criterio de fecha en la búsqueda. Histórico: Cada objeto del repositorio Fedora contiene una auditoría que preserva un registro de cada cambio realizado sobre el objeto. Autenticación/organización La versión de Fedora 2.1b incluye soporte para la autenticación, SSL, y autorización usando políticas XACML. Estas medidas de seguridad son gestionadas a través de un conjunto de políticas de XACML y con información de autenticación a través de Tomcat o fuentes externas de autenticación. 19 6.3. FEZ: interfaz web para el acceso y gestión de los objetos Fedora. Las principales funcionalidades de la aplicación FEZ son: Diseñada para Fedora Tipos de documentos basados en esquemas XML (XSD) presentados en forma de formulario web HTML lo que permite un alto grado de configuración en la creación pantallas de interfaces web. Utiliza tecnologías web de código abierto sencillas: PHP 5 y MySQL 4.1 Búsqueda avanzada Búsqueda por listados de materia, etc. Procedimiento de auto-archivo para la carga de documentos en el sistema. Extracción automática de metadatos de preservación Interfaz gráfica (GUI) del workflow de documentos configurable y gestión del ciclo de vida del documento. Autenticación y autorización LDAP (o Active Directory) y grupo interno. Security based on FezACML to describe user roles and rights on a per object basis or through parent collection or community security inheritance Basado en comunidades y colecciones con las relaciones entre objetos mapped con los datastream RELS-EXT. Estadísticas Security based at object granularity, drilled down from parent Communities and Collections. Tesauro Conforme con el protocolo OAI-PMH (Open Archive InititativeProtocol Metadata Haversting) 20 21