Memoriae-spaciodefinitiva.doc

Anuncio
Proyecto “e-Spacio UNED”
Repositorio Institucional de la UNED
Memoria descriptiva
Biblioteca de la UNED
1
ÍNDICE
1.
2.
3.
4.
5.
6.
7.
Introducción
Qué es un repositorio digital institucional
Los contenidos digitales de la UNED
“E-Spacio”: el repositorio digital de la UNED
Como funciona
El repositorio digital y el acceso abierto a la información científica
Beneficios para la comunidad universitaria
2
1. INTRODUCCIÓN
En abril de 2005, la Biblioteca Central de la UNED presentó al
Vicerrector de Investigación una propuesta para la creación de un
repositorio digital institucional que recogiera y permitiera el
acceso libre a través de Internet a las tesis doctorales de la UNED. La
propuesta fue aprobada en Consejo de Gobierno, el día 29 de junio
de 2005
Desde entonces, la biblioteca ha mantenido una serie de contactos
cuyo resultado ha sido constatar el interés y la necesidad de ampliar
el alcance del proyecto inicial más allá de las tesis doctorales.
La presente memoria describe el nuevo alcance del proyecto, ahora
concebido como una herramienta y un espacio común –
eSpacioUNED- en el que recoger, organizar, gestionar, dar acceso,
difundir y asegurar la permanencia en el tiempo no sólo de las tesis
doctorales, sino de todos aquellos contenidos digitales que
constituyen nuestro patrimonio intelectual único.
En este momento, la plataforma tecnológica está ya operativa. El
proceso de incorporación de las tesis doctorales está en marcha y la
biblioteca trabaja con el Departamento de Lenguajes Informáticos y
Sistemas para la incorporación al sistema de las publicaciones del
Departamento.
El repositorio forma parte del Proyecto Madroño e-Ciencia de la
Comunidad de Madrid, en el que participan todas las Universidades
del Consorcio Madroño y cuyo objetivo es crear una red de
repositorios de Universidades de la Comunidad de Madrid y un portal
de acceso común a sus contenidos. El repositorio de la UNED, como
parte de este proyecto, está financiado en parte por la Comunidad.
2. QUÉ ES UN REPOSITORIO DIGITAL INSTITUCIONAL
Un repositorio digital institucional es un conjunto de servicios que la
universidad ofrece a los miembros de su comunidad para la gestión,
la preservación, el acceso y la difusión a través de Internet de los
materiales digitales creados por la Institución y sus miembros. Es,
fundamentalmente, un compromiso institucional para el control de
estos materiales digitales.
En su nivel más básico y fundamental, un repositorio institucional es
el reconocimiento de que la actividad intelectual de nuestra
universidad estará representada cada vez más en soporte digital y
que la principal responsabilidad de la universidad es ejercer el control
3
sobre su producción intelectual, haciéndola accesible, fácilmente
recuperable y asegurando su permanencia en el tiempo.
Las Instituciones de Educación Superior tienen que gestionar sus
contenidos digitales de forma más efectiva y transparente que antes.
Actividades en marcha a nivel europeo, como el Proceso de Bolonia,
el Espacio Común Europeo de Investigación Científica, el desarrollo
del Grid del conocimiento o e-Ciencia, ofrecerán beneficios tangibles a
aquellas instituciones que puedan demostrar y explotar sistemas y
estrategias de información efectivas.
La particular naturaleza de nuestra Universidad, una Universidad
nacional a distancia, supone una exigencia y una responsabilidad
mayor en relación con la creación y gestión de unos contenidos y
servicios digitales que reclaman los miembros de nuestra comunidad
y que exigen los niveles de competitividad actual con la introducción
generalizada de las nuevas tecnologías en el seno de las Instituciones
de Educación Superior.
3. LOS CONTENIDOS DIGITALES DE LA UNED
La UNED genera un número creciente, complejo y heterogéneo de
contenidos digitales.
La biblioteca ha llevado a cabo un análisis de aproximación a los
contenidos digitales accesibles a través de nuestro campus virtual.
Muchos de ellos han sido localizados en las páginas web
departamentales. La mayoría de estos contenidos digitales son
accesibles libremente, lo que pone de manifiesto un interés por parte
del facultativo de facilitar el acceso, e incrementar su difusión, a su
actividad académica e investigadora. Estos contenidos son, en su
mayor parte, artículos de revistas y capítulos de libros y las
ponencias presentadas en diferentes Congresos y Seminarios, pero
también incluyen documentos de trabajo, posters de conferencias,
informes técnicos, etc., es decir, un tipo de literatura científica
denominada “gris” que encuentra poco o ningún acomodo en los
cauces tradicionales de publicación científica.
Se han identificado, además, revistas electrónicas editadas por
diferentes departamentos, normas, anuarios de investigación,
memorias, exámenes y soluciones, trabajos presentados en
Congresos organizados por la UNED, guías de curso e iniciativas
digitales como el proyecto Manes o el recurso educativo multimedia
Cristamine.
4
Finalmente, la UNED tiene una rica colección de objetos digitales
audiovisuales formada por los contenidos de TeleUned, RadioUned, la
Televisión Educativa, así como un volumen importante de objetos
digitales de aprendizaje generados en la actividad de las aulas
virtuales en el contexto del E-learning de nuestra universidad.
Desgraciadamente, muchos de estos recursos, distribuidos en
diferentes colecciones y localizaciones no son fáciles de encontrar. La
histórica ausencia de incentivos y mecanismos de coordinación e
intercambio de datos entre las diferentes unidades del campus tiene
como consecuencia una baja probabilidad de interoperabilidad entre
estos recursos distribuidos y una gran dificultad para su recuperación
por el usuario medio de nuestra universidad virtual lo que incide
negativamente en su grado de utilización y conocimiento.
Junto con su falta de accesibilidad, la forma en que están creados y
gestionados esos contenidos hace imposible su reutilización para
otros usos y otros entornos que aquellos para los que fueron creados.
Además, las posibilidades abiertas por las nuevas tecnologías
implican una mayor complejidad de la naturaleza de los objetos
digitales que se crean, los cuales pueden incluir no sólo objetos
convencionales como libros u otros objetos textuales (digitales o
digitalizados), datos geoespaciales, imágenes, mapas, etc. sino que
se han sumado objetos digitales compuestos, complejos y dinámicos
como vídeos, datasets numéricos y su código textual asociado,
simulaciones, audios, páginas web etc. A medida que los usuarios se
vuelven más sofisticados creando y usando contenidos digitales
complejos, los sistemas para su gestión deben también hacerse más
sofisticados.
Un análisis más profundo revela que la supervivencia a largo plazo de
muchos de estos contenidos digitales es cuestionable. Con el tiempo,
los intereses de los departamentos y las facultades cambian, como
también lo hacen los formatos y las plataformas, y el apoyo a largo
plazo así como los procesos necesarios para la preservación digital
con frecuencia no forman parte del plan inicial de muchos de esos
proyectos digitales. Aunque una gran parte de la producción
intelectual digital de nuestra universidad tiene un interés y un valor
duradero, multitud de necesidades compitiendo por tiempo y
recursos, la falta de documentación adecuada y otras limitaciones,
están poniendo en peligro la preservación en el tiempo de este
contenido. Con nuevas iniciativas digitales surgiendo constantemente
y la aceleración con que se crean estos contenidos digitales, es
necesario tomar pronto medidas para evitar su pérdida y preservar el
capital intelectual único de nuestra institución.
5
Finalmente, la consideración de nuestro campus digital también tiene
como resultado la evidencia de que muchas colecciones digitales
potenciales nunca llegan a materializarse. Tecnologías y estándares
que cambian, el alto coste de desarrollar y mantener sistemas
adecuados, una general incertidumbre sobre mejores prácticas y
pocas garantías de éxito son factores que pueden ser muy
intimidatorios.
4.- “e-SpacioUNED”: EL
INSTITUCIONAL DE LA UNED
REPOSITORIO
DIGITAL
Como respuesta a estas necesidades, la biblioteca propone a la
comunidad universitaria de la UNED un repositorio digital que ofrezca
una herramienta robusta, fiable, escalable y económica para la
gestión de sus contenidos digitales, que asegure una recuperación de
la información eficaz, fácil y útil, que permita la reutilización de esos
contenidos para diferentes propósitos y contextos, que proporcione
un acceso centralizado a todos los recursos de información, que
incremente y mejore su visibilidad y difusión y, finalmente, que
asegure la conservación de estos contenidos así como su accesibilidad
y uso en el tiempo.
La biblioteca, después de un análisis y evaluación de los programas
disponibles y más implantados en ámbitos similares, ha seleccionado
para la implementación de nuestro repositorio digital el programa
Fedora (no confundir con el proyecto Fedora patrocinado por Red
Hat) como backend y la aplicación Fez como interfaz web de Fedora.
Ambos son software libre distribuidos con licencia pública.
A nivel institucional, el uso de software libre ofrece tres ventajas
claves. En primer lugar, el SL es más adecuado que el software
propietario para entornos académicos al ser más fiable, robusto y
seguro. Y no es una casualidad, sino consecuencia de su desarrollo
abierto.
En segundo lugar, su bajísimo coste permite localizar recursos
financieros en otras áreas que mejorarían enormemente la utilidad
pública de las universidades (infraestructuras, becas, apoyo a la
investigación, etc).
En tercer lugar, al demandar menores recursos computacionales, se
extiende la vida útil de los equipamientos informáticos tanto de las
universidades como de los propios estudiantes, evitando ciclos
rápidos de obsolescencia y optimizando así las inversiones.
A nivel académico, el SL refleja mucho mejor los valores tradicionales
de la investigación universitaria desde su propia definición de "libre":
6
libertad para analizar cómo trabaja un programa y adaptarlo a
nuestras necesidades, libertad para mejorar un programa y compartir
con otros las adaptaciones, beneficiando así a toda la comunidad.
Dado que el repositorio institucional debe apoyar a la comunidad
universitaria en la consecución de sus diversos objetivos, ello exige
que sea capaz de interoperar con otros sistemas, tanto de la propia
institución como sistemas externos (sistemas administrativos,
portales, otros repositorios) de manera que sus contenidos sean
fácilmente extraíbles y reutilizables. Por ello, el repositorio digital de
la UNED funciona con protocolos y estándares abiertos, de manera
que es potencialmente capaz de ser integrado como un elemento
central, en el tejido de gestión de la información de la institución,
permitiendo a ésta competir y colaborar de una manera más eficaz y
eficiente. Los estándares y protocolos abiertos ofrecen además
protección contra la obsolescencia y la inaccesibilidad. Representan
una forma segura de almacenar contenidos para recuperaciones
futuras, dado que todos son entendidos, documentados y publicados
universalmente. No están asociados a costes de licencias y el uso y
distribución de estos formatos es gratis.
El uso de protocolos abiertos es también una condición para asegurar
la interoperabilidad y por tanto el intercambio y transferencia de
información. En este sentido, el repositorio digital de la UNED es
conforme con el protocolo OAI-PMH lo cual significa que sus
contenidos pueden incorporarse a redes de colecciones similares de
todo el mundo y ser buscados por los agentes de Internet, como
Google, Google Scholar, o servicios OAI como Oaister.
.
5.- CÓMO FUNCIONA
El repositorio digital “e-SpacioUNED” funciona como un tipo de
sistema de gestión de contenidos que, por una parte, contiene y
mantiene los contenidos que forman la producción intelectual en
soporte digital de la universidad y por otra permite que estos
contenidos sean utilizados para soportar los diferentes procesos
definidos en la estrategia de información de la institución. Puede
contener un amplio conjunto de objetos digitales que pueden usarse
de forma flexible para diferentes propósitos y soporta mecanismos de
importar, exportar, identificar, almacenar y recuperar los contenidos
digitales.
Para la carga de contenidos el repositorio utiliza un procedimiento
denominado “auto-archivo”, en el que el propio autor (o persona
delegada) deposita el documento en el sistema a través de una
7
simple interfaz web, lo cual otorga a éste el control sobre los
contenidos que deben incluirse.
El repositorio se estructura en “comunidades”; éstas pueden ser
cualquier unidad de la Universidad, como un departamento, una
facultad, un servicio, un grupo, e incluso un individuo, que genera
contenidos de carácter científico, académico o de otro tipo. La
comunidad decidirá qué contenidos se incluirán, las condiciones de
uso y acceso a los contenidos, así como las distintas funciones que
podrán ejercer los miembros de esa comunidad: editar, crear,
autorizar, publicar, etc.
Los contenidos, dentro de cada comunidad, se organizan en
“colecciones”, que son un grupo de contenidos producidos por esa
comunidad. Cada comunidad puede crear un número ilimitado de
colecciones. Ejemplo de colecciones pueden ser “artículos de
revistas”, “conferencias”, “actos académicos”, “guías de curso”,
“exámenes”, “emisiones radiofónicas”, etc.
El sistema de “auto-archivo”, sin embargo, no excluye la posibilidad
de que determinadas comunidades deleguen en la biblioteca para la
ingesta y asignación de los metadatos de los documentos que
compongan una colección.
Aunque la biblioteca propone el repositorio digital institucional como
el servicio de archivo, acceso y distribución en línea para todo el
campus, se entiende que algunas unidades preferirán crear,
mantener y controlar sus propias colecciones digitales. El repositorio
institucional ofrecerá un fuerte apoyo para el contenido distribuido, y
mediante el intercambio de metadatos entre recursos distribuidos
ofrecerá siempre enlaces que permitirán a los usuarios salir
instantáneamente del entorno del repositorio y entrar en el esquema
de navegación independiente del recurso distribuido o su página web.
Respecto a los contenidos, el modelo de objeto digital definido por
Fedora soporta la expresión de muchos tipos de objetos digitales,
incluyendo documentos (tesis, artículos, libros y revistas, ponencias,
etc.), imágenes, objetos de aprendizaje multimedia, datasets,
programas de ordenador, datos geoespaciales, mapas, etc., así como
objetos digitales compuestos, complejos y dinámicos como vídeos,
datasets numéricos y su código textual asociado, simulaciones,
audios, páginas web etc. y otras entidades de información
compuestas.
Fedora permite múltiples presentaciones del objeto digital mediante
la aplicación de diferentes hojas de estilo (p.ej. presentar el
documento en pdf , html o XML); además, Fedora ofrece unos
mecanismos de acceso al objeto digital que permiten transformar
8
dinámicamente el contenido para un uso específico o un contexto
determinado (ej. Ofrecer la vista ampliada de una imagen o sólo la
tabla de contenidos del documento libro).
Fedora también permite definir relaciones entre los objetos digitales
de diversas maneras: por ejemplo, un objeto Fedora puede
representar una colección y otros objetos que son miembros de esa
colección. Puede darse el caso de que un objeto sea considerado
parte de otro objeto, una derivación de otro objeto, una descripción
de otro objeto o incluso un equivalente de otro objeto. Estas
relaciones se definen mediante metadatos que son almacenados
junto con el objeto. Fedora proporciona por defecto una ontología
[fedora-relsext-ontology.rdfs] que define las diferentes relaciones de
los objetos Fedora, pero pueden crearse nuevas o funcionalidades
avanzadas de acceso y gestión dentro del repositorio. Algunos
ejemplos de usos de metadatos de relaciones incluyen: (1) organizar
objetos en colecciones para soportar recolecciones selectivas de los
proveedores de servicios OAI; (2) definir relaciones bibliográficas
entre objetos tales como “has part”/”is part of”; 3) definir relaciones
semánticas entre recursos para registrar cómo los objetos se
relacionan con una taxonomía externa o conjunto de estándardes; (4)
modelar una capa de red en la que los recursos están enlazados
basándose en información contextual;
(5) codificar jerarquías
naturales de los objetos; (6) establecer relaciones entre objetos de
diferentes colecciones, para mostrar, por ejemplo, que un documento
particular de una colección también puede ser considerado parte de
otra colección.
Estamos convencidos de que la extensibilidad de la arquitectura del
modelo de objeto digital de Fedora nos permitirá adaptarnos a los
rápidos y constantes cambios tecnológicos y a las nuevas formas de
contenidos que son inevitables.
Al depositar el documento, el sistema genera un identificador único y
requiere la creación de los metadatos que permitirán su indización y
posterior recuperación.
El sistema soporta tres tipos de metadatos:
1. Metadatos administrativos
Son aquellos metadatos que describen la historia, los derechos de
acceso, las versiones, etc. de cada objeto digital. Los crea el
propio sistema. Estos metadatos permiten crear índices para las
tareas de gestión interna del repositorio.
2. Metadatos técnicos
9
Describen los formatos y características técnicas del objeto. Son
opcionales. Sirven para crear índices tanto para tareas de gestión
como para el usuario final.
3. Metadatos descriptivos
Describen el contenido intelectual del objeto. Son los metadatos
que tradicionalmente crea la biblioteca para describir sus
colecciones (autor, título, etc.). Sirven para crear los índices que
permitirán la recuperación del objeto (similar a lo que sucede con
los catálogos).
Por defecto, el sistema incorpora el esquema de metadatos DublínCore, pero se pueden crear o incorporar otros esquemas de
metadatos que se adapten mejor a estructuras más complejas y a
diferentes necesidades de uso y recuperación, tales como IEEE
LOM para los objetos de aprendizaje, MPEG-7 para la descripción
de interfaces de contenidos multimedia, etc.
Los diferentes esquemas de metadatos utilizados representan los
distintos tipos de documentos. Son esquemas XML (XSD) que se
presentan al usuario en forma de formulario web HTML lo que
permite un alto grado de configuración en la creación de pantallas
de interfaces web.
La aplicación permite la búsqueda avanzada, búsqueda por
materias, por autor, por comunidades y por colecciones.
6.- EL REPOSITORIO DIGITAL Y EL MOVIMIENTO DE ACCESO
LIBRE A LA INFORMACIÓN CIENTÍFICA (“Open Access”)
Los repositorios institucionales están relacionados con el movimiento
denominado “acceso libre a la información científica” (Open Access),
en el sentido de que se consideran una de las estrategias (junto con
la creación de revistas electrónicas de acceso libre) para permitir el
acceso sin restricciones a los resultados de la investigación científica
que se lleva a cabo con fondos públicos.
El repositorio institucional de la UNED apoya este acceso libre a los
contenidos de nuestra Universidad, pero ofrece a sus autores la
última decisión sobre su política de acceso y uso de los mismos por
parte del usuario final.
Sin embargo, para permitir a la Universidad la gestión, distribución y
preservación del material depositado en el repositorio institucional, es
necesario que cada autor que contribuya ceda una autorización o
licencia de depósito, otorgada por el autor a la Universidad no
10
exclusiva e irrevocable para distribuir el contenido de su trabajo,
migrar su formato con fines de preservación y mantenimiento del
contenido a perpetuidad.
La firma de este acuerdo o licencia de depósito no supone, en ningún
caso, la pérdida o cesión de los derechos de propiedad intelectual y
de copyright del autor, el cual sólo ha hecho una cesión no exclusiva,
lo que significa que retiene el control total sobre su trabajo para
usarlo y distribuirlo en otros contextos. El Viccerrectorado de
Investigación solicitó un informe jurídico a la Asesoría Jurídica de la
Universidad para la redacción de esta licencia y estamos a la espera
de su informe.
Lo que debe quedar claro es que la política de acceso libre a los
contenidos del repositorio no perjudica ni contradice en ningún caso
los derechos de autor porque los autores conservan estos derechos,
escogen qué materiales se depositan y definen las restricciones de
acceso y uso de los mismos; la participación en el acceso libre es
absolutamente voluntaria. El repositorio no será el propietario de los
contenidos sino que sólo tendrá una cesión no exclusiva para
proporcionar acceso a los mismos a través de Internet y su
preservación. Una comunidad puede decidir permitir sólo el acceso a
una de sus colecciones a un determinado grupo de usuarios durante
un determinado período de tiempo, por ejemplo.
7.- BENEFICIOS PARA LA COMUNIDAD UNIVERSITARIA
La gran ventaja que proporcionan estos sistemas es que ayudan a la
Institución a desarrollar un enfoque coherente y coordinado para la
captura, identificación, almacenamiento y recuperación de sus
contenidos digitales. Un tratamiento gestionado de estos contenidos
aumenta las oportunidades para un uso más efectivo de los
resultados de la actividad de la Institución y estimula la colaboración
entre las diferentes disciplinas y unidades.
La posibilidad que ofrecen estos repositorios de reutilizar los
contenidos abre un amplio horizonte de aplicaciones, por ejemplo en
el ámbito de los objetos de aprendizaje. Por otra parte, suponen un
medio de romper el ciclo de silos individuales de conocimiento,
ofreciendo un espacio común de almacenamiento con acceso para
todos.
Un repositorio institucional ofrece la difusión más amplia posible de
toda la panoplia completa de la producción intelectual digital
generada en una institución, puede incrementar la visibilidad y el
prestigio de la institución y demostrar su valor para las fuentes de
financiación y subvenciones así como aumentar la visibilidad de sus
11
investigadores, ampliando la difusión y el uso de sus trabajos. Un
repositorio institucional puede estimular la innovación, facilitar un
análisis cualitativo del trabajo de sus miembros, apoyar las tareas de
enseñanza/aprendizaje, servir de sistema de registro de ideas,
ofrecer un catálogo del capital intelectual de la institución. Los
repositorios institucionales reconocen y dan cabida a los objetos
digitales científicos no incluídos en los canales tradicionales de
publicación. Finalmente, los repositorios institucionales pueden
mejorar la comunicación científica y hacer avanzar la investigación
científica permitiendo a los usuarios localizar y recuperar información
relevante más rápida y fácilmente.
El repositorio
institucional ofrece un archivo central de
almacenamiento con gestión apropiada de backups y URLs
persistentes que se pueden mantener más tiempo y con menos
dificultad que aquellas de los usuarios de páginas web.
El repositorio institucional facilita un acceso centralizado a la
información, tanto a los usuarios internos como externos. Uno de los
mayores beneficios de una localización centralizada para todos los
diferentes contenidos es que la producción intelectual de nuestra
universidad está disponible en un lugar. Las ventajas son dobles:
para los miembros de la comunidad universitaria el trabajo de una
comunidad (departamento, grupo, individuo....) es representado de
forma coherente como un todo contextualizado. Para los usuarios
externos, la producción intelectual de la Universidad está disponible
en un lugar centralizado, lo cual les permite encontrar, usar y conocer
esta información de una forma mucho más efectiva.
Las universidades actualmente están llevando cabo cada vez más la
compilación y el análisis de su investigación y publicaciones, con fines
de evaluación y para obtener financiación. Una base de datos de
publicaciones es un recurso valioso para ello.
El repositorio institucional permite también generar listas de
publicaciones para biografías, curricula vitae o información sobre
páginas web del personal; de igual modo, permite generar listas de
publicaciones de un grupo o proyecto. También permite establecer
procedimientos de citación y estadísticas.
Finalmente, una de las mayores ventajas de participar en el
repositorio institucional es que el hacerlo permite exponer la
producción intelectual de nuestra universidad a una cada vez mayor
red de colecciones similares en todo el mundo. Los registros
contenidos en el repositorio son recolectados en todo el mundo por
herramientas “Open Archives Initiative” (OAI) que promueven una
mayor difusión de los contenidos dirigidos a audiencias específicas.
12
APÉNDICE: CUESTIONES TECNOLÓGICAS
Para la implementación del repositorio institucional de la UNED la
biblioteca ha utilizado el software FEDORA como modelo de objeto
digital y servicios de acceso y gestión del mismo. Como interfaz web,
utiliza la aplicación FEZ, diseñada como aplicación web para la
gestión de los objetos digitales de FEDORA.
6.1 CRITERIOS PARA LA ELECCIÓN DEL MODELO DE OBJETO
DIGITAL
Para la fase de análisis y evaluación del software se definieron una
condiciones mínimas:

Flexibilidad
o Un modelo de datos que no fuera rígido
o Soporte para distintos tipos de media types y objetos
digitales complejos.
o Que no estuviera encerrado en una plataforma
tecnológica (OS, base de datos)
o Separación
entre
contenido,
programación
y
representación (MVC). Es muy importante que el sistema
tenga la capacidad de programar la interfaz de forma
arbitraria mientras que gestiona las cuestiones del
almacenamiento, la preservación y la recuperación de
forma independiente.

Extensibilidad
o Uso de tecnologías modernas (implementado en Java)
o Fácil integración con otros sistemas y herramientas
o Medios para la extensión/modificación
o Soporte
de
estándares
de
bibliotecas
digitales,
particularmente metadatos



Sostenibilidad
Soportabilidad
Costes
6.2 FEDORA (The Flexible Extensible Digital Object and
Repository Architecture)
Teniendo como punto de partida estas condiciones, se realizó un
análisis y evaluación de los programas con mayor implantación en el
13
desarrollo de repositorios institucionales similares en otras
Universidades, tanto nacionales como internacionales: E-prints1,
Dspace2 y Fedora3. Como resultado de esa evaluación se decidió
finalmente utilizar el software FEDORA.
Fedora es un software de código abierto distribuido bajo licencia
Educational Community License 1.0 (ECL), desarrollado conjuntamente
por la Biblioteca de la Universidad de Virginia y la Universidad de
Cornell, en Estados Unidos. Actualmente va por la versión 2.1b
(noviembre 2005).
Software




Soporta un modelo de objetos digitales basado en XML
100% Java (Sun Java J2SDK1.4)
Tecnologías que soporta:
-Apache Tomcat 4.1 y Apache Axis (SOAP)
-Xerces 6.5 para el parsing y la validación
-Saxon 6.5 para la transformación XSLT
-Schematron 1.5 para la validación
-MySQL y Mckoi como bases de datos relacionales
-Oracle 9i
Sistemas operativos:
-Windows 2000, NT, XP
-Solaris
-Linux
1
http://www.eprints.org/
http://sourceforge.net/projects/dspace/
3
http://www.fedora.info/
2
14
El sistema del repositorio Fedora
El modelo digital de Fedora
Fedora es una arquitectura modular construida sobre el principio de
que la interoperabilidad y la extensibilidad se consiguen mejor
mediante una clara separación entre datos, interfaces y mecanismos
(i.e. programas ejecutables).
Fedora define un modelo de objeto digital genérico que puede ser
utilizado para representar diferentes tipos de objetos, incluidos
documentos, imágenes, libros, objetos de aprendizaje multimedia,
datasets, vídeos, metadatos etc. Fedora soporta la agregación de uno
o más items de contenidos dentro de un objeto digital (es decir,
objetos digitales compuestos, como puede ser un artículo que
contiene la parte textual, gráficos y metadatos). Los contenidos
además pueden ser almacenados tanto localmente en el repositorio o
ser llamados desde servidores externos. El modelo es sencillo y
flexible de forma que es posible crear distintos tipos de objetos
digitales al tiempo que la naturaleza genérica del modelo de Fedora
permite gestionar todos los objetos de manera consistente. Por otra
15
parte, Fedora permite establecer relaciones jerárquicas entre objetos
a través de los metadatos incluidos en esos objetos.
Fedora permite múltiples presentaciones del objeto digital mediante
la aplicación de diferentes hojas de estilo (p.ej. presentar el
documento en pdf , html o XML); además, Fedora ofrece unos
mecanismos de acceso al objeto digital que permiten transformar
dinámicamente el contenido para un uso específico o un contexto
determinado (ej. Ofrecer la vista ampliada de una imagen o sólo la
tabla de contenidos del documento libro). Estos mecanismos se
denominan en el sistema “disseminators”. Un “disseminator” es un
componente opcional utilizado para extender los puntos de acceso al
objeto digital. Detrás del telón] el “disseminator” apunta a un
conjunto
de
métodos
que
son
invocados
para
producir
representaciones virtuales del objeto. Una representación virtual es
contenido que no está explícitamente almacenado en un objeto
digital, sino que se produce dinámicamente en el momento en que es
invocado el servicio. Un “disseminator” define un servicio mediado de
la vista de un objeto.
En este ejemplo hay dos métodos asociados con el “disseminator”,
uno produce la imagen con zoom y otro la imagen con tonos de gris.
Ambos métodos requieren una imagen jpg como input, por lo tanto el
datastream HIGH es asociado con ese “disseminator” como un
parámetro en tiempo de ejecución. El resultado es que el
“disseminator” produce dos vistas extra del contenido del objeto. El
“disseminator” contiene suficiente información para que el
respositorio Fedora pueda mediar automáticamente todas las
interacciones con el servicio asociado. Para que ello sea posible, cada
“disseminator” está enlazado con uno objeto especial que contiene
16
una descripción del servicio codificado en WSDL (Web Service
Description Language). El repositorio Fedora utiliza esta información
para ejecutar los servicios invocados apropiados para producir las
representaciones virtuales. Desde el punto de vista del cliente, todo
el proceso es transparente; el cliente únicamente solicita la
representación virtual con el identificador Fedora apropiado.
Fedora permite definir relaciones entre los objetos digitales de
diversas maneras: por ejemplo, un objeto Fedora puede representar
una colección y otros objetos que son miembros de esa colección.
Puede darse el caso de que un objeto sea considerado parte de otro
objeto, una derivación de otro objeto, una descripción de otro objeto
o incluso un equivalente de otro objeto. Estas relaciones se definen
mediante metadatos que son almacenados junto con el objeto.
Fedora proporciona por defecto una ontología [fedora-relsextontology.rdfs] que define las diferentes relaciones de los objetos
Fedora, pero pueden crearse nuevas o funcionalidades avanzadas de
acceso y gestión dentro del repositorio. Algunos ejemplos de usos de
metadatos de relaciones incluyen: (1) organizar objetos en
colecciones para soportar recolecciones selectivas de los proveedores
de servicios OAI; (2) definir relaciones bibliográficas entre objetos
tales como “has part”/”is part of”; 3) definir relaciones semánticas
entre recursos para registrar cómo los objetos se relacionan con una
taxonomía externa o conjunto de estándardes; (4) modelar una capa
de red en la que los recursos están enlazados basándose en
información contextual; (5) codificar jerarquías naturales de los
objetos; (6) establecer relaciones entre objetos de diferentes
colecciones, para mostrar, por ejemplo, que un documento particular
de una colección también puede ser considerado parte de otra
colección.
Estamos convencidos de que la extensibilidad de la arquitectura del
modelo de objeto digital de Fedora nos permitirá adaptarnos a los
rápidos y constantes cambios tecnológicos y a las nuevas formas de
contenidos que son inevitables.
Arquitectura de los servicios Fedora
Todas las funciones de Fedora, tanto en el nivel del objeto como del repositorio
se exponen como servicios web. El marco del servicio de Fedora está
concebido para facilitar la integración de nuevos servicios y funcionalidades
sobre el repositorio Fedora. Mientras que el repositorio en sí mismo expone sus
funcionalidades como un conjunto de interfaces de servicios web, todas estas
interfaces pertenecen a la aplicación web de Fedora que corre en su propio
Tomcat. El marco de servicios de Fedora permite construir nuevos servicios en
torno al repositorio núcleo como aplicaciones web “stand-alone” que corren
independientemente del repositorio Fedora. Esta aproximación aporta dos
17
ventajas fundamentales: (1) permite que se añadan nuevas funcionalidades
como servicios modulares que pueden interactuar con el repositorio Fedora y
sin embargo no forman parte de este repositorio; (2) facilita el co-desarrollo de
nuevos servicios Fedora, dado que cada servicio puede ser desarrollado y
conectado de forma independiente a la arquitectura central de Fedora.
La arquitectura de Fedora no está construida para ningún workflow o
aplicación de usuario final particular. Por ello, Fedora puede funcionar
como el substrato de un repositorio genérico sobre el cual se pueden
crear muchos tipos de aplicaciones y aprovechar las ventajas, en el
futuro, de los desarrollos en servicios web. La capacidad de crecer y
cambiar garantiza la longevidad de la arquitectura del modelo digital
Fedora.
18
Archivo y preservación de los objetos
Las capacidades de archivo y preservación de Fedora incluyen:
XML: los objetos XML de Fedora y el esquema sobre el que se basan
son preservados durante su carga, almacenamiento y exportación.
Versionado del contenido: Fedora permite seguir los cambios y
modificaciones de un objeto (el cambio, quién y cuándo se hizo)
añadiendo la nueva versión al objeto XML. Este nuevo item se añade
en cascada al objeto digital y se numera para mostrar la relación
entre el original y la versión. Ello permite recuperar antiguas
versiones del objeto realizando una búsqueda por fecha/hora o la
versión más actualizada si no se incluye el criterio de fecha en la
búsqueda.
Histórico: Cada objeto del repositorio Fedora contiene una auditoría
que preserva un registro de cada cambio realizado sobre el objeto.
Autenticación/organización
La versión de Fedora 2.1b incluye soporte para la autenticación, SSL,
y autorización usando políticas XACML. Estas medidas de seguridad
son gestionadas a través de un conjunto de políticas de XACML y con
información de autenticación a través de Tomcat o fuentes externas
de autenticación.
19
6.3. FEZ: interfaz web para el acceso y gestión de los objetos
Fedora.
Las principales funcionalidades de la aplicación FEZ son:















Diseñada para Fedora
Tipos de documentos basados en esquemas XML (XSD)
presentados en forma de formulario web HTML lo que permite
un alto grado de configuración en la creación pantallas de
interfaces web.
Utiliza tecnologías web de código abierto sencillas: PHP 5 y
MySQL 4.1
Búsqueda avanzada
Búsqueda por listados de materia, etc.
Procedimiento de auto-archivo para la carga de documentos en
el sistema.
Extracción automática de metadatos de preservación
Interfaz gráfica (GUI) del workflow de documentos configurable
y gestión del ciclo de vida del documento.
Autenticación y autorización LDAP (o Active Directory) y grupo
interno.
Security based on FezACML to describe user roles and rights on
a per object basis or through parent collection or community
security inheritance
Basado en comunidades y colecciones con las relaciones entre
objetos mapped con los datastream RELS-EXT.
Estadísticas
Security based at object granularity, drilled down from parent
Communities and Collections.
Tesauro
Conforme con el protocolo OAI-PMH (Open Archive InititativeProtocol Metadata Haversting)
20
21
Descargar