4. Instalación y Adaptación de DSpace a LAGO

Anuncio
Large Aperture Gamma Ray Burst Observatory
7TH WORKSHOP
TALLER DE LAGOVirtual
Presentado por:
Luis Alejandro Torres
Coautor:
Luis A. Nuñez
Guatemala, Junio de 2011
Large Aperture Gamma Ray Burst Observatory
OBJETIVOS
 Difundir en la comunidad LAGO la importancia de la adecuada documentación de
los datos, tanto adquiridos, procesados o simulados, con el fin de la correcta
ingestión de estos a LAGOVirtual.
 Enseñar a los miembros de la comunidad el correcto manejo de un repositorio de
datos, iniciando desde su instalación hasta el proceso de administración del
mismo.
 Enseñar a la comunidad la forma de almacenar datos en la plataforma y
demostrar las limitaciones del repositorio de datos DSpace y las capacidades
añadidas en la versión de LAGOVirtual.
 Mostrar la importancia de mantener un estándar desde el mismo momento de la
captura hasta el proceso de ingestión.
Large Aperture Gamma Ray Burst Observatory
CONTENIDO
1. DSpace – Introducción
1.1. ¿Qué es DSpace?
1.2. Tipos de Contenido.
1.3. Organización de Dspace
2. Datos, Metadatos y LAGOVirtual.
2.1. El almacenamiento de datos.
2.2. Como adquirir los datos para LAGO.
2.3. Los Metadatos en LAGOVirtual.
2.4. LAGOVirtual. ¿Repositorio de Datos o Plataforma de
trabajo Colaborativo?
3. Estructura de LAGOVirtual.
3.1. Organización de la Comunidad LAGO.
Large Aperture Gamma Ray Burst Observatory
4. Instalación y Adaptación de DSpace a LAGO
4.1. Proceso básico de instalación de un repositorio.
LAGODSpace – Un Repositorio para cada miembro de
la comunidad.
4.2. Personalización de LAGODSpace.
4.2.1. Creación de Comunidades - SubComunidades.
4.2.2. Creación de Colecciones.
4.2.3. Registro de Usuarios.
4.3. Ingestión de Datos en DSpace.
4.4. Inserción de metadatos al Esquema Dublin Core.
4.5. Inserción de nuevos esquemas de Metadatos.
5. Ingestión Masiva de Datos al repositorio.
5.1. Importación de datos a
LAGODSpace y el Formato Simple
de Archivo de DSpace.
Large Aperture Gamma Ray Burst Observatory
6. Ubicación de GRB´s – Trabajo en línea con los Satélites
6.1. Reducción de la Búsqueda de GRB´s en los Datos de LAGO
7. EL Futuro de LAGOVirtual – DURACLOUD.
8.1. Los repositorios de Datos en La Nube.
8. Discusión sobre los metadatos que deben ser implementados en la
captura de datos.
Large Aperture Gamma Ray Burst Observatory
1. DSpace – Introducción
1.1. ¿Qué es DSpace?
 DSpace es un software de Código Abierto que provee
herramientas de administración aplicadas a colecciones
digitales.
 Posee la capacidad de soportar un gran número de datos
almacenados al igual que una gran variedad de ellos
(libros, tesis, fotografías, videos, datos de investigación y
todo otro formato de contenido en medio digital).
Large Aperture Gamma Ray Burst Observatory
1. DSpace – Introducción
1.2. Tipos de Contenido.
Los repositorios digitales pueden incluir una amplia gama de contenidos para una variedad
de propósitos y usuarios.











Artículos de revistas.
Referencias bibliográficas (solo metadatos).
Libros, artículos y capítulos.
Conferencias y talleres de trabajos.
Tesis y disertaciones.
Informes sin publicar y documentos de trabajo.
Conjuntos de datos.
Contenido empaquetado de objetos de aprendizaje.
Material audiovisual y multimedia.
Software.
Patentes.
Large Aperture Gamma Ray Burst Observatory
1. DSpace – Introducción
1.3. Organización de Dspace.
DSpace fue creado con la idea e reflejar la estructura interna de las organizaciones a quien
fue dirigido, es decir, se organiza de manera jerárquica, presentando los siguientes niveles:
Comunidad
SubComunidad
Colección
Departamento
SubDepartamento Grupo de Investigación
Items
Items
Departamento
Tipo de Items
Items
Facultad
Escuela
Items
Estos niveles se presentan de manera descendente, en otras palabras se crean desde el nivel
más alto (Comunidad) hasta el nivel más bajo (Colecciones).
Large Aperture Gamma Ray Burst Observatory
2. Datos, Metadatos y LAGOVirtual.
2.1. El almacenamiento de datos.
 El almacenamiento masivo de datos de la comunidad obliga a crear una plataforma que
sirva de herramienta que permita una búsqueda simple y eficaz de los diferentes
eventos.
 Conocimiento y trabajo colaborativo.
 Permite a la comunidad reutilizar los datos y obtener resultados rápidos.
 La correcta catalogación de los datos mediante sus metadatos, evita la perdida de
tiempo, esfuerzo y recursos.
Large Aperture Gamma Ray Burst Observatory
2. Datos, Metadatos y LAGOVirtual.
2.2. Como adquirir los datos para LAGO.
Adquisición - LS
Folder (DAQ – Charge/Peak)
DD_MM_YY_H_M_S
Archivo de cabecera
Archivo de Datos
Archivo de Calibración
Large Aperture Gamma Ray Burst Observatory
2. Datos, Metadatos y LAGOVirtual.
2.3. Los Metadatos en LAGOVirtual.
ARCHIVO DE CABECERA – Separado por espacios









Código del país.
Institución.
Nombre del WCD.
Latitud y Longitud del WCD.
Voltaje del PMT.
Tipo de Investigación.
Temperatura del PMT.
Tipo de Fotomultiplicador.
Archivo de calibración.
ARCHIVO DE DATOS
Nombre del archivo




Fecha de inicio - captura de datos.
Hora de inicio - captura de datos (GMT).
Fecha de finalización - captura de datos.
Hora de finalización - captura de datos (GMT).
Contenido del archivo
 Fila con el nombre de cada Columna
Large Aperture Gamma Ray Burst Observatory
2. Datos, Metadatos y LAGOVirtual.
2.4. LAGOVirtual. ¿Repositorio de Datos o Plataforma de
trabajo Colaborativo?
Large Aperture Gamma Ray Burst Observatory
Large Aperture Gamma Ray Burst Observatory
3. Estructura de LAGOVirtual.
3.1. Organización de la Comunidad LAGO.
Large Aperture Gamma Ray Burst Observatory
4. Instalación y Adaptación de Dspace a LAGO
4.1. Proceso básico de instalación de un repositorio.
LAGODSpace – Un Repositorio para cada miembro de
la comunidad
PRERREQUISITOS
•
•
•
•
•
•
•
Sistema operativo Linux
Java JDK
Apache Maven
Apache Ant
Base de Datos PostgreSQL
Motor Servlet – Tomcat
Perl
Large Aperture Gamma Ray Burst Observatory
INSTALACIÓN
• Creación de usuario Dspace
createuser -U postgres -S -R -d -P dspace
• Creación de la base de datos desde el usuario dspace
createdb -U dspace -E UNICODE
• Edición de archivo [dspace-source]/dspace/config/dspace.cfg
dspace.dir -- debe ser el directorio conjunto de instalación [dspace](instalación)
dspace.url -- completar la URL de la página inicial del servidor de DSpace.
dspace.hostname -- completa - nombre del dominio del web server.
dspace.name -- "apropiado" – nombre del servidor, e.g. "Librería Digital".
db.password -- password de la base de datos que se introdujo en el paso anterior.
mail.server -- completo – nombre de dominio del servidor mail.
mail.from.address -- el "From" a donde se enviaran los correos de Dspace.
feedbback.recipient -- bandeja para el reenvió de correos.
mail.admin -- bandeja para el administrador del sitio de DSpace.
alert.recipient – bandeja para los errores/alertas (no es esencial pero necesario).
Registration.notify–bandeja para cuando se registren nuevos usuarios (optional).
Large Aperture Gamma Ray Burst Observatory
• Creación del directorio de instalación
mkdir [dspace]
chown dspace:dspace [dspace]
• Instalación de los paquetes
cd [dspace-source]/dspace/
mvn package
• Construcción de Dspace e Inicialización de la base de datos
cd [dspace-source]/dspace/target/dspace-[version]-build.dir
ant fresh_install
• Implementación de las aplicaciones WEB – Modificación del archivo
[Tomcat]/conf/server.xml
<Host name=“localhost” appBase=”[dspace]/webapps”
Large Aperture Gamma Ray Burst Observatory
• Creación de la cuenta inicial de administrador
[dspace]/bin/créate-administrator
• Arranque inicial de Dspace
Service tomcat6 restart
• Ingreso a la interfaz Dspace
Interfaz de usuario JSP – http://[nombre]:8080/jspui
Interfaz de usuario XML (aka, Manakin) – http://[nombre]:8080/xmlui
Interfaz OAI-PMH – http://[nombre]:8080/oai/request?verb=Identify
(podría devolver una respuesta basada en XML)
Large Aperture Gamma Ray Burst Observatory
4. Instalación y Adaptación de Dspace a LAGO
4.2. Personalización de LAGODSpace.
Large Aperture Gamma Ray Burst Observatory
4. Instalación y Adaptación de Dspace a LAGO
4.2. Personalización de LAGODSpace.
4.2.1. Creación de Comunidades - SubComunidades
I.
II.
III.
Identificarse como usuario
(administrador) de DSpace.
Hacer clic en el enlace Comunidades en
el menú LISTAR ubicado a la izquierda.
En el menú Herramientas
administrativas ubicado a la derecha,
seleccione Crear comunidad. Si se
encuentra dentro de una Comunidad, la
opción mostrada en el menú es Crear
Subcomunidad
Large Aperture Gamma Ray Burst Observatory
IV. Una vez editado los campos necesarios, se debe hacer clic en el botón Crear.
Aparecerá la pantalla inicial de la nueva comunidad.
V. En este punto se tiene la opción de crear una subcomunidad o una colección
utilizando las Herramientas administrativas.
Large Aperture Gamma Ray Burst Observatory
4. Instalación y Adaptación de Dspace a LAGO
4.2. Personalización de LAGODSpace.
4.2.2. Creación de Colecciones.
I. Ingresar a DSpace como usuario (administrador).
II. Seleccione la Comunidad en donde se desea crear la nueva Colección.
III. En el menú de Herramientas de administrador ubicado en la parte derecha,
seleccione Crear una colección.
IV. Describir la Colección a crear.
V. La siguiente página permite seleccionar las personas autorizadas para cargar
documentos a esta colección. Se puede hacer en este momento o hacerlo
posteriormente.
Large Aperture Gamma Ray Burst Observatory
4. Instalación y Adaptación de Dspace a LAGO
4.2. Personalización de LAGODSpace.
4.2.3. Registro de Usuarios.
El registro de usuarios en DSpace (LAGOVirtual) se hace solamente bajo la
autorización del administrador del sistema.
Para solicitar el acceso como nuevo usuario se debe acceder al enlace Nuevo
usuario, se introduce la dirección de email completa e inmediatamente DSpace
enviará un correo electrónico con el enlace para definir una nueva contraseña.
Esto no indica que tendrá acceso a DSpace, solamente se habrá realizado el
registro correctamente y hasta que el administrador autorice al nuevo usuario no
se podrá acceder a la plataforma.
Large Aperture Gamma Ray Burst Observatory
4. Instalación y Adaptación de DSpace a LAGO
4.3. Ingestión de Datos en DSpace.
I.
II.
Iniciar sesión.
Inicio de la Ingestión. Existen varias formas para iniciar la carga de un nuevo ítem en DSpace. La más sencilla se
muestra después del inicio de sesión en la parte central de la aplicación - Iniciar un nuevo envío. También es posible
hacer el nuevo envío ingresando a la opción Comunidades en el menú de la izquierda y seleccionando la Colección en
donde se desea ingerir el nuevo ítem y hacer clic en Enviar a esta colección. Por último se agregó una opción rápida
de ingestión en el inicio de la aplicación.
III. Descripción del documento. En este paso se muestran una serie de opciones que pueden ser elegidas de forma
individual o combinada.
IV. Información general. Esta información se presenta de forma adicional. Si el documento se ha publicado anteriormente
en revistas u otro medio, se debe introducir los datos bibliográficos pertinentes (Editor, Título de la revista, Volumen,
Número, Fecha y Páginas). Si no ha sido publicado anteriormente se puede asignar un Series/Report No. para
clasificarlo de manera interna en la colección.
V. Palabras claves, resumen. La siguiente ventana preguntara por las palabras claves, resumen y otra información sobre
el documento (No es requisito proporcionar esta información).
Large Aperture Gamma Ray Burst Observatory
VI. Carga del archivo. Después de terminar la descripción del ítem se prosigue con la carga del archivo. No se puede
olvidar que si el documento ya ha sido publicado no es posible cargarlo todo, debido a que los derechos sobre este
han sido cedidos a la revista y se deben respetar los derechos de autor. La carga del archivo en DSpace no es
necesaria y puede hacerse de manera posterior mediante la edición del ítem correspondiente.
VII. Paso de Verificación. Este paso muestra toda la información que se ha proporcionado para describir el documento, si
se desea, puede hacerse las modificaciones necesarias antes de proseguir, teniendo en cuenta que después de la
terminación de la ingestión, solo un administrador tiene los privilegios para editar esta información.
VIII. Proceso completado. Por último se muestra una ventana informativa, evidenciando que el proceso de ingestión se ha
llevado con éxito. DSpace enviará un correo informando de este envió tanto al submitter como a los grupos 1 y 2 para
aprobar o rechazar dicho envío (esto solo es válido si los grupos han sido implementados).
Large Aperture Gamma Ray Burst Observatory
4. Instalación y Adaptación de DSpace a LAGO
4.4. Inserción de metadatos al Esquema Dublin Core.
Como requisitos previos a la inserción de nuevos metadatos es necesario:
 Tener definidos los nuevos metadatos a agregar.
 Tener una cuenta administrativa.
 Haber iniciado sesión dentro de DSpace.
Nuevos metadatos en el esquema DC
I.
II.
III.
IV.
Una vez iniciada la sesión ingresar a las herramientas administrativas de DSpace, seleccionando Administrar en el menú del lado
derecho de la pagina principal de DSpace.
En herramientas administrativas seleccionar Registro de metadatos (menú lateral derecho).
Dentro de Registro de metadatos se encuentran los esquemas que existen dentro de DSpace, para agregar nuevos metadatos al
esquema DC es necesario ingresar en la URLhttp://dublincore.org/documents/dcmi-terms/ para ver los campos que pueden ser
añadidos dentro del estándar. Esquemas de registro de metadatos
En el registro de los metadatos se muestra la información del esquema DC.
Large Aperture Gamma Ray Burst Observatory
Registro de campos de metadatos
 Para agregar nuevos metadatos al final de la descripción del esquema viene Añadir campo
metadatos donde se ingresa la información del nuevo metadato.
Añadir campo metadatos
Para crear una campo nuevo debe proporcionar una pareja única de elemento y cualificador. El cualificador
puede estar en blanco si se desea y el elemento cualificador no pueden contener espacios, guiones bajos (_)
o puntos.
I. Elemento: nombre del elemento (Ej. date).
II. Cualificar: subelemento (Ej. issued)
III. Nota de alcance: Descripción del metadato.
Una vez ingresado el metadato, este aparecerá en la lista del esquema.
Large Aperture Gamma Ray Burst Observatory
4. Instalación y Adaptación de DSpace a LAGO
4.5. Inserción de nuevos esquemas de Metadatos.
Como requisitos previos a la inserción de nuevos metadatos es necesario:
 Tener definidos el nuevo esquema de metadatos a agregar.
 Tener una cuenta administrativa.
 Haber iniciado sesión dentro de DSpace.
 Estar dentro de Registro de Metadatos.
Dentro del Registro de Metadatos se encuentran las opciones de Namespace y Nombre donde irán los datos
del nuevo esquema.
Large Aperture Gamma Ray Burst Observatory
Esquemas de registro de metadatos
 Una vez que se guardan los cambios, el esquema aparece en el listado.
 Para ingresar los metadatos del esquema ingresaremos en la URL que aparece en el
Namespace lago (Nuevo esquema).
 Una vez dentro de las propiedades del esquema es necesario ingresar los metadatos que lo
conformaran (el proceso es el mismo que al agregar nuevos metadatos en el esquema DC).
Registro de campos de metadatos
 Al terminar de agregar cada metadato se desplegara la lista de los metadatos del esquema.
Large Aperture Gamma Ray Burst Observatory
5. Ingestión Masiva de Datos al repositorio.
5.1. Importación de datos a
LAGODSpace y el Formato Simple
de Archivo de DSpace.
Large Aperture Gamma Ray Burst Observatory
6. Ubicación de GRB´s – Trabajo en línea con los Satélites
6.1. Reducción de la Búsqueda de GRB´s en los Datos de LAGO
 Script que monitorea a los satélites:
 Fermi
 HETE-2
 Integral
 Konus-Wind
 SuperAgile
 Suzaku
 Swift
 Según las coordenadas ecuatoriales, se ubican los laboratorios que pudieron
observar el GRB.
 Agrupa los datos de los distintos observatorios por GRB.
Large Aperture Gamma Ray Burst Observatory
7. EL Futuro de LAGOVirtual – DURACLOUD.
7.1. Los repositorios de Datos en La Nube.
Large Aperture Gamma Ray Burst Observatory
8. Discusión sobre los metadatos que deben ser implementados en la
captura de datos.
Descargar