Large Aperture Gamma Ray Burst Observatory 7TH WORKSHOP TALLER DE LAGOVirtual Presentado por: Luis Alejandro Torres Coautor: Luis A. Nuñez Guatemala, Junio de 2011 Large Aperture Gamma Ray Burst Observatory OBJETIVOS Difundir en la comunidad LAGO la importancia de la adecuada documentación de los datos, tanto adquiridos, procesados o simulados, con el fin de la correcta ingestión de estos a LAGOVirtual. Enseñar a los miembros de la comunidad el correcto manejo de un repositorio de datos, iniciando desde su instalación hasta el proceso de administración del mismo. Enseñar a la comunidad la forma de almacenar datos en la plataforma y demostrar las limitaciones del repositorio de datos DSpace y las capacidades añadidas en la versión de LAGOVirtual. Mostrar la importancia de mantener un estándar desde el mismo momento de la captura hasta el proceso de ingestión. Large Aperture Gamma Ray Burst Observatory CONTENIDO 1. DSpace – Introducción 1.1. ¿Qué es DSpace? 1.2. Tipos de Contenido. 1.3. Organización de Dspace 2. Datos, Metadatos y LAGOVirtual. 2.1. El almacenamiento de datos. 2.2. Como adquirir los datos para LAGO. 2.3. Los Metadatos en LAGOVirtual. 2.4. LAGOVirtual. ¿Repositorio de Datos o Plataforma de trabajo Colaborativo? 3. Estructura de LAGOVirtual. 3.1. Organización de la Comunidad LAGO. Large Aperture Gamma Ray Burst Observatory 4. Instalación y Adaptación de DSpace a LAGO 4.1. Proceso básico de instalación de un repositorio. LAGODSpace – Un Repositorio para cada miembro de la comunidad. 4.2. Personalización de LAGODSpace. 4.2.1. Creación de Comunidades - SubComunidades. 4.2.2. Creación de Colecciones. 4.2.3. Registro de Usuarios. 4.3. Ingestión de Datos en DSpace. 4.4. Inserción de metadatos al Esquema Dublin Core. 4.5. Inserción de nuevos esquemas de Metadatos. 5. Ingestión Masiva de Datos al repositorio. 5.1. Importación de datos a LAGODSpace y el Formato Simple de Archivo de DSpace. Large Aperture Gamma Ray Burst Observatory 6. Ubicación de GRB´s – Trabajo en línea con los Satélites 6.1. Reducción de la Búsqueda de GRB´s en los Datos de LAGO 7. EL Futuro de LAGOVirtual – DURACLOUD. 8.1. Los repositorios de Datos en La Nube. 8. Discusión sobre los metadatos que deben ser implementados en la captura de datos. Large Aperture Gamma Ray Burst Observatory 1. DSpace – Introducción 1.1. ¿Qué es DSpace? DSpace es un software de Código Abierto que provee herramientas de administración aplicadas a colecciones digitales. Posee la capacidad de soportar un gran número de datos almacenados al igual que una gran variedad de ellos (libros, tesis, fotografías, videos, datos de investigación y todo otro formato de contenido en medio digital). Large Aperture Gamma Ray Burst Observatory 1. DSpace – Introducción 1.2. Tipos de Contenido. Los repositorios digitales pueden incluir una amplia gama de contenidos para una variedad de propósitos y usuarios. Artículos de revistas. Referencias bibliográficas (solo metadatos). Libros, artículos y capítulos. Conferencias y talleres de trabajos. Tesis y disertaciones. Informes sin publicar y documentos de trabajo. Conjuntos de datos. Contenido empaquetado de objetos de aprendizaje. Material audiovisual y multimedia. Software. Patentes. Large Aperture Gamma Ray Burst Observatory 1. DSpace – Introducción 1.3. Organización de Dspace. DSpace fue creado con la idea e reflejar la estructura interna de las organizaciones a quien fue dirigido, es decir, se organiza de manera jerárquica, presentando los siguientes niveles: Comunidad SubComunidad Colección Departamento SubDepartamento Grupo de Investigación Items Items Departamento Tipo de Items Items Facultad Escuela Items Estos niveles se presentan de manera descendente, en otras palabras se crean desde el nivel más alto (Comunidad) hasta el nivel más bajo (Colecciones). Large Aperture Gamma Ray Burst Observatory 2. Datos, Metadatos y LAGOVirtual. 2.1. El almacenamiento de datos. El almacenamiento masivo de datos de la comunidad obliga a crear una plataforma que sirva de herramienta que permita una búsqueda simple y eficaz de los diferentes eventos. Conocimiento y trabajo colaborativo. Permite a la comunidad reutilizar los datos y obtener resultados rápidos. La correcta catalogación de los datos mediante sus metadatos, evita la perdida de tiempo, esfuerzo y recursos. Large Aperture Gamma Ray Burst Observatory 2. Datos, Metadatos y LAGOVirtual. 2.2. Como adquirir los datos para LAGO. Adquisición - LS Folder (DAQ – Charge/Peak) DD_MM_YY_H_M_S Archivo de cabecera Archivo de Datos Archivo de Calibración Large Aperture Gamma Ray Burst Observatory 2. Datos, Metadatos y LAGOVirtual. 2.3. Los Metadatos en LAGOVirtual. ARCHIVO DE CABECERA – Separado por espacios Código del país. Institución. Nombre del WCD. Latitud y Longitud del WCD. Voltaje del PMT. Tipo de Investigación. Temperatura del PMT. Tipo de Fotomultiplicador. Archivo de calibración. ARCHIVO DE DATOS Nombre del archivo Fecha de inicio - captura de datos. Hora de inicio - captura de datos (GMT). Fecha de finalización - captura de datos. Hora de finalización - captura de datos (GMT). Contenido del archivo Fila con el nombre de cada Columna Large Aperture Gamma Ray Burst Observatory 2. Datos, Metadatos y LAGOVirtual. 2.4. LAGOVirtual. ¿Repositorio de Datos o Plataforma de trabajo Colaborativo? Large Aperture Gamma Ray Burst Observatory Large Aperture Gamma Ray Burst Observatory 3. Estructura de LAGOVirtual. 3.1. Organización de la Comunidad LAGO. Large Aperture Gamma Ray Burst Observatory 4. Instalación y Adaptación de Dspace a LAGO 4.1. Proceso básico de instalación de un repositorio. LAGODSpace – Un Repositorio para cada miembro de la comunidad PRERREQUISITOS • • • • • • • Sistema operativo Linux Java JDK Apache Maven Apache Ant Base de Datos PostgreSQL Motor Servlet – Tomcat Perl Large Aperture Gamma Ray Burst Observatory INSTALACIÓN • Creación de usuario Dspace createuser -U postgres -S -R -d -P dspace • Creación de la base de datos desde el usuario dspace createdb -U dspace -E UNICODE • Edición de archivo [dspace-source]/dspace/config/dspace.cfg dspace.dir -- debe ser el directorio conjunto de instalación [dspace](instalación) dspace.url -- completar la URL de la página inicial del servidor de DSpace. dspace.hostname -- completa - nombre del dominio del web server. dspace.name -- "apropiado" – nombre del servidor, e.g. "Librería Digital". db.password -- password de la base de datos que se introdujo en el paso anterior. mail.server -- completo – nombre de dominio del servidor mail. mail.from.address -- el "From" a donde se enviaran los correos de Dspace. feedbback.recipient -- bandeja para el reenvió de correos. mail.admin -- bandeja para el administrador del sitio de DSpace. alert.recipient – bandeja para los errores/alertas (no es esencial pero necesario). Registration.notify–bandeja para cuando se registren nuevos usuarios (optional). Large Aperture Gamma Ray Burst Observatory • Creación del directorio de instalación mkdir [dspace] chown dspace:dspace [dspace] • Instalación de los paquetes cd [dspace-source]/dspace/ mvn package • Construcción de Dspace e Inicialización de la base de datos cd [dspace-source]/dspace/target/dspace-[version]-build.dir ant fresh_install • Implementación de las aplicaciones WEB – Modificación del archivo [Tomcat]/conf/server.xml <Host name=“localhost” appBase=”[dspace]/webapps” Large Aperture Gamma Ray Burst Observatory • Creación de la cuenta inicial de administrador [dspace]/bin/créate-administrator • Arranque inicial de Dspace Service tomcat6 restart • Ingreso a la interfaz Dspace Interfaz de usuario JSP – http://[nombre]:8080/jspui Interfaz de usuario XML (aka, Manakin) – http://[nombre]:8080/xmlui Interfaz OAI-PMH – http://[nombre]:8080/oai/request?verb=Identify (podría devolver una respuesta basada en XML) Large Aperture Gamma Ray Burst Observatory 4. Instalación y Adaptación de Dspace a LAGO 4.2. Personalización de LAGODSpace. Large Aperture Gamma Ray Burst Observatory 4. Instalación y Adaptación de Dspace a LAGO 4.2. Personalización de LAGODSpace. 4.2.1. Creación de Comunidades - SubComunidades I. II. III. Identificarse como usuario (administrador) de DSpace. Hacer clic en el enlace Comunidades en el menú LISTAR ubicado a la izquierda. En el menú Herramientas administrativas ubicado a la derecha, seleccione Crear comunidad. Si se encuentra dentro de una Comunidad, la opción mostrada en el menú es Crear Subcomunidad Large Aperture Gamma Ray Burst Observatory IV. Una vez editado los campos necesarios, se debe hacer clic en el botón Crear. Aparecerá la pantalla inicial de la nueva comunidad. V. En este punto se tiene la opción de crear una subcomunidad o una colección utilizando las Herramientas administrativas. Large Aperture Gamma Ray Burst Observatory 4. Instalación y Adaptación de Dspace a LAGO 4.2. Personalización de LAGODSpace. 4.2.2. Creación de Colecciones. I. Ingresar a DSpace como usuario (administrador). II. Seleccione la Comunidad en donde se desea crear la nueva Colección. III. En el menú de Herramientas de administrador ubicado en la parte derecha, seleccione Crear una colección. IV. Describir la Colección a crear. V. La siguiente página permite seleccionar las personas autorizadas para cargar documentos a esta colección. Se puede hacer en este momento o hacerlo posteriormente. Large Aperture Gamma Ray Burst Observatory 4. Instalación y Adaptación de Dspace a LAGO 4.2. Personalización de LAGODSpace. 4.2.3. Registro de Usuarios. El registro de usuarios en DSpace (LAGOVirtual) se hace solamente bajo la autorización del administrador del sistema. Para solicitar el acceso como nuevo usuario se debe acceder al enlace Nuevo usuario, se introduce la dirección de email completa e inmediatamente DSpace enviará un correo electrónico con el enlace para definir una nueva contraseña. Esto no indica que tendrá acceso a DSpace, solamente se habrá realizado el registro correctamente y hasta que el administrador autorice al nuevo usuario no se podrá acceder a la plataforma. Large Aperture Gamma Ray Burst Observatory 4. Instalación y Adaptación de DSpace a LAGO 4.3. Ingestión de Datos en DSpace. I. II. Iniciar sesión. Inicio de la Ingestión. Existen varias formas para iniciar la carga de un nuevo ítem en DSpace. La más sencilla se muestra después del inicio de sesión en la parte central de la aplicación - Iniciar un nuevo envío. También es posible hacer el nuevo envío ingresando a la opción Comunidades en el menú de la izquierda y seleccionando la Colección en donde se desea ingerir el nuevo ítem y hacer clic en Enviar a esta colección. Por último se agregó una opción rápida de ingestión en el inicio de la aplicación. III. Descripción del documento. En este paso se muestran una serie de opciones que pueden ser elegidas de forma individual o combinada. IV. Información general. Esta información se presenta de forma adicional. Si el documento se ha publicado anteriormente en revistas u otro medio, se debe introducir los datos bibliográficos pertinentes (Editor, Título de la revista, Volumen, Número, Fecha y Páginas). Si no ha sido publicado anteriormente se puede asignar un Series/Report No. para clasificarlo de manera interna en la colección. V. Palabras claves, resumen. La siguiente ventana preguntara por las palabras claves, resumen y otra información sobre el documento (No es requisito proporcionar esta información). Large Aperture Gamma Ray Burst Observatory VI. Carga del archivo. Después de terminar la descripción del ítem se prosigue con la carga del archivo. No se puede olvidar que si el documento ya ha sido publicado no es posible cargarlo todo, debido a que los derechos sobre este han sido cedidos a la revista y se deben respetar los derechos de autor. La carga del archivo en DSpace no es necesaria y puede hacerse de manera posterior mediante la edición del ítem correspondiente. VII. Paso de Verificación. Este paso muestra toda la información que se ha proporcionado para describir el documento, si se desea, puede hacerse las modificaciones necesarias antes de proseguir, teniendo en cuenta que después de la terminación de la ingestión, solo un administrador tiene los privilegios para editar esta información. VIII. Proceso completado. Por último se muestra una ventana informativa, evidenciando que el proceso de ingestión se ha llevado con éxito. DSpace enviará un correo informando de este envió tanto al submitter como a los grupos 1 y 2 para aprobar o rechazar dicho envío (esto solo es válido si los grupos han sido implementados). Large Aperture Gamma Ray Burst Observatory 4. Instalación y Adaptación de DSpace a LAGO 4.4. Inserción de metadatos al Esquema Dublin Core. Como requisitos previos a la inserción de nuevos metadatos es necesario: Tener definidos los nuevos metadatos a agregar. Tener una cuenta administrativa. Haber iniciado sesión dentro de DSpace. Nuevos metadatos en el esquema DC I. II. III. IV. Una vez iniciada la sesión ingresar a las herramientas administrativas de DSpace, seleccionando Administrar en el menú del lado derecho de la pagina principal de DSpace. En herramientas administrativas seleccionar Registro de metadatos (menú lateral derecho). Dentro de Registro de metadatos se encuentran los esquemas que existen dentro de DSpace, para agregar nuevos metadatos al esquema DC es necesario ingresar en la URLhttp://dublincore.org/documents/dcmi-terms/ para ver los campos que pueden ser añadidos dentro del estándar. Esquemas de registro de metadatos En el registro de los metadatos se muestra la información del esquema DC. Large Aperture Gamma Ray Burst Observatory Registro de campos de metadatos Para agregar nuevos metadatos al final de la descripción del esquema viene Añadir campo metadatos donde se ingresa la información del nuevo metadato. Añadir campo metadatos Para crear una campo nuevo debe proporcionar una pareja única de elemento y cualificador. El cualificador puede estar en blanco si se desea y el elemento cualificador no pueden contener espacios, guiones bajos (_) o puntos. I. Elemento: nombre del elemento (Ej. date). II. Cualificar: subelemento (Ej. issued) III. Nota de alcance: Descripción del metadato. Una vez ingresado el metadato, este aparecerá en la lista del esquema. Large Aperture Gamma Ray Burst Observatory 4. Instalación y Adaptación de DSpace a LAGO 4.5. Inserción de nuevos esquemas de Metadatos. Como requisitos previos a la inserción de nuevos metadatos es necesario: Tener definidos el nuevo esquema de metadatos a agregar. Tener una cuenta administrativa. Haber iniciado sesión dentro de DSpace. Estar dentro de Registro de Metadatos. Dentro del Registro de Metadatos se encuentran las opciones de Namespace y Nombre donde irán los datos del nuevo esquema. Large Aperture Gamma Ray Burst Observatory Esquemas de registro de metadatos Una vez que se guardan los cambios, el esquema aparece en el listado. Para ingresar los metadatos del esquema ingresaremos en la URL que aparece en el Namespace lago (Nuevo esquema). Una vez dentro de las propiedades del esquema es necesario ingresar los metadatos que lo conformaran (el proceso es el mismo que al agregar nuevos metadatos en el esquema DC). Registro de campos de metadatos Al terminar de agregar cada metadato se desplegara la lista de los metadatos del esquema. Large Aperture Gamma Ray Burst Observatory 5. Ingestión Masiva de Datos al repositorio. 5.1. Importación de datos a LAGODSpace y el Formato Simple de Archivo de DSpace. Large Aperture Gamma Ray Burst Observatory 6. Ubicación de GRB´s – Trabajo en línea con los Satélites 6.1. Reducción de la Búsqueda de GRB´s en los Datos de LAGO Script que monitorea a los satélites: Fermi HETE-2 Integral Konus-Wind SuperAgile Suzaku Swift Según las coordenadas ecuatoriales, se ubican los laboratorios que pudieron observar el GRB. Agrupa los datos de los distintos observatorios por GRB. Large Aperture Gamma Ray Burst Observatory 7. EL Futuro de LAGOVirtual – DURACLOUD. 7.1. Los repositorios de Datos en La Nube. Large Aperture Gamma Ray Burst Observatory 8. Discusión sobre los metadatos que deben ser implementados en la captura de datos.