Reflexiones sobre la gestión y custodia de datos - SCOR-ES

Anuncio
Reflexiones sobre la gestión y
custodia de datos oceanográficos
en España. Recursos existentes y
recomendaciones para el futuro
Marta Estrada, Enrique Álvarez, Antonio Barragán,
Óscar Bermúdez, Mª Jesús García, Alicia Lavín,
Pere Masqué, Fiz F. Pérez, Jaume Piera
SCOR
Scientific Committee on Oceanic Research
Comité Científico sobre Investigación Oceánica
Representación española
Reflexiones sobre la gestión y
custodia de datos oceanográficos
en España. Recursos existentes y
recomendaciones para el futuro
Marta Estrada (coordinadora), Enrique Álvarez, Antonio Barragán,
Óscar Bermúdez, Mª Jesús García, Alicia Lavín,
Pere Masqué, Fiz F. Pérez, Jaume Piera
SCOR
Scientific Committee on Oceanic Research
Comité Científico sobre Investigación Oceánica
Representación española
Grupo de Trabajo de SCOR-España
Estrada, Marta (coordinadora)
Álvarez, Enrique
Barragán Antonio
Bermúdez, Óscar
García, Mª Jesús
Lavín, Alicia
Masqué, Pere
Pérez, Fiz F.
Piera, Jaume
Con la colaboración de:
Chic, Òscar
Díez, Susana
Agradecimientos.
La preparación de este informe ha sido posible gracias a una Acción Complementaria Internacional
sobre “Actividad SCOR en España” (PCI2005-A5-0141), concedida por el Ministerio de Educación y
Ciencia (MEC). Agradecemos a D. Severino Falcón y a Da. Ángeles Yuste, del MEC, la valiosa ayuda
prestada en diversas fases de este proyecto.
Este documento puede encontrarse en:
http://www.scor-es.org/documentacion/Reflexiones_Gestion_Datos.pdf
ÍNDICE
RESUMEN EJECUTIVO
1. Introducción
2. Términos de referencia del Grupo de Trabajo
3. Análisis de la situación actual en España
4. Recomendaciones
4.1 ¿Qué debería contemplar el sistema de gestión de datos oceanográficos en España?
4.1.1 Recopilación, control de calidad y archivo de datos de manera que queden disponibles
para el futuro
4.1.2. Distribución de datos a científicos, industria y el público.
4.1.3. Establecimiento de protocolos para la adquisición y tratamiento de datos
4.1.4. Desarrollo de productos de datos adecuados
4.1.5 Adopción de una Política de datos
4.2. Acciones requeridas
4.2.1. El centro Coordinador
4.2.2. Centros Acreditados
4.2.3. Estructura y gobernancia del centro Coordinador
4.2.4. Financiación
4.2.5. Priorización de tipos de datos
4.2.6. Elaboración de la Política de datos
ANEXOS
A. El contexto español e internacional
A.1. Marco administrativo en la Unión Europea
A.2. Iniciativas internacionales
A.2.2. GEO-GEOSS
A.2.3. EuroGOOS
A.2.4. IBI-ROOS
A.2.5. SeaDataNet
A.2.6. PANGAEA
A.3. Gestión de datos oceanográficos en Francia, Gran Bretaña y Estados Unidos
A.3.1. Francia. Systèmes d’Informations Scientifiques pour la Mer (SISMER)
A.3.2. Gestión de datos marinos en el Reino Unido de Gran Bretaña
A.3.3. Estados Unidos. El Integrated Ocean Observing System (IOOS)
A.4. Algunas iniciativas españolas
A.4.1. CNDP. Centro Nacional de Datos Polares
A.4.2. El proyecto ESEOO
A.4.3. Centro de datos del Instituto Español de Oceanografía
A.4.4. Sistemas de datos de Puertos del Estado
A.4.5. SAIDIN (Satellite Image Database Interface). CSIC
A.4.6. IDEE, IDECSIC
B. Conceptos básicos
B.1. Definiciones
B.1.1. Datos
B.1.2. Metadatos
B.1.3. Conjuntos de datos
B.1.4. Productos de datos
B.1.5. Bases de datos
B.2. Sistemas distribuidos y centralizados
B.2.1. Centralizados
B.2.2. Distribuidos
B.3. Modelos de datos
B.4. Formatos de metadatos
B.5. Formatos de datos espaciales
B.5.1. Mapas de bits y mallas
B.5.2. Datos vectoriales
B.6. ESEOOXML
C. Glosario
D. Miembros del Grupo de Trabajo
Resumen ejecutivo
El conocimiento científico de los océanos es fundamental para la toma de decisiones que fomenten
el bienestar de la población humana, reduzcan las pérdidas de vida y propiedades debidas a riesgos
naturales, y permitan una mejor conservación de la biodiversidad y del ambiente global. Para avanzar
en este conocimiento es necesaria una coordinación global del acceso a datos e información científica de
alta calidad. Este enfoque, reconocido en numerosas propuestas internacionales, requiere colaboración
a través de fronteras estatales y la existencia de una gestión adecuada de los datos oceanográficos en
cada país.
En España existen varios centros y servicios de datos oceanográficos, a cargo de diversas instituciones
individuales o grupos de instituciones, que realizan una meritoria actividad. Sin embargo, ninguno de
ellos tiene ni la misión ni los medios para ejercer una gestión coordinada de datos oceanográficos a nivel
estatal.
Es fundamental la creación de una estructura que permita la integración y gestión de toda la
información oceanográfica dispersa, que ofrezca los servicios de datos que los centros existentes no
pueden ahora proporcionar y que genere productos de valor añadido para la sociedad.
Esta estructura podría estar constituida por “Centro Coordinador” de nueva creación, que
coordinaría una red de “Centros Acreditados”. El Centro Coordinador sería una institución o figura
jurídica nueva. Los Centros Acreditados incluirían los centros y servicios ya existentes que superasen
unas determinadas condiciones.
El Centro Coordinador debería contar con el personal científico y técnico necesario y un Director de
reconocida experiencia. El funcionamiento del centro estaría supervisado por un Comité de Dirección,
en el que estarían representados los principales organismos estatales y de Comunidades Autónomas
con actividad en el campo de la obtención de datos oceanográficos.
Las funciones del Centro Coordinador incluirían:
- Recopilar, validar, almacenar y custodiar los datos que se le confíen.
- Garantizar el acceso fiable y eficiente a los datos oceanográficos generados en España o
disponibles a través de organizaciones internacionales.
- Actuar como centro de datos para los datos generados por OPIS (Organismos Públicos de
Investigación) que no dispongan de un centro de datos acreditado.
El Centro Coordinador debería contar con una financiación estable, procedente de fuentes públicas,
que cubriese una parte sustancial de sus costes básicos de funcionamiento. Debería asegurarse también
la continuidad de los Centros Acreditados que se aprueben. Los proyectos financiados con dinero
público deberían suministrar los datos obtenidos, de acuerdo con la política de datos que se adopte, al
Centro Coordinador o a un Centro Acreditado. Para que este objetivo sea factible, debería preverse un
sistema de financiación adecuado.
1. Introducción
El conocimiento de cómo funcionan los océanos es fundamental para la toma de decisiones que
fomenten el bienestar de la población humana, reduzcan las pérdidas de vida y propiedades debidas
a riesgos naturales y permitan una mejor conservación del ambiente global. Para avanzar en este
conocimiento es necesaria una coordinación global del acceso a datos e información científica de alta
calidad. Este enfoque requiere no sólo la colaboración a través de fronteras estatales, sino la existencia
de servicios de datos oceanográficos en cada país.
Uno de los retos con que se enfrenta la investigación oceanográfica en España es el de establecer un
sistema adecuado de almacenamiento y gestión de datos. La Jornada sobre Diagnóstico y Proyección de
la Investigación Marina en España, celebrada el 20 de septiembre de 2005 en la Dirección General de
Investigación del Ministerio de Educación y Ciencia, Madrid, identificó una serie de problemas, entre
los que se cuenta la dificultad de obtener datos o metadatos de campañas o proyectos financiados con
fondos públicos, o el que a veces haya que duplicar esfuerzos para repetir información existente, pero
que no estaba disponible para toda la comunidad. Por otra parte, se puso de manifiesto la existencia, en
España, de algunas iniciativas interesantes.
Entre los objetivos de SCOR (Scientific Committee on Oceanic Research) está el de contribuir a
mejorar la resolución de problemas conceptuales y metodológicos que entorpezcan la investigación
oceanográfica. En relación con este objetivo, y para contribuir a resolver los problemas citados en el
apartado anterior, la Representación Española de SCOR (SCOR-Es) decidió convocar un grupo de
trabajo (GT) sobre el tema: “Reflexiones sobre la gestión y custodia de datos oceanográficos en España.
Recursos existentes y recomendaciones para el futuro”.
2.Términos de referencia del GT
La misión de este GT se resume en los siguientes términos de referencia:
- Revisar las principales iniciativas sobre archivo y gestión de bases de datos/metadatos
oceanográficos disponibles a nivel español e internacional.
- Identificar las principales lagunas existentes entre las iniciativas disponibles y las necesidades de
la comunidad oceanográfica española y de la sociedad en general.
- Desarrollar recomendaciones sobre cómo podría estructurarse la gestión y custodia de datos
oceanográficos españoles para solucionar los eventuales problemas detectados.
- Preparar y publicar un informe con las recomendaciones del GT y con los aspectos más relevantes
de la información recopilada
Este documento recoge las consideraciones del GT. Incluye un análisis de la situación actual en
España y recomendaciones de actuación. Los anexos presentan información sobre diversas iniciativas
internacionales y estatales, y sobre conceptos básicos de gestión de datos.
3. Análisis de la situación actual en España
Como se ha comentado en la introducción, las conclusiones de la Jornada sobre Diagnóstico y
Proyección de la Investigación Marina en España, señalaban una serie de problemas de la gestión de
datos oceanográficos en España. A diferencia de lo que ocurre en países de nuestro entorno, España
presenta una serie de deficiencias de infraestructuras y servicios, en particular por lo que se refiere a la
custodia y gestión de datos.
Del examen de la situación realizado por los miembros del GT se deriva el siguiente diagnóstico
general, expresado en la metodología DAFO (Debilidades, Amenazas, Fortalezas, Oportunidades).
Debilidades
- Variedad de los agentes implicados en la financiación de la investigación y en la obtención de
datos. En España existen varios centros de datos (véase A.4) a cargo de distintas instituciones, pero
ninguno tiene la misión (ni los medios) para ejercer la gestión de datos oceanográficos a nivel estatal.
Las debilidades citadas a continuación son, en parte, una consecuencia de ésta.
- Falta de política de datos global a nivel nacional e internacional (incluida la necesidad de
reconocimiento a los suministradores de datos).
- Muchos datos no están custodiados en depósitos fiables. Por ejemplo, se encuentran sólo en carpetas
o en ficheros del investigador responsable.
- Falta de coordinación entre las iniciativas existentes, fragmentación de depósitos de datos y falta
de interconexión entre ellos
- Díficil búsqueda de datos y metadatos en los archivos existentes. Falta de una lista completa de los
datos disponibles.
- Diversidad de formatos y falta de interoperabilidad
- Falta de indicaciones de calidad de los datos en muchos archivos
- Falta de productos de datos destinados a usuarios no especializados
Amenazas
- La falta de una buena infraestructura de datos en España puede dificultar la obtención de la información
necesaria para estrategias de mitigación y adaptación a problemas como el cambio global.
- La falta de infraestructura para gestión de datos España puede dificultar la aportación científica
española a proyectos internacionales.
- La pérdida de conjuntos de datos que no están adecuadamente archivados ni documentados.
- La próxima jubilación de muchas de las personas que han contribuido a generar datos que no están
adecuadamente documentados puede hacer imposible su rescate.
- El cambio de tecnología puede dejar obsoletos muchos soportes de datos que no están en depósitos
adecuados.
Fortalezas
- Existencia de importantes conjuntos de datos.
- Se cuenta con ejemplos de centros de datos internacionales (véanse A.2 y A.3) y con valiosas
iniciativas parciales a nivel estatal (véase A.4).
- España tiene una comunidad oceanográfica activa y con experiencia.
- Amplia participación en redes y sistemas de gestión de datos internacionales.
Oportunidades
- Necesidad cada vez mayor de la comunidad científica de disponer de una infraestructura de gestión
de datos.
- Existencia de obligaciones internacionales que pueden incentivar la búsqueda de soluciones.
- Posibilidad de diseñar un sistema sin arrastrar excesivas restricciones por decisiones anteriores.
- Existencia, en fase de planificación o ya en marcha, de nuevas iniciativas tanto estatales como
europeas o internacionales en general (véanse secciónes 6-8).
- Aparición de nuevos adelantos tecnológicos referentes a la gestión y distribución de datos.
- Existencia de financiación europea para rescate de datos.
4. Recomendaciones
4.1. ¿Qué debería contemplar el sistema de gestión de datos oceanográficos
en España?
La consideración del análisis de la sección anterior, junto con las conclusiones de otros análisis y
estudios (véase anexo A) sugieren que el sistema de gestión de datos oceanográficos en España debería
garantizar los siguientes servicios:
- Recopilación, control de calidad y almacenamiento de datos de manera que queden disponibles
para el futuro.
- Distribución de datos a científicos, gestores, industria y público.
- Establecimiento de protocolos para la adquisición y tratamiento de datos
- Adopción de una Política de datos
- Desarrollo de productos de datos adecuados
En los párrafos siguientes se analiza la situación española actual y sus deficiencias, en relación con
los servicios citados.
4.1.1. Recopilación, control de calidad y almacenamiento de datos de manera que queden disponibles
para el futuro.
¿Qué tenemos?
- Diversos centros de datos con segmentos de información y con niveles heterogéneos en cuanto a
organización y prestaciones (véase A.4)
- Conexiones a sistemas de datos internacionales a través de algunos proyectos y centros de datos.
¿Qué falta?
- Rescate de datos y metadatos que no estén accesibles actualmente.
- Política de datos que contemple:
- Obligatoriedad de depositar datos generados con dinero público en “Centros Acreditados”
- Fuentes de financiación para asegurar la gestión de datos
- Normativa sobre restricciones y permisos de uso
- Una estructura (“Centro Coordinador”, véase 4.2.1) que permita la coordinación e integración de la
información de los centros que funcionan actualmente y que ofrezca servicios de datos a los miembros
de la comunidad científica que lo requieran.
4.1.2. Distribución de datos a científicos, industria y el público.
a) Facilitar el acceso en tiempo presente a los datos de las estaciones meteorológicas y oceanográficas
operativas en aguas españolas
¿Qué tenemos?
- Algunos portales mantenidos por una o varias instituciones, con datos en tiempo presente. Un
ejemplo es ESEOO (véase A.4.2).
- Participación en portales europeos en desarrollo (como EUROGOOS, véase A.2.3)
¿Qué falta?
- Continuidad de iniciativas existentes. Existe el compromiso político de dar continuidad a ESEOO a
10
través de una Oficina Española de Oceanografía Operacional, que debería estar estrechamente coordinada
con el Centro Coordinador.
b) Facilitar el acceso a datos y metadatos archivados
¿Qué tenemos?
- Diversos centros de datos con segmentos de información y con niveles heterogéneos en cuanto a
organización y prestaciones
- Conexiones a sistemas de datos internacionales a través de algunos proyectos y centros de datos
¿Qué falta?
- Coordinación e integración de las bases de datos existentes, de manera que los usuarios puedan
localizar la información necesaria a través del Centro Coordinador.
4.1.3. Establecimiento de protocolos para la adquisición y tratamiento de datos
¿Qué tenemos?
- Protocolo común para series temporales de medidas puntuales (ESEOO)
- Diversos protocolos estandarizados para otros tipos de datos oceanográficos (a nivel europeo e
internacional se encuentran los de SEADATANET para todo tipo de datos e información marina).
- Existen guías de buenas practicas para los distintos tipos de datos, elaboradas en el marco de
grupos de trabajo internacionales.
¿Qué falta?
- Seleccionar los protocolos adecuados y diseminar la información pertinente a todos los investigadores
interesados.
- Apoyo a las iniciativas existentes como SEADATANET.
4.1.4. Desarrollo de productos de datos adecuados
¿Qué tenemos?
- Las instituciones existentes (véase A.4) ofrecen datos y productos de datos de diversos niveles
(incluido el nivel regional, como el Atlas Oceanográfico del Mediterráneo MEDATLAS 2001).
- Esfuerzo conjunto de diversas instituciones en relación con las series temporales puntuales
(ESEOO). Entre otros productos, este proyecto ha realizado un atlas institucional de información marina
homogéneamente analizada, que está disponible en su página web.
¿Qué falta?
- Nuevos productos de datos adecuados a la evolución de la demanda.
4.1.5. Adopción de una Política de datos
¿Qué tenemos?
- Cada Organismo tiene una política de datos o reglamentación particular
11
- Política de datos Antárticos a nivel estatal
- Compromisos con políticas internacionales
¿Qué falta?
- Elaborar una política nacional de datos de obligado cumplimiento para todos los datos y productos
obtenidos y elaborados con financiación pública.
4.2. Acciones requeridas
4.2.1. El centro Coordinador
Es fundamental la creación de una estructura que permita la integración de la información gestionada
por los centros que funcionan actualmente y que ofrezca a toda la comunidad científica estatal, gestores
y público los servicios de datos que estos centros no pueden ahora proporcionar.
Esta estructura podría estar constituida por “Centro Coordinador” y una red de “Centros
Acreditados” que incluiría los centros ya existentes que superasen unas determinadas condiciones.
La misión del El Centro Coordinador sería la de ofrecer servicios propios de gestión de datos y
actuar como integrador y foco de referencia, a nivel estatal e internacional, de la información administrada
por los Centros Acreditados.
El centro Coordinador sería una institución o figura jurídica nueva, pero podría basarse y/o alojarse
físicamente en una entidad preexistente. Es importante:
a) Que participen en su gestión todas las instituciones españolas relevantes en el campo de la
obtención de datos oceanográficos.
b) Que se trate de una institución con vocación de servicio técnico-científico.
Las funciones del Centro Coordinador incluirían:
- Recopilar, validar, almacenar y custodiar los datos que se le confíen.
- Garantizar el acceso fiable y eficiente a los datos oceanográficos (incluidos los existentes a
tiempo presente) generados en España o disponibles a través de organizaciones internacionales.
- Actuar como Centro de datos para los conjuntos de datos y proyectos generados por OPIS
(Organismos Públicos de Investigación), universidades y otros centros de investigación que no dispongan
de un Centro de Datos.
- Establecimiento y selección de protocolos para la adquisición y tratamiento de datos, adopción de
una política de datos y elaboración de productos de datos, de acuerdo con las necesidades de científicos,
gestores, industria y público.
- Contribuir a la formación de técnicos.
- Interaccionar con la administración y el público.
Junto con las actividades anteriores, el Centro Coordinador debería:
- Mantener en funcionamiento un portal para coordinar e integrar el acceso a metadatos, datos y
productos, sea directamente o a través de Centros Acreditados.
- Elaborar y mantener una lista de “Centros Acreditados”
4.2.2. Los Centros Acreditados
Existen ya en España (véase A.4) un número de centros y otros servicios de datos que dan
prestaciones enfocadas a un determinado tipo de datos, una institución o grupo de instituciones, o
una región geográfica. Los Centros Acreditados deberían superar unas determinadas condiciones de
calidad y alcance de los servicios proporcionados y deberían facilitar el acceso a sus datos, metadatos y
productos por medio de una adecuada coordinación con el Centro Coordinador.
12
4.2.3. Estructura y gobernancia del Centro Coordinador
El Centro Coordinador debería contar con:
- Un Director, responsable del funcionamiento del centro, que debería ser una persona con
reconocida experiencia. El director estaría asistido por un responsable o Vicedirector científico y un
responsable o Vicedirector técnico.
- Un Comité de Dirección que incluiría representantes de las Universidades y OPIS estatales y de
Comunidades Autónomas con actividad en el campo de la obtención de datos oceanográficos. Para ser
operativo, el número de miembros de este Comité no debería exceder de unos 10. Dado que el número
de instituciones relevantes es mucho mayor, debería establecerse un sistema transparente de elección
y rotación de los miembros del Comité. La función del Comité Asesor sería la de aprobar el Plan
Estratégico del Centro, establecer una política de datos y revisar aprobar el nombramiento de “Centros
Acreditados”.
- El personal administrativo, científico y técnico necesario para cumplir su función.
4.2.4. Financiación
- El establecimiento de un Centro Coordinador y la integración de una red española de Centros
Acreditados requiere una decidida actuación presupuestaria que podría ser asumida a través de acuerdos
entre Ministerios y CCAA con áreas costeras. El Centro Coordinador debería recibir una financiación
estable que cubriese una parte sustancial de sus costes básicos de funcionamiento. Debería asegurarse
también la continuidad de los Centros Acreditados que se aprueben.
- Debería ser obligatorio que los proyectos financiados con dinero público suministrasen los datos
obtenidos, de acuerdo con la política de datos que se adopte, al Centro Coordinador o a un Centro
Acreditado. Para que este objetivo sea factible, o bien debería financiarse a los centros de datos para
que pudiesen atender gratuitamente a los proyectos aprobados, o bien deberían incluirse los gastos
generados por la gestión de datos en el presupuesto del proyecto, de modo que éste pudiese costear la
contribución del centro de datos adecuado.
4.2.5. Priorización de tipos de datos
Una vez puesto en marcha el Centro Coordinador, deberían establecerse unas prioridades de actuación
en relación con el tipo de datos a los que habría que dar servicio. Dado que existe una relación inversa
entre la complejidad del proceso de obtención del dato y la cantidad, en un principio, el énfasis se
establecería en:
- Datos oceanográficos básicos: temperatura, salinidad, concentración de clorofila y de nutrientes
- Series temporales de datos obtenidos en continuo, como nivel del mar, corrientes y oleaje.
En una segunda fase, se deberían considerar datos más complejos, como los ecológicos.
4.2.6. Elaboración de la Política de datos
El acceso abierto a datos e información científica es fundamental para la investigación, la educación
y la toma de decisiones fundamentadas. Por otra parte, la adquisición de datos representa un trabajo
que tiene que ser reconocido. El grupo de investigadores originadores de los datos, además de ser el
responsable de los datos finales, calibrados y depurados, tiene derecho al reconocimiento en cualquier
publicación científico y/o informe en el que se haga uso de esos datos y puede tener privilegios como la
exclusividad de uso de los datos en un plazo que se reglamenta atendiendo a diversas causas. Diversos
organismos internacionales (como ICSU, IODE, ICES) y estatales han adoptado o tienen en fase de
elaboración normativas sobre política de datos oceanográficos.
13
ANEXOS
A. El contexto español e internacional
A.1. Marco administrativo en la Unión Europea
El GMES (Global Monitoring for Environment and Security) es una iniciativa de la Unión Europea
(UE) para apoyar los objetivos europeos de desarrollo sostenible y proporcionar datos de alta calidad,
infomación y servicios (EEA Working paper, marzo 2007). GMES proporciona acceso a información
geoespacial para gestores y autoridades y contribuye al Global Earth Observation System of Systems
(GEOSS).
El funcionamiento de GMES (http://www.bmvbs.de/Anlage/original_1006811/The-Way-toEuropean-Earth-Observation-Services-GMES-The-Munich-Roadmap-accessible.pdf) requiere datos
de observación in situ y remotos. En principio, la recogida de datos se basará en los mecanismos ya
existentes. El contexto político del acceso a los datos está determinado por:
El “Blue Book” sobre Política Marina Integrada de la UE, publicado en 2007 junto con un detallado
Plan de Acción (http://ec.europa.eu/maritimeaffairs/), propone el desarrollo de un Red Europea de
Observación e Información del Mar (European Marine Observation and Data Network, EMODNET),
que se basaría, entre otras, en la iniciativa GMES.
- La Convención de Aarhus (www.unece.org/env/pp/documents/cep43e.pdf), que requiere que los
organismos públicos de los países signatarios compartan información, si son requeridos para ello. Véase
también UNECE(1998).
- La directiva INSPIRE (www.ec-gis.org/inspire), que entró en vigor el 15 de mayo de 2007,
posibilita un marco de referencia para una infraestructura de datos espaciales (IDE) que proporcione
servicios integrados de información espacial a las autoridades públicas de los países miembros. Para
ello, deben eliminarse obstáculos a la interoperabilidad de los datos y deben implementarse servicios
que permitan encontrar, visualizar y compartir datos de diversas fuentes.
Referencias
United Nations Economic Commisssion for Europe (UNECE). 1998. Convention on access to
information, public participation in decision-making and access to justice in environmental matters
(http://www.unece.org/env/pp/documents/cep43e.pdf). Guía de interpretación disponible en: http://
www.unece.org/env/pp/acig.htm.
A.2. Iniciativas internacionales
Esta sección describe brevemente los objetivos de varias acciones internacionales de relevancia en
el contexto español:
A.2.1. IODE
IOC Committee on International Oceanographic Data and Information Exchange = Comité de la
COI sobre Intercambio Internacional de Datos e Información Oceanográfica
El IODE fue establecido en 1961 para “favorecer la investigación, explotación y desarrollo marinos
a través de facilitar del intercambio de datos e información oceanográficos entre los Estados Miembros
y de cubrir las necesidades de productos de datos y de información de los usuarios” (IOC, 2007).
El sistema IODE lo conforma una “red mundial orientada al servicio” que se basa en Agencias
Nacionales Designadas (Designated national Agencies) y Centros Nacionales de Datos Oceanográficos
(NODCs= National Oceanographic Data centres).
El nuevo Plan Estratégico para la gestión del sistema de datos y de información de la COI (IOC,
2007) propone el establecimiento de un “IOC Data and Information Management Steering Group”,
que reuniría diversos programas de la COI (GOOS, tsunami, HAB...) junto con organizaciones que
17
colaboran con la COI (JCOMM, WMO, ICES, ICSU WDCs Oceanography...). El Steering Group sería
responsable de implementar el Plan Estratégico, con la ayuda de una Oficina de Proyecto de IODE
(IODE Project Office).
Junto a los NODCs, el sistema IODE se apoyará en centros de Datos Oceanográficos Regionales y
Centros de Datos Oceanográficos Especializados. Algunos de estos centros funcionarán como “Centros de
Archivo”, para lo que deberán adoptar una Normativa de Archivo de Datos (“Data Archive Policy”) como
la propuesta por el DMAC del IOOS (EEUU) (Hankin and the DMAC Steering Committee, 2004).
Los criterios de (policy) de intercambio de datos oceanográficos de la COI están descritos en la
página web:
http://www.iode.org/index.php?option=com_content&task=view&id=51&Itemid=95.
Básicamente, la COI requiere a los estados miembros que permitan el acceso, libre y sin retrasos
indebidos, a todos los datos, metadatos y productos generados en programas de la COI. En el caso de
otros programas, se anima a los estados miembros a que permitan el acceso a sus datos oceanográficos
para fines no comerciales de investigación y educación, de acuerdo con las condiciones que determinen
los estados (dentro de las convenciones aplicables).
La política de datos de ICES (adoptada en 2006) para los datos gestionados por esta organización
(http://www.ices.dk/Datacentre/Data_Policy_2006.pdf) se basa en al de IODE, pero indica expresamente
que hay que reconocer adecuadamente el origen de los datos y respetar las condiciones existentes para
su uso y reproducción (por ejemplo, en caso de fines comerciales).
Referencias
Hankin, S. and the DMAC Steering Committee, 2005, Data Management and Communications Plan
for Research and Operational Integrated Ocean Observing Systems: I. Interoperable Data Discovery,
Access, and Archive, Ocean.US, Arlington, VA 304 pp. http://dmac.ocean.us/dacsc/imp_plan.jsp
IOC. - 2007. IOC STRATEGIC PLAN FOR OCEANOGRAPHIC DATA AND INFORMATION
MANAGEMENT (2008-2011). IOC-XXIV/2 Annex7. Borrador disponible en www.iode.org, París, 41
pp.
A.2.2. GEO-GEOSS
El Group on Earth Observation (GEO, http://www.epa.gov/geoss/) o Grupo de Observación de la
Tierra fue instituido en respuesta a las peticiones del 2002 World Summit on Sustainable Development
y de la reunión de los países del G8 en 2003. El objetivo central del GEO es organizar la colaboración
internacional para establecer un GEOSS (Global Earth Observation System of Systems) que permita
maximizar la utillidad de las observaciones de la Tierra como ayuda para la toma de decisiones. En
la actualidad (febrero de 2008), el GEO incluye 72 gobiernos y la Comisión Europea. GOOS (Global
ocean Observing System, http://www.ioc-goos.org/) es el componente oceanográfico de GEOSS; lo
patrocinan varias agencias de las Naciones Unidas (IOC, WMO, UNERP e ICSU). Sobre la política de
datos de ICSU, puede verse: http://www.icsu.org/1_icsuinscience/DATA.html.
A.2.3. EuroGOOS
EuroGOOS (http://ioc.unesco.org/goos/eurogoos.htm) es una asociación informal de organizaciones
estatales europeas que tiene como objetivo maximizar los beneficios de las actividades de oceanografía
operacional existentes y promover la integración de estas actividades dentro de la estructura de GOOS.
Las organizaciones españolas que participan en GOOS son el Instituto español de Oceanografía y
Puertos del estado. Un documento sobre política de datos de EuroGOOS puede encontrarse en: http://
www.eurogoos.org/pdf/EG99_37DataPolicy.pdf
18
A.2.4. IBI-ROOS
Iberia-Biscay-Ireland Operational oceanographic System
IBI-ROOS (http://www.ibi-roos.eu/) es un sistema regional de observación de GOOS/EuroGOOS
en el que participan diversos organismos españoles. El principal objetivo de IBI-ROOS es establecer
una organización de oceanografía operacional para el área marítima que bordean la península Ibérica,
Francia, Gran Bretaña e Irlanda.
A.2.5. SeaDataNet
A Pan-European Infrastructure for Ocean and Marine Data Management = Una Infraestructura Paneuropea para la gestión de datos Oceánicos y Marinos
SeaDataNet es una “Iniciativa Integrada de Infraestructura” del programa de la Unión Europea para
“Infraestructuras de Investigación”. Es el sucesor de Sea-Search para el período 2006-2010. Tiene como
objetivo el mantenimiento y expansión de los directorios de Sea-Search y la interconexión de los centros
de datos oceanográficos existentes con el fin de facilitar el acceso online a conjuntos y productos de
datos y metadatos marinos. Está formado por un consorcio de 49 instituciones de 35 países e incluye
NODCs (National Oceanographic Data Centres), SDCs (Centros de Datos de Satélite), centros expertos
de modelado marino y 3 organismos internacionales, COI, ICES y JRC (Joint Research Laborarory).
Está coordinado por IFREMER (Francia).
Entre las funciones de SeaDataNet están el apoyo a programas de investigación marina, y la
constitución de una infraestructura europea eficiente de gestión de datos marinos, de acurdo con las
convenciones internacionales y la futura directiva europea INSPIRE sobre datos ambientales.
A.2.6. PANGAEA
Publishing Network for Geoscientific & Environmental Data
Pangaea es una biblioteca electrónica de acceso libre cuyo objetivo es archivar, publicar y distribuir
datos georeferenciados derivados de las diferentes disciplinas de investigación y observación de la tierra.
El acceso a los datos se realiza a través del buscador de PANGAEA (http://www.pangaea.de/), el cual
redirecciona a los diferentes enlaces donde se encuentran los datos. El sistema está gestionado por dos
instituciones alemanas: el Alfred Wegener Institute for Polar and Marine Research (AWI), y el Center
for Marine Environmental Sciences (MARM), de la Universidad de Bremen, pero incluye datos de
diversos países. La mayoría de los datos existentes son de acceso libre y pueden utilizarse referenciando
la publicación o el identificador del conjunto de datos. En algunos casos, los datos derivan de proyectos
en curso y su acceso puede estar restringido temporalmente. Los metadatos siempre son accesibles e
incluyen la dirección de contacto de los investigadores principales de los proyectos que han generado
los datos.
A.3. Gestión de datos oceanográficos en Francia, Gran Bretaña y Estados
Unidos
Esta sección presenta información sobre los sistemas de gestión de datos oceanográficos en tres
países de nuestro entorno investigador que han hecho esfuerzos importantes en este campo.
A.3.1. Francia. Systèmes d’Informations Scientifiques pour la Mer (SISMER)
SISMER (http://www.ifremer.fr/sismer/) es el Centro Nacional de Datos Oceanográficos de Francia
(French NODC) para el International Oceanographic Data Exchange Program (IODE) de la COI. Fue
creado en 1990, forma parte de IFREMER y representa una gran infraestructura para oceanografía. El
antecesor de SISMER fue el Bureau National de Données Océanographiques, que comenzó su actividad
19
en 1968. SISMER se fundó como respuesta a los problemas de acceso a los datos que aparecieron en
los años 80, cuando el establecimiento de redes impulsó la tendencia a una gestión de datos totalmente
distribuida. Los principales campos cubiertos por SISMER son física, química y biología marina, geología
y geofísica, e información general sobre campañas y conjuntos de datos oceanográficos franceses. Los
datos de monitoreo de las estaciones costeras, la información sobre pesquerías y la base de datos de
biología béntica (Biocean) están centralizadas también en IFREMER, pero fuera de SISMER. Por
razones históricas, las mediciones de nivel del mar son gestionadas por el Servicio Hidrográfico (aunque
los dos sistemas están convergiendo), y los datos de oleaje y meteorología marinas por MeteoFrance.
La misión de SISMER incluye la compilación, custodia y diseminación de datos recogidos durante
proyectos nacionales e internacionales. SISMER diseña sistemas de información científica y bases de
datos, proporciona información sobre metodología y formatos e implementa controles de calidad.
Software de SISMER
Aparte de software comercial, el sistema de software de SISMER incluye:
- Interfases RDBS ORACLE e IFREMER/ISI (Ingénierie des Systèmes Informatiques)
- Servidor de datos e información de SISMER
- Base de datos Argo/Coriolis
- Software IFREMER/ISI
- Herramientas para reformateo, control de calidad (System of Control Oriented Oceanographic
Parameters, SCOOP y System of Control Oriented Geophysical Data collected underway, CQDG) y
edición y diseminación de datos (portal de web NAUTILUS y software SELMED para selección y
grabación de datos en disco o cd-rom.
El Servidor de datos e información de SISMER contiene:
1. Una base de datos relacional
2. Un servidor para web e internet
3. Varios accesos servidor/servidor
4. Varias interfases gráficas de usuario
5. Software de gestión de datos
6. Interfases con software de calificación de datos
Este servidor proporciona acceso a metadatos, y catálogos y direcciones lógicas de los ficheros
de datos. Por otra parte, incluye herramientas de gestión para custodia de los datos, acceso online a
metadatos y diseminación automática y controlada de datos.
Figura 1. Equema de las funciones de la bse de datos de Coriolis.
20
Base de datos Argo/Coriolis
Las funciones de la base de datos Coriolis están esquematizadas en la figura 1. Puede hallarse
información técnica sobre las interfases externas y otros aspectos de Coriolis en el documento Cordo/dti-die/00-056.pdf (http://www.coriolis.eu.org/cdc/cdc_info/etc/cordo-die-00-056.pdf) y en las
referencias citadas en él.
A.3.2. Gestión de datos marinos en el Reino Unido de Gran Bretaña
Centros de datos del National Environmental Research Council (NERC)
http://www.nerc.ac.uk/research/sites/data/
La red de centros de datos de NERC ayuda a la gestión de datos en los centros financiados por NERC
y es responsable de facilitar el acceso a estos datos y de su de mantenimiento a largo plazo. NERC
gestiona datos de diversas disciplinas:
- Ciencias atmosféricas
- Ciencias de la tierra
- Ciencia Marina
- Ciencia Polar
- Arqueología Científica
- Ciencia terrestre y de agua dulce
- Hidrología
- Bioinformática
Ciencias Marinas
http://www.nerc.ac.uk/research/sites/data/marine.asp
El British Oceanographic Data Centre centraliza la información sobre datos de ciencias marinas,
aunque existen otras organizaciones que custodian datos marinos:
- Antartic Environmental Research Centre
- Dundee Satellite Receiving Station (AVHRR, CZCS, SeaWIFS)
- Global Population Dynamics Database
- MarLIN (Marine Life Information Network for Britain and Ireland)
- National Geosciences Data Centre(Geofísica Marina, Plataforma continental)
- NERC Earth Observation Data Centre (Exploración costera aérea)
- NERC Remote Sensing Data Analysis Service (Temperatura marina superficial, derivada de
datos de Dundee)
- OceanNET (Portal nacional de datos e información del ambiente marino, organizados por el
BODC para el Inter-Agency Committee on Marine Science and Technology (IACMST)
- National Oceanography Centre, Southampton – SeaDOG (Geofísica del océano profundo, British
Mid-Ocean Ridge Programme)
Centro de Datos BODC
http://www.bodc.ac.uk/about/what_is_bodc/
El BODC es una institución nacional para custodiar y distribuir datos sobre el ambiente marino.
Su sede física se encuentra el el Proudman oceanographic Laboratory (Liverpool, Gran Bretaña). Las
bases de datos del BODC están dedicadas a datos biológicos, químicos, físicos y geofísicos y contienen
medidas de casi 10000 variables diferentes.
El enfoque del BODC implica:
- Almacenamiento cuidadoso, control de calidad y almacenamiento de los datos, de modo que no
21
se vean afectados por cambios de tecnología y estén disponibles en el futuro.
- Distribución de datos para investigadores, educación, industria y el público.
- Apoyo a los investigadores durante proyectos de investigación marina. BODC proporciona un
servicio de gestión de datos durante el período de actividad del proyecto.
- Producción de atlas digitales y productos innovativos sobre datos marinos.
El papel del BODC en el Reino Unido
http://www.bodc.ac.uk/about/our_national_role/
En el contexto nacional, el BODC cumple las siguientes funciones:
- Centro de Datos Marinos del Reino Unido
- Mantenimiento y desarrollo de la National Oceanographic Database (NODB).
- Gestión de la Red de mareógrafos del Reino Unido.
- Es el centro de datos marinos para el NERC.
- Gestión de datos de proyectos.
- Coordinador nacional de datos ambientales marinos (Marine Environmental Data, MED)
del Reino Unido para la IACMST. Esta organización es un comité gubernamental responsable de la
supervisión de las actividades relacionadas con el mar en los Departamentos miembros. Gran parte del
trabajo de la IACMST se realiza a través de dos grupos de acción, el Marine Environment Data Action
Group (MEDAG) y el Global Ocean Observing System (GOOS) Action Group del Reino Unido.
- Marine Environmental Action Group (MEDAG). Se ocupa de mejorar la accesibilidad y
disponibilidad de los datos marinos, del desarrollo de normas de gestión de datos y de mejorar los
mecanismos de intercambio de datos.
- UK GOOS Action Group. Coordina la contribución del reino Unido a GOOS y EuroGOOS,
el componente europeo de GOOS. Tembie es responsible del desarrollo de un plan de acción para
monitoreo y modelado de cambios en procesos marinos y clima.
- OceanNET. Actúa como portal de datos e información sobre el ambiente marino y promotor de las
actividades del GOOS Action Group.
A.3.3. Estados Unidos. El Integrated Ocean Observing System (IOOS)
El Congreso de los Estados Unidos ha encargado a la comunidad científica marina el diseño e
implementación del denominado Integrated Ocean Observing System (IOOS). IOOS se plantea
como una red de sistemas regionales, nacionales y globales para adquisición y diseminación de datos
y productos de datos que sirvan las crecientes necesidades de protección ambiental, salud pública,
industria, educación, investigación y recreo. Representa también la contribución de EEUU al Global
Ocean Observing System (GOOS).
La oficina nacional de IOOS, Ocean.US, estableció en 2002 un Data Management and Communications
Steering Committe. Este comité ha desarrollado un minucioso Data Management an Communications
Plan (DMAC), publicado en Hankin and the DMAC Steering Committee (2004), disponible en http://
dmac.ocean.us/dacsc/imp_plan.jsp. En los párrafos siguientes se presentan algunas de las características
básicas del plan.
El sistema IOOS está compuesto por tres subsistemas:
- Subsistema de observación.
- Subsistema de modelado y análisis.
- Subsistema de gestión de datos y comunicación (DMAC).
El DMAC (figura 2) provee los enlaces entre los subsistemas de IOOS y conecta IOOS con
sistemas internacionales de gestión de datos oceanográficos, y con sistemas de gestión de datos de otras
disciplinas.
La infraestructura de DMAC comprende standards, protocolos, instalaciones, software y sistemas
de hardware. Los servicios de DMAC incluyen 1) Metadatos; 2) la capacidad de buscar y localizar
22
Figura 2. Comunicación de datos en IOOS. Los componentes del DMAC se han delimitado con línea contínua. Las flechas
indican mecanismos de feedback y control (Hankin and the DMC Steering Committee, 2004).
conjuntoy productos de datos; 3) la capacidad de transporte de datos y productos a través de Internet; 4)
La posibilidad de evaluar las características de los datos online; y 5) Archivo de datos a largo plazo.
El diseño del DMAC tiene en cuenta las siguientes características:
1. Organizaciones federades de modo flexible.
2. Depósitos de datos distribuidos geográficamente.
3. Heterogeneidad de los datos.
DMAC considera que su éxito dependerá de su aceptación y reconocimiento por parte de los
proveedores y usuarios de datos y de que tanto unos como otros consideren que DMAC les ayuda a
conseguir sus objetivos. PDMAC podrá ser efectivo si usa métodos de persuasión no coercitivos.
El Sistema de Archivo de Datos de IOOS comprenderá un conjunto de instalaciones designadas,
nuevas y ya existentes (figura 3). Se procurará aprovechar al máximo la infraestructura y experiencia
Figura 3. Esquema del Sistema de Archivo de Datos del DMAC (Hankin and the DMAC Steering Committee, 2004; véase
referencia en sección A.2).
23
y conjuntos históricos de datos de centros ya existentes como el national Oceanographic Data center
(NODC), operado por la NOAA. La política de datos del Sistema de IOOS estará de acuerdo con los
principios de GOOS y con las política de intercambio de datos de IOC/IODE y de la organización
metorológica Mundial (World Meteorological Organization, WMO).
A.4. Algunas iniciativas españolas
Esta sección, que no pretende ser exhaustiva, presenta información sobre algunas de
las principales iniciativas españolas.
A.4.1. CNDP. Centro Nacional de Datos Polares
Antecedentes Internacionales
EL SCAR-COMNAP, en la Reunión del XXII SCAR, en junio de 1992, estableció un Grupo
Especial de Planeamiento para la Gestión de la Datos Antárticos, en sustitución del anterior CCAD
(Commitee for the Coordination of Antarctic Data). Este Grupo de Planeamiento incluía el desarrollo
de un Plan para la coordinación y la gestión de estos datos.
El primer informe de este Grupo, en Octubre de 1992, propuso un Consejo de Administración
a fin de gestionar el desarrollo de un Sistema de Directorios de Datos Antárticos (Antarctic Data
Directory System - ADDS) comprendiendo los Centros Nacionales de Datos (National Antarctic
Data Centres-NADCs) conectados a través de la red global –INTERNET- con un Directorio Maestro
de Datos (Antarctic Master Directory-AMD). La tecnología propuesta por el AMD fue la de la Red
Internacional de Directorios (International Directory Network-IDN) utilizando para el intercambio de
datos el formato DIF (Directoy Interchange Format).
Las recomendaciones de su Informe fueron aceptadas por el SCAR y el Comité Ejecutivo del
COMNAP en abril de 1992, así como en la Reunión del Tratado Antártico de Noviembre de 1992.
Estos DIF o metadatos (dato de dato), contienen un resumen conciso de las personas, tareas e
investigaciones realizadas en las diferentes disciplinas, con información valedera y suficiente para su
difusión internacional.
SCAR/COMNAP JOINT COMMITTEE ON ANTARCTIC DATA MANAGEMENT (JCADM)
El 23 de mayo de 1997 el Grupo de Planeamiento (establecido en 1992) fue reemplazado por el
Joint Committee on Antarctic Data Management (JCADM).
El JCADM esta integrado por los representantes y responsables de los Centros de Datos de cada país
(National Antarctic Data Centres - NADCs).
El Tratado Antártico ha manifestado un activo interés en cuanto a la gestión de los metadatos
Antárticos.
La XXII Reunión Consultiva del Tratado Antártico, 1998, a través de su Recomendación XXII-4
y, conforme a la información presentada por el SCAR y el COMNAP en nombre del JCADM, instó
a los Países Miembros del Tratado, al establecimiento de sus Centros Nacionales de Datos (NADCs),
apoyando el desarrollo de sus políticas institucionales.
Es compromiso de estos centros promover procesos de educación a sus científicos a fin que estos
contribuyan con su información, así como asistir en la generación de los registros de metadatos, siendo
además sus depositarios, todo ello en aras de una mejor difusión de las investigaciones.
Estos centros prestarán el apoyo necesario a sus investigadores y serán los responsables del control
de los registros de metadatos, según las estructuras predeterminadas, para su posterior inserción y
actualización en el AMD, participando igualmente en el desarrollo de la Red de Directorios de Datos
(IDN).
24
El Sistema de Directorios de Datos Antárticos (ADDS) es un muy apropiado punto de partida para
la difusión de los metadatos.
El Directorio Maestro de Datos (AMD) es la central que contiene todos los grupos de metadatos
generados y enviados por los CNDAs.
El AMD, con identidad propia, se encuentra actualmente alojado en el Global Change Master
Directory (GCMD) que, con su tecnología y su dinámica, permite una fácil remisión, inclusión y mejor
acceso a la información.
Política de datos Antárticos. Iniciativa Española
El Centro Nacional de Datos Antárticos – CNDA (National Antarctic Data Centre – NADC),
actualmente Centro Nacional de Datos Polares Español (CNDP) es miembro del JCADM desde el
año 1999, y ha venido generando registros de “metadatos” de los proyectos de investigación españoles
en la Antártida.
Por iniciativa del Comité Polar Español (CPE) en el marco Subprograma Nacional de
Investigación Polar (SNIP), incluido en el Programa Nacional de I+D+i y según la resolución de 30
de noviembre de 2005, de la Secretaría de Estado de Universidades e Investigación, por la que se hace
pública la convocatoria de ayudas para la realización de proyectos de investigación, en el marco de
algunos Programas Nacionales del Plan Nacional de Investigación Científica, Desarrollo e Innovación
Tecnológica 2004-2007. Se incluye el siguiente punto:
“14. De conformidad con lo previsto por el Comité Polar Español en su reunión del 30 de mayo de
2003, los investigadores principales de los proyectos polares deberán enviar los datos brutos y los de
Figura 4. Portal del CNDP en el Global Change Master Directory Portal
25
las calibraciones instrumentales para su archivo en el Centro Nacional de Datos Antárticos, en un plazo
máximo de tres meses posteriores a la campaña finalizada [...] La no remisión de dichos datos hará
incompatible al Investigador Principal para nuevos proyectos antárticos. Asimismo, todos lo anterior
referente al envío de datos, calibraciones e incompatibilidad será aplicable a todos los proyectos que
impliquen campañas oceanográficas, independientemente del programa a que hayan sido presentados.”
En cumplimiento de esta resolución desde la campaña Antártica 2005/2006 el CNDP español, no
solo se ocupa de la generación de “metadatos” sino también del almacenamiento, custodia y gestión
de los “datos brutos” derivados de la los proyectos de investigación. El CNDP radica en el Instituto
Geológico y Minero de España (IGME) y los datos son almacenados y gestionados en servidores de
esta institución.
La aplicación de la anterior resolución implica el establecimiento de una “Política de Datos”,
que de respuesta a las dudas derivadas de la aplicación de la misma, en referencia plazos, formatos,
confidencialidad de los datos…..etc. En este sentido y de acuerdo con el CPE el CNDP ha elaborado
una “PROPUESTA DE PROTOCOLO DE REMISIÓN, ALMACENAMIENTO Y DIFUSIÓN
DE DATOS ANTÁRTICOS EN ESPAÑA”. Este protocolo (http://hielo.igme.es/index.php) ha sido
aprobado en la 16º reunión del Comité Polar Español celebrada en Madrid, el 27 de noviembre de 2007
y actualmente se está aplicando a los proyectos de investigación españoles en la Antártida.
A.4.2. El proyecto ESEOO
El proyecto ESEOO (Establecimiento de un Sistema Español de Oceanografía Operacional), de tres
años de duración (2004-2007) y financiado por el Ministerio de Educación y Ciencia, ha producido un
profundo cambio en el panorama español de la oceanografía operacional y la lucha contra la contaminación
en el mar al dotar al país de mecanismos modernos de generación de información océano-meteorológica
imprescindibles para una toma de decisiones basada en el conocimiento. Los resultados del proyecto son,
por un lado, productos y servicios tangibles (p. ej. sistemas de predicción de corrientes, de trayectorias
de contaminantes y objetos a la deriva, servicios de datos en tiempo real, etc.) y, por otro, un notable
incremento en el nivel de coordinación entre las instituciones nacionales y de estas con centros claves
en el extranjero. Esta coordinación ha cristalizado en el diseño y puesta en marcha de la USyP (Unidad
de Seguimiento y Previsión), una unidad operativa que se activa en caso de emergencia y tiene como
labor suministrar a la sala de crisis y al organismo rector toda la información océano-meteorológica
necesaria. Por último, ESEOO ha diseñado un esquema de generación y distribución de la información
que asegurará que los productos desarrollados puedan ser empleados en un futuro.
En lo referido a datos, el objetivo fundamental del proyecto fue la creación de un servicio de datos
analizados que proporciona rápido acceso a información procesada y útil a partir de las fuentes de
datos existentes en aguas españolas. La creación de dicho sistema exigió el desarrollo de un inventario
de metadatos, la homogeneización de formatos (mediante el estandar ESEOOXML), la definición de
controles de calidad y un análisis homogéneo de la información disponible, que ha requerido el desarrolló
un software de análisis de series temporales accesible a través de la web. Con los resultados de todo el
proceso se ha realizado de un atlas institucional de información marina homogéneamente analizada, que
está disponible en la página web de ESEOO (el denominado servicio de datos analizados).
Adicionalmente, se creó un directorio de datos en tiempo real capaz de proporcionar los valores de
las medidas que se estén registrando en el momento de la consulta. A continuación se describen estos
avances.
Inventario de datos
¿En qué consiste?
Este producto se desarrolló con el objetivo de inventariar los datos físicos y químicos medidos en el
medio marino y hacer públicas sus características o “metadatos”. Anteriormente, la información sobre
26
Figura 5. Puntos con medidas de corrientes. Mapa extraído de la página de ESEOO
la existencia de datos estaba desperdigada en diversos institutos, de forma que la determinación de los
disponibles para una determinada zona resultaba prácticamente imposible. Gracias a este inventario,
accesible a través de Internet, los usuarios pueden tener un rápido conocimiento de los datos existentes
en una determinada zona y de cómo acceder a ellos.
La figura 5 muestra el resultado de realizar una consulta la página de ESEOO sobre los puntos donde
existen medidas de corrientes. Algunas zonas presentan vacíos que corresponden, probablemente, a
ausencias de información que deben ser subsanadas en un futuro.
¿Para qué sirve?
Entre las aplicaciones más destacadas encontramos:
- Obtención de datos útiles para el diseño de infraestructuras portuarias.
- Fuente de datos para trabajos de investigación de naturaleza diversa (oceanografía física,
biología, etc.).
- Enumeración de datos disponibles para la creación de un servicio de datos analizados (ver
sección siguiente).
Servicio de datos analizados
¿En qué consiste?
El servicio de datos analizados pretende ser una fuente de descripciones estadísticas del medio
marino accesible rápidamente en el caso de una emergencia. En ocasiones, informaciones básicas, como
la corriente u oleaje medio en una zona, son fundamentales para el apoyo a la toma rápida de decisiones.
A modo de ejemplo, a la hora de decidir el destino de un barco que amenaza hundirse es imprescindible
conocer el comportamiento más probable del medio marino a fin de que las decisiones a tomar tengan
una sólida base técnica. En estos casos, de nada sirve tener largas series de datos, pues literalmente no
hay tiempo para analizarlas y sacar información práctica. Estas estadísticas han de ser confeccionadas a
priori y este trabajo debe ser accesible a través de Internet.
27
Figura 6. Servicio de datos analizados
En el ámbito de ESEOO, se analizaron los datos existentes en el inventario con una batería de
programas única y con los resultados se preparó el servicio de datos analizados (ver figura 6).
¿Para qué sirve?
Entre las aplicaciones a destacar se encuentran:
- Apoyo a la toma de decisiones en caso de crisis.
- Ingeniería marítima (diseño de infraestructuras portuarias mediante el cálculo de oleaje y nivel
del mar máximo, periodos de retorno, etc…).
- Estudios biológicos (a partir de la evolución estacional de las temperaturas y otras variables)
- Estudios de calidad de agua en la línea de costa (las corrientes medias y máximas en una zona
dan idea de los tiempos de renovación de las masas de agua).
- Evolución de la línea de costa (los valores de corrientes y oleaje máximos determinan el
proceso de erosión).
- Los datos de viento y oleaje medidos por las boyas son empleados para el diseño de plantas
eólicas y oleomotrices “offshore”.
Servicio de datos en tiempo presente
¿En qué consiste?
Este producto es una página web que permite un acceso a toda la información generada en tiempo
presente en los diversos institutos que mantienen redes de medida operativas y sistemas de previsión
(ver figura 7).
¿Para qué sirve?
Este servicio tiene como función fundamental proporcionar información en tiempo presente de la
situación existente en el mar en un momento de crisis. Esta información es vital para la toma correcta de
28
Figura 7. Servicio de datos en tiempo presente y uno de los productos accesibles (predicción de viento).
decisiones y la movilización de recursos. Además, tiene múltiples aplicaciones tales como:
- Monitorización de condiciones ambientales durante la realización de obras marítimas.
- Proporcionar información sobre el estado de la mar para las actividades pesqueras.
- Servir de apoyo para la navegación, incluyendo la deportiva.
- Ofrecer de forma accesible información en tiempo presente para la industria turística (p. ej.
temperatura del mar o altura de las olas para empresas de buceo).
Servicios basados en teledetección
¿En qué consiste?
Este producto es idéntico al descrito en la sección anterior (servicios de datos en tiempo presente)
con la particularidad de que la información presentada es generada a partir de las medidas de satélites.
Se han creado servicios de datos basados en medidas de satélite y medidas “in situ” accesibles a través
de la página de ESEOO. La figura 8 muestra una imagen extraída de uno de dichos servicios.
¿Para qué sirve?
Las aplicaciones de este producto son idénticas a las de el servicio de datos en tiempo real explicadas
en la sección anterior.
A.4.3. Centro de datos del Instituto Español de Oceanografía
Antecedentes
En 1964, se estableció en el Instituto Español de Oceanografía (IEO) el Centro Español de Datos
Oceanográficos (CEDO), integrado en el sistema de Centros Nacionales de Datos Oceanográficos
(NODCs), representando oficialmente a España en el Comité para el Intercambio de Datos e Información
Oceanográfica (IODE) de la Comisión Oceanográfica Intergubernamental (COI). Asimismo, el IEO
29
Figura 8. Imagen de temperatura superficial extraída del servicio de datos de teledetección
como miembro del Consejo Internacional para la Explotación del Mar (CIEM) un representante del IEO
participa en el Grupo de Trabajo de Gestión de Datos Marinos del CIEM (ICES MDMWG).
Si bien el IEO ha participado de forma activa en los comités anteriormente mencionados, enviando
los datos de campañas oceanográficas al centro mundial de datos (WDC-A), ubicado en Estados Unidos
y los datos del nivel medio del mar al Servicio Permanente del Nivel del Mar (PSMSL), ubicado en el
Reino Unido, así como los formularios de ROSCOP y datos de campañas del área del ICES al Centro
de Datos del ICES, pero ha sido en los últimos años y con la aparición de los programas marcos de la
Unión Europea cuando se ha dado un mayor empuje a esta actividad. Así en el marco de los proyectos
MEDATLAS, MEDAR/MEDATLAS II, se han recopilado y armonizado un volumen muy importante
de datos de temperatura, salinidad, oxigeno y nutrientes en el área del Mediterráneo y se ha desarrollado
aplicaciones bajo el entorno de Windows para la gestión de datos marinos. Asimismo en el marco del
proyecto CANIGO se ha hecho una recopilación completa de los datos originados en el propio proyecto
CANIGO. Asimismo, se ha participado en los proyectos europeos EDMED y SEA-SEARCH cuyo
objetivo es el mantenimiento de un directorio de datos europeo.
Por otra parte, en los últimos años, en el marco del proyecto estructural del IEO Sistema de Información
Científica de Datos Marinos (SIC_DAMAR) se ha venido difundiendo los datos y productos a través del
servidor WEB del IEO, para lo que se ha diseñado la pagina http://indamar.ieo.es.
Desde el año 2000, el IEO facilita también la información de temperatura superficial del agua a partir
de imágenes AVHRR de NOAA que se reciben en el Centro Oceanográfico de Santander. El objetivo
es hacer llegar la información a los usuarios que lo requieran y enviarla a las campañas y acciones del
IEO. Para ello se diseñó una página web en la que se dispuso de imágenes ordenadas por 5 áreas (Golfo
de Vizcaya, Atlántico Este, Mediterráneo, Estrecho y Canarias). Las imágenes ordenadas por año y mes,
se ponen en la web (http://www.teledeteccionoceanografica-ieo.net/) y se pueden descargar libremente.
Para obtener imágenes de mayor calidad hay que solicitarlas a través de la página web o por medio de
un correo electrónico. La serie de datos está disponible desde 2000 hasta 2007.
En junio de 2007, el IEO fondeó una boya Oceano-meteorológica a 22 millas al Norte de Santander,
en aguas profundas (2850m) del Golfo de Vizcaya, gracias a financiación del IEO, Ministerio de
Educación y Ciencia y Gobierno de Cantabria. Es una boya ODAS tipo “Seawatch”. La boya transmite
datos meteorológicos (presión atmosférica, temperatura del aire, humedad, dirección y velocidad
viento), oleaje direccional y parámetros oceanográficos (temperatura del agua, salinidad, velocidad y
30
dirección de la corriente (hasta 100m), oxígeno disuelto y fluorescencia) con frecuencia horaria al Centro
de Santander del IEO. Tras un control de calidad, su distribución se realiza a través de la web del IEO
(boya_agl.st.ieo.es) y tambien integrada en la Red de Boyas de Aguas Profundas de Puertos del Estado.
Los datos transmitidos se almacenan y pueden ser consultados libremente en gráficos y solicitados,
previo registro. Los datos históricos se depositarán en el Centro de datos del IEO (el sistema está a punto
de funcionar).
En la actualidad el IEO está participando en el proyecto europeo “Infraestructura pan-europea para
la gestión de datos marinos y oceánicos” SeaDataNet http://www.seadatanet.org
Organización de Centro de datos del IEO
En 2002-2003. La Secretaría General de Política Científica encomendó al IEO elaborar un estudio
para el establecimiento de un Sistema Nacional para la coordinación de las bases de datos oceanográficos
y del material de muestras referencial
La dirección del IEO constituyo un grupo de trabajo de datos e información marina para elaborar
una estrategia de gestión de datos en el IEO con el fin de alcanzar los objetivos a corto y largo plazo
siguientes:
- Guardar y organizar los datos y elaborar información marina relevante.
- Facilitar su accesibilidad a los usuarios, según los medios tecnológicos al uso.
- Atender los compromisos nacionales e internacionales en esta materia.
Con este fin se diferenciaron 3 grupos de datos:
- Grupo de datos I : datos de oceanografía y contaminantes y sus efectos biológicos.
- Grupo de datos II : datos de pesquerías y comunidades biológicas.
- Grupo de datos III : datos de geología.
Cada grupo de datos esta formado al menos por:
- Gestor científico de datos marinos (1): responsable del equipo y su función será la de planificar
el trabajo del grupo, preparar y co-dirigir, en representación del IEO, los proyectos nacionales e
internacionales de gestión de datos.
- Experto/s en la gestión de datos marinos (2): cuya función será la de describir estructuras de
información, criterios de control, métodos de análisis, supervisar las actividades de explotación de la
información.
- Ayudante/s de investigación (2): cuya función será la del procesamiento de información.
El equipo de trabajo responsable del grupo de datos I es también el responsable del Centro
Nacional de Datos. La plantilla actual de este grupo es:
- 4 funcionarios: 3 titulados superiores (1 en excedencia) y 1 ayudante de investigación.
- 2 contratados por el proyecto SeaDataNet (1 titulado superior y un técnico superior).
- 1 asistencia Técnica.
El equipo de trabajo responsable del grupo de datos II es responsable de la gestión de los datos
enmarcados en el proyecto “ Plan Nacional de Datos para la Política Pesquera Común” en la que
participan un número importante de contratados y funcionarios.
El equipo de trabajo responsable del grupo de datos III es el responsable de los sistemas de
información geográfica de fondos marinos.
A.4.4. Sistemas de datos de Puertos del Estado
Introducción
Puertos del Estado es una institución dependiente del Ministerio de Fomento que tiene la
responsabilidad global sobre el sistema portuario dependiente del Estado. Comprende un total de 27
Autoridades Portuarias y es la encargada de coordinar dicho sistema, así como de implementar la política
31
del gobierno en materia portuaria. Uno de sus papeles fundamentales es el mantenimiento de las redes
de observación del medio físico que afecta al sistema portuario. Esta labor se realiza por parte del Área
del Medio Físico. Los servicios desarrollados por el Área del Medio Físico están disponibles para uso
público. La distribución se realiza vía web en la página (http://www.puertos.es). El Área del Medio
Físico tiene 3 ámbitos fundamentales de actividad:1) Redes de Observación; 2) Sistemas de predicción
y 3) Bases de datos.
Redes de observación
Puertos del Estado opera las siguientes redes de observación del océano:
- La Red de aguas profundas está formada por 13 boyas Seawatch y 3 Wavescan. Los instrumentos
están ubicados en puntos con profundidades entre 200 y 800 metros y miden parámetros oceanográficos
y meteorológicos. Los datos son transmitidos cada hora vía satélite y se envían a la web tras un control
de calidad automático.
- Red Costera de Puertos del Estado. Proporciona datos de oleaje en tiempo real en puntos de
aguas poco profundas. Su objetivo es complementar las medidas de la red exterior en lugares de especial
interés para las actividades portuarias o la validación de modelos de oleaje. Consta de boyas escalares
Waverider y de boyas direccionales Tryaxis.
- Red de correntímetros. El objetivo de esta red es obtener medidas oceanográficas (corrientes,
temperatura y salinidad) que complementen y ayuden a interpretar las obtenidas por las boyas de la red
exterior. Está formada por cadenas de correntímetros (modelo RCM7) que se ubican a profundidades
predefinidas. No transmiten en tiempo real.
- La Red de Mareógrafos REDMAR. Está en funcionamiento desde 1992. El objetivo es la
monitorización del dato de nivel del mar en tiempo real y la generación de series históricas para su
posterior explotación. En la actualidad está constituida por 14 mareógrafos acústicos SONAR, 7
mareógrafos de presión Aanderaa y 12 mareógrafos de radar Miros.
- La tecnología Radar de Alta Frecuencia (Radar HF). Permite la monitorización remota de
corrientes y oleaje en un área con rango entre centenas y miles de kilómetros cuadrados. Puertos del
Estado, la Autoridad Portuaria de A Coruña, la Autoridad Portuaria de Vigo y Qualitas Instruments
suscribieron el pasado 14 de abril de 2005 un protocolo encaminado a implantar dos estaciones radar
HF SeaSonde de Codar Ocean Sensors, para la monitorización remota de corrientes y oleaje en los faros
de Finisterre y Silleiro, a efectos de demostración de su utilidad en las necesidades derivadas del diseño,
seguridad y operatividad de las infraestructuras portuarias.
Los registros de estos sistemas, junto con los generados por los modelos de previsión se almacenan
en el banco de datos de Puertos del Estado. Asimismo incluye varias bases de datos numéricos de
retroanálisis. La base es accesible on-line.
Los datos de Puertos del Estado en tiempo real son gratuitos y se accede a ellos a través de Internet.
Los datos históricos han de ser solicitados a Puertos del Estado. Para propósitos de investigación se
proporcionan a coste cero. Para empresas tienen asociado un pequeño gasto por gestión.
A.4.5. SAIDIN. Satellite Image Database Interface, Estació Litoral de Barcelona. Centre Mediterrani
d’Investigacions Marines i Ambientals (CMIMA, CSIC), Instituto de Ciencias Marinas de Andalucía
(ICMAN, CSIC)
Introducción
SAIDIN (http://saidin.cmima.csic.es/) es una aplicación para la web, desarrollada para visualizar y
distribuir datos de satélite de la estación receptora HRPT (High Resolution Picture Transmission) del
CMIMA y de otras fuentes. El objetivo de SAIDIN es facilitar el trabajo con datos de satélite tanto a
usuarios interesados en imágenes cualitativas, como a usuarios interesados en datos cuantitativos crudos.
32
Características principales
- Temperatura marina superficial (SST) del AVHRR de NOAA, en tiempo casi real (Mediterráneo
Occidental), datos históricos de viento (Quikscat) y promedios mensuales de clorofila del SeaWIFS.
- Calendario interactivo para búsqueda de datos.
- Poderosas herramientas de visualización y posibilidad de descaga de imágenes. Inspección rápida
de imágenes y de metadatos. Posibilidad de guardar los metadatos en disco.
- Se pueden descargar datos crudos en formato netCDF funcionament a través del catálogo THREDDS
(http://ers.cmima.csic.es/thredds).
- Posibilidad de superponer los datos de boyas de Puertos del estado.
- Animación diaria de SST y temperaturas medias nocturnas.
La aplicación está implementada en el lenguaje Java y puede utilizarse a través de un servidor o
puede descargarse para su uso como aplicación independiente. Los ficheros de configuración de la
aplicación web.xml permiten la transferencia fácil a otros servidores y que otras instituciones sirvan sus
datos con esta aplicación.
Política de datos
Los datos ERS (Estación Receptora de Satélite) se distribuyen libremente, pero se requiere a
losnusuarios de SAIDIN que hagan constar en los agradecimientos que “estos datos han sido obtenidos
de los ERS del CMIMA (Barcelona) y del ICMAN (Cádiz), ambos del CSIC, España”. Las imágenes
de SeaWIFS sólo pueden usarse para fines científicos y educacionales. Los usos comerciales deben
coordinarse con ORBIMAGE.
Financiación
El proyecto SAIDIN se inició con fondos del proyecto MAMA (EVR1-CT-2001-20010), de la UE,
que tenía como objetivo general contribuir a las observaciones marinas rutinarias y predicciones en el
Mediterráneo (MedGOOS). Actualmente, el funcionamiento de SAIDIN está financiado por los dos
Institutos del CSIC que lo mantienen (CMIMA e ICMAN).
A.4.6. IDEE, IDECSIC
A nivel español, una respuesta a la directiva INSPIRE es el proyecto de desarrollo y mantenimiento
de una Infraestructura de Datos Espaciales de España (IDEE), que forma parte del plan estratégico del
Instituto Geográfico Nacional (http://www.idee.es/show.do?to=pideep_pidee.ES).
Por su parte, el área de Humanidades y Ciencias Sociales del CSIC está impulsando la creación
de una Infraestructura de Datos Espaciales del CSIC (IDECSIC; http://sig.ieg.csic.es/documentos/
Borrador_Resumen_IDECSIC.pdf), con los siguientes objetivos:
- La implantacion de las herramientas necesarias para servir la información geoespacial disponible
en los distintos Centros del CSIC.
- El desarrollo e implantación de un visualizador (Geoportal) para presentar los datos y generar los
servicios OGC (Open Geospacial Consortium) adecuados.
- La implicación de los Centros y grupos de investigación que dispongan de datos georeferenciados
de interés común, para visualización desde el citado Geoportal de referencia o desde los suyos
propios.
En relación con la IDECSIC, el CSIC ha contratado licencias corporativas de diverso software de las
empresas ESRI España y Leica Geosystems, y ha firmado un convenio con el IGN.
33
B. Conceptos básicos
Los siguientes apartados proporcionan una breve introducción a conceptos y definiciones de uso
geenral en relación con la gestión de datos.
B.1. Definiciones
B.1.1. Datos
Los datos son representaciones simbólicas (numérica, alfabética, imágenes, etc.) de atributos o
características que describen sucesos y entidades.
Los datos pueden consistir en mediciones y observaciones o bien ser derivados de modelos. La
importancia de los datos está en su capacidad de asociarse dentro de un contexto para convertirse en
información.
Las Etiquetas de calidad (Quality flags) son indicadores alfanuméricos que se añaden a cada dato
al final de un proceso de control de cualidad.
B.1.2. Metadatos
Metadatos es el término genérico que le damos a toda aquella información sobre el contexto, calidad,
condición o características de un conjunto de datos, es decir, información sobre la propia información,
datos sobre los datos, y tienen la finalidad de facilitar su tratamiento automatizado. Por lo tanto, los
metadatos son descripciones estructuradas que están disponibles de forma pública para ayudar a localizar
objetos.
Ejemplo de datos y metadatos:
Dato: Foto de una nueva especie de pez.
Metadato: Localización del descubrimiento (latitud, longitud, profundidad), otras especies de la
zona, salinidad y temperatura del agua, cantidad de individuos encontrados, etc.
Los beneficios derivados de la utilización de metadatos son diversos:
- Los metadatos adhieren contenido, contexto y estructura a los objetos de información.
- Los metadatos permiten el intercambio de la información sin la necesidad de que implique el
intercambio de los propios recursos.
- Los metadatos permiten un acceso a los recursos en forma controlada ya que se conoce con
precisión el objeto descrito.
- Los metadatos permiten preservar los objetos de información permitiendo migrar (gracias a la
información estructural) sucesivamente éstos, para su posible uso en un futuro.
- Los metadatos son esenciales para sostener un crecimiento de una Web a mayor escala,
permitiendo búsquedas, integración y recuperación del conocimiento desde un mayor número de
fuentes heterogéneas.
El fin último de los metadatos es el de convertir la información en algo accesible a nivel internacional,
de manera que independientemente de la región, el idioma, el sistema operativo, la versión de navegador
y demás factores cualquier tipo de información, pueda ser procesada de manera automática, favoreciendo
su recuperación.
B.1.3. Conjuntos de datos
Un conjunto de datos es un grupo de datos individuales asociados y relacionados de acuerdo con un
determinado criterio (perfiles verticales, campañas, experimentos).
34
B.1.4. Productos de datos
Son conjuntos agregados o combinados de datos o metadatos (incluidos servicios a través de la
web), poseedores de un valor añadido en relación con una aplicación determinada.
B.1.5. Bases de datos
Las más utilizadas son las bases de datos relacionales, que se define una base de datos como una
serie de datos organizados en tablas y relacionados entre sí, que se almacenan sin redundancia para ser
útiles en diferentes aplicaciones.
Componentes principales de una base de datos:
- Datos. Los datos son la Base de Datos propiamente dicha.
- Hardware. El hardware se refiere a los dispositivos de almacenamiento en donde reside la base
de datos, así como a los dispositivos periféricos (unidad de control, canales de comunicación,
etc.) necesarios para su uso.
- Software. Está constituido por un conjunto de programas que se conoce como Sistema Gestor de
Base de Datos (SGBD o DMBS: Data Base Management System). Es un sistema con capacidad
para definir, mantener y utilizar una base de datos. Ej: SQL-Server (Microsoft), Oracle Server
(Oracle), MySQL (Open Source) o Microsoft Access (de menor tamaño).
- Usuarios. Existen tres clases de usuarios relacionados con una Base de Datos:
1. El programador de aplicaciones, quien crea programas de aplicación que utilizan la base de
datos.
2. El usuario final, quien acceda la Base de Datos por medio de un lenguaje de consulta o de
programas de aplicación.
3. El administrador de la Base de Datos (DBA: Data Base Administrator), quien se encarga del
control general del Sistema de Base de Datos.
Características de un sistema gestor de bases de datos:
- Los datos se organizan independientemente de las aplicaciones que los vayan a usar (independencia
lógica) y de los ficheros en los que vayan a almacenarse (independencia física).
- Los usuarios y las aplicaciones pueden acceder a los datos mediante el uso de lenguajes de
consulta (p.ej. SQL, Query-by-example…).
- Los datos se gestionan de forma centralizada e independiente de las aplicaciones.
- Consistencia e integridad de los datos.
- Fiabilidad (protección frente a fallos) y seguridad (no todos los datos deben ser accesibles a
todos los usuarios).
B.2. Sistemas distribuidos y centralizados
B.2.1. Centralizados
En el modelo de sistema centralizado hay una máquina denominada servidor, que dispone de los
recursos a compartir, al cual los demás ordenadores (denominados clientes) acceden para utilizar los
recursos.
B.2.2. Distribuidos
Colección de servidores independientes que se encuentran físicamente separados y no comparten una
memoria común, pero están enlazados por una red y equipados con un sistema de software distribuido
y que de cara al usuario funcionan como un sistema único y centralizado.
35
Ventajas de los sistemas distribuidos vs centralizados:
- Economía: Los microprocesadores ofrecen mejor relación precio/rendimiento que los mainframes
(ordenadores centrales).
- Velocidad: Tiene mayor poder de cómputo que un mainframe.
- Distribución inherente: Aplicaciones en máquinas separadas geográficamente.
- Confiabilidad: El sistema sobrevive a cualquier falla en una máquina.
- Crecimiento por incrementos según las necesidades.
Desventajas de los sistemas distribuidos vs centralizados:
- Software: Hay poco software disponible para sistemas distribuidos. La administración es
compleja
- Redes: Se pueden saturar o causar otros problemas y la velocidad de propagación de la información
puede ser lenta
- Más problemas de seguridad
- Mantenimiento más complejo
- No existe una memoria global (cada nodo tiene su memoria local).
B.3. Modelos de datos
Un modelo de datos es una serie de conceptos que se utilizan para describir un conjunto de datos y
las operaciones para manipularlos, es decir, describe la estructura de un sistema de gestión de base de
datos (SGBD)
Un modelo de datos consiste en:
- Objetos (entidades que existen y que se manipulan).
- Atributos (características básicas de estos objetos).
- Relaciones (forma en que enlazan los distintos objetos entre si).
Hay dos tipos de modelos de datos:
- los modelos conceptuales: disponen de conceptos cercanos a la forma en que los usuarios finales
perciben una base de datos.
- los modelos lógicos: disponen de conceptos que describen detalles sobre el almacenamiento de
los datos en la computadora.
En el diseño de bases de datos se usan primero los modelos conceptuales para lograr una descripción
de alto nivel de la realidad, y luego se transforma el esquema conceptual en un esquema lógico.
Clasificación de los modelos de datos
Los modelos de datos sirven para clasificar los distintos tipos de SGBD. Existen diferentes modelos
de datos para bases de datos:
Modelos lógicos basados en objetos
a)Modelo relacional-objeto: se basa en una percepción del mundo compuesta por objetos, llamados
entidades, y relaciones entre ellos. Las entidades se diferencian unas de otras a través de atributos.
b)Modelo orientado a objetos: también se basa en objetos, agrupados en clases, los cuales contienen
valores y métodos, entendidos como órdenes que actúan sobre los valores.
36
Modelos lógicos basados en registros: estos modelos se usan para especificar la estructura lógica
global de la base de datos, estructurada en registros de formato fijo de varios tipos
- Modelo relacional: representa los datos y sus relaciones mediante tablas bidimensionales, que
contienen datos tomados de los dominios correspondientes.
- Modelo de red: está formado por colecciones de registros, relacionados mediante punteros o ligas
en grafos arbitrarios.
- Modelo jerárquico: es similar al de red, pero los registros se organizan como colecciones de
árboles.
El más extendido es el relacional, mientras que los otros dos existentes, jerárquico y de red, se
encuentran en retroceso.
Relaciones entre Sistemas de Información Científica (Scientific Information Systems) y Sistemas de
Información Geográfica (Geographic Information Systems)
Los formatos y modelos de datos pueden clasificarse también en función de la comunidad a la
que sirven. Por un lado existen sistemas orientados a la comunidad científica de Ciencias de la
Tierra (Scientific Information Systems) y, por otro, sistemas usados por la comunidad científica de
los Sistemas de Información Geográfica (Geographical Information Systems o GIS). La progresiva
convergencia de intereses entre ambas comunidades ha planteado la necesidad de integrar ambos tipos
de sistemas, aunque el objetivo no es fácil debido a los problemas de operar con los diferentes formatos
y herramientas de análisis que se han desarrollado en cada uno de esos sistemas. La necesidad de llegar
a una interoperabilidad entre estas comunidades ha sido considerada por autores como Nativi et al.
(2006). En la comunidad de las Ciencias de la Tierra se han desarrollado a lo largo de los años una
serie de formatos y modelos de datos específicos (netCDF, HDF, BUFR, GRIB…), herramientas de
acceso a estos datos (OpenDAP, ADDE…) y aplicaciones para trabajar con estos datos (Matlab, IDL).
Por otro lado, la comunidad SIG ha trabajado tradicionalmente con formatos de datos (SHP, DWG,
GeoTIFF…) y Sistemas de Gestión de Bases de Datos generalmente propietarios aunque recientemente
está incoporporando estándares abiertos a través de los OGC Web Services.
El ArcGIS Marine Data Model es un modelo de datos orientado a objetos para un amplio rango de
datos marinos, como por ejemplo puntos, datos raster y series temporales. Incluye también información
del instrumento que ha generado las observaciones, campañas, etc. El modelo está desarrollado en UML
(Unified Modelling Language) e incluye metadatos.
B.4. Formatos de metadatos científicos
Muchos formatos de metadatos se basan en XML (Extensible Markup Language). Es un lenguaje que
cabe mencionar debido a que se ha utilizado en la definición de muchos de los formatos de metadatos.
Este lenguaje se diseñó para mejorar la interoperatibilidad de la red, proporcionando un sistema de
identificación de la información más flexible y adaptable.
Del mismo modo que el lenguaje HTML, los datos en XML se identifican utilizando etiquetas
(identificadores englobados en paréntesis angulares del tipo: <...>). Colectivamente, las etiquetas
se conocen con el término inglés “markup”. A diferencia de HTML, las etiquetas XML se utilizan
para describir los datos, y no como se visualizan. Así como en HTML una etiqueta puede indicar la
visualización del texto en negrita (<b>...</b>), una etiqueta XML proporciona un descriptor del dato,
por ejemplo, <cruise id>...</cruise>.
El lenguaje se denomina extensible porque no tiene un formato predefinido (a diferencia de otros
lenguajes basados en etiquetas, como HTML). XML es de hecho un “metalenguaje” —un lenguaje para
describir otros lenguajes— que permite definir lenguajes propios adaptados a la descripción de diferentes
tipos de datos y documentos (por este motivo ha sido utilizado ampliamente en la definición de metadatos).
XML está escrito en SGML, el metalenguaje internacional estándar para sistemas de texto basados en
etiquetas (ISO 8879).
37
Formatos usuales de metadatos científicos
ISO 19115 es un estándar de metadatos geo-espaciales propuesto por la ISO/TC 211. Dentro de el
estándar se ha definido un subconjunto reducido de metadatos debido a que algunos de los conjuntos de
datos no requieren de la complejidad de las especificaciones del estándar. El ISO 19115 no especifica
un formato concreto de almacenamiento aunque se han realizado algunos esquemas basados en XML
para su implementación.
CSDGM (Content Standard for Digital Geospatial Metadata) es el estándar de metadatos para
objetos geográficos desarrollado por la FGDC (Federal Geographic Data Committee). El modelo de
metadatos CSDGM es muy detallado aunque muchos de sus componentes son opcionales. Se pueden
desarrollar perfiles específicos, adaptando el estándar a las necesidades particulares de una aplicación
específica (manteniéndose dentro del estándar). El modelo CSDGM se ha utilizado ampliamente en
U.S.A. y en menor grado en otros países. La FGDC ha desarrollado una una codificación del estándar
en XML (DTD).
Dublin Core Metadata es un estándar general para metadatos descriptores de recursos disponibles
en la red. Fue desarrollado por la Dublin Core Metadata Initiative, un foro abierto para la definición
y desarrollo de un estándar de metadatos en línea que soportara un amplio abanico de aplicaciones y
modelos de negocio. El Dublin Core (DC) se está utilizando ampliamente para la documentación de
fondos bibliográficos (artículos, libros y recursos similares) que son accesibles vía Internet.
MarineXML. El desarrollo de Marine XML (también denominada MML) es una iniciativa de
IOC/IODE para mejorar el intercambio de datos dentro de la comunidad marina. El proyecto europeo
MarineXML EC contribuyó al proceso de “pre-estadarización” basada en XML.
DIF (Directory Interchange Format) es un formato general de intercambio de información de
conjuntos de datos científicos. DIF fue propuesto en una reunión de trabajo para la interoperatibilidad
de catálogos que se realizó en febrero de 1987. Después de algunas exhibiciones, reuniones de trabajo
y revisión por parte de la comunidad científica, el Directory Interchange Format (DIF) fue aprobado
y adoptado formalmente por el CI Science Advisory Group en 1988. Desde entonces se ha utilizado
ampliamente en sistemas de catalogación, entre otros, en el Global Change Master Directory (GCMD)
para aplicaciones de Ciencias de la Tierra (inicialmente denominado NASA’s Master Directory
(NMD)). DIF es un estándar para la creación de directorios descriptores de datos, y contiene una
colección de campos en los que se detalla información específica de los datos. Seis de estos campos son
obligatorios (identificador de la entrada del directorio, título, parámetros, centro de datos, resumen y
autor del documento); el resto son opcionales y se utilizan para ampliar la información proporcionada.
El Directory Interchange Format es compatible con el estándar CSDGM. Los datos DIF es almacenan
en ficheros con formato ASCII.
ANZLIC. La Spatial Information Council es una iniciativa conjunta de los gobiernos de Australia,
Nueva Zelanda y de los Estados y Territorios de Australia. El estándar de metadatos ANZLIC define
un conjunto de elementos de metadatos central, que debe especificarse para cada conjunto de datos. Los
elementos centrales de ANZLIC se definen en el ANZMETA Document Type Definition (DTD).
NcML (NetCDF Markup Language) define los metadatos para datos genéricos en formato NetCDF.
NetCDF es un formato utilizado ampliamente en aplicaciones oceanográficas, entre las que se encuentra
el programa ARGO . El Netcdf Metadata Object Model (NMOM) se desarrollo para datos genéricos
en formato in NetCDF. Por ello, NcML se desarrolló de la forma más genérica posible y sólo incluye
características que sean comunes para todos los datos en formato NetCDF. NcML está implementado
en un esquema XML.
IWICOS (Integrated Weather, Sea Ice and Ocean Service System) es una especificación de
metadatos desarrollada durante el proyecto IST (2000-2002). La especificación de IWICOS es similar
en estructura al estándar CSDGM , pero se han añadido algunos elementos adicionales para describir
algunos de los tipos de datos met-ice-ocean desarrollados en el proyecto IWICOS. Las especificaciones
de IWICOS se definen utilizando esquemas XML. Los datos son almacenados en ficheros separados en
formatos BSQ, GRIB, Shapefile o XML.
38
B.5. Formatos de datos espaciales
B.5.1. Mapas de bits y mallas
SDTS (Spatial Data Transfer Standard) es un estándar para la transferencia de datos espaciales
desarrollado por el USGC (U.S. Geological Survey). Es ampliamente usado en softwares desarrollados
por ESRI, ERDAS y MapInfo entre otros. SDTS puede guardar datos raster (mapas de bits) y vectoriales
así como metadatos (por ejemplo calidad de los datos).
NetCDF (network Common Data Format) es una estándar de datos binarios desarrollado por
el Unidata Program Center in Boulder, Colorado. NetCDF es un formato abstracto para matrices
multidimensionales (orientada a vectores) y es muy utilizado como formato de entrada y salida de
muchas aplicaciones GIS y en general para el intercambio de datos científicos. También puede registrar
metadatos.
HDF (Hierarchical Data Format) es un formato binario estructurado de múltiples objetos diseñado
en el National Center for Supercomputer Aplications (NCSA) para facilitar la transferencia de datos.
Los metadatos son registrados como atributos de las clases.
GeoTIFF es un estándar de datos de domino público que permite que información georreferenciada
sea encajada en un archivo de imagen de formato TIFF. La información adicional incluye el tipo
de proyección, sistema de coordenadas, elipsoide, datum y todo lo necesario para que la imagen
pueda ser automáticamente posicionada en un sistema de referencia espacial. El formato GeoTIFF
es completamente compatible con TIFF 6.0, por lo que un programa informático incapaz de leer e
interpretar esa información podrá aún así abrir el archivo de imagen GeoTIFF y visualizarlo como si de
un archivo TIFF normal se tratara.
B.5.2. Datos vectoriales
S57 es un estándar del IHO (International Hydrographic Organization) para el intercambio de datos
digitales hidrográficos. S57 se utiliza para la elaboración de Cartas de Navegación electrónicas (ENCs)
pero también puede incluir datos útiles en otras áreas de aplicación. Los datos pueden ser guardados en
ficheros ASCII o binario e incluyen metadatos.
SDTS: descrito en el apartado B.5.1.
Shapefile es un formato binario vectorial de almacenamiento digital donde se guarda la localización
de los elementos geográficos y los atributos asociados a ellos. Carece de capacidad para almacenar
información topológica. Desarrollado por la compañía ESRI actualmente se ha convertido en un formato
estándar ampliamente utilizado por muchas aplicaciones, tanto comerciales como libres.
B.6. ESEOOXML
El ESEOOXML es una especificación de XML desarrollada atendiendo a los objetivos de ESEOO
con el fin de estandarizar el intercambio de información relativa a series temporales de datos entre
distintos usuarios. Se trata de un lenguaje de marcado para documentos que almacenan una información
de manera estructurada y jerarquizada, ideado para incorporar información auxiliar y almacenar
metadatos. La definición del ESEOOXML consistió en establecer las etiquetas de marcado válidas y
una estructura jerarquizada para los documentos (figura 8).
Básicamente los documentos ESEOOXML constan de un elemento raíz llamado <ESEOO> en el
que se “anidarán” los dos grandes paquetes de información. Por un lado, dentro del elemento <Head>
irá toda la información que describa los datos que contiene el mismo documento (metadatos): unidades
de medida, posición, origen, organismo generador, etc. Este elemento constituye la información
“de cabecera” del documento. Por otro lado, la otra gran rama del documento ESEOOXML cuelga
del elemento <Data>, que contiene el grueso de los datos numéricos. Los nombres de las etiquetas
39
Figura 8. Esquema de la estructura-árbol de las etiquetas de marcado válidas establecidas para la especificación
ESEOOXML.
que contienen los datos indicarán la variable de la que se trata y están pensadas para poder incluir
información de distintos registros temporales y de la calidad de los datos. La documentación que
describe detalladamente el formato ESEOOXML está disponible en la página web: http://www.eseoo.
org/intranet/menu_temas.asp.
También se desarrollaron herramientas, todas ellas basadas en software libre, que permiten
manipular y procesar documentos escritos en ESEOOXML. Estas herramientas son de dos tipos: de
transformación, que permiten crear documentos ESEOOXML a partir de ficheros en otros formatos
así como leer documentos ESEOOXML y transformarlos a otro formato, y de validación, que permite
verificar que el documento cumple con la especificación ESEOOXML. Todas las herramientas y su
documentación están disponibles en la página web de ESEOO (http://www.eseoo.org/intranet/menu_
temas.asp >> Software Disponible)
Referencias
Nativi, S., Domenico, B., Cron, J., Davis, E., Bigagli, L.- 2006. Extending THREDDS middleware
to serve OGC community. Adv. Geosci., 8: 57-62.
40
C. Glosario
ADDS Antarctic Data Directory System (SCAR)
AMD Antarctic Master Directory
BODC British Oceanographic Data Centre
CCAD Commitee for the Coordination of Antarctic Data (SCAR)
CNDP Centro Nacional de Datos Polares (España)
COI Comisión Oceanográfica Intergubernamental de UNESCO (En inglés, IOC,
Intergovernmental Oceanographic Commission)
COMNAP Council of Managers of National Antarctic Programs
CPE Comité Polar Español
DIF Directory Interchange Format (SCAR)
EMODNET European Marine Observation and Data Network
ESEOO Establecimiento de un Sistema Español de Oceanografía Operacional
DMAC IOOS Data Management and Communications (EEUU)
DNA Designated National Agency
GEO Group on Earth Observations
GEOSS Global Earth Observation System of Systems
GMES Global Monitoring for Envieonment and Security (UE)
GOOS Global Ocean Observing System
IBIROOS Iberia Biscay Ireland Operational Oceanography System
ICES International Council for the Exploration of the Sea
ICSU International Council for Science
IDE Infraestructura de datos espaciales
IDECSIC Infraestructura de datos espaciales del CSIC
IDEE Infraestructura de datos espaciales de España
IDN International Directory Network (SCAR)
IFREMER Institut français de recherche pour l’exploitation de la mer
IGME Instituto Geológico y Minero de España
IGN Instituto Geográfico Nacional (España)
IOC Intergovernmental Oceanographic Commission (UNESCO)
IODE International Oceanographic Data and Information Exchange
ISI Ingénierie des Systèmes InformatiqueS (Francia)
IOOS Integrated Ocean Observing System (EEUU)
JCADM Joint Committee on Antarctic Data Management (SCAR)
JCOMM Joint WMO/IOC Tehcnical Commission for oceanography and Marine Meteorology
JRC Joint Research Laborarory (UE)
NADC National Antarctic Data Centre
NOAA National oceanographic and Atmospheric Administration (EEUU)
NODC National Oceanographic Data Centre
OGC Open Geospacial Consortium
SAIDIN Satellite Image database Interface (CSIC)
SCOR Scientific Committee on Oceanic Research
SCAR Scientific Committee on Antarctic Research
SDC Centros de Datos de Satélite
SeaDataNet A Pan-European Infrastructure for Ocean and Marine Data Management
SGBD Sistema de gestión de base de datos
SISMER Systèmes d’Informations Scientifiques pour la Mer (Francia)
UNEP United nations Environmental Programme
WMO World Meteorological Organisation
WDC World Data Centre
41
D. Miembros del grupo de Trabajo
Participantes
Estrada, Marta (coordinadora, SCOR-España), Institut de Ciències del Mar (CSIC), Barcelona
Álvarez, Enrique, Puertos del Estado, Madrid
Barragán Antonio, Instituto Geológico y Minero de España, Madrid
Bermúdez, Óscar, Instituto Geológico y Minero de España, Madrid
García, Mª Jesús, Instituto Español de Oceanografía, Madrid
Lavín, Alicia (SCOR-España), Instituto Español de Oceanografía, Santander
Masqué, Pere (SCOR-españa), Institut de Ciència i Tecnologia Ambientals, Universitat Autònoma
de Barcelona, Bellaterra
Pérez, Fiz F., Instituto de Investigacións Mariñas (CSIC), Vigo
Piera, Jaume; Unitat de Tecnologia Marina, CMIMA (CSIC), Barcelona
Colaboradores
Chic, Òscar, Institut de Ciències del Mar (CSIC), Barcelona
Díez, Susana, Unitat de Tecnologia Marina, CMIMA (CSIC), Barcelona
42
Descargar