Bases de datos documentales: Introducción

Anuncio
Grao en Información e Documentación: Bases de datos documentais
Curso 2013 – 2014
Bases de datos documentales: Introducción
1
Introducción
Una BD documental es una BD que mantiene tablas cuyas filas contienen...
Documentos (de cualquier tipo y formato)
Referencias que permiten localizar documentos
...y su finalidad básica es la de permitir la recuperación de documentos, o la elaboración
de nuevos documentos (por ejemplo, bibliografías).
Para conseguir esto, podríamos pensar en utilizar SGBDs convencionales. Sin embargo
esta opción presenta muchos inconvenientes, ya que la gestión de la información
documental conlleva necesitades específicas. Por ejemplo, la realización de búsquedas
que tengan en consideración el contenido de los documentos almacenados en la BD.
Esta circunstancia motivo que los primeros sistemas de gestión de información
documental fuesen desarrollados de forma específica, a medida de las necesidades
puntuales que tuviesen, en un momento dado, un determinado grupo de usuarios.
Lógicamente, y desde un punto de vista práctico, no es esta es una buena solución:
enormes esfuerzos de desarrollo independientes destinados a satisfacer necesidades
similares de diferentes grupos de personas.
Y, sin embargo, hubo de transcurrir un período de tiempo razonablemente largo hasta
que los principales SGBDs comerciales fuesen adaptados para soportar de forma
explícita la gestión de información documental. Más concretamente Oracle incluye,
desde su versión 7, el módulo ConText Cartridge, que podía ser añadido opcionalmente
al sistema principal. Y del mismo modo, Informix (hoy absorbida por IBM) desarrolló
en módulo Excalibur Text Search DataBlade Module, que hoy día puede ser utilizado
con el gestor DB2 de IBM. Estos dos módulos ofrecen, entre otras funcionalidades,
extensiónes (ampliaciones) particulares del lenguaje SQL para soportar búsquedas por
contenido sobre los documentos almacenados en una BD.
2
Clasificación de las BDs documentales
Podemos establecer diferentes clasificaciones de las BDs documentales atendiendo a
diferentes criterios:
Por
Por
Por
Por
Por
su contenido
su método de acceso
su cobertura temática
su cobertura documental
su modelo de tratamiento documental
Analizaremos a continuación las clasificaciones que podemos establecer en función de
esos criterios.
Autor: Juan Ramón López Rodríguez
1
Grao en Información e Documentación: Bases de datos documentais
Curso 2013 – 2014
2.1 Clasificación por contenido
Atendiendo a su contenido, podemos clasificar las BDs documentales en:
BDs de texto completo: la BD contiene o bien documentos originalmente
electrónicos, o bien transcripciones realizadas a partir de documentos en
papel. También se incluye información asociada a cada documento. Un
sistema de este tipo permitirá, normalmente, la búsqueda por contenido sobre
los documentos.
BDs de archivos de imagen: la BD contiene documentos escaneados y
almacenados en formato de imagen, o bien, directamente, fotografías o
vídeos en formato digital. Este tipo de sistemas no permite, normalmente, la
búsqueda por contenido.
BDs referenciales: la BD almacena información para localizar y obtener
cada documento, pero no el documento en sí mismo. (ej, el catálogo de una
biblioteca). Cada tabla incluye campos con información sobre los
documentos o incluso enlaces para poder recuperar el documento a través de
otros programas o sistemas.
2.2
Clasificación por modo de acceso
BDs con acceso local: la BD es accesible desde un único equipo, o como
mucho desde los equipos de una red local
BDs con soporte CDROM: La BD, y el sistema para acceder a la misma, se
almacenan en un CD, que puede ser copiado y distribuido a sus usuarios.
BDs en línea: la BD es accesible desde cualquier ordenador con conexión a
Internet, en diferentes modalidades:
 Acceso vía Telnet: una ventana del ordenador del usuario simula
una terminal del ordenador que contiene la BD, simulando un
acceso local. El acceso a la BD puede ser controlado a través de
un sistema de menús, o bien mediante el uso de comandos
especiales.
 Acceso vía web: el acceso a la BD se realiza a través de una
aplicación Web, por medio de un navegador.
En cualquiera de los dos casos, el acceso a la BD puede ser libre, o bien
protegido mediante una contraseña, que bien pudiera obtenerse tras la
firma de un contrato.
El uso de BDs con acceso local o soporte CDROM es obligatorio en el caso de
usuarios que no dispongan de acceso a Internet. El uso de CDROM tiene
asociada la desventaja de que la información que contenga dejará de estar
actualizada con el paso del tiempo (algo que no ocurre en el caso de las BDs en
línea, que hacen accesibles de inmediato a sus usuarios las actualizaciones
producidas en la BD). Este inconveniente se puede paliar mediante la
distribución periódica de nuevas versiones del CD a sus usuarios.
2.3
Clasificación por cobertura temática
BDs monotemáticas: contienen documentos relativos a un único tema,
interesantes para especialistas en un determinado área de conocimiento:
Autor: Juan Ramón López Rodríguez
2
Grao en Información e Documentación: Bases de datos documentais
Curso 2013 – 2014
 Científico tecnológicas
 Económico-empresariales
 Médico-sanitarias
 Medios de comunicación
 Político-jurídicas
 ...
Generalistas: satisfacen necesidades de información general, estando
destinadas a un gran número de usuarios
2.4
Clasificación por cobertura documental
BDs que almacenan un único tipo de documento (ej. BD de tesis
doctorales)
BDs que almacenan tipos diferentes de documentos (ej. catálogo de una
bibioteca pública)
2.5
Clasificación en base al modelo de tratamiento documental
BDs de sumarios/sin análisis de contenido: se almacenan sólo datos
básicos relativos a cada documento (autor, título, fuente...). Como mucho, se
incluye un resumen del documento realizado por el autor y extraido del
propio documento. Sólo se admiten búsquedas sobre palabras del título del
documento.
Catálogos de biblioteca: Solo contienen información sobre los fondos de
una biblioteca (es decir, están asociados a un fondo documental
predeterminado), catalogados siguiendo normas internacionales.
BDs de análisis documental completo: asociado a cada documento, se
almacena un resumen creado ex profeso para la base de datos; o incluso un
conjunto de términos representativos:
 Descriptores: palabras descriptivas de la temática de cada
documento, extraidas de un vocabulario común y preestablecido,
que pueden estar organizadas en niveles constituyendo una
indización. (ej: encabezamientos y subencabezamientos de
materia en catálogos de biblioteca)
 Palabras clave: palabras seleccionadas al dar de alta una obra en
la BD, que se definen sobre la marcha con el fin de complementar
al conjunto de descriptores preestablecido para poder fijar con
mayor precisión la temática de cada documento.
Los tres tipos de información mencionados se puyeden combinar de muy
diversas formas. Así, podemos encontrarnos con BDs documentales...


...con clasificación y resumen: esta opción permite muchas
formas diferentes de recuperar el mismo documento (búsqueda
por palabras clave y contenido del resumen)
...con clasificación e indización: esta opción permite lograr una
mayor pertinencia de los resultados obtenidos en la búsqueda de
Autor: Juan Ramón López Rodríguez
3
Grao en Información e Documentación: Bases de datos documentais

Curso 2013 – 2014
documentos; aunque implica que el usuario debe conocer
previamente los descriptores del índice para poder utilizarlos en
la definición de su búsqueda.
...con clasificación, indización y resúmenes: la más completa de
todas.
Resumiendo, en una BD con análisis documental completo podemos
localizar documentos de muy diversas formas:



Busqueda por contenido del resumen/título de cada
documento.
Búsqueda por palabras clave/descriptores asociados a cada
documento.
Búsqueda por contenido del documento.
Índices de citas: se trata de un tipo de BD documental muy específico, que
almacenan las citas bibliográficas de revistas científicas y publicaciones de
relevancia sobre determiados temas o áreas de conocimiento. Permiten
seleccionar aquellos documentos más relevantes en una determinada
temática, o pueden ser utilizados para la realización de estudios
bibliométricos.
Autor: Juan Ramón López Rodríguez
4
Grao en Información e Documentación: Bases de datos documentais
Curso 2013 – 2014
Bibliografía
Rodríguez Yunta, Luis. Bases de datos documentales: estructura y uso. En: MALDONADO, Ángeles (coord.).
La información especializada en Internet. CINDOC, 2001
Autor: Juan Ramón López Rodríguez
5
Descargar