Tutorial TesauroUNEX

Anuncio
SOFTWARE DE ADMINISTRACION DE TESAUROS: CREACION, EDICION
Y MANTENIMIENTO (BEAT)
Sobre el tutorial y la distribución del programa
Para este tutorial hemos utilizado la versión 3.2.0.a (1999/01/23, CP 850) del
programa BEAT (“Un Buen Entorno Administrador de Tesauros”), de Josep Sau
([email protected]), que ha sido distribuida en calidad de software freeware en la web Will
Power Information (http://www.willpower.demon.com.uk/thessoft.htm#BEAT)
La versión que se proporciona es una “versión liberada” proporcionada sin
garantías, con todos los derechos reservados, que puede ser usada y copiada libremente
por particulares, pero que tiene prohibida su venta o uso comercial.
El autor de este tutorial no tiene ninguna relación comercial con el autor del
programa BEAT, si bien este último ha autorizado expresamente su uso, siempre que
todo tipo de consultas sobre dicho tutorial se realicen únicamente al autor de este taller
del Máster Online de Documentación Digital. Este tutorial no forma parte de la
documentación oficial del programa, a la que se puede acceder directamente en el
programa a través de la combinación de teclas Alt + F1.
1. Instrucciones generales
Para realizar este taller, deben seguirse todos los pasos de manera secuencial, y
antes de realizar una acción, deben leerse atentamente todas las instrucciones
correspondientes. Es, por tanto, esencial no saltarse ninguna fase del tutorial e intentar
comprender el sentido de las acciones que se están realizando.
Además, se incluyen Recuadros Especiales que contienen explicaciones de
especial importancia para aprovechar al máximo los conocimientos derivados del
tutorial. Estas explicaciones deben leerse con especial atención. El alumno no debe
proseguir con el tutorial hasta estar seguro de haber comprendido y asimilado bien las
explicaciones de cada Recuadro. Si pese a todo, le quedan dudas, o desea ampliar
conceptos, puede tomar nota y preguntar al profesor en las sesiones dedicadas al efecto.
2. ¿Qué es un tesauro?
RECUADRO ESPECIAL n.º 1:
Es muy conveniente leer previamente el apartado 4 de la teoría de la Unidad Seminario 2-2.,
Lenguajes Documentales de la Prof. Conxa Planas.
2.1. Tesauros
En general, un tesauro es un conjunto de estructuras terminológicas que interrelacionan los
términos de una lengua para construir un lenguaje documental normalizado, que es utilizado por:
- los indizadores en la representación abreviada de los documentos,
- los bibliotecarios como guía terminológica para la estandarización de las entradas de los
encabezamientos de materias en la ordenación de dichos documentos, y
- los usuarios en las ecuaciones de búsqueda, asociaciones terminológicas, comprensión del
entorno de los descriptores del tesauro, etc. de las tareas de recuperación documental.
Actualmente, se trata de potenciar los tesauros jerárquicos primitivos de cualquier subárea de
conocimiento para que se conviertan en Tesauros Conceptuales, con numerosas relaciones asociativas
entre los descriptores y relaciones cruzadas entre descriptores y los no descriptores. Tras su posterior
conversión en hipertextuales, podremos conectarlos entre sí en la Web de Internet, de manera que
1
constituyan una poderosa ontología terminológica representada en el hiperespacio como una red
semántica neuronal.
2.2. Relaciones entre descriptores
 Relaciones de equivalencia
“Relación entre los términos preferentes y no preferentes cuando se considera, a efectos de
indización, que uno o más términos se refieren al mismo concepto”.
Esta reciprocidad entre descriptores y sus sinónimos cuasisinónimos (no descriptores) se expresa
mediante las siguientes convenciones:
- USE, que se escribe precediendo al término preferente.
- UP (usado por), que se escribe precediendo al término no preferente.
 Relaciones jerárquicas
“Organización de los términos preferentes (según su significado) en categorías, subcategorías,
etc., basándose en grados o niveles de super y subordinación; en los que un término superordenado
representa un todo o clase y los términos subordinados corresponden a sus miembros o partes”.
Esta jerarquía entre términos específicos y genéricos se expresa mediante las siguientes
convenciones:
- TG (término general), que se escribe precediendo al término superordenado.
- TE (término específico), que se escribe precediendo al término subordinado.
 Relaciones asociativas
Relaciones afines, de tipo psicológico, establecidas entre los términos preferentes no
equivalentes ni con relaciones jerárquicas entre sí (sobre la base de que tal conexión podría revelar
términos alternativos útiles en la recuperación)”.
Se establecen principalmente cuando los términos se encuentran en distintos niveles jerárquicos
y la relación es recíproca entre esos términos, expresándose mediante la convención:
- TR (término relacionado), o su equivalente en otros idiomas.
 Notas de alcance
Son meras notas de aplicación del término o definiciones de conceptos confusos, que nos sirven
para que cualquier usuario no experto pueda utilizar con propiedad los descriptores del tesauro.
Según lo anterior, todos los términos de indización, preferentes (descriptores) y no preferentes
(no descriptores), se organizan en una secuencia alfabética única.
Normalmente, los términos no descriptores (no preferentes) sólo se acompañan de reenvíos (ej.,
USE) a sus equivalentes descriptores (preferentes), mientras que la información que acompaña a los
términos preferentes (descriptores) debe listarse en el siguiente orden:
- NA. Notas de aplicación o definiciones de términos confusos.
- UP. Reenvíos de los términos equivalentes no preferentes.
- TG. Referencias a los términos genéricos.
- TE. Referencias a los términos específicos.
- TR. Referencias a los términos asociados por afinidad.
2.3. Problemas en la normalización de los descriptores de un tesauro.
-
-
Selección de los términos.
Control semántico del vocabulario:
Forma gramatical de los términos (sustantivos, adjetivos sustantivados, plurales, etc.).
Anomalías gramaticales a nivel de descriptor (sinonimia, cuasisinonimia, polisemia,
etc.).
Relaciones a nivel del lenguaje (relaciones de equivalencia y jerárquicas).
Expresión de la estructura jerárquica de los descriptores, y relaciones no jerárquicas o
de equivalencia (o cruzadas) entre descriptores (lenguaje controlado) y no
descriptores (lenguaje natural).
Establecimiento de las relaciones asociativas extrajerárquicas entre los descriptores.
Fijación de las notas de alcance a determinados descriptores.
2.4. Métodos prácticos de selección de los términos.
2
-
-
Extracción a partir de otras herramientas conceptuales previamente compiladas
(glosarios, listas de encabezamientos de materia, clasificaciones temáticas, etc.) en
materias relacionadas conceptualmente.
Creación ex novo de un vocabulario controlado mediante la extracción de los términos
directamente de los documentos:
o
bien por grupos de expertos,
o
bien automáticamente, o
o
bien ambas, de manera mixta.
2.5. Expresión de las estructuras.
 Estructura alfabética:
Los términos descriptores y los no descriptores aparecen dispuestos en orden alfabético. Los no
descriptores aparecen con su reenvío a los descriptores mediante la información USE.
 Estructura jerárquica:
Los términos se expresan mediante todos los niveles genéricos y específicos de cada descriptor,
adoptando una estructura arbórea única (con sangrados en el texto mediante “saltos de tabulador”).
 Estructura alfabética conceptual:
Igual que la anterior, pero con la adicción de la siguiente información: NA, UP, TG, TE, TR a los
descriptores.
3. Introducción al uso del gestor de tesauros BEAT.
BEAT es un gestor interactivo de construcción y de consulta de tesauros sobre
ordenadores PC. Existen versiones de este programa en castellano, catalán e inglés.
BEAT y su documentación constituyen Propiedad Intelectual, el autor conserva y se
reserva todos los derechos sobre ellos.
Permite diseñar un tesauro, y actualizar interactivamente sus elementos:
descriptores, no descriptores, relaciones, notas de alcance y códigos clasificatorios.
Contempla los tipos de relaciones de equivalencia, jerárquicas y asociativas
especificados en las normas ISO. Verifica inmediatamente la coherencia de cualquier
modificación en los términos o relaciones y crea automáticamente las relaciones
inversas.
Permite consultar interactivamente los términos según su secuencia alfabética o
navegar por la red de relaciones semánticas. También, proporciona la posibilidad de
buscar términos a partir de palabras clave o de sus códigos clasificatorios, y de limitar
los tipos de relaciones visibles en un determinado momento de la consulta. Mantiene la
indización alfabética de los términos automáticamente.
Puede generar listados de tesauros en diferentes formatos, que se envían a ficheros
de texto en formato ASCII, y que pueden imprimirse o editarse posteriormente con un
procesador de textos convencional (ver 6. Generación de Listados).
Entre las especificaciones del entorno, debemos señalar que:
- La longitud máxima de un término puede ser de 60 caracteres.
- La longitud máxima de las notas puede ser de 2.000 caracteres.
- El número máximo de relaciones de cada término puede ser de 80 relaciones
de cualquier tipo.
- Admite igualmente términos con varias relaciones de equivalencia (UF/USE).
4. Fases de la construcción de los tesauros.
RECUADRO ESPECIAL N.º 2:
3
I.
II.
III.
IV.
V.
VI.
VII.
VIII.
IX.
Elección del área temática y razones para su elaboración.
Comprobación de la no existencia de otro tesauro similar.
Delimitación del tema principal, sus temas auxiliares y/o marginales.
Recopilación de los términos:
a. De vocabularios, diccionarios, libros y otras fuentes secundarias (a priori).
b. De publicaciones periódicas y otras fuentes primarias (a posteriori).e
Depuración y normalización del vocabulario.
Agrupación de los términos y estructuración de las relaciones de equivalencia,
jerárquicas, asociativas...
Puntualización de las notas de alcance.
Listado de los índices del tesauro. Anexos: acrónimos, topónimos...
Edición del tesauro en sus distintos soportes.
5. Uso del programa. ENUNCIADO DEL EJERCICIO PRÁCTICO.
Diseñar una estructura jerárquica y asociativa muy básica para un Macrotesauro
de comunicación e información generalista, no especialmente pensado para un
determinado sistema de información.
Utilizar para ello los siguientes términos descriptores y no descriptores:
DESCRIPTORES:
ACCESO A LA INFORMACIÓN, ADQUISICIÓN, ANALISIS DOCUMENTAL,
ARCHIVISTICA, ARCHIVOS, AUTOPISTAS DE LA INFORMACION
BIBLIOMETRIA, BIBLIOTECAS, BIBLIOTECONOMIA
CENTROS DE DOCUMENTACIÓN, CENTROS DE INFORMACIÓN, CIBERESPACIO,
CIENCIAS DE LA INFORMACIÓN, COMUNICACIÓN, CONTROL DOCUMENTAL
DIFUSION DE LA INFORMACIÓN, DOCUMENTACIÓN, DOCUMENTOS LEGALES,
DOCUMENTOS PRIMARIOS, DOCUMENTOS SECUNDARIOS, DOCUMENTOS
TERCIARIOS
FONOTECAS, FUENTES DE INFORMACION
GESTION DE LA INFORMACIÓN, GESTION DEL CONOCIMIENTO, GLOBALIZACION
HEMEROTECAS
INFORMACIÓN, INFORMATICA
MATERIAL AUDIOVISUAL, MATERIAL IMPRESO, MATERIAL VISUAL, MEDIOS DE
COMUNICACION
MODOS DE COMUNICACIÓN, MUSEOS
PERIODISMO, POLITICA DE COMUNICACIÓN, PROCESAMIENTO DE LA
INFORMACIÓN, PROCESOS DE COMUNICACIÓN, PUBLICACIONES PERIÓDICAS,
PUBLICIDAD
RECUPERACION DE LA INFORMACION
SELECCION DE LA INFORMACIÓN, SERVICIOS BIBLIOGRAFICOS, SERVICIOS DE
CONSULTA, SERVICIOS DE INDIZACIÓN, SERVICIOS DE INFORMACIÓN, SERVICIOS
DE PRESTAMO, SERVICIOS DE PUBLICACIONES, SERVICIOS DE RESÚMENES,
SERVICIOS
DE
TRADUCCIÓN,
SERVICIOS
ESTADÍSTICOS,
SISTEMAS
INFORMATICOS, SOCIEDAD DE LA INFORMACIÓN, SOCIOLOGIA DE LA
COMUNICACIÓN, SOPORTES INFORMATICOS
TECNICAS DE COMUNICACIÓN, TECNOLOGIAS DE LA EDUCACIÓN, TECNOLOGIAS
DE LA INFORMACIÓN, TELECOMUNICACIONES, TEORIA DE LA INFORMACION
USUARIOS DE LA INFORMACION
VIDEOTECAS
NO DESCRIPTORES:
Información en bruto, multimedia, servicios de referencia, tecnologías de la comunicación
5.1. Inicio del programa.
4
Localice el icono del programa BEAT con el explorador de Windows, para
acceder al fichero ejecutable del programa del ya clásico sistema operativo MS-DOS.
Haga clic o presione la tecla enter, y vaya ejecutando los comandos correspondientes
para activar el programa. Cuando se active el programa puede maximizar la ventana del
programa para que ocupe toda la zona útil de la pantalla, si la configuración de su PC lo
permite.
La primera vez que utilice el programa gestor, deberá crear un tesauro (ej.:
EJERCICIOMASTER) al que acceder después para ir realizando las distintas
operaciones de compilación. Las veces sucesivas, bastará con seleccionar este u otro de
los tesauros creados de un recuadro, mediante la presión dos veces consecutivas de la
tecla enter.
Cuando quiera salir del programa, puesto que trabaja en el sistema operativo
MS-DOS, deberá utilizar la combinación de las teclas Alt+F, y después “S”, o también
con Escape, y asintiendo a la pregunta de si deseamos salir (¡OJO! No se puede hacer
mediante un clic con el ratón en el “aspa” superior derecha de la ventana ). En
ambos casos se guardará la información automáticamente al salir, pues no hay
comandos para guardar la información mediante “guardar”.
A la indicación de que el “Fichero diario ya existe” deberá presionar la letra “S”,
y a la de la pregunta “Nuevo o Añadir” deberá presionar la letra “A”, para pasar a la
pantalla siguiente en la que poder ir cargando los términos.
Esto último se hará mediante la presión simultánea de las teclas Alt+M y luego
la letra “A”, para pasar a la barra de “Alta término”, y poder dar de alta los nuevos
términos (ej.: CIENCIAS DE LA INFORMACIÓN) mediante un formulario
desplegable en la parte inferior de la pantalla:
5
Mediante una nueva presión de la tecla enter se irán añadiendo los términos
creados a la lista alfabética general de términos.
RECUADRO ESPECIAL N.º 3:
Para evitar los ya clásicos problemas de no reconocimiento fácil de las letras mayúsculas
acentuadas, necesitando configurar tanto la base de datos del gestor como el sistema operativo Windows
con la tabla de caracteres latina, adoptaremos el “convenio” de escribir:
 los descriptores en mayúsculas sin acentuar, y
 los no descriptores en minúsculas acentuadas, pues,
también resulta muy visual a la hora de distinguirlos en la edición final del tesauro, tanto en los índices
alfabéticos como en los permutados.
5.2. Fase documental. Selección formal de los términos.
RECUADRO ESPECIAL N.º 4:
Seguiremos las indicaciones teóricas de la Prof. Conxa Planas en su apartado 4.4., (Elaboración
y Mantenimiento) sobre los métodos analítico, sintético y mixto para la elección de los términos
descriptores.
Y, seleccionaremos como “convenio” entre diez y quince conceptos (monotérminos o
pluritérminos) como “facetas” de una de las posibles segmentaciones temáticas que se nos ocurra para el
tesauro que queremos diseñar, después de una detenida meditación.
Ésta será distinta para cada alumno, según sus conocimientos o preferencias. Pero, su diversidad
no producirá un déficit muy grave para el tesauro conceptual final dado que, posteriormente,
interrelacionaremos todos estos conceptos entre sí, mediante relaciones de equivalencia con los no
descriptores (UP/USE), y/o mediante relaciones asociativas con otros descriptores extrajerárquicos (TR).
Todo ello se traducirá en un tipo de red semántica de conceptos, a los que les afecta menos su
inicial emplazamiento jerárquico, o las primeras omisiones que luego se podrán suplir con la inclusión de
no descriptores (ya que, en su día, éstos podrán elevarse a descriptores en las sucesivas operaciones de
mantenimiento).
A continuación, mediante las teclas Alt+M y luego “A” accederemos a un
formulario desplegable en la parte inferior de la tabla alfabética general de términos, en
la que iremos dando de alta todos nuestros términos “cabecera de subjerarquía”
elegidos.
6
En el caso de que alguno de los descriptores incluidos se deba modificar,
entraremos en la misma pantalla anterior de modificar y nos situaremos en la barra de
“Cambio de Término” y presionaremos la letra “T” para que en el formulario
desplegable de la parte inferior de la hoja nos aparezca la posibilidad de modificar el
término escrito inicialmente:
Igualmente, en esta fase del cargado de términos es más sencillo borrar
totalmente un descriptor (Alt+M más “B”). Ya que, más adelante, cuando los
descriptores tengan ya sus distintas relaciones habrá que eliminar previamente éstas, por
necesidades informáticas del gestor BEAT.
Una vez modificados todos los términos incompletos o erróneos pasaremos de
nuevo a la tabla alfabética general de términos para establecer sus relaciones en dos
fases sucesivas: lingüística y conceptual.
5.3. Fase lingüística. Control semántico del vocabulario.
En esta fase que denominaremos lingüística, iremos cargando el resto de los
términos elegidos, de manera que se constituyan todas las subjerarquías necesarias
dentro de esas siete familias generales que hemos establecido en la fase anterior de
nuestro ejercicio.
Aprovecharemos, una vez cargados los correspondientes descriptores, para
relacionarlos jerárquicamente con sus “padres” o cabeceras de jerarquía de esas siete
familias generales establecidas en la fase anterior.
Para ello, nos posicionaremos sobre el término para el que queramos crear la
relación y pulsaremos enter. Después, cuando se haya abierto la pantalla con sólo ese
término (destinada a añadir o modificar todo lo relativo a ese término), pulsaremos
insert, (¿OJO!, a veces hay que insistir una segunda vez) que abre un menú con cinco
opciones en el que podremos escoger el tipo de relación a crear:
7
Aquí, por ejemplo, para cargar el término genérico de “Archivística”, que es
“Ciencias de la Información”, escogeremos de este menú “TG Término genérico”. Acto
seguido se abrirá un formulario desplegable en la parte inferior de la pantalla, en el que
deberemos introducir el término que queramos considerar como genérico (“Ciencias de
la Información”). Después pulsaremos enter y la relación genérica aparecerá cargada.
RECUADRO ESPECIAL N.º 5:
Igualmente, una vez cargados todos los descriptores, acompañaremos a cada uno de ellos de su
correspondiente código clasificatorio. Para ello, estableceremos el convenio de utilizar:
1. Una letra mayúscula relacionada con el nombre general del tesauro. En este caso pondremos la
letra “C” por convenio (a capricho del autor) al ser nuestro ejercicio práctico un tesauro de
“Comunicación e (Información)” y dado que la otra letra que se podía elegir “I” ser fácilmente
confundible con el dígito numérico “1”.
2. Seguida de un número dígito correlativo del 1 al 9 (después, cuando se agoten los números,
utilizaremos de nuevo letras mayúsculas correlativas de la A a la Z) por cada una de las
subjerarquías que vayamos constituyendo. A partir del término más general o “top”
“Información”, caracterizado por no tener ningún otro genérico superior o TG.
Para hacer esta operación, deberemos posicionarnos sobre el término que
elijamos, y pulsar Alt + M. Cuando salga el menú de Modificar, pulsar “C” (Cambiar
código). En el formulario desplegable que aparecerá, escribiremos el código
correspondiente:
8
Finalmente, cargaremos todos los términos no descriptores. Aprovecharemos
para relacionarlos con sus equivalentes descriptores, mediante relaciones cruzadas del
tipo UP/USE.
Para ello, procederemos del mismo modo que para cargar las otras relaciones.
Tras seleccionar el descriptor al que queramos asignar el no descriptor, pulsaremos
enter para entrar en la pantalla específica del término, y después insert para abrir el
menú de relaciones. De ese menú escogeremos “UP Usar por término no preferente”,
que abrirá el formulario desplegable que rellenaremos con el correspondiente no
descriptor “información en bruto”:
5.4. Fase conceptual. Relaciones asociativas entre los descriptores. Notas de
alcance.
Para ello, procederemos del mismo modo que para cargar las otras relaciones.
Tras seleccionar el descriptor al que queramos asignar otro descriptor como relacionado
9
asociativamente (ej.: PROCESAMIENTO DE LA INFORMACIÓN, de la familia
jerárquica C5), pulsaremos enter para entrar en la pantalla específica del término, y
después insert para abrir el menú de relaciones. De ese menú escogeremos “TR
Término relacionado”, que abrirá el formulario desplegable que rellenaremos con el
correspondiente descriptor relacionado “GESTIÓN DEL CONOCIMIENTO, de la
familia jerárquica C73”. Vemos que no es preciso que ambos descriptores estén al
mismo nivel jerárquico, aunque según la norma ISO deben pertenecer a jerarquías
diferentes de manera que no se crucen “erróneamente” las relaciones jerárquicas con las
asociativas:
También, en esta fase iremos acompañando a aquellos términos muy específicos
que lo precisen, dado que su significado pueda resultar desconocido para un usuario no
necesariamente experto en el área del conocimiento que pretende abarcar el tesauro en
construcción, de su correspondiente nota de alcance (NE Nota explicativa), mediante el
acceso primero a la pantalla de Modificar (Alt+M) y a continuación pulsando la letra
“N” para el llamado “Cambio de nota”, que sirve tanto para crear una nueva como para
modificar una definición anterior que no esté perfilada adecuadamente Las notas es
preferible escribirlas con mayúsculas y minúsculas con acentos, dado que así mejoran
en su visualización en los índices conceptuales:
10
RECUADRO ESPECIAL N.º 6:
El número de relaciones asociativas y de notas de alcance es totalmente aleatorio, dependiendo
del área del conocimiento cubierta por el tesauro en construcción, el sistema o sistemas de información
donde deberá utilizarse, y las características psicosociales de los compiladores.
Sin embargo, hoy en día se ha comprobado mayor eficacia de las recuperaciones en grandes
bases de datos documentales no previamente indizadas con ninguna otra herramienta conceptual (ej.:
bases de datos periodísticas o de la Web) con tesauros enriquecidos con numerosas relaciones asociativas
entre descriptores, y algunos autores proponen más de un 30% de relaciones asociativas como mínimo.
En el caso de las notas de alcance, suele partirse de un mínimo del 10% y no más del 30%,
aunque no haya ningún tipo de norma universalmente adoptada al respecto.
6. Generación de listados.
RECUADRO ESPECIAL N.º 7:
Siguiendo las indicaciones teóricas de la Prof. Conxa Planas en su apartado 4.4., (Elaboración y
Mantenimiento) sobre las distintas formas de presentación de los tesauros. Seleccionaremos las cuatro
formas más usadas en los tipos de tesauros más conocidos (por ej. los del CINDOC) que nos puede
proporcionar el gestor BEAT:

Índice alfabético (alfabético de términos para BEAT).

Índice jerárquico (sistemático global para BEAT).

Índice conceptual (alfabético a un solo nivel para BEAT).

Índice permutado KWIC (ídem. para BEAT).
Para la generación de los listados, abriremos la pestaña superior “Listar”
mediante la combinación Alt+L y en ella elegiremos sucesivamente cada uno de los
índices de BEAT del párrafo anterior:
1)
Para el llamado por BEAT “alfabético de términos”, nuestro
ALFABÉTICO, pulsaremos la letra “T” y en el recuadro que aparezca
iremos contestano sí (“S”) o no (“N”) a las sucesivas preguntas que se
nos vayan formulando.
[ES MUY IMPORTANTE TENER EN CUENTA QUE EN ESTA PANTALLA SE SALTA DE UNA
A OTRA LÍNEA MEDIANTE LA TECLA “tabulador” (cuarta por la izqda., desde el ángulo
inferior izqdo. del teclado).]
A la primera pregunta “Explicitar la fecha de modificación” se suele contestar
con una N mayúscula, pues, las fechas repetitivas en cada término producen unos
11
resultados muy poco visuales de los índices. Las siguientes tres preguntas se suelen
mantener con la letra S mayúscula para añadir la mayor cantidad de información.
En la última es imprescindible situarse sobre el renglón “ASCII ISO Latin 1”,
para que al “golpear dos veces seguidas” sobre la tecla “intro” nos salga un índice con
todos los acentos del teclado cuando hemos diferenciado mayúsculas y minúsculas (no
descriptores y notas de alcance):
A continuación cerraremos BEAT y nos iremos al “Explorador de Windows”,
donde veremos el fichero con terminación (.LTA) correspondiente a nuestros índice
alfabético (por ej.: EJERCICIOMASTER.LTA). Haremos clic dos veces seguidas con
el ratón sobre dicho fichero, y al preguntarnos Windows con que programa queremos
abrirlo deberemos contestarle bajando en la lista que nos propone hasta el icono de MSWord y de nuevo clic.
Es una pena que BEAT no muestre en pantalla automáticamente los índices y
que al generarlos, y nosotros recuperarlos en una hoja de Word, nos muestre
inmediatamente debajo de cada línea del término el “Código Clasificatorio” (CC) en
otra línea (en vez de en la misma línea antes o después del término correspondiente),
pero los programas en MS-DOS tienen sus limitaciones de programación. Ahora
tendremos una página de Word con el índice alfabético del tesauro de nuestro ejemplo.
..............................
GESTION DE LA INFORMACION
CC: C4
GESTION DEL CONOCIMIENTO
CC: C73
GLOBALIZACION
CC: C74
HEMEROTECAS
CC: C66
INFORMACION
CC: C
* Información en bruto
US: INFORMACION
INFORMATICA
CC: C15
MATERIAL AUDIOVISUAL
12
CC: C35
MATERIAL IMPRESO
CC: C36
MATERIAL VISUAL
CC: C37
MEDIOS DE COMUNICACION
CC: C21
MODOS DE COMUNICACION
CC: C22
* Multimedia
US: MATERIAL AUDIOVISUAL
.....................................................
2)
De manera análoga generaremos el índice llamado por BEAT
“Sistemático Global”, nuestro JERÁRQUICO, pulsaremos la letra
“G” y en el recuadro que aparezca iremos contestano sí (“S”) o no
(“N”) a las sucesivas preguntas que se nos vayan formulando.
[ES MUY IMPORTANTE TENER EN CUENTA QUE EN ESTA PANTALLA SE SALTA DE UNA
A OTRA LÍNEA MEDIANTE LA TECLA “tabulador” (cuarta por la izqda., desde el ángulo
inferior izqdo. del teclado).]
Antes de contestar las sucesivas preguntas del recuadro, nos iremos con Alt+V
más la letra “F” al llamado “Filtro de relaciones” y deshabilitaremos aquellas que
distorsionan o no aportan contenido a nuestro índice jerárquico: UP, TR, FE, NE y NH.
Para ello nos iremos moviendo de arriba abajo presionando la barra espaciadora una
sola vez, de manera que un “asterisco” en el lateral izqdo. nos muestre que dicha
relación ha quedado anulada para nuestra siguiente actuación (¡OJO!, Hay que repetir el
proceso de filtrado de relaciones cada vez que se cierra BEAT). Finalmente, pulsaremos
la tecla “intro” y comprobaremos en el recuadro alargado de la pantalla que dichas
relaciones han sido eliminadas:
En el recuadro propuesto para la generación del índice jerárquico, aceptaremos
las opciones por defecto de BEAT (20 niveles, 4 tabulaciones por nivel, no fechas),
excepto la opción de “Incluir los términos no jerárquicos” que contestaremos con N
mayúscula por incompatibilidad con la presentación tradicional de dicho tipo de
índices.
Ahora seguiremos la mecánica del índice alfabético anterior en el Explorador de
Windows y, generaremos un listado con terminación (.SNT) con un único árbol
13
jerárquico, al “golpear dos veces seguidas” sobre la tecla “intro”(por ej.: EJERCICIO
MASTER.SNT).
En caso de que nos aparezcan varios árboles jerárquicos al compilar, ello se
deberá a que falta alguna relación del tipo TG/TE entre alguno/s de los descriptores.
Deberemos volver a BEAT y revisar cada uno de ellos hasta que aparezca la omisión y
se subsane, luego generaremos el índice nuevamente de manera que nos aparezca
finalmente una página de Word con el Índice Jerárquico de nuestro tesauro de ejemplo:
INFORMACION
CC C
CIENCIAS DE LA INFORMACION
CC C1
ARCHIVISTICA
CC C11
COMUNICACION
CC C2
MEDIOS DE COMUNICACION
CC C21
MODOS DE COMUNICACION
CC C22
POLITICA DE COMUNICACION
CC C23
PROCESOS DE COMUNICACION
CC C24
SOCIOLOGIA DE LA COMUNICACION
CC C25
TECNICAS DE COMUNICACION
CC C26
FUENTES DE INFORMACION
CC C3
.......................................
3)
De manera análoga generaremos el índice llamado por BEAT
“Alfabético de términos”, nuestro CONCEPTUAL (o alfabético
completo), pulsaremos la letra “A” y en el recuadro que aparezca
iremos contestano sí (“S”) o no (“N”) a las sucesivas preguntas que se
nos vayan formulando.
Igualmente que en el índice jerárquico, antes de contestar las sucesivas
preguntas del recuadro, nos iremos con Alt+V más la letra “F” al llamado “Filtro de
relaciones” y deshabilitaremos aquellas que no aportan contenido a nuestro índice
conceptual: FE, NE y NH.
En el recuadro propuesto para la generación del índice jerárquico, aceptaremos
las opciones por defecto de BEAT (no fechas...), e incluso la proposición de “Incluir los
términos aislados” que contestaremos con S mayúscula, dado que con ello veremos si
en algún termino no descriptor se nos olvidó establecer la relación de equivalencia (o
cruzada) mediante UP/USE.
Después, seguiremos la mecánica de los índices anteriores en el Explorador de
Windows y, generaremos un listado con terminación (.LTH) al “golpear dos veces
seguidas” sobre la tecla “intro” (por ej.: EJERCICIO MASTER.LTH). Tendrá toda la
información cargada por nosotros o generada automáticamente por el gestor de tesauros
BEAT, por orden alfabético dentro de los distintos términos descriptores o no, de
manera que nos aparezca una página de Word con el índice conceptual de nuestro
tesauro de ejemplo:
INFORMACION
CC C
14
UP
TE
Información en bruto
CIENCIAS DE LA INFORMACION
COMUNICACION
FUENTES DE INFORMACION
GESTION DE LA INFORMACION
PROCESAMIENTO DE LA INFORMACION
SERVICIOS DE INFORMACION
TECNOLOGIAS DE LA INFORMACION
Información en bruto
US INFORMACION
INFORMATICA
CC C15
TG CIENCIAS DE LA INFORMACION
MATERIAL AUDIOVISUAL
CC C35
UP Multimedia
TG FUENTES DE INFORMACION
MATERIAL IMPRESO
CC C36
TG FUENTES DE INFORMACION
MATERIAL VISUAL
CC C37
TG FUENTES DE INFORMACION
MEDIOS DE COMUNICACION
CC C21
TG COMUNICACION
MODOS DE COMUNICACION
CC C22
TG COMUNICACION
Multimedia
US MATERIAL AUDIOVISUAL
...............................
4)
De manera análoga generaremos el índice llamado tanto por BEAT
como por nosotros “Índice permutado KWIC”, pulsaremos la letra
“K” y en el recuadro que aparezca iremos contestano sí (“S”) o no
(“N”) a las sucesivas preguntas que se nos vayan formulando.
En el recuadro propuesto para la generación del índice permutado KWIC
(“Keywords in context”), aceptaremos la opción por defecto de BEAT (30 caracteres
desde el margen izqdo.), incluyendo las proposiciones de “Incluir los términos no
preferentes” y “marcarlos” que contestaremos con S mayúscula; excepto las fechas y la
opción de “Explicitar términos preferentes” que contestaremos con N mayúscula, esta
última por incompatibilidad con la presentación tradicional de este tipo de índices.
Después, seguiremos la mecánica de los índices anteriores en el Explorador de
Windows y generaremos un listado con terminación (.PER), al “golpear dos veces
seguidas” sobre la tecla “intro” (por ej.: EJERCICIO MASTER.PER), de manera que a
continuación recuperemos una página de Word con el índice KWIC de nuestro tesauro
de ejemplo:
...........................................
ACCESO A LA
AUTOPISTAS DE LA
CENTROS DE
CIENCIAS DE LA
INFORMACION
CC: C
INFORMACION
CC: C41
INFORMACION
CC: C71
INFORMACION
CC: C64
INFORMACION
15
DIFUSION DE LA
FUENTES DE
GESTION DE LA
PROCESAMIENTO DE LA
RECUPERACION DE LA
SELECCION DE LA
SERVICIOS DE
SOCIEDAD DE LA
TECNOLOGIAS DE LA
TEORIA DE LA
USUARIOS DE LA
CC: C1
INFORMACION
CC: C53
INFORMACION
CC: C3
INFORMACION
CC: C4
INFORMACION
CC: C5
INFORMACION
CC: C54
INFORMACION
CC: C55
INFORMACION
CC: C6
INFORMACION
CC: C76
INFORMACION
CC: C7
INFORMACION
CC: C18
INFORMACION
CC: C43
* información en bruto
INFORMATICA
CC: C15
............................................................................................
7. Integración documental en una página de MS-Word.
Una vez obtenidos los cuatro índices básicos del tesauro que queremos editar,
será preciso maquetarlos con un programa de composición o un procesador de textos.
Lo más sencillo será utilizar la función “Esquema” de MS-Word, en la ventana “Ver”.
Allí especificaremos previamente las distintas secciones de un tesauro editado
en formato papel: Introducción a la metodología de realización, con las fuentes
utilizadas (bibliografía final). Agradecimientos. Índice Analítico con paginación. Cada
uno de los cuatro Índices de presentación del tesauro.
Será conveniente consultar algún tesauro reconocido para ver la forma en que
se suelen redactar las páginas iniciales, y luego ir abriendo los ficheros que contienen
nuestros cuatro índices y “Seleccionando todo” más “Copiar” en la ventana “Edición”
los iremos llevando a nuestro Esquema y con “Pegar” los iremos colocando en sus
secciones correspondientes:
8. Importación y exportación de datos, desde y a otros programas.
16
1) BEAT proporciona la posibilidad de incorporar datos (términos, relaciones,
códigos, notas, etc.) desde ficheros de texto con un proceso de carga masiva.
Las operaciones no interactivas a realizar sobre el tesauro actual se toman de
ficheros de texto con una sintaxis propia del programa, el formato BEAT que se explica
en la ayuda del programa:
En una carga masiva desde un fichero, BEAT es capaz de modificar el tesauro de
forma no interactiva (o batch) añadiendo, modificando o eliminando términos,
relaciones, códigos, notas, etc. repetidos o incompletos. Se considera que las relaciones,
códigos o notas afectan al último término encabezamiento (sin ninguna etiqueta) leído
del fichero.
Los ficheros de texto de entrada han de ser codificados con la tabla de caracteres
ASCII CP 850. Los ficheros que deba leer BEAT estarán preferentemente en
mayúsculas sin acentuar (excepto las notas de alcance, SN: y los términos no
descriptores, US:) y serán como el siguiente ejemplo:
COMUNICACION
CC:C2
BT:INFORMACION
NT:MEDIOS DE COMUNICACION
NT:MODOS DE COMUNICACION
NT:POLITICA DE COMUNICACION
NT:PROCESOS DE COMUNICACION
NT:SOCIOLOGIA DE LA COMUNICACION
NT:TECNICAS DE COMUNICACION
CONTROL DOCUMENTAL
CC:C42
BT:GESTION DE LA INFORMACION
DIFUSION DE LA INFORMACION
CC:C53
BT:PROCESAMIENTO DE LA INFORMACION
2) BEAT proporciona igualmente la posibilidad de exportar datos a otros
programas gestores (términos, relaciones, códigos, notas, etc.) desde sus ficheros
autogenerados de texto. La manera más sencilla es acceder a la casilla de “Exportar”
17
mediante la combinación de teclas Alt+E y, luego, con la letra “A” al “Alfabético
BEAT”.
El fichero obtenido deberá ser adaptado al tipo de ficheros admitidos por el
programa gestor receptor. En la mayoría de los casos, basta con eliminar en el formato
BEAT anterior las líneas en blanco entre los términos encabezamiento y sustituir los
saltos de línea de las distintas relaciones por un signo separador establecido por el
formato del programa receptor (; | ¿).
9. Bibliografía básica.
-
-
AITCHISON, J.; GILCHRIST, A. Thesaurus construction, a practical manual. Londres:
ASLIB, 1987.
CURRAS, E. Thesauros: lenguajes terminológicos. Madrid: Paraninfo, 1991.
GIL URDICIAÍN, B. Manual de lenguajes Documentales. Madrid: Noesis, 1996.
ISO. Documentación - Directrices para el establecimiento y desarrollo de tesauros
monolingües. Norma internacional ISO 2788-1986. En Revista española de documentación
científica, 12, 4 (1989), pp. 463-483 (Parte I), y en 13, 1 (1990), pp. 601-629 (Parte II).
18
Documentos relacionados
Descargar