MODULO 5 Tesauros

Anuncio
MODULO 5
Tesauros
En esta parte del módulo abordaremos el estudio del lenguaje documental controlado de estructura
combinatoria, el tesauro, una de las herramientas más utilizadas en la actualidad en el procesamiento de
información.
Un tesauro es un lenguaje de indización controlado, organizado formalmente para hacer explícitas
las relaciones, a priori, entre conceptos (UNE-50-106-60).
Está constituido por un conjunto de términos, descriptores y no descriptores, (unidades léxicas) y un
sistema de relaciones que define su contenido semántico, (relaciones semánticas entre las unidades
léxicas)
Los objetivos del tesauro se enfocan hacia dos tipos de uso:

indización de documentos

recuperación de información
La norma ISO 2788/1986 da las pautas para la construcción y utilización de tesauros.
Dicha norma especifica que los tesauros son:
 Herramientas de control terminológico que
traducen el lenguaje natural, en el cual están los
documentos, al lenguaje documental o controlado del tesauro.
 Listado controlado y dinámico de términos y de las relaciones semánticas y jerárquicas que éstos
guardan entre sí, aplicable a un campo específico del conocimiento.
DEFINICIONES…
Alan Gilchrist en el libro que ha publicado en el año 1987, “Thesaurus construction” define tesauro
como “Vocabulario de lenguaje controlado de indización, organizado formalmente, de forma que las
relaciones entre conceptos se establezcan a priori, para ser usado en sistemas de recuperación de
información, sean éstos bases de datos, índices impresos o catálogos.”
Para Emilia Currás tesauro es “Un lenguaje especializado, normalizado, post-coordinado, usado
con fines documentarios, donde los elementos lingüísticos que lo componen (términos, simples o
compuestos) se hallan relacionados entre sí sintáctica y semánticamente”
Según la UNESCO los tesauros son “Vocabularios coordinados y dinámicos de términos
relacionados de manera semántica y genérica que cubren ampliamente una esfera dada de conocimientos”
Amat Noguera lo define como un diccionario que muestra la equivalencia entre los términos o
expresiones del lenguaje natural y aquellos términos normalizados procedentes del lenguaje documental,
así como las relaciones semánticas que existen entre los términos.
Coll-Vinet define el tesauro como una compilación de palabras y frases que muestran sus
sinónimos, sus jerarquías y otras dependencias, y cuya función es suministrar un vocabulario normalizado
para la recuperación y almacenamiento de la información.
García Gutiérrez y Lucas Fernández dicen que es un dispositivo léxico que correlaciona los
mensajes humanos y documentales con los objetivos:
-
servir de base terminológica representante de un campo científico determinado.
-
dinamizar la comunicación de entrada y salida en el hombre y en la propia base de datos.
Del conjunto de definiciones se desprende que:
 un tesauro es un vocabulario controlado para representar de manera unívoca el contenido de los
documentos y de las preguntas, así como para ayudar al usuario en el tratamiento de la información
 Un tesauro es un lenguaje documental, un vocabulario controlado dotado de relaciones que
son las que le distinguen de otros instrumentos terminológicos y le proporcionan la categoría
de lenguaje.
PARTES / ESTRUCTURA
Las partes de un Tesauro
Introducción
Tabla de contenido
Justificación
Prólogo
Cobertura
Introducción
Normas
Instrucciones de uso
Cuerpo de la Obra
Parte alfabética
Parte sistemática (temática)
Parte gráfica
Partes auxiliares
KWOC
Índices Permutados
KWIC
Bibliografía
1. Introducción
En la introducción del Tesauro se detallan los siguientes ítems:

Teoría general de los lenguajes documentales y específicamente de Tesauro

Utilidad, finalidad de la realización del mismo

Área del conocimiento o de la ciencia que abarca

Metodología seguida para su construcción

Instituciones u organismos que intervinieron en su realización

Sistemas automatizados utilizados para la elaboración

Principios seguidos en la colecta de términos. Si estuvo basada en tesauros anteriores, base
de datos de bibliotecas o centros de documentación, etc.

Normas internacionales seguidas en su construcción

Indicaciones de uso

Actualizaciones pautadas

Bibliografía utilizada
2. Cuerpo de la obra
Tipos de presentación
o
Alfabética: el descriptor en su contexto (con las relaciones semánticas) se ordena alfabéticamente.
Facilita la entrada en el tesauro por la primera palabra significativa de descriptores y no
descriptores y que expresa las relaciones del vocabulario,
o
Sistemática: Los descriptores se ordenan por campo semántico. NO contiene los no descriptores
o
Gráfica: se ordenan los términos gráficamente consiguiéndose una mayor comprensión de las
relaciones dentro de una misma familia. Las formas más usuales son: arborescente, cuadriculada,
espiral, recuadros interconectados.
3. Índices permutados
Lista de palabras o frases ordenadas en forma alfabética, en la que cada una de las palabras significativas de la
frase va desplazándose al primer lugar como término de acceso.
Por lo tanto cada frase aparece tanta veces en el índice permutado como palabras claves tenga.
o
Indice kwic (keyword in context) La palabra que se está ordenando alfabéticamente del descriptor,
aparece jerarquizada de alguna manera, por ejemplo en negrita y en una posición fija, precedida y
seguida por el resto del descriptor.
síndrome de
o
abstinencia
abuelos
abusos sexuales
Indice kwoc (keyword out of context) Las palabras que se ordenan alfabéticamente aparecen como
un encabezamiento en línea separada. Bajo cada encabezamiento aparece la totalidad de
descriptores que contienen dicha palabra.
Cuidado
Cuidado del niño
Cultura
Cultura
Cultura urbana
ELEMENTOS CONSTITUTIVOS DE UN
TESAURO
Unidades
léxicas
Relaciones semánticas entre dichas
unidades
títulos que encabezan los conjuntos
pertenencia
descriptores,
equivalencia ínterlingüística
no-descriptores,
equivalencia semántica intralingüística
descriptores auxiliares
jerárquica
asociación
Unidades léxicas
Un tesauro puede incluir hasta 4 categorías de unidades léxicas
o
Los títulos que encabezan los conjuntos, en el interior de los cuales se agrupan los términos:
campos semánticos (Temas) o naturaleza de los términos (Facetas). NO se utilizan para indizar los
documentos ni las consultas SOLO agrupan descriptores
o
los descriptores, término (palabra o expresión) que se ha escogido de un conjunto de sinónimos ,
cuasi sinónimos y términos emparentados para representar de manera unívoca
un concepto.
También llamados términos preferentes.
o
los no-descriptores, llamados también términos equivalentes o términos no preferentes: son
sinónimos o cuasi sinónimos de los descriptores. NO se utilizan para indizar los documentos ni
para las consultas, reenvía a 1 ó 2 descriptores que se deben utilizar. Están incluídos dentro de un
tesauro y ligados a un descriptor por una relación de equivalencia, sirven para facilitar el acceso
al usuario
o
descriptores auxiliares, se utilizan en combinación
con descriptores libres para formar los
descriptores compuestos. Existen en algunos tesauros, casi todos son unitérminos, con un sentido
poco preciso (INFLUENCIA, FACTOR, REPARTO.) NO se los incorpora dentro de un tema
específico por la imprecisión de su significado
o
Identificador: Recibe diferentes acepciones
o Palabra aislada, transición de palabra clave a descriptor
o Antiguos descriptores en desuso
o Palabra que identifican lugares o fechas relevantes
Ejemplos:
Consejo de Europa
UNESCO
Nicaragua
Relaciones semánticas
Un tesauro contiene las siguientes relaciones semánticas
o
pertenencia a un grupo, entre descriptores y temas o facetas a los que pertenecen esos
descriptores. Es la relación asimétrica entre un descriptor y el campo semántico al que ha sido
vinculado y le permite al usuario situar el campo semántico al que pertenece el descriptor y
remitirse a ellos para buscar otros descriptores
o
equivalencia interlinguística entre descriptores, designan el mismo concepto o el equivalente en 2 o
más lenguas .Relación bi-unívoca y simétrica entre descriptores de 2 o más lenguas diferentes que
representan el mismo concepto o un concepto similar, permitiendo indicar los documentos en una o
varias lenguas, formular consultas en la lengua del usuario y recuperar documentos
independientemente de cual sea la lengua
o
equivalencia intralinguística entre descriptores (término preferente) y no descriptores (término no
preferente) y viceversa dentro de la misma lengua. Relación asimétrica entre un descriptor y un no
descriptor que expresa un concepto
único y que serán indizados de manera unívoca por el
descriptor, eliminando al máximo silencios y ruidos. De las variadas denominaciones con que
puede ser representado un concepto, se selecciona una, que será el término con valor de
descriptor y las otras formas posibles, consideradas sinónimos, son descartadas como puntos de
acceso en la indización y recuperación. Las notaciones más habituales para representar esta
relación son: UP/UF (usado por) y USE.
o
Ej.:
Sinonimia
ENSEÑANZA MEDIA
ENSEÑANZA SECUNDARIA
USE ENSEÑANZA SECUNDARIA
o
Ej.:
Casi-sinonimia
ENSEÑANZA VOCACIONAL
USE ENSEÑANZA PROFESIONAL
o
Ej,:
UF ENSEÑANZA MEDIA
Antónimos
INEFICIENCIA
USE EFICIENCIA
ENSEÑANZA PROFESIONAL
UF ENSEÑANZA VOCACIONAL
o
jerárquica entre descriptores de la misma lengua. Relación asimétrica entre dos
descriptores de los que uno es superior a otro y se utilizan en la indización de los documentos para
escoger los descriptores más específicos, eliminando ruidos en la búsqueda. Permite formular
consultas en distintos niveles jerárquicos
Notación: Término tope: TT / TGG
Término genérico: BT / TG
Término específico: NT / TE
Ej. Término genérico
ESCUELAS
Término específico
Ej. Término específico
NT ESCUELAS RURALES
ESCUELAS RURALES
Término genérico
o
BT ESCUELAS
asociación, entre descriptores de la misma lengua. Relación simétrica entre 2 descriptores
que designan conceptos y son susceptibles de evocarse mutuamente por asociación de ideas,
aportan ayuda para la búsqueda documental gracias a los distintos puntos de vista.
Notación: RT / RT: Término relacionado
Ej.
EXAMEN
CALIFICACIONES
RT CALIFICACIONES
RT EXAMEN
Notas de alcance
Denominada nota de aplicación o nota explicativa. Su objetivo es brindar información
adicional sobre el descriptor, también puede explicitar el significado o alcance conceptual del
mismo.
Notación: SN / NA
NOTACIONES DE LAS RELACIONES SEMÁNTICAS
Nota de aplicación
Nota explicativa
NA
SN
Scope note
USE
USE
Use
Indica el descriptor -Término preferenteSe elige entre varios términos sinónimos.
Indica el término equivalente
-no preferenteTérmino cabecera.
UP
UF
Use for
Se aplica a los términos que identifican el
TC
TT
Top Term
Término genérico
TG
BT
Broader term
Término específico
TE
NT
Narrower term
Término relacionado
TR
RT
Related term
nombre de la clase más amplia a la que
pertenece el concepto específico.
PRESENTACION DE UN DESCRIPTOR EN SU CONTEXTO
Centros de educación preescolar 1977
Preschool centres
Centre préscolaire
UF
Salas cuna
SN
Instalaciones educacionales para niños
en edad preescolar que pueden incluir
servicios familiares y sanitarios.
BT
Instituciones educacionales
NT
Escuelas de párvulos
RT
311
INDICE PERMUTADO – KWIC
ancianos
abandonados
niños
abandonados
aberración cromosómica (ND)
USE: cromosomopatías
régimen
abierto
abogados
colegio oficial de
abogados (ND)
USE: colegios profesionales
aborto
aborto legal
absentismo escolar
absentismo laboral
síndrome de
abstinencia
abuelos
abusos sexuales
accesibilidad
accesibilidad en el transporte
accesibilidad en el urbanismo
accesibilidad en la vivienda
accesibilidad en los edificios públicos
acceso a la cultura
acceso a la educación
acceso a la información
acceso al empleo
accidentes
accidentes de tráfico
accidentes en el hogar
accidentes laborales
prevención de
programa de
accidentes
acción comunitario (ND)
ACNUR
familia
centros de
niños
acogedora
acogida
acogidos
acogimiento familiar
acoso sexual
INDICE PERMUTADO – KWOC
Cuestionarios
Cuestionarios 203
Cuestiones
Cuestiones morales 100
Cuidado
Cuidado del niño 126
Cultura
Cultura 130
Cultura urbana 130
Oficina Regional de Cultura de la UNESCO para América Latina y el Caribe 851
Cultural
Agente de extensión cultural 440
Aislamiento cultural 130
Ambiente cultural 550
Desventaja cultural 130
Extensión cultural 382
Extensión cultural de las bibliotecas 382
Extensión cultural urbana 382
Intercambio cultural 130
Medio cultural 130
Culturales
Actividades culturales 537
Aspectos culturales 561
Centros culturales 310
Desfavorecidos culturales 402
Factores culturales 285
Interrelaciones culturales 130
Políticas culturales 130
Cuota
Sistema de cuota 205
Curiosidad
Curiosidad 561
Cursillos
Cursillos e especialización 334
Cursillos de iniciación 351
Tesauros
Actividad 8
Análisis de la introducción del Tesauro de la Educación UNESCO:OIE 5ta. ed., 1991.
Analizar la introducción del Tesauro de Educación y contestar las preguntas listadas a continuación.
1. ¿Cuál es la función del Tesauro?
2. Nombrar la organización responsable de la realización la obra
3. ¿Cuáles fueron los principales objetivos de la presente edición?
4. ¿Sobre qué tesauros se basaron para la selección de los términos?
a. ¿Cuáles fueron los motivos de elección de dichos Tesauros?
5. ¿Cuál es el campo de aplicación, área de conocimiento que abarca?
6. Estructura del tesauro
a. ¿En cuántas partes explicita que está dividido? Nombrarlas
b. ¿Cuál es el contenido de cada parte?
7. Campos semánticos (puede ser realizado como tabla)
a. Sintetizar las características que poseen.
b. ¿Qué características tienen los descriptores incluidos en cada uno?
c.
¿Qué aspectos contemplan?
8. Definir
a. Faceta
b. Descriptor
c.
9.
Identificador
Copiar las abreviaturas que se utilizan para las relaciones semánticas.
10. ¿Cómo pauta la búsqueda de términos apropiados utilizando el Tesauro?
11. ¿Cuál es la diferencia entre descriptor e identificador?
12. ¿Para qué se utilizan los Identificadores?
Descargar