MODULO 5 Tesauros En esta parte del módulo abordaremos el estudio del lenguaje documental controlado de estructura combinatoria, el tesauro, una de las herramientas más utilizadas en la actualidad en el procesamiento de información. Un tesauro es un lenguaje de indización controlado, organizado formalmente para hacer explícitas las relaciones, a priori, entre conceptos (UNE-50-106-60). Está constituido por un conjunto de términos, descriptores y no descriptores, (unidades léxicas) y un sistema de relaciones que define su contenido semántico, (relaciones semánticas entre las unidades léxicas) Los objetivos del tesauro se enfocan hacia dos tipos de uso: indización de documentos recuperación de información La norma ISO 2788/1986 da las pautas para la construcción y utilización de tesauros. Dicha norma especifica que los tesauros son: Herramientas de control terminológico que traducen el lenguaje natural, en el cual están los documentos, al lenguaje documental o controlado del tesauro. Listado controlado y dinámico de términos y de las relaciones semánticas y jerárquicas que éstos guardan entre sí, aplicable a un campo específico del conocimiento. DEFINICIONES… Alan Gilchrist en el libro que ha publicado en el año 1987, “Thesaurus construction” define tesauro como “Vocabulario de lenguaje controlado de indización, organizado formalmente, de forma que las relaciones entre conceptos se establezcan a priori, para ser usado en sistemas de recuperación de información, sean éstos bases de datos, índices impresos o catálogos.” Para Emilia Currás tesauro es “Un lenguaje especializado, normalizado, post-coordinado, usado con fines documentarios, donde los elementos lingüísticos que lo componen (términos, simples o compuestos) se hallan relacionados entre sí sintáctica y semánticamente” Según la UNESCO los tesauros son “Vocabularios coordinados y dinámicos de términos relacionados de manera semántica y genérica que cubren ampliamente una esfera dada de conocimientos” Amat Noguera lo define como un diccionario que muestra la equivalencia entre los términos o expresiones del lenguaje natural y aquellos términos normalizados procedentes del lenguaje documental, así como las relaciones semánticas que existen entre los términos. Coll-Vinet define el tesauro como una compilación de palabras y frases que muestran sus sinónimos, sus jerarquías y otras dependencias, y cuya función es suministrar un vocabulario normalizado para la recuperación y almacenamiento de la información. García Gutiérrez y Lucas Fernández dicen que es un dispositivo léxico que correlaciona los mensajes humanos y documentales con los objetivos: - servir de base terminológica representante de un campo científico determinado. - dinamizar la comunicación de entrada y salida en el hombre y en la propia base de datos. Del conjunto de definiciones se desprende que: un tesauro es un vocabulario controlado para representar de manera unívoca el contenido de los documentos y de las preguntas, así como para ayudar al usuario en el tratamiento de la información Un tesauro es un lenguaje documental, un vocabulario controlado dotado de relaciones que son las que le distinguen de otros instrumentos terminológicos y le proporcionan la categoría de lenguaje. PARTES / ESTRUCTURA Las partes de un Tesauro Introducción Tabla de contenido Justificación Prólogo Cobertura Introducción Normas Instrucciones de uso Cuerpo de la Obra Parte alfabética Parte sistemática (temática) Parte gráfica Partes auxiliares KWOC Índices Permutados KWIC Bibliografía 1. Introducción En la introducción del Tesauro se detallan los siguientes ítems: Teoría general de los lenguajes documentales y específicamente de Tesauro Utilidad, finalidad de la realización del mismo Área del conocimiento o de la ciencia que abarca Metodología seguida para su construcción Instituciones u organismos que intervinieron en su realización Sistemas automatizados utilizados para la elaboración Principios seguidos en la colecta de términos. Si estuvo basada en tesauros anteriores, base de datos de bibliotecas o centros de documentación, etc. Normas internacionales seguidas en su construcción Indicaciones de uso Actualizaciones pautadas Bibliografía utilizada 2. Cuerpo de la obra Tipos de presentación o Alfabética: el descriptor en su contexto (con las relaciones semánticas) se ordena alfabéticamente. Facilita la entrada en el tesauro por la primera palabra significativa de descriptores y no descriptores y que expresa las relaciones del vocabulario, o Sistemática: Los descriptores se ordenan por campo semántico. NO contiene los no descriptores o Gráfica: se ordenan los términos gráficamente consiguiéndose una mayor comprensión de las relaciones dentro de una misma familia. Las formas más usuales son: arborescente, cuadriculada, espiral, recuadros interconectados. 3. Índices permutados Lista de palabras o frases ordenadas en forma alfabética, en la que cada una de las palabras significativas de la frase va desplazándose al primer lugar como término de acceso. Por lo tanto cada frase aparece tanta veces en el índice permutado como palabras claves tenga. o Indice kwic (keyword in context) La palabra que se está ordenando alfabéticamente del descriptor, aparece jerarquizada de alguna manera, por ejemplo en negrita y en una posición fija, precedida y seguida por el resto del descriptor. síndrome de o abstinencia abuelos abusos sexuales Indice kwoc (keyword out of context) Las palabras que se ordenan alfabéticamente aparecen como un encabezamiento en línea separada. Bajo cada encabezamiento aparece la totalidad de descriptores que contienen dicha palabra. Cuidado Cuidado del niño Cultura Cultura Cultura urbana ELEMENTOS CONSTITUTIVOS DE UN TESAURO Unidades léxicas Relaciones semánticas entre dichas unidades títulos que encabezan los conjuntos pertenencia descriptores, equivalencia ínterlingüística no-descriptores, equivalencia semántica intralingüística descriptores auxiliares jerárquica asociación Unidades léxicas Un tesauro puede incluir hasta 4 categorías de unidades léxicas o Los títulos que encabezan los conjuntos, en el interior de los cuales se agrupan los términos: campos semánticos (Temas) o naturaleza de los términos (Facetas). NO se utilizan para indizar los documentos ni las consultas SOLO agrupan descriptores o los descriptores, término (palabra o expresión) que se ha escogido de un conjunto de sinónimos , cuasi sinónimos y términos emparentados para representar de manera unívoca un concepto. También llamados términos preferentes. o los no-descriptores, llamados también términos equivalentes o términos no preferentes: son sinónimos o cuasi sinónimos de los descriptores. NO se utilizan para indizar los documentos ni para las consultas, reenvía a 1 ó 2 descriptores que se deben utilizar. Están incluídos dentro de un tesauro y ligados a un descriptor por una relación de equivalencia, sirven para facilitar el acceso al usuario o descriptores auxiliares, se utilizan en combinación con descriptores libres para formar los descriptores compuestos. Existen en algunos tesauros, casi todos son unitérminos, con un sentido poco preciso (INFLUENCIA, FACTOR, REPARTO.) NO se los incorpora dentro de un tema específico por la imprecisión de su significado o Identificador: Recibe diferentes acepciones o Palabra aislada, transición de palabra clave a descriptor o Antiguos descriptores en desuso o Palabra que identifican lugares o fechas relevantes Ejemplos: Consejo de Europa UNESCO Nicaragua Relaciones semánticas Un tesauro contiene las siguientes relaciones semánticas o pertenencia a un grupo, entre descriptores y temas o facetas a los que pertenecen esos descriptores. Es la relación asimétrica entre un descriptor y el campo semántico al que ha sido vinculado y le permite al usuario situar el campo semántico al que pertenece el descriptor y remitirse a ellos para buscar otros descriptores o equivalencia interlinguística entre descriptores, designan el mismo concepto o el equivalente en 2 o más lenguas .Relación bi-unívoca y simétrica entre descriptores de 2 o más lenguas diferentes que representan el mismo concepto o un concepto similar, permitiendo indicar los documentos en una o varias lenguas, formular consultas en la lengua del usuario y recuperar documentos independientemente de cual sea la lengua o equivalencia intralinguística entre descriptores (término preferente) y no descriptores (término no preferente) y viceversa dentro de la misma lengua. Relación asimétrica entre un descriptor y un no descriptor que expresa un concepto único y que serán indizados de manera unívoca por el descriptor, eliminando al máximo silencios y ruidos. De las variadas denominaciones con que puede ser representado un concepto, se selecciona una, que será el término con valor de descriptor y las otras formas posibles, consideradas sinónimos, son descartadas como puntos de acceso en la indización y recuperación. Las notaciones más habituales para representar esta relación son: UP/UF (usado por) y USE. o Ej.: Sinonimia ENSEÑANZA MEDIA ENSEÑANZA SECUNDARIA USE ENSEÑANZA SECUNDARIA o Ej.: Casi-sinonimia ENSEÑANZA VOCACIONAL USE ENSEÑANZA PROFESIONAL o Ej,: UF ENSEÑANZA MEDIA Antónimos INEFICIENCIA USE EFICIENCIA ENSEÑANZA PROFESIONAL UF ENSEÑANZA VOCACIONAL o jerárquica entre descriptores de la misma lengua. Relación asimétrica entre dos descriptores de los que uno es superior a otro y se utilizan en la indización de los documentos para escoger los descriptores más específicos, eliminando ruidos en la búsqueda. Permite formular consultas en distintos niveles jerárquicos Notación: Término tope: TT / TGG Término genérico: BT / TG Término específico: NT / TE Ej. Término genérico ESCUELAS Término específico Ej. Término específico NT ESCUELAS RURALES ESCUELAS RURALES Término genérico o BT ESCUELAS asociación, entre descriptores de la misma lengua. Relación simétrica entre 2 descriptores que designan conceptos y son susceptibles de evocarse mutuamente por asociación de ideas, aportan ayuda para la búsqueda documental gracias a los distintos puntos de vista. Notación: RT / RT: Término relacionado Ej. EXAMEN CALIFICACIONES RT CALIFICACIONES RT EXAMEN Notas de alcance Denominada nota de aplicación o nota explicativa. Su objetivo es brindar información adicional sobre el descriptor, también puede explicitar el significado o alcance conceptual del mismo. Notación: SN / NA NOTACIONES DE LAS RELACIONES SEMÁNTICAS Nota de aplicación Nota explicativa NA SN Scope note USE USE Use Indica el descriptor -Término preferenteSe elige entre varios términos sinónimos. Indica el término equivalente -no preferenteTérmino cabecera. UP UF Use for Se aplica a los términos que identifican el TC TT Top Term Término genérico TG BT Broader term Término específico TE NT Narrower term Término relacionado TR RT Related term nombre de la clase más amplia a la que pertenece el concepto específico. PRESENTACION DE UN DESCRIPTOR EN SU CONTEXTO Centros de educación preescolar 1977 Preschool centres Centre préscolaire UF Salas cuna SN Instalaciones educacionales para niños en edad preescolar que pueden incluir servicios familiares y sanitarios. BT Instituciones educacionales NT Escuelas de párvulos RT 311 INDICE PERMUTADO – KWIC ancianos abandonados niños abandonados aberración cromosómica (ND) USE: cromosomopatías régimen abierto abogados colegio oficial de abogados (ND) USE: colegios profesionales aborto aborto legal absentismo escolar absentismo laboral síndrome de abstinencia abuelos abusos sexuales accesibilidad accesibilidad en el transporte accesibilidad en el urbanismo accesibilidad en la vivienda accesibilidad en los edificios públicos acceso a la cultura acceso a la educación acceso a la información acceso al empleo accidentes accidentes de tráfico accidentes en el hogar accidentes laborales prevención de programa de accidentes acción comunitario (ND) ACNUR familia centros de niños acogedora acogida acogidos acogimiento familiar acoso sexual INDICE PERMUTADO – KWOC Cuestionarios Cuestionarios 203 Cuestiones Cuestiones morales 100 Cuidado Cuidado del niño 126 Cultura Cultura 130 Cultura urbana 130 Oficina Regional de Cultura de la UNESCO para América Latina y el Caribe 851 Cultural Agente de extensión cultural 440 Aislamiento cultural 130 Ambiente cultural 550 Desventaja cultural 130 Extensión cultural 382 Extensión cultural de las bibliotecas 382 Extensión cultural urbana 382 Intercambio cultural 130 Medio cultural 130 Culturales Actividades culturales 537 Aspectos culturales 561 Centros culturales 310 Desfavorecidos culturales 402 Factores culturales 285 Interrelaciones culturales 130 Políticas culturales 130 Cuota Sistema de cuota 205 Curiosidad Curiosidad 561 Cursillos Cursillos e especialización 334 Cursillos de iniciación 351 Tesauros Actividad 8 Análisis de la introducción del Tesauro de la Educación UNESCO:OIE 5ta. ed., 1991. Analizar la introducción del Tesauro de Educación y contestar las preguntas listadas a continuación. 1. ¿Cuál es la función del Tesauro? 2. Nombrar la organización responsable de la realización la obra 3. ¿Cuáles fueron los principales objetivos de la presente edición? 4. ¿Sobre qué tesauros se basaron para la selección de los términos? a. ¿Cuáles fueron los motivos de elección de dichos Tesauros? 5. ¿Cuál es el campo de aplicación, área de conocimiento que abarca? 6. Estructura del tesauro a. ¿En cuántas partes explicita que está dividido? Nombrarlas b. ¿Cuál es el contenido de cada parte? 7. Campos semánticos (puede ser realizado como tabla) a. Sintetizar las características que poseen. b. ¿Qué características tienen los descriptores incluidos en cada uno? c. ¿Qué aspectos contemplan? 8. Definir a. Faceta b. Descriptor c. 9. Identificador Copiar las abreviaturas que se utilizan para las relaciones semánticas. 10. ¿Cómo pauta la búsqueda de términos apropiados utilizando el Tesauro? 11. ¿Cuál es la diferencia entre descriptor e identificador? 12. ¿Para qué se utilizan los Identificadores?