mesh1

Anuncio
MEDICAL SUBJECT HEADINGS (Mesh)
Fabiola Gabriela Navarro López
Resumen
La indización de documentos es una técnica del análisis documental que trata
de retener una o varias nociones que representan el contenido de un
documento y adecuarlas a un lenguaje documental determinado, con el objetivo
primordial de organizar y recuperar la información. El lenguaje utilizado es
conocido como Thesahurus o lenguaje controlado, este trabajo pretende
analizar un thesahurus especializado en el área de medicina y ciencias de la
salud, conocido como Medical Subject Headings (Mesh) realizado por la
National Lybrary Medicine desde 1960 y que representa un ejemplo exitoso de
un vocabulario controlado.
El trabajo aquí realizado se enfocara a revisar la estructura del Mesh para
recuperar información indizada en la base de datos medica de MED LINE.
Thesahurus
La primera parte que se necesita comprender para el análisis de Mesh es la
definición de un thesahurus que es: una lista de palabras o descriptores, que
proporcionan la indización, forman lo que se denomina un vocabulario
controlado en el que hemos depurado el lenguaje natural seleccionando los
términos pertinentes,1.
La descripción de las relaciones semánticas que trata el tesauro son:
Relaciones de sustitución, que reenvían de un sinónimo el término aceptado
por el lenguaje documental, su incorporación tiende a eliminar la sinonimia y
polisemia.
Fernández, Caballero Antonio. Teoría de la información y la documentación.
España 1998
1
Relaciones hieráticas o jerárquicas, que conducen de los términos aceptados
más específicos a los términos más generales, también aceptados y viceversa.
Relaciones asociativas entre nociones emparentadas patentiza las relaciones
de subordinación colateral, similaridad funcional causa-efecto.
Relaciones sintagmáticas, que tratan del lugar que una palabra ocupa en un
texto determinado.
El Mesh
El thesahuro con terminología médica más utilizado para la indización de
documentos médicos es El Medical Subject Headings (MeSH) es producido
por la National Library Medicine de EU (NLM) desde 1960 hasta hoy. La edición
hasta el año 2007 era de forma impresa actualmente se presenta de forma
electrónica.
La versión del 2008 contenía un total de 24,767 descriptores los cuales
son acompañados de una breve descripción
y una lista de sinónimos o
términos muy similares. La revisión anual de términos hace que cada año se
incorporen términos nuevos y otros se modifiquen de acuerdo a las
necesidades del propio lenguaje medico. La siguiente tabla muestra la revisión
anual que se ha hecho al vocabulario:
MeSH
Total
New
Changed Deleted
descriptors descriptors descriptors descriptors
2002
20,232
847
185
47
2003
21,079
1250
93
20
2004
22,329
666
109
20
2005
22,995
487
129
60
2006
23,885
933
188
43
2007
24,357
494
99
22
La misión que cumplen estos descriptores es la de representar los conceptos
principales tratados en los artículos publicados y facilitar su recuperación. La
idea es que cada concepto esté representado por un único término, y que cada
término represente un único concepto con la finalidad de resolver los
problemas de sinonimia, polisemia y ambigüedad que comporta el lenguaje
natural.
Estructura del Mesh
El MeSH se divide en dos partes: la primera es la lista alfabética de
descriptores aceptados con las referencias cruzadas de sinónimos y términos
relacionados que nos indica cuál es la palabra clave a utilizar; así, por ejemplo,
si buscamos la palabra cáncer, la lista nos remite a la palabra neoplasms que
es el descriptor adecuado. Debajo de cada entrada podemos encontrar una
pequeña nota histórica sobre el año de introducción del descriptor en el
tesauro y otros descriptores utilizados para este concepto.
La mayoría de los artículos indizados en la base de datos MEDLINE llevan
asignados de 10 a 12 descriptores; los que están señalados con un asterisco,
los Major Concept, indican el tema principal del artículo, y los restantes hacen
referencia a aspectos tratados o discutidos en el mismo. Esta opción nos
permite limitar nuestra búsqueda a los artículos identificados como más
importantes y prescindir de las otras citas irrelevantes.
La segunda parte del MeSH es la clasificación jerárquica llamada "Tree
Structures” que agrupa a todos los descriptores de la lista alfabética en 15
grandes categorías temáticas. Estas categorías se subdividen al mismo tiempo
en
subcategorías,
en
donde
los
descriptores
se
hallan
ordenados
jerárquicamente del más general al más específico. Los descriptores llevan
asociados unos códigos alfanuméricos que permiten también seleccionar la
información mediante dichos códigos.
La aplicación práctica más interesante de la clasificación jerárquica consiste en
que permite recuperar citas bibliográficas muy específicas sobre un tema, al
mismo tiempo que existe la posibilidad de ir ampliando el concepto
introduciendo los descriptores de categorías más generales que incluyen los
términos subordinados. Por poner un ejemplo, podríamos seleccionar sólo
aquellos artículos que hicieran referencia a la Meningitis viral o bien ampliar el
conjunto utilizando el descriptor más general de Meningitis que incluye a todos
los restantes. Será en función del tema que nos interese buscar y de los
distintos aspectos que queramos combinar que utilizaremos los descriptores
que nos amplíen o bien limiten el conjunto de registros bibliográficos.
Existe
además
el
apartado
de
los
subencabezamientos,
o
"MeSH
Subheadings", que consta de 88 divisiones o facetas temáticas que lógica y
debidamente relacionados con los descriptores del tesauro permite seleccionar
distintos
aspectos
(etiología,
diagnóstico,
tratamiento,
cirugía)
de
enfermedades o patologías tratadas en la literatura médica. En la parte
introductoria de MeSH donde se relaciona la lista de los "Subheadings" hay una
pequeña explicación que indica la utilización adecuada de cada uno de ellos y
señala las categorías temáticas a las que pueden ir asociados.
Si buscamos información sobre la prevención y control del cáncer de mama, la
combinación del descriptor BREAST NEOPLASMS y el "subheading" Prevention and control (PC) sería la forma más correcta de obtener esta
información, mientras que si cruzamos estos dos términos de forma
independiente, obtenemos también esta información, pero con un mayor
número de referencias bibliográficas añadidas, en las cuales aparecen estos
términos pero en un contexto distinto al que nos interesa. La combinación de
un descriptor y un subencabezamiento es a menudo la manera más precisa de
concretar un tema.
Descargar