Búsquedas en las bases de datos. Palabras clave y tesauro

Anuncio
Búsquedas en las bases de datos. Palabras clave y tesauro.
Antonio Cano Vindel
Cuando vamos a hacer una búsqueda sobre la evidencia científica que existe en una
determinada base de datos a favor de un tema que estamos revisando, debemos tener en
cuenta que existe una gran diferencia entre hacer una búsqueda simple de los términos que se
nos ha ocurrido que son importantes, y hacer una búsqueda sistemática, siguiendo un proceso
que nos llevará a usar el tesauro de la base de datos, una elección más adecuada de los
términos clave, y poner como condición que dichos términos se encuentren el campo “palabras
clave”, utilizando el sistema de búsqueda avanzada.
1. Al buscar en cualquier base de datos es imprescindible utilizar el tesaurus propio de esa
base de datos. Es decir, el diccionario de términos clave que se han usado para guardar los
trabajos que ahora quieres buscar. Si tú le dices al buscador (la base de datos) que utilice
términos que no conoce, aunque sean sinónimos, no te podrá ofrecer artículos que te
interesan, pero sí están en la base de datos. Un problema de sensibilidad de tu búsqueda,
porque no has detectado trabajos que pueden ser esenciales para tu revisión. Cualquier revisor
especialista podría echar en falta estos trabajos esenciales al revisar tu artículo, en el proceso
de publicación. A su vez, si tú utilizas un lenguaje diferente al del buscador, te ofrecerá cosas
que tú en realidad no querías. Son los falsos positivos, o el problema de la especificidad de tu
búsqueda.
2. La base de datos Pubmed tiene un excelente tesaurus, que se ha ido tejiendo con mucho
esfuerzo durante mucho tiempo (más de 50 años), y que se llama Mesh
(http://www.ncbi.nlm.nih.gov/mesh). Pubmed ha ido asignando palabras o términos clave a
cada artículo almacenado, en el campo "key word" o campo "Mesh". Al mismo tiempo, ha ido
creando y puliendo una base de datos de términos clave utilizados en este proceso de
indización. Es la base de datos Mesh. Otras bases de datos, como PsycInfo, tienen también su
propio tesauro.
3. En los materiales de mi curso de doctorado
(http://www.ucm.es/info/seas/invest/formac/index.htm) se encuentra el enlace al tutorial de
Pubmed en español (http://www.sap.org.ar/staticfiles/medline/tutorial/), en el que se explica de
manera interactiva la búsqueda avanzada en Pubmed utilizando los términos Mesh. En el
Glosario te explica qué significa MeSH, Medical Subject Heading. Es un vocabulario controlado
utilizado para asegurar que la indización tenga consistencia a la hora de asignar los términos a
los artículos o citas sobre un tema específico. Ayudan en la búsqueda al evitar tener que
pensar todas las palabras que pueden identificar un concepto. Por ejemplo el término MeSH
“AGED” es asignado en lugar de aging, older, elderly, senior citizen, geriatric person, etc. que
pueden aparecer en el título o resumen.
4. Por lo tanto, antes de hacer una búsqueda, debemos usar la base de datos del tesauro, es
decir la base de datos de términos Mesh si utilizamos Pubmed (o el Tesauro de PsycInfo), para
conocer cuáles son las palabras clave que debo usar en mi búsqueda.
5. Si quiero hacer una revisión en Pubmed sobre “bienestar psicológico en el trabajo” y busco
"wellness" en la búsqueda sencilla, me saldrán muchos artículos que han utilizado la palabra
wellness en algún campo (título, abstract, etc.), pero que no han investigado el bienestar
psicológico. Mi búsqueda tendrá un problema de baja especificidad. A su vez me perderé
muchos trabajos que sí han investigado el bienestar psicológico, pero que han sido
almacenados con "job satisfaction", por ejemplo. Mi búsqueda tendrá también un problema de
baja sensibilidad. ¿Y cómo puedo saber que es más adecuado usar "job satisfaction" que
"wellness"? Es facil. Buscando primero en la base de datos Mesh (tesauro de Pubmed).
Primero debo buscar una serie de sinónimos en la base de datos Mesh, como wellness, well
being, satisfaction. Lo mismo debo hacer con job, workplace, etc.
6. Cuando uso un término Mesh (es decir, que sí está en la base de datos Mesh), estoy
utilizando el mismo lenguaje que el sistema buscador de la base de datos Pubmed. En este
caso será más fácil entendernos, porque utilizamos los mismos términos. Mesh me ofrece la
definición de cada término, el año de inclusión del término en la base de datos Mesh, el árbol
lógico en el que se incluye, así como distintas opciones para seleccionar este término,
subtérminos, etc. Por ejemplo, el árbol lógico de “job satisfaction” es:
Psychological Phenomena and Processes [F02]
Psychology, Applied [F02.784]
Psychology, Industrial [F02.784.692]
Absenteeism [F02.784.692.107]
Efficiency [F02.784.692.351]
Job Satisfaction [F02.784.692.425]
Task Performance and Analysis
[F02.784.692.746] +
Time Management [F02.784.692.816]
Vocational Guidance [F02.784.692.887]
Además, me informa que este término se indizaba previamente (entre 1972 y 1975) como
“personal satisfaction”.
7. No sólo debo buscar los términos clave (Mesh), sino también los términos secundarios que
hay dentro de cada término clave. Por ejemplo, muchos términos clave de la base de datos
Mesh incluyen a su vez acepciones, o categorías, que pueden ser de tipo médico o psicológico.
Yo debo seleccionar las que realmente estoy buscando. De lo contrario obtendré muchos
artículos que no me interesan y que probablemente no pueda abarcar (con lo cuál, puede que
utilice de nuevo más criterios de exclusión, para reducir el tamaño del resultado hasta hacerlo
manejable, que no sean adecuados).
8. Además, no es lo mismo usar un término en el campo "palabra clave", "key word", o "Mesh",
que usar ese mismo término en cualquier campo (título, abstract, etc.). Aunque yo utilice un
término Mesh, si lo utilizo en cualquier campo, me saldran artículos que incluyen ese término
en el abstract, por ejemplo, pero que en realidad no han investigado ese término. Utilizando la
sintaxis de Pubmed, no es lo mismo buscar "job satisfaction"[Mesh] que "job satisfaction". En el
primer caso, estoy pidiendo artículos que sí han trabajado la satisfacción laboral y han sido
clasificados en Pubmed con ese término clave; mientras que en el segundo caso, estoy
pidiendo cualquier artículo que contenga "job satisfaction", aunque no trate sobre ese tema.
9. Entonces, ¿debo aprender la sintaxis de búsqueda de Pubmed y saber que debo escribir
exactamente "job satisfaction"[Mesh], en la búsqueda simple de la página principal de Pubmed,
en lugar de buscar "job satisfaction"? Puede ser útil, pero no es imprescindible, ya que las
bases de datos como Pubmed ofrecen la posibilidad de hacer búsquedas avanzadas eligiendo
fácilmente, por ejemplo, el campo en el que debe buscar el término (key word, Mesh) que
escribamos (job satisfaction), sin tener que escribir la sintaxis correspondiente. En este caso,
bastará con hacer esta misma búsqueda como "búsqueda avanzada" y no como "búsqueda
simple". Los resultados serán muy diferentes y yo no tendré que aprender a utilizar la sintaxis
de la base de datos.
10. Uso simple de la base de datos Mesh. Puedo buscar en Google "pubmed" y me aparecerá
la dirección de la base de datos Pubmed, así como la dirección de la base de datos Mesh
(http://www.ncbi.nlm.nih.gov/mesh), aunque también puedo acceder Pubmed y luego pinchar
en "Mesh Database". En la búsqueda simple de Mesh (similar a la de Pubmed) puedo buscar
un término clave como, por ejemplo, "stress". Me aparecerán 459 términos clave que usan esta
palabra. Selecciono "Stress, psychological". Entro en este término, pues me permite
seleccionar muchos términos secundarios, algunos de los cuales no me interesan ("blood",
"cerebro spinal fluid", etc.), mientras que otros sí ("psychology", por ejemplo). Si marco éste y
pulso un botón que dice "Add to search builder" con "AND", me añadirá la sintaxis "Stress,
Psychological/psychology"[Mesh] a la caja de búsqueda de Pubmed, a la que podré seguir
añadiendo términos de búsqueda, eligiendo los operadores "AND", "OR", "NOT". Por ejemplo:
("Stress, Psychological/psychology"[Mesh]) AND ( "Stress, Psychological/etiology"[Mesh]).
Cuando haya añadido todos los términos que quiero buscar, enlazados por estos operadores,
pulsaré el botón "Search Pubmed". Me dará el resultado de la búsqueda que deseaba.
11. Estrategias de búsqueda de términos clave. Un buena estrategia a la hora de seleccionar
los términos clave idóneos para mi revisión es echar un vistazo a los artículos que me acaba de
proporcionar Pubmed y ver qué titulos se aproximan más a lo que yo estoy buscando
realmente. Entro en el que más se aproxima y veo cuales son las palabras clave (Mesh) que
tiene asignadas este artículo. Esto me puede ayudar a incluir nuevos términos o modificar los
que ya tenía. Además, cuando entro en el resumen de un artículo que está muy centrado en lo
que busco, no sólo puedo ver sus palabras clave, sino que Pubmed tiene un algoritmo que le
permite ofrecerme una selección de artículos muy próximos, por semejanza en sus palabras
clave, al que estoy accediendo. Puedo echar un vistazo a los títulos de este listado de artículos
similares. Si encuentro alguno que me interesa, puedo observar sus palabras clave o el listado
de artículos relacionados, etc.
12. Uso avanzado de la base de datos Mesh. Para hacer más accesibles las distintas
características u opciones que ofrece Mesh, puedo utilizar la página Mesh Browser
(http://www.nlm.nih.gov/mesh/MBrowser.html). En esta herramienta veo que puedo buscar
una(s) palabra(s) que sea(n) un término principal, o secundario, o ambos. Además, puedo
interrelacionar sinónimos que se usan en Mesh. Así, puedo utilizar una palabra exacta, pero
también puedo buscar términos que incluyen esta palabra, o una parte de ella. Si busco
"satisfaction", como término principal (main headings), o bien secundario (supplementary
Concepts), mediante la opción “ambos” (all the above), y con todos los fragmentos incluidos en
otros términos (“find terms with all fragments”, otros términos que incluyan "satisfaction"), me
aparecerán varias salidas, que incluyen “satisfaction”, como "job satisfaction" y "personal
satisfaction". Puedo utilizar un OR entre ambas, si creo que puedo encontrar artículos
interesantes con ambos términos ("Job Satisfaction"[Mesh] OR "Personal Satisfaction"[Mesh]).
También puedo buscar “job*” y las opciones anteriores, lo que me dará entre otros resultados el
término “job satisfaction”, o el término “workplace”.
13. ¿Puedo incluir una palabra que NO es término Mesh en mi búsqueda? Por ejemplo,
¿puedo incluir "Well being" en el título ("well being[Title])? No es una práctica muy
recomendable. Porque las palabras que los millones de autores usan para titular su trabajo no
son modificadas por el equipo de Mesh y puede haber muchos problemas de sinonimia, que no
han sido trabajados por la base de datos. Por lo tanto, "well being" en el título nos puede llevar
a perder sensibilidad y especificidad (a una peor revisión). Así, es probable que haya pocos
trabajos que incluyan “well being” en el título, pero que me interesarían para mi revisión.
14. Ejemplo. Si yo hago una búsqueda simple en Pubmed con los términos psychological
wellness and work (porque me parecen inicialmente como los más adecuados), obtengo más
de once mil trabajos, que no puedo revisar uno por uno. Pero es muy probable que haya en
este resultado muchos artículos que no investigan el bienestar psicológico en el trabajo (falsos
positivos, problema de especificidad). Además, es probable que la búsqueda tenga una baja
sensibilidad y se me hayan escapado muchos artículos importantes para mi revisión (por
ejemplo, los que no hayan utilizado en ningún campo la expresión “pyschological wellnes”, pero
sí hayan estudiado mi tema). Si yo busco “job satisfaction”[Mesh] me salen en principio todavía
más, unos dieciséis mil artículos, pero estos sí que han investigado el tema que estoy
revisando (alta especificidad) y no se me han escapado los imprescindibles (buena
sensibilidad). Ahora tendré que seguir buscando más términos Mesh (principales y
secundarios) que sean adecuados para mi revisión. Por ejemplo, si yo quiero centrar mi
búsqueda en el bienestar psicológico de los trabajadores sanitarios de cuidados paliativos,
buscaré “palliative” en Mesh, exploraré las distintas opciones mencionadas más arriba y
finalmente puedo optar por (“palliative care team”[Mesh] OR “palliative care/Manpower”[Mesh]).
Pero al cruzar estos términos con “job satisfaction”[Mesh], unidos por un AND no obtengo
resultados. Por lo tanto, tengo que ser menos restrictivo y pruebo con la siguiente sintaxis:
("Job Satisfaction"[Mesh]) AND (“palliative care”[Mesh]). Obtengo 46 artículos muy específicos
sobre el tema que busco. Si creo que he podido perder trabajos de investigación al ir
seleccionando estos términos (por ejemplo, algunas investigaciones estudian el estrés laboral,
en lugar de estudiar la satisfacción laboral, puedo hacer una nueva búsqueda. Así, podría
comenzar por revisar ("Stress, Psychological/prevention and control"[Mesh] OR "Stress,
Psychological/psychology"[Mesh]), que cruzaría con (“palliative care”[Mesh]). Obtengo 179
artículos, que quizás puedo revisar manualmente, aunque sería mejor cruzar este resultado
con la anterior búsqueda ((“Job satisfaction”[Mesh] OR "Stress, Psychological/prevention and
control"[Mesh] OR "Stress, Psychological/psychology"[Mesh]) AND (“palliative care”[Mesh])),
pues obtengo 212 (menor que 46+179=235), eliminando los repetidos en ambas.
15. El resultado final de la búsqueda debería recogerlo en un programa de gestión de
referencias bibliográficas, como EndNote, My EndNoteWeb, RefWorks, etc., porque me
permitiría (1) insertar las citas en Word mientras escribo (sin tener que teclear información,
riesgo de cometer errores, o perder productividad, al repetir un trabajo que ya está hecho), en
un determinado estilo que elijo para una revista y que puedo modificar en cualquier momento,
sin volver a teclear o corregir la información; (2) no tener que preocuparme de las normas de
estilo APA, o cualquier otras, sino que por el contrario, el programa de referencias gestiona el
estilo correspondiente, ordena la bibliografía de acuerdo con las normas del estilo
seleccionado, por ejemplo, alfabéticamente en el estilo APA; (3) tener accesibles no sólo los
datos que hay que incluir en una referencia bibliográfica (autores, año, título, etc.), sino también
el resumen, las palabras clave, etc.; (4) poder hacer búsquedas electrónicas en el resultado
final, sin tener que acceder de nuevo a la base de datos online; (5) hacer rápidamente listados
de referencias bibliográficas en formato APA, ordenados alfabéticamente, o cambiar
inmediatamente a otro estilo; etc.
16. EndNote permite hacer búsquedas directas (sin importación) en la base de datos Pubmed.
My EndNoteWeb permite hacer búsquedas directas en Pubmed y la Web of Sicences. El
programa RefWorks permite hacer importaciones directas desde PsycInfo. Y todos los
programas de gestión bibliográfica permiten la importación de ficheros de búsqueda que se han
obtenido en cualquier base de datos.
Descargar