Ar@cne - Wikispaces

Anuncio
Ar@cne
REVISTA ELECTRÓNICA DE RECURSOS EN INTERNET
SOBRE GEOGRAFÍA Y CIENCIAS SOCIALES
Universidad de Barcelona
Nº 83, 1 de mayo de 2006
ISSN 1578-0007
Depósito Legal: B. 21.743-98
MÉTODOS DE BÚSQUEDA EN FUENTES DE INFORMACIÓN EN CIENCIAS
SOCIALES Y HUMANIDADES
José Martín Brocos Fernández
Profesor de la Universidad San Pablo-CEU, Madrid (Madrid), España
[email protected]
Carlos Ortiz de Landázuri
Prof. Universidad de Navarra, Pamplona (Navarra), España
[email protected]
Disponible: http://www.ub.es/geocrit/aracne/aracne-083.htm
Métodos de búsqueda en fuentes de información en ciencias sociales y
humanidades (Resumen)
Tras una presentación de la información en Internet, procedemos al análisis de los
principales recursos informativos existentes en las disciplinas pertenecientes a las
ciencias sociales y humanas, para después mostrar los sistemas de recuperación de las
fuentes de información socio-humanísticas. Para ello, partiendo de criterios de
evaluación de las fuentes de información y de búsqueda, entramos a analizar los
servicios y aplicaciones que permiten investigar y encontrar información.
Transferencias de ordenadores remotos, búsqueda de ficheros específicos, consulta a
ordenadores remotos, HyTelnet, Wide Area Information Server, servicios integrados de
búsqueda de información con la exploración de internet a través de menús y enlaces, y
Verónica, así como el uso de servicios y aplicaciones que permiten encontrar
información; la búsqueda con WinSPIRS y WebSPIRS y valoración de los mismos.
Palabras clave: Búsqueda, ciencias sociales, humanidades, Motores.
Search methods inside information sources about social sciences and humanities
(Abstract)
After a short survey of internet information, we expose the analysis of the main
information resources in social and human sciences, in order to show the recuperation
systems concerning social and human informations. Beginning with the criteria for the
evaluation of information and research sources, we analyze the services and applications
1
that assist the research and finding out of information. Transference from remote
computers, research of specific folders, pop into remote computers, HyTelnet, Wide
Area Information Server, integrated researching services through internet exploration by
links and menus, and Veronica, as well as the use of services and application suitable to
find out information; the research by WinSPIRS and WebSPIRS and their evaluation.
Keywords: Research, Social Sciences, Humanities, Search Engines.
Ante el gran número de fuentes de información que aparecen a diario en Internet, se
hace necesario usar un criterio de evaluación para seleccionar los recursos más
apropiados para nuestras investigaciones, un instrumento para decidir si una fuente
determinada puede unirse a nuestra guía de recursos, o para juzgar la capacidad e
resolver las necesidades de información nueva.
Sin un criterio de evaluación, las páginas web de selecciones de recursos de información
serían en muchos casos herramientas de dudoso valor. El profesor José Antonio Cordón
expone estos criterios de evaluación de fuentes de información en Internet[1].
Existen dos tipos de informaciones en Internet, teniendo en cuenta el acceso a ella. Por
un lado se puede acceder a información de distintas bases de datos de los distintos
servicios de información electrónica, o sea acceso a información elaborada, con
instrumentos de búsqueda sofisticados, previa autorización, mayoritariamente de pago y
con un acceso por suscripción.
El otro tipo de información es la que ofrecen las entidades y organismos generalmente
públicos, aunque también existen empresas privadas y personas individualmente, en la
mayoría de los casos sin una gran elaboración, con pocos instrumentos de búsqueda,
gratuita, y donde la búsqueda debe hacerse fuente a fuente, o sea buscando la misma
información en distintos Webs[2]. Tanto en un caso como en otro, el problema sigue
siendo cómo encontrar la información deseada, aunque el WWW (World Wide Web)
permite un acceso amigable y muy sencillo a la información.
Para poder resolver este problema de búsqueda y acceso a la información, han aparecido
distintos servidores de páginas Web, o máquinas de búsqueda en el WWW que ayudan
a localizar los servidores que contienen una determinada información. Pueden llamarse
también buscadores, localizadores, directorios de recursos, robots, arañas (spiders) o
vagabundos (wanderers), entre otros términos.
Fuentes de información en ciencias sociales y humanidades. Análisis de manuales y
repertorios impresos. Directorios telemáticos
Manuales y repertorios impresos
R. Blazer y E Aversa (2000). The Humanities: A Selective Guide to Information
Sources. Distingue entre acceso a la información sobre cada disciplina y las principales
fuentes de las mismas. Tiene descripciones de las áreas que abarcan cada disciplina. No
ofrece descripciones de los tipos de información. Tiene índice de autores y títulos,
2
además de índice de materias. Con una descripción del contenido y utilidad de cada
fuente seleccionada.
Gloria Carrizo Sainero (2000). La información en ciencias sociales. Distingue entre
fuentes primarias y fuentes secundarias (repertorios bibliográficos, bases de datos, etc).
Dedica dos capítulos a la literatura gris. Delimita el campo de actuación de las
disciplinas, incluyendo su evolución histórica. En los primeros capítulos se definen los
distintos tipos de fuentes de información. Su índice es analítico (autores, títulos,
materias). Referencias desiguales e incompletas de las fuentes y descripción de
contenido de las mismas.
Nancy Herron (ed.) (2002). The social sciences: a cross disciplinary guide to selected
sources. Antes de cada disciplina ofrece explicaciones teóricas sobre la misma. No
incluye teoría relativa a las fuentes de información. Tiene índice de autores, títulos y
materias, así como referencias y breves reseñas de las fuentes seleccionadas.
Tze-chung Li (2000). Social science reference sources: a practical guide. Distingue
entre acceso a las fuentes (guías, bibliografías, resúmenes, tesis, reseñas, índices, etc.) y
fuentes de información (enciclopedias, diccionarios, directorios, diccionarios,
biografías, manuales, etc). Breves explicaciones sobre las ciencias y más detalladas
sobre las fuentes. Índice de autores y títulos; índice de URL citadas. Tiene referencias
de las obras seleccionadas y una breve reseña sobre su contenido y utilidad.
Susana Romanos de Tiratel (2000). Guía de fuentes de información especializadas:
Humanidades y Ciencias Sociales. Estructura su obra a partir de las fuentes de
información: obras de referencia, acceso a libros y publicaciones seriadas, acceso a los
contenidos de las publicaciones seriadas, acceso a las publicaciones oficiales y fuentes
no bibliográficas. Extensos capítulos dedicados a delimitar las disciplinas que integran
las ciencias socio-humanísticas. Índice de autores y títulos. Referencias y descripción
breve de contenido y utilidad de las fuentes que se han seleccionado de cada disciplina
Directorios telemáticos
Social Science Information Gateway (SOSIG). URL: <http://www.sosig.ac.uk>.
Responsable la Universidad de Bristol. Institute for Learning and research Technology.
La selección se realiza a partir de una serie de criterios, tanto relativos a la calidad de la
información, como a los sistemas de recuperación empleados. Las fuentes incluidas en
este directorio se presentan agrupadas por tipología documental.
Voice of the Shuttle (VoS). URL: <http://vos.ucsb.edu>. Responsable: Universidad de
California. El equipo que elabora el directorio se encarga de incluir nuevos links,
aunque también pueden hacerlo usuarios registrados. No tiene establecidos criterios de
selección. La clasificación se hace desde las submaterias[3].
Información bibliográfica (bases de datos ISBN, bibliografías nacionales, directorios de
editoriales, catálogos colectivos)
Información bibliográfica (bases de datos ISSN)
3
ISBN. URL: <http://www.mcu.es/bases/spa/isbn/ISBN.html>. Productor: Agencias
Española de ISBN. Documentos editados en España para la venta, sujetos al Decreto
2984/1972 de 2 de noviembre. Más de un millón de documentos (1972-). Incluye todas
las lenguas en las que se hayan publicado documentos en España. Relacionada con una
base de datos de editores españoles.
Global Books in Print. URL: <http://www.globalbooksinprint.com>. Productor:
Browker/Whitaker. Registros ISBN de USA, Reino Unido, Canadá, Australia y
Sudáfrica. Suma de varios repertorios. Supera los 8 millones de títulos de lengua inglesa
de unos 170.000 editores.
Repertorio Integrado de Libros en venta en Iberoamérica (RILVI). URL:
<http://www.cerlalc.org/rilvi/index.php>. Productor: CERLAC y Agencias ISBN de
Iberoamérica. Cerca de 2 millones de monografías[4].
Información bibliográfica (bibliografías nacionales)
Bibliografía Nacional Española. Productor: BNE. Se forma con obras ingresadas por
Depósito Legal. Carácter oficial desde 1958. Su contenido es el mismo que el del
catálogo ARIADNA, y accedemos a través de URL: <http://www.bne.es>. Libros
modernos desde 1831, libros antiguos hasta 1830, manuscritos, documentos, mapas,
grabados, dibujos, revistas, periódicos, fotografías, planos, partituras, grabaciones
sonoras y videograbaciones.
Bibliografía Nacional Portuguesa em CD-ROM. Editor: ProQuest Information and
Learning – Chadwyck-Healey. (1986-). Bibliografia Nacional Portuguesa em linha.
URL: <http://bnp.bn.pt/>[5].
Información bibliográfica (directorios de editoriales)
Buscaeditorial. Buscador de editoriales españolas. URL:
<http://www.bibliotecagodella.com/buscaeditorial/> Responsable: Ricardo Fornas
Carrasco (el mismo que Buscopio). Unos 1000 enlaces. Opciones de búsqueda avanzada
Editoriales. URL: <http://www.mcu.es/bases/spa/edit/EDIT.html> Responsable:
Agencia Española de ISBN. Puede localizarse e-mail y web de la editorial.
Publisher`s Catalogues. URL: <http://www.lights.com/publisher/> Responsable: Peter
Scott, Northern Lights Internet Solution Ltd. Directorio y buscador de webs de
editorials de todo el mundo. Búsqueda directa, a través de motor de búsqueda, por
países, por materias y por los tipos de documentos que publican
Directorio: Editoriales, Distribuidoras y Librerías (relacionado con el RILVI). URL:
<http://www.cerlalc.org/directorioeditoriales/directorio.php> Responsable: CERLALC.
Información sobre el sector del libro en Hispanoamérica, tanto editores, distribuidores y
libreros. Hay enlaces a Agencias ISBN iberoamericanas.
Información bibliográfica (catálogos colectivos)
4
Otros consorcios y catálogos colectivos. URL: <http://www.cbuc.es/> (opción Enllaços
d`interès. Vas continentes→Países→Redes de Bibliotecas→CC=Catálogo colectivo)
Responsable: CBUC. Podemos localizar desde el enlace los catálogos colectivos
puestos en marcha por consorcios de bibliotecas de cualquier país del mundo
REBIUN. Catálogo general. URL: <http://rebiun.crue.org/cgibin/abnetop/X16136/ID1997242528?ACC=101> Tres catálogos colectivos: general,
publicaciones periódicas y fondo antiguo.
Catálogos de Bibliotecas Públicas del Estado (BPE)
<http://www.mcu.es/bpe/bpe.html> Responsable: Ministerio de Educación, Cultura y
Deporte. Acceso a los catálogos de las BPE, así como a las Bibliotecas Centrales de
Comunidades Autónomas y Servicios Autonómicos[6].
Tesis Doctorales, Pasarelas y Revistas electrónicas
Tesis Doctorales
TESEO URL: <http://www.mcu.es/TESEO/teseo.html> Productor: Ministerio de
Educación, Cultura y Deporte. Contiene información sobre las tesis doctorales leídas en
Universidades españolas. Los descriptores están establecidos en un breve tesauro.
Índice. Lista de materias. No tiene sistema de suministro de documentos. (1976-)
Dissertation abstract / Digital Dissertations. Tiene tesis doctorales y otros trabajos de
investigación, como tesinas y trabajos de postgrado, presentadas en más de mil
facultades de todo el mundo. Consulta por Search (Basic/Advanced) o Browser
(disciplina/subdisciplina). Registros con extenso resumen. Sirven documentos desde
1997 en papel, en microficha o en formato electrónico. De los documentos posteriores a
1997 pueden consultarse las 24 primeras páginas en .pdf (1861-) URL:
<http://library.dialog.com/bluesheets/html/bl0035.html>[7].
Pasarelas y Revistas electrónicas
PCI Full Text / Periodical Content Index (PCI). Base de datos que recoge información
bibliográfica de artículos publicados en más de 4.000 revistas de ciencias sociales y
humanidades. Digitaliza revistas antiguas. (XVIII-).
Emerald Full Text. Acceso a más de un centenar de revistas publicadas por MCB
University Press sobre materias relacionadas con las ciencias sociales, en particular.
Economía, gestión y ciencias de la información.
Ebsco Host Electronic Journal Service (EJS). Pasarela. Pueden consultarse revistas o
artículos. Unas 10.000 revistas, la mitad a texto completo.
SwetsWise. Pasarela. Acceso a unas 18.000 revistas. Búsquedas por artículos, revistas o
editores[8].
Servicio de suministro de documentos
5
Document Suply Centre, de Brithish Library. URL:
<http://www.bl.uk/services/document/dsc.html>. Colecciones para préstamo y para
envío de fotocopias. Múltiples servicios. Base Inside actualizada diariamente. Para el
envío de documentos cabe varios procedimientos, entre lo que se encuentra el software
Ariel, que combina escáner con e-mail.
Article Science, de INIST. URL: <http://articlesciences.inist.fr>. (1990). Envío por
correo ordinario.
Servicio de acceso al documento, de CINDOC. URL:
<http://marte.cindoc.csic.es/cindoc/servicios.htm>. Envío por correo ordinario, por
FAX o mediante Ariel.
Article Finder / Table of Contents, de Infotrieve. URL: <http://www.infotrieve.com>.
Consulta gratuita, pero no el envío de documentos[9].
Principales bases de datos de ciencias sociales y humanidades
Project Gutenberg (cooperativo) URL: <http://www.promo.net/pg>
Biblioteca digital. Gratuita. Lingüística y Literatura
Biblioteca Virtual Miguel de Cervantes. URL: <http://www.cervantesvirtual.com>
Obras clásicas de la literatura hispanoamericana. Acceso a “Bibliotecas de autor”.
MLA International Bibliography. Lingüística y Literatura. Base bibliográfica a partir de
publicaciones especializadas. Tesauro propio.
Bibliografía de la Literatura Española. Literatura. En CD-ROM permite que se pueda
pasar a formato MARC. URL: <http://ble.chadwyck.com/>.
Aranzadi. Derecho. Base de datos de legislación y jurisprudencia desde 1930
Indiboe (B.O.E.). Derecho. Gratuita. Sumarios a partir de 1995. Textos completos en
IBERLEX (legislación nacional) e IBELEX-UE (legislación europea), mientras que las
normas históricas se recopilan en la base GAZETA.
EUR-LEX. Derecho. Gratuito. Acceso a base de datos CELEX (de pago). URL:
http://europa.eu.int/eur-lex/es/
Econlit. Economía. Base de datos bibliográfica realizada a partir de publicaciones
periódicas especializadas. URL: <http://www.econlit.org/>
Philosopher´s Index. Filosofía. Desde 1940. Se actualiza cada tres meses. Documentos
recogidos de revistas de cerca de 500 países. URL:
<http://www.philinfo.org/electronic.htm>.
6
All music guide. Música. URL: <http://www.allmusic.com>. Portal de información
musical y discográfica. Ofrece datos de intérpretes y estilos musicales de todos los
tiempos, géneros y países. Varias posibilidades de consulta. Glosario.
Internet Movie Database. Cine. URL: <http://www.imdb.com> Portal dedicado al
mundo del cine. Amplios datos ofrecidos para cada película. Para investigadores.
Películas españolas y extranjeras estrenadas en España. Cine. Responsable: Instituto
de la Cinematografía y las Artes Visuales (MECD) URL:
<http://www.mcu.es/jsp/plantilla_wai.jsp?id=23&area=centrosdoc> Base de datos.
Amplia posibilidades de búsqueda. Incluye número de espectadores y recaudación
obtenida.
Library & Information Science Abstract (LISA), de CAS. Biblioteconomía y
Documentación. Base de datos bibliográfica. URL:
<http://www.csa.com/factsheets/lisa-set-c.php>.
Sociological Abstract, de CAS. Sociología. Base de datos bibliográfica. Incluye tesis
doctorales. Da información de las veces que ha sido citado un documento. (1963-).
URL: <http://www.csa.com/factsheets/socioabs-set-c.php>.
ERIC. Responsable: Departamento de Educación USA. Pedagogía. Base de datos.
Acceso gratuito a través de Internet. Tesauro propio. URL: <http://www.eric.ed.gov/>.
Psycinfo, de la APA. Psicología. Recoge tb tesis. (1887-). Tesauro que ayuda a la
recuperación de información en la base. URL: <http://www.apa.org/psycinfo/>
Historical Abstract. Historia. (1955-). Consulta a través de la Web. Opción “Clio
Notes” de búsqueda conjunta[10].
Criterios de búsqueda. Búsqueda automatizada
El profesor José Antonio Cordón (2001) aborda la búsqueda bibliográfica, y utilización
de los operadores lógicos. Establece criterios de búsqueda que nos permitirán establecer
el nivel y la cobertura que ha de tener la misma. Estos criterios son: el período que debe
cubrir la búsqueda, corriente o retrospectiva; las lenguas deseadas para la recuperación
de la información; y el tipo de documentos deseados: monografías, artículos, tesis,
patentes, etc.
Una vez establecidos los criterios de búsqueda se pasa al desarrollo de ésta, para lo cual
tenemos que elaborar una estrategia de búsqueda que mediante unos procedimientos
lógicos permita obtener los resultados deseados. También el profesor José Antonio
Cordón expone con profundidad los pasos para una correcta estrategia de búsqueda
manual y automatizadas[11].
La profesora de la UAB, María Eulalia Fuentes trata este tema con más amplitud[12].
Abordando en tema de los servidores de páginas web, afirma que dado que la
información recogida por estos servidores se puede almacenar por palabras clave o por
conceptos, o con la información jerarquizada o estructurada arborescentemente, es
posible localizar y recuperar la información también de distintas manera:
7
- En la indización por palabras clave el programa recogerá las palabras que tienen que
ver con el contenido del documento (en el título, en el resumen ...), y por lo tanto estos
términos de búsqueda no podrán ser ambiguos. En la indización por conceptos los
documentos aparecen ordenados por temas o conceptos, y por lo tanto al realizar la
búsqueda será necesario introducir gran número de términos relacionados con el tema
buscado, para que el sistema realice con mayor exactitud la información requerida.
- También es posible realizar búsquedas a través de los directorios, donde se ordena la
información jerárquicamente por temas de interés general, hasta llegar a temas
específicos. De todas maneras este tipo de búsquedas, muy válido para localizar datos
relacionados con un tema, es limitado puesto que no llegan a catalogar todo el contenido
de la Red.
- Se trata pues de recuperar información precisa, sin ruido ni silencio[13], o por lo
menos con un equilibrio entre ambos. La regla de oro de la recuperación de la
información es la existencia de un equilibrio entre ruido y silencio, o lo que es lo
mismo, entre precisión y exhaustividad.
Para obtener el máximo provecho de la consulta mediante estos localizadores es
necesario elaborar la estrategia de búsqueda: definir la consulta; analizarla y seleccionar
los términos básicos o esenciales y más significativos; búsqueda de sinónimos y
equivalentes en otros idiomas para cada término; establecimiento de las relaciones entre
términos usando los operadores lógicos o booleanos que admita el localizador, y
teniendo en cuenta de delimitar entre paréntesis el alcance de cada operador.
Los tres operadores lógicos son: Intersección: Y / AND donde todos los términos o
conceptos de la búsqueda aparecerán siempre en todos los documentos. Unión: O / OR
donde alguno de los términos o conceptos de la búsqueda aparecerán en los documentos
seleccionados. Negación: NO / AND NOT de un grupo de documentos se excluyen los
que por las razones que sea, tengan elementos informativos que no interesen.
También dependiendo de las posibilidades de los distintos localizadores, pueden
utilizarse los operadores de proximidad y los truncados.
La función de los operadores de proximidad[14] es profundizar en la precisión de la
búsqueda a través de la proximidad de los términos escogidos. Se pueden buscar
documentos que contengan dos o más términos y que estén en un mismo párrafo (near)
o que estén separados por n palabras (w/8).
En cambio los truncados[15] permiten incrementar el nivel de exhaustividad en la
búsqueda. Los truncados no son otra cosa que el uso de signos comodines (*, ¿, $, ...)
que pueden sustituir de uno a n caracteres, tanto al principio, como en medio, como al
final de la palabra. Debe tenerse cuidado con el uso de los truncados y el lugar del
término donde se hace este truncado, puesto que pueden entorpecer la búsqueda más
que ayudarla, aportando ruido documental.
Sistemas de búsqueda en Internet y valoración de los mismos
Sobre los sistemas de búsqueda en Internet, el profesor José Antonio Cordón nos dice
que son similares[16]. Recursos como los operadores boléanos, and, or, not, etc.,
truncamientos, operadores de proximidad, se pueden emplear con el mismo nivel de
eficacia que en una base de datos convencional.[17]
8
Catálogos Web, Buscadores y Metabuscadores
Internet es un inmenso pandemonium[18] en el que para encontrar la información
buscada precisamos de herramientas de búsqueda, los llamados buscadores.
Un catálogo Web nos ofrece páginas clasificadas por temas. Según Ingo Laxkerbauer:
"La búsqueda de campos temáticos o de empresas y organizaciones se simplifica
gracias a la clara estructura y a la indexación. Detrás del catálogo Web se esconde una
serie de espíritus trabajadores. Éstos buscan continuamente servidores Web nuevos que
luego se clasifican por temas, se incluyen en el catálogo y se acompañan de una
descripción"[19]. Por consiguiente, un catálogo Web no explora en la red para localizar
lo pedido por el usuario, sino que acude a su propia base de datos.
El catálogo Web, al estar dividido por áreas temáticas, resulta adecuado para localizar
un tema concreto. Nos aporta menos entradas que un buscador, pero éstas suelen estar
más acorde con lo que queremos buscar.
Catálogos de búsqueda los tenemos por ejemplo en los portales[20] de, <www.terra.es>,
<www.biwe.es>, <www.lycos.es> o <www.yahoo.com>.
Por el contrario, un servidor de búsqueda sí pesca en el conjunto de Internet. Es por ello
que es necesario cuando utilizamos un motor de búsqueda indicar con la máxima
claridad y precisión el concepto de búsqueda.
Cada buscador tiene su metodología de búsqueda, y lo mejor para ello es tomarse unos
minutos en leer la ayuda de cada uno. Aquí ofrecemos el análisis de algunos de los más
utilizados y que mayor precisión ofrecen en el campo de las ciencias sociales y
humanidades.
Google. URL: <http://www.google.com>. Podemos realizar una búsqueda exacta de
frases. Para ello escribimos entre comillas la frase que queremos buscar. El directorio
permite acceder a la información por categorías temáticas. Si ponemos un signo menos
(-) delate de un término, con ello excluimos una palabra de la búsqueda. Es
imprescindible incluir un espacio antes de este signo. Podemos utilizar el operador or.
No acepta truncamientos. No hay diferencia entre mayúsculas y minúsculas. Utilización
del signo +. Para ello debemos introducir un espacio delante del signo. Para saber
quienes han efectuado enlaces a una página concreta o establecer redes de citas hacia
una URL se emplea la fórmula siguiente: link: url
Altavista. URL: <http://www.altavista.com>. El buscador Altavista permite localizar de
forma separada distintos recursos de la red Internet: páginas web, noticias, foros de
discusión, productos, imágenes, vídeos y audio. La presentación de resultados siempre
será por orden de pertinencia. Las búsquedas simples las realizamos desde la pantalla
principal. Podemos restringir las búsquedas especificando el idioma; en la actualidad
tiene la opción de 25. Las comillas las utilizamos para encontrar la frase exacta. Si
escribimos en mayúsculas, sólo localizará estas. Para que busque minúsculas y
mayúsculas tenemos que poner p. ej. california=California, california, CALIFORNIA.
Para inclusión de palabras, ponemos el signo (+) inmediatamente delante de la palabra
sin espacio. Para exclusión de palabras ponemos el signo (-) inmediatamente después de
la palabra sin espacio. Escribiendo un asterisco (*) al final de una palabra –
9
truncamiento- buscará todas las formas posibles del término. Caracteres especiales
como %, #, _, /, . y $, Altavista los interpreta como un separador para palabras. Con
Altavista podemos utilizar funciones:
- anchor: text → Localiza páginas que tienen una palabra en el texto del hipervínculo.
- domain: domainname → Se utiliza para buscar páginas de un dominio.
- image: filename → Busca imágenes guardadas con este nombre.
- link: URLtext → Busca páginas que redireccionan una página.
- url: text → Localiza un texto dentro de la URL.
USSeek. URL: <http://www.usseek.com/>. Es uno de los más rápidos en cuanto a la
búsqueda y recuperación de documentos y dispone de un amplio directorio temático
accesible desde su página principal. Desde ella también se pueden realizar búsquedas
sencillas o acceder al apartado de ayuda para búsquedas avanzadas, sin operadores
boléanos, pero con unos caracteres clave que hacen funciones similares y realizando la
búsqueda o a través del Web, de USEnet, FTP, Gopher o Newsgroups para buscar
información adicional, pudiéndose trabajar en distintos idiomas.
Magellan. URL: <http://www.magellan.mckinley.com>. Es uno de los servidores de
páginas Web más clásico con un buen sistema de ayuda y diversos servicios
complementarios, como buscadores de e-mail o un directorio de páginas amarillas, y
puede realizar búsquedas en el Web, en FTP, en Gopher y en Newsgroups. No incluye
operadores boléanos, pero tiene diversos símbolos que hacen funciones parecidas y está
provisto de un catálogo temático.
Sobre los metabuscadores, éstos actúan como pasarelas a los buscadores más
conocidos[21]. La búsqueda con estos agentes multibuscadores ofrece un mejor
rendimiento que la realizada tradicionalmente con buscadores[22].
Copernic[23] es uno de los metabuscadores más conocidos. La casa permite descargarlo
freeware, pero con las limitaciones de acceso gratuito no están activadas todas sus
funciones. Este robot de búsqueda cuenta con la gran ventaja de clasificar la
información. La base de datos de direcciones de Copernic 2000 se divide en temas. El
usuario podrá seleccionar el tema donde quiera buscar la información. Para poder
localizar información en la red seguimos los siguientes pasos: Clic en el botón New que
lo encontramos en la barra de herramientas; seleccionar una categoría para la
información a través de la lista desplegable Category; introducir la cadena de búsqueda;
especificar la búsqueda deseada; determinar el tipo de acción que tendrá que desarrollar
Copernic 2000 una vez que finalice la búsqueda. Una opción interesante, si habilitada
también si descargamos gratuitamente el programa, es comprobar que todas las
direcciones URL funcionen correctamente; clic en Search Now. Copernic nos muestra a
continuación, completada ya la búsqueda, un informe con referencias y un breve
resumen de cada página Web.
Subject Search Spider es otro robot de búsqueda especializado en localizar información
en Internet. Este programa busca en varias bases de datos de información publicada en
Internet y genera un resumen en un documento HTML. En este documento muestra el
título de la página Web donde se encuentra la información solicitada, un hiperenlace
para acceder a ella y un resumen de su contenido. Subject Search Spider permite
configurar cada una de las búsquedas[24], determinar el idioma de la búsqueda, el
10
número de páginas que se mostrarán en el resumen, el número de palabras que tendrá el
informe de cada uno de los recursos localizados y el tiempo del que dispondrá para
efectuar la búsqueda. Cuanto mayor sea el tiempo disponible, mejor será la calidad de la
información suministrada. En el informe ordenará la información por importancia.
Portales
El crecimiento masivo de información en Internet está obligando a encontrar
herramientas que permitan a los usuarios acceder a la información de su interés de una
forma rápida y fiable. El problema de la gran acumulación de información apareció ya
en los primeros años de Internet, por lo que las soluciones a buscar están unidas a la
propia historia de la Red.
Hasta l990 los usuarios de Internet debían conocer los comandos Uníx para navegar y
buscar en la Red. La herramienta principal para localización de ficheros era el comando
grep de Uníx, Archie, que es una elaboración de grep y fue creado en 1980 por un grupo
de investigadores del Centro de Computación de la Universidad McGill, en USA, con el
fin de encontrar ficheros ftp más fácilmente.
En 1991, investigadores del Centro de Computación de la Universidad de Minnesota
inventaron el Gopher, con un interface de usuario más amigable y un formato de menú
de ficheros. Tal fue su popularidad que en poco tiempo aparecieron miles de sitios
Gopher por todo el mundo, para los cuales no existía un índice central o mecanismo de
búsqueda. Es por ello que en 1992 se creó Verónica, permitiendo a los usuarios de
Gopher buscar en el Gopherespacio.
En 1989 comienza a fraguarse en concepto de World Wide Web –WWW- en el CERN
–Centro Europeo de Investigaciones Nucleares, siendo Tim Berners-Lee uno de sus
primeros responsables. La aparición de la Web supuso una revolución ya que su carácter
gráfico e hipertextual la acercó al gran público, aumentando la cantidad de información
existente, por lo que se planteó de nuevo la creación de otras herramientas que
permitieran buscar y encontrar en la Web. El WWW permite el acceso a todos los
recursos de información disponibles mediante referencias cruzadas de información, y
cada página Web tiene conexiones que permite acceder a otras páginas Web mediante
lazos asociativos. El WWW es, actualmente, la aplicación estrella de Internet, y su
diseño permite acceder, además de a servidores de WWW, a otro tipo de servicios y
pasarelas que tradicionalmente habían sido proporcionados de manera individual, y que
WWW ha conseguido unificar en un solo interface, como el FTP, Archie, Gopher y
Verónica, Wais, servicios de direcciones como Whois o X500, Finger, Usenet, Telnet y
Hytelnet, entre otros.
En 1993 la primera generación de motores –WWW Worm y WebCrawler- hace su
aparición, aunque a principios de 1994 son sustituidos por motores de búsqueda más
poderosos como Altavista, Excite, Infoseek, Lycos y OpenText. Pero incluso estos
motores, que usan algoritmos de búsqueda por palabras, fallan para encontrar
información relevante; es por ello por lo que actualmente se utilizan motores que
incorporan algoritmos inteligentes –Inktomi`s Slurp- basados en indización por
conceptos, es decir, tratan de determinar lo que el usuario piensa, no lo que dice.
11
Ya en el siglo XXI los portales se están constituyendo como una evolución lógica de las
anteriores herramientas de búsqueda. Se está observando un proceso curioso: a mayor
cantidad e información, menor esfuerzo del usuario por localizarla. Es en este sentido
donde los portales tienen su éxito asegurado, ya que reúnen en una única dirección web
aquellos links de mayor interés o difusión en Internet. El problema que plantean es que
la información es previamente seleccionada y manipulada por un grupo de personas, por
lo que la información que nos presentan puede estar manipulada.
El profesor José Antonio Cordón sostiene que los portales generalistas, que intentan
abarcar todos los campos del conocimiento están abocados al fracaso frente a los
portales especializados, más centrados en campos específicos del conocimiento[25].
Búsqueda con WinSPIRS
Para la búsqueda con WinSPIRS[26] es necesaria, normalmente, la intervención de dos
tipos de organizaciones: una sería el productor de las bases de datos, bien en línea Online, bien comercializada en Cd-Rom, y la otra el centro u organismo (centros de
documentación, hospitales, centros de investigación, etc.) que disponga de los equipos
de teledocumentación necesarios.
El equipo que precisamos para realizar búsquedas On-line es un terminal de ordenador,
teléfono, módem e impresora. Para búsquedas en Cd-Rom precisamos de terminal de
ordenador, red, multilector de Cd-Rom, Cd-Rom e impresora.
Los pasos para efectuar esta búsqueda los encontramos en el mencionado libro del
profesor José Antonio Cordón[27].
Búsqueda con WebSPIRS
WebSPIRS es el programa de consulta de bases de datos SilverPlatter. Con WebSPIRS
operan varias bases de datos de las más importantes del campo de las ciencias sociales y
humanidades, p.ej. las mencionadas ERIC (educación), LISA (Documentación), MLA
(Lengua y Literatura) y EconLit (Economía). La página de búsqueda de WebSPIRS
permite construir peticiones de búsqueda y determinar como se mostrarán los registros.
Podemos combinar términos mediante operadores lógicos que permiten formar
peticiones de búsqueda compuestas –and, in, near, not, or, with, adj-, los operadores de
campos límite -<, >, <=, >=, - -, y la utilización de truncamiento y comodines que
permite variaciones de su término de búsqueda cuando construya sus búsquedas en las
páginas de Selección de Bases de Datos y Búsquedas. El símbolo de truncación (* )
sirve como sustituto para cualquier cadena de cero o más caracteres. El símbolo de
comodín (¿) sirve como sustituto de uno o más caracteres. Podemos utilizar la
truncación y los comodines en cualquier lugar en su término de búsqueda, excepto
como primer carácter.
Conclusiones finales
Para una localización específica de recursos de información en Internet, accesible bien
mediante un browser o bien mediante pasarelas, debemos primero definir la búsqueda,
entendida ésta como el conjunto de operaciones cuyo objeto es localizar, seleccionar y
obtener los documentos que den respuesta a las preguntas formuladas por el usuario en
12
función de sus necesidades de información. Lo ideal es manejar las diversas
herramientas disponibles en la ejecución de una búsqueda genérica (v.gr. buscadores,
directorios, portales, catálogos web, metabuscadores), específica (v. gr. portales
temáticos, revistas en línea, bases de datos) e investigaciones varias (v. gr.
complementar con grupos de discusión, P2P, IRC); a la par que conocer los detalles
diferenciadores de cada fase y saber explotarlos.
Hay una serie de cuestiones que debemos plantearnos durante una búsqueda de
recursos: definir la necesidad de información, seleccionar las fuentes de información,
crear la estrategia de búsqueda: v. gr. comenzar escribiendo una frase que resuma lo que
queremos buscar, establecer relaciones lógicas utilizando operadores; y la adecuación o
feedback si los resultados son muchos, v. gr. añadir más conceptos utilizando AND,
eliminar términos genéricos, eliminar truncamientos, buscar en campos específicos o
delimitar con descriptores, fechas, tipología etc.; si los resultados relevantes son pocos
v. gr. eliminado términos introducidos por AND utilizando sólo el más importante,
añadiendo palabras clave utilizando el operador OR, usando los truncamientos,
buscando en todos los campos como búsqueda libre si la base de datos nos lo permite; y
si los resultados relevantes son muchos, v. gr. añadiendo más conceptos usando AND,
eliminando términos genéricos que aporten demasiados resultados, eliminado
truncamientos, buscando en campos específicos o delimitando con descriptores.
Lo importante es definir una buena estrategia de búsqueda y saber desenvolvernos con
soltura utilizando las diversas herramientas y estrategias a nuestro alcance, y para ello se
hace imprescindible conocer la existencia y posibilidades, las ventajas e inconvenientes,
de cada herramienta.
Notas
[1] Cordón García, José Antonio. Manual de investigación bibliográfica y documental.
Teoría y práctica, p. 46-60.
[2] Por ejemplo buscar la noticia en distintos periódicos.
[3]Fuente: Merlo Vega y elaboración propia.
[4] Fuente: Merlo Vega y elaboración propia.
[5] Fuente: Elaboración propia.
[6] Fuente: Merlo Vega y elaboración propia.
[7] Fuente: Elaboración propia
[8] Fuente: Elaboración propia
[9] Fuente: Elaboración propia.
13
[10] Fuente: Merlo Vega y elaboración propia.
[11] Cfr. Cordón García, José Antonio, op. cit. , pp. 63-68.
[12] Fuentes i Pujol, Mª Eulalia, La información en Internet, pp. 83-87.
[13] Una recuperación con ruido es aquella en la que se suministra al usuario
documentos que no responden exactamente a su solicitud. Es una falta de precisión en la
recuperación. En cambio una recuperación con silencio es aquella en la que se dejan de
suministar al usuario algunos documentos que se refieren explícitamente a su solicitud,
o sea que se produce una falta de exhaustividad en el momento de proporcionar los
documentos.
[14] Para mayor información, Montes Hernández, Agustín. “Las posibilidades de los
buscadores”; en El profesional de la información, pp. 12-13.
[15] Cfr. Montes Hernández, Agustín. “Las posibilidades de los buscadores”; en El
profesional de la información, p. 11.
[16] Ibidem, p. 80.
[17] Cfr. Luis Lizasoain, Base de datos en CD-Rom, pp. 89-112. En estas páginas
aborda las cuestiones generales sobre recuperación de la información, estructura de las
bases de datos, y métodos y técnicas de interrogación. Es en este último apartado donde
estudia los operadores boléanos, operadores de expansión, operadores de intervalo,
operadores de proximidad o distancia, operadores de cualificación, y operadores de
encadenamiento.
[18] En noviembre de 2001, la cifra de servidores activos era de 36.458.394, con la
existencia de unas 1.600 millones de páginas Web. Cfr. Diario El Mundo, Las páginas
Web celebran su décimo cumpleaños, p. 36. Los datos de How Much Information?
2003 <http://www.sims.berkeley.edu/research/projects/how-much-info-2003/> elevan la
cifra a cerca de 45.000.000 servidores.
[19] Lackerbauer, Ingo. Todo sobre Internet, pp. 58-59.
[20] La idea de un Portal es facilitar al usuario la navegación por Internet, además de
mostrarle publicidad, ofertas, motores de búsqueda, información, o cualquier artículo
que crean que puede interesar. Ofrecen la gran mayoría cuentas de correo gratuitas.
[21] Codina Bonilla, L. “Cómo funcionan los servicios de búsqueda en Internet: un
informe especial para navegantes y creadores de información. Parte II”; en Information
World en español, p. 24.
[22] Cfr. Hipola, Pedro; Vargas-Quesada, Benjamín; Montes, Agustín. “Descripción y
evaluación de agentes multibuscadores”; en El profesional de la información, pp. 15-24.
[23] Véase Marcos Mora, Mari Carmen. “Copernic”; en El profesional de la
información, pp. 29-34.
14
[24] Aunque se pueden configurar varias búsquedas a la vez, Subject Search Spider las
atenderá de una en una.
[25] Cfr. Cordón García, José Antonio, op. cit. , p. 86.
[26] Cfr. Cfr. Luis Lizasoain, Base de datos en CD-Rom, pp. 221-234.
[27] Cfr. Cordón García, José Antonio, op. cit. , pp. 69-72.
Referencias bibliográficas
BALAY, R. Guide to Referente Books. 11ª ed., Chicago: Ala, 1996.
CARRIZO SAINERO, Gloria. La información en Ciencias Sociales. Gijón: Trea, 2000.
CODINA BONILLA, L. Cómo funcionan los servicios de búsqueda en Internet: un
informe especial para navegantes y creadores de información. Parte I. Information
World en español. 1997, 6(5), 22-27.
CODINA BONILLA, L. Cómo funcionan los servicios de búsqueda en Internet: un
informe especial para navegantes y creadores de información. Parte II. Information
World en español. 1997, 6(6), 18-27.
CORDÓN GARCÍA, José Antonio; López Lucas, Jesús; Vázquez Pulido, José Raul.
Manual de investigación bibliográfica y documental. Madrid: Pirámide, 2001.
FUENTES i PUJOL, Mª Eulalia. La información en Internet. Barcelona: CIMS, 1997.
GARZA MERCADO, A. Fuentes de información en Ciencias Sociales y Humanidades.
México: El Colegio de México, 1999-.
HERRON, NANCY (et al.). The Social sciences: a cross disciplinary guide to selected
sources. 3rd edition. Englewood: Libraries Unlimited, 2002.
HIPOLA, Pedro; VARGAS-QUESADA, Benjamín; MONTES, Agustín. Descripción y
evaluación de agentes multibuscadores. El profesional de la información. 1999, v.8,
n.11, 15-24.
LACKERBAUER, Ingo. Todo sobre Internet. Barcelona: Marcorbo, 2000
LIZASOAIN, Luis. Bases de datos en CD-ROM. Madrid: Paraninfo, 1992.
MALDONADO MARTÍNEZ, Á. (coord.). La información especializada en Internet.
Directorio de Recursos de interés académico y profesional. Madrid: CINDOC, 2001.
MARCOS MORA, Mari Carmen. Diversos modos de acceso a catálogos en línea a
través de Internet. El profesional de la información. 1999, v.8, n.1-2, 7-13.
15
MARCOS MORA, Mari Carmen. Copernic. El profesional de la información. 2001,
v.10, n.10, 29-34.
MERLO VEGA, José Antonio. Apuntes de curso académico inéditos. Facultad de
Documentación, Universidad de Salamanca, 2003.
MONTES HERNÁNDEZ, Agustín. Las posibilidades de los buscadores. El profesional
de la información. 1999, v.8, n.3, 8-14.
SWEETLAND, J. H. Fundamental Referente Sources. 3rd ed. Chicago: ALA, 2001.
ROMANOS DE TIRATEL, S. Guía de fuentes especializadas: Humanidades y
Ciencias Sociales. Buenos Aires: EB Publicaciones, 2000.
TORRES RAMÍREZ, I. de (ed.). Las fuentes de información: estudios teóricoprácticos. Madrid: Síntesis, 1998.
WALFORD'S. Walford`s guide to referente material. London: Library Association,
1994-1997.
Recursos electrónicos
BERKELEY UC. University of California. How much information 2003 [En línea].
Berkeley: Universidad de California, 2003.
<http://www.sims.berkeley.edu/research/projects/how-much-info-2003/>. [Consulta: 25
de febrero 2006].
RECERK. Proyecto RecerK.com (2000-). [En línea].
<http://es.groups.yahoo.com/group/recerk/messages>. [Consulta: 25 de febrero 2006].
© Copyright José Martín Brocos Fernández y Carlos Ortiz de Landázuri, 2006.
© Copyright Ar@cne, 2006.
Ficha bibliográfica:
BROCOS FERNÁNDEZ, José Martín; ORTÍZ DE LANDÁZURI. , Carlos. Métodos de
búsqueda en fuentes de información en ciencias sociales y humanidades. Ar@cne.
Revista electrónica de recursos en Internet sobre Geografía y Ciencias Sociales. [En
línea]. Barcelona: Universidad de Barcelona, nº 83, 1 de mayo de 2006.
<http://www.ub.es/geocrit/aracne/aracne-083.htm>.
16
Descargar