Las mejores herramientas

Anuncio
Las mejores herramientas
E
xisten diferentes tipos de herramientas de búsqueda de información en Internet. Cada una
de ellas funciona de una manera diferente y tiene su propio propósito y su alcance. Aquí nos
referiremos a: buscadores, metabuscadores, directorios, guías y software
especializado.
 Buscadores:
Los buscadores o motores de búsqueda utilizan tipos de software especiales que localizan e
indexan, en forma automática, las páginas Web y además todos los documentos referenciados en
ellas.
Un buscador está compuesto por cuatro componentes básicos:




un robot,
un motor de indexación,
los índices
un motor de búsqueda.
El robot, también llamado spider, es un programa que se encarga de recorrer la Web obteniendo
información relevante, de cada una de las páginas que visita.
Una vez obtenida la información de la página, debe ser analizada y condensada, para su organización
y su posterior presentación a los usuarios. Esta tarea la realiza el denominado motor de indexación.
La indexación puede efectuarse por palabras claves, que es la forma más común, o por
conceptos. En el caso de hacerlo por palabras claves, algunos buscadores indexan todo el texto del
documento, a excepción de los artículos, preposiciones y otros términos denominados “palabras
vacías”.
Otros motores de búsqueda se limitan a incluir en la indexación a las palabras que más se repiten,
o priorizan los términos que se encuentran en el título, la URL, las cabeceras, los enlaces, los
primeros párrafos y además, las palabras claves incluidas en las etiquetas o tags.
Para facilitar la búsqueda, en la información recolectada, se utilizan estructuras de datos
denominadas "índices o ficheros inversos", mediante los cuales se asocia una palabra a una lista de
documentos relacionados con ella.
El motor de búsqueda es el encargado de procesar las consultas recibidas por los usuarios, para lo
cual recorre los índices inversos buscando los términos relacionados con la consulta y obteniendo
los identificadores de los documentos. Finalmente los ordena jerárquicamente y presenta al usuario
los resultados obtenidos.
Este tipo de herramienta, realiza sus búsquedas en sus propios índices, no lo hace directamente
sobre la Web. Esto implica, que los buscadores, solo pueden recuperar una muy pequeña parte
de todo lo que realmente hay en Internet.
Es importante señalar que los motores de búsqueda se diferencian entre sí por diferentes
características como: el volumen y la frecuencia de indexación y el ordenamiento que hacen de la
información encontrada para su presentación.
Entre los buscadores más importantes se encuentran:
 Google (http://www.google.com.ar): el más utilizado.
 Lycos (http://www.lycos.com/): un portal web que
incluye un buscador que surgió como un proyecto de desarrollo de un motor de búsqueda.
 Bing (http://www.bing.com/): anteriormente Live Search, Windows Live Search y MSN
Search, es un buscador Web de Microsoft.
Otros buscadores:
 DuckduckGo (https://duckduckgo.com/): un motor de búsqueda establecido en Valley
Forge, Pensilvania, USA, que utiliza la información de sitios de origen público con el
objetivo de aumentar los resultados tradicionales y mejorar la relevancia. Se promociona
como un motor de búsqueda con mucha privacidad (no almacena nuestros datos de
registro) y que nos muestra los mejores resultados descartando todo el spam y el ruido
informativo.
 Yahoo buscador (https://es.search.yahoo.com/)
Actividad sugerida:
Realiza la misma búsqueda en los distintos buscadores sugeridos y compara los resultados
obtenidos.

Metabuscadores
Los metabuscadores son “buscadores en buscadores”, es decir, son servidores web que
realizan búsquedas en los índices de un gran número de buscadores y/o directorios,
eliminan las duplicaciones y nos presentan un resumen de los resultados obtenidos,
ordenados por relevancia y, en algunos casos, nos indican cuál ha sido el buscador de origen
de dicha información. Cada uno de los motores de búsqueda de los metabuscadores
funciona de una manera distinta, aunque existe un proceso interno común a todos ellos.
Los pasos en el funcionamiento de un metabuscador son los siguientes:
 El usuario realiza su petición al metabuscador.
 El metabuscador da formato a dicha petición de
acuerdo a la interfaz de cada uno de los buscadores y les
pasa la solicitud.
 Los buscadores realizan la búsqueda utilizando sus
medios habituales a partir de los sitios web en Internet.
 Éstos devuelven la información obtenida al
metabuscador, el cual analiza los datos.
 El metabuscador organiza la información de
acuerdo a los criterios del mismo y se la muestra al
usuario.
Podría decirse entonces que el metabuscador aporta resultados seleccionados y ordenados
mediante puntos de vista distintos y su ventaja principal es que amplía el ámbito de las búsquedas
que realizamos.
Tengamos en cuenta que cada buscador utiliza su propia estrategia a la hora de recoger la
información y ordenar los resultados de las búsquedas, por lo que las páginas de mayor relevancia
en un buscador no tienen por qué coincidir con las del resto.
Entre los metabuscadores más importantes se encuentran:
 Metacrawler (http://www.metacrawler.com/) /
Zoo (http://www.zoo.com/)
Metacrawler fue uno de los primeros metabuscadores disponibles
para los usuarios. La empresa denominada Go2Net dueña de su
franquicia fue comprada por InfoSpace o Blucora y desde marzo
redirecciona a http://www.zoo.com/(nuevo nombre e imagen del
metabuscador).
Pero si se siente nostalgia todavía es posible acceder al original en el
Reino Unido:
http://www.metacrawler.co.uk/
 iBoogie (http://www.iboogie.com/)
Realiza búsquedas organizadas en “cluster” (conjuntos o conglomerados de ordenadores
unidos entre sí normalmente por una red de alta velocidad y que se comportan como si
fuesen una única computadora) y tiene un motor muy potente. Además, permite añadir
pestañas solicitando buscar en bases de datos concretas que tienen a disposición del
usuario y posee una búsqueda avanzada (http://iboogie.com/advanced_web.asp)
 Ixquick (http://www.ixquick.com/esp/)
El primer metabuscador que se ocupó de proteger la privacidad de los usuarios sin
registrar su proceso de búsqueda y su dirección de IP.
 Dogpile (http://www.dogpile.com/)
Es un metabuscador que retorna las búsquedas desde los motores About, Ask.com,
FinWhat, Google, LookSmart, MSN Search, Teoma, Yahoo!, Bing y otros buscadores
populares, incluyendo de audio y video.
Actividad sugerida:
Realiza la misma búsqueda en los distintos metabuscadores sugeridos y compara los
resultados obtenidos.
 Directorios
Los directorios, también denominados buscadores temáticos, organizan la información por medio
de categorías y sub-categorías que registran las direcciones (URL) y una pequeña descripción de
los diferentes sitios que han sido indexados.
Son organizados en forma manual a partir del registro de sitios por parte de sus autores, y de un
proceso posterior de selección y categorización jerarquizada por parte de los editores.
Entre los directorios más importantes se encuentran:
 Yahoo (http://ar.search.yahoo.com/)
El equipo de Yahoo! se encargan de visitar, analizar y evaluar los
sitios web y organizarlos según su contenido en categorías y/o
subcategorías, como por ejemplo Educación y Formación, Salud,
Gastronomía, Viajes, etc... como si de una gran biblioteca virtual se
tratase.
Las categorías del Directorio van de lo general a lo más específico.
 DMOZ (http://www.dmoz.org/World/Español/)
El Open Directory Project (ODP), también conocido como DMoz (por directory.mozilla.org su
nombre de dominio original) es un proyecto colaborativo multilingüe, en el que editores
voluntarios listan y categorizan enlaces a páginas web.
Cualquier persona puede sugerir un enlace en una categoría determinada, que luego ha de ser
aprobada por un editor
El proyecto está dividido en varias ramas según el idioma, y las categorías de páginas se organizan
jerárquicamente dentro de cada una de las ramas.
 Portal SEO (http://www.portal-seo.com/directorio- web.php)
Dedicado al SEO (Search Engine Optimization) es decir al posicionamiento en buscadores u
optimización en motores de búsqueda, un proceso que busca mejorar la visibilidad de un
sitio web en los resultados orgánicos de los diferentes buscadores.
 Excite (http://www.excite.com/)
Es una colección de sitios y servicios web, lanzado en diciembre de 1995. Ofrece una gran variedad
de contenido, incluyendo un portal de Internet que muestra noticias y el tiempo, etc., incluye
además un motor de búsqueda, un servicio de correo electrónico basado en la web, mensajería
instantánea, cotizaciones de bolsa, y una página de inicio personalizable por el usuario.
Muchos buscadores incluyen además un sistema de navegación en forma de directorio y por otra
parte, algunos directorios complementan sus resultados con los de una búsqueda en un
buscador. Pero es importante realizar una distinción entre estos dos tipos de herramientas de
búsqueda de información, ya que, se organizan y funcionan de diferente manera.
Actividad sugerida:
Realiza búsquedas temáticas empleando diferentes directorios.
 Guías
Las guías temáticas están conformadas por páginas de recursos web organizadas por áreas del
dominio de diversos especialistas y entidades académicas que asumen la tarea de elaborarlas.
Por lo general incluyen algún mecanismo de búsqueda en sus páginas o en el sitio en general.
Estos directorios anotados suelen ser de gran calidad ya que la selección de recursos, es muy
cuidadosa y su actualización, frecuente.
Visualiza la siguiente presentación para ampliar la
información:
Guías temáticas
http://goo.gl/8tDn1i
Algunas guías son desarrolladas por Universidades y Bibliotecas, como por ejemplo:
 Universidad de Almería. Biblioteca Nicolás Salmerón: Guías Temáticas
http://goo.gl/F4AlNa
"Las guías temáticas recogen los recursos de información disponibles en la Biblioteca
agrupados en diferentes categorías: bases de datos, revistas electrónicas, revistas en papel,
libros impresos, e-books, tesis y proyectos."
 Universidad Carlos III de Madrid. Biblioteca: Guías de recursos
http://goo.gl/vht1rP
"En estas guías encontrarás fuentes y recursos de información, tanto de la Biblioteca como
una selección de recursos externos de interés."
 Universidad de Sevilla. Biblioteca. Guías: Herramientas y guías para encontrar y gestionar
la información: Guías de la BUS
http://goo.gl/nSt3JJ
"...podrás encontrar consejos para elaborar trabajos académicos, estrategias y formas de
localizar libros, patentes, películas..., recursos de información clasificados por temas,
instrucciones para el manejo de gestores bibliográficos, y mucho más."
 Universidad de Alicante. Biblioteca: Guías temáticas
http://goo.gl/OyScXJ
 En ciertas ocasiones, varias instituciones se asocian para la elaboración cooperativa de
estas guías.
Un ejemplo es la “Biblioteca Virtual WWW” (The WWW Virtual Library) http://vlib.org/
Actividad sugerida:
Realiza búsquedas en algunas de las guías sugeridas.
 Software especializado
Para mejorar las búsquedas en la Web puede utilizarse software especializado.
Estos agentes auxiliares se instalan en nuestra PC y operan junto a los navegadores añadiéndoles
ciertas funcionalidades, como el manejo de conceptos para la recuperación de la información.
Un agente de búsqueda es un programa que, imitando el comportamiento de una persona y
actuando de forma autónoma, recorre automáticamente internet aprovechando la estructura de
enlaces de la web. Un agente de búsqueda puede recuperar un documento en particular, o utilizar
algún algoritmo de búsqueda que permita recuperar distintos documentos de la web a los que se
hace referencia en un documento fuente u origen, o conforme a unos criterios predefinidos
anteriormente por sus usuarios.
Un agente de búsqueda puede realizar diversas funciones como:
-
Realizar consultas con una velocidad y en un conjunto de fuentes mucho mayor que el
posible para un usuario humano.
Informar de las actualizaciones que se producen en los sitios web que son de interés.
Agilizar las descargas que se realizan de internet.
Eliminación de correo basura o spam
Búsqueda de noticias conforme a las preferencias.
Un ejemplo es “Copernic Agent”, una herramienta realmente útil que permite la búsqueda
selectiva en múltiples fuentes y la clasificación mediante potentes herramientas de análisis.
Que si bien aún está disponible para su descarga, ya no brinda soporte a los usuarios desde su
sitio.
Descargar