Martinelli, Laura

Anuncio
Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información
Laura Martinelli
Motores de búsqueda
Resumen
Este trabajo tiene por objetivo investigar sobre el funcionamiento de los motores de búsqueda y realizar un
relevamiento de los más importantes.
Introdución
Los motores de búsqueda son herramientas que ayudan a realizar búsquedas de información de una manera
sencilla y rápida con cierto grado de confiabilidad.
Motores - Directorios
Las herramientas de búsqueda denominadas genéricamente como buscadores se han desarrollado para hacer
posible la recuperación y localización de la información. Se pueden clasificar en dos grandes categorías:
●
Los índices o directorios: son listados de recursos organizados en categorías temáticas. Estas se
organizan jerárquicamente en un árbol desde los categorías principales, que a su vez se van
subdividiendo en otras categorías más específicas hasta llegar a los listados de recursos.
La sistematización de la información se da en forma manual. Los propios Webmasters o los
responsables de los mismos son los que indizan manualmente y guardan los documentos bajo alguna
de las categorías establecidas. Las categorías presentan un listado de enlaces a las páginas
referenciadas del buscador. La mayoría de los índices permiten el acceso a la información
descendiendo por las distintas ramas temáticas hasta llegar al enlace que contiene la información
requerida, o buscando por palabras claves del texto.
●
Los motores de búsqueda: es una herramienta que permite extraer de los documentos las palabras o
términos que mejor lo representen. Estas serán almacenadas en un índice (fichero inverso), y sobre él
se hará la consulta. Lo que en realidad hace un motor de búsqueda es crear una base de datos con las
palabras que almacena en el índice. Así, cuando realizamos una búsqueda, por ejemplo en Altavista o
Google, lo que estamos haciendo es utilizar una base de datos alojada en un servidor.
Sólo recibirán el nombre de motores aquellas herramientas capaces de revisar millones de documentos
en pocos segundos. Para que la búsqueda sea rápida es necesario que el archivo sobre el cual la
vamos a efectuar esté estructurado en forma inteligente, en función de los distintos tipos de algoritmos
de búsqueda. Estos no son públicos, por lo que genera diferentes resultados. Ni los lectores ni los
autores de los documentos disponen de un procedimiento que permita alterar la forma en la operan, por
lo cual no es posible diseñar las páginas o la estructura de un sitio para que se vea mejor reflejada en
un catálogo o en una respuesta a una búsqueda.
La sistematización de la información se realiza automáticamente. Un motor de búsqueda cuenta con un
módulo Crawler (programa) que realiza la recogida de páginas, también denominado Robot, que
recorre la red de forma automática explorando los servidores Web al nivel que le corresponde. Puede
ser a nivel mundial, o en el ámbito de la especialización del buscador (geográfico, idiomático, temático).
El Crawler extrae URLs que aparecen en las páginas bajadas. Esta información es pasada al módulo de
control del Crawler y al repositor de páginas. El primer módulo determina qué links visitar luego, y
cuáles ignorar. Mientras que el segundo se encarga de guardar las páginas . Algunas veces los motores
mantienen una caché de las páginas que visitan durante el tiempo necesario para construir el índice.
Algunos mantienen un número grande de páginas en archivos permanentes.
El módulo indexador extrae todas las palabras de cada página y registra la URL donde cada palabra
apareció. El resultado es generalmente una tabla muy grande donde están todos los URLs que apuntan
a las páginas donde figuraba esa palabra. El módulo Utility index es creado por el módulo de análisis de
colección que es responsable de crear una variedad de otros índices. El utility index puede proveer
file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (1 of 11) [10/11/2001 10:09:18 AM]
Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información
acceso a páginas de un largo determinado, páginas de cierta importancia o páginas con algún número
de imágenes.
El módulo de consultas es responsable de recibir los pedidos de los usuarios, cuenta con los índices y
el repositor de páginas.
El módulo
ranking tiene la tarea de presentar los resultados en forma ordenada.
"Existe un tipo TAG en HTML utilizado por los distintos motores de búsqueda(Search-Engines) para
clasificar información, este tag es denominado META "
Estos deben ser incluidos entre los TAGS HEAD de un documento. Actualmente, existen muchas
páginas que utilizan etiquetas META (TAG en HTML) que permiten agregar información a un
documento al momento de su confección. Se suele tratar de información documental que referencia el
contenido del documento a través de resúmenes y palabras clave. Estos tags no son obligatorios para
que la información sea clasificada por el motor, inclusive su utilización dependerá del diseño del robot o
"Web-Crawler", pero lo que es seguro es que cualquier robot bien diseñado utilizará esta información
para clasificar con mayor relevancia.
Si está pensando que colocando miles de palabras relevantes entre los tags meta de un documento, no
servirá, ya que prácticamente todos los motores de búsqueda utilizan un nivel de relevancia de tres
palabras.
file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (2 of 11) [10/11/2001 10:09:18 AM]
Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información
FAST= FAST, AV= AltaVista,
EX= Excite, NL= Northern Light,
GG= Google, INK= Inktomi,
Go= Go (Infoseek), LY= Lycos
.
Fuente: SearchEngineWatch.com
Los principales buscadores suelen incluir publicidad y, cada vez más, una gran cantidad de recursos de
valor añadido, como: la búsqueda de direcciones de correo, de artículos de news, chats, acceso a sitios
de venta, a información meteorológica, links a prensa electrónica, a otros buscadores, servicio de
traducción automática de páginas, de localización de imágenes o ficheros audio, y acceso a las últimas
noticias. Esto los convierte en portales Internet. Algunos buscadores como Yahoo en inglés o El
Buscador permiten personalizar la interfaz de cada usuario según sus propias preferencias. De esta
forma el usuario puede crearse portales a medida.
Principales Motores de Búsqueda
Yahoo es uno de los más antiguos y populares "buscadores. Una primera forma de usarlo consiste en
conectarse (http://www.yahoo.com/). Otra forma de consultar Yahoo consiste en buscar una palabra clave que
aparezcan en el nombre de de una categoría o en los recursos que se están buscando. Yahoo destaca las
nuevas incorporaciones con un icono especial (New), lo mismo que los sitios más visitados.
Incluye Páginas Web y recursos de todo el mundo en una "guía jerárquica universal". Las incorpora en una de
la categorías existentes, y publica en el catálogo general un resumen de su contenido. El árbol está
organizado en más de 20000 categorías. Los punteros finales son enlaces a recursos de Internet como:
grupos de noticias Usenet, sitios FTP, además de páginas Web. Yahoo no almacena las páginas sino que
mantiene los links Html correspondientes.
Cataloga de forma arbitraria los FAQ y los recursos que contienen índices.Si una categoría tiene el signo @ en
su nombre significa que es un alias cuya referencia aparece en diversos sitios en yahoo.
AltaVista es un servicio creado por Digital (ahora Compaq), que mantiene una enorme base de datos (más
de 40GB, en constante crecimiento) a partir de un sistema que visita y registra en forma automática todas las
páginas web publicadas en el mundo así como los newsgroups. Y es altamente confiable ya que se borran
automáticamente los links a páginas que se dejaron de publicar por varios días.
Aunque la recogida de datos, como ya se mencionó, es realizada en forma automática por medio de un robot,
file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (3 of 11) [10/11/2001 10:09:18 AM]
Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información
ofrece la posibilidad de dar de alta un documento mediante un formulario en el que sólo se coloca la URL.
(posteriormente el robot extraerá los datos que considere adecuados).
Alta Vista es capaz de reconocer etiquetas META y extraer la información que contienen.Para buscar algo,
basta tipear una frase. Lo que hace el sistema es buscar en su índice las páginas que contienen esas palabras
y mostrarlas según un orden de aciertos relativoas a la frase de búsqueda. Obviamente pueden aparecer
documentos que la contengan por casualidad y no como tema central. Para aprovechar AltaVista hay que
personalizar las búsquedas. Se permite especificar parámetros que permiten acotar y delimitar los recursos
que se encuentren.
Lo que se escriba entre comillas en la frase de búsqueda será considerado como una unidad indivisible.
● Se pueden diferenciar mayúsculas y minúsculas.
●
●
●
●
Si se pone un signo + ante una palabra, se exige que aparezca en la respuesta.
Si se pone un signo - ante una palabra, se eliminarán los documentos que la contengan.
Se puede usar el signo * para indicar que se acepte cualquier terminación de una palabra de la cual
sólo se escribe la raiz seguida del * (pegado).
(Si no se usan las comillas o el signo +, se pueden obtener respuestas que contengan sólo una o
algunas de las palabras mencionadas en la frase de búsqueda).
Se ofrece además un sistema búsqueda avanzada, que admite operadores lógicos (AND y OR), operadores
de proximidad (near), límites de fechas y de distancia entre palabras, etc.
● Permite la búsqueda por link.
●
●
●
●
●
●
●
Ofrece la posibilidad de hacer una segunda selección entre las páginas recuperadas.
Permite buscar en Web y Usenet. La red de los grupos de noticias contiene información más
actualizada que la Web, ya que es todo texto y actualizada a diario.
Truncamientos
Permite búsqueda simple y avanzada.
No permite limitar el número de documentos limitados
No dispone de clasificación temática.
Presentación de resultados:
Ordena los documentos por relevancia. (en el formulario simple el orden lo establece el propio sistema,
mientras que en el avanzado lo decide el usuario utilizando la opción Ranking que permite que se
escoja el término que deben contener las páginas para que se presenten en primera instancia).
●
Ofrece resumen. (en el caso de que el documento no tenga etiquetas meta, ofrece las primeras
palabras del mismo).
●
No se puede diseñar el formato de presentación.
●
Datos interesantes:
La ayuda es muy buena ya que ejemplifica la forma de realizar consultas y la aplicación de los criterios
de relevancia para la presentación de la información.
●
●
●
Frecuencia de actualización diaria.
Tiempo de respuesta medio.
Accesibilidad alta.
Buscadores en España
¡Olé! se hizo rápidamente de mercado por su nombre sencillo, por su facilidad de uso, por su gran base de
datos. Es en España lo que Yahoo en el resto del mundo.
file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (4 of 11) [10/11/2001 10:09:18 AM]
Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información
Permite la búsqueda a lo largo de un amplio árbol temático (16 categorías) y también por palabras claves.
● Permite utilizar los operadores lógicos "y" y "o".
● Busca en la descripción, en los URLs, en el título, en las palabras claves.
● Entiende por defecto las palabras claves como cadenas de caracteres, pero si se quiere las puede
entender como palabras completas.
●
●
●
Se puede buscar por la zona de influencia, el sector, o ver si se trata de noticias.
Permite buscar en castellano, catalán, euskera, gallego, bable, portugués.
Se pueden restringir las búsquedas por tipo de servicio y por país de origen y delimitar la antigüedad de
las ocurrencias encontradas y su número por página.
●
Tanto las búsquedas como el servicio de salto aleatorio (Olé Hoop) y la muestra del árbol de sectores
se hacen partiendo de la categoría en la que se encuentre el navegante.
●
El servicio "Mundo Olé" ofrece distintos temas de ocio como cine, motor, informática, humor, etc. y un
apartado de servicios donde incluye el OleChat, InfoMail, etc.
●
Las noticias se dividen en categorías, incluyen los temas de actualidad, y se puede revisar la
información ocurrida con anterioridad mediante un Historial.
Ozú es un índice español clásico. Resulta práctico y sencillo de usar, y cuenta con una amplia base de datos.
●
Resulta útil la búsqueda por comunidades autónomas, accediendo a direcciones que contenga
información de la comunidad que sea de nuestro interés. En ellas se repite el esquema de categoría
inicial. Se puede buscar por título, URL, dirección de correo electrónico, y por contenido.
●
Soporta las búsquedas de cadenas de caracteres entre comillas , operadores booleanos "o" e "y" ,
búsquedas relacionales (relacionando lo que se busca y encuentra con la categoria(s) en la que se
sitúa) y por orden alfabético.
●
Un programa comprueba diariamente si las direcciones que almacena continúan activas (se espera 2
meses). De esta forma se garantiza una mayor actualización de los enlaces.
●
Servicios añadidos:
Bolsa de trabajo
Anuncios clasificados de compra y venta
"Congresos" - sección que informa sobre cualquier evento que se produzca en España en este sentido.
Chat
Noticias On-Line, dividido por categorías y un enlace a su página de Webs favoritas
Dirección de correo en forma gratuita.
●
●
●
●
●
●
Elcano es uno de los más viejos (1995). Su base de datos es menor que la de los anteriores. Su interfaz y
organización es más simple aunque parecida.
● No admite búsqueda por operadores booleanos.
●
Las búsquedas se pueden realizar por categorías y por eltipo de propietario de la página (personal,
gobierno, empresas).
●
Presenta 2 grandes categorías: área de interés y profesionales o colectivos. En la segunda hay
subcategorías desde abogados hasta radioaficionados, fans, médicos,etc.
●
Se puede filtrar por idioma (contempla además del castellano, inglés, francés e italiano, catalán,
eureska y gallego)
●
Se pueden deshabilitar todos los filtros
file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (5 of 11) [10/11/2001 10:09:18 AM]
Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información
Forma de presentar los resultados:
● Valoración propia de la calidad de la página
● El tipo de información que contiene
● La fecha de alta en la base de datos
● El e-mail del responsable
● El nombre de quien la ha dado de alta.
Es especialmente útil para profesionales y colectivos que necesiten información sobre sus áreas de interés.
AltaVista Magallanes es la versión española del Alta Vista.Cuenta con una base de datos grandísima, con
un altísimo número de páginas indezadas. Si no se sabe acotar la búsqueda devolverá miles de recursos, por
eso cuenta con el más completo sistema de operadores (el mismo que Alta Vista).
● Permite buscar por palabras exactas
●
Permite utilizar operadores booleanos como: AND, OR, NOT Y NEAR.
●
Delimitación de la fecha de publicación o modificación
Permite el uso de palabras especiales, comodines
Permite filtrar las búsquedas realizadas.
Incorpora un listado sobre servicios de interés y noticias sobre la actualidad.
●
●
●
Donde? es una de las mejores base de datos sobre recursos españoles. La recolección de datos se hace de
forma manual en base a un formulario donde se completan los siguientes datos: URL, título, tipo de recurso,
datos institucionales, descripción del contenido, localización geográfica, persona, e-mail del responsable.
El sistema no es capaz de reconocer etiquetas Meta.
Sistema de búsqueda:
● Las consultas se realizan por medio de un formulario o a través de un mapa de España que recoge los
recursos agrupados por comunidades autónomas. La información del resto del mundo la clasifica como
"ciberespacio"
●
●
●
●
●
Acepta operadores booleanos: and, or
Permite truncamientos
Búsquedas avanzadas acotando por: título, URL, descripción, organización responsable, localidad y
comunidad autónoma.
El uso de comillas permite la utilización de términos compuestos.
Búsqueda en Web
Presentación de resultados.
● Permite elegir entre un formato de salida reducido y otro más completo.
● Ofrece resumen
● El ordenamiento está dado por la relevancia
● La visualización está limitada a 100 registros
● Los recursos más recientes tienen una etiqueta que indica su novedad
● No dispone de una clasificación temática
file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (6 of 11) [10/11/2001 10:09:18 AM]
Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información
Datos de interés:
● El sistema de ayuda es bueno aunque no ejemplifica formas de busqueda ni criterios de relevancia para
el ordenamiento
●
Ofrece una sección "lo + nuevo" donde se agrupa lo último.
Historia del Google
Google! es el primer buscador que se sitúa en medio de los directorios y de los motores. Mantiene todas las
ventajas de un robot de búsqueda automática, pues consigue rastreos muy amplios, pero elimina el problema
de la información de baja calidad y atrasada. Este avance lo logra gracias a que Google! aplica como criterio
principal para ordenar los resultados el número de enlaces que se dirigen desde los millones de páginas
rastreadas hacia otras webs y no, como el resto de los buscadores automáticos, el número de veces que una
palabra clave se repite en una página. Esto, en definitiva, consigue que sean los propios usuarios de Internet,
mediante sus particulares selecciones de páginas favoritas en cada momento, quienes determinen el orden en
el que aparecerán los resultados al realizar una búsqueda en Google! En teoría, los resultados de este
buscador son siempre de calidad y actuales.
De nuevo es la comunidad de Internet quien ha comenzado a difundir las excelencias de este nuevo buscador.
Y quién sabe si de nuevo no se repetirá un éxito arrollador como el de Yahoo! que, cinco años después de su
aparición, se ha encaramado al primer puesto entre las empresas de Internet. De momento Google! no exhibe
ni un solo anuncio. Seguro que esto no durará mucho.
Búsqueda específica en grupos de interés (news)
Para buscar lo que puede estar discutiendo públicamente la comunidad internacional acerca de una tema
particular, nada mejor que utilizar un sistema de búsqueda por palabras (o frases) que tenga como foco todos
los news de alcance internacional. Para ello, una buena alternativa es DejaNews. Es posible limitar la
búsqueda a alguna categoría predefinida, aplicar filtros, etc. a través de un menú que ofrece múltiples
posibilidades.
METABUSCADORES
La tarea de buscar no sólo implica saber cómo acotar la búsqueda sino también saber cuál es el motor más
conveniente en cada caso o combinar varios de ellos. La dificultad llegó a tal punto que se crearon sistemas de
meta-búsquedas que lo que hacen es consultar en varios motores en forma paralela. O sea, un metabuscador
es una página Web que busca la información solicitada en varios buscadores convencionales al mismo tiempo,
ahorrando así, tiempos de búsqueda de visitar y utilizar varios de ellos a la vez. En realidad, un metabuscador
no busca en sus propias bases de datos sino que lo que hace es acceder a las bases de datos de los motores.
Ofrecen detalles de las respuestas de cada uno de los servicios, o bien el listado completo de las
coincidencias. Es notable cómo la velocidad de algunas búsquedas es mayor que si se utilizase un buscador.
Generalmente no se obtiene toda la potencia de cada uno de los sistemas (ya que los formatos de consulta
son diferentes) pero puede ser un buen punto de partida para empezar una búsqueda a fondo. Su utilización
es recomendable.
Ventajas:
Interrogan varios motores a la vez
Desventajas
● Buenos sólo para términos sueltos
●
●
●
Gastan poco tiempo en cada base de datos
Descartan lógica de búsqueda completa
Intentar "acomodar" la misma cuestión a todos los buscadores
file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (7 of 11) [10/11/2001 10:09:18 AM]
Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información
●
No utilizan el motor de búsqueda Fast
Arquitectura de un metabuscador
Los usuarios pueden seleccionar bases de datos en los cuales quieren buscar información. Puede ser una o
más de las tres disponibles. Son:
1_ USGS
2_ EPA
3_ PUB SCIENE
El usuario puede especificar el número de documentos que quiere por cada Base de Datos como resultado.
Cada Base de Datos tiene sus propias reglas para las palabras claves. Por ej, algunas bases no soportan
"end" y "or". Si el usuario Ingresa palabras no soportadas el resultado no se mostrará. Información referente a
cuantas palabras pueden entrase y en que combinación , puede ser encontrada haciendo clic en el link de
ayuda.
Todas estas acciones se realizan el la página principal del motor llamada index.html.
Una vez que se ingresan las palabras claves para la búsqueda los datos son transferidos de una página a otra
con la ayuda de un shell scrip que es el inter.cgi. Este script es guardado en un archivo particular (Metafile.txt)
y conecta html con un programa java, en este caso, hace correr el MetaSearch.java tomando como argumento
los datos del archivo anterior. El MetaSearch.java lee los datos y los analiza para obtener la información
solicitada. Los datos consisten en información acerca la base de datos elegida, las palabras claves. Luego
llama a una función para reemplazar la palabra clave en la URL de la base de datos. Aquí se chequea si el
usuario pregunta con "and" o "or". Luego de que la URL cambió el thread es creado. Después se creará otro
thread para otra B. de D. hasta que busque en la última que se haya elegido. El programa llamado
MetasearchThread.java tiene las siguientes funciones: Run, Startconnection, GetPage, Get,Hits.
La función Run llama a la función Startconnection, quien a su vez llama a la función GetPage con la URL de la
base de datos pasada como argumento. Luego, la página obtenida es leída en un buffer y posteriormente se
guarda como string en una variable.
Después se llama a la función GetHits donde primero se chequea el nombre de la BD. Como cada BD tiene su
propio formato de salida, para que el resultado que arroje el metabuscador sea adecuada, se han escrito
programas separados para analizar las páginas y poder obtener los resultados en el formato establecido.
Los resultados son mostrados por cada BD seleccionada como páginas html.
El usuario tiene la facilidad de pedir más información haciendo click en el botón " more". En este caso, se
llama a inter.cgi y todo el proceso es repetido.
PRINCIPALES METABUSCADORES
MetaCrawler
Arquitectura: se encuentra diseñado en módulos.
● Interfaz de usuario es simplemente es la capa que traslada las consultas con las opciones elegidas a
los parámetros apropiados. Esto es lo que se envía al motor de agregación
●
Motor de agregación es el responsable de obtener las referencias iniciales de cada servicio, procesar
las referencias, eliminando duplicados y otorgar el resultado a la interfaz de usuario
●
Interfaz Web paralela es la responsable de bajar las páginas html de la Web, enviar consultas y recibir
los resultados de cada búsqueda realizada.
●
Harness recibe información de control que detalla qué referencias obtener.Le da formato a las consultas
y envía la referencia a la interfaz Web paralela, quien envía una página al módulo motor de agregación.
file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (8 of 11) [10/11/2001 10:09:19 AM]
Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información
Está implementado como una colección de módulos, donde cada uno representa un servicio en
particular; en cada módulo se puede agregar, modificar, remover sin que esto afecte al resto del
MetaCrawler.
Brinda resultados rápidos y precisos. Utiliza los motores más efectivos. Permite seleccionar entre búsquedas
rápidas o detalladas
Motores: Alta Vista, Excite , infoSeek, Lycos, WebCrawler, Yahoo!.
Velocidad: Muy rápido (más que buscar en varios de los motores).
Opciones de búsqueda:any, all, as a phrase.Resultados: Combina los resultados en una lista eliminando los
duplicados.
Inference Find busca en 6 motores y muestra una lista ordenada. Esto es útil si devuelve muchas
respuestas y se necesita ayuda para organizar la información. La ventaja del agrupamiento se debe en gran
parte a la ausencia de resúmenes. Recoge la búsqueda como se la ingresó sin realizar ningún cambio para
acordar los formatos de cada motor. El listado está basado más en el dominio de Internet que en la
información. Todo lo que ve del documento es el título, lo que no ayuda a la precisión.
Buscadores: WebCrawler, Lycos, Alta Vista, InfoSeek, Excite.
Velocidad: Rápido. Depende de cuánto tiempo espera en cada buscador.
file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (9 of 11) [10/11/2001 10:09:19 AM]
Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información
Opciones: Max Time determina cuánto debe esperar. Siete segundos es la opción por defecto.
Resultados. El formato de resultados es una lista de resultados seguida por una lista de títulos - no hay
descripciones de URL o de resultados. Además elimina los duplicados y los ordena otorgando una etiqueta
para cada grupo.
Dogpile es bueno si se busca mucha información o algo difícil de encontrar. Accede a más buscadores que
cualquier otro. Permite construir nuestra propia estrategias de búsqueda.
Opciones de búsqueda: Se puede elegir dónde buscar primero. The Web, Usenet, FTP.
Motores: busca en tres a la vez en el grupo seleccionado.
The Web: Yahoo, Lycos A2z, Excite Guide, World, Wibe Web Worm, WWW Yellow Pages, PlanetSearch,
What U Seek, Lycos, WebCrawler, InfoSeek, OpenText, Alta Vista, Excite & HotBot.
FTP: Filez, FTP Search and Snoopie!
Velocidad: Relativamente rápido para grupo. Los resultados se muestran en cuanto los recoge.
Resultados. Se presentan sin ningún formato tal como son recibidos del motor. Añade un botón para conseguir
más resultados si es necesario.
Búsqueda personalizada: El botón Custom Search te permite seleccionar qué motores usar y el orden de la
búsqueda.
Bibliografía
Proyect Report: Swathi chitteddi , " Meta Search Engine for NWRC", the center for advanced computer studies,
the university of Luisiana at lafayette.
Document: "Searching the Web" Arvind Arasu, Junghoo Cho, Hector Garcia-Molina, Andreas Paepcke, Sriram
Raghavan. Computer Science Department, Stanford University".
Document: "The MetaCrawler Architecture for Resiource Aggregation on the Web", Erik Selberg, Oren Etzioni,
Department of Computer science and Engineering, University of Washington.
Proceedings: "Architecture of a Metasearch Engine that Supports User Information Needs", Eric J. Glover1,2,
Steve Lawrence1 , William P. Birmingham2, C. Lee Giles1.
NEC Research Institute1_ Artificial Intelligence Laboratory2_
4 Independence Way University of Michigan
Princeton, NJ 08540 1101 Beal Avenue
Ann Arbor, MI 48109
Document: "Network Data Services", Professor Stan Zdonik
Contenido de metabuscadores
http://www.buscaya.com/metabuscadores/metab.htm
Aplicaciones de Internet: servicios de búsqueda en internet.
http://www.diatel.upm.es/~adasilva/trabajosTecnologiaWeb/Sistemas de busqueda - Raul
Abengozar/htdocs/indice2.htm
file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (10 of 11) [10/11/2001 10:09:19 AM]
Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información
Buscadores de información en Internet: directorios y motores de búsqueda
http://hipatia.uc3m.es/~jroble/documentac/buscar.htm
La revolución Google!
http://www.el-mundo.es/navegante/diario/99/abril/21/comunicacion.html
metabuscadores
http://members.es.tripod.de/iui/meta.htm#compo/
Web-Crawlers : Motores de Búsqueda (Search-Engine)
http://www.osmosislatina.com/aplicaciones/robots.htm
Cómo buscar información en Internet
http://www.servicom.es/enadasur/busqueda.htm
Estrategias de búsqueda en la internet
http://www.uprm.edu/socialsciences/manualprofesor/id77.htm
Estrategias de búsqueda
http://artesliberales.bc.inter.edu/jquintana/TodoWeb/Buscadores/Estrategias%20busqueda.htm
file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (11 of 11) [10/11/2001 10:09:19 AM]
Descargar