Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información Laura Martinelli Motores de búsqueda Resumen Este trabajo tiene por objetivo investigar sobre el funcionamiento de los motores de búsqueda y realizar un relevamiento de los más importantes. Introdución Los motores de búsqueda son herramientas que ayudan a realizar búsquedas de información de una manera sencilla y rápida con cierto grado de confiabilidad. Motores - Directorios Las herramientas de búsqueda denominadas genéricamente como buscadores se han desarrollado para hacer posible la recuperación y localización de la información. Se pueden clasificar en dos grandes categorías: ● Los índices o directorios: son listados de recursos organizados en categorías temáticas. Estas se organizan jerárquicamente en un árbol desde los categorías principales, que a su vez se van subdividiendo en otras categorías más específicas hasta llegar a los listados de recursos. La sistematización de la información se da en forma manual. Los propios Webmasters o los responsables de los mismos son los que indizan manualmente y guardan los documentos bajo alguna de las categorías establecidas. Las categorías presentan un listado de enlaces a las páginas referenciadas del buscador. La mayoría de los índices permiten el acceso a la información descendiendo por las distintas ramas temáticas hasta llegar al enlace que contiene la información requerida, o buscando por palabras claves del texto. ● Los motores de búsqueda: es una herramienta que permite extraer de los documentos las palabras o términos que mejor lo representen. Estas serán almacenadas en un índice (fichero inverso), y sobre él se hará la consulta. Lo que en realidad hace un motor de búsqueda es crear una base de datos con las palabras que almacena en el índice. Así, cuando realizamos una búsqueda, por ejemplo en Altavista o Google, lo que estamos haciendo es utilizar una base de datos alojada en un servidor. Sólo recibirán el nombre de motores aquellas herramientas capaces de revisar millones de documentos en pocos segundos. Para que la búsqueda sea rápida es necesario que el archivo sobre el cual la vamos a efectuar esté estructurado en forma inteligente, en función de los distintos tipos de algoritmos de búsqueda. Estos no son públicos, por lo que genera diferentes resultados. Ni los lectores ni los autores de los documentos disponen de un procedimiento que permita alterar la forma en la operan, por lo cual no es posible diseñar las páginas o la estructura de un sitio para que se vea mejor reflejada en un catálogo o en una respuesta a una búsqueda. La sistematización de la información se realiza automáticamente. Un motor de búsqueda cuenta con un módulo Crawler (programa) que realiza la recogida de páginas, también denominado Robot, que recorre la red de forma automática explorando los servidores Web al nivel que le corresponde. Puede ser a nivel mundial, o en el ámbito de la especialización del buscador (geográfico, idiomático, temático). El Crawler extrae URLs que aparecen en las páginas bajadas. Esta información es pasada al módulo de control del Crawler y al repositor de páginas. El primer módulo determina qué links visitar luego, y cuáles ignorar. Mientras que el segundo se encarga de guardar las páginas . Algunas veces los motores mantienen una caché de las páginas que visitan durante el tiempo necesario para construir el índice. Algunos mantienen un número grande de páginas en archivos permanentes. El módulo indexador extrae todas las palabras de cada página y registra la URL donde cada palabra apareció. El resultado es generalmente una tabla muy grande donde están todos los URLs que apuntan a las páginas donde figuraba esa palabra. El módulo Utility index es creado por el módulo de análisis de colección que es responsable de crear una variedad de otros índices. El utility index puede proveer file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (1 of 11) [10/11/2001 10:09:18 AM] Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información acceso a páginas de un largo determinado, páginas de cierta importancia o páginas con algún número de imágenes. El módulo de consultas es responsable de recibir los pedidos de los usuarios, cuenta con los índices y el repositor de páginas. El módulo ranking tiene la tarea de presentar los resultados en forma ordenada. "Existe un tipo TAG en HTML utilizado por los distintos motores de búsqueda(Search-Engines) para clasificar información, este tag es denominado META " Estos deben ser incluidos entre los TAGS HEAD de un documento. Actualmente, existen muchas páginas que utilizan etiquetas META (TAG en HTML) que permiten agregar información a un documento al momento de su confección. Se suele tratar de información documental que referencia el contenido del documento a través de resúmenes y palabras clave. Estos tags no son obligatorios para que la información sea clasificada por el motor, inclusive su utilización dependerá del diseño del robot o "Web-Crawler", pero lo que es seguro es que cualquier robot bien diseñado utilizará esta información para clasificar con mayor relevancia. Si está pensando que colocando miles de palabras relevantes entre los tags meta de un documento, no servirá, ya que prácticamente todos los motores de búsqueda utilizan un nivel de relevancia de tres palabras. file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (2 of 11) [10/11/2001 10:09:18 AM] Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información FAST= FAST, AV= AltaVista, EX= Excite, NL= Northern Light, GG= Google, INK= Inktomi, Go= Go (Infoseek), LY= Lycos . Fuente: SearchEngineWatch.com Los principales buscadores suelen incluir publicidad y, cada vez más, una gran cantidad de recursos de valor añadido, como: la búsqueda de direcciones de correo, de artículos de news, chats, acceso a sitios de venta, a información meteorológica, links a prensa electrónica, a otros buscadores, servicio de traducción automática de páginas, de localización de imágenes o ficheros audio, y acceso a las últimas noticias. Esto los convierte en portales Internet. Algunos buscadores como Yahoo en inglés o El Buscador permiten personalizar la interfaz de cada usuario según sus propias preferencias. De esta forma el usuario puede crearse portales a medida. Principales Motores de Búsqueda Yahoo es uno de los más antiguos y populares "buscadores. Una primera forma de usarlo consiste en conectarse (http://www.yahoo.com/). Otra forma de consultar Yahoo consiste en buscar una palabra clave que aparezcan en el nombre de de una categoría o en los recursos que se están buscando. Yahoo destaca las nuevas incorporaciones con un icono especial (New), lo mismo que los sitios más visitados. Incluye Páginas Web y recursos de todo el mundo en una "guía jerárquica universal". Las incorpora en una de la categorías existentes, y publica en el catálogo general un resumen de su contenido. El árbol está organizado en más de 20000 categorías. Los punteros finales son enlaces a recursos de Internet como: grupos de noticias Usenet, sitios FTP, además de páginas Web. Yahoo no almacena las páginas sino que mantiene los links Html correspondientes. Cataloga de forma arbitraria los FAQ y los recursos que contienen índices.Si una categoría tiene el signo @ en su nombre significa que es un alias cuya referencia aparece en diversos sitios en yahoo. AltaVista es un servicio creado por Digital (ahora Compaq), que mantiene una enorme base de datos (más de 40GB, en constante crecimiento) a partir de un sistema que visita y registra en forma automática todas las páginas web publicadas en el mundo así como los newsgroups. Y es altamente confiable ya que se borran automáticamente los links a páginas que se dejaron de publicar por varios días. Aunque la recogida de datos, como ya se mencionó, es realizada en forma automática por medio de un robot, file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (3 of 11) [10/11/2001 10:09:18 AM] Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información ofrece la posibilidad de dar de alta un documento mediante un formulario en el que sólo se coloca la URL. (posteriormente el robot extraerá los datos que considere adecuados). Alta Vista es capaz de reconocer etiquetas META y extraer la información que contienen.Para buscar algo, basta tipear una frase. Lo que hace el sistema es buscar en su índice las páginas que contienen esas palabras y mostrarlas según un orden de aciertos relativoas a la frase de búsqueda. Obviamente pueden aparecer documentos que la contengan por casualidad y no como tema central. Para aprovechar AltaVista hay que personalizar las búsquedas. Se permite especificar parámetros que permiten acotar y delimitar los recursos que se encuentren. Lo que se escriba entre comillas en la frase de búsqueda será considerado como una unidad indivisible. ● Se pueden diferenciar mayúsculas y minúsculas. ● ● ● ● Si se pone un signo + ante una palabra, se exige que aparezca en la respuesta. Si se pone un signo - ante una palabra, se eliminarán los documentos que la contengan. Se puede usar el signo * para indicar que se acepte cualquier terminación de una palabra de la cual sólo se escribe la raiz seguida del * (pegado). (Si no se usan las comillas o el signo +, se pueden obtener respuestas que contengan sólo una o algunas de las palabras mencionadas en la frase de búsqueda). Se ofrece además un sistema búsqueda avanzada, que admite operadores lógicos (AND y OR), operadores de proximidad (near), límites de fechas y de distancia entre palabras, etc. ● Permite la búsqueda por link. ● ● ● ● ● ● ● Ofrece la posibilidad de hacer una segunda selección entre las páginas recuperadas. Permite buscar en Web y Usenet. La red de los grupos de noticias contiene información más actualizada que la Web, ya que es todo texto y actualizada a diario. Truncamientos Permite búsqueda simple y avanzada. No permite limitar el número de documentos limitados No dispone de clasificación temática. Presentación de resultados: Ordena los documentos por relevancia. (en el formulario simple el orden lo establece el propio sistema, mientras que en el avanzado lo decide el usuario utilizando la opción Ranking que permite que se escoja el término que deben contener las páginas para que se presenten en primera instancia). ● Ofrece resumen. (en el caso de que el documento no tenga etiquetas meta, ofrece las primeras palabras del mismo). ● No se puede diseñar el formato de presentación. ● Datos interesantes: La ayuda es muy buena ya que ejemplifica la forma de realizar consultas y la aplicación de los criterios de relevancia para la presentación de la información. ● ● ● Frecuencia de actualización diaria. Tiempo de respuesta medio. Accesibilidad alta. Buscadores en España ¡Olé! se hizo rápidamente de mercado por su nombre sencillo, por su facilidad de uso, por su gran base de datos. Es en España lo que Yahoo en el resto del mundo. file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (4 of 11) [10/11/2001 10:09:18 AM] Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información Permite la búsqueda a lo largo de un amplio árbol temático (16 categorías) y también por palabras claves. ● Permite utilizar los operadores lógicos "y" y "o". ● Busca en la descripción, en los URLs, en el título, en las palabras claves. ● Entiende por defecto las palabras claves como cadenas de caracteres, pero si se quiere las puede entender como palabras completas. ● ● ● Se puede buscar por la zona de influencia, el sector, o ver si se trata de noticias. Permite buscar en castellano, catalán, euskera, gallego, bable, portugués. Se pueden restringir las búsquedas por tipo de servicio y por país de origen y delimitar la antigüedad de las ocurrencias encontradas y su número por página. ● Tanto las búsquedas como el servicio de salto aleatorio (Olé Hoop) y la muestra del árbol de sectores se hacen partiendo de la categoría en la que se encuentre el navegante. ● El servicio "Mundo Olé" ofrece distintos temas de ocio como cine, motor, informática, humor, etc. y un apartado de servicios donde incluye el OleChat, InfoMail, etc. ● Las noticias se dividen en categorías, incluyen los temas de actualidad, y se puede revisar la información ocurrida con anterioridad mediante un Historial. Ozú es un índice español clásico. Resulta práctico y sencillo de usar, y cuenta con una amplia base de datos. ● Resulta útil la búsqueda por comunidades autónomas, accediendo a direcciones que contenga información de la comunidad que sea de nuestro interés. En ellas se repite el esquema de categoría inicial. Se puede buscar por título, URL, dirección de correo electrónico, y por contenido. ● Soporta las búsquedas de cadenas de caracteres entre comillas , operadores booleanos "o" e "y" , búsquedas relacionales (relacionando lo que se busca y encuentra con la categoria(s) en la que se sitúa) y por orden alfabético. ● Un programa comprueba diariamente si las direcciones que almacena continúan activas (se espera 2 meses). De esta forma se garantiza una mayor actualización de los enlaces. ● Servicios añadidos: Bolsa de trabajo Anuncios clasificados de compra y venta "Congresos" - sección que informa sobre cualquier evento que se produzca en España en este sentido. Chat Noticias On-Line, dividido por categorías y un enlace a su página de Webs favoritas Dirección de correo en forma gratuita. ● ● ● ● ● ● Elcano es uno de los más viejos (1995). Su base de datos es menor que la de los anteriores. Su interfaz y organización es más simple aunque parecida. ● No admite búsqueda por operadores booleanos. ● Las búsquedas se pueden realizar por categorías y por eltipo de propietario de la página (personal, gobierno, empresas). ● Presenta 2 grandes categorías: área de interés y profesionales o colectivos. En la segunda hay subcategorías desde abogados hasta radioaficionados, fans, médicos,etc. ● Se puede filtrar por idioma (contempla además del castellano, inglés, francés e italiano, catalán, eureska y gallego) ● Se pueden deshabilitar todos los filtros file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (5 of 11) [10/11/2001 10:09:18 AM] Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información Forma de presentar los resultados: ● Valoración propia de la calidad de la página ● El tipo de información que contiene ● La fecha de alta en la base de datos ● El e-mail del responsable ● El nombre de quien la ha dado de alta. Es especialmente útil para profesionales y colectivos que necesiten información sobre sus áreas de interés. AltaVista Magallanes es la versión española del Alta Vista.Cuenta con una base de datos grandísima, con un altísimo número de páginas indezadas. Si no se sabe acotar la búsqueda devolverá miles de recursos, por eso cuenta con el más completo sistema de operadores (el mismo que Alta Vista). ● Permite buscar por palabras exactas ● Permite utilizar operadores booleanos como: AND, OR, NOT Y NEAR. ● Delimitación de la fecha de publicación o modificación Permite el uso de palabras especiales, comodines Permite filtrar las búsquedas realizadas. Incorpora un listado sobre servicios de interés y noticias sobre la actualidad. ● ● ● Donde? es una de las mejores base de datos sobre recursos españoles. La recolección de datos se hace de forma manual en base a un formulario donde se completan los siguientes datos: URL, título, tipo de recurso, datos institucionales, descripción del contenido, localización geográfica, persona, e-mail del responsable. El sistema no es capaz de reconocer etiquetas Meta. Sistema de búsqueda: ● Las consultas se realizan por medio de un formulario o a través de un mapa de España que recoge los recursos agrupados por comunidades autónomas. La información del resto del mundo la clasifica como "ciberespacio" ● ● ● ● ● Acepta operadores booleanos: and, or Permite truncamientos Búsquedas avanzadas acotando por: título, URL, descripción, organización responsable, localidad y comunidad autónoma. El uso de comillas permite la utilización de términos compuestos. Búsqueda en Web Presentación de resultados. ● Permite elegir entre un formato de salida reducido y otro más completo. ● Ofrece resumen ● El ordenamiento está dado por la relevancia ● La visualización está limitada a 100 registros ● Los recursos más recientes tienen una etiqueta que indica su novedad ● No dispone de una clasificación temática file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (6 of 11) [10/11/2001 10:09:18 AM] Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información Datos de interés: ● El sistema de ayuda es bueno aunque no ejemplifica formas de busqueda ni criterios de relevancia para el ordenamiento ● Ofrece una sección "lo + nuevo" donde se agrupa lo último. Historia del Google Google! es el primer buscador que se sitúa en medio de los directorios y de los motores. Mantiene todas las ventajas de un robot de búsqueda automática, pues consigue rastreos muy amplios, pero elimina el problema de la información de baja calidad y atrasada. Este avance lo logra gracias a que Google! aplica como criterio principal para ordenar los resultados el número de enlaces que se dirigen desde los millones de páginas rastreadas hacia otras webs y no, como el resto de los buscadores automáticos, el número de veces que una palabra clave se repite en una página. Esto, en definitiva, consigue que sean los propios usuarios de Internet, mediante sus particulares selecciones de páginas favoritas en cada momento, quienes determinen el orden en el que aparecerán los resultados al realizar una búsqueda en Google! En teoría, los resultados de este buscador son siempre de calidad y actuales. De nuevo es la comunidad de Internet quien ha comenzado a difundir las excelencias de este nuevo buscador. Y quién sabe si de nuevo no se repetirá un éxito arrollador como el de Yahoo! que, cinco años después de su aparición, se ha encaramado al primer puesto entre las empresas de Internet. De momento Google! no exhibe ni un solo anuncio. Seguro que esto no durará mucho. Búsqueda específica en grupos de interés (news) Para buscar lo que puede estar discutiendo públicamente la comunidad internacional acerca de una tema particular, nada mejor que utilizar un sistema de búsqueda por palabras (o frases) que tenga como foco todos los news de alcance internacional. Para ello, una buena alternativa es DejaNews. Es posible limitar la búsqueda a alguna categoría predefinida, aplicar filtros, etc. a través de un menú que ofrece múltiples posibilidades. METABUSCADORES La tarea de buscar no sólo implica saber cómo acotar la búsqueda sino también saber cuál es el motor más conveniente en cada caso o combinar varios de ellos. La dificultad llegó a tal punto que se crearon sistemas de meta-búsquedas que lo que hacen es consultar en varios motores en forma paralela. O sea, un metabuscador es una página Web que busca la información solicitada en varios buscadores convencionales al mismo tiempo, ahorrando así, tiempos de búsqueda de visitar y utilizar varios de ellos a la vez. En realidad, un metabuscador no busca en sus propias bases de datos sino que lo que hace es acceder a las bases de datos de los motores. Ofrecen detalles de las respuestas de cada uno de los servicios, o bien el listado completo de las coincidencias. Es notable cómo la velocidad de algunas búsquedas es mayor que si se utilizase un buscador. Generalmente no se obtiene toda la potencia de cada uno de los sistemas (ya que los formatos de consulta son diferentes) pero puede ser un buen punto de partida para empezar una búsqueda a fondo. Su utilización es recomendable. Ventajas: Interrogan varios motores a la vez Desventajas ● Buenos sólo para términos sueltos ● ● ● Gastan poco tiempo en cada base de datos Descartan lógica de búsqueda completa Intentar "acomodar" la misma cuestión a todos los buscadores file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (7 of 11) [10/11/2001 10:09:18 AM] Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información ● No utilizan el motor de búsqueda Fast Arquitectura de un metabuscador Los usuarios pueden seleccionar bases de datos en los cuales quieren buscar información. Puede ser una o más de las tres disponibles. Son: 1_ USGS 2_ EPA 3_ PUB SCIENE El usuario puede especificar el número de documentos que quiere por cada Base de Datos como resultado. Cada Base de Datos tiene sus propias reglas para las palabras claves. Por ej, algunas bases no soportan "end" y "or". Si el usuario Ingresa palabras no soportadas el resultado no se mostrará. Información referente a cuantas palabras pueden entrase y en que combinación , puede ser encontrada haciendo clic en el link de ayuda. Todas estas acciones se realizan el la página principal del motor llamada index.html. Una vez que se ingresan las palabras claves para la búsqueda los datos son transferidos de una página a otra con la ayuda de un shell scrip que es el inter.cgi. Este script es guardado en un archivo particular (Metafile.txt) y conecta html con un programa java, en este caso, hace correr el MetaSearch.java tomando como argumento los datos del archivo anterior. El MetaSearch.java lee los datos y los analiza para obtener la información solicitada. Los datos consisten en información acerca la base de datos elegida, las palabras claves. Luego llama a una función para reemplazar la palabra clave en la URL de la base de datos. Aquí se chequea si el usuario pregunta con "and" o "or". Luego de que la URL cambió el thread es creado. Después se creará otro thread para otra B. de D. hasta que busque en la última que se haya elegido. El programa llamado MetasearchThread.java tiene las siguientes funciones: Run, Startconnection, GetPage, Get,Hits. La función Run llama a la función Startconnection, quien a su vez llama a la función GetPage con la URL de la base de datos pasada como argumento. Luego, la página obtenida es leída en un buffer y posteriormente se guarda como string en una variable. Después se llama a la función GetHits donde primero se chequea el nombre de la BD. Como cada BD tiene su propio formato de salida, para que el resultado que arroje el metabuscador sea adecuada, se han escrito programas separados para analizar las páginas y poder obtener los resultados en el formato establecido. Los resultados son mostrados por cada BD seleccionada como páginas html. El usuario tiene la facilidad de pedir más información haciendo click en el botón " more". En este caso, se llama a inter.cgi y todo el proceso es repetido. PRINCIPALES METABUSCADORES MetaCrawler Arquitectura: se encuentra diseñado en módulos. ● Interfaz de usuario es simplemente es la capa que traslada las consultas con las opciones elegidas a los parámetros apropiados. Esto es lo que se envía al motor de agregación ● Motor de agregación es el responsable de obtener las referencias iniciales de cada servicio, procesar las referencias, eliminando duplicados y otorgar el resultado a la interfaz de usuario ● Interfaz Web paralela es la responsable de bajar las páginas html de la Web, enviar consultas y recibir los resultados de cada búsqueda realizada. ● Harness recibe información de control que detalla qué referencias obtener.Le da formato a las consultas y envía la referencia a la interfaz Web paralela, quien envía una página al módulo motor de agregación. file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (8 of 11) [10/11/2001 10:09:19 AM] Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información Está implementado como una colección de módulos, donde cada uno representa un servicio en particular; en cada módulo se puede agregar, modificar, remover sin que esto afecte al resto del MetaCrawler. Brinda resultados rápidos y precisos. Utiliza los motores más efectivos. Permite seleccionar entre búsquedas rápidas o detalladas Motores: Alta Vista, Excite , infoSeek, Lycos, WebCrawler, Yahoo!. Velocidad: Muy rápido (más que buscar en varios de los motores). Opciones de búsqueda:any, all, as a phrase.Resultados: Combina los resultados en una lista eliminando los duplicados. Inference Find busca en 6 motores y muestra una lista ordenada. Esto es útil si devuelve muchas respuestas y se necesita ayuda para organizar la información. La ventaja del agrupamiento se debe en gran parte a la ausencia de resúmenes. Recoge la búsqueda como se la ingresó sin realizar ningún cambio para acordar los formatos de cada motor. El listado está basado más en el dominio de Internet que en la información. Todo lo que ve del documento es el título, lo que no ayuda a la precisión. Buscadores: WebCrawler, Lycos, Alta Vista, InfoSeek, Excite. Velocidad: Rápido. Depende de cuánto tiempo espera en cada buscador. file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (9 of 11) [10/11/2001 10:09:19 AM] Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información Opciones: Max Time determina cuánto debe esperar. Siete segundos es la opción por defecto. Resultados. El formato de resultados es una lista de resultados seguida por una lista de títulos - no hay descripciones de URL o de resultados. Además elimina los duplicados y los ordena otorgando una etiqueta para cada grupo. Dogpile es bueno si se busca mucha información o algo difícil de encontrar. Accede a más buscadores que cualquier otro. Permite construir nuestra propia estrategias de búsqueda. Opciones de búsqueda: Se puede elegir dónde buscar primero. The Web, Usenet, FTP. Motores: busca en tres a la vez en el grupo seleccionado. The Web: Yahoo, Lycos A2z, Excite Guide, World, Wibe Web Worm, WWW Yellow Pages, PlanetSearch, What U Seek, Lycos, WebCrawler, InfoSeek, OpenText, Alta Vista, Excite & HotBot. FTP: Filez, FTP Search and Snoopie! Velocidad: Relativamente rápido para grupo. Los resultados se muestran en cuanto los recoge. Resultados. Se presentan sin ningún formato tal como son recibidos del motor. Añade un botón para conseguir más resultados si es necesario. Búsqueda personalizada: El botón Custom Search te permite seleccionar qué motores usar y el orden de la búsqueda. Bibliografía Proyect Report: Swathi chitteddi , " Meta Search Engine for NWRC", the center for advanced computer studies, the university of Luisiana at lafayette. Document: "Searching the Web" Arvind Arasu, Junghoo Cho, Hector Garcia-Molina, Andreas Paepcke, Sriram Raghavan. Computer Science Department, Stanford University". Document: "The MetaCrawler Architecture for Resiource Aggregation on the Web", Erik Selberg, Oren Etzioni, Department of Computer science and Engineering, University of Washington. Proceedings: "Architecture of a Metasearch Engine that Supports User Information Needs", Eric J. Glover1,2, Steve Lawrence1 , William P. Birmingham2, C. Lee Giles1. NEC Research Institute1_ Artificial Intelligence Laboratory2_ 4 Independence Way University of Michigan Princeton, NJ 08540 1101 Beal Avenue Ann Arbor, MI 48109 Document: "Network Data Services", Professor Stan Zdonik Contenido de metabuscadores http://www.buscaya.com/metabuscadores/metab.htm Aplicaciones de Internet: servicios de búsqueda en internet. http://www.diatel.upm.es/~adasilva/trabajosTecnologiaWeb/Sistemas de busqueda - Raul Abengozar/htdocs/indice2.htm file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (10 of 11) [10/11/2001 10:09:19 AM] Las herramientas de búsqueda denominadas genéricamente como busca...ra hacer posible la recuperación y localización de la información Buscadores de información en Internet: directorios y motores de búsqueda http://hipatia.uc3m.es/~jroble/documentac/buscar.htm La revolución Google! http://www.el-mundo.es/navegante/diario/99/abril/21/comunicacion.html metabuscadores http://members.es.tripod.de/iui/meta.htm#compo/ Web-Crawlers : Motores de Búsqueda (Search-Engine) http://www.osmosislatina.com/aplicaciones/robots.htm Cómo buscar información en Internet http://www.servicom.es/enadasur/busqueda.htm Estrategias de búsqueda en la internet http://www.uprm.edu/socialsciences/manualprofesor/id77.htm Estrategias de búsqueda http://artesliberales.bc.inter.edu/jquintana/TodoWeb/Buscadores/Estrategias%20busqueda.htm file:///C|/WINDOWS/Escritorio/zzz/martinelli-motor.htm (11 of 11) [10/11/2001 10:09:19 AM]