2014 Buscadores web SIOMARIS FERNANDA CANABAL PERAZA 23-8-2014 Índice Introducción ¿Qué es un buscador web? ¿Para qué sirve un buscador web? ¿Cómo se usa un buscador web? Clasificación de buscadores Conclusión Referencias Glosario 1 2 3 4 5 9 10 11 Introducción La manera más rápidas y moderna de buscar información, es por medio de la Internet. Hoy en día existen millones de sitios web en todo el mundo (billones de páginas indexadas por los buscadores), las cuales contienen la más variada información posible de imaginar. Es por lo mismo, que con la globalización y la tecnología, la búsqueda de información dejó de estar limitada principalmente a las bibliotecas, para ahora llevarse a cabo en la red de información que accedemos por medio de la Internet. Y la cantidad de información disponible se va incrementando a una gran velocidad, año tras año. Por esta razón en este trabajo abordaremos el tema de los buscadores web. 1 ¿Qué es un buscador web? Los buscadores en Internet, son programas o aplicaciones que residen en un sitio o página web, los cuales, al ingresar palabras en sus recuadros de búsqueda, operan dentro de la base de datos del mismo buscador y recopilan todas las páginas que contengan información relevante y relacionada con lo que se busca; de hecho este es el principal desafío que enfrentan las compañías que brindan este servicio, el ser capaces de brindar un orden al verdadero océano de información que es la web (hablamos de red o web también para referirnos a la Internet). Las palabras que ingresamos en los recuadros para buscar se denominan en el medio "palabras clave", o "keywords" en inglés, por su importancia para obtener la información necesaria de la gran base de datos que maneja cada buscador. Un motor de búsqueda, también conocido como buscador, es un sistema informático que busca archivos almacenados en servidores web gracias a su «spider» (también llamado araña web). Un ejemplo son los buscadores de Internet (algunos buscan únicamente en la web, pero otros lo hacen además en noticias, servicios como Gopher, FTP, etc.) cuando se pide información sobre algún tema. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda «Página de resultados del buscador» es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas. Como operan de forma automática, los motores de búsqueda contienen generalmente más información que los directorios. Sin embargo, estos últimos también han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de páginas (lo cual puede ser muy limitante). Los buenos directorios combinan ambos sistemas. Hoy en día Internet se ha convertido en una herramienta rápida y eficiente para la búsqueda de información, para ello han surgido los buscadores que son un motor de búsqueda que nos facilita encontrar información rápida de cualquier tema de interés, en cualquier área de las ciencias, y de cualquier parte del mundo. Un buscador es una página de internet que permite realizar búsquedas en la red. Su forma de utilización es muy sencilla, basta con introducir una o más palabras clave en una casilla y el buscador generará una lista de páginas web que se supone guardan relación con el tema solicitado. Aunque el modo de utilización es muy fácil a nivel básico, los buscadores permiten opciones avanzadas para refinar la búsqueda, cuyo resultado puede ser en muchas ocasiones de miles de páginas. Mediante estas opciones avanzadas se puede acotar la búsqueda y obtener un número de páginas más manejable. Debido al gran tamaño de Internet y a su naturaleza cambiante, ningún buscador posee registro de todas las páginas que se encuentran en la red. Por ello es aconsejable visitar más de un buscador para contrastar los resultados y en ningún caso pensar que si una página no aparece en un buscador, es que no existe. 2 ¿Para qué sirve un buscador web? Los buscadores poseen enormes bases de datos que contienen información referente a páginas web. Estas bases de datos se generan por las altas de usuarios que han creado sus páginas web (esto equivaldría a poner tus datos en un listín telefónico). En muchos buscadores, si el creador de la página no se da de alta en el buscador, la página no aparecerá. Para las empresas es muy importante promocionar sus páginas en los buscadores para que la gente las encuentre fácilmente. Otros buscadores, no contentos con ello, poseen programas específicos que rastrean la red 24 horas al día, todos los días. Estos programas procesan una gran cantidad de información y extraen palabras clave que puedan servir para identificar la temática de la página web. Cuando necesitamos de Internet, normalmente buscamos información sobre un tema concreto, y es difícil acceder a una página que la contenga, simplemente pinchando vínculos. Como solución a este problema surgieron los buscadores. Un buscador es una página web en la que se ofrece consultar una base de datos en la cual se relacionan direcciones de páginas web con su contenido. Su uso facilita enormemente la obtención de un listado de páginas web que contienen información sobre el tema que nos interesa. Existen varios tipos de buscadores, en función del modo de construcción y acceso a la base de datos, pero todos ellos tienen en común que permiten una consulta en la que el buscador nos devuelve una lista de direcciones de páginas web relacionadas con el tema consultado. El origen de los buscadores se remonta a abril de 1994, año en el que una pareja de universitarios norteamericanos (David Filo y Jerry Yang) decidieron crear una página web en la que se ofreciera un directorio de páginas interesantes clasificadas por temas, pensando siempre en las necesidades de información que podrían tener sus compañeros de estudios. Había nacido Yahoo!. El éxito de esta página fue tan grande que una empresa decidió comprarla y convertirla en el portal que hoy conocemos. Además del buscador, hoy Yahoo! ofrece muchos más servicios. 3 ¿Cómo se usa un buscador web? Si hablamos de los buscadores en Internet que operan mediante robots, estamos hablando de sitios como Google (a mi juicio el más recomendable, y por lo mismo el más usado a la fecha en el mundo), una de las páginas más visitadas y exitosas en la búsqueda de información. Otra denominación común para los buscadores que operan a través de robots es la de "motores de búsqueda", un sinónimo técnico poco utilizado. Los robots o arañas son programas que escudriñan la web siguiendo los links o enlaces que van encontrando en las diferentes páginas, de tal manera de ir descubriendo y archivando lo que encuentran a su paso. Estas arañas no descansan nunca, descubriendo cada vez nuevas páginas en la red; entre los robots más conocidos tenemos al Googlebot, de Google, el Slurp, de Yahoo!!!!, el Bingbot (antes el MSN bot, de MSN search) de Microsoft y otros menos conocidos. En todo caso se mencionan aquí de manera informativa, ya que para el usuario todos estos tecnicismos son completamente transparentes, o sea no necesita saber ni de su existencia ni funcionamiento para poder utilizar un buscador. Yahoo! es el primer tipo de buscador que surgió. En los índices de búsqueda, la base de datos con direcciones la construye un equipo humano. Es decir, un grupo de personas va rastreando la red en busca de páginas. Vistas éstas son clasificadas por categorías o temas y subcategorías en función de su contenido. De este modo, la base de datos de un índice de búsqueda contiene una lista de categorías y subcategorías relacionadas con un conjunto de direcciones de páginas web que tratan esos temas. La consulta de un índice se realiza a través de categorías. Temporalmente, los motores de búsqueda son posteriores a los índices. El concepto es diferente: en este caso, el rastreo de la web lo hace un programa, llamado araña o motor (de ahí viene el nombre del tipo de buscador). Este programa va visitando las páginas y, a la vez, creando una base de datos en la que relaciona la dirección de la página con las 100 primeras palabras que aparecen en ella. Como era de esperar, el acceso a esta base de datos se hace por palabras clave: la página del buscador me ofrece un espacio para que yo escriba la o las palabras relacionadas con el tema que me interesa, y como resultado me devuelve directamente un listado de páginas que contienen esas palabras clave. Por ejemplo, si utilizo un motor de búsqueda para localizar información sobre el Museo del Prado, simplemente tendré que escribir "Museo del Prado" en el espacio de búsqueda y pinchar en el botón Buscar. A continuación se me devolverá otra página con los resultados de la búsqueda: un listado con enlaces a las páginas solicitadas. Un buen ejemplo de motores de búsqueda es Google. 4 Clasificación de buscadores + Buscadores jerárquicos (arañas o spiders) Las arañas (también llamadas "spiders") de los motores de búsqueda, recorren las páginas recopilando información sobre los contenidos de las páginas. Cuando se busca una información concreta en los buscadores, ellos consultan su base de datos y presentan resultados clasificados por su relevancia para esa búsqueda concreta. Los buscadores pueden almacenar en sus bases de datos desde la página de entrada de cada web, hasta todas las páginas que residan en el servidor, una vez que las arañas (spiders) las hayan reconocido e indexado. Si se busca una palabra (por ejemplo: “ordenadores”), en los resultados que ofrecerá el motor de búsqueda aparecerán páginas que contengan esta palabra en alguna parte de su texto de contenido. Si consideran que un sitio web es importante para el usuario, tienden a registrar todas sus páginas. Si no la consideran importante, no se almacenan todas. Cada cierto tiempo, los motores revisan los sitios web, para actualizar los contenidos de su base de datos, por tanto puede que los resultados de la búsqueda estén desactualizados. Los buscadores jerárquicos tienen una colección de programas simples y potentes con diferentes cometidos. Se suelen dividir en tres partes. Los programas que exploran la red -arañas (spiders)-, los que construyen la base de datos y los que utiliza el usuario, el programa que explota la base de datos. Si se paga, se puede aparecer en las primeras posiciones de resultados, aunque los principales buscadores delimitan estos resultados e indican al usuario que se trata de anuncios (resultados esponsorizados o patrocinados). Hasta el momento, aparentemente, esta forma de publicidad es indicada explícitamente. Los buscadores jerárquicos se han visto obligados a comercializar este tipo de publicidad para poder seguir ofreciendo a los usuarios el servicio de forma gratuita. + Directorios Una tecnología barata, ampliamente utilizada por gran cantidad de scripts en el mercado. No se requieren muchos recursos de informática. En cambio, se requiere más soporte humano y mantenimiento. Los algoritmos son mucho más sencillos, presentando la información sobre los sitios registrados como una colección de directorios. No recorren los sitios web ni almacenan sus contenidos. Solo registran algunos de los datos 5 de nuestra página, como el título y la descripción que se introduzcan en el momento de registrar el sitio en el directorio. Los resultados de la búsqueda, estarán determinados por la información que se haya suministrado al directorio cuando se registra el sitio. En cambio, a diferencia de los motores, son revisadas por operadores humanos, y clasificadas según categorías, de forma que es más fácil encontrar páginas del tema de nuestro interés. Más que buscar información sobre contenidos de la página, los resultados serán presentados haciendo referencia a los contenidos y temática del sitio. Su tecnología es muy barata y sencilla. Como inconveniente cabe resaltar que los resultados están ordenados por temática, o por fecha de publicación, pero no por relevancia o concordancia con una búsqueda concreta del usuario. Ejemplos de directorios: Antiguos directorios, Open Directory Project, Yahoo! Terra (antiguo Olé). Ahora, ambos utilizan tecnología de búsqueda jerárquica, y Yahoo! conserva su directorio. Buscar Portal, es un directorio, y la mayoría de motores hispanos son directorios. + Meta buscador Permite lanzar varias búsquedas en motores seleccionados respetando el formato original de los buscadores. Lo que hacen es realizar búsquedas en auténticos buscadores, analizan los resultados de la página y presentan sus propios resultados, según un orden definido por el sistema estructural del meta buscador. Metacrawler y Aleyares son ejemplos de este tipo de buscador. + FFA - Enlaces gratuitos para todos FFA (acrónimo del inglés "Free For All"), Cualquiera puede inscribir su página durante un tiempo limitado en estos pequeños directorios. Los enlaces no son permanentes. + Buscadores verticales Los buscadores verticales o motores de búsqueda temáticos son buscadores especializados en un sector concreto, lo que les permite analizar la información con mayor profundidad, disponer de resultados más actualizados y ofrecer al usuario herramientas de búsqueda avanzadas. 6 Es importante resaltar que utilizan índices especializados, para, de este modo, acceder a la información de una manera más específica y fácil. Algunos ejemplos de estos buscadores son: Trovit, Nestoria, Wolfram Alpha. Existen distintos tipos de estos buscadores, algunos están especializados en una rama de una ciencia, y algunos abarcan todo tipo de materias. También hay motores de búsqueda que solo ofrecen resultados sobre música, ropa y otras temáticas. Lo más utilizados: Google: Es una herramienta que rastrea e indexa miles de millones de páginas web y documentos asociados, y realiza una clasificación de su relevancia para cualquier término que el usuario busque. Esta clasificación se realiza principalmente siguiendo el algoritmo PageRank, que se basa en que cada hiperenlace recibido por un documento significa un voto de calidad. Es el servicio más popular de Google, aunque dispone de muchos más, que buscan información contenida en otro tipo de soportes. Para rentabilizarlo económicamente, en octubre de 2000 se lanzó el programa publicitario Google AdWords, que permite a cualquier persona anunciarse dentro de la página de resultados del buscador, pagando una determinada cantidad por cada click que el usuario realice. Bing : Bing (anteriormente Live Search, Windows Live Search y MSN Search) es un buscador web de Microsoft. Presentado por el director ejecutivo de Microsoft, Steve Ballmer el 28 de mayo de 2009 en la Conferencia All Things Digital en San Diego. Fue puesto en línea el 3 de junio de 2009 con una versión preliminar publicada el 1 de junio del 2009. Cambios notables incluyen la lista de sugerencias de búsqueda en tiempo real, y una lista de las búsquedas relacionadas (llamado "Panel de explorador" en el lado izquierdo de los resultados de búsqueda), basado en tecnología semántica de Powerset que Microsoft compró en el 2008. 7 Ask: Ask.com, también conocido como Ask Jeeves, es un motor de búsqueda de Internet. Es parte de la compañía InterActive Corporation, fundada en 1996 por Garrett Gruener y David Warthen en Berkeley, California. El programa original fue implementado por Gary Chevsky basado en su propio diseño. El primer inversor fue el Grupo RODAS. Ask.com búsqueda y barras de herramientas relacionadas se clasifican como posibles programas no deseados que se promueven y difunden a través de otros programas libres. Una vez que capta el equipo, que van a hacer una serie de modificaciones a su sistema, como el secuestro de los navegadores instalados cambiando página original y proveedor de búsqueda predeterminado para ask.com, nl.ask.com, search.ask.com, u otros sitios similares. De hecho, el secuestrador del navegador ask.com hizo su primera aparición hace varios años que puede remontarse a 2008, o incluso antes. Tal secuestrador del navegador parece seguir sus infecciones a más usuarios de computadoras en diferentes variantes, desde antes conocida search.ask.com dominio a nl.ask.com recientemente encontrado. 8 Conclusión Los buscadores en Internet, son programas o aplicaciones que residen en un sitio o página web, los cuales, al ingresar palabras en sus recuadros de búsqueda, operan dentro de la base de datos del mismo buscador y recopilan todas las páginas que contengan información relevante y relacionada con lo que se busca. Los buscadores web son muy fáciles de usar, solo necesitas ingresar en el recuadro de búsqueda una palabra clave y el buscador te dará la lista de páginas relacionadas con tu búsqueda. Existen los jerárquicos, directorios, meta buscador, enlaces gratuitos y buscadores verticales. De los más comunes buscadores es Google que utilizamos a diario aun sin saber su estructura o su historia. 9 Bibliografía 2. http://es.wikipedia.org/wiki/Motor_de_b%C3%BAsqued a 3. http://www.alu.ua.es/r/rac6/Buscadores/que_es_un_bu scador.html 4. http://aula21.net/tallerwq/buscadores/buscador1.htm 5. http://google.dirson.com/o.a/google-web 6. http://www.misrespuestas.com/que-son-losbuscadores-en-internet.html 7. MENU 10 Glosario 1. Indexado: Es el nombre que se le da al proceso de recolectar y almacenar páginas web por parte de un buscador de internet. Luego de este proceso, pueden estar disponibles en las páginas con resultados de búsquedas que se realicen en ese buscador. 2. Algoritmo: Es un conjunto prescrito de instrucciones o reglas bien definidas, ordenadas y finitas que permite realizar una actividad mediante pasos sucesivos que no generen dudas a quien deba realizar dicha actividad. 11