Buscadores web

Anuncio
2014
Buscadores web
SIOMARIS FERNANDA CANABAL PERAZA
23-8-2014
Índice
Introducción
¿Qué es un buscador web?
¿Para qué sirve un buscador web?
¿Cómo se usa un buscador web?
Clasificación de buscadores
Conclusión
Referencias
Glosario
1
2
3
4
5
9
10
11
Introducción
La manera más rápidas y moderna de buscar información, es por medio de la
Internet. Hoy en día existen millones de sitios web en todo el mundo (billones de
páginas indexadas por los buscadores), las cuales contienen la más variada
información posible de imaginar. Es por lo mismo, que con la globalización y la
tecnología, la búsqueda de información dejó de estar limitada principalmente a las
bibliotecas, para ahora llevarse a cabo en la red de información que accedemos
por medio de la Internet. Y la cantidad de información disponible se va
incrementando a una gran velocidad, año tras año. Por esta razón en este trabajo
abordaremos el tema de los buscadores web.
1
¿Qué es un buscador web?
Los buscadores en Internet, son programas o aplicaciones que residen en un sitio
o página web, los cuales, al ingresar palabras en sus recuadros de búsqueda,
operan dentro de la base de datos del mismo buscador y recopilan todas las
páginas que contengan información relevante y relacionada con lo que se busca;
de hecho este es el principal desafío que enfrentan las compañías que brindan
este servicio, el ser capaces de brindar un orden al verdadero océano de
información que es la web (hablamos de red o web también para referirnos a la
Internet). Las palabras que ingresamos en los recuadros para buscar se
denominan en el medio "palabras clave", o "keywords" en inglés, por su
importancia para obtener la información necesaria de la gran base de datos que
maneja cada buscador.
Un motor de búsqueda, también conocido como buscador, es un sistema
informático que busca archivos almacenados en servidores web gracias a su
«spider» (también llamado araña web). Un ejemplo son los buscadores de Internet
(algunos buscan únicamente en la web, pero otros lo hacen además en noticias,
servicios como Gopher, FTP, etc.) cuando se pide información sobre algún tema.
Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas;
el resultado de la búsqueda «Página de resultados del buscador» es un listado de
direcciones web en los que se mencionan temas relacionados con las palabras
clave buscadas.
Como operan de forma automática, los motores de búsqueda contienen
generalmente más información que los directorios. Sin embargo, estos últimos
también han de construirse a partir de búsquedas (no automatizadas) o bien a
partir de avisos dados por los creadores de páginas (lo cual puede ser muy
limitante). Los buenos directorios combinan ambos sistemas. Hoy en día Internet
se ha convertido en una herramienta rápida y eficiente para la búsqueda de
información, para ello han surgido los buscadores que son un motor de búsqueda
que nos facilita encontrar información rápida de cualquier tema de interés, en
cualquier área de las ciencias, y de cualquier parte del mundo.
Un buscador es una página de internet que permite realizar búsquedas en la red.
Su forma de utilización es muy sencilla, basta con introducir una o más palabras
clave en una casilla y el buscador generará una lista de páginas web que se
supone guardan relación con el tema solicitado.
Aunque el modo de utilización es muy fácil a nivel básico, los buscadores
permiten opciones avanzadas para refinar la búsqueda, cuyo resultado puede ser
en muchas ocasiones de miles de páginas. Mediante estas opciones avanzadas
se puede acotar la búsqueda y obtener un número de páginas más manejable.
Debido al gran tamaño de Internet y a su naturaleza cambiante, ningún buscador
posee registro de todas las páginas que se encuentran en la red. Por ello es
aconsejable visitar más de un buscador para contrastar los resultados y en ningún
caso pensar que si una página no aparece en un buscador, es que no existe.
2
¿Para qué sirve un buscador web?
Los buscadores poseen enormes bases de datos que contienen información
referente a páginas web. Estas bases de datos se generan por las altas de
usuarios que han creado sus páginas web (esto equivaldría a poner tus datos en
un listín telefónico). En muchos buscadores, si el creador de la página no se da de
alta en el buscador, la página no aparecerá. Para las empresas es muy importante
promocionar sus páginas en los buscadores para que la gente las encuentre
fácilmente.
Otros buscadores, no contentos con ello, poseen programas específicos que
rastrean la red 24 horas al día, todos los días. Estos programas procesan una gran
cantidad de información y extraen palabras clave que puedan servir para
identificar la temática de la página web.
Cuando necesitamos de Internet, normalmente buscamos información sobre un
tema concreto, y es difícil acceder a una página que la contenga, simplemente
pinchando vínculos. Como solución a este problema surgieron los buscadores. Un
buscador es una página web en la que se ofrece consultar una base de datos en
la cual se relacionan direcciones de páginas web con su contenido. Su uso facilita
enormemente la obtención de un listado de páginas web que contienen
información sobre el tema que nos interesa.
Existen varios tipos de buscadores, en función del modo de construcción y acceso
a la base de datos, pero todos ellos tienen en común que permiten una consulta
en la que el buscador nos devuelve una lista de direcciones de páginas web
relacionadas con el tema consultado.
El origen de los buscadores se remonta a abril de 1994, año en el que una pareja
de universitarios norteamericanos (David Filo y Jerry Yang) decidieron crear una
página web en la que se ofreciera un directorio de páginas interesantes
clasificadas por temas, pensando siempre en las necesidades de información que
podrían tener sus compañeros de estudios. Había nacido Yahoo!. El éxito de esta
página fue tan grande que una empresa decidió comprarla y convertirla en el
portal que hoy conocemos. Además del buscador, hoy Yahoo! ofrece muchos más
servicios.
3
¿Cómo se usa un buscador web?
Si hablamos de los buscadores en Internet que operan mediante robots, estamos
hablando de sitios como Google (a mi juicio el más recomendable, y por lo mismo
el más usado a la fecha en el mundo), una de las páginas más visitadas y exitosas
en la búsqueda de información. Otra denominación común para los buscadores
que operan a través de robots es la de "motores de búsqueda", un sinónimo
técnico poco utilizado. Los robots o arañas son programas que escudriñan la web
siguiendo los links o enlaces que van encontrando en las diferentes páginas, de tal
manera de ir descubriendo y archivando lo que encuentran a su paso. Estas
arañas no descansan nunca, descubriendo cada vez nuevas páginas en la red;
entre los robots más conocidos tenemos al Googlebot, de Google, el Slurp, de
Yahoo!!!!, el Bingbot (antes el MSN bot, de MSN search) de Microsoft y otros
menos conocidos. En todo caso se mencionan aquí de manera informativa, ya que
para el usuario todos estos tecnicismos son completamente transparentes, o sea
no necesita saber ni de su existencia ni funcionamiento para poder utilizar un
buscador.
Yahoo! es el primer tipo de buscador que surgió. En los índices de búsqueda, la
base de datos con direcciones la construye un equipo humano. Es decir, un grupo
de personas va rastreando la red en busca de páginas. Vistas éstas son
clasificadas por categorías o temas y subcategorías en función de su contenido.
De este modo, la base de datos de un índice de búsqueda contiene una lista de
categorías y subcategorías relacionadas con un conjunto de direcciones de
páginas web que tratan esos temas.
La consulta de un índice se realiza a través de categorías.
Temporalmente, los motores de búsqueda son posteriores a los índices. El
concepto es diferente: en este caso, el rastreo de la web lo hace un programa,
llamado araña o motor (de ahí viene el nombre del tipo de buscador). Este
programa va visitando las páginas y, a la vez, creando una base de datos en la
que relaciona la dirección de la página con las 100 primeras palabras que
aparecen en ella. Como era de esperar, el acceso a esta base de datos se hace
por palabras clave: la página del buscador me ofrece un espacio para que yo
escriba la o las palabras relacionadas con el tema que me interesa, y como
resultado me devuelve directamente un listado de páginas que contienen esas
palabras clave. Por ejemplo, si utilizo un motor de búsqueda para localizar
información sobre el Museo del Prado, simplemente tendré que escribir "Museo
del Prado" en el espacio de búsqueda y pinchar en el botón Buscar. A
continuación se me devolverá otra página con los resultados de la búsqueda: un
listado con enlaces a las páginas solicitadas.
Un buen ejemplo de motores de búsqueda es Google.
4
Clasificación de buscadores
+ Buscadores jerárquicos (arañas o spiders)






Las arañas (también llamadas "spiders") de los motores de búsqueda,
recorren las páginas recopilando información sobre los contenidos de las
páginas. Cuando se busca una información concreta en los buscadores,
ellos consultan su base de datos y presentan resultados clasificados por su
relevancia para esa búsqueda concreta. Los buscadores pueden almacenar
en sus bases de datos desde la página de entrada de cada web, hasta
todas las páginas que residan en el servidor, una vez que las arañas
(spiders) las hayan reconocido e indexado.
Si se busca una palabra (por ejemplo: “ordenadores”), en los resultados que
ofrecerá el motor de búsqueda aparecerán páginas que contengan esta
palabra en alguna parte de su texto de contenido.
Si consideran que un sitio web es importante para el usuario, tienden a
registrar todas sus páginas. Si no la consideran importante, no se
almacenan todas.
Cada cierto tiempo, los motores revisan los sitios web, para actualizar los
contenidos de su base de datos, por tanto puede que los resultados de la
búsqueda estén desactualizados.
Los buscadores jerárquicos tienen una colección de programas simples y
potentes con diferentes cometidos. Se suelen dividir en tres partes. Los
programas que exploran la red -arañas (spiders)-, los que construyen la
base de datos y los que utiliza el usuario, el programa que explota la base
de datos.
Si se paga, se puede aparecer en las primeras posiciones de resultados,
aunque los principales buscadores delimitan estos resultados e indican al
usuario que se trata de anuncios (resultados esponsorizados o
patrocinados). Hasta el momento, aparentemente, esta forma de publicidad
es indicada explícitamente. Los buscadores jerárquicos se han visto
obligados a comercializar este tipo de publicidad para poder seguir
ofreciendo a los usuarios el servicio de forma gratuita.
+ Directorios
Una tecnología barata, ampliamente utilizada por gran cantidad de scripts en el
mercado.
No se requieren muchos recursos de informática. En cambio, se requiere más
soporte humano y mantenimiento.

Los algoritmos son mucho más sencillos, presentando la información sobre
los sitios registrados como una colección de directorios. No recorren los
sitios web ni almacenan sus contenidos. Solo registran algunos de los datos
5
de nuestra página, como el título y la descripción que se introduzcan en el
momento de registrar el sitio en el directorio.

Los resultados de la búsqueda, estarán determinados por la información
que se haya suministrado al directorio cuando se registra el sitio. En
cambio, a diferencia de los motores, son revisadas por operadores
humanos, y clasificadas según categorías, de forma que es más fácil
encontrar páginas del tema de nuestro interés.

Más que buscar información sobre contenidos de la página, los resultados
serán presentados haciendo referencia a los contenidos y temática del sitio.

Su tecnología es muy barata y sencilla.

Como inconveniente cabe resaltar que los resultados están ordenados por
temática, o por fecha de publicación, pero no por relevancia o concordancia
con una búsqueda concreta del usuario.
Ejemplos de directorios: Antiguos directorios, Open Directory Project, Yahoo! Terra
(antiguo Olé). Ahora, ambos utilizan tecnología de búsqueda jerárquica, y Yahoo!
conserva su directorio. Buscar Portal, es un directorio, y la mayoría de motores
hispanos son directorios.
+ Meta buscador
Permite lanzar varias búsquedas en motores seleccionados respetando el formato
original de los buscadores. Lo que hacen es realizar búsquedas en auténticos
buscadores, analizan los resultados de la página y presentan sus propios
resultados, según un orden definido por el sistema estructural del meta buscador.
Metacrawler y Aleyares son ejemplos de este tipo de buscador.
+ FFA - Enlaces gratuitos para todos
FFA (acrónimo del inglés "Free For All"), Cualquiera puede inscribir su página
durante un tiempo limitado en estos pequeños directorios. Los enlaces no son
permanentes.
+ Buscadores verticales
Los buscadores verticales o motores de búsqueda temáticos son buscadores
especializados en un sector concreto, lo que les permite analizar la información
con mayor profundidad, disponer de resultados más actualizados y ofrecer al
usuario herramientas de búsqueda avanzadas.
6
Es importante resaltar que utilizan índices especializados, para, de este modo,
acceder a la información de una manera más específica y fácil. Algunos ejemplos
de estos buscadores son: Trovit, Nestoria, Wolfram Alpha.
Existen distintos tipos de estos buscadores, algunos están especializados en una
rama de una ciencia, y algunos abarcan todo tipo de materias. También hay
motores de búsqueda que solo ofrecen resultados sobre música, ropa y otras
temáticas.
Lo más utilizados:
 Google:
Es una herramienta que rastrea e indexa miles de millones de páginas web y
documentos asociados, y realiza una clasificación de su relevancia para cualquier
término que el usuario busque.
Esta clasificación se realiza principalmente siguiendo el algoritmo PageRank, que
se basa en que cada hiperenlace recibido por un documento significa un voto de
calidad.
Es el servicio más popular de Google, aunque dispone de muchos más, que
buscan información contenida en otro tipo de soportes.
Para rentabilizarlo económicamente, en octubre de 2000 se lanzó el programa
publicitario Google AdWords, que permite a cualquier persona anunciarse dentro
de la página de resultados del buscador, pagando una determinada cantidad por
cada click que el usuario realice.
 Bing :
Bing (anteriormente Live Search, Windows Live Search y MSN Search) es un
buscador web de Microsoft. Presentado por el director ejecutivo de Microsoft,
Steve Ballmer el 28 de mayo de 2009 en la Conferencia All Things Digital en San
Diego. Fue puesto en línea el 3 de junio de 2009 con una versión preliminar
publicada el 1 de junio del 2009.
Cambios notables incluyen la lista de sugerencias de búsqueda en tiempo real, y
una lista de las búsquedas relacionadas (llamado "Panel de explorador" en el lado
izquierdo de los resultados de búsqueda), basado en tecnología semántica de
Powerset que Microsoft compró en el 2008.
7
 Ask:
Ask.com, también conocido como Ask Jeeves, es un motor de
búsqueda de Internet. Es parte de la compañía InterActive
Corporation, fundada en 1996 por Garrett Gruener y David Warthen en
Berkeley, California. El programa original fue implementado por Gary
Chevsky basado en su propio diseño. El primer inversor fue el Grupo
RODAS.
Ask.com búsqueda y barras de herramientas relacionadas se
clasifican como posibles programas no deseados que se promueven y
difunden a través de otros programas libres. Una vez que capta el
equipo, que van a hacer una serie de modificaciones a su sistema,
como el secuestro de los navegadores instalados cambiando página
original y proveedor de búsqueda predeterminado para ask.com,
nl.ask.com, search.ask.com, u otros sitios similares. De hecho, el
secuestrador del navegador ask.com hizo su primera aparición hace
varios años que puede remontarse a 2008, o incluso antes. Tal
secuestrador del navegador parece seguir sus infecciones a más
usuarios de computadoras en diferentes variantes, desde antes
conocida search.ask.com dominio a nl.ask.com recientemente
encontrado.
8
Conclusión
Los buscadores en Internet, son programas o aplicaciones que residen en un sitio
o página web, los cuales, al ingresar palabras en sus recuadros de búsqueda,
operan dentro de la base de datos del mismo buscador y recopilan todas las
páginas que contengan información relevante y relacionada con lo que se busca.
Los buscadores web son muy fáciles de usar, solo necesitas ingresar en el
recuadro de búsqueda una palabra clave y el buscador te dará la lista de páginas
relacionadas con tu búsqueda.
Existen los jerárquicos, directorios, meta buscador, enlaces gratuitos y buscadores
verticales. De los más comunes buscadores es Google que utilizamos a diario aun
sin saber su estructura o su historia.
9
Bibliografía
2. http://es.wikipedia.org/wiki/Motor_de_b%C3%BAsqued
a
3. http://www.alu.ua.es/r/rac6/Buscadores/que_es_un_bu
scador.html
4. http://aula21.net/tallerwq/buscadores/buscador1.htm
5. http://google.dirson.com/o.a/google-web
6. http://www.misrespuestas.com/que-son-losbuscadores-en-internet.html
7. MENU
10
Glosario
1. Indexado: Es el nombre que se le da al proceso de recolectar y
almacenar páginas web por parte de un buscador de internet. Luego
de este proceso, pueden estar disponibles en las páginas con
resultados de búsquedas que se realicen en ese buscador.
2. Algoritmo: Es un conjunto prescrito de instrucciones o reglas bien
definidas, ordenadas y finitas que permite realizar una actividad
mediante pasos sucesivos que no generen dudas a quien deba
realizar dicha actividad.
11
Descargar