Funcionamiento del buscador Altavista

Anuncio
Funcionamiento del buscador Altavista
- Introducción
El Índice de AltaVista se construye enviando "espías" (programas robot) que capturan texto y lo almacenan. En este
proceso no interviene ninguna acción humana ni juicio. Lo que ven es lo que almacenan.
El principal espía, "Scooter", recoge miles de peticiones http simultáneamente como si fueran miles de usuarios
picando texto, almacenándolo y enviándolo a las máquinas indexadoras para que el texto pueda ser clasificado.
"Scooter" tiene "primos", otros espías que realizan tareas específica para ayudar a mantener el índice actualizado,
cómo, por ejemplo, comprobar vínculos rotos -páginas que se han movido o borrado y no serán indexadas.
¿Cómo sabe Scooter dónde tiene que ir? Sigue los vínculos que se encuentra en las páginas que visita. Cuando una
página es capturada, los vínculos desde esa página se almacenan en una lista. En teoría, no es necesario describir a
AltaVista su sitio: el resto del sitio se encontrará automáticamente. En un día normal, Scooter y sus primos visitan
más de 10 millones de páginas.
Aún así, éste un juego aleatorio con cientos de miles de Página. Aquellas páginas hacia las que apunten vínculos
desde otros sitios serán encontradas frecuentemente por Scooter. Las páginas con pocos vínculos serán encontradas
en una semana, un mes, seis meses o incluso más tarde. Las páginas sin vínculos no serán encontradas nunca.
- Añadir y eliminar direcciones de páginas web (URL)
Al añadir su página al índice de Altavista, un espía visitará automáticamente esa página y la llevará a las máquinas
de búsqueda para añadirla al índice.
Tenga en cuenta que no es necesario tener una identidad especial para añadir tu página. AltaVista no es un directorio
como Yahoo!, donde la persona que añade la página debe proveer la información y probar que es quien dice ser;
simplemente se sugiere una dirección URL para que el espía la visite y recoja cualquier texto que se encuentre en esa
dirección.
Todo lo que sabe el espía es lo que se encuentra en la página, no lo que le hayamos dicho. Si ha cambiado la
estructura de directorios de su sitio web, puede introducir la URL de todas las direcciones antiguas para eliminar la
información antigua del índice. Después puede añadir las direcciones de las nuevas páginas.
- Propiedades del buscador de Altavista
Las grandes empresas malinterpretan a menudo cómo funciona AltaVista. Algunos Webmasters piensan que
AltaVista y otros motores de búsqueda buscan sólo a través de la información que se encuentran en las etiquetas
META - palabras clave incrustadas en la cabecera de un documento HTML. Piensan que solo esas "palabras clave"
son importantes y están equivocados.
Esto no es así. Las bases de datos utilizan palabras clave. Con bases de datos se necesita organizar la información
para encontrarla después, pero AltaVista es un índice de texto. Cada palabra en cada página importa, y no solo
palabras individuales, sino el orden de esas palabras al igual que las frases.
El uso creativo de distintas combinaciones de búsqueda pueden producir resultados interesantes e inesperados.
Mucha gente tiende a pensar que la única manera de organizar grandes cantidades de información es a través de
bases de datos. Configurar una base de datos requiere definir campos, categorizar información, etc... Lleva un
montón de trabajo crearla y más aún mantenerla.
El índice de búsqueda de AltaVista no tiene categorías. Lo que se almacena es el texto, no información acerca de ese
texto. Una búsqueda hace un correspondencia directa uno a uno con el texto que aparece en las páginas web, no con
descripciones publicitarias de esas páginas.
1
En los primeros tiempos de la Web, muchos sitios estaban diseñados como historias de aventuras. Se esperaba que el
usuario entrara en la página principal y siguiera la navegación de vínculos presentada por el diseñador, con opciones
limitadas y restricciones a la hora de navegar.
Hoy en día, si el contenido de su sitio está incluido en los motores de búsqueda, mucha gente no pasa por la página
principal. Cualquier página puede ser un potencial punto de entrada. Una página principal no es nada especial. Todas
las páginas creadas son iguales, al menos en lo que respecta a los motores de búsqueda.
Como el tráfico que puede llegar a su sitio puede venir de cualquier motor de búsqueda debe prestar atención a todas
las páginas de su sitio web.
AltaVista basa su ranking, más o menos, en los siguientes factores:
- Las páginas largas con mucho texto significativo.
- Páginas con un buen sistema de navegación, con un montón de vínculos a páginas con contenido relacionado.
- La conectividad de las páginas, incluyendo no sólo cuantos vínculos hay hacia una página sino también desde
dónde vienen los vínculos; el número de distintos dominios y la "calidad" de esos sitios desde los que apuntan los
vínculos. Un sitio o página es "bueno" si muchas páginas apuntan a ella y especialmente si muchos buenos "sitios"
apuntan a ella.
- El nivel de directorio donde se encuentra la página. Los más altos son considerados como más importantes. Si una
página está muy al fondo, el espía no irá tan abajo y nunca la encontrará. Estos factores estáticos son recalculados
una vez a la semana, y según vaya mejorando la página irá subiendo en el ranking.
- Indexar correctamente el sitio
AltaVista no indexa todo. De hecho, algunas características que los diseñadores de web añaden a sus sitios con gran
esfuerzo, pueden llegar a bloquear los robots, lo que supone que esas páginas nunca serán indexadas y nunca serán
encontradas a través de los motores de búsqueda.
En definitiva, esos sitios suelen terminar gastando dinero en promoción que en principio no estaba previsto.
Prestando atención a cómo funcionan los espías y motores de búsqueda puedes conseguir más visitas al mínimo
coste.
- Sugerencias para el registro de una página web en el buscador Altavista
Altavista toma principalmente de la Tag "Description" y de la Tag "Title" de su código HTML las palabras para
indexar su sitio, por lo tanto le aconsejamos que utilice en esta descripción todas las palabras por las cuales desee ser
hallado por los navegantes. Y que el título de su sitio web contenga al menos la palabra más importante que lo
describa. Mostrará hasta 1,024 caracteres.
A falta de la TAG "Description", Altavista tomará de las palabras clave que ingrese en su código HTML algunas y
las incluirá en un índice para mostrar luego su sitio en los resultados. Por lo tanto le sugerimos también prestar
especial atención a las primeras palabras clave que utilice.
No utilice datos de su URL como palabras clave, ej.: "http://www....", ya que Altavista no indexa esto correctamente.
Use las etiquetas corrientes, tales como palabras que usted pueda suponer que utilizarán sus futuros visitantes para
encontrarlo. Ej: si posee una página de recetas de cocina, use: cocina, alimento, cocinar, comida, etc. Pero nunca la
dirección de su página.
Recuerde que el nombre de las URL's es considerado distinto según emplee mayúsculas o minúsculas, es decir, las
mayúsculas y las minúsculas son consideradas letras diferentes. Vigile siempre éste detalle antes de pedir su
incorporación.
2
Si por algún motivo no desea que su sitio sea indexado, o evitar que lo sean páginas concretas del mismo, debe crear
un archivo llamado robot.txt dentro de su servidor, que debe contener lo siguiente:
User-agent: scooter # AltaVista web page search
Disallow: /directorio/subdirectorio/
No utilice palabras clave repetidas en grandes cantidades, o palabras clave que no guarden relación con el contenido
verdadero de su sitio web. Altavista, al igual que otros buscadores, ha detectado esta forma de quedar incluído en los
primeros puestos y desalienta estas maniobras dejando sin efecto su registro y en el caso en que detecte un abuso,
todas sus páginas serán eliminadas de este Buscador.
Altavista utiliza un robot de búsqueda (a diferencia de los directorios, que necesitan de la inclusión manual de cada
una de las páginas que constituyen su web), por lo que indexa también los enlaces que encuentre en su página. La
mejor manera de tener éxito en este proceso es tener un sitio diseñado de forma clara, que facilite el trabajo del robot.
Una vez que se ingrese la URL principal, serán indexadas (luego de un tiempo) todos los enlaces que encuentre,
incluyendo sus subdirectorios. A partir de ese momento todo su sitio quedará indexado, por lo que no es necesario
registrar cada página individualmente.
La dificultad con éste modo de trabajo, es la lentitud del proceso, por lo cual, puede estar interesado en rellenar el
formulario para varias de sus páginas principales, logrando así aparecer indexado en menor plazo.
Existe también una restricción para aquellas páginas que se hallan ubicadas en un servidores gratuitos, por lo que si
le aparece un mensaje de error por haber registrado demasiadas páginas, le sugerimos que continúe con el registro al
día siguiente.
Una vez registrado en el sitio específico, al poco tiempo será incorporado en todos los sitios regionales que están
enlazados con este buscador.
Se aconseja que compruebe una vez realizado todo el proceso y pasado un plazo prudencial, si su sitio figura donde
Ud. desea.
-
-
Si tus páginas están bien indexadas en AltaVista, puedes usar el propio motor de búsqueda como
herramienta para comprobar tu sitio y arreglar los problemas que hubieras podido encontrar.
Buscando host: seguido de tu nombre de dominio te dará una lista de todas las páginas de tu sitio web que
se encuentran en el índice de AltaVista. Si la lista es relativamente pequeña, puedes ver fácilmente las
páginas a las que les falte el título u otro tipo de problemas. También puedes ver las fechas y determinar qué
páginas están obsoletas.
Si has cambiado algún nombre de dominio o nombres de directorio en algún momento, haz una búsqueda
por link: seguido de la dirección antigua para encontrar si quedan páginas (tanto dentro de tu sitio como en
cualquier otro) que todavía vinculen a tu antigua dirección. Puedes arreglar inmediatamente esos vínculos
obsoletos dentro de tu sitio o contactar con los webmasters de los otros sitios para actualicen sus
hipervínculos.
- Resultados de la búsqueda
Hay cientos de millones de páginas, así qué cualquier búsqueda es susceptible de tener un gran número de páginas de
resultado. Para que los resultados de búsqueda sean útiles, los motores de búsqueda deben puntuar más alto las
páginas que tienen un contenido más relevante de acuerdo a la petición de búsqueda.
La forma en que AltaVista hace esto es un secreto (como la fórmula de la Coca-cola) y está sujeta a continuas
mejoras.
3
Descargar