Funcionamiento del buscador Altavista - Introducción El Índice de AltaVista se construye enviando "espías" (programas robot) que capturan texto y lo almacenan. En este proceso no interviene ninguna acción humana ni juicio. Lo que ven es lo que almacenan. El principal espía, "Scooter", recoge miles de peticiones http simultáneamente como si fueran miles de usuarios picando texto, almacenándolo y enviándolo a las máquinas indexadoras para que el texto pueda ser clasificado. "Scooter" tiene "primos", otros espías que realizan tareas específica para ayudar a mantener el índice actualizado, cómo, por ejemplo, comprobar vínculos rotos -páginas que se han movido o borrado y no serán indexadas. ¿Cómo sabe Scooter dónde tiene que ir? Sigue los vínculos que se encuentra en las páginas que visita. Cuando una página es capturada, los vínculos desde esa página se almacenan en una lista. En teoría, no es necesario describir a AltaVista su sitio: el resto del sitio se encontrará automáticamente. En un día normal, Scooter y sus primos visitan más de 10 millones de páginas. Aún así, éste un juego aleatorio con cientos de miles de Página. Aquellas páginas hacia las que apunten vínculos desde otros sitios serán encontradas frecuentemente por Scooter. Las páginas con pocos vínculos serán encontradas en una semana, un mes, seis meses o incluso más tarde. Las páginas sin vínculos no serán encontradas nunca. - Añadir y eliminar direcciones de páginas web (URL) Al añadir su página al índice de Altavista, un espía visitará automáticamente esa página y la llevará a las máquinas de búsqueda para añadirla al índice. Tenga en cuenta que no es necesario tener una identidad especial para añadir tu página. AltaVista no es un directorio como Yahoo!, donde la persona que añade la página debe proveer la información y probar que es quien dice ser; simplemente se sugiere una dirección URL para que el espía la visite y recoja cualquier texto que se encuentre en esa dirección. Todo lo que sabe el espía es lo que se encuentra en la página, no lo que le hayamos dicho. Si ha cambiado la estructura de directorios de su sitio web, puede introducir la URL de todas las direcciones antiguas para eliminar la información antigua del índice. Después puede añadir las direcciones de las nuevas páginas. - Propiedades del buscador de Altavista Las grandes empresas malinterpretan a menudo cómo funciona AltaVista. Algunos Webmasters piensan que AltaVista y otros motores de búsqueda buscan sólo a través de la información que se encuentran en las etiquetas META - palabras clave incrustadas en la cabecera de un documento HTML. Piensan que solo esas "palabras clave" son importantes y están equivocados. Esto no es así. Las bases de datos utilizan palabras clave. Con bases de datos se necesita organizar la información para encontrarla después, pero AltaVista es un índice de texto. Cada palabra en cada página importa, y no solo palabras individuales, sino el orden de esas palabras al igual que las frases. El uso creativo de distintas combinaciones de búsqueda pueden producir resultados interesantes e inesperados. Mucha gente tiende a pensar que la única manera de organizar grandes cantidades de información es a través de bases de datos. Configurar una base de datos requiere definir campos, categorizar información, etc... Lleva un montón de trabajo crearla y más aún mantenerla. El índice de búsqueda de AltaVista no tiene categorías. Lo que se almacena es el texto, no información acerca de ese texto. Una búsqueda hace un correspondencia directa uno a uno con el texto que aparece en las páginas web, no con descripciones publicitarias de esas páginas. 1 En los primeros tiempos de la Web, muchos sitios estaban diseñados como historias de aventuras. Se esperaba que el usuario entrara en la página principal y siguiera la navegación de vínculos presentada por el diseñador, con opciones limitadas y restricciones a la hora de navegar. Hoy en día, si el contenido de su sitio está incluido en los motores de búsqueda, mucha gente no pasa por la página principal. Cualquier página puede ser un potencial punto de entrada. Una página principal no es nada especial. Todas las páginas creadas son iguales, al menos en lo que respecta a los motores de búsqueda. Como el tráfico que puede llegar a su sitio puede venir de cualquier motor de búsqueda debe prestar atención a todas las páginas de su sitio web. AltaVista basa su ranking, más o menos, en los siguientes factores: - Las páginas largas con mucho texto significativo. - Páginas con un buen sistema de navegación, con un montón de vínculos a páginas con contenido relacionado. - La conectividad de las páginas, incluyendo no sólo cuantos vínculos hay hacia una página sino también desde dónde vienen los vínculos; el número de distintos dominios y la "calidad" de esos sitios desde los que apuntan los vínculos. Un sitio o página es "bueno" si muchas páginas apuntan a ella y especialmente si muchos buenos "sitios" apuntan a ella. - El nivel de directorio donde se encuentra la página. Los más altos son considerados como más importantes. Si una página está muy al fondo, el espía no irá tan abajo y nunca la encontrará. Estos factores estáticos son recalculados una vez a la semana, y según vaya mejorando la página irá subiendo en el ranking. - Indexar correctamente el sitio AltaVista no indexa todo. De hecho, algunas características que los diseñadores de web añaden a sus sitios con gran esfuerzo, pueden llegar a bloquear los robots, lo que supone que esas páginas nunca serán indexadas y nunca serán encontradas a través de los motores de búsqueda. En definitiva, esos sitios suelen terminar gastando dinero en promoción que en principio no estaba previsto. Prestando atención a cómo funcionan los espías y motores de búsqueda puedes conseguir más visitas al mínimo coste. - Sugerencias para el registro de una página web en el buscador Altavista Altavista toma principalmente de la Tag "Description" y de la Tag "Title" de su código HTML las palabras para indexar su sitio, por lo tanto le aconsejamos que utilice en esta descripción todas las palabras por las cuales desee ser hallado por los navegantes. Y que el título de su sitio web contenga al menos la palabra más importante que lo describa. Mostrará hasta 1,024 caracteres. A falta de la TAG "Description", Altavista tomará de las palabras clave que ingrese en su código HTML algunas y las incluirá en un índice para mostrar luego su sitio en los resultados. Por lo tanto le sugerimos también prestar especial atención a las primeras palabras clave que utilice. No utilice datos de su URL como palabras clave, ej.: "http://www....", ya que Altavista no indexa esto correctamente. Use las etiquetas corrientes, tales como palabras que usted pueda suponer que utilizarán sus futuros visitantes para encontrarlo. Ej: si posee una página de recetas de cocina, use: cocina, alimento, cocinar, comida, etc. Pero nunca la dirección de su página. Recuerde que el nombre de las URL's es considerado distinto según emplee mayúsculas o minúsculas, es decir, las mayúsculas y las minúsculas son consideradas letras diferentes. Vigile siempre éste detalle antes de pedir su incorporación. 2 Si por algún motivo no desea que su sitio sea indexado, o evitar que lo sean páginas concretas del mismo, debe crear un archivo llamado robot.txt dentro de su servidor, que debe contener lo siguiente: User-agent: scooter # AltaVista web page search Disallow: /directorio/subdirectorio/ No utilice palabras clave repetidas en grandes cantidades, o palabras clave que no guarden relación con el contenido verdadero de su sitio web. Altavista, al igual que otros buscadores, ha detectado esta forma de quedar incluído en los primeros puestos y desalienta estas maniobras dejando sin efecto su registro y en el caso en que detecte un abuso, todas sus páginas serán eliminadas de este Buscador. Altavista utiliza un robot de búsqueda (a diferencia de los directorios, que necesitan de la inclusión manual de cada una de las páginas que constituyen su web), por lo que indexa también los enlaces que encuentre en su página. La mejor manera de tener éxito en este proceso es tener un sitio diseñado de forma clara, que facilite el trabajo del robot. Una vez que se ingrese la URL principal, serán indexadas (luego de un tiempo) todos los enlaces que encuentre, incluyendo sus subdirectorios. A partir de ese momento todo su sitio quedará indexado, por lo que no es necesario registrar cada página individualmente. La dificultad con éste modo de trabajo, es la lentitud del proceso, por lo cual, puede estar interesado en rellenar el formulario para varias de sus páginas principales, logrando así aparecer indexado en menor plazo. Existe también una restricción para aquellas páginas que se hallan ubicadas en un servidores gratuitos, por lo que si le aparece un mensaje de error por haber registrado demasiadas páginas, le sugerimos que continúe con el registro al día siguiente. Una vez registrado en el sitio específico, al poco tiempo será incorporado en todos los sitios regionales que están enlazados con este buscador. Se aconseja que compruebe una vez realizado todo el proceso y pasado un plazo prudencial, si su sitio figura donde Ud. desea. - - Si tus páginas están bien indexadas en AltaVista, puedes usar el propio motor de búsqueda como herramienta para comprobar tu sitio y arreglar los problemas que hubieras podido encontrar. Buscando host: seguido de tu nombre de dominio te dará una lista de todas las páginas de tu sitio web que se encuentran en el índice de AltaVista. Si la lista es relativamente pequeña, puedes ver fácilmente las páginas a las que les falte el título u otro tipo de problemas. También puedes ver las fechas y determinar qué páginas están obsoletas. Si has cambiado algún nombre de dominio o nombres de directorio en algún momento, haz una búsqueda por link: seguido de la dirección antigua para encontrar si quedan páginas (tanto dentro de tu sitio como en cualquier otro) que todavía vinculen a tu antigua dirección. Puedes arreglar inmediatamente esos vínculos obsoletos dentro de tu sitio o contactar con los webmasters de los otros sitios para actualicen sus hipervínculos. - Resultados de la búsqueda Hay cientos de millones de páginas, así qué cualquier búsqueda es susceptible de tener un gran número de páginas de resultado. Para que los resultados de búsqueda sean útiles, los motores de búsqueda deben puntuar más alto las páginas que tienen un contenido más relevante de acuerdo a la petición de búsqueda. La forma en que AltaVista hace esto es un secreto (como la fórmula de la Coca-cola) y está sujeta a continuas mejoras. 3