Análisis del tráfico externo de http://fai.unne.edu.ar/biologia, portal vertical Hipertextos del Area de la Biología Garro, Oscar1 - Raisman, J.1 - Gonzalez, A. M.1-2 1.Facultad de Agroindustrias - UNNE. Cdte. Fernández 755 - (3700) Pcia. R. Sáenz Peña - Chaco - Argentina. E-mail: [email protected] 2.Facultad de Ciencias Agrarias - UNNE. ANTECEDENTES El portal vertical Hipertextos del Área de la Biología se estructura en su forma actual basado en la experiencia reunida en años anteriores (1, 2) y constituye la puerta de entrada de un sitio sin fines de lucro, destinado a la enseñanza de la biología, que se actualiza de manera permanente. Existe una versión en CD que se distribuye sin cargo a requerimiento de los interesados. A fin de conocer la incidencia de uso de este sitio fuera del entorno de la Universidad Nacional del Nordeste se realizó el análisis del tráfico de usuarios y sus características. El objetivo de este estudio es conocer el grado de interés que despiertan los diferentes temas y las diversas modalidades de presentación de la información. MATERIAL Y METODO El sitio presenta 100 MB de información organizada en unos 1400 archivos, siendo 450 de ellos archivos de texto y el resto archivos de imagen y animaciones (.gif, .jpg y flash), aunque estos números son variables en razón de su constante actualización. Se encuentra instalado en un equipo servidor con sistema operativo Linux Red Hat (3) en el que se ejecuta el servicio de paginas web con el software Apache (4). Para el análisis de los accesos se utilizo el registro que genera el programa, estos registros se transfirieron a un manejador de base de datos Postgress (5) en los que se realizaron las consultas en lenguaje SQL. Semanalmente se ejecuta un programa de análisis estadístico de la utilización del sitio con el Software WhoDidWhat (6). Datos de tráfico: Se utilizaron los datos Tráfico en el punto central de la Intranet de la Universidad, en el Router Cisco 4000 http://febo.unne.edu.ar/trafico.html. Análisis del Tráfico, Fac. de Agroindustrias http://febo.unne.edu.ar/runne1.unne.edu.ar.10.html. La recopilación de datos de utilización del enlace Sáenz Peña-Corrientes se realizo con el software MRTG(7). RESULTADOS Se analizaron los siguientes parámetros: utilización del enlace, distribución mensual, semanal y horaria, número de página solicitadas, directorios con mayor numero de solicitudes y origen de las solicitudes recibidas por el server. MEGABITES TRANSFERIDOS 1. Variación de la transferencia de información: desde la remodelación del sitio (agosto de 2000) a julio de 2001, agrupándolos en períodos de cuatro semanas. Los resultados se muestran en el siguiente gráfico: 8000 7000 6000 5000 4000 3000 2000 1000 0 1 2 3 4 5 6 7 8 PERIODO 9 10 11 12 Los datos muestran en los primeros períodos un incremento exponencial de accesos al sitio. Posiblemente los valores correspondientes a los períodos 10 y 11 coincidan con la capacidad máxima de transferencia de información, en el formato en que se presenta los contenidos, y la disponibilidad de ancho de banda para la transferencia de datos en el contexto actual de la red de la Universidad Nacional del Nordeste. La caída en el último mes coincide con el período de vacaciones en USA y España, principales usuarios. 2. Distribución diaria de las transferencias realizadas: Se utilizaron para ello los registros del mes de mayo, a lo largo del cual se registraron transferencias por un total de 6703 MB. 25.00% 20.00% 15.00% 10.00% 5.00% sábado viernes jueves miercoles martes lunes domingo 0.00% Los datos indican una transferencia de datos equilibrada a lo largo de los días laborables de la semana, con una ligera disminución en los fines de semana. 3. Requerimientos a lo largo del día: al igual que en el caso anterior se utilizaron los registros del mes de mayo de 2001. 4 2 24 22 20 18 16 14 12 10 8 6 9.00% 8.00% 7.00% 6.00% 5.00% 4.00% 3.00% 2.00% 1.00% 0.00% El análisis muestra una curva en forma de una campana de Gauss con un pico de transferencias alrededor de las 18 hs. Esto corresponde aproximadamente a unos 10 MB transferidos en el curso de la hora pico y esto equivale a aproximadamente a unos 16MB o sea un 10% de la capacidad de transferencia de la red UNNE por hora. 4. Cantidad de páginas visitadas (agosto 2000-julio 2001): • A través del portal (http://fai.unne.edu.ar/biologia): 14.924 entradas. Esto es indicativo del grado de reconocimiento como portal de acceso por parte de otros sitios que apuntan con sus enlaces al mismo y de usuarios particulares. • A través de las 450 páginas web (http://fai.unne.edu.ar/biologia/página1-450.htm): 264.922 entradas. Esto es indicativo del grado de reconocimiento por los buscadores de los temas desarrollados en el sitio y que son clasificados por los mismos. 5.Usuarios Con el objeto de cuantificar el comportamiento de los usuarios evitando una superestimación del número de los mismos se definió como un “USUARIO” como una misma dirección IP cuyo acceso es registrado por nuestro servidor en un mismo día. Es esta definición se han excluido a los que provienen de servidores proxi. En el curso de los meses estudiados registramos un total de 49.886 “usuarios” que consultaron el sitio y registran el comportamiento graficado en la tabla siguiente 60% 50% 40% 30% 20% 10% 100 a 400 21 a 100 16 a 20 2a5 6 a 15 0% 1 Porcentaje de usuarios que accede Porcentaje de "usuarios" que consulta una cantidad de páginas Número de páginas El 51.92% de los usuarios consulta una pagina, el 36,11% de 2 a 5 páginas, un 9,10% consulta hasta 20 páginas. Consultan hasta 100 páginas alrededor de un 1% y, finalmente casos esporádicos (alrededor de un 0,3 % )que consultaron en un día mas de 100 páginas. 6. Temas con mayores accesos: son indicativos del grado de interés de los usuarios por determinados tópicos y del reconocimiento por los buscadores de que dichos temas se encuentran en nuestro servidor. Directorios Accesos Temas /planta/ 37344 Anatomía y fisiología vegetal /cel_euca/ 36506 Célula Eucariota /macromoleculas/ 29482 Macromoléculas biológicas /metabolismo/ 23404 Metabolismo /celulamit/ 20066 Célula (traducción del M.I.T). /bacterias/ 14613 Célula Procariota /evolucion/ 13700 Evolución /introduccion/ 12327 La naturaleza de la Ciencia y la Biología /genetica/ 10094 Genética /adn/ 9399 ADN y Síntesis proteica /sintesis/ 4698 Directorio con las animaciones 7. Origen de los pedidos de transferencia Porcentaje de accesos por país 35.00% 30.00% 25.00% 20.00% 15.00% 10.00% 5.00% Otros Ecuador Portugal Venezuela Peru Colombia Chile Argentina España Mexico U.S.A 0.00% Los datos corresponden a 96.679 conexiones que pudieron ser resultas hasta el nivel de país utilizando la herramienta nslooup del sistema operativo que busca en los servidores de nombres de dominio (DNS) de Internet. Si bien pudiere sorprender el hecho que el mayor porcentaje de accesos provenga de USA debe tenerse en cuenta el aumento de la población hispano parlante en dicho país. CONCLUSIONES Los datos obtenidos de este estudio permiten inferir las siguientes conclusiones: • Este sitio es una gran vidriera que lleva la información de nuestra Universidad a usuarios de habla hispana distribuidos en el mundo, contribuyendo de esta manera a las tareas de Extensión de la Universidad Nacional del Nordeste. • Con las disponibilidades actuales de red es posible transferir sin mayores problemas la información existente en nuestro sitio, sin embargo si tenemos en cuenta la continua incorporación de contenidos propios y de nuevos sitios (Morfología, Virología etc.) se hace necesario ponderar adecuadamente la capacidad del equipo servidor y las necesidades de ancho de banda en los enlaces. • Con los números actuales de tráfico del sitio de Biología habría que prever la optimización del uso del ancho de banda ya que solo los Hipertextos del Área de la Biología utilizan en las horas pico el 10% del mismo. • Estos resultados pueden contribuir a las extrapolaciones de los requerimientos técnicos y condiciones de uso para el establecimiento de contenidos pedagógicos virtuales en Facultad y Universidad. BIBLIOGRAFIA 1.-Hipertextos del Área de la Biología. Gonzalez, Ana María - Raisman, J. S. Comunicaciones Científicas y Tecnológicas 2000 http://www.unne.edu.ar/cyt/2000/cyt.htm 2.-Hipertextos del área de la Biología. BIOCELL 25(1):91. 2001 3.-Red Hat 6.2 http://www.redhat.com 4.-The Apache Software Foundation http://www.apache.org 5.-Postgres 6.4 http://www.postgresql.org 6.-WhoDidWhat® - Web Server access statistics generator http://www.fikus.com 7.-MRTG 2.5.4 Multi Router Traffic Grapher http://ee-taff.ethz.ch/~oetiker/webtools/mrtg/mrtg.html