Análisis del tráfico externo de http://fai.unne.edu.ar/biologia, portal

Anuncio
Análisis del tráfico externo de http://fai.unne.edu.ar/biologia,
portal vertical Hipertextos del Area de la Biología
Garro, Oscar1 - Raisman, J.1 - Gonzalez, A. M.1-2
1.Facultad de Agroindustrias - UNNE.
Cdte. Fernández 755 - (3700) Pcia. R. Sáenz Peña - Chaco - Argentina.
E-mail: [email protected]
2.Facultad de Ciencias Agrarias - UNNE.
ANTECEDENTES
El portal vertical Hipertextos del Área de la Biología se estructura en su forma actual basado en la experiencia
reunida en años anteriores (1, 2) y constituye la puerta de entrada de un sitio sin fines de lucro, destinado a la
enseñanza de la biología, que se actualiza de manera permanente. Existe una versión en CD que se distribuye sin
cargo a requerimiento de los interesados.
A fin de conocer la incidencia de uso de este sitio fuera del entorno de la Universidad Nacional del Nordeste se
realizó el análisis del tráfico de usuarios y sus características. El objetivo de este estudio es conocer el grado de
interés que despiertan los diferentes temas y las diversas modalidades de presentación de la información.
MATERIAL Y METODO
El sitio presenta 100 MB de información organizada en unos 1400 archivos, siendo 450 de ellos archivos de
texto y el resto archivos de imagen y animaciones (.gif, .jpg y flash), aunque estos números son variables en
razón de su constante actualización. Se encuentra instalado en un equipo servidor con sistema operativo Linux
Red Hat (3) en el que se ejecuta el servicio de paginas web con el software Apache (4). Para el análisis de los
accesos se utilizo el registro que genera el programa, estos registros se transfirieron a un manejador de base de
datos Postgress (5) en los que se realizaron las consultas en lenguaje SQL. Semanalmente se ejecuta un
programa de análisis estadístico de la utilización del sitio con el Software WhoDidWhat (6).
Datos de tráfico: Se utilizaron los datos Tráfico en el punto central de la Intranet de la Universidad, en el Router
Cisco 4000 http://febo.unne.edu.ar/trafico.html.
Análisis del Tráfico, Fac. de Agroindustrias http://febo.unne.edu.ar/runne1.unne.edu.ar.10.html.
La recopilación de datos de utilización del enlace Sáenz Peña-Corrientes se realizo con el software MRTG(7).
RESULTADOS
Se analizaron los siguientes parámetros: utilización del enlace, distribución mensual, semanal y horaria, número
de página solicitadas, directorios con mayor numero de solicitudes y origen de las solicitudes recibidas por el
server.
MEGABITES
TRANSFERIDOS
1. Variación de la transferencia de información: desde la remodelación del sitio (agosto de 2000) a julio de
2001, agrupándolos en períodos de cuatro semanas. Los resultados se muestran en el siguiente gráfico:
8000
7000
6000
5000
4000
3000
2000
1000
0
1
2
3
4
5
6
7
8
PERIODO
9 10 11 12
Los datos muestran en los primeros períodos un incremento exponencial de accesos al sitio. Posiblemente los
valores correspondientes a los períodos 10 y 11 coincidan con la capacidad máxima de transferencia de
información, en el formato en que se presenta los contenidos, y la disponibilidad de ancho de banda para la
transferencia de datos en el contexto actual de la red de la Universidad Nacional del Nordeste. La caída en el
último mes coincide con el período de vacaciones en USA y España, principales usuarios.
2. Distribución diaria de las transferencias realizadas: Se utilizaron para ello los registros del mes de mayo, a
lo largo del cual se registraron transferencias por un total de 6703 MB.
25.00%
20.00%
15.00%
10.00%
5.00%
sábado
viernes
jueves
miercoles
martes
lunes
domingo
0.00%
Los datos indican una transferencia de datos equilibrada a lo largo de los días laborables de la semana, con una
ligera disminución en los fines de semana.
3. Requerimientos a lo largo del día: al igual que en el caso anterior se utilizaron los registros del mes de
mayo de 2001.
4
2
24
22
20
18
16
14
12
10
8
6
9.00%
8.00%
7.00%
6.00%
5.00%
4.00%
3.00%
2.00%
1.00%
0.00%
El análisis muestra una curva en forma de una campana de Gauss con un pico de transferencias alrededor de las
18 hs. Esto corresponde aproximadamente a unos 10 MB transferidos en el curso de la hora pico y esto equivale
a aproximadamente a unos 16MB o sea un 10% de la capacidad de transferencia de la red UNNE por hora.
4. Cantidad de páginas visitadas (agosto 2000-julio 2001):
• A través del portal (http://fai.unne.edu.ar/biologia): 14.924 entradas. Esto es indicativo del grado de
reconocimiento como portal de acceso por parte de otros sitios que apuntan con sus enlaces al mismo y
de usuarios particulares.
• A través de las 450 páginas web (http://fai.unne.edu.ar/biologia/página1-450.htm): 264.922 entradas.
Esto es indicativo del grado de reconocimiento por los buscadores de los temas desarrollados en el sitio
y que son clasificados por los mismos.
5.Usuarios
Con el objeto de cuantificar el comportamiento de los usuarios evitando una superestimación del número de los
mismos se definió como un “USUARIO” como una misma dirección IP cuyo acceso es registrado por nuestro
servidor en un mismo día. Es esta definición se han excluido a los que provienen de servidores proxi.
En el curso de los meses estudiados registramos un total de 49.886 “usuarios” que consultaron el sitio y
registran el comportamiento graficado en la tabla siguiente
60%
50%
40%
30%
20%
10%
100 a 400
21 a 100
16 a 20
2a5
6 a 15
0%
1
Porcentaje de usuarios que accede
Porcentaje de "usuarios" que consulta una
cantidad de páginas
Número de páginas
El 51.92% de los usuarios consulta una pagina, el 36,11% de 2 a 5 páginas, un 9,10% consulta hasta 20 páginas.
Consultan hasta 100 páginas alrededor de un 1% y, finalmente casos esporádicos (alrededor de un 0,3 % )que
consultaron en un día mas de 100 páginas.
6. Temas con mayores accesos: son indicativos del grado de interés de los usuarios por determinados tópicos y
del reconocimiento por los buscadores de que dichos temas se encuentran en nuestro servidor.
Directorios
Accesos
Temas
/planta/
37344
Anatomía y fisiología vegetal
/cel_euca/
36506
Célula Eucariota
/macromoleculas/
29482
Macromoléculas biológicas
/metabolismo/
23404
Metabolismo
/celulamit/
20066
Célula (traducción del M.I.T).
/bacterias/
14613
Célula Procariota
/evolucion/
13700
Evolución
/introduccion/
12327
La naturaleza de la Ciencia y la Biología
/genetica/
10094
Genética
/adn/
9399
ADN y Síntesis proteica
/sintesis/
4698
Directorio con las animaciones
7. Origen de los pedidos de transferencia
Porcentaje de accesos por país
35.00%
30.00%
25.00%
20.00%
15.00%
10.00%
5.00%
Otros
Ecuador
Portugal
Venezuela
Peru
Colombia
Chile
Argentina
España
Mexico
U.S.A
0.00%
Los datos corresponden a 96.679 conexiones que pudieron ser resultas hasta el nivel de país utilizando la
herramienta nslooup del sistema operativo que busca en los servidores de nombres de dominio (DNS) de
Internet. Si bien pudiere sorprender el hecho que el mayor porcentaje de accesos provenga de USA debe tenerse
en cuenta el aumento de la población hispano parlante en dicho país.
CONCLUSIONES
Los datos obtenidos de este estudio permiten inferir las siguientes conclusiones:
• Este sitio es una gran vidriera que lleva la información de nuestra Universidad a usuarios de habla
hispana distribuidos en el mundo, contribuyendo de esta manera a las tareas de Extensión de la
Universidad Nacional del Nordeste.
• Con las disponibilidades actuales de red es posible transferir sin mayores problemas la información
existente en nuestro sitio, sin embargo si tenemos en cuenta la continua incorporación de contenidos
propios y de nuevos sitios (Morfología, Virología etc.) se hace necesario ponderar adecuadamente la
capacidad del equipo servidor y las necesidades de ancho de banda en los enlaces.
• Con los números actuales de tráfico del sitio de Biología habría que prever la optimización del uso del
ancho de banda ya que solo los Hipertextos del Área de la Biología utilizan en las horas pico el 10% del
mismo.
• Estos resultados pueden contribuir a las extrapolaciones de los requerimientos técnicos y condiciones de
uso para el establecimiento de contenidos pedagógicos virtuales en Facultad y Universidad.
BIBLIOGRAFIA
1.-Hipertextos del Área de la Biología. Gonzalez, Ana María - Raisman, J. S. Comunicaciones Científicas y
Tecnológicas 2000 http://www.unne.edu.ar/cyt/2000/cyt.htm
2.-Hipertextos del área de la Biología. BIOCELL 25(1):91. 2001
3.-Red Hat 6.2 http://www.redhat.com
4.-The Apache Software Foundation http://www.apache.org
5.-Postgres 6.4 http://www.postgresql.org
6.-WhoDidWhat® - Web Server access statistics generator http://www.fikus.com
7.-MRTG 2.5.4 Multi Router Traffic Grapher http://ee-taff.ethz.ch/~oetiker/webtools/mrtg/mrtg.html
Descargar