Mejoras al Servidor SIGGEN-Informe1

Anuncio
Propuesta de Mejoras al Servidor SIGGEN
Mejoras de Rendimiento
1.
Implementar un mecanismo de Cache que permita disminuir las transferencias de datos en las consultas a NCBI
GenBank: 3 Semanas (1) *
 Comparar y Seleccionar una técnica adecuada de implementación del cache de secuencias.
Producto de un rápido proceso de investigación con el objeto de conocer mecanismos que
podrían utilizarse en el sistema de caché SIGGEN, se conocieron dos niveles a los cuales se
podría implementación: El caché de objetos que conllevaría a una modificación de la
aplicación ya implementada y la implementación de un servlet filter que serviría como
mecanismo de caché sin alterar el código ya realizado, interceptando las peticiones al servlet
http y determinar en el filter si la pericón debe ser servida desde caché o procesada por el
servlet.
 Implementación de las mejoras al Servlet con la técnica para Cache seleccionada anteriormente.
Debido a las ventajas que conlleva no realizar modificaciones a la aplicación, se eligió
implementar un servlet filter para el manejo del caché.
Producto de un rápido proceso de investigación se obtuvo dos bibliotecas suficientemente
desarrolladas en software libre para la implementación de caché: OSCache, JCACHE (JSR107) y Apache JCS. Por características como vigencia del desarrollo y orientación a
aplicaciones Web se escogió OSCache y se realizó la implementación del servlet filter con esta
biblioteca, que permite configurar el medio de almacenamiento del caché (Memoria y/o Disco),
tiempo de vigencia del caché, algoritmo de descarte de caché (LRU, FIFO), clusterin, caché de
objetos dinámicos y tolerancia a fallos.
2.
Mejorar la eficiencia del servicio de obtención y sincronización de datos de taxonomías desde GenBank: 8 Semanas
(1)


3.
Buscar mecanismos de comparación o anclaje con las bases de datos Genéticas que puedan ser usados para
la sincronización de datos de taxonomías.
Se identificó un filtro del servicio web Entrez de NCBI que podría servir como ancla de
sincronización de las taxonomías, el filtro es llamado “entrezDate” y permite obtener las
taxonomías por la fecha de introducción a GenBank.
Implementar técnicas a través de los mecanismos de anclaje que permitan evitar la descarga completa del
archivo taxonomías y comparación campo a campo de los datos para la sincronización.
Integrar el Servidor de SIGGEN con el cliente SIGGEN. 6 Semanas (1)
 Revisión de los casos de uso comunes e intercambio de datos que llevan a cabo el cliente y el servidor
SIGGEN.
Producto de la revisión del sistema de intercambio de datos, se determinó que el mapa debe ser
generado a partir del GML servido por el WFS y no obtenido del WMS, debido a que el WMS
solo permite generar mapas de las diferentes capas sin la aplicación de ningún tipo de filtro,
siendo el filtrado asunto vital para SIGGEN.
 Implementar pruebas que permitan verificar la interoperabilidad de las aplicaciones.
 Incluir opciones de compresión en la transferencia de datos entre el cliente y el servidor.
Aprovechando nuevamente las ventajas de los servlet filter y la capacidades de compresión
soportadas por el protocolo http, se implementó la compresión de datos en formato gzip en la
transferencia de datos entre cliente y servidor. La compresión es opcional y puede ser activada
o desactivada a petición del cliente mediante el campo “support-encondig” de la cabecera http.
Elaborado por: William Moreno.
Junio 2004, Proyecto Bioinformantes.
*
Los Números entre paréntesis indican la prioridad de la actividad, siendo 1 de mayor peso.
Descargar