Propuesta de Mejoras al Servidor SIGGEN Mejoras de Rendimiento 1. Implementar un mecanismo de Cache que permita disminuir las transferencias de datos en las consultas a NCBI GenBank: 3 Semanas (1) * Comparar y Seleccionar una técnica adecuada de implementación del cache de secuencias. Producto de un rápido proceso de investigación con el objeto de conocer mecanismos que podrían utilizarse en el sistema de caché SIGGEN, se conocieron dos niveles a los cuales se podría implementación: El caché de objetos que conllevaría a una modificación de la aplicación ya implementada y la implementación de un servlet filter que serviría como mecanismo de caché sin alterar el código ya realizado, interceptando las peticiones al servlet http y determinar en el filter si la pericón debe ser servida desde caché o procesada por el servlet. Implementación de las mejoras al Servlet con la técnica para Cache seleccionada anteriormente. Debido a las ventajas que conlleva no realizar modificaciones a la aplicación, se eligió implementar un servlet filter para el manejo del caché. Producto de un rápido proceso de investigación se obtuvo dos bibliotecas suficientemente desarrolladas en software libre para la implementación de caché: OSCache, JCACHE (JSR107) y Apache JCS. Por características como vigencia del desarrollo y orientación a aplicaciones Web se escogió OSCache y se realizó la implementación del servlet filter con esta biblioteca, que permite configurar el medio de almacenamiento del caché (Memoria y/o Disco), tiempo de vigencia del caché, algoritmo de descarte de caché (LRU, FIFO), clusterin, caché de objetos dinámicos y tolerancia a fallos. 2. Mejorar la eficiencia del servicio de obtención y sincronización de datos de taxonomías desde GenBank: 8 Semanas (1) 3. Buscar mecanismos de comparación o anclaje con las bases de datos Genéticas que puedan ser usados para la sincronización de datos de taxonomías. Se identificó un filtro del servicio web Entrez de NCBI que podría servir como ancla de sincronización de las taxonomías, el filtro es llamado “entrezDate” y permite obtener las taxonomías por la fecha de introducción a GenBank. Implementar técnicas a través de los mecanismos de anclaje que permitan evitar la descarga completa del archivo taxonomías y comparación campo a campo de los datos para la sincronización. Integrar el Servidor de SIGGEN con el cliente SIGGEN. 6 Semanas (1) Revisión de los casos de uso comunes e intercambio de datos que llevan a cabo el cliente y el servidor SIGGEN. Producto de la revisión del sistema de intercambio de datos, se determinó que el mapa debe ser generado a partir del GML servido por el WFS y no obtenido del WMS, debido a que el WMS solo permite generar mapas de las diferentes capas sin la aplicación de ningún tipo de filtro, siendo el filtrado asunto vital para SIGGEN. Implementar pruebas que permitan verificar la interoperabilidad de las aplicaciones. Incluir opciones de compresión en la transferencia de datos entre el cliente y el servidor. Aprovechando nuevamente las ventajas de los servlet filter y la capacidades de compresión soportadas por el protocolo http, se implementó la compresión de datos en formato gzip en la transferencia de datos entre cliente y servidor. La compresión es opcional y puede ser activada o desactivada a petición del cliente mediante el campo “support-encondig” de la cabecera http. Elaborado por: William Moreno. Junio 2004, Proyecto Bioinformantes. * Los Números entre paréntesis indican la prioridad de la actividad, siendo 1 de mayor peso.