Luis Caballero Cruz Ingeniería Técnica Informática de Sistemas Universidad de Sevilla SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 3.1- ESTADO DEL ARTE: En este capítulo analizaremos las herramientas o softwares más populares y utilizados que existen en la actualidad donde todos ellos tienen en común un objetivo: la gestión y monitorización de redes, pero la llevan a cabo por diferentes caminos y de forma diferente. Destacaremos una serie de ítems o aspectos interesantes de cada uno, como por ejemplo: historia, versión actual, quién lo ha fabricado y quién lo mantiene, qué licencia tiene, si posee una versión comercial o Enterprise de su producto, si ha recibido algún premio importante, las tecnologías utilizadas en su desarrollo, qué plataformas soporta, sus funcionalidades, su arquitectura y características principales, si tiene interfaz web y qué funciones desempeña y una serie de ventajas e inconvenientes. Finalmente, realizaremos una comparativa global de algunas características para seleccionar una solución final. Diferenciaremos dos grandes grupos de comparativa: herramientas de Software Libre y herramientas Comerciales. Software Libre: Son las herramientas con una distribución libre y generalmente con disponibilidad gratuita, aunque no siempre se cumple esto último. Aun así, el autor establece una licencia para el producto, puesto que no significa que sea de dominio público. Su principal ventaja es su bajo coste de adquisición y la innovación y corrección de errores por parte de cualquier usuario. De este tipo de herramientas, analizaremos las siguientes: › › › › › › › › › Pandora FMS Nagios Hyperic Zabbix Zenoss Ganglia OpenNMS Cacti Munin Software Comercial: Es también conocido como software propietario o privativo y son las herramientas donde el usuario tiene limitaciones en su uso, modificación y redistribución. La persona o compañía que posee los derechos de autor restringe los derechos de usuario y lo utiliza como fuente de productividad constituyendo un acuerdo o contrato con el cliente. De este tipo de herramientas, analizaremos las siguientes: › › › BMC Patrol HP OpenView OVO IBM Tivoli SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 1 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 3.1.1- HERRAMIENTAS DE SOFTWARE LIBRE: La primera herramienta de monitorización a estudiar será Pandora FMS v4.0. Es una herramienta de software libre OpenSource (código abierto) con licencia GPL versión 2 (GNU Public License), la cual está orientada a proteger la libre distribución y modificación de software libre. El proyecto comenzó en 2004 cuando se publicó la primera versión estable 1.0 con el nombre de ‘Pandoramon’. Está desarrollado y mantenido actualmente por la empresa Ártica Soluciones Tecnológicas con base en Madrid. También existe una versión con una licencia comercial, Pandora FMS Enterprise que proporciona numerosas características adicionales, aunque la gran mayoría del código es similar a la versión OpenSource ya que está creada a partir de esta. Se puede obtener por un precio proporcional al número de agentes o nodos instalados. Esta versión incluye además soporte profesional, actualizaciones y mantenimiento mediante el sistema Open Update Manager. Esta aplicación de monitorización sirve para vigilar y analizar de forma visual todo tipo de sistemas y aplicaciones, utilizando una interfaz o entorno web a través de nuestro navegador. Es una herramienta modular y flexible y está orientada datos. Puede supervisar todo tipo de parámetros o servicios, Sistemas Operativos mediante agentes específicos que recolectan información, incluso hasta sensores (por ejemplo: humedad, luminosidad, movimiento), electrónica de red, etc. Bajo los servicios más comunes, puede monitorizar la carga del procesador, espacio libre en disco, uso de memoria, procesos que están corriendo en el sistema. Además, puede detectar si una interfaz de red se ha caído, un ataque de “defacement” en una web incluso un movimiento de un valor en NASDAQ (bolsa de valores automatizada electrónica de EEUU). Puede monitorizar también mediante SNMP (protocolo de intercambio de información entre dispositivos de red), WMI (protocolo ideal para compañías con instalaciones mixtas Linux/Windows) y pruebas de red (TCP/ICMP) y comprobar cualquier sistema hardware con conectividad TCP/IP (protocolo de transmisión y de internet), como por ejemplo, cortafuegos, proxies, bases de datos, VPN (red privada virtual), balanceadores de carga, routers, switches, impresoras, etc. Todo esto controlado mediante notificaciones, las cuales son enviadas mediante correo electrónico o SMS cuando cualquier parámetro establezca un valor incorrecto o por encima del umbral establecido. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 2 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Trabaja bajo una base de datos, actualmente MySQL es el único formato soportado para entornos de producción, aunque se está experimentando para trabajar también con Oracle y PostgreSQL, y es donde almacena todos los datos recibidos por los módulos de los agentes, por lo tanto es el componente más vital de la arquitectura de nuestra herramienta. Estos datos se gestionan automáticamente y no requiere ningún tipo de administración de base de datos ni proceso manual. Se realiza periódicamente una compactación de los datos con una determinada antigüedad. Gracias a esta base de datos, puede generar estadísticas, gráficas, niveles de acuerdo de servicio (SLA – Service Level Agreement), niveles de acuerdo de operación (OLA – Operation Level Agreement) e indicadores clave de rendimiento (KPI – Key Performance Indicators). También puede generar informes, los cuales pueden ser programados en la versión comercial para ser enviados a un correo electrónico de forma recurrente, es decir, de forma diaria o cada semana, cada mes, etc. El formato del informe es el estándar PDF. Cabe mencionar que Pandora FMS no es un sistema de monitorización de entornos críticos, ya que su monitorización no es completamente en tiempo real (+5 segundos). Tampoco es una herramienta de correlación y análisis de logs o eventos. Puede recolectarlos y procesarlos pero no es su función principal. Las iniciales en el nombre de Pandora FMS vienen de Flexible Monitoring System, y de acuerdo con ello, es una herramienta extremadamente flexible, modular y descentralizada. Consta de diversos elementos en su arquitectura, entre ellos, los servidores, que se encargan de recolectar y procesar los datos e introducirlos en la base de datos (todos los servidores acceden a la BD). Son los encargados de realizar las comprobaciones y comparaciones existentes y verifican, de forma constante, si algún elemento tiene algún problema y cambian el estado de los mismos según los resultados obtenidos. Por tanto, son los que avisan mediante alertas para el control del estado de los datos. A continuación, pondrían en ejecución la acción definida en la alerta, como por ejemplo, mandar la notificación o ejecutar un script personalizado. Existen una totalidad de 10 servidores diferentes y especializados en diferentes tareas, de los cuales 7 existen en la versión OpenSource y hay 3 sólo para la versión Enterprise. Todos están integrados en una aplicación, llamada de forma genérica “Pandora Server”, la cual es una aplicación multihilo o multiproceso desarrollada en PERL5 que ejecuta en diferentes subprocesos cada instancia especializada. Cada uno de ellos puede ser monitorizado desde la Consola Web, en la sección de ‘estado de servidores’, observando así su estado. Posee también los elementos llamados agentes, que son aplicaciones que corren en los sistemas y recolectan información para enviárselas a los servidores, en concreto los agentes Windows están desarrollados en C++ y los agentes en Unix en PERL5. Usa un protocolo de comunicación llamado Tentacle para comunicar los agentes con el servidor. Mediante este protocolo lo que se envía es un documento XML que el servidor es capaz de entender y el checksum de ese archivo XML. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 3 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE En la web sourceforge se puede encontrar el código fuente de tentacle, con lo que es fácil compilarlo para cualquier arquitectura. Además, posee como entorno de usuario una Consola Web, que permite la administración y control total de nuestra herramienta con diferentes privilegios según el usuario, como se puede encontrar en la demo disponible en la web oficial, donde encontramos usuarios específicos para monitorización de entornos virtuales, monitorización web o de eficiencia energética, entre otros. Se encarga de visualizar los datos presentes en la base de datos. El servidor de aplicaciones está programado en PHP5 y no requiere la instalación de ningún software adicional: ni Java, ni ActiveX, lo cual lo convierte en una aplicación ligera. No obstante, las gráficas están disponibles en FLASH y para poder verlas en este formato será necesario este complemento para el navegador. La interfaz web está basada en tecnologías como AJAX y HTML5. Posee un sistema de expansión o de extensión (plugins) muy modular que permite aumentar las funcionalidades de los agentes y que pueden desarrollarse en diferentes lenguajes de programación, como por ejemplo VBScript, Java, PowerShell, Perl, Python o Shellscript. Permite realizar batch de pruebas complejas e incorporarlas de una forma sencilla y autónoma, además de que se pueden aprovechar mecanismos de monitorización ya existentes en Pandora para crear otros nuevos. Ilustración 11 – Interfaz o consola web de usuario de Pandora FMS SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 4 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Por último, podemos destacar algunas impresiones personales y puntos fuertes sobre Pandora FMS: Ventajas: - La política de Pandora FMS, y en general de la empresa Ártica ST, al desarrollar un nuevos productos de software libre y realizarlo de forma global, con un código abierto y legible a todas las personas o empresas permite trabajar codo a codo con empresas interesadas o futuros clientes, ya que no solo se les vende el producto, sino que se permite que dichas empresas clientes entren en el desarrollo del producto para sus propios intereses específicos y avanzar hacia el objetivo juntos. Como es el caso en España de Telefónica, en su página web se publica un artículo de cómo fueron las relaciones y la historia del éxito conseguido por ambas partes, donde se puntualiza que ambos equipos, tanto el de Ártica ST como Telefónica, trabajaron conjuntamente para las necesidades del cliente y para adaptar su forma de trabajo a la herramienta. Este cambio ha llevado a Telefónica a utilizar una única herramienta para sustituir lo que se hacía con diferentes soluciones privativas como HP OpenView o IBM Tivoli, homogeneizando así el sistema (una herramienta para diferentes entornos) además de conseguir un ahorro importante en gastos. Además, al ser una herramienta OpenSource que cuenta con una gran comunidad con miles de usuarios en todo el mundo (+5.000) y con más de 500.000 descargas, los tiempos de evaluación de nuevas versiones y posibles nuevos errores es mínimo. Podemos escuchar directamente a Sancho Lerena, jefe de proyecto de Pandora FMS defendiendo esta postura en una entrevista concedida en Intereconomía Business: http://www.youtube.com/watch?v=Bv89wTaFqHM - Es una herramienta que cumple con todas las funcionalidades y la arquitectura de un sistema de monitorización, incluyendo la supervisión en todo tipo de sistemas operativos (multiplataforma en cliente). › NT4, Windows 2000, XP, 2003, Vista, 2008, 7 en 32/64 bits. › HP-UX 11 o superior. › AIX 4.3 o superior. › Solaris. › Linux (cualquier distribución). › NetBSD, FreeBSD, OpenBSD. Este es un factor importante para empresas con servidores con sistemas operativos mixtos, un ejemplo de ello, es la siguiente gráfica disponible en la web oficial donde se muestran las descargas y utilización del sistema en los diferentes sistemas operativos. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 5 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ilustración 12 – Distribución de descargas y Sistemas Operativos monitorizados. - También puede considerarse una herramienta multiplataforma en servidor, con la excepción de que aunque puede instalarse en servidores Windows, no se recomienda en entornos de producción. Además dicha instalación debe realizarse manualmente, ya que el proceso no está automatizado. Existen instrucciones de su configuración para la creación de directorios y pasos a seguir. - Uno de los principales puntales que hacen de Pandora FMS una herramienta excepcional es el fácil uso que presenta su interfaz o consola web, ya que permite controlar totalmente la aplicación de forma intuitiva y amigable, así como realizar tareas de administración y configuración de manera sencilla (sistema GUI). También afecta en su usabilidad la fase de instalación y configuración hasta su puesta a punto, el tiempo que conlleva es menor que la de otros sistemas que estudiaremos a continuación, lo cual realza la facilidad de uso de cara al usuario. Hay disponible una demo para navegar por dicha interfaz web para poder visualizarla sin necesidad de instalarla y para tener una idea del producto: http://firefly.artica.es/pandora_demo/ - En cuanto a su arquitectura, debido a ser un proyecto iniciado hace menos tiempo, podemos intuir que su forma de avanzar hacia su objetivo es distinta y camina con mejor perspectiva hacia el funcionamiento y la consolidación de la herramienta, evitando errores del pasado que ya poseen otros sistemas de monitorización. Por ejemplo, divide en varios procesos las funcionalidades del sistema y utiliza agentes en cada nodo o cliente a monitorizar, aprovechando las ventajas que esto conlleva. Está diseñado para soportar cambios en el sistema y que este no se vea afectado de forma global y posee una buena escalabilidad y potencial para monitorizar una gran red de dispositivos. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 6 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE - Es una herramienta relativamente joven (2004) en comparación con otras aplicaciones descritas en este documento, y aunque por ello se hagan modificaciones, revisiones y nuevos desarrollos en beneficio de la aplicación para corregir bugs y otros errores, se solventan con rapidez y con gran eficacia y hace que el proyecto siga vivo y activo con el paso de los años consolidándose aún más. Esto es llevado a cabo, en parte por una comunidad que da soporte gratuito al usuario de forma muy efectiva desde el foro y la wiki disponible en el sitio web oficial, lo cual es especialmente importante para un usuario sin conocimientos avanzados. - En comparativa con el resto de herramientas que vamos a comparar, el soporte técnico que podríamos recibir sería en castellano, tanto la documentación, su página oficial, ayuda de la comunidad o el soporte comercial en vistas de una mejora del producto Enterprise, ya que la empresa fundadora es de nacionalidad española. Inconvenientes: - Actualmente el único formato de base de datos soportada para la gestión y el proceso de dichos datos a nivel de producción es MySQL, aunque actualmente se trabaja en el proyecto para compatibilizar a otros formatos, como Oracle y PostgreSQL, la capacidad de la herramienta para aminorar esta pequeña desventaja. De hecho, se permite probar y utilizar de forma experimental estos sistemas como gestores de BD desde la versión 4.0. Fuentes: http://pandorafms.org/ http://es.wikipedia.org/wiki/Pandora_FMS http://openideas.info/wiki/index.php?title=Pandora_3.0:Documentation http://pandorafms.com/clientes/Case%20studies/downloads/Successful_Story_Telefonica_ES.pdf http://www.youtube.com/watch?v=Bv89wTaFqHM SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 7 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE El principal software libre orientado a la monitorización es desde hace mucho tiempo Nagios Core Versión 3.x. Es una herramienta Open Source y está diseñado y mantenido por Ethan Galstad, autor de dicho software, junto con un grupo de desarrolladores que mantienen varios plugins. Según su propio autor, el significado de su nombre, N.A.G.I.O.S es un acrónimo recursivo: “Nagios Ain´t Gonna Insist On Sainthood”. Es una referencia a la encarnación original del software bajo el nombre de Netsaint. Está licenciado bajo la GNU General Public License Version 2 publicada por Free Software Fundation. También posee una licencia comercial Nagios PoweredTM la cual pone a disposición de sus clientes dos softwares: Nagios XI y OpMon. El primero de ellos, se puede obtener basándose en el volumen de nuestro sistema: entre 50 a 100 nodos o para nodos ilimitados, y representa la versión de Nagios comercial. El segundo, es una solución de gobierno IT y gestión de procesos empresariales y es compatible con Nagios. En cuanto a su arquitectura y definición, es un sistema de monitorización monolítico y orientado a eventos que vigila los equipos, tanto su hardware como software, alertando cuando el comportamiento de los mismos no es el adecuado. Puede monitorizar servicios de red, recursos hosts y puede programar plugins específicos para nuevos sistemas. El control remoto es manejado a través de túneles SSH o SSL cifrado. Fue diseñado para sistemas GNU/Linux pero también funciona en variantes Unix. Está basado en una estructura maestro-esclavo donde el maestro es el servidor dedicado para Nagios y los esclavos las máquinas a monitorizar. En cada uno de los esclavos o clientes a monitorizar se configuran los plugins o scripts que serán ejecutados para chequear un determinado servicio. Dichos scripts pueden estar desarrollados en diferentes lenguajes o tecnologías: Perl, C/C++/C#, Expect/TCL, Bash, Ruby, Python, o PHP. Aunque Nagios posee opcionalmente un intérprete embebido de Perl que acelera la ejecución de estos scripts. En el maestro se ejecuta una herramienta de conexión remota, la más habitual es el demonio NRPE, con la cual el servidor accede a los plugins o scripts de medición disponibles y configurados en las máquinas remotas o esclavos. Ilustración 13 – Esquema de ejecución entre maestro-esclavo. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 8 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Algunas de sus principales características o funciones pueden ser: - Supervisión de los servicios red (SMTP, POP3, HTTP, NNTP, PING,etc). Monitorización de los recursos (carga de procesador, espacio en disco,etc). Capacidad para definir una jerarquía de servidores en la red, lo que permite la detección de hosts ‘down’ o inalcanzables. Notificación de errores cuando existen problemas y cuando son resueltos mediante correo electrónico, buscapersonas, SMS, etc. Registro automático de rotación de logs. Interfaz web para visualizar el estado actual de la red con la posibilidad de generar informes y gráficas. Su interfaz web nos permite la visualización de los servidores y el estado de los servicios. Podemos organizar las máquinas o esclavos monitorizados, si realizamos la configuración oportuna, por Grupos y por Servicios. Para el primero, por ejemplo, si pertenecen a una misma familia o estación. Mientras que para el segundo, agruparlos referente a un servicio determinado, por ejemplo, para aplicaciones web el servicio HTTP. Posee la integración de diferentes CGIs (Computer-generated imagery) que son imágenes o gráficos generados por ordenador mediante escenas estáticas o dinámicas. También utiliza la herramienta RRDtool (Round Robin Database Tool) que es una herramienta que trabaja con una base de datos para la creación de gráficas, cuyo funcionamiento es ir actualizando los valores y sobreescirbiendo los antiguos, los cuales se conservan como un historial. Su finalidad principal es el tratamiento de datos temporales y datos seriales como temperaturas, transferencias en redes, cargas del procesador, etc. Ilustración 14 – Interfaz Web de Nagios. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 9 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ventajas: - - Es un software popularmente conocido y consolidado, ya que posee una gran cantidad de plugins de la comunidad (más de 200) para extender sus funcionalidades a través de innumerables sitios webs, que incluso son facilitados en su manual oficial. Aunque, hay etapas de su historia en la que dicha comunidad ha estado poco activa en cuanto al desarrollo de nuevos avances sobre el producto. Su fama ha incentivado nuevas herramientas de monitorización que contienen un núcleo basado en Nagios, como por ejemplo: Opsview o Shinkem. Existe buena documentación muy trabajada incluso en detalles y facilitada por la comunidad. Permite diferenciar entre hosts caídos o inaccesibles. Posee un comando que chequea y valida los ficheros de texto de configuración modificados antes de reiniciar el sistema. Puede acoplarse con otra aplicación llamada Centreon para la gestión y control de cualquier aspecto de la herramienta desde una interfaz web, evitando las modificaciones sobre ficheros y por línea de comandos. Aunque esta aplicación sólo funciona con todas las funcionalidades (reportes y statusmap) de Nagios en Ubuntu 9.04 y conlleva una configuración y un tiempo extra para la puesta en marcha. Inconvenientes: - - - - - La instalación, configuración y los complementos (plugins) está basada en texto, lo cual implica una dificultad media, inversión de tiempo y requiere un grado de conocimiento técnico, además puede resultar algo tedioso. Cuando en realidad, la mayoría de estas funciones, alrededor del 90% ya son posibles a partir del protocolo SNMP. Cualquier modificación en la configuración requiere un reinicio completo del sistema, ya que por ejemplo, no es capaz de auto-descubrir nodos nuevos que se incluyen al sistema. Su interfaz web sólo sirve para visualizar los acontecimientos. Cualquier cambio debe realizarse manualmente desde el servidor de Nagios. No soporta ningún gestor de base de datos que trabaje bajo SQL. No está disponible o no funciona en todos los sistemas operativos, por ejemplo, en sistemas Microsoft Windows, es decir, sólo está disponible para sistemas GNU Linux y otros unicode. Necesita una herramienta auxiliar para monitorizar estos sistemas que sirva de proxy o intermediario, por ejemplo, NSClient++. Aporta mucha información, pero a veces es poco exhaustivo, ya que no localiza el problema y requiere una interacción cercana con la herramienta. Aparte, de que el histórico de datos tampoco es muy recomendable, ya que no utiliza ningún tipo de recolector de datos para el rendimiento. Dispone de una consola de eventos muy débil, ya que por ejemplo no permite configurar acciones automáticas ante nuevos eventos en el sistema. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 10 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE - - - Los famosos timeouts o tiempos de espera en Nagios al utilizar nuevos plugins para recoger y volcar los datos puede provocar que el sistema se venga abajo como resultado. No existe seguridad al ejecutar scripts en clientes diseñados por una persona encargada de realizarlos, supone una confianza plena en él y en el código que ha implementado. Como ya hemos comentado, no sería una buena práctica, ya que muchas de las caídas de servicios o tiempos de inactividad son provocados por las propias personas o usuarios. No posee un soporte adecuado para entornos de gran magnitud, así como de técnicas contemporáneas como puede ser el clustering. Su código original, con más de 10 años de antigüedad, presenta limitaciones a la hora de adaptarlo a la rápida evolución de las redes contemporáneas de hoy en día (lenguajes de programación, entornos distribuidos, etc.) Su arquitectura se basa en un único proceso para realizar diferentes tareas. Fuentes: http://es.wikipedia.org/wiki/RRDtool http://en.wikipedia.org/wiki/Computer-generated_imagery SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 11 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Otra herramienta de monitorización de redes disponible y potente es Hyperic HQ Versión 4.6. Es una distribución OpenSource galardonada en 2007 con el “Best Systems Management Tool Award at LinuxWorld” desarrollada por un equipo formado por: Javier Soltero, Charles Lee, Jonathan Cobb y Doug MacEachem (autor de Mod perl). Está disponible bajo la licencia GPL versión 2 (GNU Public License) publicado por la Free Software Foundation. También dispone de una versión comercial VMWare vFabric Hyperic HQ|Enterprise disponible como parte de una vFabric Cloud Application (aplicación nube). Está diseñada para compañías con infraestructuras de gran escala. Proporciona soporte y mantenimiento y presenta funciones avanzadas de automatización y control respecto a la versión OpenSource. Por ejemplo: permite definir diferentes niveles o estados de alerta mediante roles o grupos. Además, permite una predicción de estadísticas basado en lo almacenado o existente en la base de datos. Se puede obtener gratuitamente con una caducidad entre 30 y 45 días o con una contribución económica obteniendo así la licencia del producto con un soporte básico o productivo. Estas dos opciones hacen varíar el precio del producto casi un 10% más, y duración de 1 o 3 años por valores de 436$ y 553$ respectivamente. Volviendo a la versión OpenSource, es una aplicación diseñada para la monitorización y rendimiento de infraestructuras. Visualiza los datos en tiempo real mediante métricas. Es capaz de realizar continuamente 50.000 mediciones a través de más de 75 tecnologías webs. Autodescubre todos los recursos del sistema incluyendo hardware, sistemas operativos, virtualización, base de datos, aplicaciones y servicios de red (SMTP, POP3, HTTP, etc). Alerta cuando hay degradación en el rendimiento o existe la no disponibilidad de un servicio, notificando o realizando y ejecutando procesos definidos personalizados por el usuario. Los componentes de Hyperic HQ son Servidor Hyperic, Agentes Hyperic y base de datos. Ejecuta un agente en cada equipo que se desee administrar, los cuales recolectan tanto información del sistema operativo, como su proveedor o versión y también específicos del hardware, como la memoria RAM, velocidad CPU, dirección IP y nombres de domino. Revisan la disponibilidad del sistema, logs, eventos y cambios de configuración, lo que permite disponer de un histórico de los datos almacenados. Además, puede llevar a cabo funciones de control, tales como iniciar o detener servidores. Envían los datos de inventario a un servidor central Hyperic y este lo almacena en la base de datos. Además, el servidor Hyperic detecta cuando se disparan las alertas y realiza las notificaciones o procesos de escalación definidos por el usuario. Procesa las acciones iniciadas desde la interfaz o consola web de usuario y proporciona servicios de autentificación. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 12 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Es una distribución de aplicaciones J2EE que se ejecuta sobre el servidor de código abierto JBoss. Está escrito en Java y pequeñas porciones de códigos portable en C, para funciones que Java no alcanza todavía. Es una herramienta multiplataforma en cliente, es decir, está disponible en todas las plataformas más populares incluyendo OS X, Unix, Linux, Windows, Solaris, AIX, HPUX, VMWare, AppEngine Google y Amazon Web Services. Para el servidor de Hyperic puede implementarse en Linux, Solaris 10 o superior, Mac OS X y Windows Server 2003 o superior de 32 bits. También puede ejecutarse en Windows XP, pero no se recomienda para un entorno de producción, sólo para un entorno de desarrollo o de pruebas. Entre sus principales características podemos destacar: - - Utilización de plugins de fácil aplicación por parte del usuario mantenidos por la comunidad Hyperic. Permiten descubrir productos software ejecutados sobre una plataforma, tales como servidores web, servidor de aplicaciones, bases de datos, etc. Puede utilizar lenguajes como XML, J2EE, Bash, C++/C#, Perl, Ruby, Python, PHP,etc. Seguimiento y correlación de eventos. Puede controlar logs y archivos de configuración. Es un sistema Live Data, se ejecuta, muestra los datos y ofrece vistas en tiempo real en cualquier plataforma. Incluye una interfaz web conocida también como Portal Hyperic extensible y configurable a nivel de usuario y está desarrollado mediante las tecnologías Java y AJAX. Permite el seguimiento y análisis de los equipos monitorizados y la visualización de los recursos mediante gráficos detallados. Además, permite iniciar las acciones de control de recursos, es decir, procesos a ejecutar en caso de alerta. Un caso práctico sería por ejemplo, para un servidor de aplicaciones, puede comenzar la detención y recolección de basura, mientras que para un servidor de base de datos, puede realizar funciones de análisis y limpieza. Incluye además, vistas especiales o específicas para determinados recursos, por ejemplo, para vSphere para gestiones vCenter y GemFire para componentes de la distribución vFabric GemFire. Posee un despliegue por parte de la comunidad conocido como HQU con el objetivo de la creación y despliegue de APIs para extender el Portal Hyperic, así como su integración con otros sistemas, por ejemplo con OpenNMS. El marco se basa en HQU Groovy, un lenguaje parecido a Java y que se ejecuta en la máquina virtual Java. Intenta mejorarlo con nuevas vistas y plugins en XML y JavaScript. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 13 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ilustración 15 – Interfaz Web de Hyperic. Ventajas: - - - Detección automática mediante los agentes de nuevas máquinas virtuales o clientes. Permite pasar de la instalación de un nuevo nodo a su monitorización en menos de 60 segundos. Soporta base de datos en MySQL, Oracle y PostgreSQL. Esta última es la que instala por defecto. En caso de instalar un ambiente de producción, recomienda instalar la BD en otro equipo distinto al servidor HQ con Oracle o MySQL. Control total de la aplicación desde el portal o interfaz web. Framework de la comunidad HQU para la mejora del Portal Hyperic. Inconvenientes: - No diferencia claramente entre las funcionalidades de sus productos libres y comerciales en la documentación oficial. Intenta dar una vista consumidora de su producto hacia el cliente, lo cual incita a tener una opinión excesivamente comercial del producto. Este suceso hace que su soporte gratuito y de la comunidad de cara al usuario sea de menor calidad. Fuentes: http://hyperic-hq.software.informer.com/wiki/ http://www.springsource.com/products/systems-management/compare http://support.hyperic.com/display/DOC/HQ+Documentation SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 14 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Otra solución disponible OpenSource es Zabbix Versión 1.8.8. Fue creada por Alexei Vladishev, propietario del producto y de la compañía que lo soporta y mantiene Zabbix SIA. Es una empresa de código abierto y que se centra en el desarrollo de software para la monitorización de redes y aplicaciones. Está licenciado bajo la GNU General Public License Version 2 y publicada por la Free Software Fundation. Actualmente están en continuo desarrollo y progresión hacia su versión 2.0. El único aspecto comercial de la empresa es el soporte que ofrece a diferentes niveles, el cual incluye implementación, integración, desarrollo personalizado y servicios de consultoría, así como programas de formación. Ilustración 16 – Niveles de soporte comercial de ZABBIX. Ofrecen una licencia comercial Zabbix Comercial Licence dirigida a los OEMs (Fabricante de equipamiento original), ISVs (Proveedor de software independiente), VARs y para organizaciones que debido a los secretos comerciales, patentes u otros motivos de propiedad, combinan y distribuyen la licencia de software libre Zabbix con sus productos. Es un software de monitorización avanzada que controla los parámetros de la red y su salud e integridad. Esta versión incorpora algunas mejoras respecto a las anteriores, como por ejemplo: soporte completo para plataformas Unicode/UTF-8, mejoras en la utilización de gráficos y mapas. En resumen, ofrece un control centralizado, disponibilidad de hasta 1000 nodos, multiplataforma de soporte en clientes y eficiente para Linux y Win32, autenticación de usuarios segura, sistema de notificaciones flexible para e-mail o SMS basado en cualquier evento, incluido también XMPP (Protocolo extensible de mensajería y comunicación de presencia) (anteriormente llamado Jabber), que se pone en funcionamiento tanto cuando ocurre un problema como cuando se resuelve. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 15 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Permite la monitorización de recursos hardware: procesos de carga, actividad en la red, actividad en disco, parámetros del sistema operativo, servicios de red (SMTP, HTTP), soporte para la monitorización remota o sin agentes a través de: SNMP, ICMP, TCP, IPMI, SSH y Telnet. Genera informes y estadísticas y la posible visualización de los datos a través de su interfaz web, la cual está desarrollada en PHP y Javascript. Ilustración 17 – Interfaz o Consola Web de Zabbix. Sus principales elementos o componentes son: una base de datos, que soporta MySQL, PostgreSQL, SQLite, Oracle o IBM DB2 para almacenar los datos. Su servidor Zabbix y sus agentes Zabbix, los cuales están desarrollados en lenguaje C. Incluye algunas características destacadas: - Auto detección de dispositivos y servicios monitorizados. Monitorización en tiempo real: rendimiento, disponibilidad, integridad, registro de logs, etc. Servicios IT jerárquicos. Ventajas: - Ofrecen una web en castellano muy bien organizada: www.zabbix.com/es/ Tienen en mente el crecimiento de la comunidad Zabbix, poniendo a disponibilidad una wiki en construcción. Inconvenientes: - La potencia o capacidad del software es menor que la de alguno de los mencionados anteriormente (1000 nodos). El no disponer de una versión Enterprise hace que no crezca tanto su popularidad en cuanto a clientes importantes asociados a la herramienta. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 16 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Otra plataforma de gestión de red y servidores OpenSource es Zenoss Core Versión 3.2.1. El proyecto de creación de Zenoss comenzó en 2005 y fue iniciado por Erik Dahl y Bill Karpovich, los cuales formaron la compañía Zennos, Inc. Esta empresa es patrocinadora del núcleo Zenoss y proporciona apoyo, mantenimiento y desarrollo de productos. Destacan que es una empresa donde tienen el código y el control de la evolución del mismo y también su indemnización, a diferencias de otras empresas como puede ser el caso de Hyperic, que viene de un fondo comercial y hace que una parte de su código sea OpenSource. Es un producto licenciado bajo la GNU General Public License Version 2.0 y publicada por la Free Software Fundation. También dispone de dos versiones comerciales, basada en la versión básica, llamadas Zenoss Service Dynamics Enterprise y Zennos Profesional que incluye funcionalidades adicionales como transacciones sintéticas (supervisión en tiempo real de acciones programadas en aplicaciones web, bases de datos o e-mail) umbrales de predicción, gestión completa de VMWare VI3, paneles de controles globales, etc. Esta versión además proporciona soporte y mantenimiento a sus clientes y puede descargarse una versión de pruebas. Zenoss Core es un producto de vigilancia y seguimiento para una red informática y de supervisión de infraestructuras IT. Puede gestionar la configuración, salud, rendimiento de dispositivos, servidores y aplicaciones. Todo esto a través de un único paquete de integrado de software. Ofrece monitorización de dispositivos y servicios en la red (SNMP, HTTP, POP3, etc.), recursos hardware y detecta automáticamente nuevos recursos en la red y cambios en su configuración. Realiza notificaciones y alertas basados en un conjunto de reglas. Es un producto multiplataforma para soporte en clientes, incluyendo: Windows Server (2000, 2003, 2008), XP, Vista, 7. GNU/Linux. Tomcat y servidores Java/JMX. Para ser instalado como servidor soporta distribuciones: › Linux: Red Hat Enterprise Linux 4, 5. CentOS 4, 5. Fedora Core 12, 13. Debian 5. Ubuntu Server 8.04, 10.04. openSUSE 10.3, 11.1. SUSE Linux Enterprise Server 10, 11. Mac OS X v10.5 y v10.6 Windows (Requiere VMWare Player y la aplicación virtual Zenoss). Para la consola o interfaz web necesita: Firefox 3.6.x, 4, 5 o Internet Explorer 7, 8, 9. Adobe Flash Player. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 17 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Zenoss utiliza una tecnología sin agentes (SNMP, SSH, Telnet y WMI) y se inicia con una CMBD (Base de datos de la Gestión de Configuración), la cual contiene detalles relevantes de cada elemento, generando a partir de esta la administración de fallos, notificaciones, alertas y tareas de remediación a fallos. Y además con un amplio inventario de cada recurso. Una vez que se descubre la infraestructura, comienza a monitorizar el rendimiento de cada dispositivo. Posteriormente, ofrece la gestión de eventos, automatización de alarmas e informes. Por tanto, los principales niveles o áreas del núcleo sistema son: Descubrimiento y Configuración Rendimiento y Disponibilidad Fallos y gestión de Eventos Alertas y remedios Generación de Informes La arquitectura del sistema viene separada y escalonada en cuatro partes principales, tal y como se puede observar en la siguiente ilustración: Ilustración 18 – Arquitectura del sistema de Zenoss. La capa de usuario está construido alrededor de la interfaz o aplicación web e interactúa con la capa de datos para traducir la información y mostrarla al usuario. Dicha capa de datos, recopila la información y configuración y la almacena en tres bases de datos separadas: - ZenRRD: Utiliza la herramienta RRDtool. ZenModel: Es el modelo de configuración del núcleo, que comprende los dispositivos, sus componentes, grupos y lugares. ZenEvents: Almacena los datos de eventos en una base de datos MySQL. La capa de procesos gestiona la comunicación entre la capa de datos y la capa de colección y ejecuta periódicamente trabajos generados por el usuario (ZenActions y ZenJobs). Utiliza la herramienta Twisted PB para las comunicaciones. Por último, la capa de colección está formada por servicios o demonios que llevan a cabo funciones como la recopilación de información en máquinas remotas, disponibilidad (fallos de PING) y SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 18 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE rendimiento (infracciones en los umbrales), los cuales son devueltos a través de ZenHub al sistema de eventos. Combina programación propia y tecnologías de código abierto, con las cuales consigue integrar su software al completo. Por ejemplo, en el núcleo del sistema realiza tareas como el Modelado del Sistema, que le permite entender el entorno en el que opera, basado en el concepto de herencia de lenguajes de programación. Podemos citar algunas de las tecnologías utilizadas, como por ejemplo: - - - - Zope: Aplicación web orientado a objetos. Está escrito en el lenguaje de programación Python. Es utilizado para la edición de contenidos, personalizaciones básicas y aporta ventajas respecto a lugares web compuestos por archivos de texto plano. Python: Lenguaje de programación de alto nivel diseñado en 1991 por Guido van Rossum. Es un lenguaje multiparadigma (permite crear programas con más de un estilo de programación), ya que soporta programación orientado a objetos, programación imperativa (basado en estados y sentencias, variables globales, como en la programación o implementación hardware de las Máquinas de Turing) y en menor medida, programación funcional (basado en funciones aritméticas: Entrada -> Subrutina -> Salida). Es un lenguaje interpretado (ejecutado por un intérprete que convierte el lenguaje fuente en código máquina), utiliza tipado dinámico y es multiplataforma. Net-SNMP: Protocolo de monitorización que recolecta información sobre el estado de los sistemas. RRDtool: Es una herramienta ya mencionada y utilizada por otros productos de monitorización. Trabaja y tiene como objetivo la creación de gráficas y guarda registros temporales de datos. Una de sus principales características es que no crece con el paso del tiempo. MySQL: Motor y gestor de base de datos relacional multihilo y multiusuario popularmente conocido. Twisted PB: Es un framework de red para la programación dirigida por eventos escrito en Python. Soporta varias arquitecturas (TCP, UDP, SSL, IP, etc.) y protocolos (HTTP, XMPP, NNTP, SSH, etc.) Los usuarios pueden escribir pequeños callbacks (retrollamadas) para realizar tareas complejas. Posee una comunidad Zenoss Core Comunnity la cual dispone de un repositorio de plugins llamado ZenPacks, con los cuales los miembros de la comunidad pueden extender las funcionalidades de Zennos Core. Además, el software soporta el formato de plugins de Nagios. Para la visualización y control total de la aplicación aporta una interfaz o Consola Web, la cual nos permite manejar el estado y situación de la infraestructura. Puede personalizarse por distintos roles para usuario y se puede integrar con Google Maps para visualizar problemas geográficamente. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 19 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ilustración 19 – Interfaz o Consola Web de Zenoss. Ventajas: - Fácil instalación de extensiones o paquetes ZenPacks desde la consola web. Soporta y puede por tanto ejecutar plugins de Nagios y de Cacti. Inconvenientes: - - - - Al no utilizar tecnología con agentes en los clientes, requiere una configuración previa en su instalación del protocolo SNMP en cada uno de las máquinas a monitorizar siguiendo un procedimiento distinto según la versión o tipo de sistema operativo. Necesita la instalación de paquetes adicionales ZenPacks para monitorización de servicios básicos como HTTP o FTP, información del sistema operativo y algunos recursos hardware como obtener información de la CPU. Con lo cual, la instalación puede no llegar a ser suficiente, y necesita una puesta a punto para cumplir funcionalidades básicas. La instalación de la herramienta en el equipo host es rápida, pero no cada configuración del cliente desde la consola web. Por ejemplo, hay que asignarle una plantilla o template adecuada o personalizada para que monitorice lo que necesitamos de dicho dispositivo. Necesita de la aplicación externa VMplayer para funcionar en sistemas operativos de Microsoft Windows. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 20 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ganglia Web Release Versión 2.1.8 es otra herramienta OpenSource distribuida y escalable para la monitorización de redes o sistemas de computación de alto rendimiento como son los clusters y grids. Es un proyecto que surgió en la Universidad de California Berkeley con el nombre de Millenium Project, que fue inicialmente financiado, en gran parte, por la NPACI (National Partnership for Advanced Computational Infraestructure) y National Science Foundation RI. Es una fundación que intenta lograr avances en la ciencia mediante la creación de una generalizada infraestructura de cálculo: el Grid. El apoyo actual al producto proviene de Planet Lab, la cual es una plataforma abierta para el desarrollo, despliegue y acceso a los servicios de escala planetaria. Es un producto licenciado bajo la BSD-Licenced, es una licencia permisiva, con lo cual posee requisitos mínimos de cómo se puede redistribuir el software. Fue escrita originalmente en la Universidad de California. Existen nuevas variantes de dicha licencia New BSD License/Modified BSD License y Simplified BSD License/FreeBSD License, las cuales han sido compatibles con la GPL por la Free Software Fundation. El término de Grid Computing se refiere a la combinación de recursos para alcanzar un objetivo común, en este caso, es la combinación de dominios administrativos para componer una “supercomputadora virtual” para realizar tareas muy grandes. Utiliza el software Middleware para dividir y repartir las piezas de un programa entre varios ordenadores. El cual, es un software esencial para tecnologías de información (IT) basadas en XML, SOAP, servicios Web y arquitecturas orientadas a servicios. Se ejecuta en una capa intermedia entre la aplicación, por ejemplo una base de datos, y la infraestructura o sistema operativo y permite a los procesos que se ejecutan en una o más máquinas interactuar y transferir datos entre ellos. Es un producto cuyos principales proveedores son IBM, Red Hat y Oracle Corporation. En resumen, los Grids son sistemas que se utilizan y se han utilizado para intensivos problemas científicos y matemáticos computacionales y en empresas comerciales para aplicaciones diversas, como el descubrimiento de fármacos, previsiones económicas o análisis sísmicos. Los clusters son grupos de computadoras, conectadas normalmente en redes de área local, que trabajan y colaboran juntas formando un solo equipo. Son desplegados para mejorar el rendimiento, disponibilidad y rentabilidad de un solo equipo con características similares. Volviendo al software libre inicial, Ganglia se basa en un diseño jerárquico y permite al usuario visualizar de forma remota y en tiempo real estadísticas o históricos sobre recursos de las máquinas que están siendo monitorizadas, como por ejemplo, promedios de carga de CPU o la utilización de la red. Puede escalarse para manejar hasta 2000 nodos, y está presente en más de 500 grupos de todo el mundo. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 21 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Es una herramienta con direccionamiento multicast, el cual es un método de transmisión one-to-many (de uno a muchos receptores). Su funcionamiento es el siguiente: el emisor envía desde su dirección unicast un datagrama a la dirección multicast, las cuales están reservadas desde la 224.0.0.0 a la 239.255.255.255, según la IANA (Internet Assigned Numbers Authority), que se encarga de asignar direcciones IPv4 para nuevos protocolos. Una vez enviado el datagrama, el router se encarga de hacer copias y enviarlas a todos los receptores que hayan informado de su interés por dichos datos. Se utilizan protocolos como UDP (User Datagram Protocol) y PGM (Pragmatic General Multicast), el cual corrige fallos del anterior e incluye mejoras en la distribución, como la detección de pérdida de datos o mensajes entregados fuera de orden. Es un método de transmisión utilizado principalmente en empresas para el intercambio de datos multimedia, como aplicaciones IPTV, enseñanza a distancia o encuentros televisados. En otros ámbitos ha tenido poco éxito, puesto que requiere un gran ancho de banda y que este sistema a gran escala puede venir acompañado de fallos, debido a ataques de denegación de servicio (DoS), los cuales sobrecargan el servidor de solicitudes. Utiliza tecnologías como XML, para la representación de datos, XDR para el transporte compacto y portátil de los datos y RRDtool para el almacenamiento y visualización de los mismos. Para su interfaz web utiliza PHP4 y algunos otros pequeños programas de utilidad. Está compuesto únicamente por dos demonios: - - Gmond: Demonio multi-hilo que se ejecuta en cada nodo a supervisar. Su instalación no requiere ningún sistema de archivos común NFS ni una base de datos. Tampoco necesita mantenimiento de los archivos de configuración. Transmite los datos mediante mensajes de formato UDP. Posee cuatro funciones principales: 1- Monitorizar los cambios en el servidor anfitrión. 2- Anunciar cambios relevantes. 3- Escuchar el estado del resto de nodos a través de un canal unicast/multicast. 4- Responder a las solicitudes para obtener una descripción XML del estado del cluster. Gmetad: Ganglia diseña una conexión punto a punto, mediante un árbol de conexiones, entre los nodos del cluster para controlar el estado de todos. En cada nodo del árbol, este demonio sondea periódicamente una recopilación de datos de las fuentes hijas y analiza el XML de datos recibido de los gmonds, guardando parámetros numéricos. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 22 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Su interfaz web dinámica proporciona una vista de la información obtenida y muestra datos de manera significativa para los administradores y usuarios del sistema. Puede visualizar datos históricos como el uso de la CPU durante la última hora, día, semana, mes o año. Muestra gráficas similares para el uso de memoria, disco, red, procesos en ejecución, etc. Estos datos son recogidos por el demonio gmetad, que es el encargado de enviar el árbol XML al puerto 8651 por defecto, que es donde estará escuchando la web. Ilustración 20 – Interfaz Web de Ganglia. Ventajas: - Es una herramienta cuyo origen proviene de estudiantes universitarios de la Universidad de California Berkeley. Inconvenientes: - - Aunque es una herramienta de monitorización, no se ajusta al perfil de los anteriores, ya que es un software destinado a otros propósitos diferentes, en comparación con otras herramientas estudiadas en este documento. Incumple una de las principales propiedades de un sistema de monitorización: no dispone un sistema para la generación de alarmas. Tiene una capacidad o potencial inferior a alguna de las herramientas anteriores (monitoriza unos 2000 nodos). Su interfaz web es una simple aplicación de visualización de datos y dispone pocas funcionalidades. Existe poca documentación y no disponen de entorno o sitio web propio. Tienen una licencia propia, cuyas nuevas versiones no se ajusta o no es aprobada completamente por la Free Software Fundation. Fuentes: http://en.wikipedia.org/wiki/Grid_computing http://es.wikipedia.org/wiki/IP_Multicast http://en.wikipedia.org/wiki/BSD_license SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 23 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE OpenNMS es una herramienta de monitorización de Software Libre, publicada actualmente bajo la licencia GPL versión 3(GNU Public License), de las más antiguas que existen junto con Nagios y conocida como uno de los padres de este tipo de herramientas, ya que es un proyecto que se inició en 1999 por Steve Giles, Brian Weaver y Luke Rindfuss y su empresa PlatformWorks. Actualmente, la fundación The Order of the Green Polo (OGP) fundada en 2004 para administrar el proyecto, junto a The OpenNMS Group que es otra organización independiente que ofrece servicio y apoyo comercial, son las encargadas del proyecto. Ha sido premiada con varios galardones, como por ejemplo: Inforworld Best of OpenSource Software (BOSSIE), mejor software en la categoría de gestión redes en los años 2009 y 2010 o Best Systems Management Tool de LinuxWorld en 2005 frente a otros productos, a priori favoritos, como IBM's Tivoli Intelligent Orchestrator y Novell's ZENworks 7 Linux Management. La última versión de la herramienta disponible estable y en producción es la Versión 1.8.16, además siguen desarrollándose nuevas versiones gracias a la comunidad, que le permite seguir ofreciendo nuevas características a su producto, actualmente trabajan en una nueva versión, aún inestable, la 1.9.93. No disponen de otras versiones diferentes a la OpenSource, es decir, que no disponen de una versión Enterprise o comercial de su producto. Fue diseñado para ofrecer disponibilidad y escalabilidad a decenas de miles de nodos y para ofrecer soluciones a empresas. Para ello, ponen a disposición dos tipos de soporte, el gratuito creado por la comunidad, con una wiki de información, hilos de discusión y bugs o problemas registrados en una instancia de JIRA. En el soporte comercial, incluimos un libro disponible en amazon.de en lenguaje alemán por 36,90€, además del soporte profesional de OpenNMS Group, Inc que proporciona información formal a sus clientes e imparte cursos de formación en EEUU. Es una herramienta diseñada como solución empresarial y que sigue el modelo de telecomunicaciones FCAPS para la gestión de la red. Su nombre es un acrónimo de: fallos, configuración, contabilidad, rendimiento y seguridad. Define la gestión y organización de una red mencionando la importancia de los servicios IT, ya que los empleados y clientes dependen de ellos, de su disponibilidad y rendimiento y de que los problemas puedan ser rápidamente identificados y resueltos o reparados en un tiempo lo más corto posible para evitar caídas del sistema y la consecuente la pérdida de ingresos. Entre las funcionalidades de OpenNMS podemos destacar que es una herramienta capaz de autodescrubrir los servicios en la red en la cual está funcionando, de forma que un proceso actúa automáticamente mediante una lista o rango de direcciones IP. Se puede utilizar la interfaz web de usuario o crear archivos personalizables de configuración en XML para dicha tarea. El aprovisionamiento de los procesos es asíncrono para la escalabilidad, y existen redes de suministro con más de 50.000 dispositivos conectados. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 24 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Puede generar eventos y notificaciones o incluso recibirlos de fuentes externas, como por ejemplo, SNMP, syslog o TL/1. Puede procesar 125.000 mensajes de syslog por minuto de forma continua y enviar dichas notificaciones mediante e-mail, XMPP, SMS o a una aplicación de tickets que disponga de comunicación bidireccional como pueden ser JIRA, OTRS, etc. También ofrece servicios para la gestión de los tiempos de respuesta (SLAs), como pueden ser solicitudes ICMP (ping), visitas a un puerto determinado TCP para comprobar la instancia, aplicaciones web mediante el protocolo HTTP o pruebas de comprobación de ida y vuelta de correo mediante el servicio API MTM (Mail Transport Monitor). Pudiendo generar informes detallados y representaciones gráficas sobre la disponibilidad de dichos servicios y configurar los tiempos de inactividad, a partir de los datos recogidos en la base de datos, lo cual ayuda a identificar los problemas dentro de la red. Es una herramienta escrita en el lenguaje de programación Java, y por tanto, puede ejecutarse en cualquier plataforma con soporte para una versión de Java SDK 1.5 o superior. También existen paquetes binarios precompilados para Linux, Windows, Solaris o Mac OS X. Requiere una base de datos PostgreSQL, aunque se está trabajando actualmente para hacer que la base de datos sea independiente de la aplicación con Hibernate, el cual es un proyecto de una librería Java ORM (object-relational mapping) o también conocido como técnica de programación para la conversión de datos en lenguajes de programación orientados a objetos, creando una base de datos de objeto virtual, pudiéndose utilizar dentro del lenguaje de programación. Su función es permitir mapear clases de Java a bases de datos relacionales mediante archivos XML, así como realizar consultas mediante llamadas SQL generadas por la propia herramienta. Dispone de una interfaz web de usuario construida en Jetty, el cual es un servidor de aplicaciones y contenedor de servlets Java basado en HTTP desarrollado en OpenSource como parte de la fundación Eclipse y es utilizado hoy en día en productos tales como Alfresco, Apache Maven, Ubuntu, JBoss, HP OpenView, etc. También existe una integración con la herramienta de informes de Java JasperReports con el fin de crear informes de alto nivel en PDF, HTML, Microsoft Excel, etc. Ilustración 21 – Interfaz Web de OpenNMS. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 25 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Realizan una serie de comparaciones en su sitio web oficial con otros productos, ya que consideran que OpenNMS puede sustituir e incluso mejorar funcionalidades de otras herramientas sin tener una licencia privativa. Es el caso de CA eHealth Perfomance Manager, donde se argumenta que OpenNMS separa en dos demonios distintos la disponibilidad y el rendimiento, y que para la obtención de estos datos puede utilizar protocolos como HTTP(s), JMX, XMP, NSClient, JDBC y WMI entre otros, además de SNMP. También lo comparan con la herramienta HP OpenView Product Family, ya que algunos de los creadores originales de OpenNMS provienen de una compañía que era parte de OpenView, y por tanto, toman algunos conceptos, objetivos y terminologías parecidos aplicándolos a OpenNMS. Aseguran que, aunque no tienen toda la funcionalidad en el núcleo de su producto, pueden implementar el 99% de funcionalidades de HP OpenView gracias a los paquetes adicionales de código abierto (plugins). Por último, The Tivoli Netcool Suite pertenecía a la empresa Micromuse, y posteriormente fue comprado por IBM en el año 2000. Parte de la arquitectura de OpenNMS está inspirada en el producto Netcool OMNIbus, ya que poseen técnicos con experiencia y certificados en Netcool, a diferencia, de que es un producto comercializado con una licencia de software privativa. También se compara con Nagios, que sí es un producto OpenSource, y mencionan una cita que existe en la documentación de Nagios. “Note: Nagios is not designed to be a replacement for a full-blown SNMP management application like HP OpenView or OpenNMS”. Además consideran que no es una aplicación con la que deban competir, ya que no está estructurada de la misma forma. Ventajas: - - Posee un sistema de notificaciones muy flexible, ya que puede gestionarlas y enviarlas incluso a una herramienta exterior (JIRA, OTRS, etc.) centralizando así todo el mecanismo de procesos ITIL. Soporta y ejecuta plugins diseñados inicialmente para Nagios. Posee una interfaz web como demo para poder visualizar su funcionamiento sin necesidad de instalarlo y tener una idea del producto: demo.opennms.org/ Inconvenientes: - - Sólo puede utilizar como gestor de base de datos PostgreSQL. Posee una puesta a punto para optimizar el rendimiento del sistema que requiere un nivel muy elevado de conocimientos, lo cual conlleva una serie de modificaciones y tunnings en la instalación a nivel de configuración, hardware, base de datos, sistema operativo, etc. Posee una interfaz web que a veces no deja claro la evaluación de los datos mostrados. Tampoco funciona correctamente con algunos navegadores como por ejemplo Mozilla Firefox. Fuentes: http://www.opennms.org/ http://en.wikipedia.org/wiki/FCAPS http://en.wikipedia.org/wiki/Jetty_(Web_server) http://www.opennms.org/wiki/Comparison_with_other_network_management_systems http://www.rootdev.com/tech/opennms-vs-nagios http://en.wikipedia.org/wiki/Hibernate_(Java) http://en.wikipedia.org/wiki/JasperReports SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 26 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Otra herramienta de software libre y posible solución de administración para dispositivos en red OpenSource es Cacti versión 0.8.7h. Actualmente, la comunidad de dicho producto está trabajando en la elaboración de dos nuevas versiones para el 2012 1.0.0 y 1.1.0 con mejoras planificadas como por ejemplo: mejora de la interfaz web 2.0 basado en AJAX, plugins integrados en el núcleo de la aplicación, grupos de usuarios y permisos, etc. Está publicada bajo la licencia GPL (GNU Public Licensed). No dispone de una versión comercial ni otra licencia privativa para la distribución del producto, tampoco de un soporte comercial o profesional. Pone a disposición un soporte gratuito mantenida por la comunidad mediante una lista de correo y un foro: http://forums.cacti.net/forum-12.html Es una aplicación enfocada para la generación de gráficos avanzados y diseñada para aprovechar el poder de almacenamiento y la funcionalidad que poseen las aplicaciones RRDtool. Sirve para monitorizar redes en LAN de un tamaño pequeño o redes más amplias de hasta cientos de dispositivos. La recolección de datos en los dispositivos a monitorizar se realiza mediante el protocolo SNMP y se almacenan en la RRD (base de datos Round Robin) y luego genera gráficos en formato PNG. También puede recolectar los datos mediante scripts para consultas en XML ejecutados desde el cron de forma periódica en el caso de Linux, por ejemplo, para función de realizar ping a un host. Pueden generarse plantillas para determinados dispositivos tales como router, switch o servidores y también para gráficas, con el propósito de generalizar la monitorización de dispositivos similares, pudiendo exportarlas e importarlas posteriormente en otros equipos. Permite la instalación de un código opcional Spine, también conocido como cactid con la función principal de hacer al producto más rápido. Está escrito en lenguaje C y hace uso de hilos POSIX y está relacionado con la librería de Net-SNMP. Sirve para reemplazar el poller cmd.php instalado por defecto con Cacti. Depende del tamaño de la red en la que estará instalado, por defecto tiene una respuesta de los datos de unos 300 segundos (5 minutos) para recolectar los datos de todos los hosts, si este tiempo no es suficiente, se recomienda que se cambie este mecanismo manualmente o que se aumente el número de procesos concurrentes en el sistema. Funciona bajo una base de datos MySQL versión 4.1.x, 5.x o superior. Además, entre sus requisitos necesita PHP 4.3.6 o superior y un servidor web como Apache o IIS. La versión de RRDtool 1.0.49 o 1.2.x o superior, teniendo en cuenta de que existen bugs en la versión 1.2.28 en la representación de texto y leyendas en los gráficos. Tiene una interfaz web de usuario personalizable y desarrollada en PHP que permite el acceso mediante usuarios con diferentes privilegios, para darle permisos sobre ciertas áreas de Cacti. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 27 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ilustración 22 – Interfaz Web de Cacti. Ventajas: - Es una herramienta avanzada para la generación de gráficas y utiliza una tecnología libre también fomentada por otras herramientas como es RRDtool. Inconvenientes: - - - - Tiene un potencial inferior a otras herramientas anteriormente analizadas y con diferentes objetivos los cuales no pasan por la monitorización de dispositivos, ya que puede calificarse de ser una simple aplicación de gráficas. No cumple con funcionalidades básicas como la monitorización de hardware (CPU, memoria, disco, etc.), generación de notificaciones ante problemas inminentes mediante la definición de umbrales y necesita plugins para generar mapas o auto descubrir la red. Su arquitectura no está diseñada para trabajar ante una red con miles de dispositivos ni tampoco funciona con agentes en los clientes o nodos a monitorizar. En caso de necesitarlo y mejorar las expectativas del sistema, no cubre la posibilidad de ampliar a una versión comercial o a un soporte profesional. Su interfaz web no permite controlar la aplicación sólo permite una visualización de los datos obtenidos. Fuentes: http://www.cacti.net http://es.wikipedia.org/wiki/Cacti http://cactiusers.org/index.php SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 28 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE La última herramienta OpenSource de software libre a analizar para el seguimiento de los recursos de red es Munin versión 1.4.6. Actualmente Steve Schnepp está trabajando en el desarrollo una nueva versión beta inestable 2.0 y progresa por su cuarta revisión con un conjunto de características nuevas, como por ejemplo: gráficos CGI y con zoom, mejorar la escalabilidad, usar protocolo nativo SSH, simplificar los tiempos de ejecución de los plugins, etc. Su nombre proviene de la mitología nórdica de un ciervo del dios Odín, cuyo significado es ‘Memoria’. Actualmente, está publicada bajo la licencia GPL (GNU Public Licensed). El único soporte que disponen es gratuito mantenido por la comunidad con una wiki y un foro. No disponen de una versión comercial o Enterprise ni de ningún tipo de soporte profesional. Sólo ponen a disposición un libro publicado por Gabriele Pohl y Michael Renner escrito en alemán titulado “Munin - Graphisches Netzwerk- und System-Monitoring” publicado por Open Source Press en colaboración con Linpro por 34,90€. Munin es una aplicación de monitorización de red escrita en Perl que presenta la producción de gráficos a través de una interfaz web utilizando RRDtool (diseñado por Tobi Oetiker) como base de datos. Su énfasis está en las capacidades plug and play. Existen más 500 plugins de vigilancia disponibles actualmente en su repositorio oficial escritos en diferentes lenguajes como Bash, Perl, Python, Ruby, PHP, Shell, etc. Específicos para diferentes sistemas operativos como Linux, FreeBSD, NetBSD, Solaris, AIX, HP-UX y otros multiplataforma, que es lo más común según muestra el siguiente gráfico: Ilustración 23 – Estadísticas de plugins: A) Plataformas soportadas, B) Lenguajes que son escritos los plugins. Puede supervisar el rendimiento de ordenadores, redes, redes SAN y aplicaciones. Determina cuándo sucede un problema de rendimiento y puede ver la capacidad de todos los recursos limitados. Monitoriza aspectos de cada nodo como promedio de carga, uso de memoria, tráfico eth0, etc. A través de la recolección de datos, puede mostrar tendencias y puede ayudar a predecir cuellos de botella. Genera eventos cada vez que un valor se eleva por encima o se hunde por debajo de los límites preestablecidos. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 29 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Uno de los objetivos principales ha sido la facilidad de crear nuevos plugins e intentar medir cualquier cosa cuantificable. Puede integrarse con Nagios para enviar eventos e informar a los contactos configurados en Nagios, mediante configuración de ficheros. Se integra con otra herramienta de Software Libre y OpenSource llamada Monit para supervisar sistemas Unix y Linux. Eleva su funcionalidad ya que puede verificar servicios como Apache, MySQL o Postfix y toma medidas acerca de dichos procesos para verificar si su comportamiento es el adecuado y llevar a cabo un reinicio del sistema si no es el esperado. Está escrito en el lenguaje de programación C y licenciado bajo la GPL (GNU Public Licensed). Tiene una arquitectura maestro / nodo en el que el maestro se conecta a todos los nodos a intervalos regulares (normalmente cada cinco minutos), interrogando a cada uno de los munin-node. Dichos nodos a monitorizar disponen de un agente instalado el cual recopila la información a través de un demonio instalado por defecto en el puerto 4949 que ejecuta los plugins. A continuación, el servidor o maestro almacena los datos en los archivos RRD, y (si es necesario) actualiza los gráficos en la interfaz Web. Se ejecuta en el servidor o maestro con cuatro trabajos o procesos diferentes, lo que permite que cualquiera de ellos pueda comenzar mientras otro ya se está ejecutando y no se bloqueen entre ellos. 1. Actualización: Contacto con cada nodo para la recuperación de datos y configuración de plugins. 2. Gráficas: Creación de gráficas a partir de la base de datos RRD. 3. Límites: Chequeo de los límites o umbrales y de las infracciones en cada servicio. 4. Visualización: Actualiza los ficheros HTML mostrados desde la interfaz. Ilustración 24 – Interfaz Web de Munin. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 30 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ventajas: - Es una herramienta de software libre que utiliza tecnologías libres como es RRDtool para su gestión de los datos y Monit para ampliar su funcionalidad, la cual le permite realizar acciones sobre algún servicio en particular. Inconvenientes: - - - No cumple con algunas funcionalidades como autodescubrir la red, grupos lógicos de nodos a monitorizar, reportar informes SLA. Su monitorización es periódica cada cinco minutos y su función es recolectar datos estadísticos pero no como herramienta de alertamiento. Recibe la información al servidor central sin autenticación y en texto plano, por lo tanto no es adecuado si existe información sensible o confidencial. Su interfaz web sólo es para visualizar los resultados, no proporciona un control sobre la aplicación y por tanto, toda configuración debe realizarse de forma manual por línea de comandos. No permite utilizar otro gestor de base de datos que no sea RRDTool. Al no disponer de una versión Enterprise o un soporte profesional, no dispone de clientes importantes que utilizan la herramienta. Fuentes: http://munin-monitoring.org/ http://exchange.munin-monitoring.org/ SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 31 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 3.1.2- HERRAMIENTAS DE SOFTWARE PRIVATIVO: HP OpenView es una familia de productos de software con licencia comercial muy amplia y sub-marca de HP Software. Pertenece a Hewlett-Packard Company que es uno de los principales proveedores de soluciones globales existentes en el mercado y que intenta cubrir la mayoría de las problemáticas de administración de los departamentos de TI. Existen herramientas orientadas exclusivamente a la administración del rendimiento y la disponibilidad de los sistemas. Históricamente, el nacimiento de la serie OpenView fue con el producto Network Node Manager (NNM), el cual ofrecía servicios de red y GUI para otros productos que se integraban con él. Actualmente NNM se usa generalmente para administrar redes, probablemente en conjunción con otros productos como Cisco CiscoWorks. A partir de 2007, tras la adquisición de Mercury Interactive Corp por parte de HP, se elimina OpenView y el producto pasa a llamarse HP Operations. Ilustración 25 – Soluciones de la gama HP OpenView. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 32 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE La Suite de herramientas HP OpenView permite el control y la gestión de la tecnología en las diferentes áreas de IT: gestión de aplicaciones, disponibilidad de dispositivos, condiciones y estado de la red, rendimiento del sistema, servicio y mantenimiento y programas de almacenamiento. En concreto, con OpenView Operations (OVO), los administradores de IT pueden tener un control global desde la consola central que puede gestionar todos los recursos de IT distribuidos por la compañía. Los técnicos de sistemas pueden monitorizar, analizar y planificar recursos en entornos distribuidos, multifabricante, y también pueden supervisar el rendimiento de plataformas con herramientas como OpenView Perfomance Agent (OVPA), OpenView Performance Manager (OVPM) y OpenView Performance Insight (OVPI). Cada una de estas tres herramientas, junto con la consola principal (OVO), tiene un objetivo y unas funciones y en conjunto forman la arquitectura de un sistema de monitorización. A continuación vamos a definir cada una de ellas y sus características. HP OpenView Operations: es la consola central de eventos de HP OpenView. Es independiente al resto de herramientas, ya que integra una propia arquitectura consola-agente (paquetes software) para los principales sistemas operativos del mercado y plataformas (Unix: AIX, HP-UX, Solaris, Tru64. Microsoft Windows, Linux, Novell Netware, OpenVMS, AS/400, IBM Mainframe). Existen dos versiones diferenciadas HP Operations Manager para Windows 8.10 y para Unix 8.35. Los agentes OVO son independientes de la consola central y son un componente de activo instalado en cada equipo para informar a la consola cuando se detecta alguna situación importante, permiten monitorizar ficheros de log, ejecutar programas de control y automatización, capturar eventos SNMP (traps), recolectar métricas de rendimiento de sistema y puede tomar una acción autónoma si dicha métrica realiza un incumplimiento de un umbral, también posee interfaces abiertas para envió de mensajes. Cualquier alerta creada también puede tener una acción asociada con ellos. Estas acciones por lo general vienen en dos formas, automáticas o iniciadas por un operador. Las acciones automáticas se ejecutarán cada vez que una alerta ocurre, mientras que las iniciadas por un operador requieren la orden explícita para la acción en concreto. Maneja a los usuarios/operadores en su interfaz Web por privilegios o responsabilidades, lo que permite el filtrado de alarmas que son relevantes para el papel de la persona dentro de la organización, cada usuario de OVO sólo recibe mensajes de los dispositivos de su interés y que pueda tener acceso. Permite crear un mapa lógico de los componentes de la infraestructura, dando a los usuarios una mejor visión del estado de los servicios informáticos. Utiliza tecnologías como Motif en los sistemas Unix o una interfaz gráfica basada en Java para Unix o Microsoft Windows. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 33 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Es escalable e integrable, permite el manejo de una gran cantidad de dispositivos y posee integración con los otros módulos de OpenView. Maneja los eventos, a los cuales permite asociar acciones, instrucciones, anotaciones y mantener un histórico para consultas y estadísticas. Permite el empleo de plugins exteriores al núcleo del software SMART Plug-Ins (SPI) para añadir mejoras o aumentar la facilidad para el entorno existente con una rápida implementación. Un ejemplo podría ser SAS 9.2 para servidores empresariales de BI con HP OpenView Operations 7.x para Windows para realizar un seguimiento a los datos de negocio y que fluye sin problemas en toda la empresa. También otro ejemplo puede ser PROGNOSIS incorpora beneficios de monitorización, filtrado y alertas en tiempo real y posibilita a los servidores NonStop incluirse en el marco de la gestión de OVO permitiendo una total visibilidad de los servidores y aplicaciones críticas de negocio. HP OpenView Performance Manager (OVPM): Esta herramienta permite visualizar información de rendimiento de los agentes de OVO y OVPA. El acceso a la información es mediante una interfaz Web (existe la posibilidad de un acceso HTML o Java). HP OpenView Performance Agent (OVPA): Es la herramienta que recolecta información de rendimiento de recursos de diferentes plataformas y/o sistemas operativos mediante los agentes OVPA, se instala localmente en cada nodo a monitorizar. A diferencia del agente de OVO, este agente permite la incorporación de nuevas métricas para recolección, configurar parámetros para el almacenamiento de datos y generar alarmas de rendimiento, que pueden integrarse a la consola de eventos de NNM y OVO. HP OpenView Performance Insight Manager (PIM): Es la herramienta que realiza los reportes de HP OpenView. Permite extraer información de diferentes fuentes y protocolos (SNMP, RMON2, SQL, archivos ASCII, agentes OVO y OVPA). Posee mecanismos para definir la recolección de datos, almacenarlos en una base de datos relacional y desarrollar informes en base a estos datos. Fue comprada por HP y adapta para ser usada con los otros módulos de OpenView. Las alarmas activas son visibles en la consola de operaciones de Operation Manager en toda la infraestructura así como el estado de los servicios que hayamos configurado. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 34 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ilustración 26 – Consola de HP OVO. Ventajas: - Es una herramienta potente para gestionar una infraestructura IT si se combina o integra con otros productos la gama openview ya sean herramientas de ticketing (HP ServiceDesk o ServiceManager) de forma que al llegar una incidencia a la consola de OVO automáticamente se abra un tiquet para el grupo de TI interesado/afectado. También la integración de reportes (HP Performance Manager, HP Reporter) o herramientas complementarias de monitorización (HP Network Node Manager – NNM) o monitorización sin agentes (HP SiteScope). Y por último, y quizás más recomendable la integración con los plugins SPI (Smart PlugIns) que facilitan la labor de configurar una monitorización, ya que son paquetes que llevan configurados la forma de monitorizar multitud de plataformas. (BEA, BMC, BlackBerry, Oracle, IBM WebSphere, VMWare, Unix SO, etc). Inconvenientes: - No es un producto de software libre y presenta varias desventajas, como por ejemplo el precio de la licencia, la cual tiene un precio prohibitivo para la mayoría de las empresas. Se le debe sumar un coste extra por cada agente que se desee instalar. También la poca documentación o información que hay disponible por parte del fabricante, en general la privatización de la empresa impide conocer aspectos de sus productos e incluso puede afectar al trato con los clientes de forma negativa. Podemos ver un precio estimado para el software HP Openview Network Node Manager (NNM), aunque este precio varía dependiendo de la versión y del nº de nodos a monitorizar: SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 35 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ilustración 27 – Costos de las licencias de productos HP Openview. - - - En particular esta empresa, HP tiene multitud de productos software muy mal organizados y que resulta confuso y tedioso conocerlas o saber qué realizan particularmente cada una de ellas, ya que incluso cambian el nombre de algunas de ellas. Además, en diversas ocasiones es necesario añadir o combinar varias de ellas para obtener un producto sólido. Puede considerarse una política de la empresa para dificultar la tarea de indagar en sus productos sin la ayuda de sus técnicos y sin prestar servicio. Podría verse como una ventaja que hace unos años ya, entre los años 1999 y 2000, fue considerada como la principal solución a herramientas de gestión de redes y sistemas informáticos, llegando a gestionar incluso el 70% de los sistemas en Internet con clientes importantes como British Telecom, Euskaltel, Uni2, Metro Bilbao, Fagor y Henkel, Telefónica, Banco de Santander o Mapfre. Pero actualmente provoca que sean productos bastante ‘desfasados’ y paralizados cuyos desarrollos de mejoras o cambios para adaptarse a los sistemas actuales sea casi nulo. A esto debemos sumar, que incluso actualmente se encuentran numerosos agujeros de seguridad en productos de HP y son emitidos por la propia empresa, como por ejemplo el documentado referente a la vulnerabilidad en los agentes OVPA que puede permitir a un atacante remoto borrar cualquier archivo de los sistemas monitorizados a su elección o de cualquier otro sistema monitorizado a través de rutas UNC (como “\\servidor\archivo.ext”), si se realiza una petición específicamente manipulada al puerto TCP 383. Es un problema que reside en versiones 6.20.50.0 y anteriores. También otros problemas encontrados en otro producto HP OpenView, hasta nueve vulnerabilidades tuvieron que corregirse de las cuales ocho de ellas fueron calificadas con un valor de 10 (el máximo) según las métricas CVSS 2.0, en concreto para el producto Storage Data Protector, para el manejo y realización de copias de seguridad, donde por un desbordamiento del búfer (buffer overflow) en diferentes servicios a través del envío de paquetes mal construidos se permitía la ejecución de código arbitrario de forma remota en sistemas afectados y afectaba a entornos Windows. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 36 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Fuentes: http://www8.hp.com/us/en/software/enterprise-software.html#tab=3 http://monitorizando.com http://www.aurigae.com/recursos/prognosis/Folleto_Smart_plugin_HP_OpenView.pdf http://unaaldia.hispasec.com/2008/01/ejecucion-remota-de-codigo-traves-de.html http://support.sas.com/rnd/emi/HPOpenViewOperations/HPOpenViewOperations.html http://pfcmon.wikispaces.com/1.4+HP+Operations+Manager+%28OVO%29 http://www.networkworld.es/Las-ventas-de-HP-OpenView-en-Espana-crecen-un-59-por-ciento/seccion-/noticia-7015 http://topmanagement.com.mx/modules.php?management=HP+ES+EL+NO.+1+EN+PARTICIPACI%D3N+DE+MERCAD O+A+NIVEL+MUNDIAL+EN+SOFTWARE+DE+ADMINISTRACI%D3N+PARA+SISTEMAS+DISTRIBUIDOS&name=Noticias&fi le=show&clave=52644 http://vulnerabilityteam.blogspot.com/2010/06/nueva-vulnerabilidad-hp-openview.html http://informaticayseguridad.blogspot.com/2011/06/vulnerabilidad-en-hp-openview.html http://www.laflecha.net/canales/seguridad/noticias/graves-vulnerabilidades-remotas-en-hp-openview-storage-dataprotector http://www.cio.com.mx/Articulo.aspx?id=7708 http://unaaldia.hispasec.com/2008/01/ejecucion-remota-de-codigo-traves-de.html SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 37 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Tivoli Software es una familia de productos de software para la administración de infraestructura de IT (tecnología de la información) perteneciente a IBM (International Business Machines) empresa multinacional estadounidense que comercializa hardware y software y ofrece servicios en una amplia gama de áreas relacionadas con la informática. Aunque ha sido descrita como una empresa orientada a las ventas, actualmente está siendo un defensor principal en el movimiento de OpenSource invirtiendo miles de millones de dólares en servicios y software basados en Linux. Ha lanzado códigos bajo varias licencias de código abierto, tales como el framework multiplataforma Eclipse, la licencia International Components for Unicode (ICU), y el sistema de gestión de bases de datos relacionales Apache Derby, que es basado en el lenguaje de programación Java. Ofrece herramientas orientadas a la administración del rendimiento y la disponibilidad de los sistemas y servicios. Entre las que destacamos IBM Tivoli Monitoring (ITM) con licencia comercial y es la solución más novedosa de IBM de monitoreo de rendimiento y disponibilidad para la supervisión y vigilancia de sistemas operativos, aplicaciones, bases de datos y servicios de negocios en entornos distribuidos y de hosts. Está orientada a las pequeñas y medianas empresas como una herramienta de automatización para la optimización de costos. Se encuentra disponible para diversas plataformas que incluyen Linux, UNIX (AIX, Solaris, HP-UX), Windows®, y z/OS. Utiliza el protocolo SNMP para la recolección de datos que luego almacena y procesa y posee una arquitectura con o sin agentes. Permite la configuración de una respuesta programada ante una alarma ya sea local (reproducir un sonido, ejecutar un archivo externo, escribir un archivo de registro externo, ejecutar un script, escalar un mensaje en la jerarquía del sistema) o funcional (enviar un e-mail o notificación vía SMS, reiniciar un servidor remoto). Produce informes y gráficos en varías tecnologías (XML, HTML, CSV) personalizados basados en el historial o métricas recolectadas por los agentes. Ayuda a identificar y arreglar interrupciones que amenazan aplicaciones clave antes de que afecten directamente a los usuarios. Supervisa de manera proactiva los recursos del sistema para detectar problemas potenciales y responde automáticamente a eventos. Proporciona un umbral dinámico y análisis de rendimiento para mejorar la prevención de riesgos. Mejora la media de tiempo de recuperación gracias a la visualización rápida de incidentes y la búsqueda histórica de investigación rápida de incidentes. Recoge datos que puede utilizar para dirigir las actividades de rendimiento y planificación de la capacidad a tiempo y así evitar interrupciones debidas al exceso de uso de recursos. Es un producto altamente escalable con una amplia gama de opciones de personalización y de integración. Hay varios módulos disponibles para Tivoli Monitoring que se extienden las capacidades de monitoreo a los sistemas más complejos, tales como las aplicaciones. NET, bases de datos o AMW (Amazon Web Services). SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 38 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE En concreto se trata de diferentes módulos de la herramienta denominada IBM Tivoli Composite Application Manager (ITCAM). A continuación mostramos una tabla con las especialidades de cada una: Ilustración 28 – Relación de herramientas, licencia y componentes de IBM Tivoli Software. Podemos observar que la existen multitud de herramientas, cada una especializada en un sector, y la más ‘básica’ ITM sólo proporciona soporte para Sistemas Operativos. Sería necesaria una nueva herramienta, y por tanto una nueva licencia si se requiere alguna especificación en cuanto a aplicaciones, servidores virtuales, transacciones, etc. También puede integrarse con otras herramientas de la familia de IBM Software, en concreto se recomienda la integración entre IBM Tivoli Monitoring for Energy Management y Tivoli Business Service Manager que permite una gestión energética unificada de los activos tecnológicos y no tecnológicos, consolidando toda la información sobre el consumo de la instalación en un panel energético personalizable. Y por último nombraremos la herramienta IBM Tivoli Live Monitoring Services para la supervisión de centros de datos en la nube. Dispone de una consola o interfaz gráfica a través del componente IBM Tivoli Enterprise Portal (TEP) de navegación común, flexible e intuitiva y espacios de trabajo personalizables en la que se puede visualizar iconos de los dispositivos de forma y su relación en un mapa gráfico. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 39 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ilustración 29 – Consola de IBM Tivoli Monitoring. Ventajas: - Posee una amplia variedad de productos comerciales que hacen en conjunto una gestión sencilla de una infraestructura IT, incluso con un soporte total en la instalación, actualización y mantenimiento. Inconvenientes: - No es un producto de software libre y presenta un precio elevado por su licencia comercial con una duración limitada a 12 meses y se le debe sumar un coste extra por cada agente que se desee instalar a los nodos a monitorizar. Los precios de las licencias para cada herramienta varía de una a otra, en concreto para la licencia del producto ITM mostramos unos precios orientativos en euros de la web oficial de IBM: Ilustración 30 – Precios de licencia de IBM Tivoli Monitoring. - Sin embargo, para una licencia para ITCAM para aplicaciones el precio es muchísimo más elevado: SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 40 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ilustración 31 – Precios de licencia de IBM ITCAM para aplicaciones. - - El hecho de tener que contratar varias licencias diferentes para varios productos o software encarece aún más la compra de un producto sólido que sea capaz de cumplir todas las expectativas del cliente, sin mencionar que la facturación más costosa es el posterior servicio y mantenimiento que deberá realizar dicha empresa multinacional. Por último, encontramos fácilmente por la web varios agujeros de seguridad remitidos y publicados por la propia empresa como vulnerabilidades ante ataques para la ejecución de código arbitrario causados por desbordamiento del buffer al procesar cadenas demasiado grandes. Fuentes: http://www.ibm.com/developerworks/ssa/downloads/tiv/tivolimonitoring/faq-ec2-tivolimonitoring.html http://www-142.ibm.com/software/products/es/es/tivomoni/ http://www-01.ibm.com/software/ar/demos/tivoli.shtml http://www.hw-group.com/software/pd_snmp_en.html#IBM_Tivoli http://publib.boulder.ibm.com/infocenter/hctool/v1r0/index.jsp http://www.redbooks.ibm.com/abstracts/SG247217.html?Open https://www-112.ibm.com/software/howtobuy/buyingtools/paexpress/Express http://www-01.ibm.com/software/tivoli/products/monitor-virtual-servers/ http://www-142.ibm.com/software/products/es/es/tivomoniforvirtenvi/ http://www.tuexpertoit.com/2009/12/17/ibm-tivoli-live-monitoring-services-monitorizacion-de-centrosde-datos-desde-la-nube/ http://www-01.ibm.com/software/tivoli/products/monitor-virtual-servers/ http://www-03.ibm.com/systems/es/power/software/management/enterprise.html http://unaaldia.hispasec.com/2007/04/multiples-vulnerabilidades-en-varios.html http://cert.inteco.es/vulnDetail/Actualidad/Actualidad_Vulnerabilidades/detalle_vulnerabilidad/CVE-2011-4061 http://www.capitalfederal.com/foros/viewtopic.php?p=531933&sid=ba40dd6dde4e7e6895e7ca14645c88c2 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 41 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE BMC Software es corporación multinacional especializada en Business Service Management (método utilizado para la gestión de negocios y servicios IT) y desarrolla y vende productos con licencia comercial para múltiples funciones: gestión de servicios IT, automatización centro datos (data center), gestión de rendimiento, gestión de virtualización y computación en la nube. Su nombre proviene de los apellidos de sus tres fundadores: ‘Scott Boulette, Moores de Juan y Cloer Dan’. Entre la amplía gama de productos destacamos BMC Patrol (patrulla), la cual fue una herramienta diseñada y comercializada a mediados de la década de los 1990 como una herramienta de gestión de sistemas y bases de datos que controlaba el estado de los equipos, recursos y aplicaciones en una red. Dicho software fue una adquisición de la empresa BMC, entre otras muchas pequeñas y medianas empresas, en concreto a Patrol Software, Inc de Australia. Actualmente, BMC Patrol se encuentra integrada como una parte del actual producto o software propio BMC ProactiveNet Performance Management, la cual se define como una herramienta para la gestión distribuida de infraestructura y aplicaciones para garantizar un rendimiento óptimo. Esta solución intenta integrar en una única herramienta BMC Patrol clásico y BMC Patrol Express, cuya principal diferencia es el uso de una arquitectura con y sin agentes respectivamente. Dicho producto, ofrece una gran variedad de soluciones para gestionar entornos distribuidos heterogéneos: Infraestructura > BMC Performance Manager for Servers: – Windows, VMware (ESX), Linux (Red Hat, Suse) y UNIX (AIX, HP, Solaris y True 64) > BMC Performance Manager for OpenVMS > BMC Performance Manager for Virtual Servers > BMC Performance Manager for NonStop Himalaya Servers > BMC Performance Manager for Hardware by Sentry Software > BMC Performance Manager for Citrix Presentation Server Bases de datos > BMC Performance Manager for Databases: – Oracle, Microsoft SQL Server, Sybase e IBM DB2 Universal Database > BMC Performance Manager for Informix Aplicaciones > BMC Performance Manager for Business Applications – Aplicaciones SAP® (R/3, ECC, XI, APO, CRM, BW, EP, WAS), PeopleSoft (HR, Financials), Oracle E-Business Suite y Siebel > BMC Performance Manager for Mail and Messaging: – Lotus Domino y Microsoft Exchange > BMC Performance Manager for Internet Servers Software intermediario > BMC Performance Manager for WebSphere Business Integration > BMC Performance Manager for Web Application Servers – IBM WebSphere Application Server, BEA WebLogic Server SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 42 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE BMC ha rediseñado la arquitectura de BMC Patrol a partir de las metodologías y tecnologías avanzadas de recopilación remota de datos sin agente para simplificar la gestión de sistemas y reducir la carga administrativa asociada con las tecnologías de gestión basadas en agentes. Ofrece un almacén de datos centralizado para todos los datos de rendimiento y disponibilidad recopilados, ya sea mediante canales de recopilación remotos de BMC Performance Manager o de agentes Patrol local. BMC intenta combinar Patrol y PE en una sola arquitectura y consolidar en una sola licencia ambos productos. La mayoría del nuevo producto fue construido a partir de Patrol Express con alguna mejora, como la tecnología Marimba para hacer más fácil la distribución y recolección de datos. Ilustración 32 – Arquitectura multicapa de BMC Perfomance Manager, permite gestión con y sin agentes. También en esta versión, BMC expande el apoyo para el servidor Web Apache, Compaq Insight Manager, Dell OpenManage, BEA WebLogic, IBM WebSphere, JBoss y SAP. Incluye mejoras en el monitoreo mediante trampas SNMP, Telnet, SSH y JMX. Mediante un panel de control virtual con el que es posible controlar y reparar los problemas o errores detectados mediante alertas sin necesidad de detener el sistema. Combina la planificación, el análisis preventivo y de automatización, administración proactiva y gestión de impactos que impide que afecte negativamente a los usuarios o servicios finales. Resuelve eventos por prioridad en tiempo real en un contexto de negocio o mainframe, ya sea físico, virtual o en la nube (cloud) y permite definir y realizar un seguimiento de los niveles de servicio (SLA). En la suite de productos BMC Performance Manager se utilizan tecnologías con agente y sin agente para gestionar la disponibilidad de la infraestructura. Por tanto combina en un sistema híbrido la fiabilidad de una arquitectura con agentes y la simplicidad de una recopilación de datos sin agentes. Esto permite elegir el método más económico para cada componente de la infraestructura de IT. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 43 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Presenta una interfaz de usuario BMC Performance Manager Portal centralizada a través de un explorador web y permite gestionar el estado de una aplicación, sistema operativo, software intermediario o hardware. Posee paneles o vistas personalizadas, gráficos, avisos y estados de eventos, además de un inicio de sesión por usuario. Ilustración 33 - Consola BMC Performance Manager Ofrece una función de generación de informes predefinidos para Microsoft Windows, UNIX® y Linux® y puede aumentar la capacidad o potencial a través de una nueva herramienta BMC Reporting Studio. Incluye la utilidad de introducir los datos de parámetros seleccionados por el usuario en una segunda base de datos (Oracle®) de forma sincronizada. Esta funcionalidad se potencia con HDE (Historical Data Export), que extrae los datos de parámetros a un registro histórico por fecha especificado por el usuario. Gracias a esto, la segunda base de datos se convierte en una fuente de datos más completa. Cumple las directrices de los procesos ITIL (IT Infrastructure Library) en cuanto a gestión de disponibilidad, y ofrecen las medidas de rendimiento y disponibilidad necesarias para prestar un servicio óptimo. Se puede integrar con otras aplicaciones como BMC Remedy IT Service Management, para la gestión de incidencias y problemas que podrían afectar al servicio antes de que repercutan en los usuarios finales y éstos llamen al Service Desk para quejarse. También permite el integrado con BMC BladeLogic Server Automation Suite, que permite a los análisis que se aplicarán a los cambios de configuración para ayudar a identificar y aislar un error de cambio humano, una causa frecuente de caída de las aplicaciones de negocio. Otra herramienta es BMC Atrium Configuration Management Database (CMDB) que posibilita “abrir vistas en contexto” desde otras aplicaciones para reducir el número de operaciones necesarias a la hora de solucionar un problema. Integración con BMC Transaction Management y BMC Capacity Management para mejorar la visibilidad y aumentar la capacidad de gestión. Posibilidad de introducir elementos de configuración en BMC Atrium CMDB desde servidores, aplicaciones, bases de datos y sistemas de archivos gestionados para agilizar las instalaciones de CMDB y mantener su integridad. Es una plataforma ampliable con kits de desarrollo de software (SDK), que permiten al usuario desarrollar canales de recopilación personalizados o soluciones de monitorización en función de sus necesidades y llevar a cabo la integración de paquetes (plugins) o un framework para el control y supervisión de determinadas aplicaciones o entornos, como por ejemplo SAS 9.1.3 SP4 BI Server, para las versiones BMC PATROL Console for Windows® 3.5.62 y BMC PATROL UNIX Knowledge Modules® (KM) que se ejecutan en Sun Solaris 10 y entornos UNIX. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 44 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Ventajas: - Es una herramienta para gestionar una infraestructura IT y que ha sido remodelada o actualizada hace relativamente poco tiempo para afrontar un mercado en crecimiento para intentar combinar tecnología con y sin agentes, aunque las bases hayan sido partir desde la aplicación anterior y no empezar desde cero una nueva. Inconvenientes: - No es un producto de software libre opensource y suponemos que presenta un precio elevado por su licencia. En la web oficial es imposible encontrar una orientación de sus precios en coste de licencias o por número de agentes. Incluso hemos intentado ponernos en contacto personalmente con las oficinas existentes en Madrid y Barcelona como consultores de seguridad independientes para obtener más información técnica (a parte de la poca obtenida en la web oficial) acerca de la herramienta y también “alguna” información económica, tanto del coste de licencias como del servicio profesional, con la intención de ofertarla a futuros clientes. Sin embargo, la respuesta obtenida ha sido nefasta, ya que se cierran a cal y canto a negociar o hablar de cifras concretas de su producto si no son ellos los que conceden la entrevista personal con los clientes. Podemos decir que no han sabido ser buenos comerciales ni vender su producto, y que muestran una actitud desinteresada, haciendo caso omiso incluso a correos electrónicos enviados a su personal comercial. Fuentes: http://en.wikipedia.org/wiki/BMC_Software http://www.informationweek.com/news/software/app_optimization/222000399 http://documents.bmc.com/products/documents/37/83/83783/83783.pdf http://www.bmc.com/products/product-listing/ProactiveNet-Performance-Management.html http://www.serverwatch.com/sreviews/article.php/3548996/Monitoring-Tools-Profile-BMC-PATROL-forWindows.htm http://support.sas.com/rnd/emi/BMCPatrol/sas913sp4.bmcpatrol.prelim.pdf http://support.sas.com/rnd/emi/BMCPatrol/index.html SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 45 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 3.2- DIFERENCIA ENTRE ARQUITECTURAS EN LOS SISTEMAS: Vamos a comentar ahora la diferencia entre las aplicaciones que utilizan en su arquitectura una tecnología de servidor y agentes, los cuales se ejecutan en los equipos a monitorizar, y los que no utilizan ningún software en dichos equipos. Para ello, nos basaremos en un estudio realizado por Chris Knowles en 2007 “The Truth about Agent vs. Agentless Monitoring A Short” donde distingue ambos tipos de sistemas. Expone que los sistemas con agentes realizan un envío de datos al servidor más detallados y específicos, lo cual favorece para la identificar más rápidamente los fallos en el sistema y reducir los tiempos de inactividad, aunque esto conlleve una mayor carga de actividad en el nodo a monitorizar. También permite una mayor flexibilidad a la hora de crear nuevas soluciones y complementos extendiendo así la funcionalidad del sistema. Además, el control de la aplicación y servicios que expone dicho nodo se realiza de forma directa y mediante protocolos seguros encriptados. Resalta que la seguridad con un sistema sin agentes es menor y que puede verse afectado por hechos que suceden en la red. En la actualidad, también existen sistemas híbridos que disponen de una arquitectura con y sin agentes dejando al usuario la opción a escoger para cada nodo a monitorizar. Esta nueva metodología emergente surge a partir del dilema que supone que algunos componentes necesitan, en función de la importancia que tenga dentro de la red, un mayor nivel de detalle y profundidad. Este sistema aporta una mayor flexibilidad y evita sobrecargar de forma masiva el sistema con el uso de multitud de agentes. Hemos podido comprobar que esta arquitectura está siendo desarrollada y defendida en los productos con licencia comercial como una mejor elección y con mayores garantías hacia el cliente, como por ejemplo resulta en BMC Software. Existe una opinión a favor de los sistemas sin agentes para entornos específicos, en concreto para una gestión de transacción empresarial (BTM: business transaction management) para la supervisión de aplicaciones virtuales y basadas en la nube y terceros entornos de conexión ya que aprovecha mejor el bajo impacto en el rendimiento de la red, el bajo esfuerzo y la fácil implementación que supone esta arquitectura. Fuentes: Informe sistemas de monitorización con o sin agentes: Chris Knowles “The Truth about Agent vs. Agentless Monitoring A Short” http://www.google.es/url?sa=t&rct=j&q=the%20truth%20about%20agent%20vs.%20agentless%20mo nitoring%20a%20short&source=web&cd=5&sqi=2&ved=0CEoQFjAE&url=http%3A%2F%2Fwww.businesslist.co m%2Ftoolbox%2Fwhitepapers%2Findex.php%3Fm%3Dwhitepaper%26d%3Dattachment%26id%3D1073&ei=9ThNTWxOoS0hAfbsqD1Dw&usg=AFQjCNHE3-uS5FOrrFFDqRWwycvcQxym7Q&sig2=Xf-HluzbR5-WL1S0vFBHPg Vídeo sistemas de monitorización sin agentes: http://www.youtube.com/watch?v=rk_Mb7XCz8g SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 46 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 3.3- DIFERENCIA ENTRE SISTEMAS MULTIPROCESO: La diferencia entre sistemas multiproceso ante un sistema cuya ejecución se realiza con un solo proceso nos basamos en artículos como el realizado por Gerhard Lausser ‘Administración con Shinkem’ donde defiende este nuevo sistema de monitorización basado en el núcleo de Nagios con nuevas modificaciones importantes, entre ellas, un nuevo modelado multi-proceso distribuido que se adapte bien a entornos distribuidos y heterogéneos. Los sistemas que utilizan un solo proceso para realizar tareas como parsear la configuración, gestionar la programación de tareas, llevar a cabo comprobaciones y gestionar el scripting, etc. Y los sistemas que utilizan un proceso para cada una de ellas, permiten distribuir el trabajo total y optimiza el rendimiento y permite a las distintas partes completar sus tareas sin obstaculizar al resto. Fuentes: Informe sistemas de monitorización multiproceso: Gerhard Lausser “Administración con Shinkem” http://www.linux-magazine.es/issue/63/067-071_ShinkemLM63.pdf SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 47 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 3.4- COMPARACIÓN ESPECÍFICA DE LAS HERRAMIENTAS: Después de conocer y detallar algunas de las herramientas de monitorización más populares y reconocidas, realizaremos una comparación específica entre todas las soluciones planteadas en base a unos factores globales y competencias o especificaciones contenidas en dichos factores, los cuales describiremos a continuación. Funcionalidad: › Monitorizar servicios, hardware y sistema operativo. › Multiplataforma en cliente. › Generar gráficas, informes y estadísticas. › Enviar alarmas y notificaciones, etc. Fácil uso: › Interfaz o consola web con control total sobre la aplicación. › Personalización de dicha interfaz. › Extensión del sistema (plugins). › Instalación, configuración y puesta en marcha, etc. Arquitectura: › Basada en varios procesos que realicen las funcionalidades de la aplicación. › Consumo y requisitos previos aceptables (hardware, software, etc.) › Sistema con agentes que trabajan en cada cliente o nodo. › Posibilidad de monitorizar gran cantidad nº de nodos (varios miles). › Estabilidad a cambios de configuración (reinicios del sistema), etc. Calidad del Soporte Comunidad/Empresa: › Desarrollo de nuevas mejoras y revisiones en la aplicación para la corrección de bugs. › Actividad en el foro y wiki ante preguntas y resolución de problemas o peticiones de usuarios. › Disponibilidad de una versión Enterprise de su herramienta, por si se requieren aspectos más específicos en el entorno de producción donde inicialmente se confió en una herramienta de software libre. En su defecto, un soporte profesional diferente al de la comunidad. › Idiomas de la documentación disponible, etc. Expondremos de manera crítica una tabla que representará y reunirá de forma visual las características y consecución de objetivos de todos los softwares analizados. También mencionamos la siguiente fuente de Wikipedia donde ilustra una comparación entre multitud de herramientas de monitorización, entre las cuales se encuentran varias de las estudiadas en este documento: http://en.wikipedia.org/wiki/Comparison_of_network_monitoring_systems SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 48 SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE Sistema de Monitorización Software Libre Funcionalidad Fácil Uso Arquitectura Soporte Nagios Hyperic HQ Zabbix Zennos Ganglia OpenNMS Cacti Munin BMC Patrol HP OpenView IBM Tivoli Pandora FMS Ilustración 34 – Comparativa gráfica de las principales características de los sistemas de monitorización. La herramienta cumple con todas las competencias de ese factor global. La herramienta NO cumple con al menos una de las competencias de ese factor global. SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE 49