sistema de monitorización – estado del arte

Anuncio
Luis Caballero Cruz
Ingeniería Técnica Informática de Sistemas
Universidad de Sevilla
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
3.1- ESTADO DEL ARTE:
En este capítulo analizaremos las herramientas o softwares más populares y
utilizados que existen en la actualidad donde todos ellos tienen en común un objetivo: la
gestión y monitorización de redes, pero la llevan a cabo por diferentes caminos y de forma
diferente.
Destacaremos una serie de ítems o aspectos interesantes de cada uno, como por
ejemplo: historia, versión actual, quién lo ha fabricado y quién lo mantiene, qué licencia
tiene, si posee una versión comercial o Enterprise de su producto, si ha recibido algún
premio importante, las tecnologías utilizadas en su desarrollo, qué plataformas soporta, sus
funcionalidades, su arquitectura y características principales, si tiene interfaz web y qué
funciones desempeña y una serie de ventajas e inconvenientes. Finalmente, realizaremos
una comparativa global de algunas características para seleccionar una solución final.
Diferenciaremos dos grandes grupos de comparativa: herramientas de Software
Libre y herramientas Comerciales.
Software Libre: Son las herramientas con una distribución libre y
generalmente con disponibilidad gratuita, aunque no siempre se cumple esto
último. Aun así, el autor establece una licencia para el producto, puesto que
no significa que sea de dominio público. Su principal ventaja es su bajo coste
de adquisición y la innovación y corrección de errores por parte de cualquier
usuario. De este tipo de herramientas, analizaremos las siguientes:
›
›
›
›
›
›
›
›
›
Pandora FMS
Nagios
Hyperic
Zabbix
Zenoss
Ganglia
OpenNMS
Cacti
Munin
Software Comercial: Es también conocido como software propietario o
privativo y son las herramientas donde el usuario tiene limitaciones en su uso,
modificación y redistribución. La persona o compañía que posee los derechos
de autor restringe los derechos de usuario y lo utiliza como fuente de
productividad constituyendo un acuerdo o contrato con el cliente. De este
tipo de herramientas, analizaremos las siguientes:
›
›
›
BMC Patrol
HP OpenView OVO
IBM Tivoli
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
1
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
3.1.1- HERRAMIENTAS DE SOFTWARE LIBRE:
La primera herramienta de monitorización a estudiar será Pandora FMS v4.0. Es
una herramienta de software libre OpenSource (código abierto) con licencia GPL versión 2
(GNU Public License), la cual está orientada a proteger la libre distribución y modificación
de software libre. El proyecto comenzó en 2004 cuando se publicó la primera versión
estable 1.0 con el nombre de ‘Pandoramon’. Está desarrollado y mantenido actualmente
por la empresa Ártica Soluciones Tecnológicas con base en Madrid.
También existe una versión con una licencia comercial, Pandora FMS Enterprise
que proporciona numerosas características adicionales, aunque la gran mayoría del código
es similar a la versión OpenSource ya que está creada a partir de esta. Se puede obtener
por un precio proporcional al número de agentes o nodos instalados. Esta versión incluye
además soporte profesional, actualizaciones y mantenimiento mediante el sistema Open
Update Manager.
Esta aplicación de monitorización sirve para vigilar y analizar de forma visual todo
tipo de sistemas y aplicaciones, utilizando una interfaz o entorno web a través de nuestro
navegador. Es una herramienta modular y flexible y está orientada datos. Puede supervisar
todo tipo de parámetros o servicios, Sistemas Operativos mediante agentes específicos que
recolectan información, incluso hasta sensores (por ejemplo: humedad, luminosidad,
movimiento), electrónica de red, etc.
Bajo los servicios más comunes, puede monitorizar la carga del procesador, espacio
libre en disco, uso de memoria, procesos que están corriendo en el sistema. Además, puede
detectar si una interfaz de red se ha caído, un ataque de “defacement” en una web incluso
un movimiento de un valor en NASDAQ (bolsa de valores automatizada electrónica de
EEUU). Puede monitorizar también mediante SNMP (protocolo de intercambio de
información entre dispositivos de red), WMI (protocolo ideal para compañías con
instalaciones mixtas Linux/Windows) y pruebas de red (TCP/ICMP) y comprobar cualquier
sistema hardware con conectividad TCP/IP (protocolo de transmisión y de internet), como
por ejemplo, cortafuegos, proxies, bases de datos, VPN (red privada virtual), balanceadores
de carga, routers, switches, impresoras, etc.
Todo esto controlado mediante notificaciones, las cuales son enviadas mediante
correo electrónico o SMS cuando cualquier parámetro establezca un valor incorrecto o por
encima del umbral establecido.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
2
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Trabaja bajo una base de datos, actualmente MySQL es el único formato soportado
para entornos de producción, aunque se está experimentando para trabajar también con
Oracle y PostgreSQL, y es donde almacena todos los datos recibidos por los módulos de los
agentes, por lo tanto es el componente más vital de la arquitectura de nuestra
herramienta.
Estos datos se gestionan automáticamente y no requiere ningún tipo de
administración de base de datos ni proceso manual. Se realiza periódicamente una
compactación de los datos con una determinada antigüedad.
Gracias a esta base de datos, puede generar estadísticas, gráficas, niveles de
acuerdo de servicio (SLA – Service Level Agreement), niveles de acuerdo de operación (OLA
– Operation Level Agreement) e indicadores clave de rendimiento (KPI – Key Performance
Indicators). También puede generar informes, los cuales pueden ser programados en la
versión comercial para ser enviados a un correo electrónico de forma recurrente, es decir,
de forma diaria o cada semana, cada mes, etc. El formato del informe es el estándar PDF.
Cabe mencionar que Pandora FMS no es un sistema de monitorización de entornos
críticos, ya que su monitorización no es completamente en tiempo real (+5 segundos).
Tampoco es una herramienta de correlación y análisis de logs o eventos. Puede
recolectarlos y procesarlos pero no es su función principal.
Las iniciales en el nombre de Pandora FMS vienen de Flexible Monitoring System, y
de acuerdo con ello, es una herramienta extremadamente flexible, modular y
descentralizada. Consta de diversos elementos en su arquitectura, entre ellos, los
servidores, que se encargan de recolectar y procesar los datos e introducirlos en la base de
datos (todos los servidores acceden a la BD). Son los encargados de realizar las
comprobaciones y comparaciones existentes y verifican, de forma constante, si algún
elemento tiene algún problema y cambian el estado de los mismos según los resultados
obtenidos. Por tanto, son los que avisan mediante alertas para el control del estado de los
datos. A continuación, pondrían en ejecución la acción definida en la alerta, como por
ejemplo, mandar la notificación o ejecutar un script personalizado.
Existen una totalidad de 10 servidores diferentes y especializados en diferentes
tareas, de los cuales 7 existen en la versión OpenSource y hay 3 sólo para la versión
Enterprise. Todos están integrados en una aplicación, llamada de forma genérica “Pandora
Server”, la cual es una aplicación multihilo o multiproceso desarrollada en PERL5 que
ejecuta en diferentes subprocesos cada instancia especializada. Cada uno de ellos puede
ser monitorizado desde la Consola Web, en la sección de ‘estado de servidores’,
observando así su estado. Posee también los elementos llamados agentes, que son
aplicaciones que corren en los sistemas y recolectan información para enviárselas a los
servidores, en concreto los agentes Windows están desarrollados en C++ y los agentes en
Unix en PERL5. Usa un protocolo de comunicación llamado Tentacle para comunicar los
agentes con el servidor. Mediante este protocolo lo que se envía es un documento XML que
el servidor es capaz de entender y el checksum de ese archivo XML.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
3
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
En la web sourceforge se puede encontrar el código fuente de tentacle, con lo que
es fácil compilarlo para cualquier arquitectura.
Además, posee como entorno de usuario una Consola Web, que permite la
administración y control total de nuestra herramienta con diferentes privilegios según el
usuario, como se puede encontrar en la demo disponible en la web oficial, donde
encontramos usuarios específicos para monitorización de entornos virtuales,
monitorización web o de eficiencia energética, entre otros. Se encarga de visualizar los
datos presentes en la base de datos. El servidor de aplicaciones está programado en PHP5 y
no requiere la instalación de ningún software adicional: ni Java, ni ActiveX, lo cual lo
convierte en una aplicación ligera. No obstante, las gráficas están disponibles en FLASH y
para poder verlas en este formato será necesario este complemento para el navegador. La
interfaz web está basada en tecnologías como AJAX y HTML5. Posee un sistema de
expansión o de extensión (plugins) muy modular que permite aumentar las funcionalidades
de los agentes y que pueden desarrollarse en diferentes lenguajes de programación, como
por ejemplo VBScript, Java, PowerShell, Perl, Python o Shellscript. Permite realizar batch
de pruebas complejas e incorporarlas de una forma sencilla y autónoma, además de que se
pueden aprovechar mecanismos de monitorización ya existentes en Pandora para crear
otros nuevos.
Ilustración 11 – Interfaz o consola web de usuario de Pandora FMS
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
4
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Por último, podemos destacar algunas impresiones personales y puntos fuertes
sobre Pandora FMS:
Ventajas:
-
La política de Pandora FMS, y en general de la empresa Ártica ST, al desarrollar
un nuevos productos de software libre y realizarlo de forma global, con un
código abierto y legible a todas las personas o empresas permite trabajar codo a
codo con empresas interesadas o futuros clientes, ya que no solo se les vende el
producto, sino que se permite que dichas empresas clientes entren en el
desarrollo del producto para sus propios intereses específicos y avanzar hacia el
objetivo juntos. Como es el caso en España de Telefónica, en su página web se
publica un artículo de cómo fueron las relaciones y la historia del éxito
conseguido por ambas partes, donde se puntualiza que ambos equipos, tanto el
de Ártica ST como Telefónica, trabajaron conjuntamente para las necesidades del
cliente y para adaptar su forma de trabajo a la herramienta. Este cambio ha
llevado a Telefónica a utilizar una única herramienta para sustituir lo que se hacía
con diferentes soluciones privativas como HP OpenView o IBM Tivoli,
homogeneizando así el sistema (una herramienta para diferentes entornos)
además de conseguir un ahorro importante en gastos. Además, al ser una
herramienta OpenSource que cuenta con una gran comunidad con miles de
usuarios en todo el mundo (+5.000) y con más de 500.000 descargas, los tiempos
de evaluación de nuevas versiones y posibles nuevos errores es mínimo.
Podemos escuchar directamente a Sancho Lerena, jefe de proyecto de Pandora
FMS defendiendo esta postura en una entrevista concedida en Intereconomía
Business: http://www.youtube.com/watch?v=Bv89wTaFqHM
-
Es una herramienta que cumple con todas las funcionalidades y la arquitectura
de un sistema de monitorización, incluyendo la supervisión en todo tipo de
sistemas operativos (multiplataforma en cliente).
› NT4, Windows 2000, XP, 2003, Vista, 2008, 7 en 32/64 bits.
› HP-UX 11 o superior.
› AIX 4.3 o superior.
› Solaris.
› Linux (cualquier distribución).
› NetBSD, FreeBSD, OpenBSD.
Este es un factor importante para empresas con servidores con sistemas
operativos mixtos, un ejemplo de ello, es la siguiente gráfica disponible en la web
oficial donde se muestran las descargas y utilización del sistema en los diferentes
sistemas operativos.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
5
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ilustración 12 – Distribución de descargas y Sistemas Operativos monitorizados.
-
También puede considerarse una herramienta multiplataforma en servidor,
con la excepción de que aunque puede instalarse en servidores Windows, no se
recomienda en entornos de producción. Además dicha instalación debe
realizarse manualmente, ya que el proceso no está automatizado. Existen
instrucciones de su configuración para la creación de directorios y pasos a
seguir.
-
Uno de los principales puntales que hacen de Pandora FMS una herramienta
excepcional es el fácil uso que presenta su interfaz o consola web, ya que
permite controlar totalmente la aplicación de forma intuitiva y amigable, así
como realizar tareas de administración y configuración de manera sencilla
(sistema GUI). También afecta en su usabilidad la fase de instalación y
configuración hasta su puesta a punto, el tiempo que conlleva es menor que la
de otros sistemas que estudiaremos a continuación, lo cual realza la facilidad de
uso de cara al usuario. Hay disponible una demo para navegar por dicha
interfaz web para poder visualizarla sin necesidad de instalarla y para tener una
idea del producto: http://firefly.artica.es/pandora_demo/
-
En cuanto a su arquitectura, debido a ser un proyecto iniciado hace menos
tiempo, podemos intuir que su forma de avanzar hacia su objetivo es distinta y
camina con mejor perspectiva hacia el funcionamiento y la consolidación de la
herramienta, evitando errores del pasado que ya poseen otros sistemas de
monitorización. Por ejemplo, divide en varios procesos las funcionalidades del
sistema y utiliza agentes en cada nodo o cliente a monitorizar, aprovechando
las ventajas que esto conlleva. Está diseñado para soportar cambios en el
sistema y que este no se vea afectado de forma global y posee una buena
escalabilidad y potencial para monitorizar una gran red de dispositivos.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
6
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
-
Es una herramienta relativamente joven (2004) en comparación con otras
aplicaciones descritas en este documento, y aunque por ello se hagan
modificaciones, revisiones y nuevos desarrollos en beneficio de la aplicación
para corregir bugs y otros errores, se solventan con rapidez y con gran eficacia y
hace que el proyecto siga vivo y activo con el paso de los años consolidándose
aún más. Esto es llevado a cabo, en parte por una comunidad que da soporte
gratuito al usuario de forma muy efectiva desde el foro y la wiki disponible en el
sitio web oficial, lo cual es especialmente importante para un usuario sin
conocimientos avanzados.
-
En comparativa con el resto de herramientas que vamos a comparar, el soporte
técnico que podríamos recibir sería en castellano, tanto la documentación, su
página oficial, ayuda de la comunidad o el soporte comercial en vistas de una
mejora del producto Enterprise, ya que la empresa fundadora es de
nacionalidad española.
Inconvenientes:
-
Actualmente el único formato de base de datos soportada para la gestión y el
proceso de dichos datos a nivel de producción es MySQL, aunque actualmente
se trabaja en el proyecto para compatibilizar a otros formatos, como Oracle y
PostgreSQL, la capacidad de la herramienta para aminorar esta pequeña
desventaja. De hecho, se permite probar y utilizar de forma experimental estos
sistemas como gestores de BD desde la versión 4.0.
Fuentes:
http://pandorafms.org/
http://es.wikipedia.org/wiki/Pandora_FMS
http://openideas.info/wiki/index.php?title=Pandora_3.0:Documentation
http://pandorafms.com/clientes/Case%20studies/downloads/Successful_Story_Telefonica_ES.pdf
http://www.youtube.com/watch?v=Bv89wTaFqHM
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
7
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
El principal software libre orientado a la monitorización es desde hace mucho
tiempo Nagios Core Versión 3.x. Es una herramienta Open Source y está diseñado y
mantenido por Ethan Galstad, autor de dicho software, junto con un grupo de
desarrolladores que mantienen varios plugins. Según su propio autor, el significado de su
nombre, N.A.G.I.O.S es un acrónimo recursivo: “Nagios Ain´t Gonna Insist On Sainthood”. Es
una referencia a la encarnación original del software bajo el nombre de Netsaint.
Está licenciado bajo la GNU General Public License Version 2 publicada por Free
Software Fundation. También posee una licencia comercial Nagios PoweredTM la cual pone
a disposición de sus clientes dos softwares: Nagios XI y OpMon. El primero de ellos, se
puede obtener basándose en el volumen de nuestro sistema: entre 50 a
100 nodos o para nodos ilimitados, y representa la versión de Nagios
comercial. El segundo, es una solución de gobierno IT y gestión de procesos
empresariales y es compatible con Nagios.
En cuanto a su arquitectura y definición, es un sistema de monitorización
monolítico y orientado a eventos que vigila los equipos, tanto su hardware como software,
alertando cuando el comportamiento de los mismos no es el adecuado. Puede monitorizar
servicios de red, recursos hosts y puede programar plugins específicos para nuevos
sistemas. El control remoto es manejado a través de túneles SSH o SSL cifrado. Fue
diseñado para sistemas GNU/Linux pero también funciona en variantes Unix.
Está basado en una estructura maestro-esclavo donde el maestro es el servidor
dedicado para Nagios y los esclavos las máquinas a monitorizar.
En cada uno de los esclavos o clientes a monitorizar se configuran los plugins o scripts que
serán ejecutados para chequear un determinado servicio. Dichos scripts pueden estar
desarrollados en diferentes lenguajes o tecnologías: Perl, C/C++/C#, Expect/TCL, Bash,
Ruby, Python, o PHP. Aunque Nagios posee opcionalmente un intérprete embebido de Perl
que acelera la ejecución de estos scripts.
En el maestro se ejecuta una herramienta de conexión remota, la más habitual es
el demonio NRPE, con la cual el servidor accede a los plugins o scripts de medición
disponibles y configurados en las máquinas remotas o esclavos.
Ilustración 13 – Esquema de ejecución entre maestro-esclavo.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
8
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Algunas de sus principales características o funciones pueden ser:
-
Supervisión de los servicios red (SMTP, POP3, HTTP, NNTP, PING,etc).
Monitorización de los recursos (carga de procesador, espacio en
disco,etc).
Capacidad para definir una jerarquía de servidores en la red, lo que
permite la detección de hosts ‘down’ o inalcanzables.
Notificación de errores cuando existen problemas y cuando son
resueltos mediante correo electrónico, buscapersonas, SMS, etc.
Registro automático de rotación de logs.
Interfaz web para visualizar el estado actual de la red con la posibilidad
de generar informes y gráficas.
Su interfaz web nos permite la visualización de los servidores y el estado de los
servicios. Podemos organizar las máquinas o esclavos monitorizados, si realizamos la
configuración oportuna, por Grupos y por Servicios. Para el primero, por ejemplo, si
pertenecen a una misma familia o estación. Mientras que para el segundo, agruparlos
referente a un servicio determinado, por ejemplo, para aplicaciones web el servicio HTTP.
Posee la integración de diferentes CGIs (Computer-generated imagery) que son
imágenes o gráficos generados por ordenador mediante escenas estáticas o dinámicas.
También utiliza la herramienta RRDtool (Round Robin Database Tool) que es una
herramienta que trabaja con una base de datos para la creación de gráficas, cuyo
funcionamiento es ir actualizando los valores y sobreescirbiendo los antiguos, los cuales se
conservan como un historial. Su finalidad principal es el tratamiento de datos temporales y
datos seriales como temperaturas, transferencias en redes, cargas del procesador, etc.
Ilustración 14 – Interfaz Web de Nagios.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
9
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ventajas:
-
-
Es un software popularmente conocido y consolidado, ya que posee una gran
cantidad de plugins de la comunidad (más de 200) para extender sus
funcionalidades a través de innumerables sitios webs, que incluso son facilitados
en su manual oficial. Aunque, hay etapas de su historia en la que dicha
comunidad ha estado poco activa en cuanto al desarrollo de nuevos avances
sobre el producto.
Su fama ha incentivado nuevas herramientas de monitorización que contienen
un núcleo basado en Nagios, como por ejemplo: Opsview o Shinkem.
Existe buena documentación muy trabajada incluso en detalles y facilitada por la
comunidad.
Permite diferenciar entre hosts caídos o inaccesibles.
Posee un comando que chequea y valida los ficheros de texto de configuración
modificados antes de reiniciar el sistema.
Puede acoplarse con otra aplicación llamada Centreon para la gestión y control
de cualquier aspecto de la herramienta desde una interfaz web, evitando las
modificaciones sobre ficheros y por línea de comandos. Aunque esta aplicación
sólo funciona con todas las funcionalidades (reportes y statusmap) de Nagios en
Ubuntu 9.04 y conlleva una configuración y un tiempo extra para la puesta en
marcha.
Inconvenientes:
-
-
-
-
-
La instalación, configuración y los complementos (plugins) está basada en texto,
lo cual implica una dificultad media, inversión de tiempo y requiere un grado de
conocimiento técnico, además puede resultar algo tedioso. Cuando en realidad,
la mayoría de estas funciones, alrededor del 90% ya son posibles a partir del
protocolo SNMP.
Cualquier modificación en la configuración requiere un reinicio completo del
sistema, ya que por ejemplo, no es capaz de auto-descubrir nodos nuevos que se
incluyen al sistema.
Su interfaz web sólo sirve para visualizar los acontecimientos. Cualquier cambio
debe realizarse manualmente desde el servidor de Nagios.
No soporta ningún gestor de base de datos que trabaje bajo SQL.
No está disponible o no funciona en todos los sistemas operativos, por ejemplo,
en sistemas Microsoft Windows, es decir, sólo está disponible para sistemas GNU
Linux y otros unicode. Necesita una herramienta auxiliar para monitorizar estos
sistemas que sirva de proxy o intermediario, por ejemplo, NSClient++.
Aporta mucha información, pero a veces es poco exhaustivo, ya que no localiza el
problema y requiere una interacción cercana con la herramienta. Aparte, de que
el histórico de datos tampoco es muy recomendable, ya que no utiliza ningún
tipo de recolector de datos para el rendimiento.
Dispone de una consola de eventos muy débil, ya que por ejemplo no permite
configurar acciones automáticas ante nuevos eventos en el sistema.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
10
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
-
-
-
Los famosos timeouts o tiempos de espera en Nagios al utilizar nuevos plugins
para recoger y volcar los datos puede provocar que el sistema se venga abajo
como resultado. No existe seguridad al ejecutar scripts en clientes diseñados por
una persona encargada de realizarlos, supone una confianza plena en él y en el
código que ha implementado. Como ya hemos comentado, no sería una buena
práctica, ya que muchas de las caídas de servicios o tiempos de inactividad son
provocados por las propias personas o usuarios.
No posee un soporte adecuado para entornos de gran magnitud, así como de
técnicas contemporáneas como puede ser el clustering. Su código original, con
más de 10 años de antigüedad, presenta limitaciones a la hora de adaptarlo a la
rápida evolución de las redes contemporáneas de hoy en día (lenguajes de
programación, entornos distribuidos, etc.)
Su arquitectura se basa en un único proceso para realizar diferentes tareas.
Fuentes:
http://es.wikipedia.org/wiki/RRDtool
http://en.wikipedia.org/wiki/Computer-generated_imagery
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
11
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Otra herramienta de monitorización de redes disponible y potente es Hyperic HQ
Versión 4.6. Es una distribución OpenSource galardonada en 2007 con el “Best Systems
Management Tool Award at LinuxWorld” desarrollada por un equipo formado por: Javier
Soltero, Charles Lee, Jonathan Cobb y Doug MacEachem (autor de Mod perl). Está
disponible bajo la licencia GPL versión 2 (GNU Public License) publicado por la Free
Software Foundation.
También dispone de una versión comercial VMWare
vFabric Hyperic HQ|Enterprise disponible como parte de una
vFabric Cloud Application (aplicación nube). Está diseñada para
compañías con infraestructuras de gran escala. Proporciona soporte y mantenimiento y
presenta funciones avanzadas de automatización y control respecto a la versión
OpenSource. Por ejemplo: permite definir diferentes niveles o estados de alerta mediante
roles o grupos. Además, permite una predicción de estadísticas basado en lo almacenado o
existente en la base de datos. Se puede obtener gratuitamente con una caducidad entre 30
y 45 días o con una contribución económica obteniendo así la licencia del producto con un
soporte básico o productivo. Estas dos opciones hacen varíar el precio del producto casi un
10% más, y duración de 1 o 3 años por valores de 436$ y 553$ respectivamente.
Volviendo a la versión OpenSource, es una aplicación diseñada para la
monitorización y rendimiento de infraestructuras. Visualiza los datos en tiempo real
mediante métricas. Es capaz de realizar continuamente 50.000 mediciones a través de más
de 75 tecnologías webs. Autodescubre todos los recursos del sistema incluyendo hardware,
sistemas operativos, virtualización, base de datos, aplicaciones y servicios de red (SMTP,
POP3, HTTP, etc). Alerta cuando hay degradación en el rendimiento o existe la no
disponibilidad de un servicio, notificando o realizando y ejecutando procesos definidos
personalizados por el usuario.
Los componentes de Hyperic HQ son Servidor Hyperic, Agentes Hyperic y base de
datos. Ejecuta un agente en cada equipo que se desee administrar, los cuales recolectan
tanto información del sistema operativo, como su proveedor o versión y también
específicos del hardware, como la memoria RAM, velocidad CPU, dirección IP y nombres de
domino. Revisan la disponibilidad del sistema, logs, eventos y cambios de configuración, lo
que permite disponer de un histórico de los datos almacenados. Además, puede llevar a
cabo funciones de control, tales como iniciar o detener servidores. Envían los datos de
inventario a un servidor central Hyperic y este lo almacena en la base de datos.
Además, el servidor Hyperic detecta cuando se disparan las alertas y realiza las
notificaciones o procesos de escalación definidos por el usuario. Procesa las acciones
iniciadas desde la interfaz o consola web de usuario y proporciona servicios de
autentificación.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
12
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Es una distribución de aplicaciones J2EE que se ejecuta sobre el servidor de código
abierto JBoss. Está escrito en Java y pequeñas porciones de códigos portable en C, para
funciones que Java no alcanza todavía.
Es una herramienta multiplataforma en cliente, es decir, está disponible en todas
las plataformas más populares incluyendo OS X, Unix, Linux, Windows, Solaris, AIX, HPUX,
VMWare, AppEngine Google y Amazon Web Services. Para el servidor de Hyperic puede
implementarse en Linux, Solaris 10 o superior, Mac OS X y Windows Server 2003 o superior
de 32 bits. También puede ejecutarse en Windows XP, pero no se recomienda para un
entorno de producción, sólo para un entorno de desarrollo o de pruebas.
Entre sus principales características podemos destacar:
-
-
Utilización de plugins de fácil aplicación por parte del usuario mantenidos por la
comunidad Hyperic. Permiten descubrir productos software ejecutados sobre
una plataforma, tales como servidores web, servidor de aplicaciones, bases de
datos, etc. Puede utilizar lenguajes como XML, J2EE, Bash, C++/C#, Perl, Ruby,
Python, PHP,etc.
Seguimiento y correlación de eventos. Puede controlar logs y archivos de
configuración.
Es un sistema Live Data, se ejecuta, muestra los datos y ofrece vistas en tiempo
real en cualquier plataforma.
Incluye una interfaz web conocida también como Portal Hyperic extensible y
configurable a nivel de usuario y está desarrollado mediante las tecnologías Java y AJAX.
Permite el seguimiento y análisis de los equipos monitorizados y la visualización de los
recursos mediante gráficos detallados. Además, permite iniciar las acciones de control de
recursos, es decir, procesos a ejecutar en caso de alerta. Un caso práctico sería por
ejemplo, para un servidor de aplicaciones, puede comenzar la detención y recolección de
basura, mientras que para un servidor de base de datos, puede realizar funciones de
análisis y limpieza. Incluye además, vistas especiales o específicas para determinados
recursos, por ejemplo, para vSphere para gestiones vCenter y GemFire para componentes
de la distribución vFabric GemFire.
Posee un despliegue por parte de la comunidad conocido como HQU con el
objetivo de la creación y despliegue de APIs para extender el Portal Hyperic, así como su
integración con otros sistemas, por ejemplo con OpenNMS. El marco se basa en HQU
Groovy, un lenguaje parecido a Java y que se ejecuta en la máquina virtual Java. Intenta
mejorarlo con nuevas vistas y plugins en XML y JavaScript.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
13
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ilustración 15 – Interfaz Web de Hyperic.
Ventajas:
-
-
-
Detección automática mediante los agentes de nuevas máquinas virtuales o
clientes. Permite pasar de la instalación de un nuevo nodo a su monitorización
en menos de 60 segundos.
Soporta base de datos en MySQL, Oracle y PostgreSQL. Esta última es la que
instala por defecto. En caso de instalar un ambiente de producción, recomienda
instalar la BD en otro equipo distinto al servidor HQ con Oracle o MySQL.
Control total de la aplicación desde el portal o interfaz web.
Framework de la comunidad HQU para la mejora del Portal Hyperic.
Inconvenientes:
-
No diferencia claramente entre las funcionalidades de sus productos libres y
comerciales en la documentación oficial. Intenta dar una vista consumidora de
su producto hacia el cliente, lo cual incita a tener una opinión excesivamente
comercial del producto. Este suceso hace que su soporte gratuito y de la
comunidad de cara al usuario sea de menor calidad.
Fuentes:
http://hyperic-hq.software.informer.com/wiki/
http://www.springsource.com/products/systems-management/compare
http://support.hyperic.com/display/DOC/HQ+Documentation
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
14
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Otra solución disponible OpenSource es Zabbix Versión 1.8.8. Fue creada por
Alexei Vladishev, propietario del producto y de la compañía que lo soporta y mantiene
Zabbix SIA. Es una empresa de código abierto y que se centra en el desarrollo de software
para la monitorización de redes y aplicaciones. Está licenciado bajo la GNU General Public
License Version 2 y publicada por la Free Software Fundation. Actualmente están en
continuo desarrollo y progresión hacia su versión 2.0.
El único aspecto comercial de la empresa es el soporte que ofrece a diferentes
niveles, el cual incluye implementación, integración, desarrollo personalizado y servicios de
consultoría, así como programas de formación.
Ilustración 16 – Niveles de soporte comercial de ZABBIX.
Ofrecen una licencia comercial Zabbix Comercial Licence dirigida a los OEMs
(Fabricante de equipamiento original), ISVs (Proveedor de software independiente), VARs y
para organizaciones que debido a los secretos comerciales, patentes u otros motivos de
propiedad, combinan y distribuyen la licencia de software libre Zabbix con sus productos.
Es un software de monitorización avanzada que controla los parámetros de la red y
su salud e integridad. Esta versión incorpora algunas mejoras respecto a las anteriores,
como por ejemplo: soporte completo para plataformas Unicode/UTF-8, mejoras en la
utilización de gráficos y mapas.
En resumen, ofrece un control centralizado, disponibilidad de hasta 1000 nodos,
multiplataforma de soporte en clientes y eficiente para Linux y Win32, autenticación de
usuarios segura, sistema de notificaciones flexible para e-mail o SMS basado en cualquier
evento, incluido también XMPP (Protocolo extensible de mensajería y comunicación de
presencia) (anteriormente llamado Jabber), que se pone en funcionamiento tanto cuando
ocurre un problema como cuando se resuelve.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
15
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Permite la monitorización de recursos hardware: procesos de carga, actividad en la
red, actividad en disco, parámetros del sistema operativo, servicios de red (SMTP, HTTP),
soporte para la monitorización remota o sin agentes a través de: SNMP, ICMP, TCP, IPMI,
SSH y Telnet. Genera informes y estadísticas y la posible visualización de los datos a través
de su interfaz web, la cual está desarrollada en PHP y Javascript.
Ilustración 17 – Interfaz o Consola Web de Zabbix.
Sus principales elementos o componentes son: una base de datos, que soporta
MySQL, PostgreSQL, SQLite, Oracle o IBM DB2 para almacenar los datos. Su servidor Zabbix
y sus agentes Zabbix, los cuales están desarrollados en lenguaje C.
Incluye algunas características destacadas:
-
Auto detección de dispositivos y servicios monitorizados.
Monitorización en tiempo real: rendimiento, disponibilidad, integridad, registro
de logs, etc.
Servicios IT jerárquicos.
Ventajas:
-
Ofrecen una web en castellano muy bien organizada: www.zabbix.com/es/
Tienen en mente el crecimiento de la comunidad Zabbix, poniendo a
disponibilidad una wiki en construcción.
Inconvenientes:
-
La potencia o capacidad del software es menor que la de alguno de los
mencionados anteriormente (1000 nodos).
El no disponer de una versión Enterprise hace que no crezca tanto su
popularidad en cuanto a clientes importantes asociados a la herramienta.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
16
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Otra plataforma de gestión de red y servidores OpenSource es Zenoss Core Versión
3.2.1. El proyecto de creación de Zenoss comenzó en 2005 y fue iniciado por Erik Dahl y Bill
Karpovich, los cuales formaron la compañía Zennos, Inc. Esta empresa es patrocinadora del
núcleo Zenoss y proporciona apoyo, mantenimiento y desarrollo de productos. Destacan
que es una empresa donde tienen el código y el control de la evolución del mismo y
también su indemnización, a diferencias de otras empresas como puede ser el caso de
Hyperic, que viene de un fondo comercial y hace que una parte de su código sea
OpenSource. Es un producto licenciado bajo la GNU General Public License Version 2.0 y
publicada por la Free Software Fundation.
También dispone de dos versiones comerciales, basada en la versión básica,
llamadas Zenoss Service Dynamics Enterprise y Zennos Profesional que incluye
funcionalidades adicionales como transacciones sintéticas (supervisión en tiempo real de
acciones programadas en aplicaciones web, bases de datos o e-mail) umbrales de
predicción, gestión completa de VMWare VI3, paneles de controles globales, etc. Esta
versión además proporciona soporte y mantenimiento a sus clientes y puede descargarse
una versión de pruebas.
Zenoss Core es un producto de vigilancia y seguimiento para una red informática y
de supervisión de infraestructuras IT. Puede gestionar la configuración, salud, rendimiento
de dispositivos, servidores y aplicaciones. Todo esto a través de un único paquete de
integrado de software. Ofrece monitorización de dispositivos y servicios en la red (SNMP,
HTTP, POP3, etc.), recursos hardware y detecta automáticamente nuevos recursos en la red
y cambios en su configuración. Realiza notificaciones y alertas basados en un conjunto de
reglas. Es un producto multiplataforma para soporte en clientes, incluyendo:
Windows Server (2000, 2003, 2008), XP, Vista, 7.
GNU/Linux.
Tomcat y servidores Java/JMX.
Para ser instalado como servidor soporta distribuciones:
›
Linux: Red Hat Enterprise Linux 4, 5. CentOS 4, 5. Fedora Core 12, 13. Debian
5. Ubuntu Server 8.04, 10.04. openSUSE 10.3, 11.1. SUSE Linux Enterprise
Server 10, 11.
Mac OS X v10.5 y v10.6
Windows (Requiere VMWare Player y la aplicación virtual Zenoss).
Para la consola o interfaz web necesita:
Firefox 3.6.x, 4, 5 o Internet Explorer 7, 8, 9.
Adobe Flash Player.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
17
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Zenoss utiliza una tecnología sin agentes (SNMP, SSH, Telnet y WMI) y se inicia con una
CMBD (Base de datos de la Gestión de Configuración), la cual contiene detalles relevantes
de cada elemento, generando a partir de esta la administración de fallos, notificaciones,
alertas y tareas de remediación a fallos. Y además con un amplio inventario de cada
recurso. Una vez que se descubre la infraestructura, comienza a monitorizar el rendimiento
de cada dispositivo. Posteriormente, ofrece la gestión de eventos, automatización de
alarmas e informes. Por tanto, los principales niveles o áreas del núcleo sistema son:
Descubrimiento y Configuración
Rendimiento y Disponibilidad
Fallos y gestión de Eventos
Alertas y remedios
Generación de Informes
La arquitectura del sistema viene separada y escalonada en cuatro partes
principales, tal y como se puede observar en la siguiente ilustración:
Ilustración 18 – Arquitectura del sistema de Zenoss.
La capa de usuario está construido alrededor de la interfaz o aplicación web e
interactúa con la capa de datos para traducir la información y mostrarla al usuario. Dicha
capa de datos, recopila la información y configuración y la almacena en tres bases de datos
separadas:
-
ZenRRD: Utiliza la herramienta RRDtool.
ZenModel: Es el modelo de configuración del núcleo, que comprende los
dispositivos, sus componentes, grupos y lugares.
ZenEvents: Almacena los datos de eventos en una base de datos MySQL.
La capa de procesos gestiona la comunicación entre la capa de datos y la capa de
colección y ejecuta periódicamente trabajos generados por el usuario (ZenActions y
ZenJobs). Utiliza la herramienta Twisted PB para las comunicaciones. Por último, la capa de
colección está formada por servicios o demonios que llevan a cabo funciones como la
recopilación de información en máquinas remotas, disponibilidad (fallos de PING) y
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
18
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
rendimiento (infracciones en los umbrales), los cuales son devueltos a través de ZenHub al
sistema de eventos.
Combina programación propia y tecnologías de código abierto, con las cuales
consigue integrar su software al completo. Por ejemplo, en el núcleo del sistema realiza
tareas como el Modelado del Sistema, que le permite entender el entorno en el que opera,
basado en el concepto de herencia de lenguajes de programación. Podemos citar algunas
de las tecnologías utilizadas, como por ejemplo:
-
-
-
-
Zope: Aplicación web orientado a objetos. Está escrito en el lenguaje de
programación Python. Es utilizado para la edición de contenidos,
personalizaciones básicas y aporta ventajas respecto a lugares web compuestos
por archivos de texto plano.
Python: Lenguaje de programación de alto nivel diseñado en 1991 por Guido
van Rossum. Es un lenguaje multiparadigma (permite crear programas con más
de un estilo de programación), ya que soporta programación orientado a
objetos, programación imperativa (basado en estados y sentencias, variables
globales, como en la programación o implementación hardware de las
Máquinas de Turing) y en menor medida, programación funcional (basado en
funciones aritméticas: Entrada -> Subrutina -> Salida). Es un lenguaje
interpretado (ejecutado por un intérprete que convierte el lenguaje fuente en
código máquina), utiliza tipado dinámico y es multiplataforma.
Net-SNMP: Protocolo de monitorización que recolecta información sobre el
estado de los sistemas.
RRDtool: Es una herramienta ya mencionada y utilizada por otros productos de
monitorización. Trabaja y tiene como objetivo la creación de gráficas y guarda
registros temporales de datos. Una de sus principales características es que no
crece con el paso del tiempo.
MySQL: Motor y gestor de base de datos relacional multihilo y multiusuario
popularmente conocido.
Twisted PB: Es un framework de red para la programación dirigida por eventos
escrito en Python. Soporta varias arquitecturas (TCP, UDP, SSL, IP, etc.) y
protocolos (HTTP, XMPP, NNTP, SSH, etc.) Los usuarios pueden escribir
pequeños callbacks (retrollamadas) para realizar tareas complejas.
Posee una comunidad Zenoss Core Comunnity la cual dispone de un repositorio de
plugins llamado ZenPacks, con los cuales los miembros de la comunidad pueden extender
las funcionalidades de Zennos Core. Además, el software soporta el formato de plugins de
Nagios.
Para la visualización y control total de la aplicación aporta una interfaz o Consola
Web, la cual nos permite manejar el estado y situación de la infraestructura. Puede
personalizarse por distintos roles para usuario y se puede integrar con Google Maps para
visualizar problemas geográficamente.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
19
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ilustración 19 – Interfaz o Consola Web de Zenoss.
Ventajas:
-
Fácil instalación de extensiones o paquetes ZenPacks desde la consola web.
Soporta y puede por tanto ejecutar plugins de Nagios y de Cacti.
Inconvenientes:
-
-
-
-
Al no utilizar tecnología con agentes en los clientes, requiere una configuración
previa en su instalación del protocolo SNMP en cada uno de las máquinas a
monitorizar siguiendo un procedimiento distinto según la versión o tipo de
sistema operativo.
Necesita la instalación de paquetes adicionales ZenPacks para monitorización
de servicios básicos como HTTP o FTP, información del sistema operativo y
algunos recursos hardware como obtener información de la CPU. Con lo cual, la
instalación puede no llegar a ser suficiente, y necesita una puesta a punto para
cumplir funcionalidades básicas.
La instalación de la herramienta en el equipo host es rápida, pero no cada
configuración del cliente desde la consola web. Por ejemplo, hay que asignarle
una plantilla o template adecuada o personalizada para que monitorice lo que
necesitamos de dicho dispositivo.
Necesita de la aplicación externa VMplayer para funcionar en sistemas
operativos de Microsoft Windows.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
20
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ganglia Web Release Versión 2.1.8 es otra herramienta OpenSource distribuida y
escalable para la monitorización de redes o sistemas de computación de alto rendimiento
como son los clusters y grids. Es un proyecto que surgió en la Universidad de California
Berkeley con el nombre de Millenium Project, que fue inicialmente financiado, en gran
parte, por la NPACI (National Partnership for Advanced Computational Infraestructure) y
National Science Foundation RI. Es una fundación que intenta lograr avances en la ciencia
mediante la creación de una generalizada infraestructura de cálculo: el Grid. El apoyo actual
al producto proviene de Planet Lab, la cual es una plataforma abierta para el desarrollo,
despliegue y acceso a los servicios de escala planetaria.
Es un producto licenciado bajo la BSD-Licenced, es una licencia permisiva, con lo
cual posee requisitos mínimos de cómo se puede redistribuir el software. Fue escrita
originalmente en la Universidad de California. Existen nuevas variantes de dicha licencia
New BSD License/Modified BSD License y Simplified BSD License/FreeBSD License, las
cuales han sido compatibles con la GPL por la Free Software Fundation.
El término de Grid Computing se refiere a la combinación de recursos para alcanzar
un objetivo común, en este caso, es la combinación de dominios administrativos para
componer una “supercomputadora virtual” para realizar tareas muy grandes. Utiliza el
software Middleware para dividir y repartir las piezas de un programa entre varios
ordenadores. El cual, es un software esencial para tecnologías de información (IT) basadas
en XML, SOAP, servicios Web y arquitecturas orientadas a servicios. Se ejecuta en una capa
intermedia entre la aplicación, por ejemplo una base de datos, y la infraestructura o
sistema operativo y permite a los procesos que se ejecutan en una o más máquinas
interactuar y transferir datos entre ellos. Es un producto cuyos principales proveedores son
IBM, Red Hat y Oracle Corporation. En resumen, los Grids son sistemas que se utilizan y se
han utilizado para intensivos problemas científicos y matemáticos computacionales y en
empresas comerciales para aplicaciones diversas, como el descubrimiento de fármacos,
previsiones económicas o análisis sísmicos.
Los clusters son grupos de computadoras, conectadas normalmente en redes de
área local, que trabajan y colaboran juntas formando un solo equipo. Son desplegados para
mejorar el rendimiento, disponibilidad y rentabilidad de un solo equipo con características
similares.
Volviendo al software libre inicial, Ganglia se basa en un diseño jerárquico y
permite al usuario visualizar de forma remota y en tiempo real estadísticas o históricos
sobre recursos de las máquinas que están siendo monitorizadas, como por ejemplo,
promedios de carga de CPU o la utilización de la red. Puede escalarse para manejar hasta
2000 nodos, y está presente en más de 500 grupos de todo el mundo.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
21
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Es una herramienta con direccionamiento multicast, el cual
es un método de transmisión one-to-many (de uno a muchos
receptores). Su funcionamiento es el siguiente: el emisor envía
desde su dirección unicast un datagrama a la dirección multicast, las
cuales están reservadas desde la 224.0.0.0 a la 239.255.255.255,
según la IANA (Internet Assigned Numbers Authority), que se encarga de asignar
direcciones IPv4 para nuevos protocolos. Una vez enviado el datagrama, el router se
encarga de hacer copias y enviarlas a todos los receptores que hayan informado de su
interés por dichos datos. Se utilizan protocolos como UDP (User Datagram Protocol) y PGM
(Pragmatic General Multicast), el cual corrige fallos del anterior e incluye mejoras en la
distribución, como la detección de pérdida de datos o mensajes entregados fuera de orden.
Es un método de transmisión utilizado principalmente en empresas para el intercambio de
datos multimedia, como aplicaciones IPTV, enseñanza a distancia o encuentros televisados.
En otros ámbitos ha tenido poco éxito, puesto que requiere un gran ancho de banda y que
este sistema a gran escala puede venir acompañado de fallos, debido a ataques de
denegación de servicio (DoS), los cuales sobrecargan el servidor de solicitudes.
Utiliza tecnologías como XML, para la representación de datos, XDR para el
transporte compacto y portátil de los datos y RRDtool para el almacenamiento y
visualización de los mismos. Para su interfaz web utiliza PHP4 y algunos otros pequeños
programas de utilidad.
Está compuesto únicamente por dos demonios:
-
-
Gmond: Demonio multi-hilo que se ejecuta en cada nodo a supervisar. Su
instalación no requiere ningún sistema de archivos común NFS ni una base de
datos. Tampoco necesita mantenimiento de los archivos de configuración.
Transmite los datos mediante mensajes de formato UDP. Posee cuatro
funciones principales:
1- Monitorizar los cambios en el servidor anfitrión.
2- Anunciar cambios relevantes.
3- Escuchar el estado del resto de nodos a través de un canal
unicast/multicast.
4- Responder a las solicitudes para obtener una descripción XML del
estado del cluster.
Gmetad: Ganglia diseña una conexión punto a punto, mediante un árbol de
conexiones, entre los nodos del cluster para controlar el estado de todos. En
cada nodo del árbol, este demonio sondea periódicamente una recopilación de
datos de las fuentes hijas y analiza el XML de datos recibido de los gmonds,
guardando parámetros numéricos.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
22
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Su interfaz web dinámica proporciona una vista de la información obtenida y
muestra datos de manera significativa para los administradores y usuarios del sistema.
Puede visualizar datos históricos como el uso de la CPU durante la última hora, día, semana,
mes o año. Muestra gráficas similares para el uso de memoria, disco, red, procesos en
ejecución, etc. Estos datos son recogidos por el demonio gmetad, que es el encargado de
enviar el árbol XML al puerto 8651 por defecto, que es donde estará escuchando la web.
Ilustración 20 – Interfaz Web de Ganglia.
Ventajas:
-
Es una herramienta cuyo origen proviene de estudiantes universitarios de la
Universidad de California Berkeley.
Inconvenientes:
-
-
Aunque es una herramienta de monitorización, no se ajusta al perfil de los
anteriores, ya que es un software destinado a otros propósitos diferentes, en
comparación con otras herramientas estudiadas en este documento.
Incumple una de las principales propiedades de un sistema de monitorización:
no dispone un sistema para la generación de alarmas.
Tiene una capacidad o potencial inferior a alguna de las herramientas
anteriores (monitoriza unos 2000 nodos).
Su interfaz web es una simple aplicación de visualización de datos y dispone
pocas funcionalidades.
Existe poca documentación y no disponen de entorno o sitio web propio.
Tienen una licencia propia, cuyas nuevas versiones no se ajusta o no es
aprobada completamente por la Free Software Fundation.
Fuentes:
http://en.wikipedia.org/wiki/Grid_computing
http://es.wikipedia.org/wiki/IP_Multicast
http://en.wikipedia.org/wiki/BSD_license
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
23
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
OpenNMS es una herramienta de monitorización de Software Libre, publicada
actualmente bajo la licencia GPL versión 3(GNU Public License), de las más antiguas que
existen junto con Nagios y conocida como uno de los padres de este tipo de herramientas,
ya que es un proyecto que se inició en 1999 por Steve Giles, Brian Weaver y Luke Rindfuss y
su empresa PlatformWorks. Actualmente, la fundación The Order of the Green Polo (OGP)
fundada en 2004 para administrar el proyecto, junto a The OpenNMS Group que es otra
organización independiente que ofrece servicio y apoyo comercial, son las encargadas del
proyecto. Ha sido premiada con varios galardones, como por ejemplo: Inforworld Best of
OpenSource Software (BOSSIE), mejor software en la categoría de gestión redes en los años
2009 y 2010 o Best Systems Management Tool de LinuxWorld en 2005 frente a otros
productos, a priori favoritos, como IBM's Tivoli Intelligent Orchestrator y Novell's ZENworks
7 Linux Management.
La última versión de la herramienta disponible estable y en producción es la
Versión 1.8.16, además siguen desarrollándose nuevas versiones gracias a la comunidad,
que le permite seguir ofreciendo nuevas características a su producto, actualmente
trabajan en una nueva versión, aún inestable, la 1.9.93. No disponen de otras versiones
diferentes a la OpenSource, es decir, que no disponen de una versión Enterprise o
comercial de su producto.
Fue diseñado para ofrecer disponibilidad y escalabilidad a decenas de miles de
nodos y para ofrecer soluciones a empresas. Para ello, ponen a disposición dos tipos de
soporte, el gratuito creado por la comunidad, con una wiki de información, hilos de
discusión y bugs o problemas registrados en una instancia de JIRA. En el soporte comercial,
incluimos un libro disponible en amazon.de en lenguaje alemán por 36,90€, además del
soporte profesional de OpenNMS Group, Inc que proporciona información formal a sus
clientes e imparte cursos de formación en EEUU.
Es una herramienta diseñada como solución empresarial y que sigue el modelo de
telecomunicaciones FCAPS para la gestión de la red. Su nombre es un acrónimo de: fallos,
configuración, contabilidad, rendimiento y seguridad. Define la gestión y organización de
una red mencionando la importancia de los servicios IT, ya que los empleados y clientes
dependen de ellos, de su disponibilidad y rendimiento y de que los problemas puedan ser
rápidamente identificados y resueltos o reparados en un tiempo lo más corto posible para
evitar caídas del sistema y la consecuente la pérdida de ingresos.
Entre las funcionalidades de OpenNMS podemos destacar que es una herramienta
capaz de autodescrubrir los servicios en la red en la cual está funcionando, de forma que un
proceso actúa automáticamente mediante una lista o rango de direcciones IP. Se puede
utilizar la interfaz web de usuario o crear archivos personalizables de configuración en XML
para dicha tarea. El aprovisionamiento de los procesos es asíncrono para la escalabilidad, y
existen redes de suministro con más de 50.000 dispositivos conectados.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
24
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Puede generar eventos y notificaciones o incluso recibirlos de fuentes externas,
como por ejemplo, SNMP, syslog o TL/1. Puede procesar 125.000 mensajes de syslog por
minuto de forma continua y enviar dichas notificaciones mediante e-mail, XMPP, SMS o a
una aplicación de tickets que disponga de comunicación bidireccional como pueden ser
JIRA, OTRS, etc. También ofrece servicios para la gestión de los tiempos de respuesta (SLAs),
como pueden ser solicitudes ICMP (ping), visitas a un puerto determinado TCP para
comprobar la instancia, aplicaciones web mediante el protocolo HTTP o pruebas de
comprobación de ida y vuelta de correo mediante el servicio API MTM (Mail Transport
Monitor). Pudiendo generar informes detallados y representaciones gráficas sobre la
disponibilidad de dichos servicios y configurar los tiempos de inactividad, a partir de los
datos recogidos en la base de datos, lo cual ayuda a identificar los problemas dentro de la
red.
Es una herramienta escrita en el lenguaje de programación Java, y por tanto, puede
ejecutarse en cualquier plataforma con soporte para una versión de Java SDK 1.5 o
superior. También existen paquetes binarios precompilados para Linux, Windows, Solaris o
Mac OS X. Requiere una base de datos PostgreSQL, aunque se está trabajando actualmente
para hacer que la base de datos sea independiente de la aplicación con Hibernate, el cual
es un proyecto de una librería Java ORM (object-relational mapping) o también conocido
como técnica de programación para la conversión de datos en lenguajes de programación
orientados a objetos, creando una base de datos de objeto virtual, pudiéndose utilizar
dentro del lenguaje de programación. Su función es permitir mapear clases de Java a bases
de datos relacionales mediante archivos XML, así como realizar consultas mediante
llamadas SQL generadas por la propia herramienta.
Dispone de una interfaz web de usuario construida en Jetty, el cual es un servidor
de aplicaciones y contenedor de servlets Java basado en HTTP desarrollado en OpenSource
como parte de la fundación Eclipse y es utilizado hoy en día en productos tales como
Alfresco, Apache Maven, Ubuntu, JBoss, HP OpenView, etc. También existe una integración
con la herramienta de informes de Java JasperReports con el fin de crear informes de alto
nivel en PDF, HTML, Microsoft Excel, etc.
Ilustración 21 – Interfaz Web de OpenNMS.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
25
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Realizan una serie de comparaciones en su sitio web oficial con otros productos, ya
que consideran que OpenNMS puede sustituir e incluso mejorar funcionalidades de otras
herramientas sin tener una licencia privativa. Es el caso de CA eHealth Perfomance
Manager, donde se argumenta que OpenNMS separa en dos demonios distintos la
disponibilidad y el rendimiento, y que para la obtención de estos datos puede utilizar
protocolos como HTTP(s), JMX, XMP, NSClient, JDBC y WMI entre otros, además de SNMP.
También lo comparan con la herramienta HP OpenView Product Family, ya que algunos de
los creadores originales de OpenNMS provienen de una compañía que era parte de
OpenView, y por tanto, toman algunos conceptos, objetivos y terminologías parecidos
aplicándolos a OpenNMS. Aseguran que, aunque no tienen toda la funcionalidad en el
núcleo de su producto, pueden implementar el 99% de funcionalidades de HP OpenView
gracias a los paquetes adicionales de código abierto (plugins). Por último, The Tivoli
Netcool Suite pertenecía a la empresa Micromuse, y posteriormente fue comprado por
IBM en el año 2000. Parte de la arquitectura de OpenNMS está inspirada en el producto
Netcool OMNIbus, ya que poseen técnicos con experiencia y certificados en Netcool, a
diferencia, de que es un producto comercializado con una licencia de software privativa.
También se compara con Nagios, que sí es un producto OpenSource, y mencionan una cita
que existe en la documentación de Nagios. “Note: Nagios is not designed to be a
replacement for a full-blown SNMP management application like HP OpenView or
OpenNMS”. Además consideran que no es una aplicación con la que deban competir, ya
que no está estructurada de la misma forma.
Ventajas:
-
-
Posee un sistema de notificaciones muy flexible, ya que puede gestionarlas y
enviarlas incluso a una herramienta exterior (JIRA, OTRS, etc.) centralizando así
todo el mecanismo de procesos ITIL.
Soporta y ejecuta plugins diseñados inicialmente para Nagios.
Posee una interfaz web como demo para poder visualizar su funcionamiento sin
necesidad de instalarlo y tener una idea del producto: demo.opennms.org/
Inconvenientes:
-
-
Sólo puede utilizar como gestor de base de datos PostgreSQL.
Posee una puesta a punto para optimizar el rendimiento del sistema que
requiere un nivel muy elevado de conocimientos, lo cual conlleva una serie de
modificaciones y tunnings en la instalación a nivel de configuración, hardware,
base de datos, sistema operativo, etc.
Posee una interfaz web que a veces no deja claro la evaluación de los datos
mostrados. Tampoco funciona correctamente con algunos navegadores como
por ejemplo Mozilla Firefox.
Fuentes:
http://www.opennms.org/
http://en.wikipedia.org/wiki/FCAPS http://en.wikipedia.org/wiki/Jetty_(Web_server)
http://www.opennms.org/wiki/Comparison_with_other_network_management_systems
http://www.rootdev.com/tech/opennms-vs-nagios
http://en.wikipedia.org/wiki/Hibernate_(Java) http://en.wikipedia.org/wiki/JasperReports
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
26
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Otra herramienta de software libre y posible solución de administración para
dispositivos en red OpenSource es Cacti versión 0.8.7h. Actualmente, la comunidad de
dicho producto está trabajando en la elaboración de dos nuevas versiones para el 2012
1.0.0 y 1.1.0 con mejoras planificadas como por ejemplo: mejora de la interfaz web 2.0
basado en AJAX, plugins integrados en el núcleo de la aplicación, grupos de usuarios y
permisos, etc. Está publicada bajo la licencia GPL (GNU Public Licensed).
No dispone de una versión comercial ni otra licencia privativa para la distribución
del producto, tampoco de un soporte comercial o profesional. Pone a disposición un
soporte gratuito mantenida por la comunidad mediante una lista de correo y un foro:
http://forums.cacti.net/forum-12.html
Es una aplicación enfocada para la generación de gráficos avanzados y diseñada
para aprovechar el poder de almacenamiento y la funcionalidad que poseen las
aplicaciones RRDtool. Sirve para monitorizar redes en LAN de un tamaño pequeño o redes
más amplias de hasta cientos de dispositivos. La recolección de datos en los dispositivos a
monitorizar se realiza mediante el protocolo SNMP y se almacenan en la RRD (base de
datos Round Robin) y luego genera gráficos en formato PNG. También puede recolectar los
datos mediante scripts para consultas en XML ejecutados desde el cron de forma periódica
en el caso de Linux, por ejemplo, para función de realizar ping a un host. Pueden generarse
plantillas para determinados dispositivos tales como router, switch o servidores y también
para gráficas, con el propósito de generalizar la monitorización de dispositivos similares,
pudiendo exportarlas e importarlas posteriormente en otros equipos.
Permite la instalación de un código opcional Spine, también conocido como cactid
con la función principal de hacer al producto más rápido. Está escrito en lenguaje C y hace
uso de hilos POSIX y está relacionado con la librería de Net-SNMP. Sirve para reemplazar el
poller cmd.php instalado por defecto con Cacti. Depende del tamaño de la red en la que
estará instalado, por defecto tiene una respuesta de los datos de unos 300 segundos (5
minutos) para recolectar los datos de todos los hosts, si este tiempo no es suficiente, se
recomienda que se cambie este mecanismo manualmente o que se aumente el número de
procesos concurrentes en el sistema.
Funciona bajo una base de datos MySQL versión 4.1.x, 5.x o superior. Además,
entre sus requisitos necesita PHP 4.3.6 o superior y un servidor web como Apache o IIS. La
versión de RRDtool 1.0.49 o 1.2.x o superior, teniendo en cuenta de que existen bugs en la
versión 1.2.28 en la representación de texto y leyendas en los gráficos.
Tiene una interfaz web de usuario personalizable y desarrollada en PHP que
permite el acceso mediante usuarios con diferentes privilegios, para darle permisos sobre
ciertas áreas de Cacti.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
27
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ilustración 22 – Interfaz Web de Cacti.
Ventajas:
-
Es una herramienta avanzada para la generación de gráficas y utiliza una
tecnología libre también fomentada por otras herramientas como es RRDtool.
Inconvenientes:
-
-
-
-
Tiene un potencial inferior a otras herramientas anteriormente analizadas y con
diferentes objetivos los cuales no pasan por la monitorización de dispositivos,
ya que puede calificarse de ser una simple aplicación de gráficas.
No cumple con funcionalidades básicas como la monitorización de hardware
(CPU, memoria, disco, etc.), generación de notificaciones ante problemas
inminentes mediante la definición de umbrales y necesita plugins para generar
mapas o auto descubrir la red.
Su arquitectura no está diseñada para trabajar ante una red con miles de
dispositivos ni tampoco funciona con agentes en los clientes o nodos a
monitorizar.
En caso de necesitarlo y mejorar las expectativas del sistema, no cubre la
posibilidad de ampliar a una versión comercial o a un soporte profesional.
Su interfaz web no permite controlar la aplicación sólo permite una
visualización de los datos obtenidos.
Fuentes:
http://www.cacti.net
http://es.wikipedia.org/wiki/Cacti
http://cactiusers.org/index.php
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
28
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
La última herramienta OpenSource de software libre a analizar para el seguimiento
de los recursos de red es Munin versión 1.4.6. Actualmente Steve Schnepp está trabajando
en el desarrollo una nueva versión beta inestable 2.0 y progresa por su cuarta revisión con
un conjunto de características nuevas, como por ejemplo: gráficos CGI y con zoom, mejorar
la escalabilidad, usar protocolo nativo SSH, simplificar los tiempos de ejecución de los
plugins, etc. Su nombre proviene de la mitología nórdica de un ciervo del dios Odín, cuyo
significado es ‘Memoria’.
Actualmente, está publicada bajo la licencia GPL (GNU Public Licensed). El único
soporte que disponen es gratuito mantenido por la comunidad con una wiki y un foro. No
disponen de una versión comercial o Enterprise ni de ningún tipo de soporte profesional.
Sólo ponen a disposición un libro publicado por Gabriele Pohl y Michael Renner escrito en
alemán titulado “Munin - Graphisches Netzwerk- und System-Monitoring” publicado por
Open Source Press en colaboración con Linpro por 34,90€.
Munin es una aplicación de monitorización de red escrita en Perl que presenta la
producción de gráficos a través de una interfaz web utilizando RRDtool (diseñado por Tobi
Oetiker) como base de datos. Su énfasis está en las capacidades plug and play. Existen más
500 plugins de vigilancia disponibles actualmente en su repositorio oficial escritos en
diferentes lenguajes como Bash, Perl, Python, Ruby, PHP, Shell, etc. Específicos para
diferentes sistemas operativos como Linux, FreeBSD, NetBSD, Solaris, AIX, HP-UX y otros
multiplataforma, que es lo más común según muestra el siguiente gráfico:
Ilustración 23 – Estadísticas de plugins: A) Plataformas soportadas, B) Lenguajes que son escritos los plugins.
Puede supervisar el rendimiento de ordenadores, redes, redes SAN y aplicaciones.
Determina cuándo sucede un problema de rendimiento y puede ver la capacidad de todos
los recursos limitados. Monitoriza aspectos de cada nodo como promedio de carga, uso de
memoria, tráfico eth0, etc. A través de la recolección de datos, puede mostrar tendencias y
puede ayudar a predecir cuellos de botella. Genera eventos cada vez que un valor se eleva
por encima o se hunde por debajo de los límites preestablecidos.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
29
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Uno de los objetivos principales ha sido la facilidad de crear nuevos plugins e
intentar medir cualquier cosa cuantificable. Puede integrarse con Nagios para enviar
eventos e informar a los contactos configurados en Nagios, mediante configuración de
ficheros.
Se integra con otra herramienta de Software Libre y OpenSource llamada Monit
para supervisar sistemas Unix y Linux. Eleva su funcionalidad ya que puede verificar
servicios como Apache, MySQL o Postfix y toma medidas acerca de dichos procesos para
verificar si su comportamiento es el adecuado y llevar a cabo un reinicio del sistema si no es
el esperado. Está escrito en el lenguaje de programación C y licenciado bajo la GPL (GNU
Public Licensed).
Tiene una arquitectura maestro / nodo en el que el maestro se conecta a todos los
nodos a intervalos regulares (normalmente cada cinco minutos), interrogando a cada uno
de los munin-node. Dichos nodos a monitorizar disponen de un agente instalado el cual
recopila la información a través de un demonio instalado por defecto en el puerto 4949 que
ejecuta los plugins. A continuación, el servidor o maestro almacena los datos en los
archivos RRD, y (si es necesario) actualiza los gráficos en la interfaz Web.
Se ejecuta en el servidor o maestro con cuatro trabajos o procesos diferentes, lo
que permite que cualquiera de ellos pueda comenzar mientras otro ya se está ejecutando y
no se bloqueen entre ellos.
1. Actualización: Contacto con cada nodo para la recuperación de datos y
configuración de plugins.
2. Gráficas: Creación de gráficas a partir de la base de datos RRD.
3. Límites: Chequeo de los límites o umbrales y de las infracciones en cada
servicio.
4. Visualización: Actualiza los ficheros HTML mostrados desde la interfaz.
Ilustración 24 – Interfaz Web de Munin.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
30
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ventajas:
-
Es una herramienta de software libre que utiliza tecnologías libres como es
RRDtool para su gestión de los datos y Monit para ampliar su funcionalidad, la
cual le permite realizar acciones sobre algún servicio en particular.
Inconvenientes:
-
-
-
No cumple con algunas funcionalidades como autodescubrir la red, grupos
lógicos de nodos a monitorizar, reportar informes SLA. Su monitorización es
periódica cada cinco minutos y su función es recolectar datos estadísticos pero
no como herramienta de alertamiento.
Recibe la información al servidor central sin autenticación y en texto plano, por
lo tanto no es adecuado si existe información sensible o confidencial.
Su interfaz web sólo es para visualizar los resultados, no proporciona un control
sobre la aplicación y por tanto, toda configuración debe realizarse de forma
manual por línea de comandos.
No permite utilizar otro gestor de base de datos que no sea RRDTool.
Al no disponer de una versión Enterprise o un soporte profesional, no dispone
de clientes importantes que utilizan la herramienta.
Fuentes:
http://munin-monitoring.org/
http://exchange.munin-monitoring.org/
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
31
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
3.1.2- HERRAMIENTAS DE SOFTWARE PRIVATIVO:
HP OpenView es una familia de productos de software con licencia comercial muy
amplia y sub-marca de HP Software. Pertenece a Hewlett-Packard Company que es uno de
los principales proveedores de soluciones globales existentes en el mercado y que intenta
cubrir la mayoría de las problemáticas de administración de los
departamentos de TI. Existen herramientas orientadas exclusivamente a la
administración del rendimiento y la disponibilidad de los sistemas.
Históricamente, el nacimiento de la serie OpenView fue con el producto Network Node
Manager (NNM), el cual ofrecía servicios de red y GUI para otros productos que se
integraban con él. Actualmente NNM se usa generalmente para administrar redes,
probablemente en conjunción con otros productos como Cisco CiscoWorks. A partir de
2007, tras la adquisición de Mercury Interactive Corp por parte de HP, se elimina OpenView
y el producto pasa a llamarse HP Operations.
Ilustración 25 – Soluciones de la gama HP OpenView.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
32
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
La Suite de herramientas HP OpenView permite el control y la gestión de la
tecnología en las diferentes áreas de IT: gestión de aplicaciones, disponibilidad de
dispositivos, condiciones y estado de la red, rendimiento del sistema, servicio y
mantenimiento y programas de almacenamiento. En concreto, con OpenView Operations
(OVO), los administradores de IT pueden tener un control global desde la consola central
que puede gestionar todos los recursos de IT distribuidos por la compañía. Los técnicos de
sistemas pueden monitorizar, analizar y planificar recursos en entornos distribuidos,
multifabricante, y también pueden supervisar el rendimiento de plataformas con
herramientas como OpenView Perfomance Agent (OVPA), OpenView Performance
Manager (OVPM) y OpenView Performance Insight (OVPI). Cada una de estas tres
herramientas, junto con la consola principal (OVO), tiene un objetivo y unas funciones y en
conjunto forman la arquitectura de un sistema de monitorización. A continuación vamos a
definir cada una de ellas y sus características.
HP OpenView Operations: es la consola central de eventos de HP OpenView. Es
independiente al resto de herramientas, ya que integra una propia arquitectura
consola-agente (paquetes software) para los principales sistemas operativos del
mercado y plataformas (Unix: AIX, HP-UX, Solaris, Tru64. Microsoft Windows,
Linux, Novell Netware, OpenVMS, AS/400, IBM Mainframe). Existen dos versiones
diferenciadas HP Operations Manager para Windows 8.10 y para Unix 8.35.
Los agentes OVO son independientes de la consola central y son un componente
de activo instalado en cada equipo para informar a la consola cuando se detecta
alguna situación importante, permiten monitorizar ficheros de log, ejecutar
programas de control y automatización, capturar eventos SNMP (traps),
recolectar métricas de rendimiento de sistema y puede tomar una acción
autónoma si dicha métrica realiza un incumplimiento de un umbral, también
posee interfaces abiertas para envió de mensajes. Cualquier alerta creada
también puede tener una acción asociada con ellos. Estas acciones por lo general
vienen en dos formas, automáticas o iniciadas por un operador. Las acciones
automáticas se ejecutarán cada vez que una alerta ocurre, mientras que las
iniciadas por un operador requieren la orden explícita para la acción en concreto.
Maneja a los usuarios/operadores en su interfaz Web por privilegios o
responsabilidades, lo que permite el filtrado de alarmas que son relevantes para
el papel de la persona dentro de la organización, cada usuario de OVO sólo recibe
mensajes de los dispositivos de su interés y que pueda tener acceso. Permite
crear un mapa lógico de los componentes de la infraestructura, dando a los
usuarios una mejor visión del estado de los servicios informáticos. Utiliza
tecnologías como Motif en los sistemas Unix o una interfaz gráfica basada en Java
para Unix o Microsoft Windows.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
33
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Es escalable e integrable, permite el manejo de una gran cantidad de dispositivos
y posee integración con los otros módulos de OpenView. Maneja los eventos, a
los cuales permite asociar acciones, instrucciones, anotaciones y mantener un
histórico para consultas y estadísticas.
Permite el empleo de plugins exteriores al núcleo del software SMART Plug-Ins
(SPI) para añadir mejoras o aumentar la facilidad para el entorno existente con
una rápida implementación. Un ejemplo podría ser SAS 9.2 para servidores
empresariales de BI con HP OpenView Operations 7.x para Windows para realizar
un seguimiento a los datos de negocio y que fluye sin problemas en toda la
empresa. También otro ejemplo puede ser PROGNOSIS incorpora beneficios de
monitorización, filtrado y alertas en tiempo real y posibilita a los servidores
NonStop incluirse en el marco de la gestión de OVO permitiendo una total
visibilidad de los servidores y aplicaciones críticas de negocio.
HP OpenView Performance Manager (OVPM): Esta herramienta permite visualizar
información de rendimiento de los agentes de OVO y OVPA. El acceso a la
información es mediante una interfaz Web (existe la posibilidad de un acceso
HTML o Java).
HP OpenView Performance Agent (OVPA): Es la herramienta que recolecta
información de rendimiento de recursos de diferentes plataformas y/o sistemas
operativos mediante los agentes OVPA, se instala localmente en cada nodo a
monitorizar. A diferencia del agente de OVO, este agente permite la incorporación
de nuevas métricas para recolección, configurar parámetros para el
almacenamiento de datos y generar alarmas de rendimiento, que pueden
integrarse a la consola de eventos de NNM y OVO.
HP OpenView Performance Insight Manager (PIM): Es la herramienta que realiza
los reportes de HP OpenView. Permite extraer información de diferentes fuentes
y protocolos (SNMP, RMON2, SQL, archivos ASCII, agentes OVO y OVPA). Posee
mecanismos para definir la recolección de datos, almacenarlos en una base de
datos relacional y desarrollar informes en base a estos datos. Fue comprada por
HP y adapta para ser usada con los otros módulos de OpenView.
Las alarmas activas son visibles en la consola de operaciones de Operation
Manager en toda la infraestructura así como el estado de los servicios que
hayamos configurado.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
34
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ilustración 26 – Consola de HP OVO.
Ventajas:
-
Es una herramienta potente para gestionar una infraestructura IT si se combina
o integra con otros productos la gama openview ya sean herramientas de
ticketing (HP ServiceDesk o ServiceManager) de forma que al llegar una
incidencia a la consola de OVO automáticamente se abra un tiquet para el
grupo de TI interesado/afectado. También la integración de reportes (HP
Performance Manager, HP Reporter) o herramientas complementarias de
monitorización (HP Network Node Manager – NNM) o monitorización sin
agentes (HP SiteScope). Y por último, y quizás más recomendable la integración
con los plugins SPI (Smart PlugIns) que facilitan la labor de configurar una
monitorización, ya que son paquetes que llevan configurados la forma de
monitorizar multitud de plataformas. (BEA, BMC, BlackBerry, Oracle, IBM
WebSphere, VMWare, Unix SO, etc).
Inconvenientes:
-
No es un producto de software libre y presenta varias desventajas, como por
ejemplo el precio de la licencia, la cual tiene un precio prohibitivo para la
mayoría de las empresas. Se le debe sumar un coste extra por cada agente que
se desee instalar. También la poca documentación o información que hay
disponible por parte del fabricante, en general la privatización de la empresa
impide conocer aspectos de sus productos e incluso puede afectar al trato con
los clientes de forma negativa. Podemos ver un precio estimado para el
software HP Openview Network Node Manager (NNM), aunque este precio
varía dependiendo de la versión y del nº de nodos a monitorizar:
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
35
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ilustración 27 – Costos de las licencias de productos HP Openview.
-
-
-
En particular esta empresa, HP tiene multitud de productos software muy mal
organizados y que resulta confuso y tedioso conocerlas o saber qué realizan
particularmente cada una de ellas, ya que incluso cambian el nombre de
algunas de ellas. Además, en diversas ocasiones es necesario añadir o combinar
varias de ellas para obtener un producto sólido. Puede considerarse una
política de la empresa para dificultar la tarea de indagar en sus productos sin la
ayuda de sus técnicos y sin prestar servicio.
Podría verse como una ventaja que hace unos años ya, entre los años 1999 y
2000, fue considerada como la principal solución a herramientas de gestión de
redes y sistemas informáticos, llegando a gestionar incluso el 70% de los
sistemas en Internet con clientes importantes como British Telecom, Euskaltel,
Uni2, Metro Bilbao, Fagor y Henkel, Telefónica, Banco de Santander o Mapfre.
Pero actualmente provoca que sean productos bastante ‘desfasados’ y
paralizados cuyos desarrollos de mejoras o cambios para adaptarse a los
sistemas actuales sea casi nulo.
A esto debemos sumar, que incluso actualmente se encuentran numerosos
agujeros de seguridad en productos de HP y son emitidos por la propia
empresa, como por ejemplo el documentado referente a la vulnerabilidad en
los agentes OVPA que puede permitir a un atacante remoto borrar cualquier
archivo de los sistemas monitorizados a su elección o de cualquier otro sistema
monitorizado a través de rutas UNC (como “\\servidor\archivo.ext”), si se
realiza una petición específicamente manipulada al puerto TCP 383. Es un
problema que reside en versiones 6.20.50.0 y anteriores. También otros
problemas encontrados en otro producto HP OpenView, hasta nueve
vulnerabilidades tuvieron que corregirse de las cuales ocho de ellas fueron
calificadas con un valor de 10 (el máximo) según las métricas CVSS 2.0, en
concreto para el producto Storage Data Protector, para el manejo y realización
de copias de seguridad, donde por un desbordamiento del búfer (buffer
overflow) en diferentes servicios a través del envío de paquetes mal
construidos se permitía la ejecución de código arbitrario de forma remota en
sistemas afectados y afectaba a entornos Windows.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
36
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Fuentes:
http://www8.hp.com/us/en/software/enterprise-software.html#tab=3
http://monitorizando.com
http://www.aurigae.com/recursos/prognosis/Folleto_Smart_plugin_HP_OpenView.pdf
http://unaaldia.hispasec.com/2008/01/ejecucion-remota-de-codigo-traves-de.html
http://support.sas.com/rnd/emi/HPOpenViewOperations/HPOpenViewOperations.html
http://pfcmon.wikispaces.com/1.4+HP+Operations+Manager+%28OVO%29
http://www.networkworld.es/Las-ventas-de-HP-OpenView-en-Espana-crecen-un-59-por-ciento/seccion-/noticia-7015
http://topmanagement.com.mx/modules.php?management=HP+ES+EL+NO.+1+EN+PARTICIPACI%D3N+DE+MERCAD
O+A+NIVEL+MUNDIAL+EN+SOFTWARE+DE+ADMINISTRACI%D3N+PARA+SISTEMAS+DISTRIBUIDOS&name=Noticias&fi
le=show&clave=52644
http://vulnerabilityteam.blogspot.com/2010/06/nueva-vulnerabilidad-hp-openview.html
http://informaticayseguridad.blogspot.com/2011/06/vulnerabilidad-en-hp-openview.html
http://www.laflecha.net/canales/seguridad/noticias/graves-vulnerabilidades-remotas-en-hp-openview-storage-dataprotector
http://www.cio.com.mx/Articulo.aspx?id=7708
http://unaaldia.hispasec.com/2008/01/ejecucion-remota-de-codigo-traves-de.html
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
37
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Tivoli Software es una familia de productos de software para la administración de
infraestructura de IT (tecnología de la información) perteneciente a IBM (International
Business Machines) empresa multinacional estadounidense que comercializa hardware y
software y ofrece servicios en una amplia gama de áreas relacionadas con la informática.
Aunque ha sido descrita como una empresa orientada a las ventas, actualmente está siendo
un defensor principal en el movimiento de OpenSource invirtiendo miles de millones de
dólares en servicios y software basados en Linux. Ha lanzado códigos bajo varias licencias
de
código
abierto,
tales
como
el framework multiplataforma Eclipse,
la
licencia International Components for Unicode (ICU), y el sistema de gestión de bases de
datos relacionales Apache Derby, que es basado en el lenguaje de programación Java.
Ofrece herramientas orientadas a la administración del rendimiento y la
disponibilidad de los sistemas y servicios. Entre las que destacamos IBM Tivoli Monitoring
(ITM) con licencia comercial y es la solución más novedosa de IBM de monitoreo de
rendimiento y disponibilidad para la supervisión y vigilancia de sistemas operativos,
aplicaciones, bases de datos y servicios de negocios en entornos distribuidos y de hosts.
Está orientada a las pequeñas y medianas empresas como una herramienta de
automatización para la optimización de costos. Se encuentra disponible para diversas
plataformas que incluyen Linux, UNIX (AIX, Solaris, HP-UX), Windows®, y z/OS.
Utiliza el protocolo SNMP para la recolección de datos que luego almacena y
procesa y posee una arquitectura con o sin agentes. Permite la configuración de una
respuesta programada ante una alarma ya sea local (reproducir un sonido, ejecutar un
archivo externo, escribir un archivo de registro externo, ejecutar un script, escalar un
mensaje en la jerarquía del sistema) o funcional (enviar un e-mail o notificación vía SMS,
reiniciar un servidor remoto). Produce informes y gráficos en varías tecnologías (XML,
HTML, CSV) personalizados basados en el historial o métricas recolectadas por los agentes.
Ayuda a identificar y arreglar interrupciones que amenazan aplicaciones clave antes
de que afecten directamente a los usuarios. Supervisa de manera proactiva los recursos del
sistema para detectar problemas potenciales y responde automáticamente a eventos.
Proporciona un umbral dinámico y análisis de rendimiento para mejorar la prevención de
riesgos. Mejora la media de tiempo de recuperación gracias a la visualización rápida de
incidentes y la búsqueda histórica de investigación rápida de incidentes. Recoge datos que
puede utilizar para dirigir las actividades de rendimiento y planificación de la capacidad a
tiempo y así evitar interrupciones debidas al exceso de uso de recursos.
Es un producto altamente escalable con una amplia gama de opciones de
personalización y de integración. Hay varios módulos disponibles para Tivoli Monitoring que
se extienden las capacidades de monitoreo a los sistemas más complejos, tales como las
aplicaciones. NET, bases de datos o AMW (Amazon Web Services).
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
38
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
En concreto se trata de diferentes módulos de la herramienta denominada IBM
Tivoli Composite Application Manager (ITCAM). A continuación mostramos una tabla con
las especialidades de cada una:
Ilustración 28 – Relación de herramientas, licencia y componentes de IBM Tivoli Software.
Podemos observar que la existen multitud de herramientas, cada una especializada
en un sector, y la más ‘básica’ ITM sólo proporciona soporte para Sistemas Operativos.
Sería necesaria una nueva herramienta, y por tanto una nueva licencia si se requiere alguna
especificación en cuanto a aplicaciones, servidores virtuales, transacciones, etc.
También puede integrarse con otras herramientas de la familia de IBM Software, en
concreto se recomienda la integración entre IBM Tivoli Monitoring for Energy Management
y Tivoli Business Service Manager que permite una gestión energética unificada de los
activos tecnológicos y no tecnológicos, consolidando toda la información sobre el consumo
de la instalación en un panel energético personalizable. Y por último nombraremos la
herramienta IBM Tivoli Live Monitoring Services para la supervisión de centros de datos en
la nube.
Dispone de una consola o interfaz gráfica a través del componente IBM Tivoli
Enterprise Portal (TEP) de navegación común, flexible e intuitiva y espacios de trabajo
personalizables en la que se puede visualizar iconos de los dispositivos de forma y su
relación en un mapa gráfico.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
39
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ilustración 29 – Consola de IBM Tivoli Monitoring.
Ventajas:
-
Posee una amplia variedad de productos comerciales que hacen en conjunto
una gestión sencilla de una infraestructura IT, incluso con un soporte total en la
instalación, actualización y mantenimiento.
Inconvenientes:
-
No es un producto de software libre y presenta un precio elevado por su
licencia comercial con una duración limitada a 12 meses y se le debe sumar un
coste extra por cada agente que se desee instalar a los nodos a monitorizar. Los
precios de las licencias para cada herramienta varía de una a otra, en concreto
para la licencia del producto ITM mostramos unos precios orientativos en euros
de la web oficial de IBM:
Ilustración 30 – Precios de licencia de IBM Tivoli Monitoring.
-
Sin embargo, para una licencia para ITCAM para aplicaciones el precio es
muchísimo más elevado:
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
40
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ilustración 31 – Precios de licencia de IBM ITCAM para aplicaciones.
-
-
El hecho de tener que contratar varias licencias diferentes para varios productos
o software encarece aún más la compra de un producto sólido que sea capaz de
cumplir todas las expectativas del cliente, sin mencionar que la facturación más
costosa es el posterior servicio y mantenimiento que deberá realizar dicha
empresa multinacional.
Por último, encontramos fácilmente por la web varios agujeros de seguridad
remitidos y publicados por la propia empresa como vulnerabilidades ante ataques
para la ejecución de código arbitrario causados por desbordamiento del buffer al
procesar cadenas demasiado grandes.
Fuentes:
http://www.ibm.com/developerworks/ssa/downloads/tiv/tivolimonitoring/faq-ec2-tivolimonitoring.html
http://www-142.ibm.com/software/products/es/es/tivomoni/
http://www-01.ibm.com/software/ar/demos/tivoli.shtml
http://www.hw-group.com/software/pd_snmp_en.html#IBM_Tivoli
http://publib.boulder.ibm.com/infocenter/hctool/v1r0/index.jsp
http://www.redbooks.ibm.com/abstracts/SG247217.html?Open
https://www-112.ibm.com/software/howtobuy/buyingtools/paexpress/Express
http://www-01.ibm.com/software/tivoli/products/monitor-virtual-servers/
http://www-142.ibm.com/software/products/es/es/tivomoniforvirtenvi/
http://www.tuexpertoit.com/2009/12/17/ibm-tivoli-live-monitoring-services-monitorizacion-de-centrosde-datos-desde-la-nube/
http://www-01.ibm.com/software/tivoli/products/monitor-virtual-servers/
http://www-03.ibm.com/systems/es/power/software/management/enterprise.html
http://unaaldia.hispasec.com/2007/04/multiples-vulnerabilidades-en-varios.html
http://cert.inteco.es/vulnDetail/Actualidad/Actualidad_Vulnerabilidades/detalle_vulnerabilidad/CVE-2011-4061
http://www.capitalfederal.com/foros/viewtopic.php?p=531933&sid=ba40dd6dde4e7e6895e7ca14645c88c2
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
41
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
BMC Software es corporación multinacional especializada en Business Service
Management (método utilizado para la gestión de negocios y servicios IT) y desarrolla y
vende productos con licencia comercial para múltiples funciones: gestión
de servicios IT, automatización centro datos (data center), gestión de
rendimiento, gestión de virtualización y computación en la nube. Su
nombre proviene de los apellidos de sus tres fundadores: ‘Scott Boulette, Moores de Juan y
Cloer Dan’. Entre la amplía gama de productos destacamos BMC Patrol (patrulla), la cual
fue una herramienta diseñada y comercializada a mediados de la década de los 1990 como
una herramienta de gestión de sistemas y bases de datos que controlaba el estado de los
equipos, recursos y aplicaciones en una red. Dicho software fue una adquisición de la
empresa BMC, entre otras muchas pequeñas y medianas empresas, en concreto a Patrol
Software, Inc de Australia.
Actualmente, BMC Patrol se encuentra integrada como una parte del actual
producto o software propio BMC ProactiveNet Performance Management, la cual se
define como una herramienta para la gestión distribuida de infraestructura y aplicaciones
para garantizar un rendimiento óptimo. Esta solución intenta integrar en una única
herramienta BMC Patrol clásico y BMC Patrol Express, cuya principal diferencia es el uso de
una arquitectura con y sin agentes respectivamente.
Dicho producto, ofrece una gran variedad de soluciones para gestionar entornos
distribuidos heterogéneos:
Infraestructura
> BMC Performance Manager for Servers:
– Windows, VMware (ESX), Linux (Red Hat, Suse) y UNIX (AIX, HP, Solaris y True 64)
> BMC Performance Manager for OpenVMS
> BMC Performance Manager for Virtual Servers
> BMC Performance Manager for NonStop Himalaya Servers
> BMC Performance Manager for Hardware by Sentry Software
> BMC Performance Manager for Citrix Presentation Server
Bases de datos
> BMC Performance Manager for Databases:
– Oracle, Microsoft SQL Server, Sybase e IBM DB2 Universal Database
> BMC Performance Manager for Informix
Aplicaciones
> BMC Performance Manager for Business Applications
– Aplicaciones SAP® (R/3, ECC, XI, APO, CRM, BW, EP, WAS), PeopleSoft (HR, Financials),
Oracle E-Business Suite y Siebel
> BMC Performance Manager for Mail and Messaging:
– Lotus Domino y Microsoft Exchange
> BMC Performance Manager for Internet Servers
Software intermediario
> BMC Performance Manager for WebSphere Business Integration
> BMC Performance Manager for Web Application Servers
– IBM WebSphere Application Server, BEA WebLogic Server
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
42
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
BMC ha rediseñado la arquitectura de BMC Patrol a partir de las metodologías y
tecnologías avanzadas de recopilación remota de datos sin agente para simplificar la
gestión de sistemas y reducir la carga administrativa asociada con las tecnologías de
gestión basadas en agentes. Ofrece un almacén de datos centralizado para todos los datos
de rendimiento y disponibilidad recopilados, ya sea mediante canales de recopilación
remotos de BMC Performance Manager o de agentes Patrol local. BMC intenta combinar
Patrol y PE en una sola arquitectura y consolidar en una sola licencia ambos productos. La
mayoría del nuevo producto fue construido a partir de Patrol Express con alguna mejora,
como la tecnología Marimba para hacer más fácil la distribución y recolección de datos.
Ilustración 32 – Arquitectura multicapa de BMC Perfomance Manager, permite gestión con y sin agentes.
También en esta versión, BMC expande el apoyo para el servidor Web Apache,
Compaq Insight Manager, Dell OpenManage, BEA WebLogic, IBM WebSphere, JBoss y SAP.
Incluye mejoras en el monitoreo mediante trampas SNMP, Telnet, SSH y JMX.
Mediante un panel de control virtual con el que es posible controlar y reparar los
problemas o errores detectados mediante alertas sin necesidad de detener el sistema.
Combina la planificación, el análisis preventivo y de automatización, administración
proactiva y gestión de impactos que impide que afecte negativamente a los usuarios o
servicios finales. Resuelve eventos por prioridad en tiempo real en un contexto de negocio
o mainframe, ya sea físico, virtual o en la nube (cloud) y permite definir y realizar un
seguimiento de los niveles de servicio (SLA).
En la suite de productos BMC Performance Manager se utilizan tecnologías con
agente y sin agente para gestionar la disponibilidad de la infraestructura. Por tanto
combina en un sistema híbrido la fiabilidad de una arquitectura con agentes y la
simplicidad de una recopilación de datos sin agentes. Esto permite elegir el método más
económico para cada componente de la infraestructura de IT.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
43
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Presenta una interfaz de usuario BMC Performance Manager Portal centralizada a
través de un explorador web y permite gestionar el estado de una aplicación, sistema
operativo, software intermediario o hardware. Posee paneles o vistas personalizadas,
gráficos, avisos y estados de eventos, además de un inicio de sesión por usuario.
Ilustración 33 - Consola BMC Performance Manager
Ofrece una función de generación de informes predefinidos para Microsoft
Windows, UNIX® y Linux® y puede aumentar la capacidad o potencial a través de una nueva
herramienta BMC Reporting Studio. Incluye la utilidad de introducir los datos de
parámetros seleccionados por el usuario en una segunda base de datos (Oracle®) de forma
sincronizada. Esta funcionalidad se potencia con HDE (Historical Data Export), que extrae
los datos de parámetros a un registro histórico por fecha especificado por el usuario.
Gracias a esto, la segunda base de datos se convierte en una fuente de datos más completa.
Cumple las directrices de los procesos ITIL (IT Infrastructure Library) en cuanto a
gestión de disponibilidad, y ofrecen las medidas de rendimiento y disponibilidad necesarias
para prestar un servicio óptimo. Se puede integrar con otras aplicaciones como BMC
Remedy IT Service Management, para la gestión de incidencias y problemas que podrían
afectar al servicio antes de que repercutan en los usuarios finales y éstos llamen al Service
Desk para quejarse. También permite el integrado con BMC BladeLogic Server Automation
Suite, que permite a los análisis que se aplicarán a los cambios de configuración para
ayudar a identificar y aislar un error de cambio humano, una causa frecuente de caída de
las aplicaciones de negocio. Otra herramienta es BMC Atrium Configuration Management
Database (CMDB) que posibilita “abrir vistas en contexto” desde otras aplicaciones para
reducir el número de operaciones necesarias a la hora de solucionar un problema.
Integración con BMC Transaction Management y BMC Capacity Management para mejorar
la visibilidad y aumentar la capacidad de gestión. Posibilidad de introducir elementos de
configuración en BMC Atrium CMDB desde servidores, aplicaciones, bases de datos y
sistemas de archivos gestionados para agilizar las instalaciones de CMDB y mantener su
integridad.
Es una plataforma ampliable con kits de desarrollo de software (SDK), que permiten
al usuario desarrollar canales de recopilación personalizados o soluciones de
monitorización en función de sus necesidades y llevar a cabo la integración de paquetes
(plugins) o un framework para el control y supervisión de determinadas aplicaciones o
entornos, como por ejemplo SAS 9.1.3 SP4 BI Server, para las versiones BMC PATROL
Console for Windows® 3.5.62 y BMC PATROL UNIX Knowledge Modules® (KM) que se
ejecutan en Sun Solaris 10 y entornos UNIX.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
44
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Ventajas:
-
Es una herramienta para gestionar una infraestructura IT y que ha sido
remodelada o actualizada hace relativamente poco tiempo para afrontar un
mercado en crecimiento para intentar combinar tecnología con y sin agentes,
aunque las bases hayan sido partir desde la aplicación anterior y no empezar
desde cero una nueva.
Inconvenientes:
-
No es un producto de software libre opensource y suponemos que presenta un
precio elevado por su licencia. En la web oficial es imposible encontrar una
orientación de sus precios en coste de licencias o por número de agentes.
Incluso hemos intentado ponernos en contacto personalmente con las oficinas
existentes en Madrid y Barcelona como consultores de seguridad
independientes para obtener más información técnica (a parte de la poca
obtenida en la web oficial) acerca de la herramienta y también “alguna”
información económica, tanto del coste de licencias como del servicio
profesional, con la intención de ofertarla a futuros clientes. Sin embargo, la
respuesta obtenida ha sido nefasta, ya que se cierran a cal y canto a negociar o
hablar de cifras concretas de su producto si no son ellos los que conceden la
entrevista personal con los clientes. Podemos decir que no han sabido ser
buenos comerciales ni vender su producto, y que muestran una actitud
desinteresada, haciendo caso omiso incluso a correos electrónicos enviados a
su personal comercial.
Fuentes:
http://en.wikipedia.org/wiki/BMC_Software
http://www.informationweek.com/news/software/app_optimization/222000399
http://documents.bmc.com/products/documents/37/83/83783/83783.pdf
http://www.bmc.com/products/product-listing/ProactiveNet-Performance-Management.html
http://www.serverwatch.com/sreviews/article.php/3548996/Monitoring-Tools-Profile-BMC-PATROL-forWindows.htm
http://support.sas.com/rnd/emi/BMCPatrol/sas913sp4.bmcpatrol.prelim.pdf
http://support.sas.com/rnd/emi/BMCPatrol/index.html
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
45
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
3.2- DIFERENCIA ENTRE ARQUITECTURAS EN LOS SISTEMAS:
Vamos a comentar ahora la diferencia entre las aplicaciones que utilizan en su
arquitectura una tecnología de servidor y agentes, los cuales se ejecutan en los equipos a
monitorizar, y los que no utilizan ningún software en dichos equipos. Para ello, nos
basaremos en un estudio realizado por Chris Knowles en 2007 “The Truth about Agent vs.
Agentless Monitoring A Short” donde distingue ambos tipos de sistemas.
Expone que los sistemas con agentes realizan un envío de datos al servidor más
detallados y específicos, lo cual favorece para la identificar más rápidamente los fallos en el
sistema y reducir los tiempos de inactividad, aunque esto conlleve una mayor carga de
actividad en el nodo a monitorizar. También permite una mayor flexibilidad a la hora de
crear nuevas soluciones y complementos extendiendo así la funcionalidad del sistema.
Además, el control de la aplicación y servicios que expone dicho nodo se realiza de forma
directa y mediante protocolos seguros encriptados. Resalta que la seguridad con un sistema
sin agentes es menor y que puede verse afectado por hechos que suceden en la red.
En la actualidad, también existen sistemas híbridos que disponen de una
arquitectura con y sin agentes dejando al usuario la opción a escoger para cada nodo a
monitorizar. Esta nueva metodología emergente surge a partir del dilema que supone que
algunos componentes necesitan, en función de la importancia que tenga dentro de la red,
un mayor nivel de detalle y profundidad. Este sistema aporta una mayor flexibilidad y evita
sobrecargar de forma masiva el sistema con el uso de multitud de agentes. Hemos podido
comprobar que esta arquitectura está siendo desarrollada y defendida en los productos con
licencia comercial como una mejor elección y con mayores garantías hacia el cliente, como
por ejemplo resulta en BMC Software.
Existe una opinión a favor de los sistemas sin agentes para entornos específicos, en
concreto para una gestión de transacción empresarial (BTM: business transaction
management) para la supervisión de aplicaciones virtuales y basadas en la nube y terceros
entornos de conexión ya que aprovecha mejor el bajo impacto en el rendimiento de la red,
el bajo esfuerzo y la fácil implementación que supone esta arquitectura.
Fuentes:
Informe sistemas de monitorización con o sin agentes:
Chris Knowles “The Truth about Agent vs. Agentless Monitoring A Short”
http://www.google.es/url?sa=t&rct=j&q=the%20truth%20about%20agent%20vs.%20agentless%20mo
nitoring%20a%20short&source=web&cd=5&sqi=2&ved=0CEoQFjAE&url=http%3A%2F%2Fwww.businesslist.co
m%2Ftoolbox%2Fwhitepapers%2Findex.php%3Fm%3Dwhitepaper%26d%3Dattachment%26id%3D1073&ei=9ThNTWxOoS0hAfbsqD1Dw&usg=AFQjCNHE3-uS5FOrrFFDqRWwycvcQxym7Q&sig2=Xf-HluzbR5-WL1S0vFBHPg
Vídeo sistemas de monitorización sin agentes:
http://www.youtube.com/watch?v=rk_Mb7XCz8g
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
46
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
3.3- DIFERENCIA ENTRE SISTEMAS MULTIPROCESO:
La diferencia entre sistemas multiproceso ante un sistema cuya ejecución se realiza
con un solo proceso nos basamos en artículos como el realizado por Gerhard Lausser
‘Administración con Shinkem’ donde defiende este nuevo sistema de monitorización
basado en el núcleo de Nagios con nuevas modificaciones importantes, entre ellas, un
nuevo modelado multi-proceso distribuido que se adapte bien a entornos distribuidos y
heterogéneos.
Los sistemas que utilizan un solo proceso para realizar tareas como parsear la
configuración, gestionar la programación de tareas, llevar a cabo comprobaciones y
gestionar el scripting, etc. Y los sistemas que utilizan un proceso para cada una de ellas,
permiten distribuir el trabajo total y optimiza el rendimiento y permite a las distintas partes
completar sus tareas sin obstaculizar al resto.
Fuentes:
Informe sistemas de monitorización multiproceso:
Gerhard Lausser “Administración con Shinkem”
http://www.linux-magazine.es/issue/63/067-071_ShinkemLM63.pdf
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
47
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
3.4- COMPARACIÓN ESPECÍFICA DE LAS HERRAMIENTAS:
Después de conocer y detallar algunas de las herramientas de monitorización más
populares y reconocidas, realizaremos una comparación específica entre todas las
soluciones planteadas en base a unos factores globales y competencias o especificaciones
contenidas en dichos factores, los cuales describiremos a continuación.
Funcionalidad:
› Monitorizar servicios, hardware y sistema operativo.
› Multiplataforma en cliente.
› Generar gráficas, informes y estadísticas.
› Enviar alarmas y notificaciones, etc.
Fácil uso:
› Interfaz o consola web con control total sobre la aplicación.
› Personalización de dicha interfaz.
› Extensión del sistema (plugins).
› Instalación, configuración y puesta en marcha, etc.
Arquitectura:
› Basada en varios procesos que realicen las funcionalidades de la
aplicación.
› Consumo y requisitos previos aceptables (hardware, software, etc.)
› Sistema con agentes que trabajan en cada cliente o nodo.
› Posibilidad de monitorizar gran cantidad nº de nodos (varios miles).
› Estabilidad a cambios de configuración (reinicios del sistema), etc.
Calidad del Soporte Comunidad/Empresa:
› Desarrollo de nuevas mejoras y revisiones en la aplicación para la
corrección de bugs.
› Actividad en el foro y wiki ante preguntas y resolución de
problemas o peticiones de usuarios.
› Disponibilidad de una versión Enterprise de su herramienta, por si
se requieren aspectos más específicos en el entorno de producción
donde inicialmente se confió en una herramienta de software libre.
En su defecto, un soporte profesional diferente al de la comunidad.
› Idiomas de la documentación disponible, etc.
Expondremos de manera crítica una tabla que representará y reunirá de forma
visual las características y consecución de objetivos de todos los softwares analizados.
También mencionamos la siguiente fuente de Wikipedia donde ilustra una comparación
entre multitud de herramientas de monitorización, entre las cuales se encuentran varias de
las estudiadas en este documento:
http://en.wikipedia.org/wiki/Comparison_of_network_monitoring_systems
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
48
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
Sistema de
Monitorización
Software Libre
Funcionalidad
Fácil Uso
Arquitectura
Soporte
Nagios
Hyperic HQ
Zabbix
Zennos
Ganglia
OpenNMS
Cacti
Munin
BMC Patrol
HP OpenView
IBM Tivoli
Pandora FMS
Ilustración 34 – Comparativa gráfica de las principales características de los sistemas de monitorización.
La herramienta cumple con todas las competencias de ese factor global.
La herramienta NO cumple con al menos una de las competencias de ese factor global.
SISTEMA DE MONITORIZACIÓN – ESTADO DEL ARTE
49
Descargar