Disponibilidad de sistemas informáticos Los fallos y la disponibilidad de los sistemas informáticos Las causas de los fallos de los sistemas informáticos que provocan tiempos de inactividad no planificados son muchas y muy variadas: cortes del suministro eléctrico, factores ambientales (temperatura, humedad), desastres naturales (incendios, inundaciones, terremotos, …), actuaciones humanas (accidentales o intencionadas), errores de componentes hardware ( CPU, RAM, disco, red,…), errores de software (sistema operativo, aplicativos, migraciones, …), ...etc. La alta disponibilidad aplicada a los sistemas informáticos consiste en diseñar e implantar las tecnologías y el conjunto de medidas y actuaciones necesarias que permitan garantizar el acceso de los usuarios a los servicios las veinticuatro horas del día. Se define como continuidad del servicio el período de tiempo en el que el sistema informático funciona normalmente. El término tiempo de inactividad es el utilizado para medir cuándo el sistema no está disponible. Y la disponibilidad de un sistema se obtiene como un porcentaje, dividiendo el tiempo en que un sistema funciona normalmente y el tiempo total. Cada vez más los diferentes servicios de los sistemas informáticos deben estar disponibles a cualquier hora del día y se vuelven críticos. Es por ello que deben dotarse de arquitecturas que permitan garantizar la disponibilidad del servicio, asegurando el funcionamiento de las aplicaciones y el acceso a los datos. ¿Cómo incrementar el índice de disponibilidad de los sistemas informáticos? ▣ A través de actuaciones proactivas (como la prevención y predicción de errores o el despliegue de sistemas tolerantes a errores) orientadas a limitar los riesgos de una pérdida de servicio. ▣ Elaborando protocolos de actuación frente a los diferentes errores que permitan reducir los tiempos de inactividad en caso de que fallen todos los mecanismos de prevención y se produzca un fallo. ▣ Utilizando sistemas “Cluster” (arquitecturas formadas por dos o más servidores “nodos”) conectados entre sí que aumentan la tolerancia a errores y reducen las caídas del servicio. tao ¿Cómo puede ayudar T-Systems en la mejora de la disponibilidad de la información? Una buena estrategia de continuidad del negocio pasa por desplegar sistemas de alta disponibilidad (HA) y de rápida recuperación ante desastres (Failover) que minimicen los tiempos de pérdida de servicio. Para garantizar esta continuidad en el servicio, las aplicaciones TAO de T-systems están diseñadas para poder ser desplegadas en arquitecturas de alta disponibilidad de cada uno de sus componentes: servidores de base de datos, servidores de aplicaciones, servidores de ficheros, servidores web y sistemas cortafuegos. SERVIDORES DE BASE DE DATOS Cluster Activo/Pasivo (arquitectura de “Cluster de Microsoft”) ▣ En uno de los servidores del cluster está arrancada la base de datos. De producirse una caída del servidor, hay una pérdida de servicio de la base de datos pero inmediatamente se inicia el proceso de failover que arranca la base de datos en otro de los servidores del cluster. En pocos segundos la base de datos vuelve a encontrarse en producción. ▣ La bases de datos de Oracle además del cluster de Microsoft necesita del software de Oracle Failsafe. En cuanto a las bases de datos de SQLServer , se despliegan directamente sobre el cluster de Microsoft. Cluster Activo/Activo (Oracle en RAC) ▣ Dos o más servidores del sistema Oracle RAC, dan servicio de la misma base de datos de Oracle. De producirse la caída de uno de los servidores, toda la carga de trabajo es asumida por el resto de servidores del cluster de Oracle RAC. No hay pérdida de servicio de la base de datos de Oracle. ▣ Oracle RAC puede desplegarse sobre plataformas Microsoft Windows y sobre plataformas Unix. SERVIDORES DE APLICACIONES Granja de servidores Windows Terminal Server (WTS) WTS con NLB (Network Load Balancing) aporta alta disponibilidad y reparto equitativo de las conexiones de los usuarios entre los diferentes servidores sin atender a la carga de trabajo soportada por cada uno de los servidores. Si cae uno de los servidores de la granja de Terminal Server, las nuevas conexiones de los usuarios se reparten de forma equitativa entre el resto de servidores de la granja de Terminal Server sin atender a la carga de trabajo soportada por cada servidor. El software de alta disponibilidad arranca automáticamente los servicios en cualquiera de las otras máquinas del cluster en el caso de que se produzca un fallo de hardware o de aplicación en una de las máquinas, minimizando así la percepción del fallo por parte de los usuarios Granja de servidores CITRIX Citrix aporta alta disponibilidad y balanceo de conexiones de los usuarios en función de la carga de trabajo que soporta cada uno de los servidores pertenecientes a la granja Citrix. Si cae uno de los servidores de la granja Citrix, las nuevas conexiones de los usuarios se repartida entre el resto de los servidores de la granja teniendo en cuenta la carga de trabajo soportada por cada uno de los servidores. Una alternativa es el cluster de balanceo de carga, diseñado para repartir las conexiones de los usuarios entre los servidores del cluster. ON ALTA DISPONIBILIDAD SERVIDORES WEB Construcción de granjas de servidores Web de Microsoft sobre las que implementamos el NLB de Microsoft (Network Load Balancing). El NLB reparte las peticiones entre los servidores Web que conforman la granja. Se configura la afinidad de sesión para forzar que una vez establecida una sesión de usuario con uno de los servidores Web, el resto de peticiones sean resueltas por este mismo servidor. tao SERVIDORES DE FICHEROS Construcción de sistemas de alta disponibilidad de carpetas compartidas con el “Cluster de Microsoft” CORTAFUEGOS Construcción de de sistemas cortafuegos en alta disponibilidad mediante dos equipos cortafuegos del fabricante SonicWall en configuración Activo/Pasivo