Tolerancia a Fallos Wilmer Estevez Piratoa J. Andrés Argumero Falla Es un desperfecto causado por un error de diseño, de programación, daño físico, deterioro por paso del tiempo o de fabricación. Fallas de Componentes Transitorias Intermitentes Permanentes Transitorias Ocurren una vez y luego desaparecen Intermitentes Este tipo de Falla se presentan, desaparecen luego reaparecen, etc… Permanentes Continua existiendo hasta que se arregla el componente. Las Fallas pueden ocurrir en todos los niveles. Si algún componente tiene una probabilidad p de tener una falla en un segundo dado, la probabilidad de que no falle durante k segundos consecutivos y después falle es: El tiempo esperado de fallo esta dado por la formula: Fallas de sistema Fallas silentes Fallas Bizantinas Sistemas Asíncronos Sistemas Síncronos Un sistema que responde siempre a un mensaje en un tiempo limite conocido Redundancia De la Información Del tiempo Fisica Tolerancia a Fallas por Replica Activa (Método de la Maquina de Estados) Es una técnica muy conocida. Se utiliza en la Biología Redundancia modular triple Tolerancia mediante respaldo primario El objetivo es que en todo momento un servidor es el primario y realiza todo el trabajo. Si el primario falla el respaldo ocupa su lugar. Acuerdos en sistemas defectuosos ¿La entrega de los mensajes es confiable? ¿Pueden fallar los procesos? ¿Son bizantinos o silentes? ¿El sistema es asíncrono o asíncrono? Ejemplo del ejercito bizantino: Sistemas Distribuidos de Tiempo Real ¿Qué son? Tiempo Real Suave Tiempo Real Duro Los tres mitos: 1. 2. 3. La escritura de controladores de dispositivos en código ensamblador. El computo de tiempo real es rápido. Las computadoras rápidas harán que el sistema de tiempo real sea obsoleto. Aspectos del Diseño Sincronización de Reloj Sistemas activado por eventos Sistemas activados por el tiempo PREDICTIBILIDAD TOLERANCIA A FALLOS