FACULTAD DE INGENIERIA ESCUELA DE INGENIERIA MECANICA ANALISIS DE RIESGOS EN PLANTA USANDO ÁRBOLES DE EVENTOS FERNANDO ESPINOSA FUENTES INTRODUCCIÓN. El análisis de riesgos es una técnica para identificar, caracterizar, cuantificar y evaluar peligros. Esta herramienta puede ser usada para apoyar la decisión sobre la regulación y la inversión en seguridad. El análisis de riesgo consiste de dos fases distintas: una fase cualitativa de identificación, caracterización y ordenamiento de los riesgos; y una fase cuantitativa de la evaluación del riesgo, la cual incluye la estimación de la probabilidad (p.ej.: frecuencias) y consecuencias de la ocurrencia del peligro. Las principales metas de la administración del riesgo son minimizar la ocurrencia de los accidentes mediante la reducción de la probabilidad de su ocurrencia (minimizar la presencia del peligro); reducir el impacto de los accidentes incontrolables (preparar y adoptar medidas de emergencia) y transferir el riesgo (p. ej.: vía seguros). La estimación de la probabilidad de la frecuencia del riesgo depende de gran manera de la confiabilidad de los componentes del sistema, tomando como sistema la interacción del hombre y la máquina o entorno. ANÁLISIS DE RIESGOS PARA EL OPERARIO. La seguridad-inocuidad de un sistema puede ser definida como la probabilidad de que un sistema no falle de una manera que produzca heridas peligrosas personales o de que pueda ocurrir una gran pérdida económica. En este mismo sentido, la fiabilidad puede ser definida como la probabilidad de que tales fallas críticas no ocurran en un intervalo especificado de tiempo, dado que el sistema cumplía satisfactoriamente todas sus funciones al comienzo de tal intervalo. Esto significa que un sistema puede ser muy seguro aún si el sistema es no fiable. Esto es verdad si el sistema siempre falla (con una alta probabilidad) de una manera no peligrosa. Muchos sistemas pueden ser detenidos sin problemas cuando se detecta una falla crítica de seguridad. Tales sistemas pueden ser implementados con falla silenciosa. Esto significa que cuando una falla de seguridad crítica se detecta, el sistema automáticamente se detiene. Un sistema con falla silenciosa, que es un caso especial de una clasificación más general de sistemas seguro a la falla, tiene un comportamiento en el cual las fallas peligrosas no pueden ocurrir en el nivel del sistema. Haciendo uso del análisis funcional del equipo, para reconocer aquellos subsistemas que podrían eventualmente reportar peligro y teniendo en cuenta la forma de trabajo e intervención del operario a cargo del equipo, se elabora un mapa de los subsistemas peligrosos (ver figura 7.1), para posteriormente estudiar sus niveles de peligrosidad. Se puede obtener un método de análisis estructurado para evaluar el riesgo, usando un árbol de decisión de tipo binomial, ya que refleja bien las situaciones más recurrentes: grave o leve, frecuente o no frecuente, etc. El resultado de este análisis provee lineamientos para el diseño del sistema de seguridad, el cual está basado sobre cinco niveles relativos de riesgo. Estos niveles parten del rango más bajo (nivel/categoría B) en el cual la severidad del daño es leve y tiene una probabilidad relativa pequeña de ocurrencia, hasta la más alta del nivel de riesgos (nivel/categoría 4) en el cual la probabilidad de un daño severo es relativamente alta. Este árbol de decisión se muestra en la figura 7.2. sistema subsistema seguridad de la función seguridad de la función subsistema subsistema seguridad de la función subsistema o parte subsistema o parte seguridad de la función seguridad de la función nivel de peligrosidad nivel de peligrosidad Fig. 7.1: Árbol para análisis de partes peligrosas. El análisis de un árbol de eventos permite al diseñador cuantificar el nivel de riesgo asociado con la máquina o uno de sus subsistemas. Para cualquier sistema dado, el analista primero clasifica el conjunto de problemas potenciales en términos de: • La severidad del daño potencial (S): • S1 es para daños leves: provoca ausencia corta del operario. • S2 para daños graves: en caso extremo la muerte del operario. • La frecuencia de la exposición al peligro potencial (F): • F1 exposición no frecuente: revisión distanciada en el tiempo del proceso productivo. • F2 exposición frecuente a continua: el proceso requiere atención permanente. • • La posibilidad de evitar el peligro si éste ocurre (P): P1 puede ser posible: velocidad o frecuencia de los movimientos del punto peligroso es baja y la distancia del operador al punto peligroso es grande. • P2 menos posible: velocidad o frecuencia de los movimientos del punto peligroso es alta y la distancia del operador al punto peligroso es pequeña. • La probabilidad de ocurrencia si un interbloqueo falla (L): • L1 puede ser muy improbable • L2 puede ser improbable • L3 altamente probable L3 L2 L1 B B B S1 P1 O 1 F1 P2 P1 S2 F2 P2 B 2 B 1 3 2 4 3 B 1 3 1 1 4 2 2 Fig. 7.2: Árbol de eventos para determinar niveles de peligro o riesgos para el operario. Diferentes máquinas y procesos presentan diferentes tipos de peligros y riesgos para el operador y el personal de mantenimiento. La valoración estructurada del riesgo es una manera sistemática de cuantificar esos niveles de riesgos, a principios del desarrollo o bien durante la vida útil para revalorizar el índice en base a los datos recolectados. Conduce al equipo de diseño a determinar el espectro de la seguridad requerida del sistema, necesaria para proteger al personal de posibles heridas, identificar peligros y posibles problemas de diseños del equipo. La valoración estructurada del riesgo formaliza lo que, en muchas ocasiones, han sido procesos intuitivos en los cuales los diseñadores usan experiencias pasadas para identificar y valorar el riesgo y elegir salvaguardas para ellos. Con este tipo de cuantificación en mano, los diseñadores o mantenedores pueden definir mejor los tipos de salvaguarda necesarios para cada ocasión. El sistema de seguridad general de requerimientos de diseño, asociado con cada nivel valorado de riesgo, es descrito por las Normas Europeas (EN954-1). Como se podría esperar, a mayor posibilidad o severidad del daño, más grandes son los requerimientos en el diseño e integridad del sistema de seguridad de la máquina. Para el nivel B de riesgos, el sistema de seguridad está diseñado para encontrase con requerimientos operacionales y resistir influencias esperadas externas. Esta categoría es usualmente satisfecha seleccionando componentes compatibles con las condiciones de aplicación, tales como los niveles de temperatura o voltaje que podrían existir. Aquí una simple avería o falla en el sistema de seguridad puede conducir a la pérdida de la función de seguridad. Para el nivel 1 de riesgos, el sistema de seguridad debe cumplir los requerimientos de la categoría B, pero debe usar principios de seguridad y componentes bien probados. Principios y componentes bien probados incluyen aquellos que: evitan se produzcan ciertas fallas, tales como cortocircuitos; reducen la probabilidad de averías, quizás por subestimación de componentes seleccionados, sobredimensionando para integridad estructural, o por otros medios; detectan fallas tempranamente, como es el caso de los interruptores de puesta a tierra; aseguran el modo de avería (por ejemplo, asegurar que un circuito se abre cuando es vital que la potencia se interrumpa en la presencia de una condición insegura); o limitan las consecuencias de la avería. Aquí también una simple avería o falla en el sistema de seguridad puede conducir a la pérdida de la función de seguridad. Pero el uso de principios y componentes bien probados provee un alto nivel de confiabilidad del sistema. En el caso del nivel 2 de riesgos, el sistema de seguridad debe comprender los requerimientos de la categoría B. Se le suma, además, que no se puede poner en funcionamiento la máquina si se detecta una avería antes de la aplicación de la potencia, o durante chequeos periódicos durante la operación El último requerimiento sugiere el uso de un módulo de relees de seguridad con redundancia y autochequeante o energizante. Un canal único de operación se permite para proveer los mecanismos de entradas (protecciones de los interbloqueos de la máquina, botones de parada de emergencias, etc.), los cuales son probados regularmente para una apropiada operación. Como en el caso de los aparatos categoría B, una sola avería o falla en el sistema de seguridad puede conducir a la pérdida de la función de seguridad entre los intervalos de chequeo. Sin embargo, los chequeos periódicos detectarían las averías y mantendrían un estado seguro hasta que la avería sea corregida. Similarmente, los sistemas de seguridad para los aparatos del nivel 3 deben contener los requerimientos de la categoría B. Se le suma que la seguridad del sistema de control debe ser diseñada de modo tal que una sola falla no conduzca a la pérdida de la función de seguridad. Y, en la práctica, la sola falla sería detectada. Para prevenir que una sola avería haga fracasar la función de seguridad, aquí se necesita ser redundante en el módulo de relees de seguridad. Un requerimiento adicional es el uso de un canal dual de monitoreo de los aparatos de entrada tales como interruptores de conexión de la máquina, botones de emergencias, etc. En general, los requerimientos del sistema de seguridad del nivel 4 incluyen todos los del nivel 3 y contienen adicionalmente el requerimiento que, en la práctica, una sola falla se detecta en o antes de la siguiente demanda del sistema de seguridad. Si esto es imposible, entonces la acumulación de múltiples averías no debe conducir a la pérdida de la función de seguridad. El número permitido de averías será determinado por la aplicación, tecnología usada y estructura del sistema. En otras palabras, una sola avería o falla en el nivel 4 del sistema de seguridad no debería comprometer la función de seguridad. Los requerimientos del nivel 4 de seguridad están usualmente asociados con aplicaciones extremadamente riesgosas. Consecuentemente, el sistema de seguridad relacionado puede ser muy complejo y costoso. Afortunadamente, pocas máquinas representan un nivel 4 de riesgo, porque la práctica del diseño en general de máquinas, respecto a la jerarquía clásica de seguridad, la mayoría de los peligros de la máquina son eliminados en el diseño, y se toman medidas precautorias para evitarlos si ellos no pueden ser eliminados en el diseño, o como última opción poner sobre aviso al usuario. Un caso de aplicación. Teniendo un conocimiento previo en terreno de las condiciones en que trabaja un operario frente a su máquina, se puede evaluar la condición de seguridad, siguiendo los pasos indicados en el diagrama de la figura 7.2, el cual está implementado en planilla Excel (ver figura 7.3). Para cada paso en la evaluación, la situación más real a la que se ve enfrentado el operario se indica mediante el valor 1, así por ejemplo, si la severidad del daño que le podría causar un accidente es grave, se marca con valor 1 la celda identificada con S2. Siguiendo cada etapa del análisis, conducirá finalmente al analista a tener una visión de las características que deberán tener los implementos de seguridad en la máquina, equipo o lugar de trabajo. Fig. 7.3: Planilla para calcular el riesgo probable para un operario. El número que indica el índice de impacto probable, es sólo una guía para relacionar el tipo de ínter bloqueo más indicado con el análisis realizado a través del árbol binario de decisión y así comprobar si el ínter bloqueo instalado es suficiente o bien tomar las medidas del caso. ANALISIS PROBABILISTICO DEL RIESGO (APR) PARA UNA PLANTA INDUSTRIAL. El siguiente análisis provee una metodología para analizar el riesgo probable de accidente en una planta, a través de un esquema similar al ya expuesto para el operario, y se recomiendan los siguientes pasos (ver figura 7.4): Desarrollo de la secuencia (escenarios) Cuantificación: • Análisis dependiente de la falla. • Análisis de incerteza. • Cálculo del riesgo. Desarrollo de los eventos iniciales Estimaciones de las consecuencias Análisis del sistema Desarrollo de información: - Procedimientos. - Test y prácticas de mantención. - Confiabilidad humana. - Datos de fallas. - Esquemas. - Especificaciones. - Criterios de éxito. - Apoyo de información. - Interacción humana. VALOR DEL RIESGO Fig. 7.4: Pasos en un análisis del APR. 1. Definición de la metodología. La preparación para un APR comienza con una revisión de los objetivos del análisis del riesgo, para proveer una ruta o camino para el análisis. 2. Familiarización y recopilación de información. Es necesario para comenzar el APR tener un conocimiento general del layout físico del sistema o del proceso (p. ej.: facilidades, planta, diseño), controles administrativos, procedimientos y pruebas de mantenimiento y sistemas protectores cuyo funcionamiento mantiene la seguridad. Se deben entender con suficientes detalles todos los sistemas, ubicaciones y actividades esperadas que jueguen un papel en la iniciación, propagación o detención de una condición peligrosa, a fin de poder construir los modelos necesarios para capturar todos los escenarios posibles. Se debe realizar una inspección detallada a los procesos en las áreas esperadas de interés e importancia para el análisis. Los siguientes ítems deberán ser considerados en este paso: a) Identificar los sistemas principales de seguridad y emergencia (o métodos). b) Identificar y describir detalladamente las interacciones físicas entre todos los sistemas principales. El resultado debe ser resumido en una matriz de dependencia. c) Se debe llevar un registro de los eventos pasados de fallas y situaciones no normales que se han observado en el proceso. Tal información podría ayudar a generar escenarios de aplicaciones importantes. d) La documentación consistente es la llave para asegurar la calidad del APR. Entonces se debe diseñar un buen sistema de información para sustentar el estudio. Con la interacción de los diseñadores del proceso, los operarios y los administradores se determinan las reglas básicas para el análisis, el escenario del análisis y la configuración que será analizada. También se debe determinar las fallas y las condiciones que serán incluidas o excluidas, los modos de operación de interés, los datos de referencia o nivel estándar de diseño, y la configuración física asociada al nivel estándar. El nivel estándar es un dato arbitrario después del cual no hay cambios adicionales en el diseño del proceso y la configuración que será modelada. Entonces, los resultados del APR son sólo aplicables al proceso y los datos de referencia. 3. Identificación de los eventos iniciales. Esta tarea involucra identificar aquellos eventos (eventos anormales) que podrían, si no son correctamente detectados, resultar en una exposición peligrosa. El primer paso involucra identificar fuentes de peligro y las barreras para estos peligros. El siguiente paso involucra identificar los eventos que pueden conducir a una amenaza directa a la integridad de las barreras. Un sistema o proceso puede tener uno o más modos de operación los cuales entregan sus correspondientes salidas. En cada modo operacional, se ejecutan operaciones específicas que dan como resultado las salidas esperadas. Cada función está directamente relacionada a uno o más sistemas que ejecutan las acciones funcionales necesarias. Estos sistemas a su vez están compuestos de varias unidades básicas (p. ej.: componentes) que ayudan a conseguir el objetivo del sistema. Mientras el sistema esté operando dentro de sus parámetros de diseño, son pocas las posibilidades de cambiar los componentes del sistema tal que los peligros potenciales puedan traspasar estas barreras. Estos modos operacionales son llamados modos normales de operación. Durante el modo normal de operación la pérdida de ciertas funciones de los sistemas podrían causar que el proceso entre una condición fuera de lo normal. Una vez en esta condición, se presentan dos posibilidades: primero, el estado del proceso podría ser tal que no se requieren de otras funciones para mantener el proceso en una condición segura (segura se refiera a un modo donde el cambio a la exposición al peligro en los límites del proceso es sumamente difícil), y la segunda posibilidad es un estado donde otras funciones o sistemas se requieren para prevenir la exposición al peligro dentro de los límites del sistema. Para esta segunda posibilidad, la pérdida de una función o la pérdida de un sistema es un evento inicial. Ya que tal evento está relacionado al proceso operativo del equipo, se llama evento operacional inicial. Una alternativa para identificar los eventos iniciales es usar la descomposición jerárquica del análisis del modo de falla y efecto (AMFE). El uso del AMFE para identificar los eventos iniciales consiste en la identificación de los eventos conducentes a una falla (modos de falla) cuyos efectos es una amenaza a las barreras del peligro. Para simplificar el proceso, es necesario, después de identificar todos los eventos iniciales, combinar estos eventos iniciales que provocan la misma amenaza a las barreras y requieren de las mismas funciones de mitigación del proceso para prevenir la exposición al peligro. El siguiente procedimiento inductivo se debe seguir cuando se agrupan los eventos iniciales: a. Combine los eventos iniciales que directamente rompen todas las barreras del peligro. b. Combine los eventos iniciales que rompen la misma barrera (no necesariamente todas las barreras). c. Combine los eventos iniciales que requieren el mismo conjunto de acciones de mitigación humana o automática, siguiendo su ocurrencia. d. Combine los eventos iniciales que simultáneamente incapacita el proceso normal y algunas de las acciones humanas o automáticas de mitigación. Los eventos que causan una operación fuera de lo normal del proceso y requieren de otro sistema de operación para mantener el proceso dentro de sus límites deseados, pero que no está directamente relacionado al proceso o componentes, son eventos iniciales no operacionales. Los eventos no operacionales iniciales se identifican con el mismo método usado para identificar los eventos operacionales. Sin embargo, los eventos de interés son aquellos que son primariamente externos al proceso. El siguiente procedimiento debería ser seguido es este paso para el APR: a. Seleccione un método para identificar los eventos iniciales específicos operacionales y no operacionales. Dos métodos representativos son la jerarquización operacional y el AMFE. Si está disponible una lista inicial genérica de eventos iniciales, esta puede ser usada como complemento. b. Usando el método seleccionado, identifique un conjunto de eventos de iniciación. c. Agrupe los eventos iniciales de tal forma que aquellos que tienen el mismo efecto en el proceso y requieren las mismas funciones mitigantes para prevenir la exposición al peligro o accidente sean agrupadas juntas. 4. Secuencia o desarrollo del escenario. El objetivo del desarrollo del escenario es derivar un conjunto completo de escenarios que abarquen todas las rutas posibles de propagación del peligro que puedan conducir a la pérdida o confinamiento del peligro siguiendo la ocurrencia del evento inicial. Para describir la causa y efecto entre el iniciador y la progresión del evento, es necesario identificar aquellas funciones (p. ej.: funciones de seguridad) que deben ser mantenidas para prevenir la pérdida de las barreas al peligro. Los escenarios que describen las respuestas funcionales del proceso a los eventos iniciales son frecuentemente descritos mediante árboles de eventos. Siguiendo un evento inicial se elaboran los árboles de eventos y la representación (de manera cronológica aproximadamente) de los éxitos o fallas de las acciones claves de mitigación (p. ej.: acciones humanas o dispositivos mitigantes que responden automáticamente) que son requeridos para responder al evento inicial. En el APR, dos tipos de árboles de eventos se pueden desarrollar: funcional o sistemático. El árbol de eventos funcional usa las funciones mitigantes como su entrada. El propósito principal del árbol funcional es comprender mejor el escenario de eventos a un alto nivel, siguiendo la ocurrencia de un evento inicial. El árbol funcional también guía al analista del APR en el desarrollo más detallado del árbol de eventos sistémico. El árbol de eventos sistémico, refleja los escenarios de mitigación de eventos específicos (acciones humanas específicas o sistemas operacionales mitigantes o fallas) que conducen a una salida peligrosa. Esto es, el árbol de eventos funcionales puede ser más bien descompuesto para mostrar equipos o dispositivos específicos o acciones humanas que ejecutan las funciones descritas en el árbol de eventos de eventos funcionales. Entonces, un árbol de eventos sistémico delinea totalmente el proceso o la respuesta del sistema a un evento inicial y sirve como la herramienta principal para un análisis posterior en el APR. Los siguientes procedimientos se deben seguir en este paso del APR: a. Identificar las funciones mitigantes de cada evento inicial (o grupo de eventos). b. Identificar las correspondientes acciones humanas, operaciones del sistema o dispositivos asociados con cada función, junto con las condiciones necesarias para el éxito. c. Desarrollar un árbol de eventos sistémicos para cada evento inicial (o grupos de eventos). d. Desarrollar un árbol de eventos sistémicos para cada evento inicial, delineando las condiciones de éxito, fenómeno de progresión del evento inicial y el efecto final de cada escenario. 5. Análisis del sistema. Los árboles de eventos comúnmente involucran puntos en sus ramas en la cual un sistema dado (evento) ya sea trabaja (o sucede) o no trabaja (o no sucede). A veces, la falla de esos sistemas (o eventos) es rara y sus datos pueden ser no adecuados para eventos observados de fallas, para proveer una base de datos confiables de tasa de fallas. En tales casos hay que tener otra metodología dependiendo de la certeza de los datos. El método más común usado en un APR es calcular la probabilidad de falla del sistema mediante el análisis del árbol de fallas. Los siguientes pasos se deben seguir como parte del desarrollo de un árbol de fallas: a. Desarrolle un árbol de fallas para cada evento en el árbol de entradas. b. Explicite el modelo de dependencias de un sistema en otros sistemas y dependencias inter componentes (p. ej.: causas de fallas comunes). c. Incluya toda causa potencial de fallas, tales como dispositivos, software, pruebas y mantenimiento y error humano en el árbol de fallas. 6. Eventos internos externos al proceso. Los eventos que se originan dentro de un sistema complejo son llamados eventos internos. Los eventos que afectan adversamente al proceso y ocurren fuera de los límites del proceso, pero dentro de las instalaciones, se definen como eventos internos externos al proceso. Típicos eventos internos externos al proceso son incendios internos, flujos internos, eventos de alta energía dentro de un sistema complejo. Los sucesos de estos eventos deberían ser modelados con árboles de eventos para mostrar todos los posibles escenarios. 7. Eventos externos. Son eventos que se originan fuera del sistema complejo. Ejemplo de eventos externos serían el incendio, temblor terrestre, choques, etc. Esta clasificación puede ser usada para agrupar escenarios en los árboles de eventos. 8. Consideraciones dependientes de las fallas. Para lograr un nivel muy bajo de riesgos, los sistemas y dispositivos que comprenden las barreras a la exposición al peligro deben tener muy altos niveles de confiabilidad. Esta alta confiabilidad es lograda típicamente a través del uso de redundancias y/o diversos dispositivos, las cuales proveen múltiples alternativas de éxito. El problema entonces comienza en el aseguramiento de las independencias de esas alternativas, ya que siempre hay algún grado de acoplamiento entre la fallas de los mecanismos, ya sea a través del medio operativo (eventos externos a los dispositivos), o a través de dependencias funcionales o espaciales. El tratamiento de estas dependencias debe ser cuidadosamente incluido en el desarrollo y análisis de los árboles de eventos y de fallas en el APR. Como la confiabilidad de los sistemas individuales y de los subsistemas aumenta debido a la redundancia, la contribución de las fallas dependientes se vuelve muy importante, al punto que las fallas dependientes pueden dominar la totalidad de la confiabilidad. El tratamiento de las fallas dependientes no es un paso aislado realizado durante el APR, se debe considerar en todo su análisis (p. ej.: en los árboles de eventos, árboles de fallas y acciones humanas). El siguiente procedimiento se debe seguir en el análisis de las dependencias: a. Identifique los ítems que son similares y pueden causar dependencias o causas comunes de falla. Por ejemplo, bombas similares, válvulas moto-operadas, válvulas operadas por aire, generadores diesel y baterías son los mayores componentes en las plantas de procesos y se consideran fuentes importantes de causas de fallas comunes. b. Los ítems que son potencialmente susceptibles a una causa común de falla se deben incorporar explícitamente en los árboles de eventos y de fallas cuando es aplicable. c. Las dependencias funcionales deben ser identificadas y explícitamente modeladas en los árboles de fallas y de eventos. 9. Análisis de los datos de fallas. Un bloque crítico en la valoración de la confiabilidad y disponibilidad de los ítems de un sistema complejo es el dato de falla en el desarrollo del ítem. En particular, la mejor fuente para predecir futuras disponibilidades del equipo son las experiencias pasadas o las pruebas. Los componentes de los datos de confiabilidad son las entradas a los modelos de estudios de la confiabilidad y la validez de esos resultados depende altamente de la calidad de la información de entrada. Se debe reconocer, sin embargo, que los datos históricos tienen validez solamente en el entendido que las condiciones circundantes son las mismas. Tres tipos de eventos se identifican durante la secuencia el accidente, y el modelamiento del sistema debe ser cuantificado para los árboles de eventos y árboles de falla para estimar la frecuencia de ocurrencias de las secuencias: eventos iniciales, componentes fallados y errores humanos. La cuantificación de los eventos iniciales y la probabilidad de fallas de los componentes involucran dos actividades separadas. Primero, el modelo de confiabilidad para cada evento se debe establecer, en seguida los parámetros del modelo se establecen. Los datos necesarios incluyen tasa de fallas de los componentes, tiempos de reparación, frecuencia de pruebas, pruebas de detención, probabilidad de las causas comunes y caracterización de las incertezas. El siguiente procedimiento se debe seguir como parte de la tarea de análisis de datos: a. Determinar los valores genéricos de las tasa de fallas y distribución de probabilidad de las fallas para componentes identificados en el análisis del árbol de fallas. b. Determinar pruebas, reparaciones y acciones de mantenimiento primarias de la experiencia, si es posible. De otra forma use fuentes genéricas. c. Determinar la frecuencia de los eventos iniciales y otros eventos de fallas de los componentes a partir de la experiencia, juicio de expertos o fuentes genéricas. d. Determinar la probabilidad de falla de causas comunes para ítems similares, principalmente de datos genéricos. Sin embargo, cuando un dato específico significativo está disponible se puede usar. 10. Cuantificación. Las secuencias de los árboles de fallas y de eventos se cuantifican para determinar las frecuencias de los escenarios e incertezas asociadas en los cálculos. Las aproximaciones dependen a veces de la manera como las dependencias del sistema se manejan. Normalmente, se usa la cuantificación mediante la reducción Booleana para arribar a una representación Booleana para cada secuencia. Comenzando con los modelos de árboles de falla para varios sistemas o eventos de entrada en los árboles de eventos, y usando las estimaciones de probabilidades para cada uno de los eventos en el árbol de fallas, se obtiene la probabilidad de entrada para cada árbol de eventos (si la entrada es independiente do otras entradas). El siguiente procedimiento se debe seguir como parte del proceso de cuantificación: a. Combinar los correspondientes árboles de fallas asociados con cada falla o evento exitoso en la secuencia del árbol de eventos (p. ej.: combínelos en una forma Booleana). Desarrolle una función reducida Booleana para cada secuencia. b. Calcular la frecuencia total de cada secuencia, usando la frecuencia de eventos iniciales, la probabilidad de falla de los dispositivos, frecuencias de test y mantenimiento, distribución de probabilidades de causas de fallas, y probabilidad de fallas humanas. c. Calcular la frecuencia de cada secuencia. Un ejemplo de aplicación. Considere el sistema de protección contra el fuego mostrado en la figura 7.5. Este sistema está diseñado para extinguir todos los fuegos posibles en una planta que maneja productos químicos tóxicos. Hay dos dispositivos independientes con boquillas extintoras las cuales están diseñadas de tal manera que cada una de ellas es capaz de controlar cualquier tipo de incendio dentro de la planta. El dispositivo de boquillas 1 es el dispositivo principal de inyección de agua. Cuando se recibe una señal desde el detector de fuego, la bomba 1 funciona automáticamente, succionando agua desde el estanque de almacenamiento e inyectándola en el área con fuego de la planta. Detector Actuador de alarma (DAA) Válvula (V12) Estanque de agua (EA) Válvula (V11) B1 Válvula (V22) Válvula (V21) Boquillas línea 1 (BI1) Boquillas línea 2 (BI2) B2 Bombas Potencia exterior (PE) Dpto. de bomberos (DB) Generador Diesel (GD) Fig. 7.5: Sistema de protección contra el fuego. Operador (Op) Si el circuito 1 de inyección de agua no funciona, el operador de la planta puede poner en funcionamiento a una segunda unidad de bombeo manualmente. Si la segunda unidad no está operativa, el operador puede llamar al departamento de bomberos, aunque el detector también envía una señal directamente a bomberos. Sin embargo, debido a la tardanza en la llegada de los bomberos, la magnitud del daño podría ser tan grande como si el fuego fuese extinguido por los inyectores de agua. Bajo todas las condiciones, si la potencia exterior no está disponible debido al fuego u otras razones, un generador local proveería de energía eléctrica a las bombas. La potencia para el detector se provee a través de baterías, las cuales están siendo constantemente cargadas desde la energía exterior. Aún si la corriente alterna no está disponible, se espera que la corriente continua esté siempre disponible a través de las baterías. Las válvulas manuales a ambos lados están normalmente abiertas, y permanecen cerradas cuando se están reparando las bombas. El sistema completo contra el fuego y el generador están ubicados afuera de la planta por lo cual no son afectados por fuego interno alguno. El análisis de riesgos es el que se indica a continuación: 1. Identificación de los eventos iniciales. En este paso, todos los eventos que conducen o promueven un incendio en la planta se deben identificar. Esto debería incluir equipos funcionando mal, errores humanos y condiciones del proceso, conjuntamente con la frecuencia de cada evento. Suponiendo que todos los eventos conducirían a la misma magnitud del fuego, el último evento inicial es el fuego, para el cual la frecuencia es la suma de las frecuencias de los eventos individuales causantes del fuego. Asuma para este ejemplo que la frecuencia estimada de la aparición del fuego es 1x10-6/año. Ya que el fuego es el único desafío para la planta en este ejemplo, se tiene al final un solo evento inicial. Sin embargo, en situaciones más complejas, un gran conjunto de eventos iniciales se pueden identificar, cada uno de ellos siendo un desafío diferente en la planta. 2. Desarrollo del escenario. En esta etapa, se debe explicar la causa y efecto de las relaciones entre el fuego y la progresión de los eventos que siguen al fuego. Se usará el método de árbol de eventos para describir estas relaciones. Generalmente, esto se realiza en forma inductiva, y el nivel de detalles considerado en el árbol depende del analista. Dos medidas de protección han sido consideradas en el árbol de eventos, mostrado en la figura 7.6: medidas de protección en el sitio o lugar (bombas, estanque, etc.) y medidas exteriores (departamento de bomberos). La selección de estas medidas está basada en el hecho de la disponibilidad o no disponibilidad de las medidas en el lugar o fuera del lugar que podrían conducir a diferentes estados de daño en la planta. Resultado final Sistema de protección en el lugar (PEL) Funciona Efecto Daño grado 1 Menor Daño grado 2 Mayor Daño grado 3 Catastrófico Sistema de protección fuera del lugar (PFL) Fuego (F) Funciona Falla Falla Fig. 7.6: Distintos escenarios usando el árbol de eventos. 3. Análisis del sistema. En este paso, se deben identificar todas las fallas (de equipos o humanas) que conducen a la falla de la entrada del árbol de eventos (medidas de protección en el sitio o fuera del sitio). Por ejemplo en la figura 7.7, se muestra el árbol de fallas desarrollado para el sistema de protección contra el fuego en el lugar. En este árbol de fallas, se describen todos los eventos básicos que conducen a la falla de los circuitos independientes. Note que la energía eléctrica de las bombas y el estanque de agua están presentes en las dos rutas. Claramente esto es considerado una dependencia física. Esto se debe tomar en cuenta en la cuantificación del análisis del riesgo. En estos árboles, todos los eventos externos y pasivos que conducen a la falla no han sido considerados. En la figura 7.8 se muestra el árbol de fallas para el sistema de protección fuera del lugar. 4. Análisis de los datos de fallas. Es importante en este punto calcular la probabilidad de los eventos básicos de falla descritos en el árbol de eventos y en los árboles de fallas. Esto se puede realizar usando datos específicos de la planta, datos genéricos o juicios de expertos. En la tabla 7.1 se entregan los datos usados para esta evaluación. Se asume que se necesitan a lo menos 10 horas para extinguir el fuego completamente. Boquillas línea 1 inhabilitada Válvula 12 cerrada OR Falla ruta de inyección 1 OR Falla bomba 1 Válvula 11 cerrada Bomba 1 inhabilitada Falla detector alarma AND Sin energía bomba 1 Gen. Diesel inhabilitado Estanque inhabilitado Falla sistema AND protección en el lugar Sin energía exterior Boquillas línea 2 inhabilitadas Válvula 22 cerrada OR Falla ruta de inyección 2 OR Falla bomba 2 Válvula 21 cerrada Estanque inhabilitado Operador no da la partida Bomba 2 inhabilitada Falla detector alarma AND Sin energía bomba 2 Fig. 7.7: Árbol de eventos para el sistema de protección en el lugar. Operador no avisa a los bomberos AND Fallas internas Fallas detector alarma Falla sistema OR protección fuera del lugar Respuesta tardía de los bomberos Fig. 7.8: árbol de eventos para el sistema de protección fuera del lugar. Sin energía exterior Gen. Diesel inhabilitado DATOS PARA LA EVALUACIÒN DEL APR Evento de falla Experiencia en la planta Dato genérico Frecuencia de iniciación No hay datos de incendios Cinco incendios en plantas F = 5/70000 del fuego durante los últimos 10 similares. F = 7,1x10-5/año años de operación años-planta Hay de Probabilidad usada 70.000 Comentarios Uso de datos genéricos expe- riencia. Falla de las bomba 1 y Cuatro fallas de las dos Fallas al funcionar = 4/(2x12x10)= Para fallas en la partida bomba 2 bombas 1x10-5/hr. 0,0166/demanda use datos específicos de realizan pruebas mensual- No disponibilidad = la planta. Para fallas al mente cuyos tiempos son 0,0166 + 10/8760 = funcionar cortos. 0,0178 genéricos. Suponiendo 10 reparación toma 10 horas Fallas al funcionar = años de experiencia y en la frecuencia de 1 vez 1x10-5/hr. 8760 horas en el año. al año. No se sabe de B1 = B2 = fallas al funcionar. 0,0178 + 1x10-5x10 = al El partir. tiempo Se de use datos 1,79x10-2 Causa común de fallas No se tiene conocimiento entre las bombas 1 y 2 Usando en método del Usando la no dispo- Despreciar las posibles factor β, con β=0,1 para nibilidad debido a fallas fallas comunes de las falla de las bombas al comunes: boquillas y las válvulas. partir. Ver nota al pie. CCF = 0,1x1,78x10-2 = 1,78x10-3 V11 = V12 = V21 = V22= Se usan datos específicos válvula cerrada después = 1/(2x12x10) de la planta. de una prueba de la = 4,2x10-3 Falla por aislamiento de Una las válvulas. falla al dejar la No se usan. bomba, por subsistema. Falla de las boquillas. No hay experiencias 1x10-5/demanda = 1x10 /demanda anteriores. Tres fallas en las pruebas Diesel mensuales. horas Se usa dato genérico -5 Falla en el generador 40 BI1 = BI2 = 3x10-2/demanda 3/(12x10) = Datos específicos de la 2,5x10 /demanda planta se usan para falla -2 para su 3x10-3/hora por corrida reparación por año. en la demanda. Se supone 3x10-3/hora GD = 2,5x10 + 3x10 x40 10 años de experiencia. = 0,145 Genérico -2 -3 para el funcionamiento. Pérdida de potencia No hay experiencia. 0,1/año exterior. PPE = 0,1x10/8760 = 1,1x10 /demanda -4 Asuma 10 horas de operación para extinguir el fuego y uso de dato genérico. Falla del detector. No hay experiencia. No disponibilidad de datos. MAA = 1x10 -4 Esta estimación está basada en el juicio de un experto. Tabla 7.1: Datos para evaluación del APR. DATOS PARA LA EVALUACIÒN DEL APR Evento de falla Experiencia en la planta Falla del operador en la No hay experiencia. partida de la bomba 2. Dato genérico Uso de método THERP Probabilidad usada Comentarios OP1 = 1x10-2 Uso del método THERP OP2 = 1x10-3 Este dato está basado en para tareas de esta clase, se sugiere 1x10-2 Falla del operador en No hay experiencia. 1x10-3 llamar a los bomberos. experiencias similares de no respuesta. Se usa dato genérico. Respuesta atrasada o no hay respuesta departamento No hay experiencia. 1x10-4 LFD = 1x10-4 Esto está basado en casos del similares del cuerpo de de bomberos. Atrasos o no bomberos. llegada se debe accidentes, problemas a tráfico, de comuni- cación, etc. Estanque con fallas. No hay experiencia. 1x10-5 T = 1x10-5 Esto está basado en datos de ruptura del estanque o contenido de agua insuficiente. Tabla 7.1 (cont): datos para evaluación del APR. Nota: en general, la probabilidad de causas comunes de fallas entre k elementos específicos en un grupo compuesto por m elementos, tal que se cumple 1≤ k ≤ m, se puede calcular a través del modelo que relaciona los parámetros de la probabilidad total Qt y la relación entre la tasa de fallas debido a causas comunes y tasa de fallas independientes β, como sigue: Qk = (1 – β)Qt k=1 0 1< k < m βQt k=m Método THERP (Technique for Human Error Rate Prediction), un sistema convencional de análisis de confiabilidad modificado para cuantificar posibles errores humanos. En vez de generar diferentes estados en un equipo, THERP reproduce posibles actividades humanas y su correspondiente posibilidad de error humano. Para mayores detalles consultar Swain, A.D. and H.E. Guttman (1983), “Handbook of human Reliability Analysis with EMPSIS on Nuclear Power Applications”, U.S. Nuclear Regulatory Commission, NUREG/CR-1278, Washington D.C. 5. Cuantificación. Para calcular la frecuencia de cada escenario definido en la figura 7.9, se determina la probabilidad de cada escenario basado en la probabilidad de cada evento integrante del árbol de fallas. Para el árbol de eventos los tres escenarios a evaluar serán: Escenario1 = F x (PEL) funciona Escenario2 = F x (PEL) falla x (PLF) funciona Escenario3 = F x (PEL) falla x (PLF) falla El proceso se muestra en la figura 7.9. Figura 7.9: árbol de eventos valorado. 6. Consecuencias. En el desarrollo del escenario y la cuantificación de las tareas, se identifican tres escenarios distintos de interés, cada uno con distintas salidas y frecuencias. La consecuencia asociada con cada escenario se especifica en términos de las pérdidas económicas y/o humanas. Esta parte del análisis es una de las más difíciles por diferentes razones: 1) Cada escenario posee peligros y formas de exposición diferentes al peligro, y requieren de cuidadosos monitoreos. En este caso, el modelo debería incluir como el fuego se propaga a través de la planta, como la gente se puede exponer, procedimiento de evacuación, disponibilidad de ropa protectora, etc. 2) La salida del escenario puede ser medida en término de pérdidas humanas. También puede ser medida como pérdidas financieras. Esto involucra asignar valores a la vida humana o a los accidentes, lo cual es fuente de controversias. El bajo valor asignado al riesgo indica que el riesgo del fuego no es importante en esta planta. Sin embargo, los escenario 1 y 2 son significativamente más importantes que el escenario 3. Entonces, si el riesgo fuese alto, uno podría mejorar estos componentes o eventos, que tengan una mayor contribución al escenario 1 y 2. El escenario 1 es debido principalmente a la falla común entre las bombas 1 y 2, así reduciendo esta probabilidad de falla se puede analizar una fuente potencial del mejoramiento. 7. Cálculo del riesgo y evaluación. Usando los valores de la figura 7.9, se puede calcular el riesgo asociado con cada escenario: Escenario número Consecuencia económica 1 $1.000.000 2 $92.000.000 3 $210.000.000 El riesgo se muestra en la tabla 7.2: Escenario número Riesgo del escenario 1 7,1x10-5x$1.000.000 = $71,3 2 8,5x10-8x$92.000.000 = $7,8 3 8,5x10-19x$210.000.000 = $0,0 Tabla 7.2: Riesgos valorados para cada escenario. Ya que el análisis muestra que el riesgo debido al fuego es más bien bajo, no es importante realizar un análisis de incertezas. CONCLUSION. Controlar el riesgo también es parte integral del mantenimiento ya que situaciones inseguras y sus posibles efectos afectan negativamente, cuando estas se convierten finalmente en accidentes. Redundan sobre el personal en forma dramática disminuyendo su rendimiento y sobre los bienes deteriorándolos. Un análisis detallado como el mostrado puede ser una gran salvaguarda a situaciones no deseadas.