Universidad Autónoma Metropolitana-Iztapalapa División de Ciencias Básicas e Ingenierı́a La Estadı́stica en el Mantenimiento y Reemplazo Óptimo en el Control de Calidad Tesis Que para obtener el grado de: Maestro en Ciencias (Matemáticas Aplicadas e Industriales) Presenta Raquel Vergara Lazcano Asesor Dr. Alberto Castillo Morales México D.F., Febrero 2014 iv Dedicatoria Con todo cariño, a mi familia. v Agradecimientos En primer lugar quiero agradecer a mi asesor, el Dr. Alberto Castillo Morales por haberme brindado la oportunidad de realizar esta tesis. Agradezco su continuo apoyo y el esfuerzo que ha realizado para que este trabajo se pudiera concluir. También agradezco a mis sinodales, por sus aportaciones realizadas para mejorar y complementar este trabajo. vii Índice general Dedicatoria III Agradecimientos V Objetivos 1 Introducción 3 1. Conceptos básicos de confiabilidad 1.1. Definiciones preliminares . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1. Función de densidad de probabilidad . . . . . . . . . . . . . . 1.1.2. Función de distribución acumulada . . . . . . . . . . . . . . . 1.1.3. Función de confiabilidad . . . . . . . . . . . . . . . . . . . . . 1.1.4. La tasa de falla . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.5. Tasa de falla acumulada . . . . . . . . . . . . . . . . . . . . . 1.1.6. El valor medio de los tiempos de falla . . . . . . . . . . . . . . 1.1.7. Tasa de fallo promedio . . . . . . . . . . . . . . . . . . . . . . 1.1.8. El p-cuantil . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.9. Estadı́sticos de orden . . . . . . . . . . . . . . . . . . . . . . . 1.2. Relaciones y equivalencias . . . . . . . . . . . . . . . . . . . . . . . . 1.3. Modelos de distribución en Confiabilidad . . . . . . . . . . . . . . . . 1.3.1. Distribución Exponencial . . . . . . . . . . . . . . . . . . . . . 1.3.2. Distribución Weibull . . . . . . . . . . . . . . . . . . . . . . . 1.3.3. Distribución Normal . . . . . . . . . . . . . . . . . . . . . . . 1.3.4. Distribución Lognormal . . . . . . . . . . . . . . . . . . . . . 1.4. Censura de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5. Estimación de parámetros por método de Máxima Verosimilitud (MV) 1.5.1. Estimación del parámetro de la distribución Exponencial . . . 1.6. Estimación no paramétrica . . . . . . . . . . . . . . . . . . . . . . . . ix 5 5 5 6 6 7 9 9 10 11 12 12 13 13 15 16 20 22 23 24 26 x 1.6.1. Estimación de la función de distribución en caso de observaciones completas . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.2. Estimación de la función de confiabilidad en caso de observaciones censuradas. . . . . . . . . . . . . . . . . . . . . . . . . . 1.7. Estimación de parámetros mediante linealización de la función de distribución. . . . . . . . . . . . . . . . 1.8. Modelos de vida acelerada . . . . . . . . . . . . . . . . . . . . . . . . 1.8.1. Distribución del tiempo de falla, bajo vida acelerada . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8.2. Modelo de Arrhenius . . . . . . . . . . . . . . . . . . . . . . . 1.8.3. Modelo de Eyring . . . . . . . . . . . . . . . . . . . . . . . . . 1.8.4. Ley de la Potencia Inversa . . . . . . . . . . . . . . . . . . . . 26 27 29 34 34 37 39 40 2. Mantenimiento 43 2.1. Tipos de Mantenimiento . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.2. Mantenimiento Correctivo . . . . . . . . . . . . . . . . . . . . . . . . 44 2.3. Mantenimiento Preventivo . . . . . . . . . . . . . . . . . . . . . . . . 45 2.4. Función de densidad de fallo que resulta cuando se practican acciones de mantenimiento preventivo . . . . . . . . . . . . . . . . . . . . . . . 46 2.5. Función de Mantenibilidad . . . . . . . . . . . . . . . . . . . . . . . . 51 3. Modelos Matemáticos de Polı́ticas Óptimas de Mantenimiento tiempos de reparación instantáneos 3.1. Polı́tica I. Mantenimiento Basado en la Edad . . . . . . . . . . . . 3.2. Polı́tica II. Mantenimiento preventivo a intervalos constantes . . . 3.3. Aplicación a un caso real . . . . . . . . . . . . . . . . . . . . . . . con 55 . . 56 . . 61 . . 66 4. Polı́ticas óptimas de mantenimiento preventivo para sistemas con varios componentes. 4.1. Confiabilidad de sistemas en serie . . . . . . . . . . . . . . . . . . . . 4.1.1. Tasa de falla del sistema . . . . . . . . . . . . . . . . . . . . . 4.1.2. Sistema en serie con componentes de distribución exponencial 4.2. Polı́tica de reemplazo por edad para un sistema en serie . . . . . . . . 4.3. Polı́tica de reemplazo a intervalos constantes para un sistema en serie 4.4. Confiabilidad de sistemas en paralelo . . . . . . . . . . . . . . . . . . 4.4.1. Sistema en paralelo con componentes de distribución exponencial 4.5. Polı́tica de reemplazo por edad para un sistema en paralelo . . . . . . 4.6. Polı́tica de reemplazo a intervalos constantes para un sistema en paralelo 4.7. Sistemas Mixtos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.8. Mantenimiento Oportunista para Sistemas en Serie . . . . . . . . . . 4.8.1. Descripción del Sistema . . . . . . . . . . . . . . . . . . . . . 4.8.2. Estructura de costos . . . . . . . . . . . . . . . . . . . . . . . 73 74 75 76 77 80 81 83 85 87 88 92 93 93 xi 4.8.3. Descripción del modelo . . . . . . . . . . . . . . . . . . . . . . 95 4.9. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 xii Objetivos Objetivos generales El objetivo general de esta tesis es presentar y realizar los análisis estadı́sticos correspondientes a los tiempos falla de un sistema con uno o más componentes, para poder realizar una adecuada planeación de los tiempos en los cuales se debe efectuar el mantenimiento preventivo de los componentes del sistema. Para lograr esto último, se van a aplicar distintas polı́ticas de mantenimiento preventivo: Mantenimiento Basado en la Edad, Mantenimiento a Intervalos Constantes y Mantenimiento Oportunista para sistemas en serie. Estas tres polı́ticas tienen por objetivo determinar el intervalo de reemplazo óptimo de los componentes de un sistema a fin de minimizar los costos totales asociados al mantenimiento. Objetivos particulares Los objetivos particulares de la tesis son los siguientes: Realizar un estudio de los modelos más usados que se ajustan a la distribución de los tiempos de falla, y a partir de cada uno éstos medir algunas de las funciones básicas del área de Confiabilidad como son: función de confiabilidad, tasa de falla y tiempo medio entre fallas. Estudiar los procedimientos que permitan realizar una estimación paramétrica de la función de confiabilidad a partir de una muestra dada, independientemente de si los datos de la muestra estén completos o presenten algún tipo de censura. Estudiar los procedimientos a partir de los cuales se puede realizar una estimación no paramétrica de la función de confiabilidad tanto para observaciones completas como para observaciones censuradas por la derecha. Estudiar la función de densidad de falla que resulta cuando se efectúan actividades de mantenimiento preventivo en intervalos periódicos. 1 2 Estudiar las funciones básicas del área de confiabilidad para sistemas con más de dos componentes, ya sea que se trate de una configuración en serie, paralela o mixta. Estudiar las polı́ticas de mantenimiento preventivo de los elementos de un sistema: Mantenimiento Basado en la Edad, Mantenimiento a Intervalos Constantes y Mantenimiento Oportunista para Sistemas en Serie. Introducción Hoy en dı́a, el rápido avance tecnológico, el desarrollo de productos altamente sofisticados, el incremento de las perspectivas del consumidor y la intensa competencia global, han obligado a las empresas a mejorar la calidad de sus productos o servicios. Pero, ¿qué significa calidad? Calidad significa cumplir con los requerimientos especificados en un producto o servicio, para satisfacer las necesidades del cliente. También se puede entender como las propiedades de una cosa que permiten apreciarla como igual, mejor o peor que cualquier otra de su misma especie. Sin embargo, cada vez es más importante la extensión de la calidad en el tiempo de uso del producto o servicio, y es aquı́ donde aparece el concepto de confiabilidad. La confiabilidad intenta garantizar que el producto realizará adecuadamente su función durante un periodo razonable de tiempo. Todo usuario sabe que independientemente de la perfección del diseño de un sistema, de la tecnologı́a de su producción o de los materiales usados en su fabricación, a lo largo de su operación se producirán cambios irreversibles, producto del desgaste u obsolescencia de los materiales. La desviación de esas caracterı́sticas respecto a los valores especificados es lo que se considera como falla del sistema. Por consiguiente, la falla del sistema se puede definir como un suceso cuya realización provoca, ya sea la pérdida de capacidad para realizar las funciones requeridas, o bien la pérdida de capacidad para satisfacer los requisitos especificados. Hay muchos sistemas para los cuales se puede recuperar capacidad de funcionamiento y se les denomina sistemas recuperables. Para que un sistema recupere la capacidad de realizar una función es necesario realizar ciertas actividades, conocidas como actividades de mantenimiento. Existen distintos tipos de mantenimiento: correctivo, preventivo, proactivo y mantenimiento basado en la condición; éste último ayuda a predecir la falla de un sistema a través del monitoreo de ciertas caracterı́sticas del sistema. 3 4 En esta tesis sólo se estudiarán el mantenimiento correctivo y preventivo, los cuales en conjunto ayudarán a predecir un intervalo de mantenimiento preventivo óptimo para una unidad o sistema. En el Capı́tulo 1, se inicia con un estudio de los conceptos básicos del área de Confiabilidad Estadı́stica como son: función de confiabilidad, tasa de falla y tiempo medio para la falla; se definen cada uno de éstos para algunos de los modelos de distribución de tiempos a la falla: distribución Exponencial, distribución Weibull, distribución Normal y distribución Lognormal. Se realiza un estudio de la estimación de parámetros por Método de Máxima Verosimilitud, ası́ como de la estimación no paramétrica, tanto para observaciones completas, como para observaciones censuradas. También se presentan algunos de los modelos de vida acelerada como son: Modelo de Arrhenius, Modelo de Eyring y Modelo de la Potencia Inversa. El Capı́tulo 2 trata cuestiones relacionadas con el mantenimiento de un sistema. Se presentan las definiciones de los conceptos de mantenimiento correctivo y preventivo y se expone la función de densidad que resulta cuando se realizan actividades de mantenimiento preventivo. El Capı́tulo 3 se dedica al estudio de las polı́ticas de mantenimiento preventivo para un solo componente: reemplazo por edad y reemplazo a intervalo constantes. Estas polı́ticas indican el intervalo de tiempo óptimo para llevar a cabo el reemplazo o mantenimiento periódico de un cierto componente al menor costo. Se presentan algunos ejemplos que ayudarán a comprender cada una de las polı́ticas. En lo que se refiere al Capı́tulo 4, se presentan los conceptos de confiabilidad para las distintas configuraciones de un sistema: sistema en serie, sistema en paralelo y sistema mixto. Nuevamente se exponen las polı́ticas de mantenimiento preventivo que se estudiaron en el caso de un solo componente, pero ahora en el caso de un sistema con múltiples componentes, considerando que éstos forman parte de alguna de las configuraciones que se mencionaron anteriormente. En esta parte, las polı́ticas de mantenimiento indicarán el intervalo de tiempo para reemplazar todos los componentes del sistema. Este último enfoque presenta desventajas económicas, sobre todo cuando el sistema está formado por componentes con distintas tasas de falla, pues se realizará el reemplazo de componentes que aún continúan funcionando. Una alternativa a este método es la polı́tica de mantenimiento oportunista, la cual considera la falla de un sistema como una oportunidad para realizar el reemplazo preventivo de los componentes que no fallaron en ese momento. El objetivo de ésta es indicar cuándo y qué componentes de un sistema reemplazar a fin de minimizar los costos totales de mantenimiento. Al final del Capı́tulo 4 se presenta la polı́tica de mantenimiento oportunista para un sistema en serie con dos componentes. Capı́tulo 1 Conceptos básicos de confiabilidad En este primer capı́tulo se presentan los conceptos básicos utilizados en el análisis de confiabilidad, ası́ como algunos de los modelos de distribución utilizados para modelar tiempos a la falla. 1.1. Definiciones preliminares Se dice que una falla ocurre cuando un componente o unidad deja de funcionar como es requerido. Considérese a T como una variable aleatoria que representa el tiempo a la falla de un componente o sistema, la cual toma valores en el intervalo [0, +∞); ésta puede ser tiempo real, número de horas de vuelo, número de ciclos de operación, etc. 1.1.1. Función de densidad de probabilidad La función de densidad f de la variable aleatoria T se define como la probabilidad que tiene un componente de fallar en un instante t. Para esta función continua se cumple que: f (t) ≥ 0, ∀t ∈ [0, +∞) R∞ f (t) dt = 1 0 6 1.1.2. Función de distribución acumulada La función de distribución acumulada F de la variable aleatoria T , representa la probabilidad acumulada de fallo hasta el tiempo t, es decir F (t) = P (T ≤ t), ∀t ∈ [0, +∞) La función F (·) es una función continua y monótona no decreciente, para la cual se verifica que lı́mt→−∞ F (t) = 0 lı́mt→∞ F (t) = 1 A partir de la función de distribución F (t), se puede definir la función de densidad f (t) como d f (t) = F 0 (t) = F (t). dt 1.1.3. Función de confiabilidad La confiabilidad se define como la probabilidad de que una unidad o componente realice la función para la cual fue diseñado, bajo ciertas condiciones de uso especificadas, por un periodo de tiempo determinado. Las condiciones de uso son importantes para definir la confiabilidad, por ejemplo: no duran los mismo unos neumáticos si se usan en autopista, que si se usan en un camino rural. La función de confiabilidad R(t), es la probabilidad de que la variable aleatoria T sea mayor a t: Z ∞ R(t) = P (T > t) = f (u) du = 1 − F (t), ∀t ∈ [0, +∞) t Esta función es continua y monótona decreciente. Para ésta se cumple que: R(0) = 1 R(∞) = lı́mt→∞ (1 − F (t)) = 0 7 Por su definición, la función de confiabilidad se utiliza en otras disciplinas tales como: Medicina, Actuarı́a o Finanzas en las que se realizan análisis de supervivencia. En estas disciplinas, la función de confiabilidad se conoce como función de supervivencia. Dentro de las finanzas, el análisis de supervivencia tiene aplicaciones en diversas áreas, en particular en la de seguros, ya sean de vida, de autos, de casas o de desempleo. Por ejemplo, para calcular el monto las primas de seguros de vida es importante realizar un estudio de las tasas de mortalidad de los asegurados. Entre otros estudios, se analiza la probabilidad de muerte en las diferentes edades dadas ciertas condiciones de salud; a partir de este análisis, es fácil calcular la probabilidad de que el asegurado fallezca durante la vigencia de la póliza del seguro de vida. 1.1.4. La tasa de falla Otra de las funciones importantes para modelar tiempos a la falla es la función de riesgo o tasa de falla h(t). Esta función representa la probabilidad instantánea, por unidad de tiempo, que tiene un componente de fallar en un instante t, dado que habı́a funcionado hasta el instante anterior. Analı́ticamente se expresa por la razón: h(t) = f (t) R(t) (1.1) siempre que R(t) 6= 0. Esta razón se puede interpretar como la proporción de fallas en el instante t relativo sólo a los componentes que no han fallado hasta ese instante. A diferencia de esta función, la función de densidad f (t) representa la proporción de fallas en el instante t, pero respecto al total de la muestra. La tasa de falla se obtiene a partir del lı́mite, cuando ∆t → 0, de la probabilidad condicionada de que el componente falle antes del tiempo t + ∆t, dado que habı́a 8 funcionado hasta el instante t. De esta forma h(t) = = = = = P (t < T ≤ t + ∆t|T > t) ∆t→0 ∆t P (t < T ≤ t + ∆t, T > t)/P (T > t) lı́m ∆t→0 ∆t P (t < T ≤ t + ∆t) lı́m ∆t→0 ∆tP (T > t) F (t + ∆t) − F (t) 1 lı́m R(t) ∆t→0 ∆t f (t) R(t) lı́m Figura 1.1: Curva de la Bañera Los expertos de confiabilidad, en algunos casos, utilizan la curva de la bañera para describir el comportamiento de la tasa de falla en los componentes o sistemas [?]. En la Figura 1.1 se muestra la gráfica de la función que caracteriza la tasa de falla a través del tiempo. Se muestran tres zonas: zona infantil, zona de vida útil y zona de desgaste. En la primer zona, de corta duración, se puede apreciar una tasa de falla alta pero decreciente, se observa en componentes cuya probabilidad de fallo es menor a medida que aumenta el tiempo. Aquı́ las fallas aparecen inmediatamente 9 y al cabo de poco tiempo de poner en funcionamiento el sistema; la mayorı́a de las veces, como consecuencia de defectos de fabricación. En la segunda zona se observa una tasa de falla constante; esta indica que la probabilidad de falla instantánea es la misma en cualquier momento, es decir, el proceso no tiene memoria, ya que la posibilidad de falla estando funcionando es idéntica en cualquier momento de la vida del sistema. Las fallas en esta zona son originadas por causas inexplicables y fenómenos naturales imprevistos. En la zona de desgaste se observa una tasa de falla creciente. Ésta se presenta en la mayorı́a de los casos por desgastes u obsolescencia del ı́tem, es decir, por un proceso de envejecimiento. La tasa de falla creciente en la zona de desgaste indica que la probabilidad de falla instantánea, teniendo en cuenta que el componente está funcionando, se incrementa a medida que aumenta el tiempo. 1.1.5. Tasa de falla acumulada Una vez definida la tasa de falla, se define la tasa de falla acumulada H(t), que como su nombre lo indica, acumula la tasa de falla a lo largo del tiempo. Z t H(t) = h(u) du. 0 1.1.6. El valor medio de los tiempos de falla Se pueden considerar dos situciones, dependiendo de la unidad o dispositivo que se trate. Si se considera un dispositivo o sistema el cual una vez que falla es restaurado a su estado de funcionamiento, se define el tiempo medio entre falla, en inglés M T BF (Medium Time Between Failure). Matemáticamente se tiene Z ∞ M T BF = tf (t) dt 0 El M T BF también se puede expresar en términos de la función de confiabilidad, Z M T BF = ∞ R(t) dt 0 (1.2) 10 Demostración Realizamos integración por partes en Hacemos R∞ tf (t) dt 0 u = t dv = f (t)dt du = dt v = −R(t) Entonces queda que Z ∞ M T BF = tf (t) dt 0 = −tR(t)|∞ 0 Z + ∞ R(t) dt 0 Para el primer término de la última igualdad, se tiene que tR(t) es cero cuando t = 0, de ahı́ que sólo nos queda por evaluar tR(t) cuando t = ∞, de lo cual resulta el siguiente lı́mite lı́m tR(t) t→∞ Como el anterior es un lı́mite indeterminado, usamos la Ley de L’Hopital, para tener 1 t = lı́m t→∞ R(t)−2 f (t) t→∞ R(t)−1 R(t) = lı́m t→∞ h(t) lı́m Siendo h(t) = f (t) R(t) El valor del último lı́mite es nulo siempre que h(t) no sea cero. El hecho de que se tenga que para un componente o sistema que está funcionando el lı́mt→∞ h(t) = 0, nos conduce a pensar que el valor de la tasa de falla tiende cada vez más a cero, lo cual significarı́a que el componente o sistema se perfecciona a medida que pasa el tiempo, cosa que no sucede. En otras palabras, el sistema debe fallar después de una cantidad finita de tiempo funcionando. Por este motivo se deduce que lı́mt→∞ h(t) 6= 0. Finalmente Z ∞ Z tf (t) dt = 0 ∞ R(t) dt 0 En el otro caso, si el dispositivo no es reparado una vez que falla, como es el caso de un foco, es usual definir el tiempo medio para la falla, en inglés M T T F (Medium 11 Time To Failure). Al igual que el M T BF , si Rsr (t) indica la confiabilidad del sistema que es no restaurado una vez que falla, se puede escribir Z ∞ Rsr (t) dt MT T F = 0 1.1.7. Tasa de fallo promedio Otra definición de gran interés es la tasa de fallo promedio entre los instantes t1 y t2 , que denotaremos por AF R(t1 , t2 ), R t2 h(u) du AF R(t1 , t2 ) = t1 t2 − t1 1.1.8. El p-cuantil El p-cuantil de la distribución de la variable aleatoria T es el valor tp de la variable que separa una probabilidad acumulada p a la izquierda. De este modo, el p-cuantil tp verifica que P (T ≤ tp ) = p Luego, si F es la función de distribución de la variable aleatoria, el p-cuantil se obtiene como solución de la ecuación F (tp ) = p Es decir, tp = F −1 (p), donde F −1 es la función inversa de F . En la práctica es de gran interés el tiempo de falla mediano t0.5 , que es el menor punto donde la función de distribución acumulada alcanza el valor de 0.5. Ejemplo 1.1.1. Calcular el tiempo de falla mediano, suponiendo que el tiempo de falla es modelado por la distribución exponencial, cuya función de distribución es F (t) = 1 − exp(−λt), t ≥ 0, λ > 0. Queremos encontrar el valor de t0.5 para el cual se verifica que 12 1 − exp(−λt0.5 ) = 0.5 exp(−λt0.5 ) = 0.5 −λt0.5 = ln(0.5) ln 2 t0.5 = λ ln 2 Observe que el tiempo de falla mediano, t0.5 = , que indica que el 50 % de λ los componentes habrán fallado cuando se alcanza este valor, es menor que el co1 rrespondiente M T T F , que es . Para este último valor se tiene que la distribución λ acumulada, es decir, F (M T T F ) = 1−e−1 ≈ 0.632, lo cual significa que aproximadamente el 63.2 % de los componentes habrán fallado cuando se alcanza el M T T F. 1.1.9. Estadı́sticos de orden En algunos estudios, como los ensayos de vida, en los que se analiza el tiempo de falla o duración de ciertos componentes, los datos correspondientes a los tiempos de falla de un conjunto de componentes son más relevantes si se presentan en un orden no decreciente. De esta forma, si t(1) ≤ t(2) ≤ t(n) representa la muestra t1 , t2 , ..., tn ordenada de menor a mayor, entonces t(k) es el estadı́stico de orden k − ésimo. A los estadı́sticos t(1) y t(n) se les llama mı́nimo y máximo respectivamente. 1.2. Relaciones y equivalencias De las funciones que se definieron anteriormente, se pueden establecer las siguientes relaciones. 1. Relación entre la función de densidad, función de distribución y función de 13 confiabilidad. d F (t) dt d f (t) = (1 − R(t)) dt f (t) = −R0 (t) f (t) = (1.3) (1.4) (1.5) 2. Relación entre tasa de falla y función de confiabilidad R0 (t) R(t) d = − ln R(t) dt h(t) = − (1.6) (1.7) 3. Relación entre tasa de falla acumulada y función de confiabilidad. Z t H(t) = h(u) du 0 Z t d − ln R(u) du 0 du = − ln R(t) = Por tanto Rt R(t) = e− 0 h(u) du = e−H(t) 4. Relación entre función de densidad y tasa de falla Rt f (t) = h(t)e− 0 h(u) du = h(t)e−H(t) = h(t)R(t) La importancia de conocer las relaciones y equivalencias entre las funciones f , h, F y R, se deriva del hecho de que si sólo se conoce una de estas funciones, se pueden deducir cualesquiera de las otras. 14 1.3. Modelos de distribución en Confiabilidad En la literatura se consideran los modelos que mejor han ajustado en los problemas de confiabilidad. Éstos coinciden con los modelos de tiempo de vida en el Análisis de Supervivencia. 1.3.1. Distribución Exponencial Esta distribución es utilizada para modelar tiempos de falla que presentan una tasa de falla constante, es decir, que la probabilidad de fallo, condicionada a que el elemento o componente esté en uso no varı́a con el tiempo. Los sistemas electrónicos como por ejemplo, sistemas de generación de estados de cuenta bancarios y cajeros automáticos son sistemas cuyos tiempos de falla se modelan con esta distribución. Función de densidad t ≥ 0, λ > 0 f (t) = λ exp(−λt), Función de distribución F (t) = 1 − exp(−λt), t ≥ 0, λ > 0 Función de confiabilidad R(t) = exp(−λt), t ≥ 0, λ > 0 Tasa de falla h(t) = λ, t > 0 Tiempo medio entre falla(MTBF) M T BF = 1 λ Función p-cuantil tp = − ln(1 − p) λ 15 Figura 1.2: Función de confiabilidad de la distribución Exponencial con λ = 0.5, 1 Figura 1.3: Tasa de falla de la distribución Exponencial, λ = 0.5, 1 1.3.2. Distribución Weibull Esta distribución es utilizada para modelar tiempos de falla que presentan una tasa de falla que no es constante. Ahora ésta se define a partir de dos parámetros λ, 16 que es el parámetro de escala y β, el parámetro de forma. Según sean los valores del parámetro β, esta distribución puede presentar tasas de falla crecientes, decrecientes o constantes. Por ejemplo: Cuando β = 1, se tiene el caso del modelo exponencial, que tiene una tasa de falla constante. Cuando β > 1, se tiene una tasa de falla creciente. Cuando β < 1, se tiene una tasa de falla decreciente. Función de densidad f (t) = λβ(λt)β−1 exp(−λt)β , t ≥ 0, λ > 0, β > 0 Función de distribución F (t) = 1 − exp(−λt)β Función de confiabilidad R(t) = exp(−λt)β Figura 1.4: Función de confiabilidad de la distribución Weibull λ = 1, β = 0.5, 1.5. 17 Tasa de falla h(t) = λβ(λt)β−1 Figura 1.5: Tasa de falla de la distribución Weibull con λ = 1, β = 0.5, 1.5. Función p-cuantil tp = 1 1 (− ln(1 − p)) β λ Tiempo medio entre falla (MTBF) M T BF = donde Γ(x) = Γ(n) = (n − 1)! R∞ 0 1 1 Γ(1 + ) λ β tx−1 e−t dt. Se define Γ(x) = (x − 1)Γ(x − 1) y para n entero 1.3.3. Distribución Normal La distribución normal es una de las distribuciones más utilizadas, debido a que puede representar muchos fenómenos de la vida cotidiana. Esta distribución se define a partir de dos parámetros, la media µ que indica la tendencia central de un conjunto de datos, y la desviación estándar σ que cuantifica el grado de dispersión de los datos 18 respecto de la media. En el área de ingenierı́a esta distribución es utilizada para construir Gráficas de Control de Procesos, las cuales fueron desarrollados por Shewhart (1931). Una gráfica de control es un gráfico en el cual se representan los valores de algún tipo de medición realizada durante el funcionamiento de un proceso continuo, para detectar causas no naturales de variación en el proceso. Se puede decir, que para todo proceso en el que sólo existe variación inherente o no causada los resultados siguen las caracterı́sticas de una distribución normal. Es decir, aproximadamente el 67 % de los resultados van a encontrarse dentro del intervalo ±1s donde s es la desviación estándar muestral. Aproximadamente el 95 % de los resultados se encuentran dentro del intervalo ±2s y aproximadamente el 99 % de los resultados se encuentran dentro del intervalo ±3s. Figura 1.6: Lı́mites control y su relación con la distribución normal. La gráfica de control consiste en: una lı́nea central LC y dos pares de lı́neas lı́mite espaciadas por encima y por debajo de la lı́nea central, que se denominan Lı́mite de Control Inferior LCI y Lı́mite de Control Superior LCS. Éstos se establecen de tal manera que los valores situados entre los lı́mites puedan atribuirse a la dispersión inherente del proceso, mientras que los que caigan fuera puedan interpretarse como una carencia de control del proceso. Si todos los puntos caen dentro de los lı́mites de control, pero se observan tendencias, entonces también el proceso está fuera de control. En el siguiente ejemplo se presenta la construcción de una gráfica de control para medias X y rangos R, el cual se utiliza para controlar los dos parámetros básicos de un proceso: la media y la variación. El rango R, se define como la diferencia entre los valores máximo y mı́nimo de un conjunto de datos. 19 Para construir la gráfica se deben estimar la media y la desviación estándar. En la práctica el rango se utiliza como medida de dispersión. Los lı́mites de control, que se establecen a 3 desviaciones estándar, y la lı́nea central son: Para gráfica de medias: LCI = X + A2 R LC = X LCS = X − A2 R Para la gráfica de rangos: LCI=D4 R LC=R LCS=D4 R Donde X = n X i=1 X i, R = n X Ri y n es el número de muestras. Los valores A2 y i=1 D4 [1] son constantes que dependen del tamaño de la muestra. Se recomienda utilizar un tamaño de muestra igual a 5 y un número de muestras no menor a 25. Ejemplo 1.3.1. Una empresa de alimentos se dedica a la fabricación de mermeladas. La mermelada se vende en frascos de 200 gramos. El equipo de control de calidad supervisa el estado de control del proceso, para ello, se extraen cinco frascos de la lı́nea de producción en intervalos de 10 minutos registrando el peso. En el siguiente cuadro se muestran los valores obtenidos para la media y rango de cada una de las 25 muestras que se observaron. 20 No. muestra 1 2 3 4 5 6 7 8 9 10 11 12 13 X R 200.80 6.00 202.00 6.00 203.00 7.00 200.60 2.00 200.20 11.00 202.80 8.00 200.40 4.00 204.40 4.00 203.40 6.00 202.60 5.00 201.00 4.00 203.00 7.00 203.60 1.00 No. muestra 14 15 17 17 18 19 20 21 22 22 24 25 - X R 208.80 198.60 206.40 203.20 200.80 203.80 204.80 204.20 205.60 204.60 203.60 203.00 - 10.00 11.00 4.00 5.00 8.00 4.00 6.00 9.00 2.00 5.00 5.00 4.00 - Para n = 5 A2 = 0.58 y D4 = 2.11 Figura 1.7: Gráfica de Control X − R En la Figura 1.7 se observan las gráficas de control tanto para medias como para los rangos. En la primera gráfica, la gráfica de medias, se puede observar que dos valores se encuentran fuera de los lı́mites de control, uno por encima del lı́mite superior y otro por debajo del lı́mite inferior, los cuales corresponden a las muestras 14 y 15. Esto es indicio de que el proceso se encuentra fuera de control, es decir, que además de la variación natural, existe variación causada. En lo que se refiere a la gráfica de rangos, se puede observar que la variabilidad del proceso permanece 21 estable, pues ninguno de los puntos de encuentra fuera de los lı́mites de control. En lo que sigue se presentan las diferentes funciones que caracterizan la distribución Normal. Función de densidad 1 1 f (t) = √ exp − 2 σ 2π t−µ σ 2 ! , −∞ < t < ∞, µ ≥ 0, σ > 0 Función de distribución Z t F (t) = f (x) dx = Φ −∞ t−µ σ Donde Φ es la función de distribución normal estándar, cuyos parámetro son µ = 0 y σ = 1. Función de confiabilidad Z R(t) = t ∞ 1 1 √ exp − 2 σ 2π t−µ σ 2 ! dx = 1 − Φ t−µ σ Tiempo medio entre falla (MTBF) M T BF = µ Función p-cuantil tp = µ + σΦ−1 (p) donde Φ−1 es la función inversa de la distribución normal estándar acumulada. 22 Figura 1.8: Función de confiabilidad de la distribución Normal, µ = 5, σ = 0.5, 1, 1.5 Figura 1.9: Tasa de falla de la distribución Normal, µ = 5, σ = 0.5, 1, 1.5 23 1.3.4. Distribución Lognormal La distribución Lognormal se relaciona con la distribución normal de la siguiente forma: si X es una variable aleatoria normal con media µ y desviación estándar σ, entonces la variable aleatoria Y = eX tiene una distribución lognormal con parámetros T50 = eµ y σ. Es decir, el logaritmo de una variable aleatoria lognormal cuyos parámetros son la mediana T50 = eµ y σ, tiene distribución N (µ, σ). La variable aleatoria T no asume valores iguales a cero ya que ln T no está definida para T = 0. La distribución Lognormal es útil es diversas áreas: en Confiabilidad se utiliza para modelar tiempos de reparación; en Medicina se utiliza para modelar el tiempo de supervivencia en pacientes con alguna enfermedad como cáncer y en Economı́a se usa para modelar la distribución personal de la renta y la distribución de ventas. Función de densidad 2 1 ln t − ln T50 1 , f (t) = √ exp − 2 σ σ 2π t > 0, µ ≥ 0, σ > 0 Función de distribución Z t F (t) = f (x) dx = Φ −∞ ln t − ln T50 σ Función de confiabilidad Z ∞ 1 1 (x − µ)2 ln t − ln T50 √ exp − R(t) = dx = 1 − Φ 2 σ σ σ 2π t Tiempo medio entre falla(MTBF) 2 σ2 σ M T BF = exp T50 + = T50 exp 2 2 24 Figura 1.10: Función de confiabilidad de la distribución Lognormal, µ = 0, σ = 0.5, 1, 1.5 Función p-cuantil tp = T50 exp(σΦ−1 (p)) Figura 1.11: Tasa de falla de la distribución Lognormal, µ = 0, σ = 0.25, 0.5, 1 25 1.4. Censura de datos Con frecuencia ocurre que los datos asociados a tiempos de falla presentan observaciones incompletas, es decir, no se conocen los tiempos de falla de algunas de las unidades de manera exacta. Para el análisis de los datos se incluye toda la información de las observaciones, aún de aquellas que pudieron perderse durante el estudio o cuya falla sucede después de haber finalizado el estudio. Por esta razón, los datos se pueden clasificar en dos categorı́as: completos y censurados. Una observación en el tiempo t es completa si representa el tiempo exacto en el que ocurrió la falla de la unidad. Si no se conocen los tiempos de falla de las unidades de manera exacta, sino sólo los intervalos de tiempo donde ocurrieron o pidieron haber ocurrido las fallas, se tienen datos censurados. Existen tres posibles casos de datos censurados: censurados por la derecha, por la izquierda y por intervalo. Censura por la derecha. Se presenta cuando sabemos que la falla ocurre en algún punto posterior al tiempo de duración del estudio u observación. Algunos tipos de censura por la derecha son: Censura tipo I (por tiempos). Se fija un tiempo determinado C para la duración del estudio, y sobre ese intervalo de tiempo se observan las fallas ocurridas. En este caso, C es una constante de censura prefijada por el analista para todas las unidades muestrales. Censura tipo II (por número de fallas). Se determina una cantidad r < n de fallas con las cuales concluirá el estudio, n es el número de unidades en observación. Es importante señalar que los valores de censura C y r se fijan antes de iniciar el estudio y no durante el transcurso del mismo. Censura por la izquierda Este tipo de censura resulta cuando se sabe que el tiempo exacto de la falla de una unidad ocurrió antes de un cierto tiempo. Por ejemplo, se puede conocer que cierta unidad falló antes de las 100 horas pero no se conoce exactamente cuándo. En otras palabras, tal unidad podrı́a haber fallado en algún tiempo entre 0 y 100 horas. Censura por intervalo Este tipo de censura ocurre cuando se sabe que el tiempo de falla ocurre dentro de un intervalo. Aquı́ el seguimiento de las unidades se realiza periódicamente y por tanto, 26 la falla sólo puede conocerse entre dos periodos de revisión. Por ejemplo, supongamos que una unidad se inspecciona cada 100 horas; si se inspecciona a las 100 horas y encontramos que está operando y luego al realizar otra inspección a las 200 horas encontramos que ésta ya no se encuentra funcionando, entonces solamente se sabe que la unidad falló en el intervalo 100 y 200 horas. 1.5. Estimación de parámetros por método de Máxima Verosimilitud (MV) Cuando se conoce la forma de la función de distribución del tiempo de falla es posible estimar los parámetros que la definen a partir de una muestra dada. Los estimadores más frecuentes son los de máxima verosimilitud. Un estimador de máxima verosimilitud del parámetro de una distribución se obtiene a partir de una muestra y es el valor del parámetro que da a la muestra la máxima probabilidad de ocurrencia. Supóngase que T1 , T2 , T3 , ..., Tn son variables aleatorias independientes e idénticamente distribuidas, las cuales representan los tiempos de falla t1 , t2 , ..., tn de n unidades. Sean f la función de densidad y θ = (θ1 , θ2 , ..., θn ) los parámetros a estimar. La función de verosimilitud se define como la función de probabilidad conjunta de las variables T1 , T2 , T3 , ..., Tn , evaluada en t1 , t2 , ..., tn . Si todas las observaciones ti son completas, la función de verosimilitud L va a estar dada por el producto de las densidades individuales evaluadas en cada observación, como a continuación se indica: Y L(θ) = f (ti ) i:n No obstante, hemos visto que las observaciones pueden estar incompletas, es decir, que pueden presentar algún tipo de censura. El caso más común es el de censura por la derecha, en este caso se supone que en el tiempo en el que se inician las observaciones, t = 0, los componentes se encuentran funcionando . Para poder caracterizar la función de verosimilitud para observaciones censuradas por la derecha, se define para cada unidad la función indicadora de censura en el tiempo vi como ( 1, si ti ≤ vi δi = 0, si ti > vi . 27 Es decir, si ti es una observación de tiempo de falla, δi = 1, y es una observación censurada si δi = 0 y en este caso se toma ti = vi como el último momento en que la unidad fue observada y seguı́a funcionando. De esta forma, se tiene que las observaciones estarán representadas por la parejas (ti , δi ). A partir de lo anterior, la función de verosimilitud para observaciones censuradas por la derecha va a estar dada por L(θ) = Y f (ti )δi R(ti )1−δi i:n Entonces, si la observación es completa contribuye a la función de verosimilitud con su función de densidad, y si es censurada, contribuye con su función de confiabilidad. Cuando las observaciones son censuradas por la izquierda la función de densidad se reemplaza por la función de distribución y el caso en el que existen observaciones censuradas por intervalo, la función de densidad se sustituye por la probabilidad de falla en ese intervalo. Finalmente, las estimaciones de los parámetros de la distribución se obtienen maximizando la función L(θ) [3]. 1.5.1. Estimación del parámetro de la distribución Exponencial Supongamos que se tienen t1 , t2 , t3 , ..., tn observaciones independientes de tiempos de falla con distribución exponencial, correspondientes a n componentes puestos a prueba. Supongamos además que de las n observaciones, n − r son observaciones censuradas por la derecha. Recordemos que la función de densidad de la distribución Exponencial está dada por f (t) = λ exp(−λt), siendo λ el parámetro a estimar. Dado que existen observaciones censuradas por la derecha, la función de verosimilitud queda expresada como: L(λ) = n Y i f (ti )δi R(T )1−δi = n Y i (λ exp(−λti ))δi (exp(−λti ))1−δi 28 Si el valor de censura es el mismo para las n unidades, digamos v y las primeras r observaciones son completas y las últimas n − r son censuradas en v entonces r= r X 1 i=1 Luego L(λ) = r Y λ exp(−λti ) (exp(−λv))n−r i Para hacer los cálculos más sencillos, tomamos el logaritmo natural de la función de verosimilitud L(λ). Recordemos que el logaritmo es una función monótona creciente, ası́ que, el máximo de L(λ) y de ln(L(λ)) se alcanzan en el mismo punto. ln(L(λ)) = r ln λ − λ r X ti − (n − r)(λv). i=1 Si derivamos respecto a λ obtenemos r r X ∂ ln(L(λ)) = − ti − (n − r)v ∂λ λ i=1 Finalmente si igualamos la derivada a cero tenemos r r X = ti − (n − r)v λ i=1 Por lo que un estimador para el parámetro λ es r . i=1 ti − (n − r)v λ̂ = Pr En esta última ecuación, si consideramos censura de tipo I, t1 , t2 , ..., tr son los tiempos de falla de las r unidades que fallaron antes de que finalizara la prueba, en el tiempo v. Por otro lado, si consideramos censura de tipo II, es decir, que la prueba termina hasta que se presenta el r-ésimo tiempo de falla, entonces v = tr y el estimador queda expresado como: r . i=1 ti − (n − r)tr λ̂ = Pr 29 1.6. Estimación no paramétrica Ahora se abordarán algunas técnicas no paramétricas que permitirán estimar ya sea la función de distribución F(t) o alternativamente la función de confiabilidad R(t) = 1 − F (t)) asociada a las observaciones, tanto para observaciones completas como para observaciones censuradas. 1.6.1. Estimación de la función de distribución en caso de observaciones completas Primero vamos a presentar la función que permite estimar la función de distribución para el caso en que ninguna de las observaciones es censurada. Sea T una variable aleatoria que representa el tiempo a la falla. Considérese una muestra de n dispositivos de los cuales se han observado los tiempos de falla t1 , t2 , ..., tn . A partir de los estadı́sticos de orden de la muestra t(1) < t(2) < ... < t(n) se define la función de distribución empı́rica de F como: 0, si 0 < t < t(1) F̂ (t) = ni , si t(i) ≤ t < t(i+1) , i = 1, 2, ..., n − 1 1, si t(n) ≤ t A partir de la expresión anterior podemos ver que el estimador para la función de distribución F̂ (t) se caracteriza por F̂ (t) = num.observaciones ≤ t n Es decir, F̂ (t) representa la fracción de dispositivos que han fallado hasta antes del instante t. Una vez que se ha estimado la función F (t) podemos obtener el estimador para R(t): R̂(t) = 1 − F ˆ(t). Ejemplo 1.6.1. Se realizó una prueba de vida sobre diez dispositivos idénticos, y se obtuvieron los siguientes tiempos de falla: 89, 132, 202, 263, 321, 362, 421, 473, 575 y 633 horas. Se obtendrá el estimador no paramétrico de la función de distribución 30 para t = 350 horas. Solución: Usando la expresión de la función de distribución empı́rica, y puesto que en este caso n = 10 y hay sólo 5 observaciones cuyo tiempo de falla es inferior o igual a 350 1 5 = horas, se tiene que F̂ (350) = 10 2 Figura 1.12: Función de distribución empı́rica En la Figura 1.12 se muestra la representación gráfica de la función de distribución empı́rica de los tiempos de falla. Observe que la gráfica es una función escalonada creciente con saltos discontinuos en cada uno de los tiempos de falla, y dado 1 que todos éstos son distintos, la función crece en proporción 10 en cada uno. Note también que F̂ (t) = 0 para los valores de t anteriores a la primera falla y F (t) = 1 después del último tiempo de falla. 1.6.2. Estimación de la función de confiabilidad en caso de observaciones censuradas. Ahora vamos a presentar el estimador de Kaplan Meier, el cual permite obtener un estimador no paramétrico para la función de confiabilidad cuando las observaciones presentan algún tipo de censura. Se define el estimador de Kaplan Meier para 31 el caso en que se tienen observaciones censuradas por la derecha. Sea T una variable aleatoria que representa el tiempo a la falla de una unidad. Considérese una muestra formada por n unidades de las cuales se observan t1 , t2 , ..., tn tiempos de falla (incluyendo censuras) y sean t(1) < t(2) < ... < t(k) los estadı́sticos de orden de los k tiempos de falla distintos que fueron observados. Sean ni el número de unidades bajo observación que están funcionando antes del instante ti , di el número de dispositivos que fallan justo antes del instante ti y ci el número de censuras que ocurren en el intervalo [ti , ti+1 ). Se puede ver que n0 = 0, t0 = 0, d0 = 0 y ni+1 = ni − di − ci , i = 1, 2, ..., k − 1. Se define el estimador de Kaplan Meier para la función de confiabilidad R(t) como R̂(t) = Y i:t(i) ≤t di 1− ni (1.8) Ejemplo 1.6.2. Se realizó una prueba de vida con 19 unidades idénticas y se obtuvieron los siguientes tiempos a la falla. Los tiempos censurados están marcados con un asterisco ∗ . 5, 5, 6, 6∗ , 7, 8∗ , 8, 9∗ , 9∗ , 12, 13, 13∗ , 15∗ , 16∗ , 17, 24, 25, 27∗ , 30∗ Vamos a calcular el estimador de Kaplan-Meier para estimar la función de confiabilidad R(t). Solución: En este caso, se tienen 10 observaciones completas y 9 observaciones censuradas. Como son 10 tiempos de falla distintos, se consideran nueve intervalos durante los cuales ocurrieron las fallas. En la siguiente tabla, se muestra un resumen de los cálculos realizados para obtener el estimador de Kaplan-Meier para R(t). 32 i [ti , ti+1 ) 0 [0,5) 1 [5,6) 2 [6,7) 3 [7,8) 4 [8,12) 5 [12,13) 6 [13,17) 7 [17,24) 8 [24, 25) 9 [25, +∞) ni 19 19 17 15 14 10 9 5 4 3 di – 2 1 1 1 1 1 1 1 1 1 − ndii – 0.894737 0.941176 0.933333 0.928571 0.9 0.88888 0.8 0.75 0.66666 b R(t) 1 0.894737 0.842105 0.785965 0.729825 0.656842 0.583860 0.467088 0.350316 0.233544 Note que en el intervalo [0, 5) se observan las 19 unidades y ninguna falla antes de 5, en el intervalo [5, 6) se observan nuevamente las 19 unidades y ahora fallan 2 en 5, en el intervalo [6, 7) se observan 17 unidades, hay una falla en 6 y una unidad censurada que afecta sólo al número de unidades observadas. En la Figura 1.13 se muestra la representación gráfica de la estimación no paramétrica para la función de confiabilidad R(t). Observe que esta representación es una función escalonada que decrece. Cada discontinuidad se produce en los instantes donde hay fallos y la altura de esta discontinuidad es 1 menos la proporción de fallos en ese instante. Figura 1.13: Estimación no paramétrica de R(t) 33 1.7. Estimación de parámetros mediante linealización de la función de distribución. En esta sección veremos como realizar la estimación de los parámetros de las distribuciones de tiempos de falla, linealizando la función de distribución y luego resolviendo con regresión lineal. Primero vamos a linealizar el modelo de distribución, para enseguida mostrar en un gráfico la lı́nea recta que describe este modelo junto con el conjunto de observaciones, que pueden ser completas o censuradas. En este gráfico vamos a juzgar el ajuste de las observaciones a la lı́nea recta. Si el ajuste es bueno podemos concluir que las observaciones se caracterizan por tener dicha distribución. Finalmente, las estimaciones de los parámetros de la distribución se obtienen a partir de los coeficientes de la ecuación de lı́nea recta: pendiente y ordenada al origen. Enseguida se muestran las ecuaciones linealizadas para cada uno de lo modelos que se mencionaron anteriormente. Éstas están dadas en la forma y = ax + b. Distribución Exponencial Para esta distribución la ecuación linealizada, a partir de la función de distribución, se escribe como: − ln(1 − (F (t))) = λt En este caso el valor estimado del parámetro λ de la distribución exponencial, estará dado por la pendiente de la recta que pasa por el origen, es decir, λ̂ = a. Distribución Weibull De la función de distribución Weibull la ecuación linealizada resultantes es ln(− ln(1 − (F (t)))) = β ln t + β ln(λ) (1.10) Para esta distribución, las estimaciones de cada uno de sus dos parámetros serán β̂ = a (1.11) 34 y b λ̂ = e β̂ (1.13) Distribución Normal Para la distribución Normal se obtiene la siguiente ecuación Φ−1 (F (t)) = µ t − σ σ Los valores de los parámetros estimados son σ̂ = 1 y µ̂ = −bσ̂. a Distribución Lognormal La ecuación linealizada que se obtiene para esta distribución es Φ−1 (F (t)) = Aquı́ nuevamente σ̂ = ln t µ − σ σ 1 y µ̂ = −bσ̂. a Hasta este momento sólo conocemos la función de distribución empı́rica, la cual nos permite estimar F (t); sin embargo, en la práctica se utilizan algunas otras definiciones, las más usada debido a los buenos resultados que presenta es F̂ (t) = i − 0.3 n + 0.4 (1.15) Esta fórmula es conocida como el estimador de Bernard [4],[5] donde i es el número de fallas que han ocurrido antes o en el instante t. No se debe olvidar que los tiempos de falla deben estar ordenados. El siguiente ejemplo ilustra el uso del estimador de Bernard para estimar la función de distribución. 35 Ejemplo 1.7.1. Considérense 5 modelos de camiones idénticos comprados en las mismas fechas para realizar la mismas operaciones. Después de 3 meses de operación se realiza el análisis de fallas de los camiones. Se encontró que ciertas correas 1 de alguna toma de fuerza del sistema de diesel han experimentado un importante número de fracasos. Después de una investigación se obtuvo la información correspondiente al tiempo de falla de las correas, contando a partir de t = 0. Ver Cuadro 1.1 Cuadro 1.1: Periodo de falla Perı́odo (mes) Camión 1 Camión 2 Camión 3 Camión 4 Camión 5 1 Falla Falla 2 Falla Falla 3 Falla A partir del método de linealización vamos a estimar los parámetros de la distribución Weibull, para modelar el tiempo de falla de las correas. Se sabe que cada camión trabaja aproximadamente 300 horas por mes. El registro termina al final del tercer mes (hay censura tipo I, pues el final de la prueba se fija en t=900 hrs.). Se supone que cada vez que falla una correa, ésta es reemplazada por una nueva y la toma de fuerza funciona como nueva. En el Cuadro 1.2 se muestran los tiempos de operación de cada correa antes de que ésta falle. Entre paréntesis se ubica el tiempo de operación en caso de que la correa haya sido reemplazada anteriormente. Perı́odo 1 2 3 Cuadro 1.2: Tiempos de falla (horas) de las correas. (mes) Camión 1 Camión 2 Camión 3 Camión 4 Camión 5 100 250 350 450 (200) 850 En Cuadro 1.3 se muestra el número de horas de operación que lleva la correa de cada camión al final de la prueba (t=900 hrs). Ahora vamos a obtener una aproximación de la función de distribución F (t) con los tiempos de falla mostrados en el Cuadro 1.2. Para ello utilizamos el estimador de Bernard (Ecuación 1.14), para el cual se requiere que los tiempos de operación estén 1 Una correa es una transmisión flexible que se usa para generar movimiento o transmitir potencia. Las correas se conocen también como bandas. 36 Cuadro 1.3: Tiempo de operación (horas) de las correas al finalizar la prueba. Camión 1 Camión 2 Camión 3 Camión 4 Camión 5 900 800 550 450 50 ordenados de forma creciente como en el Cuadro 1.4. Se tienen 5 camiones; cada uno representa una muestra, entonces n = 5. Note que la segunda falla del camión 4 ocurre en el tiempo t = 450, pero ésta llevaba 200 hrs. funcionando. Cuadro 1.4: Tiempos de falla ordenado en orden creciente. Orden de la falla Camión Tiempo de operación 1 2 100 2 4 200 3 4 250 4 3 350 5 5 850 En el Cuadro 1.5 se muestran los valores de la estimación para F (t). Cuadro 1.5: Estimación para F (t) utilizando datos completos sin censura. ti Fbi 100 0.13 200 0.31 250 0.5 350 0.69 850 0.87 En la segunda parte, además de considerar los tiempos de falla del Cuadro 1.2, vamos a considerar los tiempos de falla que resultan de la censura al final del tercer mes, los cuales se presentan el el Cuadro 1.3. A partir de esta estimación vamos a estimar los parámetros de la distribución Weibull. El objetivo de incluir los datos censurados en el análisis es obtener una mejor estimación de la función de distribución, pues de esta forma evitamos subestimar la función de confiabilidad. El subestimar la confiabilidad de las correas nos llevarı́a a pensar que los autobuses requieren de un mantenimiento innecesario. En el Cuadro 1.6 se muestran todos los tiempos de falla de las correas de cada camión. Si al finalizar la prueba, la correa seguı́a funcionando, el tiempo de falla registrado para ésta se considera como un dato censurado. 37 Cuadro 1.6: Tiempos de falla (horas), considerando datos censurados i Falla-F, Censurada-C Hrs. de operación Camión No. de correa 1 C 50 5 2 2 F 100 2 1 3 F 200 4 2 4 F 250 4 1 5 F 350 3 1 6 C 450 4 3 7 C 550 3 2 8 C 800 2 2 9 F 850 5 1 10 C 900 1 1 Como se tienen datos censurados vamos a utilizar el estimador de Kaplan Meier (Ecuación 1.8) para obtener la estimación de la función de confiabilidad, R̃(t), a partir de la cual podemos obtener la nueva estimación de la función de distribución, F̃ (t). En el Cuadro 1.7 se muestran los resultados obtenidos para cada estimación. Cuadro 1.7: Estimación para F (t) i R̃i 100 0.89 200 0.78 250 0.67 350 0.56 850 0.28 incluyendo datos censurados F̃i 0.11 0.22 0.33 0.44 0.72 Para terminar, procedemos a calcular los parámetros de la distribución Weibull haciendo uso de esta última estimación para F (t). En la Ecuación (1.10), la cual representa la ecuación linealizada para la distribución Weibull hacemos x = ln t y y = ln(− ln(1 − (F̃ (t)))) Utilizamos el método de mı́nimos cuadrados para encontrar la ecuación de la lı́nea recta que mejor se ajuste a las parejas de puntos (x, y). La ecuación de la recta ajustada es y = −7.30 + 1.13x. Finalmente por Ecuaciones (1.11) y (1.13) los estimadores de los parámetros de la distribución Weibull son βb = 1.13 y b = 627.96 λ 38 Figura 1.14: Estimaciones de la función de distribución acumulada. 1.8. Modelos de vida acelerada 1.8.1. Distribución del tiempo de falla, bajo vida acelerada Cuando se quiere medir la confiabilidad de un componente es necesario tener una gran cantidad de información correspondiente a los tiempos de falla del componente, y se requiere que esta información esté disponible en un corto espacio de tiempo. Para poder obtener esta información de manera más rápida se utilizan pruebas de vida acelerada en las cuales los componentes son sometidos a condiciones de operación más extremas de lo normal (llamadas también condiciones de estrés), con lo que se conseguirá acelerar el proceso de desgaste y, en consecuencia, se reducirá la duración del estudio. Los resultados ası́ obtenidos sobre los tiempos de falla se podrán extrapolar al caso en el que los dispositivos se encuentran operando en condiciones normales. Normalmente lo que se hace es incrementar alguna de las variables aceleradoras del componente o unidad (temperatura, voltaje, presión, humedad, etc.), esto causa tiempos de falla menores a los tiempos de fallo en condiciones normales. 39 Una suposición importante que se hace en estos modelos es que cuando el componente se encuentra operando en condiciones de estrés, tendrá el mismo mecanismo de falla que cuando se encuentra operando en condiciones normales, con la única diferencia de que la falla aparece más rápido. El incremento de la variable aceleradora puede ser constante o escalonado. En la práctica el método más usado es el de aceleración constante. En este método cada unidad o componente se somete a esfuerzo constante durante el estudio. Cuando se supone aceleración constante se tiene la siguiente relación para los tiempos de falla to = t , donde es el factor de aceleración constante, t es el tiempo de falla bajo condiciones de estrés y to es el tiempo de falla en condiciones normales. La función de distribución acumulada del tiempo de falla en condiciones normales Fo (to ) para un cierto tiempo to está dada por Fo (to ) = P (To < to ) to To < = P = P (T < t ) to = F De modo que Fo (to ) = F to . La función de densidad en condiciones normales de operación para un cierto instantes t es d t fo (t) = F dt 1 t = f La función de confiabilidad en condiciones normales de operación para un cierto tiempo t es t t Ro (t) = 1 − Fo (t) = 1 − F =R La tasa de falla bajo condiciones normales de operación para un cierto tiempo t 40 es fo (t) Ro (t) 1 f ( t ) = t R 1 t = h ho (t) = Enseguida se muestra la función de confiabilidad de los modelos de distribución de confiabilidad bajo condiciones de operación normales, a partir de la estimación bajo condiciones aceleradas con factor de aceleración . Distribución Weibull λ β R(t) = e−( t) Distribución exponencial λ R(t) = e−( t) Distribución Normal R(t) = 1 − Φ t − µ σ Distribución Lognormal R(t) = 1 − Φ ln t − ln − µ σ Ejemplo 1.8.1. Un componente se probó en 180 o F , se encontró que el tiempo de falla sigue una distribución Weibull con parámetro de forma β = 3.5 y parámetro 1 de escala λ = 19.3 . La temperatura con la cual opera el componente en condiciones o normales es 110 F y el factor de aceleración entre estas dos temperaturas es 12. Determinaremos la confiabilidad del componente bajo condiciones de operación normales en t = 200. Sabemos que la confiabilidad del componente en cualquier instante de tiempo está dada por " 3.5 # t R(t) = exp − 12(19.3) 41 Entonces en t = 200 la confiabilidad del componente es " 3.5 # 200 R(t) = exp − = 0.550 12(19.3) Para determinar el factor de aceleración se utilizan los modelos de aceleración, que usan datos de falla que fueron obtenidos en condiciones aceleradas (o de estrés). Éstos suponen que el tiempo de falla es una función del estrés aplicado y otros valores constantes. Como los tiempos de falla son completamente aleatorios, un modelo de aceleración se interpreta como una ecuación que calcula el parámetro de escala de una distribución o cualquier p-cuantil como una función de las variables de estrés aplicado. Los modelos de aceleración más utilizados son: Modelo de Arrhenius, Modelo de Eyring y Ley de la Potencia Inversa. 1.8.2. Modelo de Arrhenius El modelo de Arrhenius se utiliza en pruebas aceleradas de componentes en los que el mecanismo de fallo analizado se puede acelerar por temperatura. Resulta muy útil en ensayos acelerados de componentes electrónicos, porque muchos de los mecanismos de fallos de estos componentes se aceleran por temperatura. El modelo de Arrhenuis se representa por la siguiente ecuación c tp = ke temp (1.16) Donde: tp es el tiempo en el cual una proporción p de la población falla. temp es la temperatura absoluta (medida en grados Kelvin, o K =o C + 273.16). k y c son constantes. En el siguiente ejemplo vamos a ver cómo determinar las constantes del modelo de Arrhenius, a partir del décimo cuantil de la distribución del tiempo de falla. La estimación de las constantes del modelo es independiente del p-cuantil que se considere; no obstante t10 y t50 son los que más se utilizan en la práctica. Ejemplo 1.8.2. Un componente fue probado en cuatro diferentes temperaturas. Los parámetros estimados de la distribución Weibull fueron los siguientes: 42 Temperatura β λ 30o C 3.16 0.0011 50o C 3.08 0.0024 100o C 3.14 0.0051 150o C 3.10 0.0096 Vamos a determinar la constantes del modelo de Arrhenius y estimaremos el factor de aceleración para una temperatura de 70o C. Se supone que 20o C es la temperatura a la cual el componente opera en condiciones normales. Solución: Primero vamos a determinar el cuantil t10 para cada una de las distribuciones de Weibull. Para esta distribución se tiene que tp = 1 1 (− ln(1 − p)) β λ Entonces, los cuantiles obtenidos son Temperatura t10 30o C 447.52 50o C 196.93 100o C 96.34 150o C 50.61 Para poder determinar las constantes vamos a linealizar el modelo de Arrhenius, con lo que nos queda c ln tp = + lnk temp Podemos observar que esta última ecuación es de la forma y = ax+b, con a = c y b = ln k. Estimamos los valores de las dos constantes usando el método de regresión 1 como variable independiente y ln tp como variable lineal simple, considerando temp dependiente. En la siguiente tabla se muestra la información requerida para usar el método de regresión lineal. t10 447.52 196.93 96.34 50.61 ln(t10 ) 6.1037 5.2828 4.5679 3.9241 Temperatura o C 30 50 100 150 Temperatura o K 303.16 323.16 373.16 423.16 1 temp 0.0032986 0.0030944 0.0026798 0.00023632 Los parámetros de la lı́nea recta que mejor se ajustan a los datos son a = 2207.8 y b = −1.3425. Entonces las constantes del modelo de Arrhenius son k = eb = e−1.3425 = 0.2615 y c = 2207.8 43 Para terminar, calculamos el factor de aceleración para una temperatura de 70o C. Sabemos que to = t . Se usan los cuantiles t10 en 20o C y 70o C y se tiene = t10,20 t10,70 El estimador para t10 en 20o C es 2207.8 t10,20 = 0.2612e 20+273.16 = 487.15 El estimador para t10 en 70o C es 2207.8 t10,70 = 0.2612e 70+273.16 = 162.20 Finalmente el factor de aceleración en 70o C es = 487.15 = 2.996. 162.20 1.8.3. Modelo de Eyring Este modelo supone que existen varios factores que provocan estrés en el componente y aceleran el fallo. Uno de estos factores es siempre la temperatura, mientras que los otros pueden ser el campo eléctrico, el voltaje, la humedad, el estrés mecánico, la corriente eléctrica, ciclos de temperatura, etc. Dos factores comúnmente usados son la temperatura y la humedad. La forma simple del modelo de Eyring, donde sólo se consideran dos factores, temperatura y voltaje, se caracteriza por la siguiente ecuación b tp = ae temp V −c (1.17) Donde: tp es el tiempo en el cual una proporción p de la población falla. temp es la temperatura absoluta (medida en grados Kelvin, o K =o C + 273.16). V es el voltaje. a, b y c son constantes. Para poder encontrar los valores de las tres constantes a, b y c se linealiza la ecuación del modelo (Ec. 1.17). Se obtiene la siguiente ecuación ln t = ln a + b + c(− ln V ) temp 44 Observe que esta última ecuación es de la forma y = a + bx1 + cx2 . Como ahora se tienen dos variables independientes utilizamos el método de regresión lineal múltiple para obtener los parámetros del plano que mejor se ajuste a un conjunto de datos, 1 y − ln V como las variables suponiendo ln t como la variable dependiente y temp independientes x1 y x2 respectivamente. Ejemplo 1.8.3. Se realizan pruebas a un componente en tres niveles de temperatura y voltaje diferentes, los cuales se muestran en la siguiente tabla junto con los valores de t50 . Vamos a determinar los valores de las constantes del modelo de Eyring. t50 45 38 35 29 23 Temperatura o C 30 60 30 60 45 Voltaje V 20 20 40 40 30 En la siguiente tabla se muestran los datos necesarios para realizar el análisis de regresión lineal múltiple. t50 45 38 35 29 23 ln(t) 3.8066 3.6376 3.5553 3.3673 3.4965 T (o C) 30 60 30 60 45 T (o K) 303.16 333.16 303.16 333.16 318.16 V 1/T (o K) 20 0.00329 20 0.00300 40 0.00329 40 0.00300 30 0.00314 −lnV -2.9957 -2.9957 -3.6889 -3.6889 -3.4012 Después de realizar el análisis de regresión lineal múltiple en el paquete Minitab se obtienen los siguientes valores para la ecuación del plano que mejor se ajusta a los datos: a = 2.95, b = 601.52 y c = 0.383. Con estos valores se procede como en el ejemplo anterior para obtener el factor de aceleración . 1.8.4. Ley de la Potencia Inversa Este modelo resulta de utilidad cuando la vida del componente es inversamente proporcional al estrés aplicado. Se utiliza frecuentemente con estrés de tensión y estrés de fatiga por estrés cı́clico, como por ejemplo vibración mecánica. La ecuación que caracteriza este modelo es 45 tp = A Sc (1.18) Donde: tp es el tiempo en el cual una proporción p de la población falla. S es el estrés aplicado. A y c son constantes. Esta ecuación es una simplificación del modelo de Eyring, sólo que en éste no se considera la temperatura. La forma linealizada del modelo que nos permitirá encontrar los valores de las constantes A y c es lntp = lnA − clnS 46 Capı́tulo 2 Mantenimiento Hoy en dı́a las empresas buscan asegurar y mejorar su competitividad por medio de esfuerzos, acciones y decisiones orientadas que garanticen equipos o sistemas que operen de manera eficiente y eficaz; clientes y usuarios satisfechos; riesgos reducidos; mı́nimos incidentes ambientales y costos óptimos. El análisis RAMS incluye todas las consideraciones que deben tomarse en cuenta para poder desarrollar un nuevo producto o servicio. RAMS agrupa cuatro conceptos: Confiabilidad (Reliability), Disponibilidad (Availability), Mantenibilidad (Maintainability) y Seguridad (Safety). La confiabilidad se define como la capacidad de que un equipo o sistema opere sin fallar durante un periodo determinado y bajo ciertas condiciones previamente establecidas; en consecuencia, si estas condiciones cambian, la confiabilidad del sistema también cambiará. La Disponibilidad es la capacidad del sistema para funcionar en un determinado instante. La Mantenibilidad es la capacidad de ser mantenido o reparado preventiva y correctivamente con objeto de mejorar su disponibilidad. Durante el proceso de diseño se debe considerar la mantenibilidad como un criterio fundamental para conseguir calidad de servicio y ahorro de costes en el futuro. La experiencia ha demostrado que un ahorro en la inversión inicial puede suponer un gasto mucho mayor en mantenimiento. Por último se considera la Seguridad, que se define como la capacidad de operar sin producir daños al usuario o a su entono. El usuario considera que un componente o sistema es confiable si realiza adecuadamente la tarea para la que ha sido diseñado a lo largo de su vida útil. En realidad no existen equipos totalmente confiables, pues siempre hay una probabilidad de falla, la cual debe reducirse hasta valores suficientemente pequeños los cuales permitan la aceptación de los dispositivos por parte de la usuarios. Las fallas de un componente pueden clasificarse según diferentes criterios. Por 48 la forma en que aparecen pueden ser catastróficas o por degradación. Las fallas catastróficas son consecuencia de un cambio brusco en un parámetro o caracterı́stica operativa del componente, mientras que las fallas por degradación se deben al desgaste de los materiales. Según el momento en que aparecen pueden ser: fallas infantiles, fallas por azar o aleatorias y fallas por desgaste u obsolescencia. Las fallas infantiles se producen en productos recién salidos de fábrica, y son la consecuencia de los defectos de fabricación no detectados en la inspección. Este tipo de fallas pueden disminuirse con un buen control de calidad y son las que normalmente cubre la garantı́a. Las fallas por azar se deben a circunstancias desfavorables para el componente o sistema y se pueden presentar durante toda su vida útil. Las fallas por desgaste se presentan después de que el sistema ha tenido un largo periodo de uso. Si se considera la relación entre las fallas, pueden ser primarias o secundarias. Son primarias cuando se producen sin que ninguna otra falla las haya provocado, y secundarias cuando fueron originadas por una primera falla. Para disminuir el impacto negativo de los procesos de desgaste de un componente, se aplican tareas de mantenimiento preventivo, las cuales tienen por objetivo anticiparse a la falla para evitar problemas y al mismo tiempo asegurar que el componente o sistema funcione de manera continua y en las mejores condiciones. 2.1. Tipos de Mantenimiento El mantenimiento se define como la combinación de actividades mediante las cuales un equipo o sistema se mantiene, o se restablece a un estado en el que puede realizar las funciones para la cual fue diseñado o asignado. El objetivo del mantenimiento es mantener la confiabilidad del sistema, es decir, conservarlo de la mejor manera posible. Hay dos categorı́as básicas de mantenimiento: mantenimiento correctivo y mantenimiento preventivo o planificado. 2.2. Mantenimiento Correctivo El mantenimiento correctivo se realiza después que ocurre una falla, es decir, cuando el equipo es incapaz de seguir operando o no está cumpliendo la función para 49 cual fue diseñado o asignado. El objetivo de este tipo de mantenimiento consiste en llevar los equipos después de una falla, a sus condiciones operativas, por medio de restauración o reemplazo de componentes o partes [6]. En este tipo de mantenimiento se incluyen las tareas no programadas, que son consecuencia de una falla repentina en el sistema o producto, como son: Identificación de la falla Localización del elemento en falla Desensamble Reemplazo o arreglo Ensamble Pruebas Verificación 2.3. Mantenimiento Preventivo El mantenimiento preventivo se define como una serie de tareas planeadas y programadas previamente con base en el tiempo, el uso o la condición del equipo, y que se realizan a fin de evitar la ocurrencia de las fallas. Su objetivo es mantener los equipos bajo condiciones especı́ficas de operación [6]. Las tareas que se generan con este tipo de mantenimiento incluyen las siguientes actividades: Desensamble Reemplazo o arreglo Ensamble Pruebas Verificación Se ha mencionado antes que el comportamiento de la tasa de falla de un componente se puede dividir en tres etapas: infantil, de vida útil y de desgaste. ¿Qué beneficios se obtienen si se realiza el mantenimiento preventivo en cada una de estas etapas? Para la etapa infantil en donde la ocurrencia de fallas se debe principalmente a defectos de fabricación, las actividades de mantenimiento preventivo incrementarı́an la 50 tasa de falla, puesto que el mantenimiento restaura el componente o sistema al estado inicial, entonces el sistema se restaura a un estado en el cual se tiene una tasa de falla alta y por ende, aumentarı́a el número de fallas. Respecto a la etapa de vida útil, el mantenimiento preventivo únicamente originarı́a pérdida de tiempo y dinero, pues en esta etapa las fallas son consecuencia de averı́as accidentales debidas a factores externos. Las fallas que si se pueden prevenir con mantenimiento son las de la etapa de desgaste, ya que en esta etapa la tasa de fallas es creciente, es decir, depende de la edad del componente; por lo tanto el mantenimiento preventivo restaura el sistema a un estado en el cual la tasa de fallas es mas baja. De acuerdo a lo dicho en el párrafo anterior, se establece una diferencia entre los equipos electrónicos, cuyos componentes básicamente responden a fallas por causas completamente aleatorias, y los equipos mecánicos, en los cuales domina la falla por desgaste. En los equipos electrónicos el mantenimiento preventivo normalmente no sólo no aporta ventaja alguna, sino que llevarı́a a desperdiciar gran parte de la vida útil de los componentes, agregando el costo de la acción preventiva. 2.4. Función de densidad de fallo que resulta cuando se practican acciones de mantenimiento preventivo Sea f (t) una función de densidad de fallas que da origen a una tasa de fallas creciente con el tiempo. Se quiere hallar la función de densidad de fallas fM P (t) que resulta cuando se practican acciones de mantenimiento preventivo. Las acciones de mantenimiento preventivo, que se realizan a intervalos de tiempo tp , determinan una nueva función de densidad de fallas, pues los componentes sólo pueden fallar dentro del intervalo [0, tp ] después del cual se lleva a cabo el mantenimiento preventivo. Sea ( f (t), si 0 ≤ t ≤ tp f1 (t) = 0, si t > tp Vamos a describir la nueva función de densidad de fallos, fk (t), para cualquier instante t > tp . 51 Observe que la función f1 (t) nos permite calcular la probabilidad de fallo en el intervalo [0, tp ]. De esta forma, la función de confiabilidad obtenida con base en f (t) sólo tiene validez en el intervalo [0, tp ]; denotemos ésta como R0 (t). Debido a que después de una intervención (correctiva o preventiva) el equipo queda como nuevo, si consideramos entonces la intervención k tendremos lı́m R(ktp + ∆t) = 1, k = 0, 1, 2, · · · , n ∆t→0 Por tanto, dentro de cualquier intervalo (ktp , (k + 1)tp ), a partir de una intervención, la función de densidad de fallos será una réplica de la densidad de fallos entre 0 y tp . Sabemos que R(tp ) es la probabilidad de que el componente no falle durante un intervalo cualquiera [0, tp ]. Entonces, ¿cuál será la probabilidad de que el componente siga en funcionamiento en un instante t cualquiera posterior a ktp ? t = ktp + tm , k = 1, 2, 3, ..., n, 0 < tm < tp , tm = t − ktp Ésta será la probabilidad de que el sistema haya funcionado desde el instante t = 0 hasta el instante t = ktp y de que no se produzca un fallo en el intervalo ktp < t < ktp + tm Como la confiabilidad en el intervalo (0, tp ) es R(tp ), la probabilidad de que no haya fallado en ninguno de los k intervalos anteriores es R(ktp ) = [R(tp )]k Por otro lado, Z R(tm ) = 1 − F (tm ) = 1 − tm f1 (t) dt 0 Entonces la función de confiabilidad en t con mantenimiento preventivo RM P es RM P (t) = R(ktp + tm ) = R(ktp )R(tm ) = [Ro (tp )]k Ro (t − ktp ) Por lo tanto, la función de densidad de fallo fk (t) dentro del intervalo 52 (ktp , (k + 1)tp ) estará dada por dRM P (t) dt d[Ro (tp )]k Ro (t − ktp ) = − dt dR o (t − ktp ) = −[Ro (tp )]k dt k = [Ro (tp )] f1 (t − ktp ) fk (t) = − Finalmente, la función de densidad del tiempo de falla cuando se efectúa mantenimiento preventivo, se puede escribir como: fM P (t) = ∞ X ∞ X fk (t) = [Ro (tp )]k f1 (t − ktp ), t≥0 k=0 k=0 Es decir, la probabilidad instantánea de que ocurra una falla en un instante t = ktp + tm con 0 < tm < tp y k = 1, 2, 3, ..., siendo que en los instantes t = ktp se realiza mantenimiento preventivo, está dada por la suma de las densidades de fallo en cada uno de los intervalos (ktp , (k + 1)tp ). Se puede observar que fM P (t) ≥ 0 Z ∀t ∈ [0, +∞) y además ∞ fM P (t) dt = 0 Z = ∞ ∞X 0 = [R(tp )]k f1 (t − ktp ) dt k=0 ∞ X k Z k=0 (k+1) f1 (t − ktp ) dt [R(tp )] k Z (tp ) 1 = f (t) dt 1 − R(tp ) 0 1 F (tp ) = F (tp ) = 1 Hay que notar que el efecto del mantenimiento preventivo periódico es alterar la función de densidad de falla de su forma original a una de tipo exponencial. Por tanto, la tasa de falla que en un principio era creciente, con el tiempo se puede aproximar a una tasa de falla constante, que no crece. Esto es, el mantenimiento preventivo periódico elimina las fallas por desgaste u obsolescencia del dispositivo, dejando la posibilidad de que sólo ocurran fallas que puedan ser originadas por algún fenómeno 53 imprevisto. Ejemplo 2.4.1. Un componente tiene una función de densidad de falla f (t) que tiene una distribución uniforme entre [0,10] años, es decir, ( 1 , si 0 ≤ t ≤ 10 f (t) = 10 0, si t > 10 El componente es sometido a mantenimiento preventivo 1 vez al año. Vamos a calcular la función de densidad resultante cuando se considera el efecto del mantenimiento, para después comparar el M T BF original y el M T BFM P que resulta cuando se efectúa el mantenimiento preventivo. A partir de la función de densidad de fallo se tiene que la función de distribución de fallo es ( t , si 0 ≤ t ≤ 10 F (t) = 10 1, si t > 10 Figura 2.1: Funciones estadı́sticas sin efecto del mantenimiento La función de confiabilidad es R(t) = 1 − t , 10 0 ≤ t ≤ 10 54 Y la tasa de fallo queda como sigue: h(t) = 0.1 1 = 1 − 0.1t 10 − t En la Figura 2.1 se muestran las funciones de densidad, distribución, confiabilidad y tasa de falla del componente, sin considerar el efecto del mantenimiento. Para calcular el M T BF hacemos Z 10 Z 10 R(t) dt = (1 − 0.1t) dt 0 0 Z 10 Z 10 = dt − 0.1 t dt 0 0 2 t = 10 − 0.1 |10 2 0 2 10 = 10 − 0.1 2 = 5 Es decir, el tiempo medio entre dos fallos consecutivos es de 5 años. Considerando que el mantenimiento preventivo se efectúa cada año, tp = 1 y entonces R(1) = 0.9. De ahı́, que la función de densidad de fallo que estamos buscando es ∞ X fM P (t) = (0.9)k (0.1), ktp < t < (k + 1)tp k=0 Nótese que debido al mantenimiento preventivo, el componente recupera su distribución uniforme en [0, 10] cada año. 1 Ahora vamos a calcular el M T BFM P como ∗ . La nueva tasa de falla, h∗ (t) h (t) se puede aproximar con el valor medio de h(t) en el intervalo [0,1]. Es decir Z 1 dt ∗ h (t) = 0 10 − t Si hacemos el cambio de variable u = 10 − t du = −dt (2.1) 55 ∗ Z 10 du u 9 = ln10 − 1n9 = 0.1053 h (t) = Por lo tanto, la aproximación que se tiene para el valor del M T BFM P que se obtiene cuando se considera el efecto del mantenimiento preventivo es 1 = 9.491 0.1053 El valor exacto de M T BFM P es la media de la variable t con densidad fM P (t), es decir, Z ∞ tfM P (t) dt = 0 Z ∞ = t 0 ∞ X (0.1)(0.9)k dt k=0 Z k+1 ∞ 1 X k t dt (0.9) = 10 k=0 k ∞ 1 X = (0.9)k (2k + 1) 20 k=0 = 9.5 Este valor 9.5 años representa un gran incremento de tiempo, respecto de M T BF = 5 años que se obtienen cuando no se tiene en cuenta el mantenimiento preventivo. 2.5. Función de Mantenibilidad El tiempo empleado para la reparación del dispositivo averiado depende de las caracterı́sticas del sistema en falla y de factores tales como la accesibilidad, facilidades para el diagnóstico, habilidad de los reparadores, etc. Como las fallas son aleatorias, y es diferente el tiempo de reparación involucrado en cada dispositivo, los tiempos necesarios para reparar el dispositivo también serán aleatorios. 56 Considérese la variable aleatoria T T R que representa el tiempo de ejecución de las tareas de mantenimiento, ya sea preventivo o correctivo. Esta variable toma valores en el intervalo [0, +∞). La función de distribución de la variable aleatoria T T R se denomina función de mantenibilidad y se denota por M (t), es decir Z t m(x) dx M (t) = P (T T R < t) = 0 donde m(x) es la función de densidad de la variable aleatoria T T R. La función de mantenibilidad indica la probabilidad de que un sistema que entró en proceso de reparación en el instante t = 0 este reparado al cabo de un cierto tiempo t. La experiencia indica que la distribución lognormal representa a M (t); la asimetrı́a de la función indica que tan rápido se llevan a cabo las actividades de mantenimiento. Ejemplo 2.5.1. El tiempo de reparación de un sistema sigue una distribución lognormal con parámetro de escala σ = 1.2 y parámetro de localización µ = 2.2 horas. El parámetro µ es la media del logaritmo natural de los tiempos de reparación y σ es la desviación estándar del logaritmo natural de los tiempos de reparación alrededor de µ. La probabilidad de completar la reparación del sistema en un tiempo menor a 5 horas está dada por M (5) como se muestra a continuación. 2 1 ln x − µ − 1 σ x>0 e 2 Sabemos que m(x) = √ σ 2πx Entonces Z 5 1 ln x−2.2 2 1 √ e− 2 ( 1.2 ) dx 0 1.2 2πx ln 5 − 2.2 = Φ 1.2 = Φ(−0.4921) = 0.3113 M (5) = Por lo tanto, la probabilidad de efectuar las tareas de mantenimiento en menos de 5 horas es 0.3113. 57 Figura 2.2: Función de Mantenibilidad En la Figura 2.2 se muestra el comportamiento de la función de mantenibilidad para este sistema. Al igual que en el área de confiabilidad, se denominará tasa de mantenibilidad γ(t) a la probabilidad condicional de completar las acciones de mantenimiento durante el intervalo de tiempo (t + ∆t), con ∆t → 0 , suponiendo que la acción comenzada en el instante t = 0 no haya sido completada antes del tiempo t. Ésta se representa por γ(t) = m(t) 1 − M (t) Otra de las medidas importantes es el tiempo medio de la duración de las acciones de mantenimiento M T T R. Analı́ticamente se expresa por Z ∞ M T T R = E(T T R) = tm(t) dt 0 Ejemplo 2.5.2. Consideremos que la tasa de mantenibilidad γ(t) de un sistema es constante. Entonces se tienen las siguientes ecuaciones: M (t) = 1 − e−γt m(t) = γe−γt 58 MT T R = 1 γ Para esta distribución, la mejor estimación de mantenibilidad del sistema se puede obtener mediante el cociente entre la suma de los tiempos de reparación tr y el número total de fallos n, es decir, Pn tr M T T R = r=0 n Ejemplo 2.5.3. Se sabe que durante un periodo de un mes hubo 15 acciones de mantenimiento no programadas y que se requirieron 1200 minutos para efectuar las reparaciones. Por datos históricos, el analista de mantenimiento sabe que los tiempos de mantenimiento se distribuyen de manera exponencial. ¿Cuál es el valor medio de los tiempos de reparación? Se tiene que la suma de los tiempos de reparación es 1200 y como fueron 15 intervenciones no programadas, entonces n = 15. Por lo tanto 1200 = 80 15 Es decir, las actividades de mantenimiento no programado requirieron en promedio 80 minutos. MT T R = Ejemplo 2.5.4. Consideremos ahora que m(t), la función de densidad de los tiempos de reparación es lognormal. Se tienen las siguientes ecuaciones: Z M (t) = 0 t 1 − e 2 1 − e 2 1 √ σ 2πx 1 m(t) = √ σ 2πt ln x − µ σ ln t − µ σ Recordemos que γ(t) = m(t) 1 − M (t) 2 2 dx 59 2 − µ+ σ2 MT T R = e En esta distribución Pn µ̂ = r=0 ln tr n Figura 2.3: Función de densidad lognormal En la Figura 2.3 se muestran las gráficas de la función de densidad m(t) con diferentes parámetros. Se observa que la probabilidad se concentra cerca de cero y que después de la moda, la probabilidad decrece. También se puede observar que a medida que decrece el valor del parámetro σ la distribución se vuelve más simétrica. 60 Capı́tulo 3 Modelos Matemáticos de Polı́ticas Óptimas de Mantenimiento con tiempos de reparación instantáneos Como el fenómeno de aparición de fallas se comporta como un proceso aleatorio, está claro que no podemos llegar a predecir cuando ocurrirán las fallas, pero sı́ podemos determinar con base en la mejor información los tiempos de mantenimiento preventivo y las polı́ticas de mantenimiento más adecuadas a largo plazo. Los propietarios de un sistema deben decidir acerca de sus polı́ticas de mantenimiento o realizarlas utilizando datos proporcionados por su sistema, no basados en intuiciones, pues esto puede ocasionar pérdida de confiabilidad del sistema. En las siguientes secciones se estudian dos de las polı́ticas de mantenimiento preventivo introducidas por Richard E. Barlow y Proschan (1965) [7], las cuales tienen por objetivo lograr un balance entre la disminución del riesgo de llegar a tener una falla y el aumento de los costos de mantenimiento preventivo; de ahı́ que estos modelos se construyen para determinar el intervalo óptimo entre dos reemplazos sucesivos de componentes. Usaremos reemplazo para referirnos a mantenimiento preventivo o mantenimiento por falla. 62 3.1. Polı́tica I. Mantenimiento Basado en la Edad La falla de un sistema durante su operación puede ser de poca o mucha importancia dependiendo del tipo de falla, llegando a ser muy costoso y peligroso.Una de las áreas importantes de la teorı́a de confiabilidad es el estudio de las polı́ticas de mantenimiento para reducir los costos de operación. En esta polı́tica de mantenimiento por edad, ya sea que el sistema es reemplazado en el tiempo de falla t, si t < tp , o una vez que el sistema ha alcanzado una edad de operación tp , lo que ocurra primero. Se supone que en ambos casos, luego del reemplazo, el sistema queda en el estado “as good as new”. Es decir, cada reemplazo, que puede ser mantenimiento preventivo o mantenimiento por falla constituye una renovación del sistema. La edad a la cual el sistema es reemplazado depende, entre otros, de los siguientes factores: Distribución del tiempo de falla. Costos de reemplazo por falla. Costos de reemplazo preventivo. Tiempo de inactividad por falla y reemplazo preventivo. Medida de efectividad: minimizar costos, maximizar disponibilidad, o lograr cierta confiabilidad. Para este modelo vamos a suponer que los reemplazos preventivos son menos costosos que reemplazos por falla, pues además del costo de mantenimiento, se tiene el costo de reparar los daños ocasionados al sistema. También se considera que el costo del tiempo de inactividad asociado con las acciones de mantenimiento preventivo y reparaciones mı́nimas, las cuales se efectúan cuando el sistema falla, es insignificante, es decir, los reemplazos son instantáneos. Es importante señalar que el modelo sólo será de utilidad en la etapa de desgaste u obsolescencia del componente o sistema, pues en esta etapa el sistema presenta una tasa de falla creciente. Diremos que un ciclo se completa cada vez que se realiza un reemplazo ya sea por mantenimiento preventivo o por falla. Entonces para este modelo existen dos ciclos 63 posibles: en el primer ciclo se realiza mantenimiento a la edad especificada tp y en el segundo ciclo el sistema falla antes del mantenimiento preventivo. Figura 3.1: Reemplazo por edad El objetivo de esta polı́tica es encontrar el valor de tp que minimize el costo total esperado por unidad de tiempo, el cual queda definido por la siguiente ecuación: C(tp ) = E(C) E(D) (3.1) Donde: C es el costo incurrido durante un ciclo. D es el largo de un ciclo. E(C) es el costo esperado de un ciclo. E(D) es el largo esperado de un ciclo. Vamos a considerar ( Cp , si T > tp C= Cf , si T ≤ tp ( dp + tp , si T > tp D= df + T, si T ≤ tp Donde: Cp es el costo de mantenimiento preventivo. Cf es el costo de mantenimiento por falla. dp es la duración del mantenimiento preventivo. df es la duración del mantenimiento por falla. T es el tiempo de falla. tp es el tiempo de operación del componente sin falla después del cual se efectúa un 64 mantenimiento preventivo. Si suponemos que los tiempos requeridos para llevar a cabo tanto las actividades de mantenimiento preventivo como correctivo son nulos, es decir, que df = dp = 0 entonces ( tp , si T > tp D= T, si T ≤ tp Recordemos además que Cp < Cf . Por lo dicho anteriormente, el costo total esperado por ciclo está dado por las dos probabilidades, que T > tp , lo cual significa que no hay falla en el intervalo de mantenimiento preventivo, y que T ≤ tp , es decir, que ocurre una falla antes de efectuar el mantenimiento preventivo. Entonces el costo total esperado por ciclo se expresa como sigue: Cp P (T > tp ) + Cf P (T ≤ tp ) = Cp R(tp ) + Cf [1 − R(tp )] (3.2) De la misma forma, el largo esperado de un ciclo está dado por las dos probabilidades, que T > tp y que T ≤ tp . En el caso de que se realice una mantenimiento preventivo en tp , el largo esperado del ciclo es tp . En cambio, si se realiza mantenimiento preventivo antes de tp , el largo esperado del ciclo es el tiempo medio entre falla, pero en el intervalo [0, tp ]. Se busca entonces la media de la distribución truncada en tp . R∞ Sabemos que para la distribución completa, el M T BF = 0 tf (t) dt, pero como la función de densidad se trunca en tp , el valor medio queda expresado de la siguiente forma Z tp f (t) dt M (tp ) = t 1 − R(tp ) 0 Por lo tanto, el largo esperada del ciclo, E(D) está dado por tp P (T > tp ) + M (tp )P (T ≤ tp ) = tp R(tp ) + M (tp )[1 − R(tp )] (3.3) Hasta aquı́, el costo total esperado por unidad de tiempo queda expresado como Cp R(tp ) + Cf [1 − R(tp )] tp R(tp ) + M (tp )[1 − R(tp )] Cp R(tp ) + Cf [1 − R(tp )] = Rt tp R(tp ) + 0 p tf (t) dt C(tp ) = 65 La expresión anterior se puede simplificar aún más si realizamos integración por partes en Z tp tf (t) dt. 0 u = t dv = f (t)dt du = dt v = F (t) = 1 − R(t) ⇒ Z tp Z tp [1 − R(t)] dt Z tp = tp − tp R(tp ) − tp + R(t) dt tf (t) dt = t[1 − 0 t R(tp )]|0p − 0 0 Entonces el largo esperado por ciclo queda definido por Z tp R(t) dt (3.4) 0 Finalmente, el costo esperado por unidad de tiempo para un intervalo de reemplazo tp es definido por la siguiente función de costo. C(tp ) = Cp R(tp ) + Cf [1 − R(tp )] , tp ∈ [0, +∞) R tp R(t) dt 0 (3.5) Es decir, el costo esperado por unidad de tiempo para un intervalo de reemplazo tp va a estar dado por la razón entre la suma del costo de mantenimiento preventivo multiplicado por la probabilidad de que no ocurra una falla es este intervalo más la probabilidad de que ocurra la falla multiplicada por el costo de mantenimiento por falla, y la confiabilidad acumulada hasta el instante tp . Como ya sabemos, el valor de tp que minimiza la ecuación anterior es aquel que dC(tp ) satisface = 0. dtp Tenemos que ( dC(tp ) = dtp R tp 0 R(t) dt) [Cp R0 (tp ) − Cf R0 (tp )] − [Cp R(tp ) + Cf (1 − R(tp ))] R(tp ) R 2 tp R(t) dt 0 Si igualamos las derivada a cero nos queda que Rt ( 0 p R(t) dt)(−Cp f (tp ) + Cf f (tp )) = Cf R(tp ) 66 ⇒ R Rt t Cf f (tp ) 0 p R(t) dt − Cp f (tp ) 0 p R(t) dt = Cp [1 − F (tp )] ⇒ R Rt t Cf h(tp ) 0 p R(t) dt − Cp h(tp ) 0 p R(t) dt = Cp ⇒ Rt Cp h(tp ) 0 p R(t) dt = Cf − Cp De esta última ecuación se puede observar que el valor de tp para el cual el costo total esperado por unidad de tiempo es mı́nimo, depende de la relación que existe entre los costos de mantenimiento preventivo y mantenimiento por falla. Ejemplo 3.1.1. Considere un componente cuyos tiempos de falla son modelados con la distribución Weibull con parámetros λ = 0.0025 y β = 2.93. Vamos a analizar el comportamiento del intervalo óptimo de mantenimiento preventivo, a partir de la relación que existe entre los costos de mantenimiento preventivo y por falla. Enseguida vamos a describir la ecuación que describe el costo total esperado por unidad de tiempo para un intervalo de reemplazo tp . β Sabemos que R(t) = e−(λt) es la función de confiabilidad para cualquier instante t ≥ 0. Entonces por (3.5) β β Cp e−(λtp ) + Cf (1 − e−(λtp ) ) C(tp ) = R tp e−(λt)β dt 0 En la Figura 3.2 se muestran las gráficas de la función del costo esperado por unidad de tiempo considerando Cp = 1 y Cf = kCp . Los valores de k se asignan de tal forma que los costos de mantenimiento por falla aumenten, pero además que Cp < kCf . En las gráficas podemos observar que la función del costo presenta un mı́nimo una vez que k toma valores por arriba de 1.4. De no ser ası́ entonces tp = ∞, lo cual indica que conviene el reemplazo sólo en la falla. En la Figura 3.3 se puede observar la relación entre el valor de la constante de proporcionalidad k y el tp óptimo, que indica la frecuencia con la que se debe efectuar el mantenimiento preventivo. Observamos que a medida que aumenta la constante de proporcionalidad, disminuye el valor de tp , es decir, del intervalo de mantenimiento preventivo a un costo mı́nimo. 67 Figura 3.2: Costo esperado por unidad de tiempo Figura 3.3: Relación entre el valor de k y el intervalo de mantenimiento tp óptimo. En resumen, la polı́tica de mantenimiento preventivo basado en la edad, sugiere que se efectúe el reemplazo del componente cuando ocurre la falla o una vez que el componente haya alcanzado una edad de operación tp , lo que ocurra primero. 68 3.2. Polı́tica II. Mantenimiento preventivo a intervalos constantes Esta polı́tica considera que se realizan reemplazos preventivos a intervalos constantes, independientemente del número de fallas intermedias (que también tienen un costo). En caso de que ocurra una falla antes de tp , se realiza mantenimiento por falla. De la misma forma que en la polı́tica anterior, la longitud del intervalo de tiempo (o edad) en el cual el sistema es reemplazado depende, entre otros, de los siguientes factores: Distribución del tiempo de falla. Costos de reemplazo por falla. Costos de reemplazo preventivo. Tiempo de inactividad por falla y reemplazo preventivo. Medida de efectividad: minimizar costos, maximizar disponibilidad, o lograr cierta confiabilidad. Se supone que el tiempo considerado para realizar reemplazos preventivos y por falla es nulo y que los costos de mantenimiento preventivo son menores que los costos de mantenimiento por falla. Este modelo podrá implementarse sólo en la etapa de desgaste del componente, en la cual la tasa de falla es creciente. Figura 3.4: Reemplazo a intervalos constantes. Nuevamente, el objetivo es encontrar el intervalo óptimo entre reemplazos preventivos, el cual minimiza el costo total esperado por unidad de tiempo. 69 El costo total, generado durante un ciclo, está dado por N (tp ) C= X Cf i + Cp i=1 N (tp ) es una variable aleatoria que mide el número de fallas que ocurren en el intervalo (0, tp ]. De ahı́ que el conjunto de variables aleatorias {N (tp ), tp ≥ 0} es un proceso de conteo que describe un Proceso no homogéneo de Poisson (NHPP) con función de intensidad h(tp ), tp ≥ 0 [8]. Por definición se tiene que el proceso de conteo {N (t), t ≥ 0} describe un NHPP con función de intensidad h(t), t ≥ 0 si satisface las siguientes propiedades: a) N(0)=0 b) El proceso tiene incrementos independientes, es decir, si 0 ≤ t1 < t2 < t3 < t4 , entonces las variables aleatorias [N (t2 ) − N (t1 ))] y [N (t4 ) − N (t3 ))] son independientes. c) P {N (t + δt) − N (t) = 1} = h(t)δt + o(δt), d) P {N (t + δt) − N (t) ≥ 2} = o(δt), δt → 0 δt → 0 En un Proceso de Poisson Homogéneo (NPP) la función de intensidad h(t), a diferencia de la función de intensidad del NHPP que depende del tiempo, ahora es una función constante. Esto significa que si el Proceso de Poisson es homogéneo, con función de intensidad constante ρ, la distribución del número de fallas que ocurren en un intervalo de longitud t es Poisson con media ρt. De las propiedades c) y d) se tiene que E[N (t, t + δt)] = ∞ X nP {N (t, t + δt) = n} = h(t)δt + o(δt), δt → 0 n=0 Entonces, el número esperado de fallas en el intervalo de longitud tp está dado por Z tp E [N (tp )] = E N (t, t + dt) 0 Z tp = E [N (t, t + dt)] 0 Z tp = h(t) dt 0 = H(tp ) 70 Por lo expuesto anteriormente, el costo total esperado por ciclo es Cp + Cf H(tp ) (3.6) Inicialmente el largo del ciclo es D = tp + dp ; pero como nuevamente dp = 0, el largo esperado del ciclo es simplemente tp , el intervalo de mantenimiento preventivo. Por lo tanto, el costo esperado por unidad de tiempo para un intervalo de reemplazo tp es definido por la siguiente función de costo C(tp ) = Cp + Cf H(tp ) , tp ∈ (0, ∞) tp (3.8) Esto significa que el costo esperado por unidad de tiempo para un intervalo de reemplazo tp es la razón entre la suma del costo de mantenimiento preventivo más el costo de mantenimiento por falla multiplicado por el número esperado de fallas en el intervalo de reemplazo, y la longitud del intervalo, que es tp . Sabemos que el valor de tp que minimiza el costo total esperado por unidad de tiempo es aquel que satisface dC(tp ) =0 dt tp Cf H 0 (tp ) − Cp − Cf H(tp ) dC(tp ) = dt t2p Si igualamos la derivada a cero tenemos tpCf H 0 (tp ) = Cp + Cf H(tp ) Cp tp h(tp ) = + H(tp ) Cf Cp tp h(tp ) − H(tp ) = Cf Esta última ecuación indica que nuevamente el intervalo óptimo de mantenimiento preventivo depende de la relación existente entre los costos de mantenimiento preventivo y por falla. Ejemplo 3.2.1. En el caso de la distribución exponencial, para la cual la tasa de de fallas es constante, realizar mantenimiento preventivo genera un gasto extra, pues 71 en este caso la probabilidad de falla es la misma para cualquier instante independientemente del tiempo que lleve funcionando el componente. Esto se ve en la solución del tiempo de mantenimiento preventivo óptimo, que es tp = ∞. Para esta distribución Z tp λ dt = λtp H(tp ) = 0 Entonces el costo total esperado por unidad de tiempo queda como sigue: C(tp ) = Cp + Cf λtp , tp ∈ (0, ∞) tp Luego tp Cf λ − Cp − tp Cf λ t2p Cp = 2 tp C 0 (tp ) = Nos interesa el valor de tp para el cual Cp =0 t2p Esta última ecuación indica que tp = ∞, lo cual significa que el mantenimiento preventivo se realiza una vez que ocurre la falla. Ejemplo 3.2.2. Consideremos nuevamente el componente con tiempos de falla de distribución Weibull, cuyos parámetros son λ = 0.0025 y β = 2.93. Haremos uso de esta nueva polı́tica para realizar el análisis del comportamiento del valor que indica el intervalo de mantenimiento para costo mı́nimo, a partir de la relación que existe entre los costos de mantenimiento preventivo y por falla. A continuación se describe la función del costo total esperado por unidad de tiempo, para un intervalo de reemplazo tp , en el caso de la distribución Weibull. Recordemos que la tasa de fallas está descrita por h(t) = λβ(λt)β−1 , t≥0 72 Entonces el número esperado de fallas H(tp ) nos queda como Z H(tp ) = tp λβ(λt)β−1 dt 0 = (λtp )β Para la distribución Weibull, el número esperado de fallas en el intervalo (0, tp ] es una potencia de λ veces la longitud del intervalo. La potencia viene a ser el parámetro de forma de la distribución. Según (3.8) C(tp ) = Cp + Cf (λtp )β , tp ∈ (0, ∞) tp En la Figura 3.5 se muestran la gráficas de la función del costo esperado por unidad de tiempo considerando los parámetros Cp = 1 y Cf = kCp . Nuevamente los valores de la constante k se asignan de tal forma que los costos de mantenimiento por falla aumenten y que Cp < kCf . En las gráficas se puede observar que a diferencia de la polı́tica de reemplazo basado en la edad, en este caso sı́ se tiene un mı́nimo para valores 1 ≤ k < 1.4. En la Figura 3.6 se muestra nuevamente la relación entre la constante de proporcionalidad k y el intervalo de reemplazo tp a costo mı́nimo. Se puede observar que el intervalo óptimo de mantenimiento preventivo disminuye a medida que crece la constante de proporcionalidad k. Figura 3.5: Costo esperado por unidad de tiempo 73 Figura 3.6: Relación entre el valor de k y el intervalo de mantenimiento tp óptimo. k Cf = kCp Reemplazo a intervalos constantes Reemplazo por edad (tp , C(tp )) (tp , C(tp )) tp :tiempo óptimo para costo mı́nimo C(tp ) 1 1.2 1.5 1.7 3 7 10 20 (314,0.0048) (295,0.0052) (273,0.0056) (262,0.0058) (216,0.0070) (161,0.0094) (143,0.0106) (113,0.0135) (∞, 0.0029) (∞, 0.0034) (416,0.0042) (366,0.0046) (250,0.0063) (171,0.0090) (149,0.0103) (115,0.0132) En la tabla anterior podemos observar que la polı́tica de reemplazo por edad genera menos reemplazos que la polı́tica de reemplazo a intervalos constantes. De hecho cuando k = 1.2 mientras que la polı́tica de reemplazo a intervalos constantes presenta un óptimo en tp = 295, la polı́tica de reemplazo por edad sugiere que el reemplazo preventivo se realize hasta que ocurra la falla. En resumen, la polı́tica de mantenimiento preventivo a intervalos constantes indica que el mantenimiento preventivo del componente se debe realizar en los instantes tp , 2tp , 3tp , ..., independientemente del número de fallas intermedias. 74 3.3. Aplicación a un caso real En lo que sigue, vamos a realizar un análisis del mantenimiento preventivo del elevador del Edificio AT, ubicado en la Universidad Autónoma Metropolitana-Unidad Iztapalapa, en el cual se tiene programado un mantenimiento preventivo cada 30 dı́as. Se aplicarán las polı́ticas de reemplazo por edad e intervalos constantes para comparar el intervalo de reemplazo preventivo indicado por cada una de estas polı́ticas con el intervalo de mantenimiento preventivo que tiene considerado el departamento de mantenimiento de la universidad. El paro del funcionamiento del elevador del Edifico AT, es ocasionado principalmente por dos tipos de fallas: falla en los botones de llamada y puertas de cabina trabadas. Independientemente del mantenimiento preventivo que se tiene programado cada 30 dı́as, cuando aparece una falla en el elevador, éste deja de funcionar y entonces se lleva a cabo un mantenimiento correctivo, con la finalidad de poner nuevamente en funcionamiento el elevador. Los costos estimados de mantenimiento preventivo y correctivo son $400.00 y $1050.00 respectivamente. En la siguiente tabla se muestran los tiempos de falla del elevador ocurridos durante el periodo Enero 2012- Abril 2013. Cuadro 3.1: Tiempos entre fallas, en dı́as 5 7 7 9 13 14 15 16 19 20 21 22 25 28 29 30 Con ayuda del programa estadı́stico MINITAB, realizamos un ajuste paramétrico de las distribuciones Weibull y Normal a los tiempos de falla, para ver cuál de la dos distribuciones es la que mejor se ajusta a los datos. En la Figura 3.7 se muestra el gráfico de probabilidad de los tiempos de falla correspondiente a la distribución Weibull. Los parámetros estimados de la distribución son: λ = 19.78 y β = 2.4273. El gráfico de probabilidad de los tiempos de falla correspondiente a la distribución Normal se muestra en la Figura 3.8, los parámetros estimados son: µ = 17.5 y σ = 7.85. Podemos observar que los tiempos de falla pueden ser modelados tanto por la distribución Weibull como por la distribución Normal. De hecho el estadı́stico AndersonDarling (que se muestra en las Figuras 3.7 y 3.8 como AD∗ ) nos da una medida de lo alejados que se encuentran los tiempos de falla de la recta que representa a cada 75 Figura 3.7: Gráfico de probabilidad para tiempos de falla del elevador.Distribución Weibull. Figura 3.8: Gráfico de probabilidad para tiempos de falla del elevador. Distribución Normal. distribución. Cuanto mejor sea el ajuste, menor será el valor de dicho estadı́stico. Los valores del estadı́stico son 1.044 para la distribución Weibull y 1.032 para la distribución normal. Ahora veamos como se comporta la tasa de falla para los tiempos de falla del elevador. En la Figura 3.9 se muestra la tasa de falla para cada distribución. Observe 76 que para ambos casos la tasa de falla es creciente, pero después de cierto tiempo ésta crece más rápido en el caso de la distribución Normal. Figura 3.9: Tasa de falla para las distribuciones Normal y Weibull. Cuadro 3.2: Distribución Weibull Polı́tica Intervalo de reemplazo óptimo de reemplazo (dı́as) Edad 14 Intervalos constantes 11 Costo mı́nimo ($/dı́a) 50.48 59.30 Cuadro 3.3: Distribución Normal Polı́tica Intervalo de reemplazo óptimo de reemplazo (dı́as) Edad 15 Intervalos constantes 12 Costo mı́nimo ($/dı́a) 48.98 57.52 En los cuadros 3.2 y 3.3 se muestran los resultados obtenidos para el intervalo óptimo de reemplazo preventivo y el costo mı́nimo en cada polı́tica de reemplazo y para cada distribución. Se puede observar que cuando se supone que los tiempos de falla son modelados por la distribución Weibull, la diferencia entre los intervalos de reemplazo óptimo es 3 dı́as. Como es de esperarse, el costo mı́nimo es más grande en la polı́tica de reemplazo a intervalos constantes. El mismo comportamiento se tiene cuando los tiempos de falla son modelados por la distribución Normal. 77 En las Figuras 3.10 y 3.11 se muestran las gráficas del costo esperado por unidad de tiempo para las dos polı́ticas de reemplazo, según sea la distribución Weibull o Normal. Figura 3.10: Costo esperado por unidad de tiempo. Distribución Weibull Figura 3.11: Costo esperado por unidad de tiempo. Distribución Normal En el Cuadro 3.4 se muestran los costos que se derivan del plan actual de mantenimiento del elevador. Estos costos se calcularon evaluando la función del costo esperado por unidad de tiempo correspondiente a la polı́tica de mantenimiento basado en la edad, para un valor de t = 30 dı́as. 78 Cuadro 3.4: Plan de mantenimiento actual Reemplazo por Intervalo de reemplazo Costo edad (dı́as) ($/dı́a) Weibul 30 58.31 Normal 30 57.89 En lo que que se refiere a qué polı́tica de reemplazo habrı́a que elegir, nuevamente optamos por elegir la polı́tica de reemplazo por edad, que es la que indica el intervalo de reemplazo más grande para cualquiera de las distribuciones. Podemos observar que el intervalo más grande, 15 dı́as, se obtiene cuando los tiempos de falla están normalmente distribuidos. Por otro lado, ¿qué función de distribución es la que vamos a utilizar? Hemos visto que el mejor resultado, 15 dı́as con un costo mı́nimo de $48.98, se obtiene con la distribución Normal; no obstante, computacionalmente con la distribución Weibull se requieren menos cálculos y tiempo para obtener los resultados que con la distribución Normal. Con la aplicación de estas polı́ticas se ha logrado optimizar, bajo ciertas suposiciones, los costos de mantenimiento preventivo del elevador. ¿Qué sucede con los costos de mantenimiento del plan actual? La polı́tica de reemplazo basado en la edad indica que el costo que se genera con el actual intervalo de mantenimiento preventivo, 30 dı́as, es de $58.31 en el caso de la distribución Weibull y $57.89 para la distribución normal. Nótese que ambos costos son más altos que los que sugiere la polı́tica de mantenimiento por edad ($50.48 y $48.98 respectivamente). Por otro lado, hemos hablado de que el mantenimiento preventivo tiene por objetivo aumentar la confiabilidad de un equipo o sistema, y por ende, disminuir la tasa de falla del sistema. En lo que sigue vamos a calcular el M T BF del elevador cuando se consideran actividades de mantenimiento preventivo programadas cada 14 dı́as para después compararlo con el M T BF que se obtiene cuando se lleva a cabo un mantenimiento programado cada 30 dı́as. En la sección 2.4 estudiamos la función de densidad que resulta cuando se practican actividades de mantenimiento preventivo. Se dedujo que la función resultante es de tipo exponencial. De manera general, la función de densidad de falla que se tiene después del mantenimiento preventivo está descrita por (P ∞ k=0 fk (t), si ktp < t < (k + 1)tp fM P (t) = 0, de otra forma. Si consideramos el caso en el que los tiempos de falla del elevador son modelados 79 por la distribución Weibull entonces β−1 ∞ h ik β 1 X 1 1 β −( λ tp )β fk (t) = e (t − ktp ) e−( λ (t−ktp )) λ λ k=0 En nuestro caso tp = 14 dı́as, λ = 19.78 y β = 2.4273. Por tanto (P 2.4273 ∞ −(0.7583)2.4273 k ] (0.05t)1.4273 e−(0.05t) , si ktp < t < (k + 1)tp k=0 0.1227[e fM P (t) = 0, de otra forma. es la función de densidad de fallo con mantenimiento preventivo. Con esto se tiene que Z ∞ tfM P (t) dt M T BF = 0 es el tiempo medio entre fallas con mantenimiento preventivo. Esta expresión se resuelve numéricamente. Una aproximación que ha funcionado en aplicaciones se basa en la tasa de falla sin mantenimiento preventivo. Como fM P (·) es de tipo exponencial, el M T BF con mantenimiento preventivo se puede aproximar usando la expresión 1/h∗ (t), donde h∗ (t) es el valor medio de h(t) en el intervalo [0, tp ], siendo tp la longitud del intervalo de mantenimiento preventivo. La tasa de falla en el caso de la distribución Weibull es β h(t) = λ β−1 t , t≥0 λ Si sustituimos los valores de los parámetros λ y β tenemos que la tasa de falla del elevador para cada valor de t es h(t) = 0.1227(0.05t)1.4273 . Ahora calculamos el valor medio de h(t) en el intervalo [0, 14] Z 14 1 0.1237(0.05t)1.4272 dt h (t) = 14 0 = 0.0306 ∗ De esta última expresión se tiene que M T BF = 32.68 es el valor del tiempo medio entre fallas con mantenimiento preventivo cada 14 dı́as. Hemos visto entonces como las actividades de mantenimiento preventivo programadas cada 14 dı́as, según la polı́tica de reemplazo basado en la edad, mejoran el M T BF del elevador, pasando de 17.54 dı́as, que es la media de la distribución Weibull (ver Figura 3.7) a 32.68 dı́as si se realiza el mantenimiento preventivo. 80 Podemos concluir que el tipo de mantenimiento que resulta óptimo es el de edad a 14 dı́as con un costo de $50.48 que es el mı́nimo. El tiempo medio entre fallas es de 32.68 dı́as, el cual es mejor que el que se tenı́a con mantenimiento programado cada 30 dı́as con un costo de $58.31. Capı́tulo 4 Polı́ticas óptimas de mantenimiento preventivo para sistemas con varios componentes. En el capı́tulo anterior se estudiaron las polı́ticas de reemplazo para un sólo componente. Sin embargo, los sistemas pueden estar formados por dos o más componentes, los cuales pueden estar organizados en distintas configuraciones: sistema en serie, sistema paralelo o sistema mixto; esto según la complejidad del sistema. En este capı́tulo se expone la generalización de las polı́ticas de reemplazo por edad e intervalos constantes para sistemas con varios componentes. Un sistema se define como un conjunto de componentes relacionados entre sı́ para llevar a cabo una misión conjunta. Se supone que estos componentes fallan de manera independiente unos de otros. Los sistemas pueden clasificarse en reparables y no reparables. Los sistemas reparables son aquellos que después de fallar en realizar al menos una de sus funciones requeridas pueden ser restaurados para realizar todas sus funciones por cualquier otro método que no sea el reemplazo del sistema completo. Los sistemas no reparables implican un cambio completo; estos últimos sistemas serán el objeto de nuestro estudio. 81 82 4.1. Confiabilidad de sistemas en serie Se considera que un sistema tiene componentes que están colocados en serie cuando la falla de uno o más componentes antes de terminar el proceso origina la falla de todo el sistema. El tiempo de vida de un sistema en serie es igual al tiempo de vida más pequeño entre todos los componentes del sistema, es decir, el sistema en serie sólo puede durar tanto como su componente más frágil. La confiabilidad de un sistema en serie es menor o igual que la confiabilidad del componente menos confiable. El diagrama de bloques de un sistema en serie con n componentes es mostrado en la Fig. 4.1 Figura 4.1: Diagrama de bloques de un sistema en serie con n componentes Supóngase una serie de n componentes que trabajan de forma independiente. Sea Pi la probabilidad de que el componente i funcione. Si Pss denota la probabilidad de que el sistema funcione, entonces Pss (f uncione) = P1 (f uncione)P2 (f uncione) · · · Pn (f uncione) Sean Fi (t) = Pi (T ≤ t) la función de distribución de la variable aleatoria T , que representa la longitud del tiempo que el componente i funciona y falla en t y Ri (t) = P (T > t) la probabilidad de que el componente i sobreviva al tiempo t (no falle en el intervalo (0,t]). De esta forma, la confiabilidad del sistema para cualquier instante t, es la probabilidad de que todos los componentes sobrevivan en t, por lo que Rss (t) = R1 (t)R2 (t) · · · Rn (t) = n Y Ri (t) i=1 En términos de la función de distribución podemos escribir Fs (t) = 1 − n Y n Y Ri (t) = 1 − (1 − Fi (t)). i=1 i=1 (4.1) 83 Si los n componentes que trabajan de manera independiente tienen la misma confiabilidad, es decir, Ri (t) = R(t), i = 1, 2, · · ·, n entonces Rss (t) = [R(t)]n Ejemplo 4.1.1. Considérese un sistema con dos componentes A y B conectados en serie, cuyos tiempos de falla son modelados por la distribución exponencial. Las tasas de falla para cada componente son 0.2 y 0.5 por 10,000 hrs. respectivamente. ¿Cuál es la confiabilidad del sistema para t = 20, 000 horas? Recordemos que para componentes con tasa de falla constante, la función de confiabilidad es R(t) = e−λt Entonces para el componente A, RA (t) = e−0.2t . De manera similar RB (t) = e−0.5t . Por Ecuación 4.1 se tiene que la confiabilidad del sistema en serie para cualquier instante t es Rss (t) = e−0.2t e−0.5t = e−0.7t Por lo tanto, la confiabilidad del sistema en t = 20, 000 horas es Rss (2) = e−1.4 = 0.2466 Observe que la confiabilidad del sistema es menor que la de cualquiera de sus componentes. 4.1.1. Tasa de falla del sistema La tasa de falla del sistema está dada por hss (t) = n X hi (t) (4.2) i=1 siendo hi (t) la tasa de falla del componente i. La ecuación 4.2 se puede obtener utilizando algunas de las relaciones que se mencionaron en el capı́tulo 1. La definición de la tasa de falla que se dio en la ecuación 1.7 es d hi (t) = − ln(Ri (t)) dt 84 Luego hss (t) = − d ln(Rss (t)) dt Por lo que acabamos de mencionar, se tiene que ! n n Y X − ln Rss (t) = − ln Ri (t) = − ln Ri (t) i=1 i=1 Entonces n d d X − ln Rss (t) = − ln Ri (t) dt dt i=1 n X d (− ln Ri (t)) = dt i=1 = n X hi (t). i=1 4.1.2. Sistema en serie con componentes de distribución exponencial Consideremos un sistema en serie con n componentes para los cuales el tiempo de falla es modelado por la distribución exponencial. Sea λi la tasa de falla del componente i. La función de confiabilidad del componente i está dada por Ri (t) = e−λi t , t ≥ 0 Entonces la función de confiabilidad del sistema en serie con distribución exponencial en cada componente está caracterizada por Rss (t) = e−λ1 t e−λ2 t e−λ3 t · · · e−λn t = e−( donde n X i=1 λi = hss (t) Pn i=1 λi )t 85 Observemos que la tasa de falla de todo el sistema también es constante. Ahora veamos qué sucede con el M T BFss del sistema. De (1.2) sabemos que Z ∞ Rss (t) dt M T BFss = 0 Para el sistema con componentes con distribución del tiempo de falla exponencial queda que Z ∞ Rss (t) dt M T BFss = 0 Z ∞ P n e−( i=1 λi )t dt = Z0 ∞ e−hss t dt = 0 = 1 1 = Pn hss (t) i=1 λi Cuando los componentes son i.i.d. con tasa de falla constante λ se tienen las siguientes ecuaciones: hss = nλ Rss (t) = e−nλt , t ≥ 0 M T BFss = 4.2. 1 nλ Polı́tica de reemplazo por edad para un sistema en serie Recordemos que el objetivo de los modelos de reemplazo es determinar el intervalo óptimo entre reemplazos sucesivos, el cual minimiza el costo total esperado por unidad de tiempo. Ahora vamos a suponer que los n componentes del sistema en serie son reemplazados de manera conjunta. Como en el caso de un sólo componente, los componentes son reemplazados en la falla del sistema o después de un cierto intervalo de tiempo 86 tp , lo que ocurra primero. Nuevamente supondremos que después de cada reemplazo el sistema queda como nuevo, que los reemplazos son instantáneos, que los costos de mantenimiento preventivo son menores que los costos de mantenimiento por falla y que los componentes fallan de manera independiente. La expresión del costo total esperado por unidad de tiempo sigue estando descrita por (3.1). Ahora el costo esperado del ciclo (3.2) se escribe como " # n n Y Y Ri (tp ) Cp Ri (tp ) + Cf 1 − i=1 i=1 El largo esperado de un ciclo definido por (3.3) queda como Z tp Z Rss (t) dt = 0 0 tp n Y Ri (t) dt i=1 Finalmente, la expresión para el costo total esperado por unidad de tiempo para un sistema en serie está dado por Q Q Cp ni=1 Ri (tp ) + Cf [1 − ni=1 Ri (tp )] Css (tp ) = , tp ≥ 0 R tp Qn R (t) dt i i=1 0 Cp y Cf son los costos de mantenimiento preventivo y costo de mantenimiento por falla respectivamente. Ejemplo 4.2.1. Supongamos un sistema en serie formado por 2 componentes idénticos, para las cuales el tiempo de falla es modelado por la distribución Weibull con parámetro de escala λi = 0.01 y parámetro de forma βi = 3.5, i = 1, 2. Cada componente puede ser reemplazado con un costo de $3, 000.00, por lo que el costo de reemplazar el sistema es de $6, 000.00; pero si un componente falla el costo de mantenimiento por falla es de $10, 000.00. ¿Qué tan frecuente deberı́a ser reemplazado el sistema ? Primero vamos a verificar que la tasa de falla del sistema es una función creciente. Recordemos que, en la distribución Weibull, para cada componente i, la tasa de falla está dada por hi (t) = λi βi (λi t)βi −1 , t ≥ 0, i = 1, 2. 87 Entonces la tasa de falla del sistema es hss (t) = 2 X λi βi (λi t)βi −1 i=1 Si sustituimos λi = 0.001 y βi = 3.5, i = 1, 2 nos queda que hss (t) = 2[0.01(3.5)](0.01t)2.5 = 0.07(0.01t)2.5 Podemos observar claramente que hss (·) es una función creciente. Ahora vamos a escribir la expresión del costo total esperado por unidad de tiempo, para cualquier instante tp ≥ 0 La confiabilidad del sistema es Rss (tp ) = 2 Y 3.5 e−(0.01tp ) 3.5 = e−2(0.01tp ) i=1 Por tanto 3.5 3.5 6000e−2(0.01tp ) + 10000[1 − e−2(0.01tp ) ] Css (tp ) = R tp e−2(0.01t)3.5 dt 0 Finalmente, el valor de tp que indica el intervalo de tiempo entre dos reemplazos sucesivos para los componentes del sistema a un costo mı́nimo es tp = 72 unidades de tiempo, a un costo de $124.17 por unidad de tiempo. En la Figura 4.2 se muestra la curva del costo esperado por unidad de tiempo. 4.3. Polı́tica de reemplazo a intervalos constantes para un sistema en serie En esta polı́tica se supone que los componentes del sistema son reemplazados de manera conjunta después de que los componentes han alcanzado una edad de operación tp y cuando fallan. Al igual que en la polı́tica anterior supondremos que después de cada reemplazo el sistema queda como nuevo, que los reemplazos son 88 Figura 4.2: Costo esperado por unidad de tiempo para un sistema en serie con dos componentes Weibull, según la polı́tica de reemplazo por edad. instantáneos y que los componentes fallan de manera independiente. Para esta polı́tica, el largo esperado de un ciclo es tp . El costo total, generado durante un ciclo (3.6), está dado por Cp + Cf Hss (tp ) Donde Hss (tp ) = R tp 0 hss (t) dt es el número esperado de fallas en el intervalo (0, tp ). Finalmente, la expresión para el costo total esperado por unidad de tiempo para un sistema en serie está dado por Css (tp ) = Cp + Cf Hss (tp ) , tp > 0 tp Cp y Cf son los costos de mantenimiento preventivo y costo de mantenimiento por falla respectivamente. Ejemplo 4.3.1. Consideremos nuevamente el sistema en serie del ejemplo anterior. Si se considera la polı́tica de reemplazo a intervalos constantes, ¿qué tan frecuente deberı́an ser reemplazados los componentes del sistema? Vamos a calcular Hss (t), el número esperado de fallas en el intervalo (0, tp ). 89 Sabemos que hss (t) = 0.07(0.01t)2.5 Entonces Z tp hss (t) dt Hss (t) = 0 Z = tp 0.07(0.01t)2.5 dt = 2X10−7 t3.5 p 0 Por tanto, la expresión del costo total esperado por unidad de tiempo se escribe como 6000 + 0.0020tp3.5 , tp > 0 tp En la Figura 4.3 se muestra la curva que representa el costo total esperado por unidad de tiempo para esta nueva polı́tica. C(tp ) = El tiempo óptimo de mantenimiento preventivo es tp = 55 unidades de tiempo, con un costo mı́nimo de $153.96 por unidad de tiempo. Figura 4.3: Costo esperado por unidad de tiempo para un sistema en serie con dos componentes Weibull, según la polı́tica de reemplazo a intervalos constantes Nótese que la polı́tica de reemplazo a intervalos constantes da un óptimo con tiempos de reemplazo menores que la polı́tica de reemplazo por edad y por ello, mayor costo en el óptimo. Por esta razón conviene usar la polı́tica de reemplazo por edad cuando la naturaleza de los componentes lo permitan. 90 4.4. Confiabilidad de sistemas en paralelo Se dice que un sistema tiene componentes que están en paralelo cuando solamente la falla de todas las componentes en el sistema origina la falla del sistema. Es decir, para que un sistema en paralelo funcione, es suficiente que al menos uno de los componentes opere sin falla. El diagrama de bloques para un sistema en paralelo se muestra en la Figura 4.4 Figura 4.4: Diagrama de bloques de un sistema en paralelo con n componentes Supóngase n componentes que trabajan de manera independiente, los cuales están colocados en paralelo. En este caso Psp (nof uncione) = P1 (nof uncione)P2 (nof uncione) · · · Pn (nof uncione) = (1 − P1 (f uncione))(1 − P2 (f uncione)) · · · (1 − Pn (f uncione)) Entonces Psp (f uncione) = 1 − Psp (nof uncione) De ahı́ que la confiabilidad del sistema Rsp (t), está dada por Rsp (t) = 1 − n Y (1 − Ri (t)), t ≥ 0 (4.3) i=1 Es decir, la confiabilidad del sistema en paralelo es uno menos el producto de la probabilidad de falla de cada uno de los componentes. 91 Ejemplo 4.4.1. Supongamos ahora los dos componentes del Ejemplo 4.1.1, pero colocados en un sistema en paralelo. ¿Cuál es la confiabilidad del sistema para t = 20, 000 horas ? La confiabilidad del sistema en cualquier instante t está dada por Rsp (t) = 1 − [(1 − e−0.2t )(1 − e−0.5t )] = 1 − (1 − e−0.5t − e−0.2t + e−0.7t ) = e−0.5t + e−0.2t − e−0.7t Por lo tanto, la confiabilidad del sistema en t = 20, 000 horas es Rsp (2) = e−1 + e−0.4 − e−1.4 = 0.7916 Observemos que en este caso la confiabilidad del sistema es mayor que la confiabilidad de cualquiera de sus componentes. Nuevamente, si suponemos que cada uno de los componentes del sistema tienen la misma confiabilidad, es decir, Ri (t) = R(t), i = 1, 2, · · ·, n, entonces n Y Rsp (t) = 1 − (1 − R(t))n i=1 Recordemos también que la función de densidad de falla de acuerdo a (1.5) se escribe como dRsp fsp (t) = − dt La tasa de falla del sistema, según (1.1), se escribe como hsp (t) = fsp Rsp Por (1.2) el tiempo medio entre falla del sistema es Z ∞ M T BFsp = Rsp (t) dt 0 En un sistema en paralelo sólo se requiere que un componente funcione para hacer que el sistema funcione. El resto de los componentes incluidos en el sistema son llamados componentes redundantes. Éstos son incluidos para aumentar la probabilidad de tener al menos un componente trabajando. La redundancia es una técnica usada ampliamente en ingenierı́a para reforzar la confiabilidad del sistema. En Dodson (2002) [9], se pueden estudiar sistemas más complejos, tales como los sistemas k de n, sistemas de n componentes que son capaces de funcionar correctamente si al menos k de los componentes operan correctamente. 92 4.4.1. Sistema en paralelo con componentes de distribución exponencial Consideremos un sistema en paralelo con n componentes para los cuales el tiempo de falla es modelado por la distribución exponencial. Sea λi la tasa de falla del componente i. La función de confiabilidad del componente i está dada por Ri (t) = e− Rt 0 λi (t) dt = e−λi Rt 0 dt = e−λi t , t ≥ 0 Al sustituir el valor de Ri (t) en (4.3) se tiene la función de confiabilidad del sistema completo Rsp (t) = 1 − n Y (1 − e−λi t ), t ≥ 0 i=1 Ejemplo 4.4.2. Consideremos un sistema en paralelo formado por dos componentes, cuyas tasas de falla son λ1 y λ2 respectivamente. La confiabilidad del sistema es Rsp (t) = 1 − (1 − e−λ1 t )(1 − e−λ2 t ) = e−λ1 t + e−λ2 t − e−(λ1 +λ2 )t La función de densidad de falla es d[e−λ1 t + e−λ2 t − e−(λ1 +λ2 )t ] dt = λ1 e−λ1 t + λ2 e−λ2 t − (λ1 + λ2 )e−(λ1 +λ2 )t fsp (t) = − Entonces la tasa de falla del sistema es hsp (t) = λ1 e−λ1 t + λ2 e−λ2 t − e−(λ1 +λ2 )t e−λ1 t + e−λ2 t − e−(λ1 +λ2 )t Observemos que ahora la tasa de falla hsp (t) es una función que depende de la edad del sistema, aunque la tasa de falla de cada componentes es constante. En la Figura 4.5 se muestra el comportamiento creciente de la tasa de falla del sistema con λ1 = 0.02 y λ2 = 0.01. 93 Figura 4.5: Tasa de falla de un sistema en paralelo con dos componentes con distribución exponencial. ¿Cómo se comporta el M T BF del sistema? Z ∞ M T BFsp = Rsp (t) dt Z0 ∞ = e−λ1 t + e−λ2 t − e−(λ1 +λ2 ) t dt 0 1 1 1 = − λ1 λ2 λ1 + λ2 Ejemplo 4.4.3. Consideremos ahora un sistema con n componentes i.i.d cuya distribución del tiempo de falla es exponencial. Sea λ la tasa de falla de cada componente. Rsp (t) = 1 − Qn i=1 (1 − e−λt ) = 1 − (1 − e−λt )n 94 Z ∞ M T BFsp = Rsp (t) dt 0 Z = = = = = = = ∞ 1 − (1 − e−λt )n dt 0 Z ∞ n X n n−j 1− 1 (−e−λt )j dt j 0 j=0 Z ∞X n n (−1)j+1 e−λjt dt j 0 j=1 Z ∞ n X n j+1 (−1) e−λjt dt j 0 j=1 n X n 1 (−1)j+1 (− )e−λjt |∞ 0 j λj j=1 n X n 1 (−1)j+1 ( ) λj j j=1 n 1X n 1 (−1)j+1 λ j=1 j j n 1X1 = λ j=1 j 4.5. Polı́tica de reemplazo por edad para un sistema en paralelo Al igual que en el caso de los sistemas en serie, vamos a suponer para ambas polı́ticas: reemplazo por edad e intervalos constantes, que los componentes del sistema en paralelo se reemplazan de manera conjunta. La expresión del costo total esperado por unidad de tiempo para un sistema formado por n componentes en paralelo, según la polı́tica de reemplazo por edad (3.5) está dada por 95 Csp (tp ) = Cp [1 − Qn Qn i=1 (1 − Ri (tp ))] + Cf i=1 (1 − Ri (tp )) , tp ≥ 0 R tp Qn [1 − (1 − R (t))] dt i i=1 0 Donde Cp y Cf son los costos de mantenimiento preventivo y mantenimiento por falla respectivamente. Ejemplo 4.5.1. Supongamos un sistema en paralelo formado por 2 componentes idénticos, para las cuales el tiempo de falla es modelado por la distribución Weibull con parámetro de escala λi = 0.01 y parámetro de forma βi = 3.5, i = 1, 2. Cada componente puede ser reemplazado con un costo de $3, 000.00, por lo que el costo de reemplazar el sistema es de $6, 000.00; pero si un componente falla el costo de mantenimiento por falla es de $10, 000.00. ¿Qué tan frecuente deberı́a ser reemplazado el sistema ? Vamos a calcular la función de confiabilidad del sistema. Rsp (t) = 1 − (1 − Ri (t))2 3.5 = 1 − (1 − e−(0.01t) )2 3.5 = 2e−(0.01t) 3.5 − e−2(0.01t) Figura 4.6: Costo esperado por unidad de tiempo para un sistema paralelo con dos componentes Weibull, según la polı́tica de reemplazo por edad. Entonces para cada instante tp ≥ 0 96 3.5 Csp (tp ) = 6000[2e−(0.01t) 3.5 3.5 − e−2(0.01t) ] + 10000[1 − 2e−(0.01t) R tp [2e−(0.01t)3.5 − e−2(0.01t)3.5 ] dt 0 3.5 + e−2(0.01t) ] En la Figura 4.6 se muestra la curva del costo esperado por unidad de tiempo. Por último, tenemos que el tiempo de reemplazo preventivo a costo mı́nimo, según la polı́tica de reemplazo por edad es tp = 94 unidades de tiempo con un costo mı́nimo de $81 por unidad de tiempo. 4.6. Polı́tica de reemplazo a intervalos constantes para un sistema en paralelo La expresión del costo total esperado por unidad de tiempo para un sistema formado por n componentes en paralelo, según la polı́tica de reemplazo a intervalos constantes (3.8) está dada por Cp + Cf Hsp (tp ) , tp > 0 tp Cp y Cf son los costos de mantenimiento preventivo y costo de mantenimiento por falla respectivamente y Hsp el número esperado de fallas en el intervalo (0, tp ). Csp (tp ) = Ejemplo 4.6.1. Supongamos un sistema en paralelo formado por 2 componentes idénticos, para las cuales el tiempo de falla es modelado por la distribución Weibull con parámetro de escala λi = 0.01 y parámetro de forma βi = 3.5, i = 1, 2. Cada componente puede ser reemplazado con un costo de $3, 000.00, por lo que el costo de reemplazar el sistema es de $6, 000.00; pero si un componente falla el costo de mantenimiento por falla es de $10, 000.00. ¿Qué tan frecuente deberı́a ser reemplazado el sistema según la polı́tica de reemplazo a intervalos constantes ? Primero vamos a calcular Hsp (tp ). Sabemos que hsp (t) = fsp (t) con Rsp (t) d[Rsp (t)] dt 3.5 d[1 − (1 − e−(0.01t) )2 ] = − dt 3.5 3.5 = 0.07(0.01t)2.5 e−(0.01t) − 0.07(0.01t)2.5 e−2(0.01t) fsp (t) = − 97 Ası́ que 3.5 3.5 0.07(0.01t)2.5 e−(0.01t) − 0.07(0.01t)2.5 e−2(0.01t) hsp (t) = 2e−(0.01t)3.5 − e−2(0.01t)3.5 En este caso 6000 + 10000 Csp (tp ) = tp R tp 0 hsp (t) dt , tp > 0 En la Figura 4.7 se muestra la curva del costo esperado por unidad de tiempo. Figura 4.7: Costo esperado por unidad de tiempo para un sistema paralelo con dos componentes Weibull. Por último, tenemos que el tiempo de reemplazo preventivo a costo mı́nimo, según la polı́tica de reemplazo a intervalos constantes es tp = 78 unidades de tiempo con un costo mı́nimo de $93 por unidad de tiempo. Al igual que en el caso de los sistemas en serie, para los sistemas en paralelo, la polı́tica de reemplazo por edad sugiere un óptimo con tiempos de reemplazo mayores que la polı́tica de reemplazo a intervalos constantes, y por ende, el costo es menor. También hay que observar que en el caso de los sistemas en serie, los intervalos de reemplazo óptimo, para ambas polı́ticas, son menores que los intervalos de reemplazo óptimos para los sistemas en paralelo. Esto se debe a que las configuraciones en paralelo aumentan su confiabilidad al incrementar el número de componentes. 98 4.7. Sistemas Mixtos Consideremos ahora el siguiente sistema, en el cual se tiene una combinación de sistemas en serie y en paralelo. Figura 4.8: Sistema formado por componentes en serie y en paralelo Figura 4.9: Simplificación del sistema mixto Para poder obtener la confiabilidad de un sistema mixto hay que ir resolviendo por etapas, calculando la confiabilidad de cada uno de los subsistemas en serie o en paralelo formados en cada etapa. Para calcular la confiabilidad del sistema mostrado en la Figura 4.8 lo primero que podrı́amos hacer es encontrar la confiabilidad de los dos pares de componentes colocados en paralelo (cada uno de estos pares se ve como un subsistema). Después habrı́a que resolver la confiabilidad del subsistema en serie, cuyos componentes son A y BC. Enseguida se calcula la confiabilidad del subsistema en paralelo con componentes ABC y G. Por último, se calcula la confiabilidad del sistema en serie formado 99 por los componentes ABCG, D y EF. En la Figura 4.9 se muestra la representación en diagramas de bloques que habrı́a que ir resolviendo. Para ilustrar las polı́ticas de reemplazo por edad y reemplazo a intervalos constantes en un sistema mixto se consideran tres componentes A, B y C cuyos tiempos de falla son modelados por la distribución Weibull. Estos tres componentes se organizan en distintas configuraciones: sistema en serie, sistema en paralelo y sistema mixto. Para cada polı́tica de reemplazo vamos a realizar un análisis de los intervalos de reemplazo óptimo para cada uno de los componentes por sı́ solos, y para cada una de las tres configuraciones, en las cuales suponemos que los tres componentes se reemplazan de manera conjunta. En el Cuadro 4.1 se muestran los parámetros de la distribución junto con los valores de Cp y Cf para cada componente. Cuadro 4.1: Caracterı́sticas de los componentes Componente Parámetro de forma Parámetro de escala Cp Cf A 2 0.001 $5,000 $39,000 B 3 0.005 $7,000 $44,000 C 2.5 0.008 $21,000 $48,000 Primero vamos a buscar el intervalo de reemplazo óptimo señalado por cada polı́tica, para cada uno de los componentes. Cuadro 4.2: Reemplazo por edad Componente Intervalo de reemplazo óptimo Costo A 388 B 91 C 99 mı́nimo($/dı́a) 26.40 116.13 380.81 Cuadro 4.3: Reemplazo a intervalos constantes Componente Intervalo de reemplazo óptimo Costo mı́nimo($/dı́a) A 358 27.93 B 86 122.07 C 76 458.36 100 Figura 4.10: Costo esperado por unidad de tiempo/Reemplazo por edad Figura 4.11: Costo esperado por unidad de tiempo/Reemplazo a intervalos constantes Consideremos ahora la configuración mixta mostrada en la Figura 4.12. Vamos a obtener el intervalo de reemplazo óptimo en ambas polı́ticas, suponiendo que los tres componentes se reemplazan de manera conjunta, es decir, considerando el sistema como un solo componente. 101 Figura 4.12: Sistema mixto Cuadro 4.4: Reemplazo de componentes del sistema mixto Polı́tica Intervalo de reemplazo óptimo Costo mı́nimo de reemplazo (dı́as) ($/dı́a) Edad 113 387.00 Intervalos constantes 105 410.76 Figura 4.13: Costo esperado por unidad de tiempo/Reemplazo conjunto 102 Figura 4.14: Sistema en serie Ahora vamos a obtener el intervalo de reemplazo óptimo del sistema, visto como uno solo, considerando que los tres componentes están colocados en serie como se muestra en la Figura 4.14. Cuadro 4.5: Reemplazo conjunto de componentes del sistema en serie Polı́tica Intervalo de reemplazo óptimo Costo mı́nimo de reemplazo (dı́as) ($/dı́a) Edad 65 875.32 Intervalos constantes 57 962.23 Figura 4.15: Costo esperado por unidad de tiempo/Sistema en serie Por último, considerando que los tres componentes están colocados en paralelo como se muestra en la Figura 4.16, obtenemos el intervalo de reemplazo óptimo del sistema visto como uno solo. 103 Figura 4.16: Sistema en paralelo Cuadro 4.6: Reemplazo conjunto de componentes del sistema en paralelo Polı́tica Intervalo de reemplazo óptimo Costo mı́nimo de reemplazo (dı́as) ($/dı́a) Edad 595 116.41 Intervalos constantes 501 131.09 Figura 4.17: Costo esperado por unidad de tiempo/Sistema en paralelo De los resultados obtenidos para cada una de las tres configuraciones, se puede observar que la configuración en paralelo resulta ser la mejor estrategia, comparada con las configuraciones mixta y en serie, pues en estas el costo es mayor. De estas dos 104 últimas, la configuración es serie es la que señala el intervalo de reemplazo óptimo más pequeño, 65 dı́as en el caso de reemplazo por edad y 57 dı́as en el caso de reemplazo a intervalos constantes. Cabe mencionar que con estos enfoques se podrı́a tener un ahorro en los costos de mantenimiento si en lugar de reemplazar los tres componentes, sólo se reemplaza el componente que falló. 4.8. Mantenimiento Oportunista para Sistemas en Serie Los modelos de mantenimiento oportunista, básicamente se refieren a situaciones en las que el mantenimiento preventivo se realiza tomando oportunidades. Una oportunidad puede ser una falla del sistema, inspecciones de calidad y otras situaciones donde el sistema deja de funcionar. Para la mayorı́a de los sistemas que operan de manera continua, como por ejemplo, generadores de energı́a, petroquı́micas e instalaciones petrolı́feras en alta mar, el costo de una parada de producción puede ser muy costoso, por lo tanto se busca limitar el número de paradas mediante la combinación de varias tareas de mantenimiento con la finalidad de reducir los costos totales de mantenimiento. El objetivo de la polı́tica de mantenimiento oportunista es ahorrar costos cuando conviene realizar el reemplazo de varios componentes en lugar de reemplazarlos por separado. 4.8.1. Descripción del Sistema Considérese un sistema compuesto de q componentes colocados en serie. En éste, la falla de cualquier componente ocasiona la falla del sistema. El objetivo de la polı́tica es seleccionar la combinación de los tiempos de reemplazo de los componentes del sistema, junto con el intervalo periódico de reemplazo τ que generen el costo esperado por unidad de tiempo mı́nimo. Sean τ1 , τ2 , ..., τq los intervalos de reemplazo preventivo óptimos correspondientes a los componentes 1, 2, ..., q respectivamente. Se supone que en cada reemplazo, ya 105 sea preventivo o correctivo, el componente queda como nuevo. Durante cada parada del sistema por mantenimiento correctivo, se debe decidir si se puede tomar la oportunidad de reemplazar de manera preventiva algunos de los componentes que no fallaron. La decisión estará basada en la degradación del componente y el riesgo que se toma si estos componentes fallan antes de alcanzar el siguiente reemplazo preventivo programado. 4.8.2. Estructura de costos En esta sección vamos a clasificar los costos de las actividades de mantenimiento en dos categorı́as: costos fijos y costos variables. Las actividades que generan los costos fijos del mantenimiento son: la movilización de un equipo de reparación, herramientas, transporte y desmontaje y montaje del sistema. El costo fijo de mantenimiento es generado independientemente del número de componentes que sean reemplazados en el sistema. Cuando se combinan varias acciones de mantenimiento, el costo fijo se comparte entre éstas y de esta forma se reducen los costos totales de mantenimiento. Sean Cop y Coc los costos fijos de mantenimiento preventivo y correctivo respectivamente. Consideraremos que Cop < Coc . Los costos variables están relacionados con las caracterı́sticas especı́ficas del componente que será reemplazado tales como: repuestos, mano de obra, herramientas especı́ficas y procedimientos de reparación. También se incluye la pérdida de producción generada durante el tiempo en que se realizan las actividades de mantenimiento. Sean Cip el costo especı́fico de mantenimiento preventivo para el componente i y Cic el costo de mantenimiento correctivo para el componente i. Nuevamente Cip < Cic . Cuando se lleva a cabo un mantenimiento preventivo, el costo total en el sistema es Csp = Cop + X Cip i∈Gp Gp es el grupo de componentes que serán reemplazados de manera preventiva. Cuando se efectúa un mantenimiento correctivo, por la falla del j-ésimo componente, se tiene la oportunidad de reemplazar otros componentes crı́ticos, de acuerdo a una regla definida. El costo correctivo del sistema por la falla del componente j, c Cs,j está dado por 106 c Cs,j = Coc + Cjc + X Cip i∈Gh ,i6=j Gh es el grupo de componentes que serán reemplazados preventivamente durante esta oportunidad. El grupo Gh se definirá con base al deterioro del componente y el riesgo tomado si este componente falla antes de alcanzar el siguiente reemplazo. Vamos a considerar el caso en el que el j-ésimo componente falla en el tiempo tj , entre dos reemplazos programados kτ y (k + 1)τ . La oportunidad de reemplazar el componente i genera un costo esperado Cip Ri (tj ). Si el componente i no se reemplaza en ese momento, puede ocurrir una de las siguientes dos posibilidades: El componente i continúa operando hasta el siguiente reemplazo programado, lo cual originará un costo Cip Ri ((k + 1)τ | tj ). El componente i falla en el tiempo t antes del siguiente reemplazo programado, lo cual originará un costo (Coc + Cic )Fi (t) La decisión de llevar a cabo o no un reemplazo oportunista del componente i, dependerá de la comparación de los costos. Si el costo de efectuar el reemplazo oportunista es menor que el costo correctivo, es mejor cambiar el componente, en caso contrario, el componente se cambiará hasta su siguiente reemplazo programado. Es decir, si Cip (Ri (tj ) − Ri ((k + 1)τ | tj )) < (Coc + Cic )Fi ((k + 1)τ | tj )) Se realiza el reemplazo oportunista del componente i en el tiempo tj . En caso contrario, se deja hasta el siguiente reemplazo programado. 4.8.3. Descripción del modelo El tiempo de reemplazo base τ se define como el tiempo de reemplazo mı́nimo de todos los componentes, es decir, τ = mini=1,...,q τi , donde τi es el tiempo de reemplazo óptimo del componente i, según la polı́tica de reemplazo basado en la edad. Los nuevos intervalos de reemplazo de los componentes se definen como múltiplos del intervalo de mantenimiento τ , es decir, νi = ki τ , donde ki son enteros que satisfacen ki ≥ 1, i = 1, 2, ..., q. Para cada componente, el valor inicial ki es calculado dividiendo el intervalo de reemplazo óptimo del componente i (τi ) por el intervalo óptimo de reemplazo mı́nimo en el sistema, redondeando al entero más cercano. 107 Figura 4.18: Plan de mantenimiento preventivo programado, sin considerar fallas (Laggoune et al.,2009, pág. 1501) De lo anterior se tiene que las variables de decisión del modelo son (τ, k1 , k2 , ..., kq ), donde τ ≥ 0 es variable continua y las variables ki son enteras. En la expresión del costo total esperado por unidad de tiempo intervienen los costos generados a lo largo del ciclo de vida del sistema. Un ciclo va a estar dado por el lapso de tiempo durante el cual todos los componentes del sistema se reemplazan de manera simultánea, y se denotará por Kτ , con K = mcm{k1 , k2 , ..., kq }. En la Figura 4.18 se muestra un sistema, el cual es renovado de manera completa en 12τ . En este punto todos los componentes del sistema son reemplazados de manera simultánea. El costo total esperado por unidad de tiempo de expresa como sigue: q PK X k=1 C(τ, k1 , ., kq ) = j=1 Coc + Cjc + X Cip Fsj (kτ ) + Cop + X Cip Rsj (kτ ) i∈Gpk i∈Ghk ,i6=j Kτ donde Fsj (·) es la función de distribución acumulada del sistema, debido a la falla del j-ésimo componente. Recordemos que para un componente en serie la falla de cualquier componente origina la falla del sistema, entonces Fsj (·) = Fj (·). El grupo Ghk , es el grupo de componentes que se reemplazaran de manera oportunista cuando una falla ocurre en el intervalo ((k − 1)τ, kτ ) y Gpk es el grupo de componentes que serán reemplazados de manera preventiva en el instante kτ . En la Figura 4.19 se presenta el diagrama de flujo del algoritmo que se utiliza para encontrar el conjunto óptimo (τ ,k1 , k2 , ..., kq ), donde τ indica el tiempo mı́nimo de reemplazo y cada ki , i = 1, ..., q fija el tiempo de reemplazo de cada componente, el cual se obtiene al multiplicar ki τ . Como la función que describe el costo esperado por unidad de tiempo está en función de variables continuas y discretas, el algoritmo se basa en simulaciones 108 Monte Carlo, el cual puede manejar ambas variables. Se generan muestras aleatorias de los tiempos de vida de cada uno de los componentes y son usadas para simular el costo total de mantenimiento para diferentes combinaciones (τ, k1 , k2 , ..., kq ). Como el algoritmo de búsqueda requiere un punto inicial, la solución inicial puede ser definida por los tiempos de reemplazo óptimos de cada componente. Estos tiempos proporcionan los valores iniciales ki . Para el número de combinaciones de los valores de ki , i = 1, ...q en lugar de usar el factorial, se reducirán éstas suponiendo que el reemplazo de cada componente sólo puede ser adelantado o retrasado un periodo τ de su valor original, es decir, ki − 1 ≤ ki ≤ ki + 1, i = 1, ..., q. Algoritmo 1. Generar muestras aleatorias de los tiempos de vida de los componentes, ti , de acuerdo a la distribución de probabilidad de falla. El tiempo de falla del sistema es definido por ts = mini=1,...,q ti . Se identifica el componente que produce la falla del sistema. Los reemplazos son programados en los tiempos kτ , donde k es un entero que varı́a de 0 a K. 2. En el k-ésimo reemplazo, el tiempo de falla ts es comparado con el tiempo programado para el reemplazo preventivo kτ . Dos posibilidades existen: i) Si no existe una falla antes de kτ , se lleva a cabo el mantenimiento preventivo programado en kτ , de acuerdo al plan actual. Se pasa al siguiente reemplazo programado (k + 1)τ . ii) Si una falla es observada, falla el sistema y se reemplaza de manera correctiva el componente que falló. En base a la regla descrita arriba, se decide si se toma la oportunidad de reemplazar los otros componentes. Se calculan los costos preventivos. 3. Se generan nuevos tiempos de vida para los componentes reemplazados en el paso 2 (pues nuevos componentes son instalados). Se pasa al siguiente reemplazo programado (k + 1)τ y ası́ hasta que se alcanza el tiempo total para reemplazar todos los componentes de manera simultánea. 4. Repetir los pasos 1-3 para generar nuevos escenarios de manera aleatoria, hasta que se alcanza un número de simulaciones N . 5. El costo total esperado por unidad de tiempo está dado por N K 1 X X c Co + Cjc + N s=1 k=1 X i∈Gh ,i6=j Cip IFk,s + Cop + X Cip IRk,s i∈Gp Donde N es el número de simulaciones, IFk,s y IRk,s son funciones indicadoras para los 109 estados de falla y operación respectivamente. Para el k-ésimo intervalo de reemplazo de simulación s, estas funciones se definen como: ( 1, si el sistema falla IFk,s = 0, si el sistema opera. IRk,s ( 1, = 0, si el sistema opera si el sistema falla. 6. El procedimiento es repetido para diferentes combinaciones de los valores ki . Figura 4.19: Diagrama de flujo para el algoritmo que permite encontrar el intervalo de reemplazo óptimo y la estrategia de grupo (Laggoune et al.,2009, pág. 1501) 110 En el siguiente ejemplo se ilustra el procedimiento de mantenimiento oportunista para un sistema en serie formado por dos componentes. Se comparan los resultados obtenidos con los que se obtienen con las polı́ticas de mantenimiento basado en la edad y mantenimiento a intervalos constantes. Ejemplo 4.8.1. Vamos a considerar un sistema en serie formado por dos componentes A y B, con distintas tasas de falla. Calcularemos los tiempos de reemplazo óptimos de los componentes usando los distintos enfoques que se han estudiado hasta el momento: reemplazo basado en la edad, reemplazo conjunto, es decir, considerando el sistema como un solo componente y reemplazo oportunista. Al terminar compararemos los resultados obtenidos. Se supondrá que los costos fijos tanto de mantenimiento preventivo como correctivo son $600.00 y $8, 0000.00 respectivamente. En el Cuadro 4.7 se muestran los datos correspondientes a los parámetros de la distribución de los tiempos de falla de cada componente, junto con los costos variables de mantenimiento preventivo y correctivo. Cuadro 4.7: Caracterı́sticas de los componentes Componente Parámetro de forma Parámetro de escala Cip Cic A 2.5 500 $600 $5,000.00 B 2.7 200 $200 $400.00 Para empezar vamos a calcular el intervalo de mantenimiento preventivo óptimo de cada componente (sin considerar la configuración en serie), de acuerdo a la polı́tica de reemplazo preventivo basada en la edad. En el Cuadro 4.8 se muestran los óptimos para cada componente. Cuadro 4.8: Reemplazo Basado en la Edad Componente topt Costo mı́nimo ($/dı́a) A 171 11.81 B 72 17.90 En la Figura 4.20 se muestra el comportamiento del costo esperado por unidad de tiempo para cada cada componente. Ahora veamos qué sucede con el reemplazo conjunto de los componentes considerando la configuración en serie. En este caso el tiempo de reemplazo óptimo para los dos componentes del sistema es 73 dı́as, con un costo mı́nimo de $31.51 por dı́a. En la Figura 4.21 se muestra el comportamiento del costo esperado por unidad de tiempo para el sistema. 111 Figura 4.20: Reemplazos separados Figura 4.21: Reemplazo conjunto Por último, vamos a utilizar el enfoque de mantenimiento oportunista para obtener la combinación de los tiempos de reemplazo para cada componente que minimize los costos totales de mantenimiento preventivo. Llamaremos componente 1 al componente A y componente 2 al componente B. Según el algoritmo que se describió anteriormente, el valor de τ es 72 dı́as. Los valores iniciales para los tiempos de reemplazo individuales son k1 = 2 y k2 = 1, es decir, el componente 1 se reemplaza cada dos reemplazos del componente 2 (cada 2τ ). Se realizan 50,000 simulaciones para generar los distintos escenarios y obtener el resultado óptimo. En el Cuadro 4.9 se muestran los resultados obtenidos para las seis diferentes combinaciones 112 que se obtuvieron a partir del grupo inicial {2, 1}. Cuadro 4.9: Solución para diferentes grupos de reemplazo Combinación k1 , k2 Ciclo de vida del sistema(dı́as) τ (dı́as) Costo ($/dı́a) 1,1 71 71 27.1246 2,1 140 70 24.5876 2,2 134 67 31.1893 1,2 136 68 26.2368 3,1 198 66 26.4678 3,2 384 64 28.2886 Se puede observar que de las 6 combinaciones, la {2, 1} es la que minimiza los costos totales de mantenimiento. De hecho, de los tres enfoques este último es el que origina los menores costos. En el reemplazo individual de los componentes, reemplazar los dos componentes genera un costo de $29.71, y si éstos se reemplazan de manera conjunta se genera un costo de $31.51. Los datos de este problema fueron tomados de [10] . Los resultados que se han obtenido no coinciden con los resultados que presenta el artı́culo, pues en éste se usa información no publicada. 4.9. Conclusiones En esta tesis se ha realizado un análisis estadı́stico de los tiempos de falla correspondientes a un componente o sistema. Se estudiaron distintos procedimientos para estimar ya sea la función de distribución del tiempo de falla F (·) o la función de confiabilidad R(·), tanto para datos completos como para datos censurados. A partir de estas funciones se pueden derivar otros de los parámetros que aportan información sobre las confiabilidad de un componente o sistema como son: la tasa de falla y el M T BF . Se estudiaron las distintas polı́ticas de mantenimiento o reemplazo preventivo de sistemas de uno o más componentes. El objetivo de éstas es además de mantener la confiabilidad del componente o sistema, ahorrar costos totales de mantenimiento. En el Capı́tulo 2 se vió que las actividades del mantenimiento preventivo prolongan la vida de los componentes, reduciendo el número de fallas e incrementando el M T BF del sistema. Realizar mantenimiento preventivo a los sistemas les permitirá a éstos mantenerse en buenas condiciones para conseguir un buen rendimiento y los estándares de calidad. 113 Las polı́ticas de mantenimiento preventivo que se expusieron a lo largo de este trabajo indican que la confiabilidad es un factor clave para determinar el costo del ciclo de vida de un sistema. Mejorar la confiabilidad de un sistema cuesta dinero, pero se justifica económicamente si la disminución del costo de falla es, al menos, igual al aumento del costo debido a la mejora de la confiabilidad. Tanto para sistemas de un solo componente como para aquellos de múltiples componentes, la polı́tica de reemplazo basado en la edad es la que genera el intervalo de reemplazo más largo, a diferencia de la polı́tica de reemplazo a intervalos constantes, reduciendo con ello el número de paradas del sistema, las cuales afectan la disponibilidad del mismo. La única desventaja de esta polı́tica es que se tiene que llevar un registro de los tiempos de las falla para calcular la edad del sistema, cosa que no sucede en la polı́tica de reemplazo a intervalos constantes, pues en esta otra los reemplazos preventivos se realizan en intervalos de tiempos fijos, sin tener en cuenta la edad del sistema. Con respecto a los modelos de distribución de probabilidad que más se utilizan en el área de confiabilidad, podemos concluir que la distribución Weibull es la que más se utiliza en la práctica; ya que además de ser muy fácil de manejar, nos permite representar la tasa de falla en las tres zonas de la Curva de la Bañera, dependiendo del valor del parámetro de forma. Recordemos que para el caso de la distribución Exponencial, la cual se caracteriza por tener una tasa de falla constante (tı́pica de los sistemas electrónicos) las polı́ticas de mantenimiento preventivo demostraron no ser una buena estrategia, pues la aplicación de éstas solo genera pérdida de tiempo y dinero. En lo que se refiere al ejemplo del elevador que se presentó en el Capı́tulo 3, se consideró que tanto la distribución Normal como la Weibull, se ajustan bastante bien a los datos, aunque el costo computacional es menor cuando se usa la distribución Weibull. Hay que recalcar que éstas dos distribuciones se ajustaron a un número reducido de datos. De hecho es un tanto difı́cil obtener los datos de falla de un sistema real, pues muchas veces los encargados de éstos llevan un registro de las fallas de los diferentes sistemas que mantienen y anotan sólo los datos. A pesar de esta limitación, se pudieron aplicar las polı́ticas de mantenimiento preventivo y se vió que el tipo de mantenimiento que resulta óptimo es el de edad a 14 dı́as con un costo de $50.48 que es el mı́nimo. El tiempo medio entre fallas es de 32.68 dı́as, el cual es mejor que el que se tenı́a con mantenimiento programado cada 30 dı́as, el cual genera un costo de $58.31. El estudio de las polı́ticas de mantenimiento para sistemas en serie, paralelo y mixto permitió ver que el intervalo de reemplazo óptimo es menor cuando se trata de un sistema en serie; el intervalo empieza a crecer cuando los componentes forman parte de una configuración mixta, y es mayor si los componentes forman parte de una configuración en paralelo. Independientemente de si el sistema está formado por uno o más componentes y de la configuración que se considere, la polı́tica de mantenimiento preventivo basado en la edad siempre es mejor que la polı́tica de mantenimiento a intervalos constantes. 114 Una buena alternativa de mantenimiento preventivo a la configuración en serie es la polı́tica de mantenimiento oportunista. Aquı́ la falla de un componente ocasiona la falla del sistema; en este momento se reemplaza el componente que falló y se evalúa la decisión de reemplazar los componentes que no fallaron, esto en base a la degradación de los componentes y la comparación de los costos de reemplazo por falla y reemplazo programado. Para ilustrar esta polı́tica empleamos la Simulación Monte Carlo para simular el comportamiento real de un sistema en serie formado por dos componentes, cuyo tiempo de falla es modelado con la distribución Weibull. Se calcularon los costos totales de mantenimiento para diferentes planes de mantenimiento preventivo y se seleccionó el plan que generó los menores costos. Los costos que se obtuvieron en el plan de mantenimiento óptimo fueron menores a los que se obtuvieron cuando se realiza el reemplazo conjunto de los dos componentes. Queda pendiente el estudio de las polı́ticas de mantenimiento preventivo para sistemas con más de dos componentes con diferente tasa de falla, suponiendo que tras la falla del sistema, sólo es reemplazado el componente que falló, en vez de reemplazar el sistema completo. Este otro procedimiento permitirá generar un ahorro en los costos totales de reemplazo preventivo. Para finalizar, cabe mencionar que estas polı́ticas serán de utilidad, para aquellas empresas que cuenten con sistemas, para los cuales, una falla inesperada del sistema le representa una gran pérdida de producción o se tengan consecuencias catastróficas; como por ejemplo: las aeronáuticas, las petroquı́micas y generadoras de energı́a, por mencionar algunas. Bibliografı́a [1] Duncan, A. J. (1996).Control de Calidad y Estadı́stica Industrial. Richard D. Irwing, Inc., México. [2] Cristaldi, L., Lazzaroni, M. and Catelani, M. (2011). Reliability Engineering. Springer, Italy. [3] Tobias, P. A. and Trindade, D. C. (1995). Applied Reliability. Thomson Publishing Inc. [4] Crowder, M. J., Klimber, A. C., Smith, R. L. and Sweeting, T. J. (1991). Statistical Analysis of Reliability Data. Chapman & Hall, London . [5] Crespo, A. M. (2007). The Maintenance Management Framework: models and methods for complex systems maintenance. Springer Series in Reliability Engineering. [6] Redondo, J. C. (2007). Un Modelo Matemático Óptimo de Mantenimiento y Fiabilidad Aplicado a la Aviación Comercial. Tesis Doctoral, Universidad Nacional de Educación a Distancia, España. [7] Barlow, R. E. and Frank P. (1996). Mathematical Theory of Reliability. Society for Industrial and Applied Mathematics. [8] Modarres, M. K., Mark and Krivtsov, V. (1999). Reliability Engineering and Risk Analysis. Marcel Dekker, Inc., New York . [9] Dodson, B. and Nolan, D. (2002). Reliability Engineering Handbook. QA Publishing, LLC. [10] Laggoune, R., Chateauneuf, A. and Aissani, D. (2009). Opportunistic policy for optimal preventive maintenance of a multi-component system in continuous operating units. Computers & Chemical Engineering, 33, 1499-1510. [11] Campbell, J. D. and Jardine, A. K. S. (2001). Maintenance Excellence: Optimizing Equipment Life-Cycle Decisions. New York: Marcel Dekker. [12] Smith, P. J. Analysis of Failure and Survival Data. (2002). Chapman & Hall. 115 116 [13] Nakawa, T. (2005). Maintenance Theory of Reliability. Springer Series in Reliability Engineering, London. [14] Wang, H. and Pham, H. (2006). Reliability and Optimal Maintenance. Springer Series in Reliability Engineering, London.