Subido por JORGE MIGUEL CHAIÑA ARANA

La Estad´ıstica en el Mantenimiento y Reempl

Anuncio
Universidad Autónoma Metropolitana-Iztapalapa
División de Ciencias Básicas e Ingenierı́a
La Estadı́stica en el Mantenimiento y Reemplazo
Óptimo en el Control de Calidad
Tesis
Que para obtener el grado de:
Maestro en Ciencias (Matemáticas Aplicadas e Industriales)
Presenta
Raquel Vergara Lazcano
Asesor
Dr. Alberto Castillo Morales
México D.F., Febrero 2014
iv
Dedicatoria
Con todo cariño, a mi familia.
v
Agradecimientos
En primer lugar quiero agradecer a mi asesor, el Dr. Alberto Castillo Morales
por haberme brindado la oportunidad de realizar esta tesis. Agradezco su continuo
apoyo y el esfuerzo que ha realizado para que este trabajo se pudiera concluir.
También agradezco a mis sinodales, por sus aportaciones realizadas para mejorar
y complementar este trabajo.
vii
Índice general
Dedicatoria
III
Agradecimientos
V
Objetivos
1
Introducción
3
1. Conceptos básicos de confiabilidad
1.1. Definiciones preliminares . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1. Función de densidad de probabilidad . . . . . . . . . . . . . .
1.1.2. Función de distribución acumulada . . . . . . . . . . . . . . .
1.1.3. Función de confiabilidad . . . . . . . . . . . . . . . . . . . . .
1.1.4. La tasa de falla . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.5. Tasa de falla acumulada . . . . . . . . . . . . . . . . . . . . .
1.1.6. El valor medio de los tiempos de falla . . . . . . . . . . . . . .
1.1.7. Tasa de fallo promedio . . . . . . . . . . . . . . . . . . . . . .
1.1.8. El p-cuantil . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.9. Estadı́sticos de orden . . . . . . . . . . . . . . . . . . . . . . .
1.2. Relaciones y equivalencias . . . . . . . . . . . . . . . . . . . . . . . .
1.3. Modelos de distribución en Confiabilidad . . . . . . . . . . . . . . . .
1.3.1. Distribución Exponencial . . . . . . . . . . . . . . . . . . . . .
1.3.2. Distribución Weibull . . . . . . . . . . . . . . . . . . . . . . .
1.3.3. Distribución Normal . . . . . . . . . . . . . . . . . . . . . . .
1.3.4. Distribución Lognormal . . . . . . . . . . . . . . . . . . . . .
1.4. Censura de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5. Estimación de parámetros por método de Máxima Verosimilitud (MV)
1.5.1. Estimación del parámetro de la distribución Exponencial . . .
1.6. Estimación no paramétrica . . . . . . . . . . . . . . . . . . . . . . . .
ix
5
5
5
6
6
7
9
9
10
11
12
12
13
13
15
16
20
22
23
24
26
x
1.6.1. Estimación de la función de distribución en caso de observaciones completas . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.2. Estimación de la función de confiabilidad en caso de observaciones censuradas. . . . . . . . . . . . . . . . . . . . . . . . . .
1.7. Estimación de parámetros mediante
linealización de la función de distribución. . . . . . . . . . . . . . . .
1.8. Modelos de vida acelerada . . . . . . . . . . . . . . . . . . . . . . . .
1.8.1. Distribución del tiempo de falla, bajo
vida acelerada . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.8.2. Modelo de Arrhenius . . . . . . . . . . . . . . . . . . . . . . .
1.8.3. Modelo de Eyring . . . . . . . . . . . . . . . . . . . . . . . . .
1.8.4. Ley de la Potencia Inversa . . . . . . . . . . . . . . . . . . . .
26
27
29
34
34
37
39
40
2. Mantenimiento
43
2.1. Tipos de Mantenimiento . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.2. Mantenimiento Correctivo . . . . . . . . . . . . . . . . . . . . . . . . 44
2.3. Mantenimiento Preventivo . . . . . . . . . . . . . . . . . . . . . . . . 45
2.4. Función de densidad de fallo que resulta cuando se practican acciones
de mantenimiento preventivo . . . . . . . . . . . . . . . . . . . . . . . 46
2.5. Función de Mantenibilidad . . . . . . . . . . . . . . . . . . . . . . . . 51
3. Modelos Matemáticos de Polı́ticas Óptimas de Mantenimiento
tiempos de reparación instantáneos
3.1. Polı́tica I. Mantenimiento Basado en la Edad . . . . . . . . . . . .
3.2. Polı́tica II. Mantenimiento preventivo a intervalos constantes . . .
3.3. Aplicación a un caso real . . . . . . . . . . . . . . . . . . . . . . .
con
55
. . 56
. . 61
. . 66
4. Polı́ticas óptimas de mantenimiento preventivo para sistemas con
varios componentes.
4.1. Confiabilidad de sistemas en serie . . . . . . . . . . . . . . . . . . . .
4.1.1. Tasa de falla del sistema . . . . . . . . . . . . . . . . . . . . .
4.1.2. Sistema en serie con componentes de distribución exponencial
4.2. Polı́tica de reemplazo por edad para un sistema en serie . . . . . . . .
4.3. Polı́tica de reemplazo a intervalos constantes para un sistema en serie
4.4. Confiabilidad de sistemas en paralelo . . . . . . . . . . . . . . . . . .
4.4.1. Sistema en paralelo con componentes de distribución exponencial
4.5. Polı́tica de reemplazo por edad para un sistema en paralelo . . . . . .
4.6. Polı́tica de reemplazo a intervalos constantes para un sistema en paralelo
4.7. Sistemas Mixtos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.8. Mantenimiento Oportunista para Sistemas en Serie . . . . . . . . . .
4.8.1. Descripción del Sistema . . . . . . . . . . . . . . . . . . . . .
4.8.2. Estructura de costos . . . . . . . . . . . . . . . . . . . . . . .
73
74
75
76
77
80
81
83
85
87
88
92
93
93
xi
4.8.3. Descripción del modelo . . . . . . . . . . . . . . . . . . . . . . 95
4.9. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
xii
Objetivos
Objetivos generales
El objetivo general de esta tesis es presentar y realizar los análisis estadı́sticos
correspondientes a los tiempos falla de un sistema con uno o más componentes, para
poder realizar una adecuada planeación de los tiempos en los cuales se debe efectuar
el mantenimiento preventivo de los componentes del sistema. Para lograr esto último, se van a aplicar distintas polı́ticas de mantenimiento preventivo: Mantenimiento
Basado en la Edad, Mantenimiento a Intervalos Constantes y Mantenimiento Oportunista para sistemas en serie. Estas tres polı́ticas tienen por objetivo determinar el
intervalo de reemplazo óptimo de los componentes de un sistema a fin de minimizar
los costos totales asociados al mantenimiento.
Objetivos particulares
Los objetivos particulares de la tesis son los siguientes:
Realizar un estudio de los modelos más usados que se ajustan a la distribución
de los tiempos de falla, y a partir de cada uno éstos medir algunas de las
funciones básicas del área de Confiabilidad como son: función de confiabilidad,
tasa de falla y tiempo medio entre fallas.
Estudiar los procedimientos que permitan realizar una estimación paramétrica
de la función de confiabilidad a partir de una muestra dada, independientemente de si los datos de la muestra estén completos o presenten algún tipo de
censura.
Estudiar los procedimientos a partir de los cuales se puede realizar una estimación no paramétrica de la función de confiabilidad tanto para observaciones
completas como para observaciones censuradas por la derecha.
Estudiar la función de densidad de falla que resulta cuando se efectúan actividades de mantenimiento preventivo en intervalos periódicos.
1
2
Estudiar las funciones básicas del área de confiabilidad para sistemas con más
de dos componentes, ya sea que se trate de una configuración en serie, paralela
o mixta.
Estudiar las polı́ticas de mantenimiento preventivo de los elementos de un
sistema: Mantenimiento Basado en la Edad, Mantenimiento a Intervalos Constantes y Mantenimiento Oportunista para Sistemas en Serie.
Introducción
Hoy en dı́a, el rápido avance tecnológico, el desarrollo de productos altamente
sofisticados, el incremento de las perspectivas del consumidor y la intensa competencia global, han obligado a las empresas a mejorar la calidad de sus productos
o servicios. Pero, ¿qué significa calidad? Calidad significa cumplir con los requerimientos especificados en un producto o servicio, para satisfacer las necesidades del
cliente. También se puede entender como las propiedades de una cosa que permiten
apreciarla como igual, mejor o peor que cualquier otra de su misma especie. Sin
embargo, cada vez es más importante la extensión de la calidad en el tiempo de uso
del producto o servicio, y es aquı́ donde aparece el concepto de confiabilidad. La
confiabilidad intenta garantizar que el producto realizará adecuadamente su función
durante un periodo razonable de tiempo.
Todo usuario sabe que independientemente de la perfección del diseño de un sistema, de la tecnologı́a de su producción o de los materiales usados en su fabricación,
a lo largo de su operación se producirán cambios irreversibles, producto del desgaste
u obsolescencia de los materiales. La desviación de esas caracterı́sticas respecto a los
valores especificados es lo que se considera como falla del sistema.
Por consiguiente, la falla del sistema se puede definir como un suceso cuya realización provoca, ya sea la pérdida de capacidad para realizar las funciones requeridas,
o bien la pérdida de capacidad para satisfacer los requisitos especificados.
Hay muchos sistemas para los cuales se puede recuperar capacidad de funcionamiento y se les denomina sistemas recuperables. Para que un sistema recupere la capacidad de realizar una función es necesario realizar ciertas actividades, conocidas como
actividades de mantenimiento.
Existen distintos tipos de mantenimiento: correctivo, preventivo, proactivo y
mantenimiento basado en la condición; éste último ayuda a predecir la falla de un
sistema a través del monitoreo de ciertas caracterı́sticas del sistema.
3
4
En esta tesis sólo se estudiarán el mantenimiento correctivo y preventivo, los
cuales en conjunto ayudarán a predecir un intervalo de mantenimiento preventivo
óptimo para una unidad o sistema.
En el Capı́tulo 1, se inicia con un estudio de los conceptos básicos del área de
Confiabilidad Estadı́stica como son: función de confiabilidad, tasa de falla y tiempo medio para la falla; se definen cada uno de éstos para algunos de los modelos de
distribución de tiempos a la falla: distribución Exponencial, distribución Weibull, distribución Normal y distribución Lognormal. Se realiza un estudio de la estimación
de parámetros por Método de Máxima Verosimilitud, ası́ como de la estimación
no paramétrica, tanto para observaciones completas, como para observaciones censuradas. También se presentan algunos de los modelos de vida acelerada como son:
Modelo de Arrhenius, Modelo de Eyring y Modelo de la Potencia Inversa.
El Capı́tulo 2 trata cuestiones relacionadas con el mantenimiento de un sistema.
Se presentan las definiciones de los conceptos de mantenimiento correctivo y preventivo y se expone la función de densidad que resulta cuando se realizan actividades
de mantenimiento preventivo.
El Capı́tulo 3 se dedica al estudio de las polı́ticas de mantenimiento preventivo
para un solo componente: reemplazo por edad y reemplazo a intervalo constantes.
Estas polı́ticas indican el intervalo de tiempo óptimo para llevar a cabo el reemplazo
o mantenimiento periódico de un cierto componente al menor costo. Se presentan
algunos ejemplos que ayudarán a comprender cada una de las polı́ticas.
En lo que se refiere al Capı́tulo 4, se presentan los conceptos de confiabilidad
para las distintas configuraciones de un sistema: sistema en serie, sistema en paralelo
y sistema mixto. Nuevamente se exponen las polı́ticas de mantenimiento preventivo que se estudiaron en el caso de un solo componente, pero ahora en el caso de
un sistema con múltiples componentes, considerando que éstos forman parte de alguna de las configuraciones que se mencionaron anteriormente. En esta parte, las
polı́ticas de mantenimiento indicarán el intervalo de tiempo para reemplazar todos
los componentes del sistema. Este último enfoque presenta desventajas económicas,
sobre todo cuando el sistema está formado por componentes con distintas tasas de
falla, pues se realizará el reemplazo de componentes que aún continúan funcionando.
Una alternativa a este método es la polı́tica de mantenimiento oportunista, la cual
considera la falla de un sistema como una oportunidad para realizar el reemplazo
preventivo de los componentes que no fallaron en ese momento. El objetivo de ésta
es indicar cuándo y qué componentes de un sistema reemplazar a fin de minimizar
los costos totales de mantenimiento. Al final del Capı́tulo 4 se presenta la polı́tica
de mantenimiento oportunista para un sistema en serie con dos componentes.
Capı́tulo
1
Conceptos básicos de confiabilidad
En este primer capı́tulo se presentan los conceptos básicos utilizados en el análisis
de confiabilidad, ası́ como algunos de los modelos de distribución utilizados para
modelar tiempos a la falla.
1.1.
Definiciones preliminares
Se dice que una falla ocurre cuando un componente o unidad deja de funcionar
como es requerido. Considérese a T como una variable aleatoria que representa el
tiempo a la falla de un componente o sistema, la cual toma valores en el intervalo
[0, +∞); ésta puede ser tiempo real, número de horas de vuelo, número de ciclos de
operación, etc.
1.1.1. Función de densidad de probabilidad
La función de densidad f de la variable aleatoria T se define como la probabilidad
que tiene un componente de fallar en un instante t. Para esta función continua se
cumple que:
f (t) ≥ 0, ∀t ∈ [0, +∞)
R∞
f (t) dt = 1
0
6
1.1.2. Función de distribución acumulada
La función de distribución acumulada F de la variable aleatoria T , representa la
probabilidad acumulada de fallo hasta el tiempo t, es decir
F (t) = P (T ≤ t), ∀t ∈ [0, +∞)
La función F (·) es una función continua y monótona no decreciente, para la cual se
verifica que
lı́mt→−∞ F (t) = 0
lı́mt→∞ F (t) = 1
A partir de la función de distribución F (t), se puede definir la función de densidad
f (t) como
d
f (t) = F 0 (t) = F (t).
dt
1.1.3. Función de confiabilidad
La confiabilidad se define como la probabilidad de que una unidad o componente realice la función para la cual fue diseñado, bajo ciertas condiciones de uso
especificadas, por un periodo de tiempo determinado. Las condiciones de uso son
importantes para definir la confiabilidad, por ejemplo: no duran los mismo unos
neumáticos si se usan en autopista, que si se usan en un camino rural.
La función de confiabilidad R(t), es la probabilidad de que la variable aleatoria
T sea mayor a t:
Z ∞
R(t) = P (T > t) =
f (u) du = 1 − F (t), ∀t ∈ [0, +∞)
t
Esta función es continua y monótona decreciente. Para ésta se cumple que:
R(0) = 1
R(∞) = lı́mt→∞ (1 − F (t)) = 0
7
Por su definición, la función de confiabilidad se utiliza en otras disciplinas tales
como: Medicina, Actuarı́a o Finanzas en las que se realizan análisis de supervivencia.
En estas disciplinas, la función de confiabilidad se conoce como función de supervivencia.
Dentro de las finanzas, el análisis de supervivencia tiene aplicaciones en diversas áreas, en particular en la de seguros, ya sean de vida, de autos, de casas o de
desempleo. Por ejemplo, para calcular el monto las primas de seguros de vida es
importante realizar un estudio de las tasas de mortalidad de los asegurados. Entre
otros estudios, se analiza la probabilidad de muerte en las diferentes edades dadas
ciertas condiciones de salud; a partir de este análisis, es fácil calcular la probabilidad
de que el asegurado fallezca durante la vigencia de la póliza del seguro de vida.
1.1.4. La tasa de falla
Otra de las funciones importantes para modelar tiempos a la falla es la función
de riesgo o tasa de falla h(t). Esta función representa la probabilidad instantánea,
por unidad de tiempo, que tiene un componente de fallar en un instante t, dado que
habı́a funcionado hasta el instante anterior. Analı́ticamente se expresa por la razón:
h(t) =
f (t)
R(t)
(1.1)
siempre que R(t) 6= 0.
Esta razón se puede interpretar como la proporción de fallas en el instante t
relativo sólo a los componentes que no han fallado hasta ese instante. A diferencia
de esta función, la función de densidad f (t) representa la proporción de fallas en el
instante t, pero respecto al total de la muestra.
La tasa de falla se obtiene a partir del lı́mite, cuando ∆t → 0, de la probabilidad
condicionada de que el componente falle antes del tiempo t + ∆t, dado que habı́a
8
funcionado hasta el instante t. De esta forma
h(t) =
=
=
=
=
P (t < T ≤ t + ∆t|T > t)
∆t→0
∆t
P (t < T ≤ t + ∆t, T > t)/P (T > t)
lı́m
∆t→0
∆t
P (t < T ≤ t + ∆t)
lı́m
∆t→0
∆tP (T > t)
F (t + ∆t) − F (t)
1
lı́m
R(t) ∆t→0
∆t
f (t)
R(t)
lı́m
Figura 1.1: Curva de la Bañera
Los expertos de confiabilidad, en algunos casos, utilizan la curva de la bañera
para describir el comportamiento de la tasa de falla en los componentes o sistemas
[?]. En la Figura 1.1 se muestra la gráfica de la función que caracteriza la tasa de
falla a través del tiempo. Se muestran tres zonas: zona infantil, zona de vida útil y
zona de desgaste. En la primer zona, de corta duración, se puede apreciar una tasa
de falla alta pero decreciente, se observa en componentes cuya probabilidad de fallo
es menor a medida que aumenta el tiempo. Aquı́ las fallas aparecen inmediatamente
9
y al cabo de poco tiempo de poner en funcionamiento el sistema; la mayorı́a de las
veces, como consecuencia de defectos de fabricación. En la segunda zona se observa una tasa de falla constante; esta indica que la probabilidad de falla instantánea
es la misma en cualquier momento, es decir, el proceso no tiene memoria, ya que
la posibilidad de falla estando funcionando es idéntica en cualquier momento de la
vida del sistema. Las fallas en esta zona son originadas por causas inexplicables y
fenómenos naturales imprevistos. En la zona de desgaste se observa una tasa de falla
creciente. Ésta se presenta en la mayorı́a de los casos por desgastes u obsolescencia
del ı́tem, es decir, por un proceso de envejecimiento. La tasa de falla creciente en la
zona de desgaste indica que la probabilidad de falla instantánea, teniendo en cuenta
que el componente está funcionando, se incrementa a medida que aumenta el tiempo.
1.1.5. Tasa de falla acumulada
Una vez definida la tasa de falla, se define la tasa de falla acumulada H(t), que
como su nombre lo indica, acumula la tasa de falla a lo largo del tiempo.
Z t
H(t) =
h(u) du.
0
1.1.6. El valor medio de los tiempos de falla
Se pueden considerar dos situciones, dependiendo de la unidad o dispositivo que
se trate.
Si se considera un dispositivo o sistema el cual una vez que falla es restaurado a
su estado de funcionamiento, se define el tiempo medio entre falla, en inglés M T BF
(Medium Time Between Failure). Matemáticamente se tiene
Z ∞
M T BF =
tf (t) dt
0
El M T BF también se puede expresar en términos de la función de confiabilidad,
Z
M T BF =
∞
R(t) dt
0
(1.2)
10
Demostración
Realizamos integración por partes en
Hacemos
R∞
tf (t) dt
0
u = t dv = f (t)dt
du = dt v = −R(t)
Entonces queda que
Z
∞
M T BF =
tf (t) dt
0
=
−tR(t)|∞
0
Z
+
∞
R(t) dt
0
Para el primer término de la última igualdad, se tiene que tR(t) es cero cuando
t = 0, de ahı́ que sólo nos queda por evaluar tR(t) cuando t = ∞, de lo cual resulta
el siguiente lı́mite
lı́m tR(t)
t→∞
Como el anterior es un lı́mite indeterminado, usamos la Ley de L’Hopital, para tener
1
t
=
lı́m
t→∞ R(t)−2 f (t)
t→∞ R(t)−1
R(t)
= lı́m
t→∞ h(t)
lı́m
Siendo h(t) =
f (t)
R(t)
El valor del último lı́mite es nulo siempre que h(t) no sea cero. El hecho de que se
tenga que para un componente o sistema que está funcionando el lı́mt→∞ h(t) = 0,
nos conduce a pensar que el valor de la tasa de falla tiende cada vez más a cero, lo cual
significarı́a que el componente o sistema se perfecciona a medida que pasa el tiempo,
cosa que no sucede. En otras palabras, el sistema debe fallar después de una cantidad
finita de tiempo funcionando. Por este motivo se deduce que lı́mt→∞ h(t) 6= 0.
Finalmente
Z
∞
Z
tf (t) dt =
0
∞
R(t) dt
0
En el otro caso, si el dispositivo no es reparado una vez que falla, como es el caso
de un foco, es usual definir el tiempo medio para la falla, en inglés M T T F (Medium
11
Time To Failure). Al igual que el M T BF , si Rsr (t) indica la confiabilidad del sistema
que es no restaurado una vez que falla, se puede escribir
Z ∞
Rsr (t) dt
MT T F =
0
1.1.7. Tasa de fallo promedio
Otra definición de gran interés es la tasa de fallo promedio entre los instantes t1
y t2 , que denotaremos por AF R(t1 , t2 ),
R t2
h(u) du
AF R(t1 , t2 ) = t1
t2 − t1
1.1.8. El p-cuantil
El p-cuantil de la distribución de la variable aleatoria T es el valor tp de la variable
que separa una probabilidad acumulada p a la izquierda. De este modo, el p-cuantil
tp verifica que
P (T ≤ tp ) = p
Luego, si F es la función de distribución de la variable aleatoria, el p-cuantil se
obtiene como solución de la ecuación
F (tp ) = p
Es decir, tp = F −1 (p), donde F −1 es la función inversa de F .
En la práctica es de gran interés el tiempo de falla mediano t0.5 , que es el menor
punto donde la función de distribución acumulada alcanza el valor de 0.5.
Ejemplo 1.1.1. Calcular el tiempo de falla mediano, suponiendo que el tiempo de
falla es modelado por la distribución exponencial, cuya función de distribución es
F (t) = 1 − exp(−λt), t ≥ 0, λ > 0.
Queremos encontrar el valor de t0.5 para el cual se verifica que
12
1 − exp(−λt0.5 ) = 0.5
exp(−λt0.5 ) = 0.5
−λt0.5 = ln(0.5)
ln 2
t0.5 =
λ
ln 2
Observe que el tiempo de falla mediano, t0.5 =
, que indica que el 50 % de
λ
los componentes habrán fallado cuando se alcanza este valor, es menor que el co1
rrespondiente M T T F , que es . Para este último valor se tiene que la distribución
λ
acumulada, es decir, F (M T T F ) = 1−e−1 ≈ 0.632, lo cual significa que aproximadamente el 63.2 % de los componentes habrán fallado cuando se alcanza el M T T F.
1.1.9. Estadı́sticos de orden
En algunos estudios, como los ensayos de vida, en los que se analiza el tiempo de
falla o duración de ciertos componentes, los datos correspondientes a los tiempos de
falla de un conjunto de componentes son más relevantes si se presentan en un orden
no decreciente.
De esta forma, si t(1) ≤ t(2) ≤ t(n) representa la muestra t1 , t2 , ..., tn ordenada de
menor a mayor, entonces t(k) es el estadı́stico de orden k − ésimo. A los estadı́sticos
t(1) y t(n) se les llama mı́nimo y máximo respectivamente.
1.2.
Relaciones y equivalencias
De las funciones que se definieron anteriormente, se pueden establecer las siguientes relaciones.
1. Relación entre la función de densidad, función de distribución y función de
13
confiabilidad.
d
F (t)
dt
d
f (t) =
(1 − R(t))
dt
f (t) = −R0 (t)
f (t) =
(1.3)
(1.4)
(1.5)
2. Relación entre tasa de falla y función de confiabilidad
R0 (t)
R(t)
d
= − ln R(t)
dt
h(t) = −
(1.6)
(1.7)
3. Relación entre tasa de falla acumulada y función de confiabilidad.
Z
t
H(t) =
h(u) du
0
Z
t
d
− ln R(u) du
0 du
= − ln R(t)
=
Por tanto
Rt
R(t) = e− 0 h(u) du
= e−H(t)
4. Relación entre función de densidad y tasa de falla
Rt
f (t) = h(t)e− 0 h(u) du
= h(t)e−H(t)
= h(t)R(t)
La importancia de conocer las relaciones y equivalencias entre las funciones f ,
h, F y R, se deriva del hecho de que si sólo se conoce una de estas funciones,
se pueden deducir cualesquiera de las otras.
14
1.3.
Modelos de distribución en Confiabilidad
En la literatura se consideran los modelos que mejor han ajustado en los problemas de confiabilidad. Éstos coinciden con los modelos de tiempo de vida en el
Análisis de Supervivencia.
1.3.1. Distribución Exponencial
Esta distribución es utilizada para modelar tiempos de falla que presentan una
tasa de falla constante, es decir, que la probabilidad de fallo, condicionada a que el
elemento o componente esté en uso no varı́a con el tiempo. Los sistemas electrónicos
como por ejemplo, sistemas de generación de estados de cuenta bancarios y cajeros
automáticos son sistemas cuyos tiempos de falla se modelan con esta distribución.
Función de densidad
t ≥ 0, λ > 0
f (t) = λ exp(−λt),
Función de distribución
F (t) = 1 − exp(−λt),
t ≥ 0, λ > 0
Función de confiabilidad
R(t) = exp(−λt),
t ≥ 0, λ > 0
Tasa de falla
h(t) = λ, t > 0
Tiempo medio entre falla(MTBF)
M T BF =
1
λ
Función p-cuantil
tp =
− ln(1 − p)
λ
15
Figura 1.2: Función de confiabilidad de la distribución Exponencial con λ = 0.5, 1
Figura 1.3: Tasa de falla de la distribución Exponencial, λ = 0.5, 1
1.3.2. Distribución Weibull
Esta distribución es utilizada para modelar tiempos de falla que presentan una
tasa de falla que no es constante. Ahora ésta se define a partir de dos parámetros λ,
16
que es el parámetro de escala y β, el parámetro de forma. Según sean los valores del
parámetro β, esta distribución puede presentar tasas de falla crecientes, decrecientes
o constantes. Por ejemplo:
Cuando β = 1, se tiene el caso del modelo exponencial, que tiene una tasa de
falla constante.
Cuando β > 1, se tiene una tasa de falla creciente.
Cuando β < 1, se tiene una tasa de falla decreciente.
Función de densidad
f (t) = λβ(λt)β−1 exp(−λt)β ,
t ≥ 0, λ > 0, β > 0
Función de distribución
F (t) = 1 − exp(−λt)β
Función de confiabilidad
R(t) = exp(−λt)β
Figura 1.4: Función de confiabilidad de la distribución Weibull λ = 1, β = 0.5, 1.5.
17
Tasa de falla
h(t) = λβ(λt)β−1
Figura 1.5: Tasa de falla de la distribución Weibull con λ = 1, β = 0.5, 1.5.
Función p-cuantil
tp =
1
1
(− ln(1 − p)) β
λ
Tiempo medio entre falla (MTBF)
M T BF =
donde Γ(x) =
Γ(n) = (n − 1)!
R∞
0
1
1
Γ(1 + )
λ
β
tx−1 e−t dt. Se define Γ(x) = (x − 1)Γ(x − 1) y para n entero
1.3.3. Distribución Normal
La distribución normal es una de las distribuciones más utilizadas, debido a que
puede representar muchos fenómenos de la vida cotidiana. Esta distribución se define
a partir de dos parámetros, la media µ que indica la tendencia central de un conjunto
de datos, y la desviación estándar σ que cuantifica el grado de dispersión de los datos
18
respecto de la media.
En el área de ingenierı́a esta distribución es utilizada para construir Gráficas
de Control de Procesos, las cuales fueron desarrollados por Shewhart (1931). Una
gráfica de control es un gráfico en el cual se representan los valores de algún tipo
de medición realizada durante el funcionamiento de un proceso continuo, para detectar causas no naturales de variación en el proceso. Se puede decir, que para todo
proceso en el que sólo existe variación inherente o no causada los resultados siguen
las caracterı́sticas de una distribución normal. Es decir, aproximadamente el 67 % de
los resultados van a encontrarse dentro del intervalo ±1s donde s es la desviación
estándar muestral. Aproximadamente el 95 % de los resultados se encuentran dentro
del intervalo ±2s y aproximadamente el 99 % de los resultados se encuentran dentro
del intervalo ±3s.
Figura 1.6: Lı́mites control y su relación con la distribución normal.
La gráfica de control consiste en: una lı́nea central LC y dos pares de lı́neas lı́mite
espaciadas por encima y por debajo de la lı́nea central, que se denominan Lı́mite de
Control Inferior LCI y Lı́mite de Control Superior LCS. Éstos se establecen de tal
manera que los valores situados entre los lı́mites puedan atribuirse a la dispersión
inherente del proceso, mientras que los que caigan fuera puedan interpretarse como
una carencia de control del proceso. Si todos los puntos caen dentro de los lı́mites
de control, pero se observan tendencias, entonces también el proceso está fuera de
control.
En el siguiente ejemplo se presenta la construcción de una gráfica de control para
medias X y rangos R, el cual se utiliza para controlar los dos parámetros básicos de
un proceso: la media y la variación. El rango R, se define como la diferencia entre
los valores máximo y mı́nimo de un conjunto de datos.
19
Para construir la gráfica se deben estimar la media y la desviación estándar. En
la práctica el rango se utiliza como medida de dispersión.
Los lı́mites de control, que se establecen a 3 desviaciones estándar, y la lı́nea
central son:
Para gráfica de medias:
LCI = X + A2 R
LC = X
LCS = X − A2 R
Para la gráfica de rangos:
LCI=D4 R
LC=R
LCS=D4 R
Donde X =
n
X
i=1
X i, R =
n
X
Ri y n es el número de muestras. Los valores A2 y
i=1
D4 [1] son constantes que dependen del tamaño de la muestra. Se recomienda utilizar
un tamaño de muestra igual a 5 y un número de muestras no menor a 25.
Ejemplo 1.3.1. Una empresa de alimentos se dedica a la fabricación de mermeladas. La mermelada se vende en frascos de 200 gramos. El equipo de control de
calidad supervisa el estado de control del proceso, para ello, se extraen cinco frascos
de la lı́nea de producción en intervalos de 10 minutos registrando el peso.
En el siguiente cuadro se muestran los valores obtenidos para la media y rango
de cada una de las 25 muestras que se observaron.
20
No. muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
X
R
200.80 6.00
202.00 6.00
203.00 7.00
200.60 2.00
200.20 11.00
202.80 8.00
200.40 4.00
204.40 4.00
203.40 6.00
202.60 5.00
201.00 4.00
203.00 7.00
203.60 1.00
No. muestra
14
15
17
17
18
19
20
21
22
22
24
25
-
X
R
208.80
198.60
206.40
203.20
200.80
203.80
204.80
204.20
205.60
204.60
203.60
203.00
-
10.00
11.00
4.00
5.00
8.00
4.00
6.00
9.00
2.00
5.00
5.00
4.00
-
Para n = 5 A2 = 0.58 y D4 = 2.11
Figura 1.7: Gráfica de Control X − R
En la Figura 1.7 se observan las gráficas de control tanto para medias como para
los rangos. En la primera gráfica, la gráfica de medias, se puede observar que dos
valores se encuentran fuera de los lı́mites de control, uno por encima del lı́mite superior y otro por debajo del lı́mite inferior, los cuales corresponden a las muestras
14 y 15. Esto es indicio de que el proceso se encuentra fuera de control, es decir,
que además de la variación natural, existe variación causada. En lo que se refiere
a la gráfica de rangos, se puede observar que la variabilidad del proceso permanece
21
estable, pues ninguno de los puntos de encuentra fuera de los lı́mites de control.
En lo que sigue se presentan las diferentes funciones que caracterizan la distribución Normal.
Función de densidad
1
1
f (t) = √ exp −
2
σ 2π
t−µ
σ
2 !
, −∞ < t < ∞, µ ≥ 0, σ > 0
Función de distribución
Z
t
F (t) =
f (x) dx = Φ
−∞
t−µ
σ
Donde Φ es la función de distribución normal estándar, cuyos parámetro son
µ = 0 y σ = 1.
Función de confiabilidad
Z
R(t) =
t
∞
1
1
√ exp −
2
σ 2π
t−µ
σ
2 !
dx = 1 − Φ
t−µ
σ
Tiempo medio entre falla (MTBF)
M T BF = µ
Función p-cuantil
tp = µ + σΦ−1 (p)
donde Φ−1 es la función inversa de la distribución normal estándar acumulada.
22
Figura 1.8: Función de confiabilidad de la distribución Normal, µ = 5,
σ = 0.5, 1, 1.5
Figura 1.9: Tasa de falla de la distribución Normal, µ = 5, σ = 0.5, 1, 1.5
23
1.3.4. Distribución Lognormal
La distribución Lognormal se relaciona con la distribución normal de la siguiente
forma: si X es una variable aleatoria normal con media µ y desviación estándar σ,
entonces la variable aleatoria Y = eX tiene una distribución lognormal con parámetros T50 = eµ y σ. Es decir, el logaritmo de una variable aleatoria lognormal cuyos
parámetros son la mediana T50 = eµ y σ, tiene distribución N (µ, σ). La variable
aleatoria T no asume valores iguales a cero ya que ln T no está definida para T = 0.
La distribución Lognormal es útil es diversas áreas: en Confiabilidad se utiliza
para modelar tiempos de reparación; en Medicina se utiliza para modelar el tiempo
de supervivencia en pacientes con alguna enfermedad como cáncer y en Economı́a se
usa para modelar la distribución personal de la renta y la distribución de ventas.
Función de densidad
2
1 ln t − ln T50
1
,
f (t) = √ exp −
2
σ
σ 2π
t > 0, µ ≥ 0, σ > 0
Función de distribución
Z
t
F (t) =
f (x) dx = Φ
−∞
ln t − ln T50
σ
Función de confiabilidad
Z ∞
1
1 (x − µ)2
ln t − ln T50
√ exp −
R(t) =
dx = 1 − Φ
2
σ
σ
σ 2π
t
Tiempo medio entre falla(MTBF)
2
σ2
σ
M T BF = exp T50 +
= T50 exp
2
2
24
Figura 1.10: Función de confiabilidad de la distribución Lognormal, µ = 0,
σ = 0.5, 1, 1.5
Función p-cuantil
tp = T50 exp(σΦ−1 (p))
Figura 1.11: Tasa de falla de la distribución Lognormal, µ = 0, σ = 0.25, 0.5, 1
25
1.4.
Censura de datos
Con frecuencia ocurre que los datos asociados a tiempos de falla presentan observaciones incompletas, es decir, no se conocen los tiempos de falla de algunas de las
unidades de manera exacta. Para el análisis de los datos se incluye toda la información de las observaciones, aún de aquellas que pudieron perderse durante el estudio
o cuya falla sucede después de haber finalizado el estudio. Por esta razón, los datos
se pueden clasificar en dos categorı́as: completos y censurados. Una observación en
el tiempo t es completa si representa el tiempo exacto en el que ocurrió la falla de la
unidad. Si no se conocen los tiempos de falla de las unidades de manera exacta, sino
sólo los intervalos de tiempo donde ocurrieron o pidieron haber ocurrido las fallas,
se tienen datos censurados.
Existen tres posibles casos de datos censurados: censurados por la derecha, por
la izquierda y por intervalo.
Censura por la derecha.
Se presenta cuando sabemos que la falla ocurre en algún punto posterior al tiempo
de duración del estudio u observación.
Algunos tipos de censura por la derecha son:
Censura tipo I (por tiempos). Se fija un tiempo determinado C para la
duración del estudio, y sobre ese intervalo de tiempo se observan las fallas
ocurridas. En este caso, C es una constante de censura prefijada por el analista
para todas las unidades muestrales.
Censura tipo II (por número de fallas). Se determina una cantidad r < n
de fallas con las cuales concluirá el estudio, n es el número de unidades en
observación.
Es importante señalar que los valores de censura C y r se fijan antes de iniciar
el estudio y no durante el transcurso del mismo.
Censura por la izquierda
Este tipo de censura resulta cuando se sabe que el tiempo exacto de la falla de una
unidad ocurrió antes de un cierto tiempo. Por ejemplo, se puede conocer que cierta
unidad falló antes de las 100 horas pero no se conoce exactamente cuándo. En otras
palabras, tal unidad podrı́a haber fallado en algún tiempo entre 0 y 100 horas.
Censura por intervalo
Este tipo de censura ocurre cuando se sabe que el tiempo de falla ocurre dentro de un
intervalo. Aquı́ el seguimiento de las unidades se realiza periódicamente y por tanto,
26
la falla sólo puede conocerse entre dos periodos de revisión. Por ejemplo, supongamos
que una unidad se inspecciona cada 100 horas; si se inspecciona a las 100 horas y
encontramos que está operando y luego al realizar otra inspección a las 200 horas
encontramos que ésta ya no se encuentra funcionando, entonces solamente se sabe
que la unidad falló en el intervalo 100 y 200 horas.
1.5.
Estimación de parámetros por método de
Máxima Verosimilitud (MV)
Cuando se conoce la forma de la función de distribución del tiempo de falla es
posible estimar los parámetros que la definen a partir de una muestra dada. Los estimadores más frecuentes son los de máxima verosimilitud. Un estimador de máxima
verosimilitud del parámetro de una distribución se obtiene a partir de una muestra
y es el valor del parámetro que da a la muestra la máxima probabilidad de ocurrencia.
Supóngase que T1 , T2 , T3 , ..., Tn son variables aleatorias independientes e idénticamente distribuidas, las cuales representan los tiempos de falla t1 , t2 , ..., tn de n
unidades. Sean f la función de densidad y θ = (θ1 , θ2 , ..., θn ) los parámetros a estimar. La función de verosimilitud se define como la función de probabilidad conjunta
de las variables T1 , T2 , T3 , ..., Tn , evaluada en t1 , t2 , ..., tn .
Si todas las observaciones ti son completas, la función de verosimilitud L va a estar
dada por el producto de las densidades individuales evaluadas en cada observación,
como a continuación se indica:
Y
L(θ) =
f (ti )
i:n
No obstante, hemos visto que las observaciones pueden estar incompletas, es decir, que pueden presentar algún tipo de censura. El caso más común es el de censura
por la derecha, en este caso se supone que en el tiempo en el que se inician las observaciones, t = 0, los componentes se encuentran funcionando .
Para poder caracterizar la función de verosimilitud para observaciones censuradas
por la derecha, se define para cada unidad la función indicadora de censura en el
tiempo vi como
(
1, si ti ≤ vi
δi =
0, si ti > vi .
27
Es decir, si ti es una observación de tiempo de falla, δi = 1, y es una observación
censurada si δi = 0 y en este caso se toma ti = vi como el último momento en
que la unidad fue observada y seguı́a funcionando. De esta forma, se tiene que las
observaciones estarán representadas por la parejas (ti , δi ).
A partir de lo anterior, la función de verosimilitud para observaciones censuradas
por la derecha va a estar dada por
L(θ) =
Y
f (ti )δi R(ti )1−δi
i:n
Entonces, si la observación es completa contribuye a la función de verosimilitud
con su función de densidad, y si es censurada, contribuye con su función de confiabilidad. Cuando las observaciones son censuradas por la izquierda la función de densidad
se reemplaza por la función de distribución y el caso en el que existen observaciones
censuradas por intervalo, la función de densidad se sustituye por la probabilidad de
falla en ese intervalo.
Finalmente, las estimaciones de los parámetros de la distribución se obtienen
maximizando la función L(θ) [3].
1.5.1. Estimación del parámetro de la distribución Exponencial
Supongamos que se tienen t1 , t2 , t3 , ..., tn observaciones independientes de tiempos de falla con distribución exponencial, correspondientes a n componentes puestos
a prueba. Supongamos además que de las n observaciones, n − r son observaciones
censuradas por la derecha.
Recordemos que la función de densidad de la distribución Exponencial está dada
por f (t) = λ exp(−λt), siendo λ el parámetro a estimar. Dado que existen observaciones censuradas por la derecha, la función de verosimilitud queda expresada como:
L(λ) =
n
Y
i
f (ti )δi R(T )1−δi =
n
Y
i
(λ exp(−λti ))δi (exp(−λti ))1−δi
28
Si el valor de censura es el mismo para las n unidades, digamos v y las primeras
r observaciones son completas y las últimas n − r son censuradas en v entonces
r=
r
X
1
i=1
Luego
L(λ) =
r
Y
λ exp(−λti ) (exp(−λv))n−r
i
Para hacer los cálculos más sencillos, tomamos el logaritmo natural de la función de verosimilitud L(λ). Recordemos que el logaritmo es una función monótona
creciente, ası́ que, el máximo de L(λ) y de ln(L(λ)) se alcanzan en el mismo punto.
ln(L(λ)) = r ln λ − λ
r
X
ti − (n − r)(λv).
i=1
Si derivamos respecto a λ obtenemos
r
r X
∂
ln(L(λ)) = −
ti − (n − r)v
∂λ
λ i=1
Finalmente si igualamos la derivada a cero tenemos
r
r X
=
ti − (n − r)v
λ
i=1
Por lo que un estimador para el parámetro λ es
r
.
i=1 ti − (n − r)v
λ̂ = Pr
En esta última ecuación, si consideramos censura de tipo I, t1 , t2 , ..., tr son los
tiempos de falla de las r unidades que fallaron antes de que finalizara la prueba,
en el tiempo v. Por otro lado, si consideramos censura de tipo II, es decir, que la
prueba termina hasta que se presenta el r-ésimo tiempo de falla, entonces v = tr y
el estimador queda expresado como:
r
.
i=1 ti − (n − r)tr
λ̂ = Pr
29
1.6.
Estimación no paramétrica
Ahora se abordarán algunas técnicas no paramétricas que permitirán estimar ya
sea la función de distribución F(t) o alternativamente la función de confiabilidad
R(t) = 1 − F (t)) asociada a las observaciones, tanto para observaciones completas
como para observaciones censuradas.
1.6.1. Estimación de la función de distribución en caso
de observaciones completas
Primero vamos a presentar la función que permite estimar la función de distribución para el caso en que ninguna de las observaciones es censurada.
Sea T una variable aleatoria que representa el tiempo a la falla. Considérese
una muestra de n dispositivos de los cuales se han observado los tiempos de falla
t1 , t2 , ..., tn . A partir de los estadı́sticos de orden de la muestra t(1) < t(2) < ... < t(n)
se define la función de distribución empı́rica de F como:


0, si 0 < t < t(1)
F̂ (t) = ni , si t(i) ≤ t < t(i+1) , i = 1, 2, ..., n − 1


1, si t(n) ≤ t
A partir de la expresión anterior podemos ver que el estimador para la función
de distribución F̂ (t) se caracteriza por
F̂ (t) =
num.observaciones ≤ t
n
Es decir, F̂ (t) representa la fracción de dispositivos que han fallado hasta antes del
instante t. Una vez que se ha estimado la función F (t) podemos obtener el estimador
para R(t): R̂(t) = 1 − F ˆ(t).
Ejemplo 1.6.1. Se realizó una prueba de vida sobre diez dispositivos idénticos, y se
obtuvieron los siguientes tiempos de falla: 89, 132, 202, 263, 321, 362, 421, 473, 575
y 633 horas. Se obtendrá el estimador no paramétrico de la función de distribución
30
para t = 350 horas.
Solución:
Usando la expresión de la función de distribución empı́rica, y puesto que en este
caso n = 10 y hay sólo 5 observaciones cuyo tiempo de falla es inferior o igual a 350
1
5
=
horas, se tiene que F̂ (350) =
10
2
Figura 1.12: Función de distribución empı́rica
En la Figura 1.12 se muestra la representación gráfica de la función de distribución empı́rica de los tiempos de falla. Observe que la gráfica es una función escalonada creciente con saltos discontinuos en cada uno de los tiempos de falla, y dado
1
que todos éstos son distintos, la función crece en proporción 10
en cada uno. Note
también que F̂ (t) = 0 para los valores de t anteriores a la primera falla y F (t) = 1
después del último tiempo de falla.
1.6.2. Estimación de la función de confiabilidad en caso de observaciones censuradas.
Ahora vamos a presentar el estimador de Kaplan Meier, el cual permite obtener
un estimador no paramétrico para la función de confiabilidad cuando las observaciones presentan algún tipo de censura. Se define el estimador de Kaplan Meier para
31
el caso en que se tienen observaciones censuradas por la derecha.
Sea T una variable aleatoria que representa el tiempo a la falla de una unidad.
Considérese una muestra formada por n unidades de las cuales se observan t1 , t2 , ..., tn
tiempos de falla (incluyendo censuras) y sean t(1) < t(2) < ... < t(k) los estadı́sticos
de orden de los k tiempos de falla distintos que fueron observados.
Sean ni el número de unidades bajo observación que están funcionando antes del
instante ti , di el número de dispositivos que fallan justo antes del instante ti y ci el
número de censuras que ocurren en el intervalo [ti , ti+1 ). Se puede ver que n0 = 0,
t0 = 0, d0 = 0 y ni+1 = ni − di − ci , i = 1, 2, ..., k − 1.
Se define el estimador de Kaplan Meier para la función de confiabilidad R(t)
como
R̂(t) =
Y i:t(i) ≤t
di
1−
ni
(1.8)
Ejemplo 1.6.2. Se realizó una prueba de vida con 19 unidades idénticas y se obtuvieron los siguientes tiempos a la falla. Los tiempos censurados están marcados con
un asterisco ∗ .
5, 5, 6, 6∗ , 7, 8∗ , 8, 9∗ , 9∗ , 12, 13, 13∗ , 15∗ , 16∗ , 17, 24, 25, 27∗ , 30∗
Vamos a calcular el estimador de Kaplan-Meier para estimar la función de confiabilidad R(t).
Solución:
En este caso, se tienen 10 observaciones completas y 9 observaciones censuradas.
Como son 10 tiempos de falla distintos, se consideran nueve intervalos durante los
cuales ocurrieron las fallas. En la siguiente tabla, se muestra un resumen de los
cálculos realizados para obtener el estimador de Kaplan-Meier para R(t).
32
i [ti , ti+1 )
0
[0,5)
1
[5,6)
2
[6,7)
3
[7,8)
4
[8,12)
5 [12,13)
6 [13,17)
7 [17,24)
8 [24, 25)
9 [25, +∞)
ni
19
19
17
15
14
10
9
5
4
3
di
–
2
1
1
1
1
1
1
1
1
1 − ndii
–
0.894737
0.941176
0.933333
0.928571
0.9
0.88888
0.8
0.75
0.66666
b
R(t)
1
0.894737
0.842105
0.785965
0.729825
0.656842
0.583860
0.467088
0.350316
0.233544
Note que en el intervalo [0, 5) se observan las 19 unidades y ninguna falla antes
de 5, en el intervalo [5, 6) se observan nuevamente las 19 unidades y ahora fallan 2
en 5, en el intervalo [6, 7) se observan 17 unidades, hay una falla en 6 y una unidad
censurada que afecta sólo al número de unidades observadas.
En la Figura 1.13 se muestra la representación gráfica de la estimación no paramétrica para la función de confiabilidad R(t). Observe que esta representación es una función escalonada que decrece. Cada discontinuidad se produce en los instantes donde
hay fallos y la altura de esta discontinuidad es 1 menos la proporción de fallos en ese
instante.
Figura 1.13: Estimación no paramétrica de R(t)
33
1.7.
Estimación de parámetros mediante
linealización de la función de distribución.
En esta sección veremos como realizar la estimación de los parámetros de las
distribuciones de tiempos de falla, linealizando la función de distribución y luego
resolviendo con regresión lineal.
Primero vamos a linealizar el modelo de distribución, para enseguida mostrar en
un gráfico la lı́nea recta que describe este modelo junto con el conjunto de observaciones, que pueden ser completas o censuradas. En este gráfico vamos a juzgar el
ajuste de las observaciones a la lı́nea recta. Si el ajuste es bueno podemos concluir
que las observaciones se caracterizan por tener dicha distribución. Finalmente, las
estimaciones de los parámetros de la distribución se obtienen a partir de los coeficientes de la ecuación de lı́nea recta: pendiente y ordenada al origen.
Enseguida se muestran las ecuaciones linealizadas para cada uno de lo modelos
que se mencionaron anteriormente. Éstas están dadas en la forma y = ax + b.
Distribución Exponencial
Para esta distribución la ecuación linealizada, a partir de la función de distribución, se escribe como:
− ln(1 − (F (t))) = λt
En este caso el valor estimado del parámetro λ de la distribución exponencial,
estará dado por la pendiente de la recta que pasa por el origen, es decir, λ̂ = a.
Distribución Weibull
De la función de distribución Weibull la ecuación linealizada resultantes es
ln(− ln(1 − (F (t)))) = β ln t + β ln(λ)
(1.10)
Para esta distribución, las estimaciones de cada uno de sus dos parámetros serán
β̂ = a
(1.11)
34
y
b
λ̂ = e β̂
(1.13)
Distribución Normal
Para la distribución Normal se obtiene la siguiente ecuación
Φ−1 (F (t)) =
µ
t
−
σ σ
Los valores de los parámetros estimados son σ̂ =
1
y µ̂ = −bσ̂.
a
Distribución Lognormal
La ecuación linealizada que se obtiene para esta distribución es
Φ−1 (F (t)) =
Aquı́ nuevamente σ̂ =
ln t µ
−
σ
σ
1
y µ̂ = −bσ̂.
a
Hasta este momento sólo conocemos la función de distribución empı́rica, la cual
nos permite estimar F (t); sin embargo, en la práctica se utilizan algunas otras definiciones, las más usada debido a los buenos resultados que presenta es
F̂ (t) =
i − 0.3
n + 0.4
(1.15)
Esta fórmula es conocida como el estimador de Bernard [4],[5] donde i es el
número de fallas que han ocurrido antes o en el instante t. No se debe olvidar que
los tiempos de falla deben estar ordenados.
El siguiente ejemplo ilustra el uso del estimador de Bernard para estimar la
función de distribución.
35
Ejemplo 1.7.1. Considérense 5 modelos de camiones idénticos comprados en las
mismas fechas para realizar la mismas operaciones. Después de 3 meses de operación
se realiza el análisis de fallas de los camiones. Se encontró que ciertas correas 1 de alguna toma de fuerza del sistema de diesel han experimentado un importante número
de fracasos. Después de una investigación se obtuvo la información correspondiente
al tiempo de falla de las correas, contando a partir de t = 0. Ver Cuadro 1.1
Cuadro 1.1: Periodo de falla
Perı́odo (mes) Camión 1 Camión 2 Camión 3 Camión 4 Camión 5
1
Falla
Falla
2
Falla
Falla
3
Falla
A partir del método de linealización vamos a estimar los parámetros de la distribución Weibull, para modelar el tiempo de falla de las correas.
Se sabe que cada camión trabaja aproximadamente 300 horas por mes. El registro
termina al final del tercer mes (hay censura tipo I, pues el final de la prueba se fija
en t=900 hrs.). Se supone que cada vez que falla una correa, ésta es reemplazada por
una nueva y la toma de fuerza funciona como nueva.
En el Cuadro 1.2 se muestran los tiempos de operación de cada correa antes de
que ésta falle. Entre paréntesis se ubica el tiempo de operación en caso de que la
correa haya sido reemplazada anteriormente.
Perı́odo
1
2
3
Cuadro 1.2: Tiempos de falla (horas) de las correas.
(mes) Camión 1 Camión 2 Camión 3 Camión 4 Camión 5
100
250
350
450 (200)
850
En Cuadro 1.3 se muestra el número de horas de operación que lleva la correa de
cada camión al final de la prueba (t=900 hrs).
Ahora vamos a obtener una aproximación de la función de distribución F (t) con
los tiempos de falla mostrados en el Cuadro 1.2. Para ello utilizamos el estimador de
Bernard (Ecuación 1.14), para el cual se requiere que los tiempos de operación estén
1
Una correa es una transmisión flexible que se usa para generar movimiento o transmitir potencia. Las correas se conocen también como bandas.
36
Cuadro 1.3: Tiempo de operación (horas) de las correas al finalizar la prueba.
Camión 1 Camión 2 Camión 3 Camión 4 Camión 5
900
800
550
450
50
ordenados de forma creciente como en el Cuadro 1.4. Se tienen 5 camiones; cada
uno representa una muestra, entonces n = 5. Note que la segunda falla del camión
4 ocurre en el tiempo t = 450, pero ésta llevaba 200 hrs. funcionando.
Cuadro 1.4: Tiempos de falla ordenado en orden creciente.
Orden de la falla Camión Tiempo de operación
1
2
100
2
4
200
3
4
250
4
3
350
5
5
850
En el Cuadro 1.5 se muestran los valores de la estimación para F (t).
Cuadro 1.5: Estimación para F (t) utilizando datos completos sin censura.
ti
Fbi
100 0.13
200 0.31
250 0.5
350 0.69
850 0.87
En la segunda parte, además de considerar los tiempos de falla del Cuadro 1.2,
vamos a considerar los tiempos de falla que resultan de la censura al final del tercer
mes, los cuales se presentan el el Cuadro 1.3. A partir de esta estimación vamos a
estimar los parámetros de la distribución Weibull.
El objetivo de incluir los datos censurados en el análisis es obtener una mejor
estimación de la función de distribución, pues de esta forma evitamos subestimar la
función de confiabilidad. El subestimar la confiabilidad de las correas nos llevarı́a a
pensar que los autobuses requieren de un mantenimiento innecesario.
En el Cuadro 1.6 se muestran todos los tiempos de falla de las correas de cada
camión. Si al finalizar la prueba, la correa seguı́a funcionando, el tiempo de falla
registrado para ésta se considera como un dato censurado.
37
Cuadro 1.6: Tiempos de falla (horas), considerando datos censurados
i Falla-F, Censurada-C Hrs. de operación Camión No. de correa
1
C
50
5
2
2
F
100
2
1
3
F
200
4
2
4
F
250
4
1
5
F
350
3
1
6
C
450
4
3
7
C
550
3
2
8
C
800
2
2
9
F
850
5
1
10
C
900
1
1
Como se tienen datos censurados vamos a utilizar el estimador de Kaplan Meier
(Ecuación 1.8) para obtener la estimación de la función de confiabilidad, R̃(t), a
partir de la cual podemos obtener la nueva estimación de la función de distribución,
F̃ (t). En el Cuadro 1.7 se muestran los resultados obtenidos para cada estimación.
Cuadro 1.7: Estimación para F (t)
i
R̃i
100 0.89
200 0.78
250 0.67
350 0.56
850 0.28
incluyendo datos censurados
F̃i
0.11
0.22
0.33
0.44
0.72
Para terminar, procedemos a calcular los parámetros de la distribución Weibull
haciendo uso de esta última estimación para F (t). En la Ecuación (1.10), la cual
representa la ecuación linealizada para la distribución Weibull hacemos
x = ln t
y
y = ln(− ln(1 − (F̃ (t))))
Utilizamos el método de mı́nimos cuadrados para encontrar la ecuación de la
lı́nea recta que mejor se ajuste a las parejas de puntos (x, y). La ecuación de la recta
ajustada es y = −7.30 + 1.13x. Finalmente por Ecuaciones (1.11) y (1.13) los estimadores de los parámetros de la distribución Weibull son
βb = 1.13
y
b = 627.96
λ
38
Figura 1.14: Estimaciones de la función de distribución acumulada.
1.8.
Modelos de vida acelerada
1.8.1. Distribución del tiempo de falla, bajo
vida acelerada
Cuando se quiere medir la confiabilidad de un componente es necesario tener una
gran cantidad de información correspondiente a los tiempos de falla del componente,
y se requiere que esta información esté disponible en un corto espacio de tiempo.
Para poder obtener esta información de manera más rápida se utilizan pruebas
de vida acelerada en las cuales los componentes son sometidos a condiciones de operación más extremas de lo normal (llamadas también condiciones de estrés), con lo
que se conseguirá acelerar el proceso de desgaste y, en consecuencia, se reducirá la
duración del estudio. Los resultados ası́ obtenidos sobre los tiempos de falla se podrán
extrapolar al caso en el que los dispositivos se encuentran operando en condiciones
normales.
Normalmente lo que se hace es incrementar alguna de las variables aceleradoras
del componente o unidad (temperatura, voltaje, presión, humedad, etc.), esto causa
tiempos de falla menores a los tiempos de fallo en condiciones normales.
39
Una suposición importante que se hace en estos modelos es que cuando el componente se encuentra operando en condiciones de estrés, tendrá el mismo mecanismo
de falla que cuando se encuentra operando en condiciones normales, con la única
diferencia de que la falla aparece más rápido.
El incremento de la variable aceleradora puede ser constante o escalonado. En la
práctica el método más usado es el de aceleración constante. En este método cada
unidad o componente se somete a esfuerzo constante durante el estudio.
Cuando se supone aceleración constante se tiene la siguiente relación para los
tiempos de falla to = t , donde es el factor de aceleración constante, t es el tiempo
de falla bajo condiciones de estrés y to es el tiempo de falla en condiciones normales.
La función de distribución acumulada del tiempo de falla en condiciones normales
Fo (to ) para un cierto tiempo to está dada por
Fo (to ) = P (To < to )
to
To
<
= P
= P (T < t )
to
= F
De modo que Fo (to ) = F to .
La función de densidad en condiciones normales de operación para un cierto
instantes t es
d
t
fo (t) =
F
dt
1
t
=
f
La función de confiabilidad en condiciones normales de operación para un cierto
tiempo t es
t
t
Ro (t) = 1 − Fo (t) = 1 − F
=R
La tasa de falla bajo condiciones normales de operación para un cierto tiempo t
40
es
fo (t)
Ro (t)
1
f ( t )
= t R 1
t
=
h
ho (t) =
Enseguida se muestra la función de confiabilidad de los modelos de distribución
de confiabilidad bajo condiciones de operación normales, a partir de la estimación
bajo condiciones aceleradas con factor de aceleración .
Distribución Weibull
λ
β
R(t) = e−( t)
Distribución exponencial
λ
R(t) = e−( t)
Distribución Normal
R(t) = 1 − Φ
t − µ
σ
Distribución Lognormal
R(t) = 1 − Φ
ln t − ln − µ
σ
Ejemplo 1.8.1. Un componente se probó en 180 o F , se encontró que el tiempo de
falla sigue una distribución Weibull con parámetro de forma β = 3.5 y parámetro
1
de escala λ = 19.3
. La temperatura con la cual opera el componente en condiciones
o
normales es 110 F y el factor de aceleración entre estas dos temperaturas es 12.
Determinaremos la confiabilidad del componente bajo condiciones de operación normales en t = 200.
Sabemos que la confiabilidad del componente en cualquier instante de tiempo
está dada por
" 3.5 #
t
R(t) = exp −
12(19.3)
41
Entonces en t = 200 la confiabilidad del componente es
" 3.5 #
200
R(t) = exp −
= 0.550
12(19.3)
Para determinar el factor de aceleración se utilizan los modelos de aceleración,
que usan datos de falla que fueron obtenidos en condiciones aceleradas (o de estrés).
Éstos suponen que el tiempo de falla es una función del estrés aplicado y otros valores
constantes. Como los tiempos de falla son completamente aleatorios, un modelo de
aceleración se interpreta como una ecuación que calcula el parámetro de escala de
una distribución o cualquier p-cuantil como una función de las variables de estrés
aplicado.
Los modelos de aceleración más utilizados son: Modelo de Arrhenius, Modelo de
Eyring y Ley de la Potencia Inversa.
1.8.2. Modelo de Arrhenius
El modelo de Arrhenius se utiliza en pruebas aceleradas de componentes en los
que el mecanismo de fallo analizado se puede acelerar por temperatura. Resulta muy
útil en ensayos acelerados de componentes electrónicos, porque muchos de los mecanismos de fallos de estos componentes se aceleran por temperatura.
El modelo de Arrhenuis se representa por la siguiente ecuación
c
tp = ke temp
(1.16)
Donde:
tp es el tiempo en el cual una proporción p de la población falla.
temp es la temperatura absoluta (medida en grados Kelvin, o K =o C + 273.16).
k y c son constantes.
En el siguiente ejemplo vamos a ver cómo determinar las constantes del modelo
de Arrhenius, a partir del décimo cuantil de la distribución del tiempo de falla. La
estimación de las constantes del modelo es independiente del p-cuantil que se considere; no obstante t10 y t50 son los que más se utilizan en la práctica.
Ejemplo 1.8.2. Un componente fue probado en cuatro diferentes temperaturas. Los
parámetros estimados de la distribución Weibull fueron los siguientes:
42
Temperatura
β
λ
30o C
3.16
0.0011
50o C
3.08
0.0024
100o C
3.14
0.0051
150o C
3.10
0.0096
Vamos a determinar la constantes del modelo de Arrhenius y estimaremos el
factor de aceleración para una temperatura de 70o C. Se supone que 20o C es la temperatura a la cual el componente opera en condiciones normales.
Solución:
Primero vamos a determinar el cuantil t10 para cada una de las distribuciones de
Weibull. Para esta distribución se tiene que
tp =
1
1
(− ln(1 − p)) β
λ
Entonces, los cuantiles obtenidos son
Temperatura
t10
30o C
447.52
50o C
196.93
100o C
96.34
150o C
50.61
Para poder determinar las constantes vamos a linealizar el modelo de Arrhenius,
con lo que nos queda
c
ln tp =
+ lnk
temp
Podemos observar que esta última ecuación es de la forma y = ax+b, con a = c y
b = ln k. Estimamos los valores de las dos constantes usando el método de regresión
1
como variable independiente y ln tp como variable
lineal simple, considerando temp
dependiente. En la siguiente tabla se muestra la información requerida para usar el
método de regresión lineal.
t10
447.52
196.93
96.34
50.61
ln(t10 )
6.1037
5.2828
4.5679
3.9241
Temperatura o C
30
50
100
150
Temperatura o K
303.16
323.16
373.16
423.16
1
temp
0.0032986
0.0030944
0.0026798
0.00023632
Los parámetros de la lı́nea recta que mejor se ajustan a los datos son a = 2207.8
y b = −1.3425. Entonces las constantes del modelo de Arrhenius son
k = eb = e−1.3425 = 0.2615 y c = 2207.8
43
Para terminar, calculamos el factor de aceleración para una temperatura de 70o C.
Sabemos que to = t . Se usan los cuantiles t10 en 20o C y 70o C y se tiene
=
t10,20
t10,70
El estimador para t10 en 20o C es
2207.8
t10,20 = 0.2612e 20+273.16 = 487.15
El estimador para t10 en 70o C es
2207.8
t10,70 = 0.2612e 70+273.16 = 162.20
Finalmente el factor de aceleración en 70o C es
=
487.15
= 2.996.
162.20
1.8.3. Modelo de Eyring
Este modelo supone que existen varios factores que provocan estrés en el componente y aceleran el fallo. Uno de estos factores es siempre la temperatura, mientras
que los otros pueden ser el campo eléctrico, el voltaje, la humedad, el estrés mecánico,
la corriente eléctrica, ciclos de temperatura, etc. Dos factores comúnmente usados
son la temperatura y la humedad.
La forma simple del modelo de Eyring, donde sólo se consideran dos factores,
temperatura y voltaje, se caracteriza por la siguiente ecuación
b
tp = ae temp V −c
(1.17)
Donde:
tp es el tiempo en el cual una proporción p de la población falla.
temp es la temperatura absoluta (medida en grados Kelvin, o K =o C + 273.16).
V es el voltaje.
a, b y c son constantes.
Para poder encontrar los valores de las tres constantes a, b y c se linealiza la
ecuación del modelo (Ec. 1.17). Se obtiene la siguiente ecuación
ln t = ln a +
b
+ c(− ln V )
temp
44
Observe que esta última ecuación es de la forma y = a + bx1 + cx2 . Como ahora se
tienen dos variables independientes utilizamos el método de regresión lineal múltiple
para obtener los parámetros del plano que mejor se ajuste a un conjunto de datos,
1
y − ln V como las variables
suponiendo ln t como la variable dependiente y temp
independientes x1 y x2 respectivamente.
Ejemplo 1.8.3. Se realizan pruebas a un componente en tres niveles de temperatura y voltaje diferentes, los cuales se muestran en la siguiente tabla junto con los
valores de t50 . Vamos a determinar los valores de las constantes del modelo de Eyring.
t50
45
38
35
29
23
Temperatura o C
30
60
30
60
45
Voltaje V
20
20
40
40
30
En la siguiente tabla se muestran los datos necesarios para realizar el análisis de
regresión lineal múltiple.
t50
45
38
35
29
23
ln(t)
3.8066
3.6376
3.5553
3.3673
3.4965
T (o C)
30
60
30
60
45
T (o K)
303.16
333.16
303.16
333.16
318.16
V 1/T (o K)
20 0.00329
20 0.00300
40 0.00329
40 0.00300
30 0.00314
−lnV
-2.9957
-2.9957
-3.6889
-3.6889
-3.4012
Después de realizar el análisis de regresión lineal múltiple en el paquete Minitab
se obtienen los siguientes valores para la ecuación del plano que mejor se ajusta a
los datos: a = 2.95, b = 601.52 y c = 0.383. Con estos valores se procede como en el
ejemplo anterior para obtener el factor de aceleración .
1.8.4. Ley de la Potencia Inversa
Este modelo resulta de utilidad cuando la vida del componente es inversamente
proporcional al estrés aplicado. Se utiliza frecuentemente con estrés de tensión y
estrés de fatiga por estrés cı́clico, como por ejemplo vibración mecánica. La ecuación
que caracteriza este modelo es
45
tp =
A
Sc
(1.18)
Donde:
tp es el tiempo en el cual una proporción p de la población falla.
S es el estrés aplicado.
A y c son constantes.
Esta ecuación es una simplificación del modelo de Eyring, sólo que en éste no se
considera la temperatura.
La forma linealizada del modelo que nos permitirá encontrar los valores de las
constantes A y c es
lntp = lnA − clnS
46
Capı́tulo
2
Mantenimiento
Hoy en dı́a las empresas buscan asegurar y mejorar su competitividad por medio
de esfuerzos, acciones y decisiones orientadas que garanticen equipos o sistemas que
operen de manera eficiente y eficaz; clientes y usuarios satisfechos; riesgos reducidos;
mı́nimos incidentes ambientales y costos óptimos.
El análisis RAMS incluye todas las consideraciones que deben tomarse en cuenta
para poder desarrollar un nuevo producto o servicio. RAMS agrupa cuatro conceptos:
Confiabilidad (Reliability), Disponibilidad (Availability), Mantenibilidad (Maintainability) y Seguridad (Safety). La confiabilidad se define como la capacidad de que
un equipo o sistema opere sin fallar durante un periodo determinado y bajo ciertas
condiciones previamente establecidas; en consecuencia, si estas condiciones cambian,
la confiabilidad del sistema también cambiará. La Disponibilidad es la capacidad del
sistema para funcionar en un determinado instante. La Mantenibilidad es la capacidad de ser mantenido o reparado preventiva y correctivamente con objeto de mejorar
su disponibilidad. Durante el proceso de diseño se debe considerar la mantenibilidad
como un criterio fundamental para conseguir calidad de servicio y ahorro de costes
en el futuro. La experiencia ha demostrado que un ahorro en la inversión inicial
puede suponer un gasto mucho mayor en mantenimiento. Por último se considera la
Seguridad, que se define como la capacidad de operar sin producir daños al usuario
o a su entono.
El usuario considera que un componente o sistema es confiable si realiza adecuadamente la tarea para la que ha sido diseñado a lo largo de su vida útil. En
realidad no existen equipos totalmente confiables, pues siempre hay una probabilidad de falla, la cual debe reducirse hasta valores suficientemente pequeños los cuales
permitan la aceptación de los dispositivos por parte de la usuarios.
Las fallas de un componente pueden clasificarse según diferentes criterios. Por
48
la forma en que aparecen pueden ser catastróficas o por degradación. Las fallas
catastróficas son consecuencia de un cambio brusco en un parámetro o caracterı́stica operativa del componente, mientras que las fallas por degradación se deben al
desgaste de los materiales. Según el momento en que aparecen pueden ser: fallas
infantiles, fallas por azar o aleatorias y fallas por desgaste u obsolescencia. Las fallas
infantiles se producen en productos recién salidos de fábrica, y son la consecuencia
de los defectos de fabricación no detectados en la inspección. Este tipo de fallas
pueden disminuirse con un buen control de calidad y son las que normalmente cubre
la garantı́a. Las fallas por azar se deben a circunstancias desfavorables para el componente o sistema y se pueden presentar durante toda su vida útil. Las fallas por
desgaste se presentan después de que el sistema ha tenido un largo periodo de uso.
Si se considera la relación entre las fallas, pueden ser primarias o secundarias. Son
primarias cuando se producen sin que ninguna otra falla las haya provocado, y secundarias cuando fueron originadas por una primera falla.
Para disminuir el impacto negativo de los procesos de desgaste de un componente,
se aplican tareas de mantenimiento preventivo, las cuales tienen por objetivo anticiparse a la falla para evitar problemas y al mismo tiempo asegurar que el componente
o sistema funcione de manera continua y en las mejores condiciones.
2.1.
Tipos de Mantenimiento
El mantenimiento se define como la combinación de actividades mediante las
cuales un equipo o sistema se mantiene, o se restablece a un estado en el que puede
realizar las funciones para la cual fue diseñado o asignado. El objetivo del mantenimiento es mantener la confiabilidad del sistema, es decir, conservarlo de la mejor
manera posible.
Hay dos categorı́as básicas de mantenimiento: mantenimiento correctivo y mantenimiento preventivo o planificado.
2.2.
Mantenimiento Correctivo
El mantenimiento correctivo se realiza después que ocurre una falla, es decir,
cuando el equipo es incapaz de seguir operando o no está cumpliendo la función para
49
cual fue diseñado o asignado. El objetivo de este tipo de mantenimiento consiste en
llevar los equipos después de una falla, a sus condiciones operativas, por medio de
restauración o reemplazo de componentes o partes [6]. En este tipo de mantenimiento
se incluyen las tareas no programadas, que son consecuencia de una falla repentina
en el sistema o producto, como son:
Identificación de la falla
Localización del elemento en falla
Desensamble
Reemplazo o arreglo
Ensamble
Pruebas
Verificación
2.3.
Mantenimiento Preventivo
El mantenimiento preventivo se define como una serie de tareas planeadas y
programadas previamente con base en el tiempo, el uso o la condición del equipo, y
que se realizan a fin de evitar la ocurrencia de las fallas. Su objetivo es mantener los
equipos bajo condiciones especı́ficas de operación [6]. Las tareas que se generan con
este tipo de mantenimiento incluyen las siguientes actividades:
Desensamble
Reemplazo o arreglo
Ensamble
Pruebas
Verificación
Se ha mencionado antes que el comportamiento de la tasa de falla de un componente se puede dividir en tres etapas: infantil, de vida útil y de desgaste. ¿Qué beneficios se obtienen si se realiza el mantenimiento preventivo en cada una de estas etapas?
Para la etapa infantil en donde la ocurrencia de fallas se debe principalmente a defectos de fabricación, las actividades de mantenimiento preventivo incrementarı́an la
50
tasa de falla, puesto que el mantenimiento restaura el componente o sistema al estado
inicial, entonces el sistema se restaura a un estado en el cual se tiene una tasa de falla
alta y por ende, aumentarı́a el número de fallas. Respecto a la etapa de vida útil, el
mantenimiento preventivo únicamente originarı́a pérdida de tiempo y dinero, pues
en esta etapa las fallas son consecuencia de averı́as accidentales debidas a factores
externos. Las fallas que si se pueden prevenir con mantenimiento son las de la etapa
de desgaste, ya que en esta etapa la tasa de fallas es creciente, es decir, depende de la
edad del componente; por lo tanto el mantenimiento preventivo restaura el sistema
a un estado en el cual la tasa de fallas es mas baja.
De acuerdo a lo dicho en el párrafo anterior, se establece una diferencia entre los
equipos electrónicos, cuyos componentes básicamente responden a fallas por causas
completamente aleatorias, y los equipos mecánicos, en los cuales domina la falla por
desgaste. En los equipos electrónicos el mantenimiento preventivo normalmente no
sólo no aporta ventaja alguna, sino que llevarı́a a desperdiciar gran parte de la vida
útil de los componentes, agregando el costo de la acción preventiva.
2.4.
Función de densidad de fallo que resulta
cuando se practican acciones de mantenimiento preventivo
Sea f (t) una función de densidad de fallas que da origen a una tasa de fallas
creciente con el tiempo. Se quiere hallar la función de densidad de fallas fM P (t) que
resulta cuando se practican acciones de mantenimiento preventivo.
Las acciones de mantenimiento preventivo, que se realizan a intervalos de tiempo
tp , determinan una nueva función de densidad de fallas, pues los componentes sólo
pueden fallar dentro del intervalo [0, tp ] después del cual se lleva a cabo el mantenimiento preventivo.
Sea
(
f (t), si 0 ≤ t ≤ tp
f1 (t) =
0,
si t > tp
Vamos a describir la nueva función de densidad de fallos, fk (t), para cualquier
instante t > tp .
51
Observe que la función f1 (t) nos permite calcular la probabilidad de fallo en el
intervalo [0, tp ]. De esta forma, la función de confiabilidad obtenida con base en f (t)
sólo tiene validez en el intervalo [0, tp ]; denotemos ésta como R0 (t).
Debido a que después de una intervención (correctiva o preventiva) el equipo
queda como nuevo, si consideramos entonces la intervención k tendremos
lı́m R(ktp + ∆t) = 1, k = 0, 1, 2, · · · , n
∆t→0
Por tanto, dentro de cualquier intervalo (ktp , (k + 1)tp ), a partir de una intervención, la función de densidad de fallos será una réplica de la densidad de fallos entre
0 y tp .
Sabemos que R(tp ) es la probabilidad de que el componente no falle durante un
intervalo cualquiera [0, tp ]. Entonces, ¿cuál será la probabilidad de que el componente
siga en funcionamiento en un instante t cualquiera posterior a ktp ?
t = ktp + tm ,
k = 1, 2, 3, ..., n,
0 < tm < tp ,
tm = t − ktp
Ésta será la probabilidad de que el sistema haya funcionado desde el instante
t = 0 hasta el instante t = ktp y de que no se produzca un fallo en el intervalo
ktp < t < ktp + tm
Como la confiabilidad en el intervalo (0, tp ) es R(tp ), la probabilidad de que no
haya fallado en ninguno de los k intervalos anteriores es
R(ktp ) = [R(tp )]k
Por otro lado,
Z
R(tm ) = 1 − F (tm ) = 1 −
tm
f1 (t) dt
0
Entonces la función de confiabilidad en t con mantenimiento preventivo RM P es
RM P (t) = R(ktp + tm )
= R(ktp )R(tm )
= [Ro (tp )]k Ro (t − ktp )
Por lo tanto, la función de densidad de fallo fk (t) dentro del intervalo
52
(ktp , (k + 1)tp ) estará dada por
dRM P (t)
dt
d[Ro (tp )]k Ro (t − ktp )
= −
dt
dR
o (t − ktp )
= −[Ro (tp )]k
dt
k
= [Ro (tp )] f1 (t − ktp )
fk (t) = −
Finalmente, la función de densidad del tiempo de falla cuando se efectúa mantenimiento preventivo, se puede escribir como:
fM P (t) =
∞
X
∞
X
fk (t) =
[Ro (tp )]k f1 (t − ktp ),
t≥0
k=0
k=0
Es decir, la probabilidad instantánea de que ocurra una falla en un instante
t = ktp + tm con 0 < tm < tp y k = 1, 2, 3, ..., siendo que en los instantes t = ktp se
realiza mantenimiento preventivo, está dada por la suma de las densidades de fallo
en cada uno de los intervalos (ktp , (k + 1)tp ).
Se puede observar que fM P (t) ≥ 0
Z
∀t ∈ [0, +∞) y además
∞
fM P (t) dt =
0
Z
=
∞
∞X
0
=
[R(tp )]k f1 (t − ktp ) dt
k=0
∞
X
k
Z
k=0
(k+1)
f1 (t − ktp ) dt
[R(tp )]
k
Z (tp )
1
=
f (t) dt
1 − R(tp ) 0
1
F (tp )
=
F (tp )
= 1
Hay que notar que el efecto del mantenimiento preventivo periódico es alterar la función de densidad de falla de su forma original a una de tipo exponencial. Por tanto,
la tasa de falla que en un principio era creciente, con el tiempo se puede aproximar
a una tasa de falla constante, que no crece. Esto es, el mantenimiento preventivo
periódico elimina las fallas por desgaste u obsolescencia del dispositivo, dejando la
posibilidad de que sólo ocurran fallas que puedan ser originadas por algún fenómeno
53
imprevisto.
Ejemplo 2.4.1. Un componente tiene una función de densidad de falla f (t) que
tiene una distribución uniforme entre [0,10] años, es decir,
(
1
, si 0 ≤ t ≤ 10
f (t) = 10
0, si t > 10
El componente es sometido a mantenimiento preventivo 1 vez al año. Vamos a
calcular la función de densidad resultante cuando se considera el efecto del mantenimiento, para después comparar el M T BF original y el M T BFM P que resulta cuando se efectúa el mantenimiento preventivo.
A partir de la función de densidad de fallo se tiene que la función de distribución
de fallo es
(
t
, si 0 ≤ t ≤ 10
F (t) = 10
1, si t > 10
Figura 2.1: Funciones estadı́sticas sin efecto del mantenimiento
La función de confiabilidad es
R(t) = 1 −
t
,
10
0 ≤ t ≤ 10
54
Y la tasa de fallo queda como sigue:
h(t) =
0.1
1
=
1 − 0.1t
10 − t
En la Figura 2.1 se muestran las funciones de densidad, distribución, confiabilidad y tasa de falla del componente, sin considerar el efecto del mantenimiento.
Para calcular el M T BF hacemos
Z 10
Z 10
R(t) dt =
(1 − 0.1t) dt
0
0
Z 10
Z 10
=
dt − 0.1
t dt
0
0
2
t
= 10 − 0.1
|10
2 0
2
10
= 10 − 0.1
2
= 5
Es decir, el tiempo medio entre dos fallos consecutivos es de 5 años.
Considerando que el mantenimiento preventivo se efectúa cada año, tp = 1 y
entonces R(1) = 0.9.
De ahı́, que la función de densidad de fallo que estamos buscando es
∞
X
fM P (t) =
(0.9)k (0.1),
ktp < t < (k + 1)tp
k=0
Nótese que debido al mantenimiento preventivo, el componente recupera su distribución uniforme en [0, 10] cada año.
1
Ahora vamos a calcular el M T BFM P como ∗ . La nueva tasa de falla, h∗ (t)
h (t)
se puede aproximar con el valor medio de h(t) en el intervalo [0,1]. Es decir
Z 1
dt
∗
h (t) =
0 10 − t
Si hacemos el cambio de variable
u = 10 − t
du = −dt
(2.1)
55
∗
Z
10
du
u
9
= ln10 − 1n9 = 0.1053
h (t) =
Por lo tanto, la aproximación que se tiene para el valor del M T BFM P que se
obtiene cuando se considera el efecto del mantenimiento preventivo es
1
= 9.491
0.1053
El valor exacto de M T BFM P es la media de la variable t con densidad fM P (t),
es decir,
Z ∞
tfM P (t) dt =
0
Z
∞
=
t
0
∞
X
(0.1)(0.9)k dt
k=0
Z k+1
∞
1 X
k
t dt
(0.9)
=
10 k=0
k
∞
1 X
=
(0.9)k (2k + 1)
20 k=0
= 9.5
Este valor 9.5 años representa un gran incremento de tiempo, respecto de M T BF = 5
años que se obtienen cuando no se tiene en cuenta el mantenimiento preventivo.
2.5.
Función de Mantenibilidad
El tiempo empleado para la reparación del dispositivo averiado depende de las caracterı́sticas del sistema en falla y de factores tales como la accesibilidad, facilidades
para el diagnóstico, habilidad de los reparadores, etc. Como las fallas son aleatorias,
y es diferente el tiempo de reparación involucrado en cada dispositivo, los tiempos
necesarios para reparar el dispositivo también serán aleatorios.
56
Considérese la variable aleatoria T T R que representa el tiempo de ejecución de
las tareas de mantenimiento, ya sea preventivo o correctivo. Esta variable toma valores en el intervalo [0, +∞).
La función de distribución de la variable aleatoria T T R se denomina función de
mantenibilidad y se denota por M (t), es decir
Z t
m(x) dx
M (t) = P (T T R < t) =
0
donde m(x) es la función de densidad de la variable aleatoria T T R. La función de
mantenibilidad indica la probabilidad de que un sistema que entró en proceso de
reparación en el instante t = 0 este reparado al cabo de un cierto tiempo t. La experiencia indica que la distribución lognormal representa a M (t); la asimetrı́a de la
función indica que tan rápido se llevan a cabo las actividades de mantenimiento.
Ejemplo 2.5.1. El tiempo de reparación de un sistema sigue una distribución lognormal con parámetro de escala σ = 1.2 y parámetro de localización µ = 2.2 horas. El
parámetro µ es la media del logaritmo natural de los tiempos de reparación y σ es la
desviación estándar del logaritmo natural de los tiempos de reparación alrededor de µ.
La probabilidad de completar la reparación del sistema en un tiempo menor a 5
horas está dada por M (5) como se muestra a continuación.
2
1 ln x − µ
−
1
σ
x>0
e 2
Sabemos que m(x) = √
σ 2πx
Entonces
Z
5
1 ln x−2.2 2
1
√
e− 2 ( 1.2 ) dx
0 1.2 2πx
ln 5 − 2.2
= Φ
1.2
= Φ(−0.4921)
= 0.3113
M (5) =
Por lo tanto, la probabilidad de efectuar las tareas de mantenimiento en menos
de 5 horas es 0.3113.
57
Figura 2.2: Función de Mantenibilidad
En la Figura 2.2 se muestra el comportamiento de la función de mantenibilidad
para este sistema.
Al igual que en el área de confiabilidad, se denominará tasa de mantenibilidad γ(t)
a la probabilidad condicional de completar las acciones de mantenimiento durante el
intervalo de tiempo (t + ∆t), con ∆t → 0 , suponiendo que la acción comenzada en
el instante t = 0 no haya sido completada antes del tiempo t. Ésta se representa por
γ(t) =
m(t)
1 − M (t)
Otra de las medidas importantes es el tiempo medio de la duración de las acciones
de mantenimiento M T T R. Analı́ticamente se expresa por
Z ∞
M T T R = E(T T R) =
tm(t) dt
0
Ejemplo 2.5.2. Consideremos que la tasa de mantenibilidad γ(t) de un sistema es
constante. Entonces se tienen las siguientes ecuaciones:
M (t) = 1 − e−γt
m(t) = γe−γt
58
MT T R =
1
γ
Para esta distribución, la mejor estimación de mantenibilidad del sistema se
puede obtener mediante el cociente entre la suma de los tiempos de reparación tr
y el número total de fallos n, es decir,
Pn
tr
M T T R = r=0
n
Ejemplo 2.5.3. Se sabe que durante un periodo de un mes hubo 15 acciones de
mantenimiento no programadas y que se requirieron 1200 minutos para efectuar las
reparaciones. Por datos históricos, el analista de mantenimiento sabe que los tiempos
de mantenimiento se distribuyen de manera exponencial. ¿Cuál es el valor medio de
los tiempos de reparación?
Se tiene que la suma de los tiempos de reparación es 1200 y como fueron 15 intervenciones no programadas, entonces n = 15. Por lo tanto
1200
= 80
15
Es decir, las actividades de mantenimiento no programado requirieron en promedio 80 minutos.
MT T R =
Ejemplo 2.5.4. Consideremos ahora que m(t), la función de densidad de los tiempos de reparación es lognormal. Se tienen las siguientes ecuaciones:
Z
M (t) =
0
t
1
−
e 2
1
−
e 2
1
√
σ 2πx
1
m(t) = √
σ 2πt
ln x − µ
σ
ln t − µ
σ
Recordemos que
γ(t) =
m(t)
1 − M (t)
2
2
dx
59
2
− µ+ σ2
MT T R = e
En esta distribución
Pn
µ̂ =
r=0
ln tr
n
Figura 2.3: Función de densidad lognormal
En la Figura 2.3 se muestran las gráficas de la función de densidad m(t) con
diferentes parámetros. Se observa que la probabilidad se concentra cerca de cero
y que después de la moda, la probabilidad decrece. También se puede observar que
a medida que decrece el valor del parámetro σ la distribución se vuelve más simétrica.
60
Capı́tulo
3
Modelos Matemáticos de Polı́ticas
Óptimas de Mantenimiento con tiempos de
reparación instantáneos
Como el fenómeno de aparición de fallas se comporta como un proceso aleatorio,
está claro que no podemos llegar a predecir cuando ocurrirán las fallas, pero sı́ podemos determinar con base en la mejor información los tiempos de mantenimiento
preventivo y las polı́ticas de mantenimiento más adecuadas a largo plazo.
Los propietarios de un sistema deben decidir acerca de sus polı́ticas de mantenimiento o realizarlas utilizando datos proporcionados por su sistema, no basados en
intuiciones, pues esto puede ocasionar pérdida de confiabilidad del sistema.
En las siguientes secciones se estudian dos de las polı́ticas de mantenimiento preventivo introducidas por Richard E. Barlow y Proschan (1965) [7], las cuales tienen
por objetivo lograr un balance entre la disminución del riesgo de llegar a tener una
falla y el aumento de los costos de mantenimiento preventivo; de ahı́ que estos modelos se construyen para determinar el intervalo óptimo entre dos reemplazos sucesivos
de componentes. Usaremos reemplazo para referirnos a mantenimiento preventivo o
mantenimiento por falla.
62
3.1.
Polı́tica I. Mantenimiento Basado en la
Edad
La falla de un sistema durante su operación puede ser de poca o mucha importancia dependiendo del tipo de falla, llegando a ser muy costoso y peligroso.Una de
las áreas importantes de la teorı́a de confiabilidad es el estudio de las polı́ticas de
mantenimiento para reducir los costos de operación.
En esta polı́tica de mantenimiento por edad, ya sea que el sistema es reemplazado
en el tiempo de falla t, si t < tp , o una vez que el sistema ha alcanzado una edad de
operación tp , lo que ocurra primero. Se supone que en ambos casos, luego del reemplazo, el sistema queda en el estado “as good as new”. Es decir, cada reemplazo,
que puede ser mantenimiento preventivo o mantenimiento por falla constituye una
renovación del sistema.
La edad a la cual el sistema es reemplazado depende, entre otros, de los siguientes
factores:
Distribución del tiempo de falla.
Costos de reemplazo por falla.
Costos de reemplazo preventivo.
Tiempo de inactividad por falla y reemplazo preventivo.
Medida de efectividad: minimizar costos, maximizar disponibilidad, o lograr
cierta confiabilidad.
Para este modelo vamos a suponer que los reemplazos preventivos son menos costosos que reemplazos por falla, pues además del costo de mantenimiento, se tiene el
costo de reparar los daños ocasionados al sistema. También se considera que el costo
del tiempo de inactividad asociado con las acciones de mantenimiento preventivo y
reparaciones mı́nimas, las cuales se efectúan cuando el sistema falla, es insignificante,
es decir, los reemplazos son instantáneos.
Es importante señalar que el modelo sólo será de utilidad en la etapa de desgaste
u obsolescencia del componente o sistema, pues en esta etapa el sistema presenta
una tasa de falla creciente.
Diremos que un ciclo se completa cada vez que se realiza un reemplazo ya sea por
mantenimiento preventivo o por falla. Entonces para este modelo existen dos ciclos
63
posibles: en el primer ciclo se realiza mantenimiento a la edad especificada tp y en el
segundo ciclo el sistema falla antes del mantenimiento preventivo.
Figura 3.1: Reemplazo por edad
El objetivo de esta polı́tica es encontrar el valor de tp que minimize el costo total
esperado por unidad de tiempo, el cual queda definido por la siguiente ecuación:
C(tp ) =
E(C)
E(D)
(3.1)
Donde:
C es el costo incurrido durante un ciclo.
D es el largo de un ciclo.
E(C) es el costo esperado de un ciclo.
E(D) es el largo esperado de un ciclo.
Vamos a considerar
(
Cp , si T > tp
C=
Cf , si T ≤ tp
(
dp + tp , si T > tp
D=
df + T, si T ≤ tp
Donde:
Cp es el costo de mantenimiento preventivo.
Cf es el costo de mantenimiento por falla.
dp es la duración del mantenimiento preventivo.
df es la duración del mantenimiento por falla.
T es el tiempo de falla.
tp es el tiempo de operación del componente sin falla después del cual se efectúa un
64
mantenimiento preventivo.
Si suponemos que los tiempos requeridos para llevar a cabo tanto las actividades
de mantenimiento preventivo como correctivo son nulos, es decir, que df = dp = 0
entonces
(
tp , si T > tp
D=
T, si T ≤ tp
Recordemos además que Cp < Cf .
Por lo dicho anteriormente, el costo total esperado por ciclo está dado por las
dos probabilidades, que T > tp , lo cual significa que no hay falla en el intervalo
de mantenimiento preventivo, y que T ≤ tp , es decir, que ocurre una falla antes de
efectuar el mantenimiento preventivo.
Entonces el costo total esperado por ciclo se expresa como sigue:
Cp P (T > tp ) + Cf P (T ≤ tp ) = Cp R(tp ) + Cf [1 − R(tp )]
(3.2)
De la misma forma, el largo esperado de un ciclo está dado por las dos probabilidades, que T > tp y que T ≤ tp .
En el caso de que se realice una mantenimiento preventivo en tp , el largo esperado
del ciclo es tp . En cambio, si se realiza mantenimiento preventivo antes de tp , el largo
esperado del ciclo es el tiempo medio entre falla, pero en el intervalo [0, tp ]. Se busca
entonces la media de la distribución truncada en tp .
R∞
Sabemos que para la distribución completa, el M T BF = 0 tf (t) dt, pero como
la función de densidad se trunca en tp , el valor medio queda expresado de la siguiente
forma
Z tp
f (t)
dt
M (tp ) =
t
1 − R(tp )
0
Por lo tanto, el largo esperada del ciclo, E(D) está dado por
tp P (T > tp ) + M (tp )P (T ≤ tp ) = tp R(tp ) + M (tp )[1 − R(tp )]
(3.3)
Hasta aquı́, el costo total esperado por unidad de tiempo queda expresado como
Cp R(tp ) + Cf [1 − R(tp )]
tp R(tp ) + M (tp )[1 − R(tp )]
Cp R(tp ) + Cf [1 − R(tp )]
=
Rt
tp R(tp ) + 0 p tf (t) dt
C(tp ) =
65
La expresión anterior se puede simplificar aún más si realizamos integración por
partes en
Z tp
tf (t) dt.
0
u = t dv = f (t)dt
du = dt v = F (t) = 1 − R(t)
⇒
Z
tp
Z
tp
[1 − R(t)] dt
Z tp
= tp − tp R(tp ) − tp +
R(t) dt
tf (t) dt = t[1 −
0
t
R(tp )]|0p
−
0
0
Entonces el largo esperado por ciclo queda definido por
Z tp
R(t) dt
(3.4)
0
Finalmente, el costo esperado por unidad de tiempo para un intervalo de reemplazo tp es definido por la siguiente función de costo.
C(tp ) =
Cp R(tp ) + Cf [1 − R(tp )]
, tp ∈ [0, +∞)
R tp
R(t)
dt
0
(3.5)
Es decir, el costo esperado por unidad de tiempo para un intervalo de reemplazo
tp va a estar dado por la razón entre la suma del costo de mantenimiento preventivo
multiplicado por la probabilidad de que no ocurra una falla es este intervalo más la
probabilidad de que ocurra la falla multiplicada por el costo de mantenimiento por
falla, y la confiabilidad acumulada hasta el instante tp .
Como ya sabemos, el valor de tp que minimiza la ecuación anterior es aquel que
dC(tp )
satisface
= 0.
dtp
Tenemos que
(
dC(tp )
=
dtp
R tp
0
R(t) dt) [Cp R0 (tp ) − Cf R0 (tp )] − [Cp R(tp ) + Cf (1 − R(tp ))] R(tp )
R
2
tp
R(t) dt
0
Si igualamos las derivada a cero nos queda que
Rt
( 0 p R(t) dt)(−Cp f (tp ) + Cf f (tp )) = Cf R(tp )
66
⇒ R
Rt
t
Cf f (tp ) 0 p R(t) dt − Cp f (tp ) 0 p R(t) dt = Cp [1 − F (tp )]
⇒ R
Rt
t
Cf h(tp ) 0 p R(t) dt − Cp h(tp ) 0 p R(t) dt = Cp
⇒
Rt
Cp
h(tp ) 0 p R(t) dt =
Cf − Cp
De esta última ecuación se puede observar que el valor de tp para el cual el costo
total esperado por unidad de tiempo es mı́nimo, depende de la relación que existe
entre los costos de mantenimiento preventivo y mantenimiento por falla.
Ejemplo 3.1.1. Considere un componente cuyos tiempos de falla son modelados
con la distribución Weibull con parámetros λ = 0.0025 y β = 2.93. Vamos a analizar
el comportamiento del intervalo óptimo de mantenimiento preventivo, a partir de la
relación que existe entre los costos de mantenimiento preventivo y por falla.
Enseguida vamos a describir la ecuación que describe el costo total esperado por
unidad de tiempo para un intervalo de reemplazo tp .
β
Sabemos que R(t) = e−(λt) es la función de confiabilidad para cualquier instante
t ≥ 0.
Entonces por (3.5)
β
β
Cp e−(λtp ) + Cf (1 − e−(λtp ) )
C(tp ) =
R tp
e−(λt)β dt
0
En la Figura 3.2 se muestran las gráficas de la función del costo esperado por
unidad de tiempo considerando Cp = 1 y Cf = kCp . Los valores de k se asignan
de tal forma que los costos de mantenimiento por falla aumenten, pero además que
Cp < kCf . En las gráficas podemos observar que la función del costo presenta un
mı́nimo una vez que k toma valores por arriba de 1.4. De no ser ası́ entonces tp = ∞,
lo cual indica que conviene el reemplazo sólo en la falla.
En la Figura 3.3 se puede observar la relación entre el valor de la constante de
proporcionalidad k y el tp óptimo, que indica la frecuencia con la que se debe efectuar
el mantenimiento preventivo. Observamos que a medida que aumenta la constante de
proporcionalidad, disminuye el valor de tp , es decir, del intervalo de mantenimiento
preventivo a un costo mı́nimo.
67
Figura 3.2: Costo esperado por unidad de tiempo
Figura 3.3: Relación entre el valor de k y el intervalo de mantenimiento tp óptimo.
En resumen, la polı́tica de mantenimiento preventivo basado en la edad, sugiere
que se efectúe el reemplazo del componente cuando ocurre la falla o una vez que el
componente haya alcanzado una edad de operación tp , lo que ocurra primero.
68
3.2.
Polı́tica II. Mantenimiento preventivo a
intervalos constantes
Esta polı́tica considera que se realizan reemplazos preventivos a intervalos constantes, independientemente del número de fallas intermedias (que también tienen un
costo). En caso de que ocurra una falla antes de tp , se realiza mantenimiento por falla.
De la misma forma que en la polı́tica anterior, la longitud del intervalo de tiempo
(o edad) en el cual el sistema es reemplazado depende, entre otros, de los siguientes
factores:
Distribución del tiempo de falla.
Costos de reemplazo por falla.
Costos de reemplazo preventivo.
Tiempo de inactividad por falla y reemplazo preventivo.
Medida de efectividad: minimizar costos, maximizar disponibilidad, o lograr
cierta confiabilidad.
Se supone que el tiempo considerado para realizar reemplazos preventivos y por
falla es nulo y que los costos de mantenimiento preventivo son menores que los costos
de mantenimiento por falla. Este modelo podrá implementarse sólo en la etapa de
desgaste del componente, en la cual la tasa de falla es creciente.
Figura 3.4: Reemplazo a intervalos constantes.
Nuevamente, el objetivo es encontrar el intervalo óptimo entre reemplazos preventivos, el cual minimiza el costo total esperado por unidad de tiempo.
69
El costo total, generado durante un ciclo, está dado por
N (tp )
C=
X
Cf i + Cp
i=1
N (tp ) es una variable aleatoria que mide el número de fallas que ocurren en el
intervalo (0, tp ]. De ahı́ que el conjunto de variables aleatorias {N (tp ), tp ≥ 0} es un
proceso de conteo que describe un Proceso no homogéneo de Poisson (NHPP) con
función de intensidad h(tp ), tp ≥ 0 [8].
Por definición se tiene que el proceso de conteo {N (t), t ≥ 0} describe un NHPP
con función de intensidad h(t), t ≥ 0 si satisface las siguientes propiedades:
a) N(0)=0
b) El proceso tiene incrementos independientes, es decir,
si 0 ≤ t1 < t2 < t3 < t4 , entonces las variables aleatorias [N (t2 ) − N (t1 ))] y
[N (t4 ) − N (t3 ))] son independientes.
c) P {N (t + δt) − N (t) = 1} = h(t)δt + o(δt),
d) P {N (t + δt) − N (t) ≥ 2} = o(δt),
δt → 0
δt → 0
En un Proceso de Poisson Homogéneo (NPP) la función de intensidad h(t), a diferencia de la función de intensidad del NHPP que depende del tiempo, ahora es
una función constante. Esto significa que si el Proceso de Poisson es homogéneo, con
función de intensidad constante ρ, la distribución del número de fallas que ocurren
en un intervalo de longitud t es Poisson con media ρt.
De las propiedades c) y d) se tiene que
E[N (t, t + δt)] =
∞
X
nP {N (t, t + δt) = n} = h(t)δt + o(δt),
δt → 0
n=0
Entonces, el número esperado de fallas en el intervalo de longitud tp está dado
por
Z
tp
E [N (tp )] = E
N (t, t + dt)
0
Z tp
=
E [N (t, t + dt)]
0
Z tp
=
h(t) dt
0
= H(tp )
70
Por lo expuesto anteriormente, el costo total esperado por ciclo es
Cp + Cf H(tp )
(3.6)
Inicialmente el largo del ciclo es D = tp + dp ; pero como nuevamente dp = 0, el
largo esperado del ciclo es simplemente tp , el intervalo de mantenimiento preventivo.
Por lo tanto, el costo esperado por unidad de tiempo para un intervalo de reemplazo
tp es definido por la siguiente función de costo
C(tp ) =
Cp + Cf H(tp )
, tp ∈ (0, ∞)
tp
(3.8)
Esto significa que el costo esperado por unidad de tiempo para un intervalo de
reemplazo tp es la razón entre la suma del costo de mantenimiento preventivo más el
costo de mantenimiento por falla multiplicado por el número esperado de fallas en
el intervalo de reemplazo, y la longitud del intervalo, que es tp .
Sabemos que el valor de tp que minimiza el costo total esperado por unidad de
tiempo es aquel que satisface
dC(tp )
=0
dt
tp Cf H 0 (tp ) − Cp − Cf H(tp )
dC(tp )
=
dt
t2p
Si igualamos la derivada a cero tenemos
tpCf H 0 (tp ) = Cp + Cf H(tp )
Cp
tp h(tp ) =
+ H(tp )
Cf
Cp
tp h(tp ) − H(tp ) =
Cf
Esta última ecuación indica que nuevamente el intervalo óptimo de mantenimiento preventivo depende de la relación existente entre los costos de mantenimiento
preventivo y por falla.
Ejemplo 3.2.1. En el caso de la distribución exponencial, para la cual la tasa de de
fallas es constante, realizar mantenimiento preventivo genera un gasto extra, pues
71
en este caso la probabilidad de falla es la misma para cualquier instante independientemente del tiempo que lleve funcionando el componente. Esto se ve en la solución del tiempo de mantenimiento preventivo óptimo, que es tp = ∞.
Para esta distribución
Z
tp
λ dt = λtp
H(tp ) =
0
Entonces el costo total esperado por unidad de tiempo queda como sigue:
C(tp ) =
Cp + Cf λtp
, tp ∈ (0, ∞)
tp
Luego
tp Cf λ − Cp − tp Cf λ
t2p
Cp
= 2
tp
C 0 (tp ) =
Nos interesa el valor de tp para el cual
Cp
=0
t2p
Esta última ecuación indica que tp = ∞, lo cual significa que el mantenimiento
preventivo se realiza una vez que ocurre la falla.
Ejemplo 3.2.2. Consideremos nuevamente el componente con tiempos de falla de
distribución Weibull, cuyos parámetros son λ = 0.0025 y β = 2.93. Haremos uso de
esta nueva polı́tica para realizar el análisis del comportamiento del valor que indica
el intervalo de mantenimiento para costo mı́nimo, a partir de la relación que existe
entre los costos de mantenimiento preventivo y por falla.
A continuación se describe la función del costo total esperado por unidad de tiempo, para un intervalo de reemplazo tp , en el caso de la distribución Weibull.
Recordemos que la tasa de fallas está descrita por
h(t) = λβ(λt)β−1 ,
t≥0
72
Entonces el número esperado de fallas H(tp ) nos queda como
Z
H(tp ) =
tp
λβ(λt)β−1 dt
0
= (λtp )β
Para la distribución Weibull, el número esperado de fallas en el intervalo (0, tp ] es
una potencia de λ veces la longitud del intervalo. La potencia viene a ser el parámetro
de forma de la distribución.
Según (3.8)
C(tp ) =
Cp + Cf (λtp )β
, tp ∈ (0, ∞)
tp
En la Figura 3.5 se muestran la gráficas de la función del costo esperado por
unidad de tiempo considerando los parámetros Cp = 1 y Cf = kCp . Nuevamente los
valores de la constante k se asignan de tal forma que los costos de mantenimiento por
falla aumenten y que Cp < kCf . En las gráficas se puede observar que a diferencia
de la polı́tica de reemplazo basado en la edad, en este caso sı́ se tiene un mı́nimo
para valores 1 ≤ k < 1.4.
En la Figura 3.6 se muestra nuevamente la relación entre la constante de proporcionalidad k y el intervalo de reemplazo tp a costo mı́nimo. Se puede observar que
el intervalo óptimo de mantenimiento preventivo disminuye a medida que crece la
constante de proporcionalidad k.
Figura 3.5: Costo esperado por unidad de tiempo
73
Figura 3.6: Relación entre el valor de k y el intervalo de mantenimiento tp óptimo.
k
Cf = kCp
Reemplazo a intervalos constantes Reemplazo por edad
(tp , C(tp ))
(tp , C(tp ))
tp :tiempo óptimo para costo mı́nimo C(tp )
1
1.2
1.5
1.7
3
7
10
20
(314,0.0048)
(295,0.0052)
(273,0.0056)
(262,0.0058)
(216,0.0070)
(161,0.0094)
(143,0.0106)
(113,0.0135)
(∞, 0.0029)
(∞, 0.0034)
(416,0.0042)
(366,0.0046)
(250,0.0063)
(171,0.0090)
(149,0.0103)
(115,0.0132)
En la tabla anterior podemos observar que la polı́tica de reemplazo por edad genera
menos reemplazos que la polı́tica de reemplazo a intervalos constantes. De hecho
cuando k = 1.2 mientras que la polı́tica de reemplazo a intervalos constantes presenta
un óptimo en tp = 295, la polı́tica de reemplazo por edad sugiere que el reemplazo
preventivo se realize hasta que ocurra la falla.
En resumen, la polı́tica de mantenimiento preventivo a intervalos constantes indica que el mantenimiento preventivo del componente se debe realizar en los instantes
tp , 2tp , 3tp , ..., independientemente del número de fallas intermedias.
74
3.3.
Aplicación a un caso real
En lo que sigue, vamos a realizar un análisis del mantenimiento preventivo del elevador del Edificio AT, ubicado en la Universidad Autónoma Metropolitana-Unidad
Iztapalapa, en el cual se tiene programado un mantenimiento preventivo cada 30 dı́as.
Se aplicarán las polı́ticas de reemplazo por edad e intervalos constantes para comparar el intervalo de reemplazo preventivo indicado por cada una de estas polı́ticas
con el intervalo de mantenimiento preventivo que tiene considerado el departamento
de mantenimiento de la universidad.
El paro del funcionamiento del elevador del Edifico AT, es ocasionado principalmente por dos tipos de fallas: falla en los botones de llamada y puertas de cabina
trabadas. Independientemente del mantenimiento preventivo que se tiene programado cada 30 dı́as, cuando aparece una falla en el elevador, éste deja de funcionar
y entonces se lleva a cabo un mantenimiento correctivo, con la finalidad de poner
nuevamente en funcionamiento el elevador. Los costos estimados de mantenimiento
preventivo y correctivo son $400.00 y $1050.00 respectivamente.
En la siguiente tabla se muestran los tiempos de falla del elevador ocurridos durante el periodo Enero 2012- Abril 2013.
Cuadro 3.1: Tiempos entre fallas, en dı́as
5 7 7 9 13 14 15 16
19 20 21 22 25 28 29 30
Con ayuda del programa estadı́stico MINITAB, realizamos un ajuste paramétrico
de las distribuciones Weibull y Normal a los tiempos de falla, para ver cuál de la dos
distribuciones es la que mejor se ajusta a los datos.
En la Figura 3.7 se muestra el gráfico de probabilidad de los tiempos de falla
correspondiente a la distribución Weibull. Los parámetros estimados de la distribución son: λ = 19.78 y β = 2.4273. El gráfico de probabilidad de los tiempos de falla
correspondiente a la distribución Normal se muestra en la Figura 3.8, los parámetros
estimados son: µ = 17.5 y σ = 7.85.
Podemos observar que los tiempos de falla pueden ser modelados tanto por la distribución Weibull como por la distribución Normal. De hecho el estadı́stico AndersonDarling (que se muestra en las Figuras 3.7 y 3.8 como AD∗ ) nos da una medida de
lo alejados que se encuentran los tiempos de falla de la recta que representa a cada
75
Figura 3.7: Gráfico de probabilidad para tiempos de falla del elevador.Distribución
Weibull.
Figura 3.8: Gráfico de probabilidad para tiempos de falla del elevador. Distribución
Normal.
distribución. Cuanto mejor sea el ajuste, menor será el valor de dicho estadı́stico.
Los valores del estadı́stico son 1.044 para la distribución Weibull y 1.032 para la
distribución normal.
Ahora veamos como se comporta la tasa de falla para los tiempos de falla del
elevador. En la Figura 3.9 se muestra la tasa de falla para cada distribución. Observe
76
que para ambos casos la tasa de falla es creciente, pero después de cierto tiempo ésta
crece más rápido en el caso de la distribución Normal.
Figura 3.9: Tasa de falla para las distribuciones Normal y Weibull.
Cuadro 3.2: Distribución Weibull
Polı́tica
Intervalo de reemplazo óptimo
de reemplazo
(dı́as)
Edad
14
Intervalos constantes
11
Costo mı́nimo
($/dı́a)
50.48
59.30
Cuadro 3.3: Distribución Normal
Polı́tica
Intervalo de reemplazo óptimo
de reemplazo
(dı́as)
Edad
15
Intervalos constantes
12
Costo mı́nimo
($/dı́a)
48.98
57.52
En los cuadros 3.2 y 3.3 se muestran los resultados obtenidos para el intervalo
óptimo de reemplazo preventivo y el costo mı́nimo en cada polı́tica de reemplazo y
para cada distribución. Se puede observar que cuando se supone que los tiempos de
falla son modelados por la distribución Weibull, la diferencia entre los intervalos de
reemplazo óptimo es 3 dı́as. Como es de esperarse, el costo mı́nimo es más grande en
la polı́tica de reemplazo a intervalos constantes. El mismo comportamiento se tiene
cuando los tiempos de falla son modelados por la distribución Normal.
77
En las Figuras 3.10 y 3.11 se muestran las gráficas del costo esperado por unidad
de tiempo para las dos polı́ticas de reemplazo, según sea la distribución Weibull o
Normal.
Figura 3.10: Costo esperado por unidad de tiempo. Distribución Weibull
Figura 3.11: Costo esperado por unidad de tiempo. Distribución Normal
En el Cuadro 3.4 se muestran los costos que se derivan del plan actual de mantenimiento del elevador. Estos costos se calcularon evaluando la función del costo esperado por unidad de tiempo correspondiente a la polı́tica de mantenimiento basado
en la edad, para un valor de t = 30 dı́as.
78
Cuadro 3.4: Plan de mantenimiento actual
Reemplazo por Intervalo de reemplazo Costo
edad
(dı́as)
($/dı́a)
Weibul
30
58.31
Normal
30
57.89
En lo que que se refiere a qué polı́tica de reemplazo habrı́a que elegir, nuevamente optamos por elegir la polı́tica de reemplazo por edad, que es la que indica el
intervalo de reemplazo más grande para cualquiera de las distribuciones. Podemos
observar que el intervalo más grande, 15 dı́as, se obtiene cuando los tiempos de falla
están normalmente distribuidos. Por otro lado, ¿qué función de distribución es la que
vamos a utilizar? Hemos visto que el mejor resultado, 15 dı́as con un costo mı́nimo
de $48.98, se obtiene con la distribución Normal; no obstante, computacionalmente
con la distribución Weibull se requieren menos cálculos y tiempo para obtener los
resultados que con la distribución Normal.
Con la aplicación de estas polı́ticas se ha logrado optimizar, bajo ciertas suposiciones, los costos de mantenimiento preventivo del elevador. ¿Qué sucede con los
costos de mantenimiento del plan actual? La polı́tica de reemplazo basado en la
edad indica que el costo que se genera con el actual intervalo de mantenimiento preventivo, 30 dı́as, es de $58.31 en el caso de la distribución Weibull y $57.89 para la
distribución normal. Nótese que ambos costos son más altos que los que sugiere la
polı́tica de mantenimiento por edad ($50.48 y $48.98 respectivamente).
Por otro lado, hemos hablado de que el mantenimiento preventivo tiene por objetivo aumentar la confiabilidad de un equipo o sistema, y por ende, disminuir la
tasa de falla del sistema. En lo que sigue vamos a calcular el M T BF del elevador
cuando se consideran actividades de mantenimiento preventivo programadas cada 14
dı́as para después compararlo con el M T BF que se obtiene cuando se lleva a cabo
un mantenimiento programado cada 30 dı́as.
En la sección 2.4 estudiamos la función de densidad que resulta cuando se practican actividades de mantenimiento preventivo. Se dedujo que la función resultante
es de tipo exponencial.
De manera general, la función de densidad de falla que se tiene después del
mantenimiento preventivo está descrita por
(P
∞
k=0 fk (t), si ktp < t < (k + 1)tp
fM P (t) =
0,
de otra forma.
Si consideramos el caso en el que los tiempos de falla del elevador son modelados
79
por la distribución Weibull entonces
β−1
∞ h
ik β 1
X
1
1
β
−( λ
tp )β
fk (t) =
e
(t − ktp )
e−( λ (t−ktp ))
λ λ
k=0
En nuestro caso tp = 14 dı́as, λ = 19.78 y β = 2.4273. Por tanto
(P
2.4273
∞
−(0.7583)2.4273 k
] (0.05t)1.4273 e−(0.05t)
, si ktp < t < (k + 1)tp
k=0 0.1227[e
fM P (t) =
0,
de otra forma.
es la función de densidad de fallo con mantenimiento preventivo. Con esto se tiene
que
Z ∞
tfM P (t) dt
M T BF =
0
es el tiempo medio entre fallas con mantenimiento preventivo. Esta expresión se resuelve numéricamente. Una aproximación que ha funcionado en aplicaciones se basa
en la tasa de falla sin mantenimiento preventivo. Como fM P (·) es de tipo exponencial,
el M T BF con mantenimiento preventivo se puede aproximar usando la expresión
1/h∗ (t), donde h∗ (t) es el valor medio de h(t) en el intervalo [0, tp ], siendo tp la longitud del intervalo de mantenimiento preventivo.
La tasa de falla en el caso de la distribución Weibull es
β
h(t) =
λ
β−1
t
, t≥0
λ
Si sustituimos los valores de los parámetros λ y β tenemos que la tasa de falla
del elevador para cada valor de t es
h(t) = 0.1227(0.05t)1.4273 .
Ahora calculamos el valor medio de h(t) en el intervalo [0, 14]
Z 14
1
0.1237(0.05t)1.4272 dt
h (t) =
14 0
= 0.0306
∗
De esta última expresión se tiene que M T BF = 32.68 es el valor del tiempo
medio entre fallas con mantenimiento preventivo cada 14 dı́as. Hemos visto entonces
como las actividades de mantenimiento preventivo programadas cada 14 dı́as, según
la polı́tica de reemplazo basado en la edad, mejoran el M T BF del elevador, pasando
de 17.54 dı́as, que es la media de la distribución Weibull (ver Figura 3.7) a 32.68
dı́as si se realiza el mantenimiento preventivo.
80
Podemos concluir que el tipo de mantenimiento que resulta óptimo es el de edad
a 14 dı́as con un costo de $50.48 que es el mı́nimo. El tiempo medio entre fallas es
de 32.68 dı́as, el cual es mejor que el que se tenı́a con mantenimiento programado
cada 30 dı́as con un costo de $58.31.
Capı́tulo
4
Polı́ticas óptimas de mantenimiento
preventivo para sistemas con varios
componentes.
En el capı́tulo anterior se estudiaron las polı́ticas de reemplazo para un sólo
componente. Sin embargo, los sistemas pueden estar formados por dos o más componentes, los cuales pueden estar organizados en distintas configuraciones: sistema
en serie, sistema paralelo o sistema mixto; esto según la complejidad del sistema. En
este capı́tulo se expone la generalización de las polı́ticas de reemplazo por edad e
intervalos constantes para sistemas con varios componentes.
Un sistema se define como un conjunto de componentes relacionados entre sı́ para
llevar a cabo una misión conjunta. Se supone que estos componentes fallan de manera independiente unos de otros.
Los sistemas pueden clasificarse en reparables y no reparables. Los sistemas
reparables son aquellos que después de fallar en realizar al menos una de sus funciones
requeridas pueden ser restaurados para realizar todas sus funciones por cualquier otro
método que no sea el reemplazo del sistema completo. Los sistemas no reparables implican un cambio completo; estos últimos sistemas serán el objeto de nuestro estudio.
81
82
4.1.
Confiabilidad de sistemas en serie
Se considera que un sistema tiene componentes que están colocados en serie cuando la falla de uno o más componentes antes de terminar el proceso origina la falla
de todo el sistema. El tiempo de vida de un sistema en serie es igual al tiempo de
vida más pequeño entre todos los componentes del sistema, es decir, el sistema en
serie sólo puede durar tanto como su componente más frágil. La confiabilidad de un
sistema en serie es menor o igual que la confiabilidad del componente menos confiable. El diagrama de bloques de un sistema en serie con n componentes es mostrado
en la Fig. 4.1
Figura 4.1: Diagrama de bloques de un sistema en serie con n componentes
Supóngase una serie de n componentes que trabajan de forma independiente. Sea
Pi la probabilidad de que el componente i funcione. Si Pss denota la probabilidad de
que el sistema funcione, entonces
Pss (f uncione) = P1 (f uncione)P2 (f uncione) · · · Pn (f uncione)
Sean Fi (t) = Pi (T ≤ t) la función de distribución de la variable aleatoria T , que
representa la longitud del tiempo que el componente i funciona y falla en t y
Ri (t) = P (T > t) la probabilidad de que el componente i sobreviva al tiempo t (no
falle en el intervalo (0,t]).
De esta forma, la confiabilidad del sistema para cualquier instante t, es la probabilidad de que todos los componentes sobrevivan en t, por lo que
Rss (t) = R1 (t)R2 (t) · · · Rn (t) =
n
Y
Ri (t)
i=1
En términos de la función de distribución podemos escribir
Fs (t) = 1 −
n
Y
n
Y
Ri (t) = 1 − (1 − Fi (t)).
i=1
i=1
(4.1)
83
Si los n componentes que trabajan de manera independiente tienen la misma
confiabilidad, es decir, Ri (t) = R(t), i = 1, 2, · · ·, n entonces
Rss (t) = [R(t)]n
Ejemplo 4.1.1. Considérese un sistema con dos componentes A y B conectados en
serie, cuyos tiempos de falla son modelados por la distribución exponencial. Las tasas
de falla para cada componente son 0.2 y 0.5 por 10,000 hrs. respectivamente. ¿Cuál
es la confiabilidad del sistema para t = 20, 000 horas?
Recordemos que para componentes con tasa de falla constante, la función de confiabilidad es
R(t) = e−λt
Entonces para el componente A, RA (t) = e−0.2t . De manera similar
RB (t) = e−0.5t .
Por Ecuación 4.1 se tiene que la confiabilidad del sistema en serie para cualquier
instante t es
Rss (t) = e−0.2t e−0.5t = e−0.7t
Por lo tanto, la confiabilidad del sistema en t = 20, 000 horas es
Rss (2) = e−1.4 = 0.2466
Observe que la confiabilidad del sistema es menor que la de cualquiera de sus
componentes.
4.1.1. Tasa de falla del sistema
La tasa de falla del sistema está dada por
hss (t) =
n
X
hi (t)
(4.2)
i=1
siendo hi (t) la tasa de falla del componente i.
La ecuación 4.2 se puede obtener utilizando algunas de las relaciones que se
mencionaron en el capı́tulo 1. La definición de la tasa de falla que se dio en la
ecuación 1.7 es
d
hi (t) = − ln(Ri (t))
dt
84
Luego
hss (t) = −
d
ln(Rss (t))
dt
Por lo que acabamos de mencionar, se tiene que
!
n
n
Y
X
− ln Rss (t) = − ln
Ri (t) =
− ln Ri (t)
i=1
i=1
Entonces
n
d
d X
− ln Rss (t) =
− ln Ri (t)
dt
dt i=1
n
X
d
(− ln Ri (t))
=
dt
i=1
=
n
X
hi (t).
i=1
4.1.2. Sistema en serie con componentes de distribución exponencial
Consideremos un sistema en serie con n componentes para los cuales el tiempo
de falla es modelado por la distribución exponencial. Sea λi la tasa de falla del componente i.
La función de confiabilidad del componente i está dada por
Ri (t) = e−λi t , t ≥ 0
Entonces la función de confiabilidad del sistema en serie con distribución exponencial en cada componente está caracterizada por
Rss (t) = e−λ1 t e−λ2 t e−λ3 t · · · e−λn t = e−(
donde
n
X
i=1
λi = hss (t)
Pn
i=1
λi )t
85
Observemos que la tasa de falla de todo el sistema también es constante.
Ahora veamos qué sucede con el M T BFss del sistema. De (1.2) sabemos que
Z ∞
Rss (t) dt
M T BFss =
0
Para el sistema con componentes con distribución del tiempo de falla exponencial
queda que
Z ∞
Rss (t) dt
M T BFss =
0
Z ∞ P
n
e−( i=1 λi )t dt
=
Z0 ∞
e−hss t dt
=
0
=
1
1
= Pn
hss (t)
i=1 λi
Cuando los componentes son i.i.d. con tasa de falla constante λ se tienen las
siguientes ecuaciones:
hss = nλ
Rss (t) = e−nλt , t ≥ 0
M T BFss =
4.2.
1
nλ
Polı́tica de reemplazo por edad para un
sistema en serie
Recordemos que el objetivo de los modelos de reemplazo es determinar el intervalo óptimo entre reemplazos sucesivos, el cual minimiza el costo total esperado por
unidad de tiempo.
Ahora vamos a suponer que los n componentes del sistema en serie son reemplazados de manera conjunta. Como en el caso de un sólo componente, los componentes
son reemplazados en la falla del sistema o después de un cierto intervalo de tiempo
86
tp , lo que ocurra primero.
Nuevamente supondremos que después de cada reemplazo el sistema queda como
nuevo, que los reemplazos son instantáneos, que los costos de mantenimiento preventivo son menores que los costos de mantenimiento por falla y que los componentes
fallan de manera independiente.
La expresión del costo total esperado por unidad de tiempo sigue estando descrita
por (3.1).
Ahora el costo esperado del ciclo (3.2) se escribe como
"
#
n
n
Y
Y
Ri (tp )
Cp
Ri (tp ) + Cf 1 −
i=1
i=1
El largo esperado de un ciclo definido por (3.3) queda como
Z
tp
Z
Rss (t) dt =
0
0
tp
n
Y
Ri (t) dt
i=1
Finalmente, la expresión para el costo total esperado por unidad de tiempo para
un sistema en serie está dado por
Q
Q
Cp ni=1 Ri (tp ) + Cf [1 − ni=1 Ri (tp )]
Css (tp ) =
, tp ≥ 0
R tp Qn
R
(t)
dt
i
i=1
0
Cp y Cf son los costos de mantenimiento preventivo y costo de mantenimiento
por falla respectivamente.
Ejemplo 4.2.1. Supongamos un sistema en serie formado por 2 componentes idénticos, para las cuales el tiempo de falla es modelado por la distribución Weibull con
parámetro de escala λi = 0.01 y parámetro de forma βi = 3.5, i = 1, 2. Cada componente puede ser reemplazado con un costo de $3, 000.00, por lo que el costo de
reemplazar el sistema es de $6, 000.00; pero si un componente falla el costo de mantenimiento por falla es de $10, 000.00. ¿Qué tan frecuente deberı́a ser reemplazado
el sistema ?
Primero vamos a verificar que la tasa de falla del sistema es una función creciente.
Recordemos que, en la distribución Weibull, para cada componente i, la tasa de
falla está dada por
hi (t) = λi βi (λi t)βi −1 ,
t ≥ 0, i = 1, 2.
87
Entonces la tasa de falla del sistema es
hss (t) =
2
X
λi βi (λi t)βi −1
i=1
Si sustituimos λi = 0.001 y βi = 3.5, i = 1, 2 nos queda que
hss (t) = 2[0.01(3.5)](0.01t)2.5 = 0.07(0.01t)2.5
Podemos observar claramente que hss (·) es una función creciente.
Ahora vamos a escribir la expresión del costo total esperado por unidad de tiempo, para cualquier instante tp ≥ 0
La confiabilidad del sistema es
Rss (tp ) =
2
Y
3.5
e−(0.01tp )
3.5
= e−2(0.01tp )
i=1
Por tanto
3.5
3.5
6000e−2(0.01tp ) + 10000[1 − e−2(0.01tp ) ]
Css (tp ) =
R tp
e−2(0.01t)3.5 dt
0
Finalmente, el valor de tp que indica el intervalo de tiempo entre dos reemplazos
sucesivos para los componentes del sistema a un costo mı́nimo es tp = 72 unidades
de tiempo, a un costo de $124.17 por unidad de tiempo.
En la Figura 4.2 se muestra la curva del costo esperado por unidad de tiempo.
4.3.
Polı́tica de reemplazo a intervalos constantes
para un sistema en serie
En esta polı́tica se supone que los componentes del sistema son reemplazados
de manera conjunta después de que los componentes han alcanzado una edad de
operación tp y cuando fallan. Al igual que en la polı́tica anterior supondremos que
después de cada reemplazo el sistema queda como nuevo, que los reemplazos son
88
Figura 4.2: Costo esperado por unidad de tiempo para un sistema en serie con dos
componentes Weibull, según la polı́tica de reemplazo por edad.
instantáneos y que los componentes fallan de manera independiente.
Para esta polı́tica, el largo esperado de un ciclo es tp .
El costo total, generado durante un ciclo (3.6), está dado por
Cp + Cf Hss (tp )
Donde Hss (tp ) =
R tp
0
hss (t) dt es el número esperado de fallas en el intervalo (0, tp ).
Finalmente, la expresión para el costo total esperado por unidad de tiempo para
un sistema en serie está dado por
Css (tp ) =
Cp + Cf Hss (tp )
, tp > 0
tp
Cp y Cf son los costos de mantenimiento preventivo y costo de mantenimiento
por falla respectivamente.
Ejemplo 4.3.1. Consideremos nuevamente el sistema en serie del ejemplo anterior.
Si se considera la polı́tica de reemplazo a intervalos constantes, ¿qué tan frecuente
deberı́an ser reemplazados los componentes del sistema?
Vamos a calcular Hss (t), el número esperado de fallas en el intervalo (0, tp ).
89
Sabemos que hss (t) = 0.07(0.01t)2.5
Entonces
Z
tp
hss (t) dt
Hss (t) =
0
Z
=
tp
0.07(0.01t)2.5 dt = 2X10−7 t3.5
p
0
Por tanto, la expresión del costo total esperado por unidad de tiempo se escribe
como
6000 + 0.0020tp3.5
, tp > 0
tp
En la Figura 4.3 se muestra la curva que representa el costo total esperado por
unidad de tiempo para esta nueva polı́tica.
C(tp ) =
El tiempo óptimo de mantenimiento preventivo es tp = 55 unidades de tiempo,
con un costo mı́nimo de $153.96 por unidad de tiempo.
Figura 4.3: Costo esperado por unidad de tiempo para un sistema en serie con dos
componentes Weibull, según la polı́tica de reemplazo a intervalos constantes
Nótese que la polı́tica de reemplazo a intervalos constantes da un óptimo con
tiempos de reemplazo menores que la polı́tica de reemplazo por edad y por ello, mayor
costo en el óptimo. Por esta razón conviene usar la polı́tica de reemplazo por edad
cuando la naturaleza de los componentes lo permitan.
90
4.4.
Confiabilidad de sistemas en paralelo
Se dice que un sistema tiene componentes que están en paralelo cuando solamente la falla de todas las componentes en el sistema origina la falla del sistema. Es
decir, para que un sistema en paralelo funcione, es suficiente que al menos uno de
los componentes opere sin falla. El diagrama de bloques para un sistema en paralelo
se muestra en la Figura 4.4
Figura 4.4: Diagrama de bloques de un sistema en paralelo con n componentes
Supóngase n componentes que trabajan de manera independiente, los cuales están
colocados en paralelo. En este caso
Psp (nof uncione) = P1 (nof uncione)P2 (nof uncione) · · · Pn (nof uncione)
= (1 − P1 (f uncione))(1 − P2 (f uncione)) · · · (1 − Pn (f uncione))
Entonces
Psp (f uncione) = 1 − Psp (nof uncione)
De ahı́ que la confiabilidad del sistema Rsp (t), está dada por
Rsp (t) = 1 −
n
Y
(1 − Ri (t)), t ≥ 0
(4.3)
i=1
Es decir, la confiabilidad del sistema en paralelo es uno menos el producto de la
probabilidad de falla de cada uno de los componentes.
91
Ejemplo 4.4.1. Supongamos ahora los dos componentes del Ejemplo 4.1.1, pero
colocados en un sistema en paralelo. ¿Cuál es la confiabilidad del sistema para
t = 20, 000 horas ?
La confiabilidad del sistema en cualquier instante t está dada por
Rsp (t) = 1 − [(1 − e−0.2t )(1 − e−0.5t )]
= 1 − (1 − e−0.5t − e−0.2t + e−0.7t )
= e−0.5t + e−0.2t − e−0.7t
Por lo tanto, la confiabilidad del sistema en t = 20, 000 horas es
Rsp (2) = e−1 + e−0.4 − e−1.4 = 0.7916
Observemos que en este caso la confiabilidad del sistema es mayor que la confiabilidad de cualquiera de sus componentes.
Nuevamente, si suponemos que cada uno de los componentes del sistema tienen
la misma confiabilidad, es decir, Ri (t) = R(t), i = 1, 2, · · ·, n, entonces
n
Y
Rsp (t) = 1 − (1 − R(t))n
i=1
Recordemos también que la función de densidad de falla de acuerdo a (1.5) se
escribe como
dRsp
fsp (t) = −
dt
La tasa de falla del sistema, según (1.1), se escribe como
hsp (t) =
fsp
Rsp
Por (1.2) el tiempo medio entre falla del sistema es
Z ∞
M T BFsp =
Rsp (t) dt
0
En un sistema en paralelo sólo se requiere que un componente funcione para hacer que el sistema funcione. El resto de los componentes incluidos en el sistema son
llamados componentes redundantes. Éstos son incluidos para aumentar la probabilidad de tener al menos un componente trabajando. La redundancia es una técnica
usada ampliamente en ingenierı́a para reforzar la confiabilidad del sistema. En Dodson (2002) [9], se pueden estudiar sistemas más complejos, tales como los sistemas k
de n, sistemas de n componentes que son capaces de funcionar correctamente si al
menos k de los componentes operan correctamente.
92
4.4.1. Sistema en paralelo con componentes de distribución exponencial
Consideremos un sistema en paralelo con n componentes para los cuales el tiempo de falla es modelado por la distribución exponencial. Sea λi la tasa de falla del
componente i.
La función de confiabilidad del componente i está dada por
Ri (t) = e−
Rt
0
λi (t) dt
= e−λi
Rt
0
dt
= e−λi t , t ≥ 0
Al sustituir el valor de Ri (t) en (4.3) se tiene la función de confiabilidad del
sistema completo
Rsp (t) = 1 −
n
Y
(1 − e−λi t ), t ≥ 0
i=1
Ejemplo 4.4.2. Consideremos un sistema en paralelo formado por dos componentes, cuyas tasas de falla son λ1 y λ2 respectivamente.
La confiabilidad del sistema es
Rsp (t) = 1 − (1 − e−λ1 t )(1 − e−λ2 t )
= e−λ1 t + e−λ2 t − e−(λ1 +λ2 )t
La función de densidad de falla es
d[e−λ1 t + e−λ2 t − e−(λ1 +λ2 )t ]
dt
= λ1 e−λ1 t + λ2 e−λ2 t − (λ1 + λ2 )e−(λ1 +λ2 )t
fsp (t) = −
Entonces la tasa de falla del sistema es
hsp (t) =
λ1 e−λ1 t + λ2 e−λ2 t − e−(λ1 +λ2 )t
e−λ1 t + e−λ2 t − e−(λ1 +λ2 )t
Observemos que ahora la tasa de falla hsp (t) es una función que depende de la
edad del sistema, aunque la tasa de falla de cada componentes es constante. En la
Figura 4.5 se muestra el comportamiento creciente de la tasa de falla del sistema con
λ1 = 0.02 y λ2 = 0.01.
93
Figura 4.5: Tasa de falla de un sistema en paralelo con dos componentes con distribución exponencial.
¿Cómo se comporta el M T BF del sistema?
Z
∞
M T BFsp =
Rsp (t) dt
Z0 ∞
=
e−λ1 t + e−λ2 t − e−(λ1 +λ2 ) t dt
0
1
1 1
=
−
λ1 λ2 λ1 + λ2
Ejemplo 4.4.3. Consideremos ahora un sistema con n componentes i.i.d cuya distribución del tiempo de falla es exponencial. Sea λ la tasa de falla de cada componente.
Rsp (t) = 1 −
Qn
i=1 (1
− e−λt ) = 1 − (1 − e−λt )n
94
Z
∞
M T BFsp =
Rsp (t) dt
0
Z
=
=
=
=
=
=
=
∞
1 − (1 − e−λt )n dt
0
Z ∞
n X
n n−j
1−
1 (−e−λt )j dt
j
0
j=0
Z ∞X
n
n
(−1)j+1 e−λjt dt
j
0
j=1
Z ∞
n
X
n
j+1
(−1)
e−λjt dt
j
0
j=1
n
X
n
1
(−1)j+1 (− )e−λjt |∞
0
j
λj
j=1
n X
n
1
(−1)j+1 ( )
λj
j
j=1
n 1X n
1
(−1)j+1
λ j=1 j
j
n
1X1
=
λ j=1 j
4.5.
Polı́tica de reemplazo por edad para un
sistema en paralelo
Al igual que en el caso de los sistemas en serie, vamos a suponer para ambas
polı́ticas: reemplazo por edad e intervalos constantes, que los componentes del sistema en paralelo se reemplazan de manera conjunta.
La expresión del costo total esperado por unidad de tiempo para un sistema
formado por n componentes en paralelo, según la polı́tica de reemplazo por edad
(3.5) está dada por
95
Csp (tp ) =
Cp [1 −
Qn
Qn
i=1 (1 − Ri (tp ))] + Cf
i=1 (1 − Ri (tp ))
, tp ≥ 0
R tp
Qn
[1
−
(1
−
R
(t))]
dt
i
i=1
0
Donde Cp y Cf son los costos de mantenimiento preventivo y mantenimiento por
falla respectivamente.
Ejemplo 4.5.1. Supongamos un sistema en paralelo formado por 2 componentes
idénticos, para las cuales el tiempo de falla es modelado por la distribución Weibull
con parámetro de escala λi = 0.01 y parámetro de forma βi = 3.5, i = 1, 2. Cada
componente puede ser reemplazado con un costo de $3, 000.00, por lo que el costo de
reemplazar el sistema es de $6, 000.00; pero si un componente falla el costo de mantenimiento por falla es de $10, 000.00. ¿Qué tan frecuente deberı́a ser reemplazado
el sistema ?
Vamos a calcular la función de confiabilidad del sistema.
Rsp (t) = 1 − (1 − Ri (t))2
3.5
= 1 − (1 − e−(0.01t) )2
3.5
= 2e−(0.01t)
3.5
− e−2(0.01t)
Figura 4.6: Costo esperado por unidad de tiempo para un sistema paralelo con dos
componentes Weibull, según la polı́tica de reemplazo por edad.
Entonces para cada instante tp ≥ 0
96
3.5
Csp (tp ) =
6000[2e−(0.01t)
3.5
3.5
− e−2(0.01t) ] + 10000[1 − 2e−(0.01t)
R tp
[2e−(0.01t)3.5 − e−2(0.01t)3.5 ] dt
0
3.5
+ e−2(0.01t) ]
En la Figura 4.6 se muestra la curva del costo esperado por unidad de tiempo.
Por último, tenemos que el tiempo de reemplazo preventivo a costo mı́nimo, según
la polı́tica de reemplazo por edad es tp = 94 unidades de tiempo con un costo mı́nimo
de $81 por unidad de tiempo.
4.6.
Polı́tica de reemplazo a intervalos constantes
para un sistema en paralelo
La expresión del costo total esperado por unidad de tiempo para un sistema
formado por n componentes en paralelo, según la polı́tica de reemplazo a intervalos
constantes (3.8) está dada por
Cp + Cf Hsp (tp )
, tp > 0
tp
Cp y Cf son los costos de mantenimiento preventivo y costo de mantenimiento
por falla respectivamente y Hsp el número esperado de fallas en el intervalo (0, tp ).
Csp (tp ) =
Ejemplo 4.6.1. Supongamos un sistema en paralelo formado por 2 componentes
idénticos, para las cuales el tiempo de falla es modelado por la distribución Weibull
con parámetro de escala λi = 0.01 y parámetro de forma βi = 3.5, i = 1, 2. Cada
componente puede ser reemplazado con un costo de $3, 000.00, por lo que el costo de
reemplazar el sistema es de $6, 000.00; pero si un componente falla el costo de mantenimiento por falla es de $10, 000.00. ¿Qué tan frecuente deberı́a ser reemplazado
el sistema según la polı́tica de reemplazo a intervalos constantes ?
Primero vamos a calcular Hsp (tp ). Sabemos que hsp (t) =
fsp (t)
con
Rsp (t)
d[Rsp (t)]
dt
3.5
d[1 − (1 − e−(0.01t) )2 ]
= −
dt
3.5
3.5
= 0.07(0.01t)2.5 e−(0.01t) − 0.07(0.01t)2.5 e−2(0.01t)
fsp (t) = −
97
Ası́ que
3.5
3.5
0.07(0.01t)2.5 e−(0.01t) − 0.07(0.01t)2.5 e−2(0.01t)
hsp (t) =
2e−(0.01t)3.5 − e−2(0.01t)3.5
En este caso
6000 + 10000
Csp (tp ) =
tp
R tp
0
hsp (t) dt
, tp > 0
En la Figura 4.7 se muestra la curva del costo esperado por unidad de tiempo.
Figura 4.7: Costo esperado por unidad de tiempo para un sistema paralelo con dos
componentes Weibull.
Por último, tenemos que el tiempo de reemplazo preventivo a costo mı́nimo, según
la polı́tica de reemplazo a intervalos constantes es tp = 78 unidades de tiempo con
un costo mı́nimo de $93 por unidad de tiempo.
Al igual que en el caso de los sistemas en serie, para los sistemas en paralelo, la
polı́tica de reemplazo por edad sugiere un óptimo con tiempos de reemplazo mayores
que la polı́tica de reemplazo a intervalos constantes, y por ende, el costo es menor.
También hay que observar que en el caso de los sistemas en serie, los intervalos de
reemplazo óptimo, para ambas polı́ticas, son menores que los intervalos de reemplazo
óptimos para los sistemas en paralelo. Esto se debe a que las configuraciones en
paralelo aumentan su confiabilidad al incrementar el número de componentes.
98
4.7.
Sistemas Mixtos
Consideremos ahora el siguiente sistema, en el cual se tiene una combinación de
sistemas en serie y en paralelo.
Figura 4.8: Sistema formado por componentes en serie y en paralelo
Figura 4.9: Simplificación del sistema mixto
Para poder obtener la confiabilidad de un sistema mixto hay que ir resolviendo
por etapas, calculando la confiabilidad de cada uno de los subsistemas en serie o en
paralelo formados en cada etapa.
Para calcular la confiabilidad del sistema mostrado en la Figura 4.8 lo primero
que podrı́amos hacer es encontrar la confiabilidad de los dos pares de componentes
colocados en paralelo (cada uno de estos pares se ve como un subsistema). Después
habrı́a que resolver la confiabilidad del subsistema en serie, cuyos componentes son
A y BC. Enseguida se calcula la confiabilidad del subsistema en paralelo con componentes ABC y G. Por último, se calcula la confiabilidad del sistema en serie formado
99
por los componentes ABCG, D y EF. En la Figura 4.9 se muestra la representación
en diagramas de bloques que habrı́a que ir resolviendo.
Para ilustrar las polı́ticas de reemplazo por edad y reemplazo a intervalos constantes en un sistema mixto se consideran tres componentes A, B y C cuyos tiempos de
falla son modelados por la distribución Weibull. Estos tres componentes se organizan
en distintas configuraciones: sistema en serie, sistema en paralelo y sistema mixto.
Para cada polı́tica de reemplazo vamos a realizar un análisis de los intervalos de
reemplazo óptimo para cada uno de los componentes por sı́ solos, y para cada una
de las tres configuraciones, en las cuales suponemos que los tres componentes se
reemplazan de manera conjunta. En el Cuadro 4.1 se muestran los parámetros de la
distribución junto con los valores de Cp y Cf para cada componente.
Cuadro 4.1: Caracterı́sticas de los componentes
Componente Parámetro de forma Parámetro de escala
Cp
Cf
A
2
0.001
$5,000 $39,000
B
3
0.005
$7,000 $44,000
C
2.5
0.008
$21,000 $48,000
Primero vamos a buscar el intervalo de reemplazo óptimo señalado por cada
polı́tica, para cada uno de los componentes.
Cuadro 4.2: Reemplazo por edad
Componente Intervalo de reemplazo óptimo Costo
A
388
B
91
C
99
mı́nimo($/dı́a)
26.40
116.13
380.81
Cuadro 4.3: Reemplazo a intervalos constantes
Componente Intervalo de reemplazo óptimo Costo mı́nimo($/dı́a)
A
358
27.93
B
86
122.07
C
76
458.36
100
Figura 4.10: Costo esperado por unidad de tiempo/Reemplazo por edad
Figura 4.11: Costo esperado por unidad de tiempo/Reemplazo a intervalos constantes
Consideremos ahora la configuración mixta mostrada en la Figura 4.12. Vamos a
obtener el intervalo de reemplazo óptimo en ambas polı́ticas, suponiendo que los tres
componentes se reemplazan de manera conjunta, es decir, considerando el sistema
como un solo componente.
101
Figura 4.12: Sistema mixto
Cuadro 4.4: Reemplazo de componentes del sistema mixto
Polı́tica
Intervalo de reemplazo óptimo Costo mı́nimo
de reemplazo
(dı́as)
($/dı́a)
Edad
113
387.00
Intervalos constantes
105
410.76
Figura 4.13: Costo esperado por unidad de tiempo/Reemplazo conjunto
102
Figura 4.14: Sistema en serie
Ahora vamos a obtener el intervalo de reemplazo óptimo del sistema, visto como
uno solo, considerando que los tres componentes están colocados en serie como se
muestra en la Figura 4.14.
Cuadro 4.5: Reemplazo conjunto de componentes del sistema en serie
Polı́tica
Intervalo de reemplazo óptimo Costo mı́nimo
de reemplazo
(dı́as)
($/dı́a)
Edad
65
875.32
Intervalos constantes
57
962.23
Figura 4.15: Costo esperado por unidad de tiempo/Sistema en serie
Por último, considerando que los tres componentes están colocados en paralelo
como se muestra en la Figura 4.16, obtenemos el intervalo de reemplazo óptimo del
sistema visto como uno solo.
103
Figura 4.16: Sistema en paralelo
Cuadro 4.6: Reemplazo conjunto de componentes del sistema en paralelo
Polı́tica
Intervalo de reemplazo óptimo Costo mı́nimo
de reemplazo
(dı́as)
($/dı́a)
Edad
595
116.41
Intervalos constantes
501
131.09
Figura 4.17: Costo esperado por unidad de tiempo/Sistema en paralelo
De los resultados obtenidos para cada una de las tres configuraciones, se puede
observar que la configuración en paralelo resulta ser la mejor estrategia, comparada
con las configuraciones mixta y en serie, pues en estas el costo es mayor. De estas dos
104
últimas, la configuración es serie es la que señala el intervalo de reemplazo óptimo
más pequeño, 65 dı́as en el caso de reemplazo por edad y 57 dı́as en el caso de
reemplazo a intervalos constantes. Cabe mencionar que con estos enfoques se podrı́a
tener un ahorro en los costos de mantenimiento si en lugar de reemplazar los tres
componentes, sólo se reemplaza el componente que falló.
4.8.
Mantenimiento Oportunista para Sistemas
en Serie
Los modelos de mantenimiento oportunista, básicamente se refieren a situaciones
en las que el mantenimiento preventivo se realiza tomando oportunidades. Una oportunidad puede ser una falla del sistema, inspecciones de calidad y otras situaciones
donde el sistema deja de funcionar.
Para la mayorı́a de los sistemas que operan de manera continua, como por ejemplo, generadores de energı́a, petroquı́micas e instalaciones petrolı́feras en alta mar,
el costo de una parada de producción puede ser muy costoso, por lo tanto se busca
limitar el número de paradas mediante la combinación de varias tareas de mantenimiento con la finalidad de reducir los costos totales de mantenimiento.
El objetivo de la polı́tica de mantenimiento oportunista es ahorrar costos cuando
conviene realizar el reemplazo de varios componentes en lugar de reemplazarlos por
separado.
4.8.1. Descripción del Sistema
Considérese un sistema compuesto de q componentes colocados en serie. En éste,
la falla de cualquier componente ocasiona la falla del sistema. El objetivo de la
polı́tica es seleccionar la combinación de los tiempos de reemplazo de los componentes del sistema, junto con el intervalo periódico de reemplazo τ que generen el
costo esperado por unidad de tiempo mı́nimo.
Sean τ1 , τ2 , ..., τq los intervalos de reemplazo preventivo óptimos correspondientes
a los componentes 1, 2, ..., q respectivamente. Se supone que en cada reemplazo, ya
105
sea preventivo o correctivo, el componente queda como nuevo. Durante cada parada del sistema por mantenimiento correctivo, se debe decidir si se puede tomar la
oportunidad de reemplazar de manera preventiva algunos de los componentes que
no fallaron. La decisión estará basada en la degradación del componente y el riesgo
que se toma si estos componentes fallan antes de alcanzar el siguiente reemplazo
preventivo programado.
4.8.2. Estructura de costos
En esta sección vamos a clasificar los costos de las actividades de mantenimiento
en dos categorı́as: costos fijos y costos variables.
Las actividades que generan los costos fijos del mantenimiento son: la movilización
de un equipo de reparación, herramientas, transporte y desmontaje y montaje del
sistema. El costo fijo de mantenimiento es generado independientemente del número
de componentes que sean reemplazados en el sistema. Cuando se combinan varias
acciones de mantenimiento, el costo fijo se comparte entre éstas y de esta forma se
reducen los costos totales de mantenimiento.
Sean Cop y Coc los costos fijos de mantenimiento preventivo y correctivo respectivamente. Consideraremos que Cop < Coc .
Los costos variables están relacionados con las caracterı́sticas especı́ficas del componente que será reemplazado tales como: repuestos, mano de obra, herramientas especı́ficas y procedimientos de reparación. También se incluye la pérdida de producción
generada durante el tiempo en que se realizan las actividades de mantenimiento. Sean
Cip el costo especı́fico de mantenimiento preventivo para el componente i y Cic el costo de mantenimiento correctivo para el componente i. Nuevamente Cip < Cic .
Cuando se lleva a cabo un mantenimiento preventivo, el costo total en el sistema
es
Csp = Cop +
X
Cip
i∈Gp
Gp es el grupo de componentes que serán reemplazados de manera preventiva.
Cuando se efectúa un mantenimiento correctivo, por la falla del j-ésimo componente, se tiene la oportunidad de reemplazar otros componentes crı́ticos, de acuerdo
a una regla definida. El costo correctivo del sistema por la falla del componente j,
c
Cs,j
está dado por
106
c
Cs,j
= Coc + Cjc +
X
Cip
i∈Gh ,i6=j
Gh es el grupo de componentes que serán reemplazados preventivamente durante
esta oportunidad. El grupo Gh se definirá con base al deterioro del componente y el
riesgo tomado si este componente falla antes de alcanzar el siguiente reemplazo.
Vamos a considerar el caso en el que el j-ésimo componente falla en el tiempo tj ,
entre dos reemplazos programados kτ y (k + 1)τ . La oportunidad de reemplazar el
componente i genera un costo esperado Cip Ri (tj ). Si el componente i no se reemplaza
en ese momento, puede ocurrir una de las siguientes dos posibilidades:
El componente i continúa operando hasta el siguiente reemplazo programado,
lo cual originará un costo Cip Ri ((k + 1)τ | tj ).
El componente i falla en el tiempo t antes del siguiente reemplazo programado,
lo cual originará un costo (Coc + Cic )Fi (t)
La decisión de llevar a cabo o no un reemplazo oportunista del componente i,
dependerá de la comparación de los costos. Si el costo de efectuar el reemplazo
oportunista es menor que el costo correctivo, es mejor cambiar el componente, en
caso contrario, el componente se cambiará hasta su siguiente reemplazo programado.
Es decir, si
Cip (Ri (tj ) − Ri ((k + 1)τ | tj )) < (Coc + Cic )Fi ((k + 1)τ | tj ))
Se realiza el reemplazo oportunista del componente i en el tiempo tj . En caso contrario, se deja hasta el siguiente reemplazo programado.
4.8.3. Descripción del modelo
El tiempo de reemplazo base τ se define como el tiempo de reemplazo mı́nimo
de todos los componentes, es decir, τ = mini=1,...,q τi , donde τi es el tiempo de reemplazo óptimo del componente i, según la polı́tica de reemplazo basado en la edad.
Los nuevos intervalos de reemplazo de los componentes se definen como múltiplos
del intervalo de mantenimiento τ , es decir, νi = ki τ , donde ki son enteros que satisfacen ki ≥ 1, i = 1, 2, ..., q. Para cada componente, el valor inicial ki es calculado
dividiendo el intervalo de reemplazo óptimo del componente i (τi ) por el intervalo
óptimo de reemplazo mı́nimo en el sistema, redondeando al entero más cercano.
107
Figura 4.18: Plan de mantenimiento preventivo programado, sin considerar fallas
(Laggoune et al.,2009, pág. 1501)
De lo anterior se tiene que las variables de decisión del modelo son (τ, k1 , k2 , ..., kq ),
donde τ ≥ 0 es variable continua y las variables ki son enteras.
En la expresión del costo total esperado por unidad de tiempo intervienen los
costos generados a lo largo del ciclo de vida del sistema. Un ciclo va a estar dado
por el lapso de tiempo durante el cual todos los componentes del sistema se reemplazan de manera simultánea, y se denotará por Kτ , con K = mcm{k1 , k2 , ..., kq }.
En la Figura 4.18 se muestra un sistema, el cual es renovado de manera completa en
12τ . En este punto todos los componentes del sistema son reemplazados de manera
simultánea.
El costo total esperado por unidad de tiempo de expresa como sigue:
q
PK X
k=1
C(τ, k1 , ., kq ) =
j=1

Coc + Cjc +

X

Cip  Fsj (kτ ) + Cop +

X
Cip  Rsj (kτ )
i∈Gpk
i∈Ghk ,i6=j

Kτ
donde Fsj (·) es la función de distribución acumulada del sistema, debido a la falla del
j-ésimo componente. Recordemos que para un componente en serie la falla de cualquier
componente origina la falla del sistema, entonces Fsj (·) = Fj (·). El grupo Ghk , es el grupo
de componentes que se reemplazaran de manera oportunista cuando una falla ocurre en
el intervalo ((k − 1)τ, kτ ) y Gpk es el grupo de componentes que serán reemplazados de
manera preventiva en el instante kτ .
En la Figura 4.19 se presenta el diagrama de flujo del algoritmo que se utiliza para encontrar el conjunto óptimo (τ ,k1 , k2 , ..., kq ), donde τ indica el tiempo mı́nimo de reemplazo
y cada ki , i = 1, ..., q fija el tiempo de reemplazo de cada componente, el cual se obtiene
al multiplicar ki τ . Como la función que describe el costo esperado por unidad de tiempo
está en función de variables continuas y discretas, el algoritmo se basa en simulaciones
108
Monte Carlo, el cual puede manejar ambas variables. Se generan muestras aleatorias de los
tiempos de vida de cada uno de los componentes y son usadas para simular el costo total
de mantenimiento para diferentes combinaciones (τ, k1 , k2 , ..., kq ).
Como el algoritmo de búsqueda requiere un punto inicial, la solución inicial puede ser
definida por los tiempos de reemplazo óptimos de cada componente. Estos tiempos proporcionan los valores iniciales ki . Para el número de combinaciones de los valores de ki ,
i = 1, ...q en lugar de usar el factorial, se reducirán éstas suponiendo que el reemplazo de
cada componente sólo puede ser adelantado o retrasado un periodo τ de su valor original,
es decir, ki − 1 ≤ ki ≤ ki + 1, i = 1, ..., q.
Algoritmo
1. Generar muestras aleatorias de los tiempos de vida de los componentes, ti , de acuerdo
a la distribución de probabilidad de falla. El tiempo de falla del sistema es definido
por ts = mini=1,...,q ti . Se identifica el componente que produce la falla del sistema.
Los reemplazos son programados en los tiempos kτ , donde k es un entero que varı́a
de 0 a K.
2. En el k-ésimo reemplazo, el tiempo de falla ts es comparado con el tiempo programado
para el reemplazo preventivo kτ . Dos posibilidades existen:
i) Si no existe una falla antes de kτ , se lleva a cabo el mantenimiento preventivo
programado en kτ , de acuerdo al plan actual. Se pasa al siguiente reemplazo
programado (k + 1)τ .
ii) Si una falla es observada, falla el sistema y se reemplaza de manera correctiva el
componente que falló. En base a la regla descrita arriba, se decide si se toma
la oportunidad de reemplazar los otros componentes. Se calculan los costos
preventivos.
3. Se generan nuevos tiempos de vida para los componentes reemplazados en el paso
2 (pues nuevos componentes son instalados). Se pasa al siguiente reemplazo programado (k + 1)τ y ası́ hasta que se alcanza el tiempo total para reemplazar todos los
componentes de manera simultánea.
4. Repetir los pasos 1-3 para generar nuevos escenarios de manera aleatoria, hasta que
se alcanza un número de simulaciones N .
5. El costo total esperado por unidad de tiempo está dado por


N
K
1 X X  c
Co + Cjc +
N
s=1
k=1

X
i∈Gh ,i6=j

Cip  IFk,s + Cop +

X

Cip  IRk,s 
i∈Gp
Donde N es el número de simulaciones, IFk,s y IRk,s son funciones indicadoras para los
109
estados de falla y operación respectivamente. Para el k-ésimo intervalo de reemplazo
de simulación s, estas funciones se definen como:
(
1, si el sistema falla
IFk,s =
0, si el sistema opera.
IRk,s
(
1,
=
0,
si el sistema opera
si el sistema falla.
6. El procedimiento es repetido para diferentes combinaciones de los valores ki .
Figura 4.19: Diagrama de flujo para el algoritmo que permite encontrar el intervalo
de reemplazo óptimo y la estrategia de grupo (Laggoune et al.,2009, pág. 1501)
110
En el siguiente ejemplo se ilustra el procedimiento de mantenimiento oportunista para un
sistema en serie formado por dos componentes. Se comparan los resultados obtenidos con
los que se obtienen con las polı́ticas de mantenimiento basado en la edad y mantenimiento
a intervalos constantes.
Ejemplo 4.8.1. Vamos a considerar un sistema en serie formado por dos componentes
A y B, con distintas tasas de falla. Calcularemos los tiempos de reemplazo óptimos de los
componentes usando los distintos enfoques que se han estudiado hasta el momento: reemplazo basado en la edad, reemplazo conjunto, es decir, considerando el sistema como un solo
componente y reemplazo oportunista. Al terminar compararemos los resultados obtenidos.
Se supondrá que los costos fijos tanto de mantenimiento preventivo como correctivo son
$600.00 y $8, 0000.00 respectivamente. En el Cuadro 4.7 se muestran los datos correspondientes a los parámetros de la distribución de los tiempos de falla de cada componente,
junto con los costos variables de mantenimiento preventivo y correctivo.
Cuadro 4.7: Caracterı́sticas de los componentes
Componente Parámetro de forma Parámetro de escala Cip
Cic
A
2.5
500
$600 $5,000.00
B
2.7
200
$200 $400.00
Para empezar vamos a calcular el intervalo de mantenimiento preventivo óptimo de
cada componente (sin considerar la configuración en serie), de acuerdo a la polı́tica de
reemplazo preventivo basada en la edad. En el Cuadro 4.8 se muestran los óptimos para
cada componente.
Cuadro 4.8: Reemplazo Basado en la Edad
Componente topt Costo mı́nimo ($/dı́a)
A
171
11.81
B
72
17.90
En la Figura 4.20 se muestra el comportamiento del costo esperado por unidad de tiempo para cada cada componente.
Ahora veamos qué sucede con el reemplazo conjunto de los componentes considerando
la configuración en serie. En este caso el tiempo de reemplazo óptimo para los dos componentes del sistema es 73 dı́as, con un costo mı́nimo de $31.51 por dı́a. En la Figura 4.21
se muestra el comportamiento del costo esperado por unidad de tiempo para el sistema.
111
Figura 4.20: Reemplazos separados
Figura 4.21: Reemplazo conjunto
Por último, vamos a utilizar el enfoque de mantenimiento oportunista para obtener la
combinación de los tiempos de reemplazo para cada componente que minimize los costos
totales de mantenimiento preventivo. Llamaremos componente 1 al componente A y componente 2 al componente B.
Según el algoritmo que se describió anteriormente, el valor de τ es 72 dı́as. Los valores iniciales para los tiempos de reemplazo individuales son k1 = 2 y k2 = 1, es decir, el
componente 1 se reemplaza cada dos reemplazos del componente 2 (cada 2τ ). Se realizan
50,000 simulaciones para generar los distintos escenarios y obtener el resultado óptimo. En
el Cuadro 4.9 se muestran los resultados obtenidos para las seis diferentes combinaciones
112
que se obtuvieron a partir del grupo inicial {2, 1}.
Cuadro 4.9: Solución para diferentes grupos de reemplazo
Combinación k1 , k2 Ciclo de vida del sistema(dı́as) τ (dı́as) Costo ($/dı́a)
1,1
71
71
27.1246
2,1
140
70
24.5876
2,2
134
67
31.1893
1,2
136
68
26.2368
3,1
198
66
26.4678
3,2
384
64
28.2886
Se puede observar que de las 6 combinaciones, la {2, 1} es la que minimiza los costos
totales de mantenimiento. De hecho, de los tres enfoques este último es el que origina los
menores costos. En el reemplazo individual de los componentes, reemplazar los dos componentes genera un costo de $29.71, y si éstos se reemplazan de manera conjunta se genera
un costo de $31.51.
Los datos de este problema fueron tomados de [10] . Los resultados que se han obtenido
no coinciden con los resultados que presenta el artı́culo, pues en éste se usa información
no publicada.
4.9.
Conclusiones
En esta tesis se ha realizado un análisis estadı́stico de los tiempos de falla correspondientes a un componente o sistema. Se estudiaron distintos procedimientos para estimar
ya sea la función de distribución del tiempo de falla F (·) o la función de confiabilidad R(·),
tanto para datos completos como para datos censurados. A partir de estas funciones se
pueden derivar otros de los parámetros que aportan información sobre las confiabilidad de
un componente o sistema como son: la tasa de falla y el M T BF .
Se estudiaron las distintas polı́ticas de mantenimiento o reemplazo preventivo de sistemas de uno o más componentes. El objetivo de éstas es además de mantener la confiabilidad del componente o sistema, ahorrar costos totales de mantenimiento. En el Capı́tulo
2 se vió que las actividades del mantenimiento preventivo prolongan la vida de los componentes, reduciendo el número de fallas e incrementando el M T BF del sistema. Realizar
mantenimiento preventivo a los sistemas les permitirá a éstos mantenerse en buenas condiciones para conseguir un buen rendimiento y los estándares de calidad.
113
Las polı́ticas de mantenimiento preventivo que se expusieron a lo largo de este trabajo
indican que la confiabilidad es un factor clave para determinar el costo del ciclo de vida de
un sistema. Mejorar la confiabilidad de un sistema cuesta dinero, pero se justifica económicamente si la disminución del costo de falla es, al menos, igual al aumento del costo debido
a la mejora de la confiabilidad.
Tanto para sistemas de un solo componente como para aquellos de múltiples componentes, la polı́tica de reemplazo basado en la edad es la que genera el intervalo de reemplazo
más largo, a diferencia de la polı́tica de reemplazo a intervalos constantes, reduciendo con
ello el número de paradas del sistema, las cuales afectan la disponibilidad del mismo. La
única desventaja de esta polı́tica es que se tiene que llevar un registro de los tiempos de
las falla para calcular la edad del sistema, cosa que no sucede en la polı́tica de reemplazo a
intervalos constantes, pues en esta otra los reemplazos preventivos se realizan en intervalos
de tiempos fijos, sin tener en cuenta la edad del sistema.
Con respecto a los modelos de distribución de probabilidad que más se utilizan en el
área de confiabilidad, podemos concluir que la distribución Weibull es la que más se utiliza
en la práctica; ya que además de ser muy fácil de manejar, nos permite representar la tasa
de falla en las tres zonas de la Curva de la Bañera, dependiendo del valor del parámetro de
forma. Recordemos que para el caso de la distribución Exponencial, la cual se caracteriza
por tener una tasa de falla constante (tı́pica de los sistemas electrónicos) las polı́ticas de
mantenimiento preventivo demostraron no ser una buena estrategia, pues la aplicación de
éstas solo genera pérdida de tiempo y dinero.
En lo que se refiere al ejemplo del elevador que se presentó en el Capı́tulo 3, se consideró que tanto la distribución Normal como la Weibull, se ajustan bastante bien a los
datos, aunque el costo computacional es menor cuando se usa la distribución Weibull. Hay
que recalcar que éstas dos distribuciones se ajustaron a un número reducido de datos. De
hecho es un tanto difı́cil obtener los datos de falla de un sistema real, pues muchas veces los
encargados de éstos llevan un registro de las fallas de los diferentes sistemas que mantienen
y anotan sólo los datos. A pesar de esta limitación, se pudieron aplicar las polı́ticas de
mantenimiento preventivo y se vió que el tipo de mantenimiento que resulta óptimo es el
de edad a 14 dı́as con un costo de $50.48 que es el mı́nimo. El tiempo medio entre fallas
es de 32.68 dı́as, el cual es mejor que el que se tenı́a con mantenimiento programado cada
30 dı́as, el cual genera un costo de $58.31.
El estudio de las polı́ticas de mantenimiento para sistemas en serie, paralelo y mixto
permitió ver que el intervalo de reemplazo óptimo es menor cuando se trata de un sistema
en serie; el intervalo empieza a crecer cuando los componentes forman parte de una configuración mixta, y es mayor si los componentes forman parte de una configuración en paralelo.
Independientemente de si el sistema está formado por uno o más componentes y de la
configuración que se considere, la polı́tica de mantenimiento preventivo basado en la edad
siempre es mejor que la polı́tica de mantenimiento a intervalos constantes.
114
Una buena alternativa de mantenimiento preventivo a la configuración en serie es la
polı́tica de mantenimiento oportunista. Aquı́ la falla de un componente ocasiona la falla
del sistema; en este momento se reemplaza el componente que falló y se evalúa la decisión
de reemplazar los componentes que no fallaron, esto en base a la degradación de los componentes y la comparación de los costos de reemplazo por falla y reemplazo programado.
Para ilustrar esta polı́tica empleamos la Simulación Monte Carlo para simular el comportamiento real de un sistema en serie formado por dos componentes, cuyo tiempo de falla
es modelado con la distribución Weibull. Se calcularon los costos totales de mantenimiento
para diferentes planes de mantenimiento preventivo y se seleccionó el plan que generó los
menores costos. Los costos que se obtuvieron en el plan de mantenimiento óptimo fueron
menores a los que se obtuvieron cuando se realiza el reemplazo conjunto de los dos componentes.
Queda pendiente el estudio de las polı́ticas de mantenimiento preventivo para sistemas
con más de dos componentes con diferente tasa de falla, suponiendo que tras la falla del
sistema, sólo es reemplazado el componente que falló, en vez de reemplazar el sistema
completo. Este otro procedimiento permitirá generar un ahorro en los costos totales de
reemplazo preventivo.
Para finalizar, cabe mencionar que estas polı́ticas serán de utilidad, para aquellas empresas que cuenten con sistemas, para los cuales, una falla inesperada del sistema le representa una gran pérdida de producción o se tengan consecuencias catastróficas; como
por ejemplo: las aeronáuticas, las petroquı́micas y generadoras de energı́a, por mencionar
algunas.
Bibliografı́a
[1] Duncan, A. J. (1996).Control de Calidad y Estadı́stica Industrial. Richard D. Irwing,
Inc., México.
[2] Cristaldi, L., Lazzaroni, M. and Catelani, M. (2011). Reliability Engineering. Springer,
Italy.
[3] Tobias, P. A. and Trindade, D. C. (1995). Applied Reliability. Thomson Publishing
Inc.
[4] Crowder, M. J., Klimber, A. C., Smith, R. L. and Sweeting, T. J. (1991). Statistical
Analysis of Reliability Data. Chapman & Hall, London .
[5] Crespo, A. M. (2007). The Maintenance Management Framework: models and methods
for complex systems maintenance. Springer Series in Reliability Engineering.
[6] Redondo, J. C. (2007). Un Modelo Matemático Óptimo de Mantenimiento y Fiabilidad
Aplicado a la Aviación Comercial. Tesis Doctoral, Universidad Nacional de Educación
a Distancia, España.
[7] Barlow, R. E. and Frank P. (1996). Mathematical Theory of Reliability. Society for
Industrial and Applied Mathematics.
[8] Modarres, M. K., Mark and Krivtsov, V. (1999). Reliability Engineering and Risk
Analysis. Marcel Dekker, Inc., New York .
[9] Dodson, B. and Nolan, D. (2002). Reliability Engineering Handbook. QA Publishing,
LLC.
[10] Laggoune, R., Chateauneuf, A. and Aissani, D. (2009). Opportunistic policy for optimal preventive maintenance of a multi-component system in continuous operating
units. Computers & Chemical Engineering, 33, 1499-1510.
[11] Campbell, J. D. and Jardine, A. K. S. (2001). Maintenance Excellence: Optimizing
Equipment Life-Cycle Decisions. New York: Marcel Dekker.
[12] Smith, P. J. Analysis of Failure and Survival Data. (2002). Chapman & Hall.
115
116
[13] Nakawa, T. (2005). Maintenance Theory of Reliability. Springer Series in Reliability
Engineering, London.
[14] Wang, H. and Pham, H. (2006). Reliability and Optimal Maintenance. Springer Series
in Reliability Engineering, London.
Descargar