VI. FASE DE MEDICIÓN 2. Probabilidad Dr. Primitivo Reyes Aguilar / enero 2009enero 2009 www.icicm.com primitivo_reyes@yahoo.com 04455 52 17 49 12 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 Contenido VI. FASE DE MEDICIÓN - PROBABILIDAD ............................................................................ 3 Definiciones .................................................................................................................. 3 VI.1 Conclusiones estadísticas válidas ............................................................................. 3 Estudios analíticos (inferenciales) ................................................................................ 3 Estudios enumerativos (descriptivos) .......................................................................... 4 VI.2 Teorema del límite central ....................................................................................... 5 VI.3 Conceptos de Probabilidad ...................................................................................... 6 Probabilidad de un evento simple ............................................................................... 7 Probabilidad de eventos Compuestos ......................................................................... 7 Relaciones entre eventos ............................................................................................. 8 Leyes dela probabilidad ............................................................................................. 10 Teorema de Bayes ...................................................................................................... 11 VI.4 Distribuciones de probabilidad .............................................................................. 13 VI.5 Distribuciones de probabilidad discretas ............................................................... 14 DISTRIBUCIÓN HIPERGEOMÉTRICA............................................................................ 14 b) Cuál es la probabilidad de aceptar el lote si contiene 3 defectuosos. ................. 15 DISTRIBUCIÓN BINOMIAL........................................................................................... 15 DISTRIBUCIÓN DE POISSON ....................................................................................... 18 VI.6 Distribuciones de probabilidad continuas.............................................................. 22 DISTRIBUCIÓN EXPONENCIAL .................................................................................... 23 La distribución normal................................................................................................ 27 VI.7 Distribuciones de probabilidad para decisión ........................................................ 29 DISTRIBUCIÓN CHI CUADRADA .................................................................................. 29 DISTRIBUCIÓN T DE STUDENT .................................................................................... 30 Distribución F ............................................................................................................. 31 Bibliografía ..................................................................................................................... 33 Página 2 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 VI. FASE DE MEDICIÓN - PROBABILIDAD Definir Definir Medir Medir Analizar Analizar Mejorar Mejorar Controlar Controlar Definiciones Distribuciones de Contienen un número infinito de valores que pueden ser probabilidad mostrarlos en una escala de medición continua (distribuciones continuas normal, uniforme, Weibull y exponencial) Distribuciones de probabilidad discretas Resultan de datos contables (atributos) con un número finito de valores posibles (distribuciones binomial, Poisson e hipergeométrcia) Distribuciones de probabilidad de decisión De utilizan para tomar decisiones y construir intervalos de confianza. Ejemplos t, F, Chi cuadrada VI.1 Conclusiones estadísticas válidas Estudios analíticos (inferenciales) El objetivo de la inferencia estadística es obtener conclusiones acerca de una característica de la población con base en la información obtenida en una muestra. Tiene dos pasos: (1) la inferencia y (2) la medición de su validez. Los pasos para realizar la inferencia son: Definir el objetivo del problema en forma precisa Decidir si el problema se evaluará con una o dos colas Formular una hipótesis nula y la alterna Página 3 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 Seleccionar una distribución de prueba y un valor crítico del estadístico reflejado el grado de incertidumbre que puede ser tolerado (alfa, riesgo) Calcular el valor del estadístico de prueba con la información de la muestra Comparar el valor del estadístico calculado vs su valor crítico y tomar una decisión de aceptar o rechazar la hipótesis nula Comunicar los hallazgos a las partes interesa Todos los días nos enfrentamos a tomar decisiones (A o B), mientras que mucha gente piensa que con su intuición es suficiente, el caso es que frecuentemente toman malas decisiones. Estudios enumerativos (descriptivos) Los datos enumerativos son los que pueden ser contados (por ejemplo: clasificación de cosas, clasificación de gente por rango de ingreso, etc.). Las herramientas usadas en las pruebas de hipótesis realizadas con datos enumerativos son la Chi cuadrada. Binomial y Poisson. Para Deming: En un Estudio enumerativo la acción se toma en el universo. En un estudio analítico la acción será tomada en un proceso para mejorar su desempeño futuro Las medidas calculadas de una muestra se denominan estadísticos y cuando describen a la población se denominan parámetros: Medida Estadístico Media 𝑋̅ Desviación estándar s Página 4 de 35 Parámetro FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 RESUMEN Los estudios analíticos inician con el establecimiento de la hipótesis acerca de los parámetros de la población. Se obtiene un estadístico muestral para probar la hipótesis y ya sea rechazarla o no rechazarla. En un cierto nivel de confianza se deben poder hacer inferencia respecto a la población. VI.2 Teorema del límite central Si una variable aleatoria X tiene media con varianza finita 2, conforme se incrementa n, 𝑋̅ tiende a ser una distribución normal con media y varianza 𝜎𝑋2̅ . Donde 𝜎𝑋2̅ = /n. Donde n es el número de observaciones en las que se basa el cálculo de las medias. La distribución de las medias de las muestras tienden a distribuirse normalmente independientemente de la población de donde se originan las muestras. La dispersión de los valores individuales en mayor que la dispersión de los promedios y se relacionan como sigue: sX X n Ejemplo: Si la media del peso de un producto es de 20 gramos y su desviación estándar S es de 0.124 gramos. Estimar la sigma de las medias para un tamaño de muestra de 4: Página 5 de 35 FASE DE MEDICIÓN PROBABILIDAD 𝑆𝑋̅ = 𝑆𝑋 √𝑛 = 0.124 √4 P. Reyes / febrero 2009 = 0.062 𝑔𝑟𝑎𝑚𝑜𝑠 En la siguiente página se muestra el comportamiento de la distribución de las medias para varias distribuciones de pobalciones: VI.3 Conceptos de Probabilidad Para hacer inferencias acerca de la población con base en información tomada de una muestra, se utilizan las probabilidades. La probabilidad de cualquier evento (E ) se encuentra entre 0 y 1. La suma de las probabilidades de todos los eventos posibles (E ) en un espacio muestra (S) es 1. Página 6 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 Probabilidad de un evento simple La probabilidad de un evento (E), puede ser calculada mediante la relación de el número de respuestas en favor de E, y el número total de resultados posibles en un experimento. P E # Favorable E # Total resultados 1 .16 6 1 Ejemplo 2: La probabilidad de lanzar una moneda y que caiga cara es: .5 2 Ejemplo 1: La probabilidad de que salga 2 al lanzar un dado es: Ejemplo 3: La probabilidad de sacar 1,2,3,4,5, o 6 al lanzar un dado es: 1 1 1 1 1 1 1 6 6 6 6 6 6 La probabilidad de un evento está comprendida siempre entre 0 y 1. La suma de las probabilidades de todos los eventos posibles (E) en un espacio muestral S = 1 Un espacio muestral (S): Es el conjunto Universal; conjunto de todos los “n” elementos relacionados = # Total de resultados posibles. Probabilidad de eventos Compuestos Es la probabilidad compuesta por dos eventos simples relacionados entre sí. En la composición existen dos posibilidades: Unión o Intersección . Unión de A y B Si A y B son eventos en un espacio muestral (S), la unión de A y B A B contiene todos los elementos de el evento A o B o ambos. Intersección de A y B Página 7 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 Si A y B son eventos en un espacio muestral S, la intersección de A y B A B está compuesta por todos los elementos que se encuentran en A y B. Relaciones entre eventos Existen tres tipos de relaciones para encontrar la probabilidad de un evento: complementarios, condicionales y mutuamente excluyentes. 1. Eventos complementarios: El complemento de un evento A son todos los elementos en un A 1 P A espacio muestral (S) que no se encuentran en A. El complemento de A es: Ejemplo 4: En el evento A (día nublado), P(A) = .3, la probabilidad de tener un día despejado será 1-P(A) = .7 P A .7 P(A)=.3 2. Probabilidad condicional: Para que se lleve a cabo un evento A se debe haber realizado el evento B. La probabilidad condicional de un evento A dado que ha ocurrido el evento B es: P A B P A B , si B 0 P B Ejemplo 5: Si el evento A (lluvia) y B(nublado) = 0.2 y el evento B (nublado) = 0.3, cual es la probabilidad de que llueva en un día nublado? Nota: no puede llover si no hay nubes P A B P A B = P B 0 .2 0.67 0 .3 A P(A/B)=.67 Ejemplo 6. Las razones de queja en productos se muestran a continuación: RAZÓN DE LA Página 8 de 35 B FASE DE MEDICIÓN PROBABILIDAD En garantía Fuera de garantía Total P. Reyes / febrero 2009 Falla eléctrica 18% 12% QUEJA Falla mecánica 13% 22% Falla apariencia 32% 3% Total 63% 37% 30% 35% 35% 100% Si A es el evento de que la queja es por apariencia y que B representa que la queja ocurrió en el periodo de garantía. Se puede calcular P(Z | B) = P(A y B) / P(B) P(A | B) = 0.32 / 0.63 = 0.51 Si C es el evento fuera de garantía y D falla mecánica: P(C|D) = P(C y D) / P(D) = 0.22 / 0.35 = 0.628 Se dice que dos eventos A y B son independientes si: P(A/B) = P(A) o P(B/A) = P(B). La probabilidad de la ocurrencia de uno no está afectada por la ocurrencia del otro. De otra manera los eventos son dependientes. Un ejemplo de evento independiente es: ¿Cuál es la probabilidad de que llueva en lunes? El ejemplo de evento dependiente es el ejemplo 5. 3. Eventos mutuamente excluyentes. Cuando un evento A no contiene elementos en común con un evento B, se dice que estos son mutuamente excluyentes. A B Eventos mutuamente excluyentes. Ejemplo 7. Al lanzar un dado: a) cual es la probabilidad de que salga 2 o 3? B) Calcule P A B ? a) P A B 1 1 1 .33 6 6 3 Página 9 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 b) P A B = 0, ya que al ser conjuntos mutuamente excluyentes la intersección no existe, es imposible que salga 2 y 3 al mismo tiempo. Leyes dela probabilidad Ley aditiva: Cuando dos eventos no son mutuamente excluyentes: P A B P A PB P A B Ejemplo: Si se tienen dos coches y cada uno tiene la probabilidad de arrancar en una mañana fría de 0.7 ¿Cuál es la probabilidad de llegar al trabajo? P(AuB) = P(A) + P(B) – P(AyB) = 0.7 + 0.7 – 0.49 = 91% Cuando los eventos son mutuamente excluyentes: P A B P A PB Ejemplo: Si la probabilidad de hallar un balón negro en un cuarto obscuro es de 0.4 y la probabilidad de hallar un balón azul es de 0.3 ¿Cuál es la probabilidad de hallar un balón negro o azul? P(AuB) = 0.4 + 0.3 = 70% Ley multiplicativa: Si los eventos A y B son dependientes: P A B P A PB A Si los eventos A y B son independientes: P A B P A PB Ejemplo 8: Se selecciona una muestra aleatoria n = 2 de un lote de 100 unidades, se sabe que 98 de los 100 artículos están en buen estado. La muestra se selecciona de manera tal que el primer artículo se observa y se regresa antes de seleccionar el segundo artículo (con reemplazo), a) calcule la probabilidad de que ambos artículos estén en buen estado, b) si la muestra se toma sin reemplazo, calcule la probabilidad de que ambos artículos estén en buen estado. A: El primer artículo está en buen estado. B: El segundo artículo está en buen estado. a) Al ser eventos independientes el primero del segundo: Página 10 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 98 98 P A B P A PB = .9604 100 100 A P(A) =.98 B P(B) =.98 b) Si la muestra se toma “sin reemplazo” de modo que el primer artículo no se regresa antes de seleccionar el segundo entonces: 98 97 P A B P A PB A = .9602 100 99 Se observa que los eventos son dependientes ya que para que para obtener el evento B, se tiene que haber cumplido antes el evento A. B P(B/A)=.97 A P(A) =.98 Teorema de Bayes Mediante el teorema de Bayes se puede calcular la probabilidad de que ocurra un determinado evento, cuando no hay datos inmediatos del mismo mediante la información que se tiene de otros eventos. Cuando existen dos eventos posibles A y B, la probabilidad de que ocurra Z se describe mediante el “teorema de probabilidad total” el cual es: Página 11 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 P(Z ) P A PZ APB PZ B Mediante el teorema anterior se deduce el teorema de Bayes: P A Z P A PZ A P A PZ APB PZ B Ejemplo 8: En cierta universidad 20% de los hombres y 1% de las mujeres miden más de 1.80m de altura. Asimismo 40% de los estudiantes son mujeres. Si se selecciona un estudiante al azar y se observa que mide más de 1.80m ¿Cual es la probabilidad de que sea mujer? Z > 1.80 m HOMBRE MUJER A = Hombre B = Mujer .80 .99 < 1.80 P (A) = .60 P (B) = .40 > 1.80 .20 .01 P (Z|A) = .20 P (Z|B) = .01 =Z Para encontrar la probabilidad de que sea mujer dado que mide más de 1.80, Utilizando el teorema de Bayes: P B Z PB PZ B P A PZ APB PZ B Hombre P(B/Z) = (.4 x .01)/ (.6 x .20 +.4 x .01) = .032. Mujer Se puede visualizar P(B/Z) en el siguiente diagrama: Z > .80 Por lo tanto la probabilidad de que sea mujer dado que mide más de 1.80 es .032 = 3.2 % Página 12 de 35 P(A/Z) P(B/Z) = .032 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 VI.4 Distribuciones de probabilidad Variable aleatoria: Para un determinado espacio muestral SS una variable aleatoria (VA) es cualquier regla que relaciona un número con cada resultado en SS. Variable aleatoria de Bernoulli: Es cualquier variable aleatoria con valores 0 y 1. Variable aleatoria discreta: Es una variable aleatoria cuyos posibles valores son enteros. Variable aleatoria continua: Es una variable aleatoria cuyos valores posibles son los reales. Distribución de probabilidad o función de masa de probabilidad: Establece en una tabla, fórmula o gráfica como se distribuye la probabilidad P(y) asociada a los posibles valores de la variable aleatoria y. Debe cumplir con las reglas siguientes: 1. 0 <= P(y) <= 1 2. Suma (P(y)) = 1 y P(Y=y) 0 1/4 1 1/2 2 1/4 Su fórmula es la siguiente: 3 P( y) P(Y y) (.5)3 y (.5) y y Función de distribución acumulativa: FX ( x) P( X x) Con propiedades: Página 13 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 0 F ( x) 1 Limx F ( x) 1 Limx F ( x) 0 Valor esperado de una distribución de probabilidad discreta La media o valor esperado de una variable aleatoria discreta X , denotada como E(X), es X E ( X ) xf X ( x) xP( X x) x x La media es el centro de la masa del rango de los valores de X. Varianza de una distribución de probabilidad discreta Sea Y una variable aleatoria discreta con distribución de probabilidades P(X=x). Entonces, la varianza de Y es: X 2 E[( X X )2 ] ( x X )2 P( X x) x VI.5 Distribuciones de probabilidad discretas DISTRIBUCIÓN HIPERGEOMÉTRICA Se aplica cuando la muestra (n) es una proporción relativamente grande en relación con la población (n > 0.1N). El muestreo se hace sin reemplazo. P(x, N, n, D) es la probabilidad de exactamente x éxitos en una muestra de n elementos tomados de una población de tamaño N que contiene D éxitos. La función de densidad de distribución hipergeométrica: CxDCnNxD P( x) CnN C xn Con n! x!(n x)! La media y la varianza de la distribución hipergeométrica son: nD N nD D N n 2 1 N N N 1 Ejemplo: De un grupo de 20 productos, 10 se seleccionan al azar para prueba. ¿Cuál es la probabilidad de que 10 productos seleccionados contengan 5 productos buenos? Los productos defectivos son 5 en el lote. Página 14 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 N = 20, n = 10, D = 5, (N-D) = 15, x = 5 P(x=5) = 0.0183 = 1.83% 5! 15! 5!0! 5!10! P (5) 0.0183 20! 10!10! USO DE EXCEL: N = Tamaño de Población, n = Tamaño de muestra, D= éxitos en la población; x = éxitos en la muestra. En Fx Estadísticas seleccionar =distr.hipergeom(x, n, D, N) USO DE MINITAB: Calc > Probability distributions > Hypergeometric Probability (densidad) o Cumulative probability (acumulada) N, D, n y en Input constant introducir x. EJERCICIO: 1. Se compran 10 transformadores y se toma una muestra de 4. Si se encuentra uno o más defectuosos se rechaza el lote de 10. a) Cuál es la probabilidad de aceptar el lote si contiene 3 defectuosos. b) Si el lote tiene un defectuoso, ¿Cuál es la probabilidad de que se rechace el lote? DISTRIBUCIÓN BINOMIAL Ensayo Bernoulli. Es un experimento aleatorio que solo tiene dos resultados. Éxito o fracaso. Donde la probabilidad de éxito se denota por p Suponga se realizan n experimentos Bernoulli independientes. Suponga que la variable X de interés es el número de éxitos. X toma valores 0,1,2,...,n La distribución binomial se utiliza para modelar datos discretos y se aplica para poblaciones grandes (N>50) y muestras pequeñas (n<0.1N). El muestreo binomial es con reemplazo. Es apropiada cuando la proporción defectiva es mayor o igual a 0.1. La binomial es una aproximación de la hipergeométrica Página 15 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 La distribución normal se aproxima a la binomial cuando np > 5 La variable aleatoria x tiene una distribución binomial como sigue: n f ( x) P( X x) p x (1 p) n x x 0,1,...,n x n = tamaño de muestra x = Ocurrencias o número de defectivos p = probabilidad o proporción defectiva Con media y varianza: E ( X ) X np V ( X ) X2 np(1 p) Ejemplo: Se toma una muestra aleatoria de 10 unidades de un lote de una prena. Por experiencia se sabe que hay el 10% de partes defectivas. Encontrar la probabilidad de encontrar exactamente una parte defectiva (n = 10, x = 1, p = 0.1) 𝑃(𝑋 = 1) = 10! (0.1)1 (0.9)9 = 𝟑𝟖. 𝟕𝟒% 1! 9! Ejemplo: Durante el mes pasado un proceso continuo promedió 6% de defectivos, al inicio de este mes se tomó una muestra de 300 unidades, encontrando 22 defectivos. ¿Cuál es el promedio de defectivos esperado y la variación a 3 sigmas? P = x/n = 22 / 300 = 0.073 𝑝(1−𝑝) 1- p =0.927 𝜎𝑝 = √ Página 16 de 35 𝑛 0.073(0.927) =√ 300 = 0.015 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 P ± 3 S = 0.073 ± 0.045 = ( 0.028, 0.118) Ejemplo: Un equipo requiere a lo más 10% de servicios en garantía. Para comprobarlo se compran 20 de estos equipos y se someten a pruebas aceleradas de uso para simular el uso durante el periodo de garantía. Obtener la probabilidad para P(x<=4). Rechazar la afirmación de que falla menos del 10% si se encuentra que X>=5. P(X>=5) = 1- P(X<=4) =1 - distr.binom(4,20,0.1,1) = 1 – 0.9568 = 0.0432 lo cual es bajo. USO DE EXCEL: x = éxitos en la muestra, p = probabilidad de éxito, n = tamaño de muestra. En Fx Estadísticas seleccionar =distr.binom(x, n, p, 0 o 1 dependiendo si es puntual o acumulada) USO DE MINITAB: Calc > Probability distributions > Binomial Probability (densidad) o Cumulative probability (acumulada) n = number of trials, p = probability of success y en Input constant introducir x. EJERCICIOS 1. Un panel solar tiene una vida útil de 5 años con una probabilidad de 0.95. Se toman 20 paneles solares y se registró la vida útil. a) ¿Cuál es la probabilidad de que exactamente 18 tengan su vida útil de 5 años? b) ¿Cuál es la probabilidad de que cuando mucho 10 tengan esa vida útil? c) ¿Si solo 10 paneles tienen una vida útil de 5 años, que debería pensarse sobre el valor verdadero de P? 2. 20% de los teléfonos se reparan cuando todavía está vigente la garantía. De estos el 60% se reparan mientras que el 40% se reemplazan. Si una empresa compra 10 de estos teléfonos, ¿Cuál es la probabilidad de que exactamente sean reemplazados 2 en periodo de garantía?. 3. Suponga que solo 25% de los automovilistas se detienen por completo en un alto con luz roja intermitente cuando no está visible otro automóvil. ¿Cuál es la probabilidad de que de 20 automovilistas seleccionados al azar se detengan: a) A lo sumo 6 se detengan por completo b) Exactamente 6 se detengan por completo? Página 17 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 c) Al menos 6 se detengan por completo? d) Cuántos de los siguientes 20 automovilistas se espera que se detengan por completo? 4. De todas las plantas sólo el 5% descargan residuos por sobre la norma. Si se muestrean 20 plantas ¿Cuál es la probabilidad de que estén fuera de la ley: a) Menos que una planta? b) Menos de dos plantas c) Exactamente 3 d) Más de una DISTRIBUCIÓN DE POISSON La distribución de Poisson se utiliza para modelar datos discretos como aproximación a la Binomial dada la dificultad que existía de encontrar tablas Binomiales adecuadas cuando n es grande y p pequeña. La distribución de probabilidad de Poisson proporciona buenas aproximaciones cuando np <= 5. Se aproxima a la binomial cuando p es igual o menor a 0.1, y el tamaño de muestra es grande (n > 16) por tanto np > 1.6. Una Variable aleatoria X tiene distribución Poisson si toma probabilidades con. e x f ( x) x! x 0,1,... Con media y varianza: np np Página 18 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 Ejemplo 1. Suponga que una compañía de seguros asegura las vidas de 5000 hombres de 42 años de edad. Si los estudios actuariales muestran que la probabilidad de que un hombre muera en cierto año es 0.001, entonces la probabilidad de que la empresa pague exactamente 4 indemnizaciones y= 4 en un cierto año es: 5000! (0.001) 4 (0.999 ) 4996 4!*4996! P( y 4) p(4) El valor de esta expresión no aparece en tablas y su cálculo era difícil, no así con Excel. Aproximando con la distribución de Poisson, se toma la tasa media de sucesos = np = (5000)*(0.001)= 5, teniendo: P( y 4) 4 e 4! 5 4 e 5 0.1745 4! Ejemplo 2. Una planta tiene 20 máquinas, si la probabilidad de que falla una en cierto día es 0.05. Encuentre la probabilidad de que durante un día determinado fallen dos máquinas. np = 20 *0.05 = 1.0 P( y 2) 12 e1 0.184 2! Si se calcula con la distribución Binomial se tiene: P( y 2) p(2) 20! (0.05) 2 (0.95)18 0.188 2!*18! Ejemplo 3. Un proceso continuo tiene una 2 defectos en cada 100 m2 de tela ¿cuál es la probabilidad de que en 100 m2 de la muestra se encuentre exactamente 2 defectos? 𝑃(𝑋 = 2) = 𝜇 𝑋 𝑒 −𝜇 4 = = 0.27 = 𝟐𝟕% 𝑥! 2! 𝑒 2 Página 19 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 La aproximación es mejor conforme se aproxima a np = 5. La distribución de Poisson además de ser útil como aproximación de las probabilidades Binomiales, constituye un buen modelo para experimentos donde Y representa el número de veces que ha ocurrido un evento en una unidad dada de tiempo o de espacio. Por ejemplo: Número de llamadas recibidas en un conmutador durante un día, conociendo el promedio por día. Número de reclamaciones contra una empresa de seguros por semana, conociendo el prom. Sem. Número de llegadas a una estación de servicio durante un minuto dado, conociendo el prom./min. Número de ventas hechas por un agente de ventas en un día, conociendo el promedio por día. Sólo se requiere que los eventos sean independientes. USO DE EXCEL: x = éxitos en la muestra, np = media. En Fx Estadísticas seleccionar =Poisson(x, np, 0 o 1 dependiendo si es puntual o acumulada) USO DE MINITAB: Calc > Probability distributions > Poisson Probability (densidad) o Cumulative probability (acumulada) n*p = mean y en Input constant introducir x. Página 20 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 EJERCICIOS: 1. El 20% de los choferes son mujeres, si se seleccionan 20 al azar para una encuesta: Usando la distribución binomial y la distribución de Poisson a) ¿Cuál es la probabilidad de que dos choferes sean mujeres ? b) ¿Cuál es la probabilidad de que al menos cuatro sean mujeres? 2. Se tienen 8 recepcionistas, estan ocupadas en promedio el 30% del tiempo, si 3 clientes llaman ¿la prob. De que estén ocupadas es mayor al 50%? 3. Un proveedor de partes de bicicleta tiene 3% de defectos. Se compran 150 partes y si la probabilidad de que 3 o más partes sean defectuosas excede al 50%, no se hace la compra. ¿Qué sucede en este caso?. 4. En una universidad las llamadas entran cada 2 minutos a) ¿Cuál es la cantidad esperada de llamadas en una hora? b) ¿Cuál es la probabilidad de 3 llamadas en los sig. 5 minutos? c) ¿Cuál es la probabilidad de no llamadas en los sig. 5 minutos? d) ¿cuál es la prob. de recibir 10 llamadas en los sig. 15 minutos? 5. Un proceso de manufactura produce 1.2 defectos por cada 100 unidades producidas, ¿Cuál es la probabilidad de que las siguientes 500 unidades presenten X=3 defectos? 6. 40 trabajadores tienen nuevas computadoras, 26 con MMX. Si se seleccionan 10 al azar, ¿Cuál es la prob. De que 3 tengan la tecnología MMX?. 7. De un grupo de 20 productos, se toman 10 al azar, ¿Cuál es la probabilidad de contengan las 5 mejores unidades? 8. De 9 empleados diurnos sólo 6 están calificados para hacer su trabajo, si se seleccionan aleatoriamente 5 de los 9 empleados, Cuál es la probabilidad de que: a) Los 5 estén calificados b) 4 estén calificados c) Por lo menos 3 estén calificados Página 21 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 VI.6 Distribuciones de probabilidad continuas Se diferencian de las distribuciones de probabilidad discretas en que su función de distribución acumulativa (F(yo)) para una variable aleatoria y es igual a la probabilidad F(yo) = P(y<=y0). Si F(y) es la función de distribución acumulada para una variable aleatoria continua entonces su función de densidad f(y) para y es: f(y) = dF(y) / dy Sus propiedades son que: 1. f(y) >= 0 2. Integral desde menos infinito a más infinito de f(y) d(y) = F( ) = 1 f(y) F(yo) yo y Función de distribución acumulativa Entre las distribuciones continuas más comunes se encuentran la distribución normal y la distribución exponencial. Página 22 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 DISTRIBUCIÓN EXPONENCIAL Se usa para modelar artículos con una tasa de falla constante y está relacionada con la distribución de Poisson. Si una variable aleatoria x se distribuye exponencialmente, entonces el recíproco de x, y = 1/x sigue una distribución de Poisson y viceversa. La función de densidad de probabilidad exponencial es: Para x >= 0 f ( x) 1 e x e x Donde Lambda es la tasa de falla y theta es la media. La función de densidad de la distribución exponencial El modelo exponencial, con un solo parámetro, es el más simple de todos los modelos de distribución del tiempo de vida. Las ecuaciones clave para la exponencial se muestran: Si el número de ocurrencias tiene Distribución de Poisson, el lapso entre ocurrencias tiene distribución exponencial. Su función de distribución acumulada es la siguiente: P( X x) 1 e t Cuando X = 0 la distribución de Poisson se convierte en el segundo término de la distribución exponencial. Página 23 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 Probabilidad de que el tiempo entre la ocurrencia de dos eventos cualquiera sea <= t F(x) t Aquí se desea saber de que no transcurra más de cierto tiempo entre dos llegadas, sabiendo que se tiene una tasa de llegadas . Ejemplo: El tiempo de respuesta de un departamento es de 5 minutos promedio y se distribuye exponencialmente. La probabilidad de que el tiempo de respuesta a lo sumo sea de 10 minutos se determina como sigue: P(X<=10) = F(10; 1/5) = 1- exp(-0.2*10) = 0.865 La probabilidad entre el tiempo de respuesta de 5 y 10 minutos es: P(5<=X<=10) = F(10;1/5) – F(5; 1/5) = 0.233 USO DE EXCEL: Lamda = 1/ media. En Fx Estadísticas seleccionar =distr.exp(x, lamda,1) = distr.exp(10,0.2,1) = 0.865 USO DE MINITAB: Calc > Probability distributions > Exponential Probability (densidad) o Cumulative probability (acumulada) Indicar Threshold = 0 y en Scale indicar la media 5 En Input constant indicar la X del tiempo. Exponential with mean = 5 x P( X <= x ) 10 0.864665 La Distribución Exponencial es usada como el modelo, para la parte de vida útil de la curva de la bañera, i.e., la tasa de falla es constante. Los sistemas complejos con muchos Página 24 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 componentes y múltiples modos de falla tendrán tiempos de falla que tiendan a la distribución exponencial Desde una perspectiva de confiabilidad, es la distribución más conservadora para predicción. Las fallas ocurren en los sistemas con una distribución denominada Curva de la Bañera: Fallas diseño tasa.de. falla. constante Fallas infantiles Fallas aleatorias Senectud Fallas por desgaste La zona de tasa de fallas constantes, es modelada con La Distribución exponencial, muy aplicada a la Confiabilidad, que es la probabilidad de que un equipo o componente sobreviva sin falla hasta un periodo t bajo condiciones normales de operación: R(t) = Confiabilidad de un sistema o componente R(t ) et Donde es la tasa media de falla y su inverso es el tiempo medio entre fallas (MTBF), o sea: 1 MTBF Ejemplo: El MTBF de un foco es de 10 semanas, por tanto = 0.1 fallas/semana y la probabilidad de que el foco no falle o continúe en operación hasta las 15 semanas es: R(15) e0.1*15 0.223 y la probabilidad de que falle dentro de las 15 semanas es: P(15) 1 e0.1*15 0.777 Página 25 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 EJERCICIOS: 1. Sea X el tiempo entre dos solicitudes de servicio sucesivas a un departamento, si X tiene una distribución exponencial con media = 10, calcular: a) El tiempo esperado entre dos solicitudes sucesivas. b) La desviación estándar de esas llegadas c) P(X<=15) d) P(8<=X<=14) 2. Las falla de los ventiladores de un equipo tiene un tiempo promedio de 25,000 Horas, ¿cuál es la probabilidad de que a) Un ventilador seleccionado al azar dure por lo menos 20,000 horas? b) A lo sumo 30,000 horas? c) Entre 20,000 y 30,000 horas? 3. Un fabricante de equipos electrónicos ofrece un año de garantía. Si el equipo falla en ese periodo por cualquier razón se reemplaza. El tiempo hasta una falla está modelado por la distribución exponencial: f(x) = 0.125 exp(-0.125*x) a) ¿Qué porcentaje de los equipos fallarán dentro del periodo de garantía? b) El costo de fabricación del equipo es de $500 y la ganancia es de $250 ¿Cuál es el efecto de la garantía por reemplazo sobre la ganancia? 4. El tiempo entre fallas de un componente de equipo es importante para proveer de equipos de respaldo. Un generador eléctrico tiene una vida promedio de 10 días. a) ¿Cuál es la probabilidad de que falle dentro de los siguientes 14 días? b) ¿Cuál es la probabilidad de que opere por más de 20 días? Página 26 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 La distribución normal Esta distribución tiene numerosas aplicaciones, como ya se vio antes es la base del teorema del límite central para la distribución de las medias muestrales. Su función de densidad es la siguiente: Donde es la media y la desviación estándar 0.0140 0.0120 = 500 = 30 = 50 = 70 f(t) 0.0100 0.0080 0.0060 0.0040 0.0020 0.0000 200 400 600 Tiempo 800 1000 Efecto de la variación de la desviación estándar en la forma de la curva normal Página 27 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 La desviación estándar sigma representa la distancia de la media al punto de inflexión de la curva normal X x-3 x-2 x- x x+ x+2 x+3 z -3 -2 -1 0 1 2 3 Para obtener las áreas bajo la curva normal se utiliza la transformación de Z = (X-)/ Ejemplo: Que porciento usa entre 20 y 24 lts? El valor Z asociado con X = 20 es z = 0 y con X = 24, z = (24 - 20)/5 = 0.8. Entonces, P(20 < X < 24) = P(0 < z < 0.8) = P(0.8) - P(0) = 0.7881- 0.5 = 0.2881 o 28.81%. ¿Qué porciento usa entre 16 y 20 lts? El valor Z1 para X = 16 es z1 = (16 - 20)/5 = -0.8, y para X = 20, z2 = 0. Entonces, P(16 < X < 20) = P(-0.8 < z < 0) = P(0) - P(-0.8) = 0.5 0.2119 = 0.2881 = 28.81%. Página 28 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 VI.7 Distribuciones de probabilidad para decisión Las distribuciones Chi cuadrada, t y F están formadas con la combinación de variables aleatorias. Normalmente no se utilizan para fenómenos físicos, como el tiempo a falla, sino se utilizan para tomar decisiones y construir intervalos de confianza. DISTRIBUCIÓN CHI CUADRADA Si Z es una variable aleatoria normal estándar, entonces: Es una variable aleatoria Chi cuadrada con n grados de libertad. Esta distribución es un caso especial de la distribución gama con una tasa de falla de 2 y grados de libertad igual a 2 dividido por el número de grados de libertad correspondiente a la distribución Chi cuadrada. La función de densidad de la distribución Chi cuadrada es la siguiente: Donde son los grados de libertad y x es la funciçoon gama. Página 29 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 DISTRIBUCIÓN T DE STUDENT La distribución t de student se forma al combinar una variable aleatoria normal y una variable aleatoria chi cuadrada, de forma que la variable aleatoria con una distribución t es a siguiente: La función de densidad de la distribución t de student es: La media y la varianza de esta distribución son; De una muestra aleatoria de n artículos, la probabilidad que se encuentren entre dos valores especificados es igual al área bajo la curva de la función de densidad de probabilidad entre los valores correspondientes en el eje X con n-1 grados de libertad. Página 30 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 Ejemplo: La resistencia de 15 sellos seleccionados al azar se muestran a continuación ¿Cuál es la probabilidad de que la resistencia sea mayor a 500? Resistencia 480 500 499 489 486 504 491 499 501 508 479 496 501 496 498 495.1333333 Media 8.467304063 S La probabilidad de que l a media poblacional sea mayor a 500 es igual al área bajo la función de densidad de probabilidad t con n – 1 = 14 grados de libertad a la izquierda de: 𝑡= 495.13−500 8.467√15 = −2.227 De tablas el área a la izquierda de este valor -2.227 es 0.0214, o sea que hay un 2.14% de posibilidad de que la media de la población sea mayor a 500. Distribución F Si X es una variable aleatoria Chi cuadrad con 1 grados de libertad y Y es una variable aleatoria Chi cuadrada con 2 grados de libertad y X y Y son independientes, entonces la siguiente variable aleatoria sigue una distribución de probabilidad F con 1 , 2 grados de libertad. Página 31 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 La distribución F se utiliza para probar la igualdad de varianzas de dos poblaciones normales. Si U y V son las varianzas de muestras aleatorias independientes de tamaño n y m de tomadas de poblaciones normales con varianzas w y z se tiene que: Es una variable aleatoria con una distribución F con 1 = n -1 y 2 = m -1 , la forma de la distribución F es: Sus valores están tabulados o se determinan con Excel o Minitab, también se puede aplicar la siguiente relación en caso de algunas tablas faltantes: Si F0.05, 8, 10 = 3.07 F0.95,10,8 = 0.326 Página 32 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 Bibliografía Referencias (Breyfogle, 2003) (Omdahl, 1997) (Triola, 1994) (Wortman, 2001) (Smith, 1987) (Duncan, 1986) (Grant, 1988) (Lapin, 1992) [En línea] / aut. Network The Gilbreth. - 30 de 11 de 2006. http://gilbrethnetwork.tripod.com/therbligs.html. "Kaizen events - 5Ss", Lean Six Sigma [Libro] / aut. Davidson P.. - VIllanova : Bisk Education, Inc. and Villanova University, 2006. "The 5S Philosophy", Matalteck Mfg, Inc. Papa Kaizen [En línea] / aut. Skaggs T.. - 1 de 11 de 2006. http://www.tpmonline.com/papakaizen/articlsa_on_lean_manufacturing_strategies/5s. htm. A study of the Toyota Production System from an industrial engineering view point [Libro] / aut. Shingo S.. - Cambridge, MA : Productivity Press, 1989. A study of the Toyota production system from an industrial engineering viewpoint [Libro] / aut. Shingo S.. - Cambridge, MA : Productivity Press, 1989. Advancing Quality Planning (APQP) and Control Plan Reference Manual [Libro] / aut. AIAG. - Southfield, Michigan EUA : AIAG, 2000. Becoming Lean: Inside stories of U.S. manufactiurers [Libro] / aut. Liker J.. - Portland, OR : Productivity Press, 1997. Business Statistics [Libro] / aut. Triola M.F. & FRanklin L.A.. - Reading : Addison Wesley, 1994. Business Statistics [Libro] / aut. Triola M.F. & Franklin, L.A.. - Reading : Addison Wesley, 1994. CSSGB Primer [Libro] / aut. Wortman B.L.. - Terre Haute, IN : Quality Council of Indiana, 2001. Engineering statistics handbook [Libro] / aut. NIST. - [s.l.] : NIST, 2001. Engineering Statistics Handbook [En línea] / aut. NIST. - Information Technology Laboratory, Statistical Engineering Division, 2001. - 21 de 9 de 2001. Examining Just in Time and Theory of Constraints. Lean Directions [En línea] / aut. Pitcher M.. - 13 de 03 de 2003. - 29 de 11 de 2006. - http://www.sme.org/cgi-bin/getnewsletter.pl?lean&2003013&1. Gemba Kaizen: A common sense, low cost aproach to management [Libro] / aut. Imai M.. - Nueva York : McGraw Hill, 1997. How to be an effective trainer [Libro] / aut. Smith B. & Delahaye, B.. - Nueva York : Wiley professionmal Development Programs, 2nd. edition, 1987. Implementing Sis Sigma [Libro] / aut. Breyfogle F., III. - Nueva York : John Wiley and Sons, 2nd. edition, 2003. Implementing six sigma: Smarter solutions using statistical methods [Libro] / aut. Breyfogle F.W. III. - Nueva York : John Wiley and Sons, 2003. - Vol. 5th edition. iSizSigma [En línea] / aut. Isixsigma. - 14 de 11 de 2006. http://www.isizsigma.com/dictionary/5S-486.htm. ISO /TS 16949:2002 Quality Management Systems [Libro]. - Genova, Suiza : ISO, 2002. Página 33 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 Lean Kaizen. A simplified approach to process improvements [Libro] / aut. Alukai G. & Manos A.. - Milwaukee WI : ASQ Qaulity Press, 2006. Measurement system analysis reference manual [Sección del libro] / aut. MSA / aut. libro AIAG. - [s.l.] : Automotive Industry Action Group, 1998. Measuring systema analysis [Libro] / aut. AIAG. - [s.l.] : AIAG, 1998. Moder approaches to manufacturing improvement: The Shingo System [Libro] / aut. Robinson A.. - Portland, OR : Productivity Press, 1990. Practical statistics: Simply explained [Libro] / aut. Langley R.. - Nueva York : Dover publications, 1971. Product part approval process (PPAP) [Libro] / aut. AIAG. - [s.l.] : AIAG, 1995. Quality control and industrial statistics [Libro] / aut. Duncan A.J.. - Homewood, IL : Richard D. Irwin, 1986. - Vol. 5th. edition. Quality dicitonary [Libro] / aut. Omdahl. - Terre Haute IN : Quality Council of Indiana, 1997. Quality management: introduction to total quality management for production, processing and services, 3rd. edition [Libro] / aut. Goestsch D.L. & Davis, S.B.. - Nueva York : Upper Saddle River, Prentice Hall, 2000. Reading Statistics and Research [Libro] / aut. Huck S. & Cormier, W.. - Nueva york : HerperCollins, 1996. - Vol. 2a. edición. Satistical quality control [Libro] / aut. Grant E.L. & Leavenworth, R. - Nueva York : McGraw Hill, 1988. - Vol. 6th. edition. Simon [En línea] / aut. Simon K. // Sample SIPOC Diagram. - 2001. - 19 de 08 de 2001. http://www.sixsigma.com/library/content/c010429b.asp. Statistics for the modern business decisions [Libro] / aut. Lapin L.L.. - Nueva York : Harcourt, 1992. - Vol. 3rd. edition. The 5S's¨five keys to a total quality improvement [Libro] / aut. Osada T.. - Tokio : Asian Productivity Organziation, 1991. The Black Belt Memory Jogger: A pocket guide for Six Sigma success [Libro] / aut. Sigma Academy Six. - Salem, NH : GOAL/QPC, 2002. The forgotten C in DMAIC [Publicación periódica] / aut. Rybarczyk P // Quality Progress, 38 . - [s.l.] : Milwa, November 2005. - pág. (11). The Goal: a process of ongoing improvement [Libro] / aut. Goldatt E. & Cox J.. - Nueva York : North River Press, 1986. The new shop floor management: Empowering people fro continuous improvement [Libro] / aut. Susaki K.. - Nueva York : The Free Press, 1993. The perfect engine: how to win in the new demand economy by building to order with fewer resources [Libro] / aut. Sharma A. & Moody, P. - Nueva York : The Free Press, 2001. Theory of Constraints [Libro] / aut. Goldratt E.. - Great Barribgton, MA : North River Press, 1990. Waste elimination [Libro] / aut. Metcalf M.D.. - Sullivan, IN : Metcalf Publishing, 1997. Why Doers Do [Libro] / aut. Wile D.. - [s.l.] : P&I - 35 (2), 1996 Febrero. Zero quality control: Source inspection and the Poka Yokes system [Libro] / aut. Shingo S.. - Stamford, CT : Productivity Press, 1986. Página 34 de 35 FASE DE MEDICIÓN PROBABILIDAD P. Reyes / febrero 2009 Página 35 de 35