MÓDULO 1. LA DISTRIBUCIÓN NORMAL y PRUEBA DE NORMALIDAD 1.1 DISTRIBUCIÓN NORMAL Un proceso opera en condiciones normales, si tiene los materiales dentro de de especificaciones y del mismo lote, un método consistente, un medio ambiente adecuado, el operador capacitado, y el equipo ajustado correctamente, si se toman mediciones en alguna característica del producto, mostrará el siguiente comportamiento: Distribución gráfica de la variación – La Curva normal LAS PIEZAS VARÍAN DE UNA A OTRA: TAMAÑO TAMAÑO TAMAÑO TAMAÑO Pero ellas forman un patrón, tal que si es estable, se denomina distr. Normal SIZE TAMAÑO TAMAÑO LAS DISTRIBUCIONES PUEDEN DIFERIR EN: UBICACIÓN TAMAÑO DISPERSIÓN TAMAÑO FORMA TAMAÑO . . . O TODA COMBINACIÓN DE ÉSTAS Fig. 1.1 Construcción de la distribución normal La distribución normal es una de las distribuciones más usadas e importantes. Se ha desenvuelto como una herramienta indispensable en cualquier rama de la ciencia, la industria y el comercio. Muchos eventos reales y naturales tienen una distribución de frecuencias cuya forma es muy parecida a la distribución normal. La distribución normal es llamada también campana de Gauss por su forma acampanada. Cuando se incluyen todos los datos de un proceso o población, sus parámetros se indican con letras griegas, tales como: promedio o media = (mu), y desviación estándar (indicador de la dispersión de los datos) = (sigma). Para el caso de estadísticos de una muestra se tiene media = X y desv. est.= s. Propiedades de la distribución normal estándar La distribución normal estándar tiene media = 0 y desviación estándar =1. La media, Mediana y Moda coinciden, son iguales y se localizan en el pico. La desviación estándar sigma representa la distancia de la media al punto de inflexión de la curva normal X x-3 x-2 x- x x+ x+2 x+3 z -3 -2 -1 0 1 2 3 Fig. 1.2 Propiedades de la distribución normal El área bajo la curva o probabilidad de menos infinito a más infinito vale 1. La distribución normal es simétrica, la mitad de curva tiene un área de 0.5. La escala horizontal de la curva se mide en desviaciones estándar. La forma y la posición de una distribución normal dependen de los parámetros , , por lo que hay un número infinito de distribuciones normales. Curvas Curvas Normales Normales con con Medias Medias iguales iguales pero pero Desviaciones estándar diferentes Desviaciones estándar diferentes 3.9 3.9 == 5.0 5.0 Límite inferior de especs. Límite superior de especificaciones Fig. 1.3 Distribuciones normales con varias desv. estándar Normales Normales con con Medias Medias yy Desviaciones estándar Desviaciones estándar diferentes diferentes = = 5, 5, == 33 == 9, 9, = = 66 == 14, 14, == 10 10 LIE Fig. 1.4 Distribuciones desviaciones estándar LSE normales con varias medias y Existe una relación del porcentaje de probabilidad o área bajo la curva normal a la desviación estándar. En la figura observamos por ejemplo que el área bajo la curva para 1 tiene un porcentaje de 68.26%, 2 = 95.46% y 3 99.73% . -3s -2s -1s +1s +2s +3s 68.26% 95.46% 99.73% Fig. 1.5 Área bajo la curva de Distribución normal Lo anterior se puede calcular con la Tabla de distribución normal o con Excel (Fx =distr.norm.estand(Z) proporciona el área desde menos infinito hasta Z). En la tabla normal, se busca el valor de Z y se encuentra el área bajo la curva. La primera tabla sirve para determinar el área o probabilidad que se encuentra fuera de los límites de especificaciones. La segunda tabla proporciona valores de área bajo la curva para Z’s mayores a cero. En cada una se muestran ejemplos de su uso. Ejemplo 1.1 a) Determinar el área bajo la curva de menos infinito a Z = - 1. P(Z<= -1) = 0.1587 b) Determinar el área bajo la curva de menos infinito a Z = - 2. P(Z<= - 2) = 0.0228 c) Determinar el área bajo la curva entre Z >= -2. hasta Z <= -1 P(- 2 <= Z<= -1) = 0.1259 Ejemplo 1.2 a) Determinar el área bajo la curva de menos infinito a Z = 1. P(Z <= 1) = 0.8413 b) Determinar el área bajo la curva de menos infinito a Z = 2. P(Z <= 2) = 0.9772 8 c) Determinar el área bajo la curva de menos Z = 1 a Z = 2 P(1 <= Z <= 2) = 0.9772 – 0.8413 = 0.1369 EJERCICIO 1: ¿Qué porcentaje del área bajo la curva normal estándar o probabilidad está incluido dentro de los siguientes rangos? a) P(1.2 <= Z <= 2.2) = P(Z <= 2.2) – P(Z <= 1.2) = b) P(-2.1 <= Z <= -0.4) = P(Z <= - 0.4) – P(Z <= -2.1) = c) P( -1.3 <= Z <= 2.7) = P(Z <= 2.7) – P(Z <= -1.3) = d) P( Z >= 2.4) = P(Z <= -2.4) = e) P( Z<=-2.9) + P(Z>= 3.1) = P(Z <= -2.9) + P(Z <= -3.1) = f) P(Z>= 1.9) = P(Z <= -1.9) = Estandarización de valores reales En la práctica, se tienen valores reales de promedio diferentes de cero y con desviación estándar diferentes de uno, para determinar la probabilidad o área bajo la curva, se determina el número de desviaciones estándar Z entre algún valor X y la media de la población o de la muestra X como sigue: Z Z X XX s sí se consideran los datos completos del proceso. sí se consideran sólo los datos de una muestra. Ejemplo 1.3 El departamento de personal de una empresa requiere que los solicitantes a un puesto en cierta prueba alcancen una calificación de 500. Si las calificaciones de la prueba se distribuyen normalmente con media 485 y desviación estándar 30 ¿Qué porcentaje de los solicitantes pasará la prueba? Calculando el valor de Z obtenemos: Z X = 500 485 0.5 30 Buscamos el valor correspondiente Z en las tablas de distribución normal estándar o por medio de Excel =distr.norm.estand(0.5). Z0.5 = 0.69146 = 69.146%. donde la probabilidad de que la calificación sea menor a 500 es P (X <= 500). Dado que el porcentaje pedido es P( X 500) la solución es 10.69146 =0.3085, por tanto sólo 30.85% de los participantes pasarán la prueba. Otra forma es tomando la Z como negativa con P(Z <= -0.5) = 0.3085. 485 30.85% Z.05 Fig. 1.6 Área bajo la curva de Distribución normal Ejemplo 1.4 Suponga que un proceso tiene una distribución normal dada tiene una media de 20 y una desviación estándar de 4. Calcule la probabilidad P (X >=24) = 1 – P(X <= 24) = En la barra de herramientas seleccione el icono de funciones fx>Estadísticas>Distr.Norm.Estand. OK. El sistema muestra la siguiente ventana, en la cual llenamos los siguientes datos: Fig. 1.7 Cálculo del área bajo la curva normal sin requerir Z El resultado de la fórmula = 0.8413. , dado que esta es la probabilidad P(X 24), la probabilidad buscada es: P(X > 24) = 1 - 0.8413= 0.1587 EJERCICIO 2: Un producto tiene un peso promedio de 75 Kgs. con una desviación estándar de 10Kgs. a) ¿Cuál es la probabilidad de que un producto pese más de 85Kgs.? b) ¿Cuál es la probabilidad de que un producto pese menos de 55Kgs.? c) ¿Cuál es la probabilidad de que el producto pese entre 60 y 80 Kgs.?. d) ¿Cuál es la probabilidad de que el producto pese entre 55 y 70 Kgs.? e) ¿Cuál es la probabilidad de que el producto pese entre 85 y 100Kgs.? 1.2 PRUEBA DE NORMALIDAD Para probar normalidad de datos, se pueden utilizar los métodos de Anderson Darling o Ryan, y la gráfica de probabilidad normal. a) En el método de Anderson Darling o Ryan Joiner, si el valor de probabilidad P de la prueba es mayor a 0.05, se considera que los datos son normales. Seguir los siguientes pasos: Generar 100 datos aleatorios en Minitab con Media = 264.6 y Desviación estándar S = 32.02 con: 1. Calc > Random data > Normal 2. Generate 100 Store in columns C1 Mean 264.06 Estandar deviation 32.02 OK Nos aseguramos que los datos se distribuyan normalmente con la prueba de Anderson Darling o Ryan Joiner como sigue: 1. Stat > Basic statistics > Normality Test