Propiedades de la distribución normal estándar

Anuncio
MÓDULO 1. LA DISTRIBUCIÓN NORMAL y PRUEBA DE
NORMALIDAD
1.1 DISTRIBUCIÓN NORMAL
Un proceso opera en condiciones normales, si tiene los materiales dentro de de
especificaciones y del mismo lote, un método consistente, un medio ambiente
adecuado, el operador capacitado, y el equipo ajustado correctamente, si se
toman mediciones en alguna característica del producto, mostrará el siguiente
comportamiento:
Distribución gráfica de la variación
– La Curva normal
LAS PIEZAS VARÍAN DE UNA A OTRA:
TAMAÑO
TAMAÑO
TAMAÑO
TAMAÑO
Pero ellas forman un patrón, tal que si es estable, se denomina distr. Normal
SIZE
TAMAÑO
TAMAÑO
LAS DISTRIBUCIONES PUEDEN DIFERIR EN:
UBICACIÓN
TAMAÑO
DISPERSIÓN
TAMAÑO
FORMA
TAMAÑO
. . . O TODA COMBINACIÓN DE ÉSTAS
Fig. 1.1 Construcción de la distribución normal
La distribución normal es una de las distribuciones más usadas e importantes.
Se ha desenvuelto como una herramienta indispensable en cualquier rama de
la ciencia, la industria y el comercio.
Muchos eventos reales y naturales tienen una distribución de frecuencias cuya
forma es muy parecida a la distribución normal. La distribución normal es
llamada también campana de Gauss por su forma acampanada.
Cuando se incluyen todos los datos de un proceso o población, sus parámetros
se indican con letras griegas, tales como: promedio o media =  (mu), y
desviación estándar (indicador de la dispersión de los datos) =  (sigma).
Para el caso de estadísticos de una muestra se tiene media = X y desv. est.= s.
Propiedades de la distribución normal estándar

La distribución normal estándar tiene media  = 0 y desviación estándar
 =1. La media, Mediana y Moda coinciden, son iguales y se localizan en el
pico.
La desviación estándar
sigma representa la
distancia de la media al
punto de inflexión de la
curva normal
X
x-3
x-2
x-
x
x+
x+2
x+3
z
-3
-2
-1
0
1
2
3
Fig. 1.2 Propiedades de la distribución normal

El área bajo la curva o probabilidad de menos infinito a más infinito vale 1.

La distribución normal es simétrica, la mitad de curva tiene un área de 0.5.

La escala horizontal de la curva se mide en desviaciones estándar.

La forma y la posición de una distribución normal dependen de los
parámetros  ,  , por lo que hay un número infinito de distribuciones
normales.
Curvas
Curvas Normales
Normales con
con Medias
Medias iguales
iguales pero
pero
Desviaciones
estándar
diferentes
Desviaciones estándar diferentes


3.9
3.9
 == 5.0
5.0

Límite inferior de especs.
Límite superior de especificaciones
Fig. 1.3 Distribuciones normales con varias desv. estándar
Normales
Normales con
con Medias
Medias yy
Desviaciones
estándar
Desviaciones estándar diferentes
diferentes
=
= 5,
5,  == 33
 == 9,
9, =
= 66
 == 14,
14, == 10
10
LIE
Fig. 1.4 Distribuciones
desviaciones estándar
LSE
normales
con
varias
medias
y
Existe una relación del porcentaje de probabilidad o área bajo la curva normal
a la desviación estándar. En la figura observamos por ejemplo que el área bajo
la curva para  1 tiene un porcentaje de 68.26%,  2 = 95.46% y
 3  99.73% .
-3s -2s -1s
+1s +2s +3s
68.26%
95.46%
99.73%
Fig. 1.5 Área bajo la curva de Distribución normal
Lo anterior se puede calcular con la Tabla de distribución normal o con Excel
(Fx =distr.norm.estand(Z) proporciona el área desde menos infinito hasta Z).
En la tabla normal, se busca el valor de Z y se encuentra el área bajo la curva.
La primera tabla sirve para determinar el área o probabilidad que se encuentra
fuera de los límites de especificaciones. La segunda tabla proporciona valores
de área bajo la curva para Z’s mayores a cero. En cada una se muestran
ejemplos de su uso.
Ejemplo 1.1
a) Determinar el área bajo la curva de menos infinito a Z = - 1.
P(Z<= -1) = 0.1587
b) Determinar el área bajo la curva de menos infinito a Z = - 2.
P(Z<= - 2) = 0.0228
c) Determinar el área bajo la curva entre Z >= -2. hasta Z <= -1
P(- 2 <= Z<= -1) = 0.1259
Ejemplo 1.2
a) Determinar el área bajo la curva de menos infinito a Z = 1.
P(Z <= 1) = 0.8413
b) Determinar el área bajo la curva de menos infinito a Z = 2.
P(Z <= 2) = 0.9772 8
c) Determinar el área bajo la curva de menos Z = 1 a Z = 2
P(1 <= Z <= 2) = 0.9772 – 0.8413 = 0.1369
EJERCICIO 1:
¿Qué porcentaje del área bajo la curva normal estándar o probabilidad está
incluido dentro de los siguientes rangos?
a) P(1.2 <= Z <= 2.2) = P(Z <= 2.2) – P(Z <= 1.2) =
b) P(-2.1 <= Z <= -0.4) = P(Z <= - 0.4) – P(Z <= -2.1) =
c) P( -1.3 <= Z <= 2.7) = P(Z <= 2.7) – P(Z <= -1.3) =
d) P( Z >= 2.4) = P(Z <= -2.4) =
e) P( Z<=-2.9) + P(Z>= 3.1) = P(Z <= -2.9) + P(Z <= -3.1) =
f) P(Z>= 1.9) = P(Z <= -1.9) =
Estandarización de valores reales
En la práctica, se tienen valores reales de promedio diferentes de cero y con
desviación estándar diferentes de uno, para determinar la probabilidad o área
bajo la curva, se determina el número de desviaciones estándar Z  entre algún
valor X y la media de la población  o de la muestra X como sigue:
Z
Z
X 

XX
s
sí se consideran los datos completos del proceso.
sí se consideran sólo los datos de una muestra.
Ejemplo 1.3 El departamento de personal de una empresa requiere que los
solicitantes a un puesto en cierta prueba alcancen una calificación de 500. Si
las calificaciones de la prueba se distribuyen normalmente con media   485
y desviación estándar   30 ¿Qué porcentaje de los solicitantes pasará la
prueba?
Calculando el valor de Z obtenemos:
Z
X 

= 500  485  0.5
30
Buscamos el valor correspondiente
Z en las tablas de distribución normal
estándar o por medio de Excel =distr.norm.estand(0.5). Z0.5 = 0.69146 =
69.146%. donde la probabilidad de que la calificación sea menor a 500 es P (X
<= 500). Dado que el porcentaje pedido es P( X  500) la solución es 10.69146 =0.3085, por tanto sólo 30.85% de los participantes pasarán la prueba.
Otra forma es tomando la Z como negativa con P(Z <= -0.5) = 0.3085.
485
30.85%
Z.05
Fig. 1.6 Área bajo la curva de Distribución normal
Ejemplo 1.4 Suponga que un proceso tiene una distribución normal dada tiene
una media de 20 y una desviación estándar de 4. Calcule la probabilidad
P (X >=24) = 1 – P(X <= 24) =
En la barra de herramientas seleccione el icono de funciones
fx>Estadísticas>Distr.Norm.Estand. OK. El sistema muestra la siguiente
ventana, en la cual llenamos los siguientes datos:
Fig. 1.7 Cálculo del área bajo la curva normal sin requerir
Z
El resultado de la fórmula = 0.8413. , dado que esta es la probabilidad
P(X  24), la probabilidad buscada es: P(X > 24) = 1 - 0.8413= 0.1587
EJERCICIO 2:
Un producto tiene un peso promedio de 75 Kgs. con una desviación estándar
de 10Kgs.
a) ¿Cuál es la probabilidad de que un producto pese más de 85Kgs.?
b) ¿Cuál es la probabilidad de que un producto pese menos de 55Kgs.?
c) ¿Cuál es la probabilidad de que el producto pese entre 60 y 80 Kgs.?.
d) ¿Cuál es la probabilidad de que el producto pese entre 55 y 70 Kgs.?
e) ¿Cuál es la probabilidad de que el producto pese entre 85 y 100Kgs.?
1.2 PRUEBA DE NORMALIDAD
Para probar normalidad de datos, se pueden utilizar los métodos de Anderson
Darling o Ryan, y la gráfica de probabilidad normal.
a) En el método de Anderson Darling o Ryan Joiner, si el valor de probabilidad
P de la prueba es mayor a 0.05, se considera que los datos son normales.
Seguir los siguientes pasos:
Generar 100 datos aleatorios en Minitab con Media = 264.6 y Desviación
estándar S = 32.02 con:
1. Calc > Random data > Normal
2. Generate 100 Store in columns C1 Mean 264.06 Estandar deviation 32.02
OK
Nos aseguramos que los datos se distribuyan normalmente con la prueba de
Anderson Darling o Ryan Joiner como sigue:
1. Stat > Basic statistics > Normality Test
Descargar