Intervalos de Confianza para el cociente de varianzas (ó desviaciones estándar) INTERVALO DE CONFIANZA PARA EL COCIENTE DE DOS VARIANZAS La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones es evidente a partir del análisis de una sola población. Frecuentemente se desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que varía el procedimiento para calificar de un profesor universitario con la de otro. Intuitivamente, podríamos comparar las varianzas de dos poblaciones, σ21 y σ22, utilizando la razón de las varianzas muestrales s12 / s2 2 y si es casi igual a 1, se tendrá poca evidencia para indicar que σ21 y σ22 no son iguales. Por otra parte, un valor muy grande o muy 2 2 pequeño para s1 / s2 , proporcionará evidencia de una diferencia en las varianzas de las poblaciones. Para encontrar un intervalo de confianza para el cociente de dos varianzas, empleamos la distribución F que es similar a como hicimos en el caso de una sóla varianza empleando la distribución chicuadrada, sólo que ahora usamos el estadístico definido por: Supóngase que se tienen dos poblaciones normales e independientes con varianzas desconocidas σ21 y σ22, respectivamente. De este par de poblaciones, se tienen disponibles dos muestras aleatorias de tamaños n1 y n2, respectivamente, sean s21 y s22 las dos varianzas muestrales. Si se desea, por ejemplo, conocer un intervalo de confianza del 95% por ciento para el cociente de las dos varianzas: σ 12 / σ 22 El caso de la distribución la F, para un nivel de confianza (por ejemplo de 95%) requiere calcular los grados de libertad del numerador y del denominador, este ejemplo son 30 y 24 respectivamente: Distribution Plot F, df1=30, df2=24 1.2 1.0 Density 0.8 0.6 0.4 95% del área = 0.95 0.2 0.025 0.0 0 0.025 0.468 X 2.21 α/2= 0.025 =2.5% del área F α/2 F (1−α/2) Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se coloca la varianza muestral mayor en el numerador del estadístico F. 2 ⎛ s1 ⎞ ⎛ σ 2 ⎞ F =⎜ ⎟ ⎜ ⎟ ⎝ s2 ⎠ ⎝ σ 1 ⎠ Despejando: 2 σ 12 s12 = 2 σ2 Fs2 2 Esto nos da permite calcular la probabilidad de que el cociente se encuentre entre dos valores de F. Para construir el intervalo de confianza empleamos entonces s12 σ 12 s12 < 2< 2 σ2 Fs2 Fs2 2 En este caso se requiere calcular los grados de libertad del numerador que son n1-1 (recordando que se toma a n1 como el tamaño de la muestra de la varianza más grande) y los del denominador que son n2 -1. Ejemplo. Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores respecto al tiempo en minutos. Los resultados se muestran en la tabla siguiente: Método 1 Método 2 n1 = 31 n1 = 25 s21 = 50 s22 = 24 Construir un intervalo de confianza del 90% para Solución: Sabemos que σ 12 / σ 22 s12 σ 12 s12 < 2< 2 σ2 Fs2 Fs2 2 Tomamos a s21 como numerador porque es el valor más grande. Los valores de F requieren los grados de libertad del numerador (n1 -1 = 30) y del denominador (n2 -1 = 24). Distribution Plot F, df1=30, df2=24 1.2 1.0 Density 0.8 0.6 90% del área =0.40.90 0.2 0.0 0.05 0.05 0 0.530 X 1.94 σ 12 50 50 < 2< (1.94)(24) σ 2 (0.53)(24) Por lo tanto: σ 12 1.07 < 2 < 3.93 σ2 y el intervalo de confianza para el cociente de las desviaciones estándar sería: σ1 1.03 < < 1.98 σ2 Ejemplo 2. Una empresa fabrica propulsores. A los ingenieros les gustaría saber cuál de dos procesos tiene la menor rugosidad en las superficies. Para ello se toman muestras aleatorias de cada proceso. Datos. Proceso 1. n1 = 16 mm, s1 = 4.7 Proceso 2. n2 = 12 mm, s2 = 5.1 Distribution Plot F, df1=11, df2=15 0.9 0.8 0.7 Density 0.6 0.5 0.4 0.3 90% del área = 0.90 0.2 0.05 0.1 0.0 0.05 0 0.368 X 2.51 Por lo que el intervalo de confianza para el cociente de varianzas estará dado por 2 2 2 s1 σ1 s1 < 2< 2 σ2 Fs2 Fs2 2 5.1 5.12 σ1 < 2< 2 (0.368)(4.7) ( 2.51)(4.7 ) 2 σ2 2 2 σ 12 0.469 < 2 < 3.2 σ2 Y para las desviaciones estándar (calculamos la raíz cuadrada): 0.68 < σ1 < 1.79 σ2 Como el intervalo de confianza incluye el valor de uno, no se puede concluir que exista alguna diferencia entre la variabilidad de los dos procesos (es decir, el intervalo de confianza incluye la posibilidad de que las dos desviaciones estándar sean iguales, por lo que el cociente sería igual a uno).