Práctica de INTERVALOS DE CONFIANZA 1.- Objetivo de la práctica El objetivo de esta práctica es familiarizarse con la estimación por intervalos, el concepto de intervalo de confianza y su aplicación en distintos casos prácticos. 2.- Datos Una empresa dedicada al sector de automoción compra ejes cilíndricos para el ensamblado de motores mediante un contrato de calidad concertada suscrito con el Fabricante A. Debido a sucesivos errores en el ensamblado, la empresa sospecha que los ejes cilíndricos no tienen las medidas contratadas. Para analizar este aspecto ha tomado muestras de los ejes cuyos diámetros aparecen en el fichero intervalos con el nombre fabricante A. 3.- Desarrollo Para analizar los datos, primero se realiza un análisis descriptivo de los mismos, según lo visto en anteriores prácticas: Obtendremos: Summary Statistics for fabricante a Count = 15 Average = 45,7533 Variance = 201,753 Standard deviation = 14,204 Minimum = 22,4 Maximum = 73,2 Range = 50,8 Stnd. skewness = 0,348472 Stnd. kurtosis = -0,284423 Puede verse que la media es 45.75 y la varianza 201.75. Sin embargo, sabemos que estos valores calculados dependen de la muestra considerada (con una muestra distinta los valores también lo serían). Para salvar este problema, necesitamos dar un rango de valores donde para cualquier muestra encontrásemos su media y su varianza. Esto se consigue mediante los intervalos de confianza. En Statgraphics, dentro de las opciones ofrecidas en Tabular Options, marcaremos la casilla de verificación Confidence Intervals Obtendremos: Confidence Intervals for fabricante a 95,0% confidence interval for mean: 45,7533 +/- 7,86593 [37,8874;53,6193] 95,0% confidence interval for standard deviation: [10,3991;22,4011] Es decir, con una confianza del 95%, la media de cualquier muestra estará en el intervalo (37.88; 53.62). Por tanto podemos afirmar que la media de la población también se hallará en dicho intervalo. Análogamente, para la varianza el intervalo será (10.4; 22.4). Con un 95% de probabilidad, la media de cualquier muestra tomada estará en dicho intervalo, por lo que admitimos que la de la población también lo estará. Ahora bien, estos intervalos están calculados con una confianza del 95 %. ¿Qué sucede si queremos tener una confianza mayor, por ejemplo del 99 %? Para averiguarlo, basta con cambiar los parámetros de cálculo en Statgraphics: Pinchando con el botón derecho del ratón: Podemos cambiar el nivel de confianza al 99 % Obtendremos: Confidence Intervals for fabricante a 99,0% confidence interval for mean: 45,7533 +/- 10,9175 [34,8359;56,6708] 99,0% confidence interval for standard deviation: [9,4966;26,3285] Vemos que los intervalos han variado aumentando su radio. Esto es así ya que queremos tener una confianza mayor con la misma información muestral, por lo que necesariamente debemos perder precisión en nuestra estimación (“intervalos más anchos”) Imaginemos ahora que queremos calcular un intervalo con una determinada precisión. Por ejemplo, queremos medir el diámetro medio con una precisión de ± 6 unidades y una confianza del 95%. Para ello debemos recordar la formula teórica del intervalo de confianza para la media: μ = x ± t n −1,α · Sˆ 2 n La precisión está relacionada con el radio del intervalo, por lo que: Sˆ tn −1,α · ≤6 2 n La resolución de esta inecuación requiere un calculo iterativo, ya que el valor de t n−1,α 2 depende de n. Para ello haremos: n t0.975 tn −1,α · 2 15 20 24 2.13 2.08 2.06 Sˆ n >6 >6 <6 Por lo que para tener la precisión deseada debemos tomar al menos 24 datos en la muestra. 4.- Intervalos de confianza para comparar poblaciones Se quiere ahora comparar si las dimensiones de los ejes adquiridos a ambos fabricantes son iguales. Realizar esta comparación de poblaciones implica responder a las preguntas: Media a = Media b Varianza a = Varianza b Para mayor facilidad en los cálculos, en Estadística transformamos las igualdades anteriores en: Media a - Media b = 0 Varianza a / Varianza b = 1 Resolveremos la cuestión calculando intervalos de confianza para la diferencia de medias y la razón de varianzas y comprobando si el “0” y el “1” respectivamente se encuentran contenidos en dichos intervalos. Para ello utilizaremos la opción COMPARE / TWO SAMPLES / TWO-SAMPLE COMPARISON Obtendremos: Para calcular los intervalos antes mencionados, en Tabular Options marcaremos las casillas de verificación correspondientes a Comparison of Standard Deviations y Comparison of Means Obtenemos: Comparison of Standard Deviations --------------------------------fabricante A fabricante B -----------------------------------------------------------Standard deviation 14,204 11,3948 Variance 201,753 129,842 Df 14 17 Ratio of Variances = 1,55383 95,0% Confidence Intervals Standard deviation of fabricante A: [10,3991;22,4011] Standard deviation of fabricante B: [8,55055;17,0825] Ratio of Variances: [0,564488;4,50652] Como podemos ver, el intervalo de confianza para la razón de varianzas va del 0.56 al 4.50, es decir el “1” está contenido dentro de él. Como el “1” resulta ser un valor probable para la razón de varianzas, no podemos rechazar su igualdad. Veamos ahora qué sucede con las medias: Comparison of Means ------------------95,0% confidence interval for mean of fabricante A: 45,7533 +/- 7,86593 [37,8874,53,6193] 95,0% confidence interval for mean of fabricante B: 62,0 +/- 5,66653 [56,3335,67,6665] 95,0% confidence interval for the difference between the means assuming equal variances: -16,2467 +/- 9,08419 [-25,3309,-7,16247] Podemos ver que el intervalo de confianza para la diferencia de medias va del -25.3 al -7.16. Por tanto, el intervalo de confianza no contiene al “0”, es decir es poco verosímil que la diferencia de medias sea “0”, por lo que es poco verosímil que las medias sean iguales y rechazamos dicha igualdad. Vemos por tanto, que los ejes fabricado por ambos fabricantes no son iguales. (A pesar de tener igual varianza no tienen la misma media). Elegiremos de entre las dos alternativas (fabricante A ó fabricante B) aquella cuyas dimensiones mejor se adapten a nuestro proceso productivo. 5.- Ejercicios de autoevaluación Como alternativa al fabricante A se quiere evaluar un fabricante alternativo B. Para ello se ha realizado una compra de ejes cilíndricos provenientes de dicho fabricante B. Entre estos ejes se ha tomado una muestra que aparece en la variable fabricante B en el fichero de datos. Con estos datos, se pide: - Análisis descriptivo y valores puntuales de media y varianza. Intervalos de confianza al 95% para media y varianza Intervalos de confianza al 99% para media y varianza Tamaño de la muestra necesario para medir el diámetro medio con una precisión de ± 5 unidades y una confianza del 99%.