Enunciado 4

Anuncio
Práctica de INTERVALOS DE CONFIANZA
1.- Objetivo de la práctica
El objetivo de esta práctica es familiarizarse con la estimación por intervalos, el
concepto de intervalo de confianza y su aplicación en distintos casos prácticos.
2.- Datos
Una empresa dedicada al sector de automoción compra ejes cilíndricos para el
ensamblado de motores mediante un contrato de calidad concertada suscrito
con el Fabricante A. Debido a sucesivos errores en el ensamblado, la empresa
sospecha que los ejes cilíndricos no tienen las medidas contratadas. Para
analizar este aspecto ha tomado muestras de los ejes cuyos diámetros
aparecen en el fichero intervalos con el nombre fabricante A.
3.- Desarrollo
Para analizar los datos, primero se realiza un análisis descriptivo de los
mismos, según lo visto en anteriores prácticas:
Obtendremos:
Summary Statistics for fabricante a
Count = 15
Average = 45,7533
Variance = 201,753
Standard deviation = 14,204
Minimum = 22,4
Maximum = 73,2
Range = 50,8
Stnd. skewness = 0,348472
Stnd. kurtosis = -0,284423
Puede verse que la media es 45.75 y la varianza 201.75. Sin embargo,
sabemos que estos valores calculados dependen de la muestra considerada
(con una muestra distinta los valores también lo serían). Para salvar este
problema, necesitamos dar un rango de valores donde para cualquier muestra
encontrásemos su media y su varianza. Esto se consigue mediante los
intervalos de confianza. En Statgraphics, dentro de las opciones ofrecidas en
Tabular Options, marcaremos la casilla de verificación Confidence Intervals
Obtendremos:
Confidence Intervals for fabricante a
95,0% confidence interval for mean: 45,7533 +/- 7,86593
[37,8874;53,6193]
95,0% confidence interval for standard deviation: [10,3991;22,4011]
Es decir, con una confianza del 95%, la media de cualquier muestra estará en
el intervalo (37.88; 53.62). Por tanto podemos afirmar que la media de la
población también se hallará en dicho intervalo.
Análogamente, para la varianza el intervalo será (10.4; 22.4). Con un 95% de
probabilidad, la media de cualquier muestra tomada estará en dicho intervalo,
por lo que admitimos que la de la población también lo estará.
Ahora bien, estos intervalos están calculados con una confianza del 95 %.
¿Qué sucede si queremos tener una confianza mayor, por ejemplo del 99 %?
Para averiguarlo, basta con cambiar los parámetros de cálculo en Statgraphics:
Pinchando con el botón derecho del ratón:
Podemos cambiar el nivel de confianza al 99 %
Obtendremos:
Confidence Intervals for fabricante a
99,0% confidence interval for mean: 45,7533 +/- 10,9175
[34,8359;56,6708]
99,0% confidence interval for standard deviation: [9,4966;26,3285]
Vemos que los intervalos han variado aumentando su radio. Esto es así ya que
queremos tener una confianza mayor con la misma información muestral, por lo
que necesariamente debemos perder precisión en nuestra estimación
(“intervalos más anchos”)
Imaginemos ahora que queremos calcular un intervalo con una determinada
precisión. Por ejemplo, queremos medir el diámetro medio con una precisión de
± 6 unidades y una confianza del 95%.
Para ello debemos recordar la formula teórica del intervalo de confianza para la
media:
μ = x ± t n −1,α ·
Sˆ
2
n
La precisión está relacionada con el radio del intervalo, por lo que:
Sˆ
tn −1,α ·
≤6
2
n
La resolución de esta inecuación requiere un calculo iterativo, ya que el valor
de
t n−1,α
2
depende de n. Para ello haremos:
n
t0.975
tn −1,α ·
2
15
20
24
2.13
2.08
2.06
Sˆ
n
>6
>6
<6
Por lo que para tener la precisión deseada debemos tomar al menos 24 datos
en la muestra.
4.- Intervalos de confianza para comparar poblaciones
Se quiere ahora comparar si las dimensiones de los ejes adquiridos a ambos
fabricantes son iguales. Realizar esta comparación de poblaciones implica
responder a las preguntas:
Media a = Media b
Varianza a = Varianza b
Para mayor facilidad en los cálculos, en Estadística transformamos las
igualdades anteriores en:
Media a - Media b = 0
Varianza a / Varianza b = 1
Resolveremos la cuestión calculando intervalos de confianza para la diferencia
de medias y la razón de varianzas y comprobando si el “0” y el “1”
respectivamente se encuentran contenidos en dichos intervalos.
Para ello utilizaremos la opción COMPARE / TWO SAMPLES / TWO-SAMPLE
COMPARISON
Obtendremos:
Para calcular los intervalos antes mencionados, en Tabular Options
marcaremos las casillas de verificación correspondientes a Comparison of
Standard Deviations y Comparison of Means
Obtenemos:
Comparison of Standard Deviations
--------------------------------fabricante A
fabricante B
-----------------------------------------------------------Standard deviation 14,204
11,3948
Variance
201,753
129,842
Df
14
17
Ratio of Variances = 1,55383
95,0% Confidence Intervals
Standard deviation of fabricante A: [10,3991;22,4011]
Standard deviation of fabricante B: [8,55055;17,0825]
Ratio of Variances: [0,564488;4,50652]
Como podemos ver, el intervalo de confianza para la razón de varianzas va del
0.56 al 4.50, es decir el “1” está contenido dentro de él. Como el “1” resulta ser
un valor probable para la razón de varianzas, no podemos rechazar su
igualdad.
Veamos ahora qué sucede con las medias:
Comparison of Means
------------------95,0% confidence interval for mean of fabricante A: 45,7533 +/- 7,86593
[37,8874,53,6193]
95,0% confidence interval for mean of fabricante B: 62,0 +/- 5,66653
[56,3335,67,6665]
95,0% confidence interval for the difference between the means
assuming equal variances: -16,2467 +/- 9,08419
[-25,3309,-7,16247]
Podemos ver que el intervalo de confianza para la diferencia de medias va del
-25.3 al -7.16. Por tanto, el intervalo de confianza no contiene al “0”, es decir es
poco verosímil que la diferencia de medias sea “0”, por lo que es poco verosímil
que las medias sean iguales y rechazamos dicha igualdad.
Vemos por tanto, que los ejes fabricado por ambos fabricantes no son iguales.
(A pesar de tener igual varianza no tienen la misma media). Elegiremos de
entre las dos alternativas (fabricante A ó fabricante B) aquella cuyas
dimensiones mejor se adapten a nuestro proceso productivo.
5.- Ejercicios de autoevaluación
Como alternativa al fabricante A se quiere evaluar un fabricante alternativo B.
Para ello se ha realizado una compra de ejes cilíndricos provenientes de dicho
fabricante B. Entre estos ejes se ha tomado una muestra que aparece en la
variable fabricante B en el fichero de datos. Con estos datos, se pide:
-
Análisis descriptivo y valores puntuales de media y varianza.
Intervalos de confianza al 95% para media y varianza
Intervalos de confianza al 99% para media y varianza
Tamaño de la muestra necesario para medir el diámetro medio con una
precisión de ± 5 unidades y una confianza del 99%.
Descargar