TEMA 13.- CONTRASTES DE HIPÓTESIS EN MODELOS

Anuncio
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
TEMA 13.- CONTRASTES DE HIPÓTESIS
EN MODELOS NORMALES Y
SOBRE PROPORCIONES
- Contrastes de hipótesis en modelos normales.
- Problemas de una muestra.
- Problemas de dos muestras.
- Test t por pares.
- Contraste de hipótesis sobre proporciones.
- Problemas de una muestra.
- Problemas de dos muestras.
- Dualidad IC – Test de Hipótesis
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
234
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
CONTRASTES DE HIPÓTESIS EN MODELOS NORMALES
ESTUDIO DE UNA POBLACIÓN NORMAL. (PROBLEMAS DE UNA MUESTRA)
Población:
XN(,),
Muestra:
X1,...,Xn
Estadísticos: X , S
Problemas de interés:
 Contrastes de hipótesis sobre la media .
 Contrastes de hipótesis sobre la varianza desviación típica 
Hipótesis nula
H0: =0
 conocida
H0: =0
 desconocida
H0: =0
H. alternativa Estadístico test
H1: 0
X  0
z0 
H1: >0
 n
H1: <0
H1: 0
H1: >0
H1: <0
H1: 0
H1: >0
H1: <0
t0 
Región crítica
X  0
S
n

 02 
z0>z/2
z0>z
z0<z
t0>tn1,/2
t0>tn-1,
t0<tn1,
(n  1) S
 02
2
2
0
 
  n21, 2   02   n21,1 2
 
2
0
2
n 1,
 02   n21,1
Entrada curva CO Carta VI
d=0/
d=0/

=/0
(1)
a, b
c, d
c, d
(2)
e, f
g, h
g, h
10
11
i, j
k, l
m, n
12
(1) En este caso es preferible usar las fórmulas desarrolladas en el Tema 12 para calcular   y n.
(2) Como  es desconocido podemos:
(a) Estimarla a partir de la muestra: ˆ  S . Si aún no se tiene, se necesita una muestra piloto.
(b) Expresar las alternativas en función de . P. ej. hallar  para 0=1,5 (es decir d=1.5).
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
235
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Un producto limpiador debe contener 25 gr. de un determinado componente para ser
eficaz, pero se sospecha por las muchas quejas de los consumidores que el proceso de fabricación no
funciona bien y que esa cantidad es menor. Para ello se toma una muestra de 15 productos y en cada
uno se mide la cantidad del componente obteniendo: X  24.1 gr. y S=0.6gr.
El contraste que hay que plantear es H 0 :   25 contra H 1 :   25 pues queremos que los
consumidores tengan que “demostrar” que el contenido medio está por debajo de los 25 gr.
Supongamos que se hace un test a nivel habitual .

 X  0
 tn 1, 
C

S n
X   0 24.1  25

 5.81  1.761  t14, 0.05
0.6 15
S n
11
Entonces, rechazamos H0 y debemos revisar nuestro proceso de producción.
El p-valor que corresponde al valor observado t= -5.81 es Pt14  5.81  0.0005 por lo que rechazamos
Ho a cualquier nivel de significación habitual.
Si además queremos calcular el tamaño muestral necesario para que la probabilidad de NO detectar
un contenido medio ineficaz de  sea menor de 0.10 ((24.75)<0.10), utilizamos las curvas CO
correspondientes a un test con distribución t y de nivel 0.05 entrando con
d
 0   0.25

 0.41
0 .6

y obtenemos que, aproximadamente, debe ser n = 50.
Con la muestra de tamaño 15 que hemos usado, la probabilidad de cometer Error de tipo II si la
muestra nos hubiese conducido a No Rechazar H0 habría sido mucho mayor que 0.10. En las curvas
CO obtenemos aproximadamente =0.55.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
236
11
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Para esmerilar discos de silicio al grueso apropiado se utiliza un cierto proceso de
bruñido. Para dar sensación de homogeneidad en el producto, interesa que la variable "X=grosor de
los discos" tenga una desviación típica lo menor posible, considerando satisfactorio el proceso si
dicha desviación no supera los 0.5 mm. Se realiza un estudio sobre una muestra de 15 discos y se
obtiene S=0.64 mm. ¿Hay evidencias de que el proceso no sea satisfactorio al nivel .
Para saber si tenemos evidencias suficientes de que el proceso no funciona bien al nivel fijado
debemos colocar esta situación en de modo que tendremos evidencias suficientes de ello si somos
capaces de rechazar .
 H 0 :  2  0.5 2
 n  1S 2
 n  1S 2 14  0.64 2
2

C

 22.904  23.68   142 ,0.05
  n 1, 
2
2
2
2
2
 H 1 :   0.5
0
0. 5
 0

Por tanto no rechazamos H0 al nivel .


2
El p-valor es: P 14  22.904  0.0618
Imaginemos que un incremento del 50% en  respecto a H0 es preocupante y queremos saber qué
riesgo  de no detectarlo estaríamos corriendo al no rechazar H0.
En este caso el valor de es 1.50.5=0.75.
En las curvas CO, Carta VI (k), entrando con =1.5 y n=15 obtenemos   0.27.
Es decir, si ocurriera dicho incremento del 50% no lo detectaríamos con una muestra de tamaño 15
el 27% de las veces.
Para conseguir  < 0.1 habríamos necesitado un número de observaciones de aproximadamente
n=30 según las curvas CO.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
237
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Un artículo publicado en la revista Materials Engineering (1989, Vol. II, No. 4, págs. 275281) describe los resultados de pruebas de resistencia a la adhesión de 22 especímenes de aleación
U-700. La carga para la que cada espécimen falla es la siguiente (en MPa):
19.8, 15.4, 11.4, 19.5, 10.1, 18.5, 14.1, 8.8, 14.9, 7.9, 17.6, 13.6, 7.5, 12.7, 16.7, 11.9, 15.4, 11.9,
15.8, 11.4, 15.4, 11.4
¿Hay evidencias empíricas de que >10 Mpa con un nivel de significación =0.01?
¿Se puede descartar que =4 Mpa al nivel =0.01?
¿Es asumible la hipótesis de normalidad?(Plot de Normalidad visto en prácticas)
Solución: Resolvemos el problema con ayuda de STATGRAPHICS
percentage
Normal Probability Plot for Resistencia
7
8
9
10
11
12
13
14
15
16
17
Resistencia
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
18
19
20
99,9
99
95
80
50
20
5
1
0,1
7
10
13
16
19
22
Resistencia
238
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Summary Statistics for
Resistencia
Count = 22
Average = 13,7136
Variance = 12,6279
Standard deviation = 3,55358
Minimum = 7,5
Maximum = 19,8
Skewness = -0,0151322
Kurtosis = -0,75137
Hypothesis Tests for Resistencia
t-test
-----Null hypothesis: mean = 10,0
Alternative: greater than
Computed t statistic = 4,90168
P-Value = 0,0000378127
Reject the null hypothesis for
alpha = 0,01.
Hypothesis Tests for sigma
95,0% confidence interval for sigma: [2,73395;5,0783]
Null Hypothesis: std. deviation = 4,0
Alternative: not equal
Computed chi-squared statistic = 16,5742. P-Value = 0,526851
Do not reject the null hypothesis for alpha = 0,05.
CONCLUSIONES:
1. La media es significativamente superior a 10 Mpa.
2. No hay evidencias de que la desviación típica sea distinta de 4 Mpa.
3. La hipótesis de normalidad parece asumible. (Plot)
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
239
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
COMPARACIÓN DE DOS POBLACIONES NORMALES, MUESTRAS INDEPENDIENTES
Población 1: X1N(1, 1), Muestra 1: X 1,1 ,..., X 1,n  Estadísticos: X 1 , S1
Población 2: X2N(2, 2), Muestra 2: X 2 ,1 ,..., X 2 ,n  Estadísticos: X 2 , S 2
Las muestras de las dos poblaciones son independientes.
1
2
Problemas de interés:
 Comparación de medias: Inferencias sobre 12 (12=0  12).
 Comparación de varianzas: Inferencias sobre 12/22 (12/22 =1  1=2).
Hipótesis nula
H. alternativa Estadístico test
X  X 2  0
H :   
z0  1
H0: 12= 1 1 2 
 12  22
H1: 12>

1 y 2 conocidas
n1
n2
H1: 12<
X  X 2  0
H :   
t0  1
H0: 12= 1 1 2 
1
1
H :   >

Sp
1=2 desconocidas 1 1 2 
n1 n 2
H1: 12<
H0: 12= H1: 12
12 desconocidas H1: 12>
Behrens-Fisher
H1: 12<
H0: 1=2
H1: 12
H1: 1>2
t0 
Región crítica
z0>z/2
z0>z
z0<z
t0  tn1  n2  2, 2
t0  tn1  n2  2,
t0  tn1  n2  2,
t0>t,/2
t0>t,
t0<t,
X1  X 2  0
2
1
2
2
S
S

n1 n2
F0 
2
1
2
2
S
S
F  F
0
n1 1, n2 1, 2
2
1
2
1
F0  Fn1 1, n2 1,
1
2
1
n1  1
  F  F
0
Entrada curva CO Carta VI
a, b
d  1  2  0 12  22
c, d
 2  2
n  n1  n2 ó n  2 1 22
c, d
1 n1 2 n2
Solo para n1=n2=n
e, f
d  1  2  0 2 (2)
g, h
*
g, h
n =2n-1
No hay curvas CO
S n  S n   2

S n   S n 
n1 1, n2 1,1 2
14
2
2
2
2
2
2
2
15
2
n2  1
solución aproximada
 Solo para n1=n2=n
=1/2
o, p
q, r
16
 Muy frecuentemente la diferencia a contrastar es 
(2) Como  es desconocido se adoptan las mismas soluciones (a) y (b) del caso de una muestra.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
13
240
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: En una investigación industrial se está buscando reducir el tiempo de secado de una
pintura de imprimación. Se ponen a prueba dos formulaciones de la pintura; la formulación 1 es la
estándar, y la formulación 2 tiene un nuevo ingrediente pensado para reducir el tiempo de secado.
Por experiencia, se sabe que la desviación típica del tiempo de secado es de 8 minutos, y que esta
variabilidad natural no se verá afectada por la adición del nuevo ingrediente. Se pintan 20
ejemplares en orden aleatorio, diez con cada una de las formulaciones. El promedio de los tiempos
de secado de las muestras en minutos son X 1  121 min. y X 2  112 min.
a) ¿Qué conclusiones se pueden extraer sobre la efectividad del ingrediente nuevo, usando =0.05?
b) Si la verdadera diferencia entre los tiempos medios de secado fuera de 10 minutos, hallar la
potencia de la prueba realizada en a) para detectar esta diferencia.
c) Si se quiere que dicha potencia sea al menos 0.95, hallar los tamaños muestrales necesarios.
d) ¿Se puede afirmar a partir de la muestra, con un nivel de significación =0.05, que el tiempo
medio de secado se reduce en más de 5 minutos?.
Solución:
a) Las hipótesis a contrastar son
 H 0: 1   2

 H 1:  1   2




 X  X2

C 1
 z 
2
2
 1  2


 n

n2
1


z0 
X1  X 2

2
1
n1


2
2
n2

121  112
2
2
8
8

10 10
 2.52  1.645  z 0.05
Entonces, rechazaremos H0 y concluimos que la nueva formulación reduce el tiempo de secado.
El p-valor sería P z  2.52   1   (2.52)  0.0059 y habríamos rechazado H0 a cualquier nivel de
significación de los habituales.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
241
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
b) Para calcular la potencia pedida, utilizamos las Curvas CO, Carta VI (c), con las entradas
d
1  2
 
2
1
2
2

10
8 8
2
2
 0.88
n  n1  n2  10
y obtenemos 0.85.
c) El tamaño muestral necesario para que el test de a) tenga una potencia de 0.95 (es decir cometa
un error de tipo II con una probabilidad <0.05) si falla H0 y ocurre que se obtiene
también utilizando las curvas CO, la misma carta que en el apartado b):
n  n1  n2  14.
d) Las hipótesis a contrastar son
 H 0: 1   2  5

 H 1:  1   2  5




X
X





2
C 1
 z 
2
2
 1  2


 n

n2
1


z0 
X1  X 2  5

2
1
n1


2
2
n2

121  112  5
2
2
8
8

10 10
 1.12  1.645  z 0.05
Entonces, no rechazamos H0 y no queda probado que la nueva formulación reduce el tiempo de
secado en más de 5 minutos.
El p-valor sería Pz  1.12   1   (1.12)  0.1314 y no rechazamos H0 a los niveles habituales.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
242
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: La presencia de arsénico en el agua para consumo humano es un riesgo potencial para la
salud. Un artículo publicado en Arizona Republic (Sunday, May 27, 2001) informó de las
concentraciones de arsénico en el suministro de agua, en partes por billón (PPB), en 10 áreas
metropolitanas de Phoenix y en 10 áreas rurales de Arizona. Los datos obtenidos fueron:
Metro Phoenix
Phoenix, 3
Chandler, 7
Gilbert, 25
Glendale, 10
Mesa, 15
Paradise Valley, 6
Peoria, 12
Scottsdale, 25
Tempe, 15
Sun City, 7
Rural Arizona
Rimrock, 48
Goodyear, 44
New River, 40
Apachie Junction, 38
Buckeye, 33
Nogales, 21
Black Canyon City, 20
Sedona, 12
Payson, 1
Casa Grande, 18
Procesando las muestras obtenemos:
Metro Phoenix:
X 1  12 .5
S 1  7.63
Rural Arizona:
X 2  27 .5 S 2  15 .35 .
Se quiere determinar si hay diferencias entre las concentraciones medias de arsénico en el agua en
ambas zonas para . Se supone normalidad para la distribución de ambas variables.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
243
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Solución:
Vamos a hacer en primer lugar un test de comparación de varianzas, por ejemplo, con :
 H 0:  1   2

 H 1:  1   2

 
C  F0  Fn1 1, n2 1, 2  F0  Fn1 1, n2 1,1 2

S12 7.632
1
F



0
.
2473

 F9,9,0.95
; 0 S 2 15.32
3
.
18
2
Luego rechazamos la igualdad de varianzas. El p-valor sería 2  P F0  0,2473   2  0,02468  0,04936 .
Así pues, para comparar las medias hay que trabajar con el test para varianzas distintas:





 X1  X 2
C
 t , / 2 
2
2

 S1 S 2

 n n
2

 1
H0: 1  2  0

H1: 1  2  0
t0 
X1  X 2
2
1
2
2
S
S

n1 n 2

12.5  27.5
2
7.63
15.3

10
10
2
  2.77  2.16  t13, 0.025
Luego rechazamos la igualdad de medias y las concentraciones medias de arsénico en ambas zonas
son diferentes para el nivel de significación usado.
El p-valor sería P  t 0  2.77   2  P t 0  2.77   2  0.0079589  0.016 .
Nota:

S
S
2
1
2
1
n1  S 22 n2
 
2
2
2

2

n1
S n2

n1  1
n2  1
2
 2  13.2  13
En este problema no podríamos abordar el cálculo de la potencia y el tamaño muestral.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
244
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Se analizan dos catalizadores para ver la forma en que afectan al rendimiento promedio de
un proceso químico. El Catalizador 1 es el que se está empleando en este momento, pero el
Catalizador 2 también es aceptable y más económico. Por tanto, podría adoptarse éste siempre que
no haya evidencias de que cambia el rendimiento medio del proceso. Se hace una prueba en una
planta piloto y los resultados son:
Catalizador 1
91,50
94,18
92,18
95,39
91,79
89,07
94,72
89,91
Catalizador II
89,19
a) ¿Existen diferencias entre los rendimientos promedio? =0.05
90,95
b) ¿Se pueden considerar iguales las varianzas? =0.05 (verlo antes)
90,46
c) ¿Los rendimientos siguen leyes normales?
93,21
97,19
97,04
91,07
92,75
Solución con STATGRAPHICS:
Summary Statistics
Catalizador 1
Catalizador 2
---------------------------------------------Count
8
8
Average
92,3425
92,7325
Variance
5,14056
8,90099
Standard dev. 2,26728
2,98345
Minimum
89,07
89,19
Maximum
95,39
97,19
Skewness
-0,0370055
0,732691
Kurtosis
-1,26841
-0,827821
Catalizador 1
Catalizador 2
89
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
90
91
92
93
94
95
96
97
98
245
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Comparison of Means
t test to compare means
Null hypothesis: mean1 = mean2
Alt. hypothesis: mean1 NE mean2
assuming equal variances: t = -0,294376
percentage
95,0% confidence interval for mean of Catalizador 1:
92,3425 +/- 1,8955
[90,447,94,238]
95,0% confidence interval for mean of Catalizador 2:
92,7325 +/- 2,49424
[90,2383,95,2267]
95,0% confidence interval for the differ. between the means
assuming equal variances: -0,39 +/- 2,8415 [-3,2315,2,4515]
99,9
99
95
80
50
20
5
1
0,1
89
91
93
95
97
Catalizador 1
P-value = 0,77279
Comparison of Standard Deviations
F-test to Compare Standard Deviations
Null hypothesis: sigma1 = sigma2
Alt. hypothesis: sigma1 NE sigma2
F = 0,577527
P-value = 0,485992
CONCLUSIONES:
a) Las varianzas se pueden considerar iguales.
b) No hay evidencias de que cambie el rendimiento medio.
c) La hipótesis de normalidad se puede asumir.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
99,9
99
95
80
50
20
5
1
0,1
percentage
95,0% Confidence Intervals
Standard deviation of Catalizador 1: [1,49907;4,61453]
Standard deviation of Catalizador 2: [1,97258;6,07214]
Ratio of Variances: [0,115623;2,8847]
89
91
93
95
97
99
Catalizador 2
246
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
d) Supongamos que un cambio en el rendimiento medio de 2.5 puntos (2.5% ó |1-2|=2.5) se
considera suficientemente importante. En caso de que se diera, interesaría detectarlo, es decir,
rechazar H0. Sin embargo, la muestra actual nos ha conducido a "No rechazar" H0 y cabe
preguntarse cuál era el riesgo de que eso ocurriese bajo el supuesto mencionado |1-2|=2.5.
Se trata de hallar el riesgo de error de tipo II, , que obtenemos en las curvas CO, Carta VI (e).
Entramos con
d
1   2
  2
2 .5
 1

 0.47
2
2S p
2  2.65
y cortamos con la curva a n*=2n-1=15.
Obtenemos:   0.55, con lo que el riesgo sería elevado.
e) Si quisiéramos correr un riesgo de error de tipo II <0.1 en d), obtener el número de
observaciones necesarias.
En las Curvas CO Carta VI (e) obtenemos:
n* 50, es decir n  (50+1)/2 = 25.5.
Por tanto, serían necesarias al menos 26 observaciones en cada muestra.
f) Obtener la potencia con que la prueba realizada en a) detectaría una diferencia de 1.5 en el
rendimiento medio de los catalizadores.
Se trata de nuevo de hallar el riesgo de error de tipo II, , a través de las curvas CO, Carta VI (e).
En este caso, d 
 1   2 1.5

 0.75 , cortamos con la curva a n*=2n1=15 y obtenemos   0.25.
2
2
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
247
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
TEST t POR PARES
Hemos estudiado el problema de comparación de medias de dos poblaciones normales a partir de
dos muestras aleatorias independientes, una de cada población.
El problema de comparación de medias se puede realizar también bajo un diseño muestral diferente
(diseño de muestras apareadas) encaminado a obtener una mayor potencia para detectar las
diferencias.
Ejemplo: Supongamos que estamos interesados en comparar la dureza de dos tipos diferentes de
puntas. Para determinar la dureza, se presiona la punta sobre una pieza metálica mediante una
máquina que aplica una fuerza determinada y se mide la profundidad de la depresión causada por la
punta.
Diseño experimental 1: Seleccionamos varias piezas metálicas al azar, para ser probadas unas con
la punta 1 y otras con la punta 2 (por ejemplo, la mitad con cada una). Podemos aplicar a los datos
obtenidos el test t para muestras independientes estudiado anteriormente. El procedimiento
estadístico aplicado es correcto, pero las diferencias de dureza entre las puntas quizás no se aprecien
con total nitidez si las muestras de piezas metálicas se han fabricado en diferentes series y no son
homogéneas en algún aspecto que pueda afectar a la dureza. Es decir, las diferencias en las lecturas
de dureza observadas también incluyen las posibles diferencias de dureza entre las piezas metálicas.
Diseño experimental 2: Se selecciona al azar una única muestra de piezas y se prueba en cada una
los dos tipos de puntas. A continuación se analizan las diferencias entre las lecturas de dureza de
ambas puntas en cada pieza de la muestra (muestras pareadas). Parece claro que ahora las
diferencias de dureza observadas se deberán fundamentalmente a las diferencias entre las puntas al
haber eliminado la variabilidad entre las piezas metálicas probadas con cada tipo de punta.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
248
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
DISEÑO Y RESOLUCIÓN DEL TEST t POR PARES
 X 1,n 
X 1 , S1
Población 1:
Muestra 1:  X 1,1   X 1,2 
 X 1  ( 1 ,  1 )
,
,
,...,
Estadísticos
:


 



 
Población 2 :  X 2  (  2 ,  2 )
Muestra 2 :  X 2,1   X 2,2 
X
X 2 , S2
 2,n 
Diferencia : D  X 1  X 2
Muestra :
D  N (  D ,  D ),  D  1   2
D1 ,
D2 , .... , Dn
S X1 X 2
 Estadísticos : D, S D
Di  X 1,i  X 2,i , i  1,..., n
1 n
1 n
2
2


D   Di , D  X 1  X 2 ,
SD 
D

D
, S D2  S12  S 22  2 S X1 X 2

i
n i 1
n  1 i 1
Las observaciones bidimensionales son independientes entre sí, pero cada observación de la
población 1 está relacionada con la que tiene el mismo subíndice de la población 2: Diseño de dos
muestras relacionadas o pareadas (apareadas).
Problema de interés: Comparación de medias: Inferencias sobre D=12 (D=0  12).
El problema se convierte así en un problema de una muestra y se resuelve como un problema de
contraste de hipótesis sobre la media de una población normal con  desconocida.
(La comparación previa de las varianzas carece aquí de interés)
Hipótesis nula
H. alternativa Estadístico test
H0: D=0
(1) H1: D 0
D  0
t0 
H1: D >0
SD n
D desconocida
H1: D <0
Región crítica
t0>tn1,/2
t0>tn-1,
t0<tn1,
Entrada curva CO Carta VI
d=D0/D
(2)
e, f
g, h
g, h
17
(1) Muy frecuentemente 0=0.
(2) Como D es desconocido se adoptan las mismas soluciones (a) y (b) del caso de una muestra.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
249
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
DISEÑOS DE MUESTRAS INDEPENDIENTES VS. MUESTRAS RELACIONADAS:
Para comparar las medias de dos poblaciones normales, en ocasiones el investigador puede plantearse
realizar un diseño por muestras independientes o por muestras relacionadas.
Siempre que sea posible es preferible el diseño de muestras pareadas porque tiene más potencia
para detectar diferencias entre las medias. La razón de esta mayor potencia estriba en que la
diferencia de medias X 1  X 2  D , que es el estadístico de contraste usado en ambos casos, tiene una
varianza estimada mayor en el caso de muestras independientes si existe una asociación positiva
entre las observaciones de los pares, es decir, S X X  0 :
1
S D2  S12  S 22  2 S X1 X 2  S12  S 22

2
t0INDRP 
X1  X 2
2
1
2
2
S
S

n
n

X1  X 2
2
D

S
n
D
SD
n
 t0PARES
(la asociación entre variables cuantitativas se estudiará en el próximo tema).
Por tanto, una determinada diferencia observada entre las medias muestrales resulta mucho más
significativa estadísticamente en el caso de muestras pareadas.
Cuanto mayores son los vínculos en el apareamiento, mayor es la ganancia de potencia y la ventaja
del diseño por pares. Éste consigue eliminar la variabilidad debida a otros factores que no están en
estudio.
Una vez realizado el diseño y obtenidas las muestras, el análisis de los datos sólo se puede realizar
mediante la técnica correspondiente al diseño utilizado. Es decir, si las muestras son
independientes no se pueden analizar como apareadas y si son apareadas no se pueden analizar como
independientes.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
250
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Un artículo publicado en Journal of Strain Analysis (1983, Vol. 18, No. 2) compara dos
métodos, Karlsruhe y Lehigh, para predecir la resistencia al corte de vigas de placa de acero. Se
aplican ambos métodos a una muestra de nueve vigas y se obtienen los siguientes resultados:
Viga
S1/1
S2/1
S3/1
S4/1
S5/1
S2/1
S2/2
S2/3
S2/4
Karlsruhe Method
1.180 1.151 1.322 1.339 1.203 1.402 1.365 1.537 1.559
Lehigh Method
1.061 0.992 1.063 1.062 1.065 1.178 1.037 1.086 1.052
Diferencias
0.119 0.159 0.259 0.277 0.138 0.224 0.328 0.451 0.507
a) Determinar si hay alguna diferencia de medias entre los dos métodos para =0.05.

 D
D
H0 : D  0
0.2736
C
t
t


 6.05  2.306  t 8, 0.025




n 1, / 2 
0
S D n 0.1356 9

 S D n
H1: D  0
D  0.2736; S D  0.1356
Rechazamos la hipótesis nula. Los datos parecen indicar concretamente una mayor resistencia del
Método Karlsruhe. El p-valor es prácticamente nulo.
b) Determinar si la media con el Método Karlsruhe es superior en más de 0.2 para =0.05.

 D   0
H0 : D  0.2
D   0 0.2736  0.2


 1.63  1.86  t 8, 0.05 . p-valor=0.070.
t
t
C




0
n 1, 



H
:

0
.
2
0
.
1356
9
S
n
S
n
D

 D
 1 D
No se rechaza H0 ,y por tanto, no queda “probada” H1.
c) Hallar el tamaño muestral necesario para que la prueba realizada en b) detecte una diferencia de
0.25 favorable a Karlsruhe con una potencia de 0.9.
D  0 0.25 0.20
d) Curvas CO, Carta VI (g)
d

 0.37,   0.1  entre n  50 y n  75 pares.
D
0.1356
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
251
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Un Laboratorio lanza un producto dietético y anuncia en su publicidad que el uso del
producto durante un mes conduce a una pérdida de peso promedio de al menos 2 kg. Ocho sujetos
utilizan el producto durante un mes, y los datos de peso como resultado la pérdida se presentan a
continuación.
a) ¿Los datos apoyan la afirmación del productor de los productos dietéticos con ?
b) En un esfuerzo por mejorar las ventas, el Laboratorio está considerando cambiar su eslogan de
"al menos 2 kg." por "al menos 3 kg."
Sujeto
Peso Antes
Peso Después
1
75.6
70.3
2
83.1
82.2
3
98,4
92.3
4
67.9
66.1
5
102.6
100.2
6
88.3
82.7
7
72.5
68.6
8
97.9
91.4
Solución con STATGRAPHICS
Resumen Estadístico para ANTES - DESPUES
Recuento
8
Promedio
4,0625
Desviación Estándar 2,1347
Mínimo
0,9
Máximo
6,5
Cuartil Inferior
2,1
Cuartil Superior
5,85
Sesgo
-0,378689
Curtosis
-1,69135
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
0
2
4
ANTES - DESPUES
6
8
252
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Prueba de Hipótesis para ANTES - DESPUES
Media Muestral = 4,0625
Mediana Muestral = 4,6
Desviación Estándar de la Muestra = 2,1347
Prueba t
Hipótesis Nula: media = 2,0
Alternativa: mayor que
Gráfico de Probabilidad Normal
99,9
99
Prueba de Hipótesis para ANTES - DESPUES
Media Muestral = 4,0625
Mediana Muestral = 4,6
Desviación Estándar de la Muestra = 2,1347
95
porcentaje
Estadístico t = 2,73276
Valor-P = 0,014611
Se rechaza la hipótesis nula para alfa = 0,05.
80
50
20
5
1
0,1
0
2
4
ANTES - DESPUES
6
8
Prueba t
Hipótesis Nula: media = 3,0
Alternativa: mayor que
Estadístico t = 1,40778
Valor-P = 0,10101
No se rechaza la hipótesis nula para alfa = 0,05.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
253
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
CONTRASTES DE HIPÓTESIS PARA MUESTRAS GRANDES
CONTRASTES DE HIPÓTESIS SOBRE PROPORCIONES
Sabemos que para tamaños muestrales grandes el estimador de la proporción sigue aproximadamente
una distribución normal en aplicación del TCL (aproximación binomial normal).
ESTUDIO DE UNA PROPORCIÓN. (PROBLEMAS DE UNA MUESTRA)
Población: X B(p),
Muestra: X1, ...,Xn.
 Estadístico: pˆ  X
Problema de interés: Contraste de hipótesis sobre la proporción p.
COMPARACIÓN DE PROPORCIONES (PROBLEMAS DE DOS MUESTRAS)
Muestra 1: X 1,1 ,..., X 1,n  Estadístico: pˆ 1  X 1
Población 1: X1 B(p1),
Muestra 2: X 2 ,1 ,..., X 2 ,n  Estadístico: pˆ 2  X 2
Población 2: X2 B(p2),
Problema de interés: Contraste de hipótesis sobre p1p2 (p1p2=0  p1p2).
1
2
Hipótesis nula
H0: pp0
H0: p1p2=
pˆ 
n1 pˆ1  n2 pˆ 2
n1  n2
H. alternativa
Estadístico test
H1: pp0
H1: p>p0
H1: p<p0
H1: p1p2
H1: p1p2>
H1: p1p2<
z0 
z0 
pˆ  p 0
p 0 (1  p 0 )
n
pˆ1  pˆ 2
1 1
pˆ (1  pˆ )  
 n1 n2 
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
Región crítica
z0>z/2
z0>z
z0<z
z0>z/2
z0>z
z0<z
Entrada curva CO Carta VI
No hay curvas CO
18
No hay curvas CO
19
254
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Un fabricante de lentes intraoculares evalúa una nueva máquina pulidora. El fabricante
aprobará la máquina si el porcentaje de lentes pulidos que contienen defectos en la superficie está
significativamente por debajo del 2%. Se toma una muestra aleatoria de 250 lentes y se encuentra
que 6 de ellos tienen defectos.
¿Qué decisión debe tomar el fabricante a nivel =0.05?
Contraste para “demostrar” que la máquina es buena:
La región crítica para =0.05 es:
Con los datos de la muestra tenemos:
H 0 : p  0 . 02 contra H 1 : p  0 . 02




pˆ  p0
C   z0   z    z0 
  z 
p
(1
p
)

0
0




n
pˆ  p 0
0.024  0.02
 0.45  1.645   z 0.05

0.02  0.98
p 0 (1  p 0 )
250
n
Entonces, no rechazamos H0 y no queda probado el interés de la nueva máquina para =0.05.
El p-valor es
P  z  0 .45   0 .6736 ,
con lo que el riesgo de error de tipo I al rechazar H0 sería realmente grande.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
255
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Se utilizan dos máquinas diferentes de moldeo por inyección para la fabricación de piezas
de plástico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le falta color. Se
toman dos muestras aleatorias, cada una de tamaño 300, y se encuentran 15 piezas defectuosas en la
muestra de la Máquina 1 y 8 piezas defectuosas en la muestra de la Máquina 2. ¿Queda con ello
probado que existen diferencias entre las máquinas a nivel a nivel =0.05?
El contraste que hay que plantear es: H 0 : p 1  p 2 contra H 1 : p 1  p 2
La región crítica es :


pˆ 1  pˆ 2

 z
C
 pˆ (1  pˆ ) 1  1 
n n 

2 
 1

De los datos obtenemos:
pˆ 1 
Es decir:
15
 0.05
300
pˆ 1  pˆ 2
 1
1 

pˆ (1  pˆ ) 
n
n
2 
 1
pˆ 2 



n pˆ  n2 pˆ 2

pˆ  1 1
2  , con
n1  n2



8
 0.0266
300
0.05  0.0266
 2 
0.0383  0.9617 

 300 
pˆ 
0.05  0.0266
 0.0383
2
 1.49  1.96  z 0.025
En consecuencia no rechazamos H0 al nivel pedido.
El p-valor es
P  z  1.49   0.13622 ,
con lo que el riesgo de error de tipo I al rechazar H0 sería superior al 10%.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
256
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
CONTRASTES DE HIPÓTESIS PARA
COMPARACIÓN DE MEDIAS EN DE POBLACIONES INDEPENDIENTES CUALESQUIERA
Sabemos que para tamaños muestrales grandes la media muestral sigue aproximadamente una
distribución normal en aplicación del TCL.
Hipótesis nula
H0: =0
 desconocida
H. alternativa
H1: 0
H1: >0
H1: <0
H1: 12
H0: 12=
H :   >
1, 2 desconocidas 1 1 2 
H1: 12<
Estadístico test
z0 
z0 
X  0
S
n
X1  X 2  0
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
S12 S 22

n1 n2
Región crítica
z0>z/2
z0>z
z0<z
z0>z/2
z0>z
z0<z
Entrada curva CO Carta VI
No hay curvas CO
20
No hay curvas CO
21
257
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
DUALIDAD INTERVALOS DE CONFIANZATESTS DE HIPÓTESIS
Hemos comprobado que los mismos problemas inferenciales paramétricos se pueden abordar tanto
desde la perspectiva de los Intervalos de Confianza como desde la de los Tests de Hipótesis.
La relación entre ambas metodologías es en realidad muy estrecha:
Si somos capaces de construir un IC de nivel de confianza  para un parámetro , este IC
proporciona de manera natural un Test para realizar un contraste de hipótesis bilateral con nivel de
significación sobre el parámetro.
Procedimiento dual:
H 0 :    0
 Queremos contrastar las hipótesis H :   
0
 1
con nivel de significación 
 Disponemos de una m.a.s.
 Construimos un IC para el parámetro  con confianza .
 Regla de decisión:
 Si IC Rechazo H0.
 Si IC No Rechazo H0.
Re chazar H 0
  P C   P  0  IC
  .


P
Error
I

P






H 0 cierta
   0 

 H0 

 El riesgo y la potencia no tienen un equivalente dentro del esquema de los IC.
De manera análoga, los test unitaterales son duales de las cotas de confianza.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
258
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
De hecho, en todos los problemas inferenciales desarrollados en esta asignatura tendríamos la
equivalencia de las dos reglas de decisión:
 La Regla de Decisión basada en el Test correspondiente desarrollado en este tema.
 La regla de Decisión dual basada en el IC desarrollado en el Tema 11.
Comprobación en el Contraste de Hipótesis sobre  en el modelo N() con  conocida:
H 0:   0
Contraste bilateral: H :   
0
 1
1. Regla de decisión basada en el Test desarrollado en Contraste de Hipótesis (Tema 12):
C Z
0
 z / 2



 z / 2   C  X  0  z / 2 

n



  X  
C  0  z / 2 
0
n  X  0  z / 2 
n
n


 C  X  0  z / 2 
 
n  X  0  z / 2 
n

2. Regla de decisión basada en el IC desarrollado en el Tema 11:


X  z / 2
   X  z / 2
Intervalo de Confianza:
 0  IC

X  z / 2

n
n
  0  X  z / 2

n
n
  0  z / 2

n
 X   0  z / 2

n

X C
De modo que los dos procedimientos conducen siempre a la misma decisión.
Tema 13. Contrastes de hipótesis en modelos normales y de proporciones.
259

Descargar