to get the file - OCW - Universidad de Murcia

Anuncio
M. Iniesta
Universidad de Murcia
INFERENCIA ESTADÍSTICA
Tema 3.3:
Contrastes de signicación
Objetivos
Dominar el esquema conceptual y el lenguaje propios de los contrastes de hipótesis.
Construir contrastes de hipótesis para los parámetros más importantes.
Comparar dos medias o dos proporciones muestrales y analizar posibles diferencias
signicativas.
1.
Elementos básicos en un contraste de hipótesis paramétrico
Como siempre va a ser (X1 , ..., Xn ) una m.a.s. de tamaño n, procedente de X ∼
f (x, ϑ) con ϑ desconocido. Supongamos también que Θ es el conjunto de valores posibles
del parámetro, denominado espacio paramétrico. Se trata ahora de decidir entre una
de dos hipótesis:
Hipótesis Nula
H0 : ϑ ∈ Θ0
Hipótesis Alternativa H1 : ϑ ∈ Θ1
con Θ = Θ0 ∪ Θ1 .
La Hipótesis Nula H0 es siempre una hipótesis conservadora que recoge información
histórica acerca del parámetro, mientras que la Hipótesis Alternativa H1 es la hipótesis
de trabajo, que recoge información reciente sobre el parámetro y progresista porque
suele informar de un cambio respecto al comportamiento histórico del parámetro. La
metodología es asumir cierta H0 y únicamente rechazarla si se maniestan discrepancias
signicativas, no atribuibles al azar; es decir, si el apoyo de H0 signica asumir que han
ocurrido sucesos de probabilidad muy baja. La aceptación de H0 signicará que no ha
habido conclusión estadística o que los datos aportados por la investigación empírica no
han sido concluyentes. Por el contrario, el rechazo de H0 para aceptar H1 signicará que
los datos proporcionados por la investigación empírica están en franco desacuerdo con
la hipótesis histórica y diremos entonces que los datos son concluyentes y la hipótesis de
trabajo es aceptada.
En la aceptación o en el rechazo de H0 podemos cometer dos tipos de errores.
Hipótesis H0
Cierta HA
Decisión que se toma
Aceptar H0
Rechazar H0
Correcto
Error (tipo I)
Error (tipo II)
Correcto
Aunque el error de tipo I, rechazar H0 cuando H0 es cierta, tiene más importancia que
el error de tipo 2, aceptar H0 cuando H0 es falsa. Si llamamos α a la probabilidad de
Página: 1
M. Iniesta
Universidad de Murcia
cometer un error de tipo I y β a la probabilidad de cometer un error de tipo II, lo anterior
signica que supuesto que nunca será α = β = 0 (a no ser de que observemos a toda la
población y con ello nunca nos equivocaremos), deberíamos de llevar a cabo test con α
controlado y pequeño.
Ejemplo 1.1 En un juicio tendremos que decidir entre dos hipótesis: o el acusado es
inocente o el acusado es culpable. Puesto que todos somos inocentes, salvo que se demuestre lo contrario, (H0 es la hipótesis apoyada por defecto), el test que debemos plantear es:
H0 : El acusado es inocente
H1 : El acusado es culpable
En este caso es:
α = P (Condenar al acusado, siendo éste inocente)
β = P (absolver al acusado, siendo éste culpable)
Con el ejemplo anterior vemos que el error tipo 1, con probabilidad α, tiene más trascendencia que el error de tipo 2, por lo que tendremos que tenerlo a ralla, jando dicha
probabilidad de antemano. A dicho valor prejado α se le denomina nivel de signicación.
Lo anterior supone que la conclusión a la que lleguemos puede levar consigo un error
tipo I, con probabilidad menor o igual que el nivel de signicación α, (que normalmente
se preja como 0.05). Si hay dos posibles test para el mismo problema que cumplan lo
anterior, elegiremos el que tiene probabilidad de error tipo II más pequeña.
Bajo este enfoque en el que le damos más importancia al error de tipo I que al de
tipo II, está claro que ha hay que tener sumo cuidado en establecer la hipótesis nula y
la hipótesis alternativa.
Si derivado de una investigación experimental, surge una hipótesis de
trabajo que queremos contrastar, dicha hipótesis debe de ser siempre la
hipótesis alternativa, puesto que la probabilidad de aceptarla, cuando
es falsa, es precisamente el nivel de signicación α. Efectivamente:
P (Rechazar
H0 |H0
cierta) = α = P (Aceptar
H1 |H1
f alsa)
La metodología seguida en estos tipos de test está basada en las etapas que describimos a continuación:
2.
Método de Construcción
Sea (X1 , ..., Xn ) una m.a.s. de tamaño n, procedente de X ∼ f (x, ϑ) con ϑ desconocido. Los pasos a seguir para construir un contraste de hipótesis para el parámetro ϑ
son:
Página: 2
M. Iniesta
Universidad de Murcia
Metodología para construir un test de hipótesis
de nivel de signicación α
1. Planteamiento de las hipótesis a contrastar. Tres tipos de test: el primero
denominado test bilateral o de dos colas (test a), y los casos b y c
denominados unilaterales o de una sola cola.
Test a.Test b.Test c.-
Hipótesis Nula
Hipótesis Alternativa
H0 : ϑ = ϑ0
H1 : ϑ 6= ϑ0
Hipótesis Nula
Hipótesis Alternativa
H0 : ϑ = ϑ0
H1 : ϑ > ϑ0
Hipótesis Nula
Hipótesis Alternativa
H0 : ϑ = ϑ0
H1 : ϑ < ϑ0
2. Construir D = g(X1 , . . . , Xn , ϑ0 ), llamada Estadístico de contraste,
que mide la discrepancia entre lo que asevera H0 y la información muestral.
3. Si H0 es cierta, la función D tiene distribución conocida.
4. Fijamos el nivel de signicación α y observamos el valor de db de D cuando
(X1 , ..., Xn ) = (x1 , ..., xn ).
5. Si el valor observado db pertenece a una región de muy baja probabilidad,
supuesto H0 cierta, tengo dos opciones: o creerme que ha sucedido un
suceso de muy baja probabilidad o bien que la hipótesis H0 es inaceptable,
por lo que deberíamos rechazarla. Más concretamente.
6. Construimos una Región de Rechazo, (RR), jado α, en base a la
distribución de probabilidad del estadístico de contraste D. La regla es
rechazar H0 si db ∈RR.
7. Alternativamente, puede calcularse lo que denominaremos P-valor, donde
b 0 cierta)
P-valor = P (D > d|H
mide el grado de apoyo de la muestra a H0 . La regla de decisión es la
siguiente:
Rechazar H0 si P − valor < α
Aceptar H0 en caso contrario.
Página: 3
M. Iniesta
Universidad de Murcia
Test de hipótesis para la media µ de una población normal
supuesto σ desconocida
1. Planteamiento de las hipótesis a contrastar. Tres tipos de test:
Test a.Test b.Test c.-
Hipótesis Nula
Hipótesis Alternativa
H0 : µ = µ0
H1 : µ 6= µ0
Hipótesis Nula
Hipótesis Alternativa
H0 : µ = µ0
H1 : µ > µ0
Hipótesis Nula
Hipótesis Alternativa
H0 : µ = µ0
H1 : µ < µ0
2. Consideramos el Estadístico de contraste D =
X − µ0
√S
n
, que mide la
discrepancia entre lo que asevera H0 y la información muestral.
3. Si H0 es cierta (µ = µ0 ), la función D ∼ tn−1
4. Fijamos el nivel de signicación α y observamos el valor de db de D cuando
x − µ0
(X1 , ..., Xn ) = (x1 , ..., xn ), es decir db =
.
S
√
n
5. Construimos una Región de Rechazo, (RR), jado α, en base a la
distribución de probabilidad del estadístico de contraste D. La regla es
rechazar H0 si db ∈RR. En este caso:
Test a.- RR=(−∞, −tn−1,1− α2 ) ∪ (tn−1,1− α2 , +∞)
Test b.- RR=(tn−1,1−α , +∞)
Test c.- RR=(−∞, −tn−1,1−α )
6. Alternativamente, puede calcularse lo que denominaremos P-valor, donde, para cada test es:
b + P (tn−1 > |d|)
b
Test a.- P (tn−1 < −|d|)
b
Test b.- P (tn−1 > d)
b
Test c.- P (tn−1 < d)
7. La regla e decisión es la siguiente:
Rechazar H0 si P − valor < α
Aceptar H0 en caso contrario.
Ejemplo 2.1 El proceso de fabricación de un determinado componente industrial produ-
ce piezas cuya medida principal está distribuida normalmente de media 5.2 mm., cuando
Página: 4
M. Iniesta
Universidad de Murcia
el proceso se encuentra bajo control. Para contrastar si el proceso sigue bajo control se
realiza periódicamente una inspección. En una de estas inspecciones una muestra de
tamaño 25 arrojó una media muestral de 5.7. y una cuasidesviación típica 1.3 mm.
¾Debemos de parar el proceso o concluir que el proceso está bajo control?.
Si planteamos el test
Hipótesis Nula (proceso bajo control)
H0 : µ = 5.2
Hipótesis Alternativa (proceso fuera de control) H1 : µ 6= 5.2
El estadístico
D=
X̄ − 5.2
√S
n
∼ tn−1 ,
si
H0
es
cierta
Dicho estadístico es observado y toma el valor
5.7 − 5.2
= 1.92
db =
1.3
√
25
Si jamos el nivel de signicación como α = 0.05, la región de rechazo es RR=(−∞, −t24,0.975 )∪
(t24,0.975 , +∞) = (−∞, −2.06) ∪ (2.06, +∞). Como db = 1.92 ∈
/ RR, debemos concluir
que NO hay suciente evidencia y debemos de aceptar que el proceso se encuentra bajo
control.
En el ejemplo anterior se ha optado por un test bilateral porque suponemos que,
en caso de desajuste, el parámetro µ puede moverse hacia arriba o hacia abajo. Pero
imaginemos que disponemos de la información de que el parámetro tiende a subir, en
caso de desajuste. Si esto es conocido, es más razonable hacer un test unilateral pues
estamos teniendo en cuenta esta información y puede haber evidencia estadística donde
antes no la había. Evidentemente, en el caso de usar un test unilateral, hay que recordar
que la hipótesis de trabajo ha de estar en la hipótesis alternativa.
Ejemplo 2.2 El proceso de fabricación de un determinado componente industrial produ-
ce piezas cuya medida principal está distribuida normalmente de media 5.2 mm., cuando
el proceso se encuentra bajo control. El proceso se puede desajustar provocando que dicha medida principal aumente. Para contrastar si el proceso sigue bajo control se realiza
periódicamente una inspección. En una de estas inspecciones una muestra de tamaño 25
arrojó una media muestral de 5.7. y una cuasidesviación típica 1.3 mm.¾Debemos de
parar el proceso o concluir que el proceso está bajo control?.
Hipótesis Nula (proceso bajo control)
H0 : µ = 5.2
Hipótesis Alternativa (proceso fuera de control) H1 : µ > 5.2
El estadístico
D=
X̄ − 5.2
√S
n
∼ tn−1 ,
si
H0
es
cierta
Dicho estadístico es observado y toma el valor
5.7 − 5.2
db =
= 1.92
1.3
√
25
Página: 5
M. Iniesta
Universidad de Murcia
Si jamos el nivel de signicación como α = 0.05, la región de rechazo es RR=(t24,0.95 , +∞) =
(1.71, +∞). Como db = 1.92 ∈ RR, debemos concluir que SI hay suciente evidencia y
debemos de rechazar H0 para aceptar que el proceso está fuera de control.
3.
Contrastes paramétricos más frecuentes
Al igual que en el tema de intervalos de conanza, resolvemos test de hipótesis para
un solo parámetro mediante una muestra cuya población depende de dicho parámetro
desconocido y para dos parámetros a partir de dos muestras.
Para cada parámetro o pareja de parámetros tenemos tres opciones de test: uno
bilateral o de dos colas y dos unilaterales o de una sola cola.
Los test bilaterales producen resultados cuyas conclusiones son completamente equivalentes a las que se producirían de haberse construido el correspondiente intervalo de
conanza.
Sin embargo en los test unilaterales es posible restringir el espacio paramétrico, si este
hecho es conocido de antemano, tal y como se ha visto en el ejemplo anterior, suponiendo
que el parámetro sólo puede moverse en una sola dirección a partir de un valor histórico
dado.
De poder plantear un test unilateral (no siempre es posible hacer el supuesto de que el
parámetro se mueve en una sola dirección), la región de rechazo se concentra en una sola
cola de la distribución del estadístico pivote y eso puede suponer apreciar diferencias
signicativas cuando no se apreciaban en un test bilateral. De ahí la importancia de
seleccionar en cada situación el test oportuno.
Las siguientes tablas muestran, la primera para el caso de un solo parámetro y la
segunda para dos, las situaciones más frecuentes. Cada situación plantea tres posibles
hipótesis alternativas H1 6= ϑ0 , H1 > ϑ0 y H1 < ϑ0 , donde ϑ es el parámetro de
interés (media, varianza o proporción), de las que tendremos que seleccionar la que
reeje nuestra hipótesis de trabajo. La hipótesis nula será H0 = ϑ0 para los tres casos.
El procedimiento, tal y como hemos visto anteriormente, consistirá en calcular el
estadístico de contraste a partir de una muestra y contrastar si dicho valor pertenece o
no a la región de rechazo. De ser así concluiremos rechazando H0 para aceptar nuestra
hipótesis de trabajo que se ha concretado en H1 . De no pertenecer el valor del estadístico
de contraste a la región de rechazo nuestra hipótesis de trabajo no ha sido avalada por
los datos. En esta situación no concluimos que nuestra hipótesis de trabajo sea falsa,
sino más bien que los datos no son concluyentes en el sentido de que no ha podido ser
aceptada.
A modo de resumen, diremos que hay conclusión estadística sólo en el caso del rechazo
de la hipótesis nula H0 para aceptar nuestra hipótesis de trabajo H1 . En el caso de
aceptar H0 y puesto que ésta es una hipótesis débil porque es la que se considera por
defecto por razones históricas o por desconocimiento de la actualidad, diremos que no hay
conclusión estadística o que los datos no son concluyentes respecto a nuestra hipótesis
de trabajo.
Página: 6
H1
µ 6= µ0
µ > µ0
µ < µ0
µ 6= µ0
µ > µ0
µ < µ0
µ 6= µ0
µ > µ0
µ < µ0
µ 6= µ0
µ > µ0
µ < µ0
p 6= p0
p > p0
p < p0
λ 6= λ0
λ > λ0
λ < λ0
σ 2 6= σ02
σ 2 > σ02
σ 2 < σ02
N (0, 1)
pb − p0
q
desconocida (n
≥ 30)
µ
desconocida
≥ 30)
Normal con
Poisson (n
Bernoulli (n
σ
No normal con
conocida (n
N (0, 1)
χ2n−1
x − λ0
p
λ0 /n
(n − 1)S 2
σ02
p0 (1−p0 )
n
N (0, 1)
x − µ0
√
S/ n
σ
No normal con
≥ 30)
N (0, 1)
x − µ0
√
σ/ n
σ
Normal con
≥ 30)
tn−1
x − µ0
√
S/ n
σ
Normal con
desconocida
N (0, 1)
x − µ0
√
σ/ n
conocida
Distribución
Estadístico
Población
(−∞, −z1− α2 ) ∪ (z1− α2 , +∞)
(z1−α , +∞)
(−∞, −z1−α )
(−∞, −tn−1,1− α2 ) ∪ (tn−1,1− α2 , +∞)
(tn−1,1−α , +∞)
(−∞, −tn−1,1−α )
(−∞, −z1− α2 ) ∪ (z1− α2 , +∞)
(z1−α , +∞)
(−∞, −z1−α )
(−∞, −z1− α2 ) ∪ (z1− α2 , +∞)
(z1−α , +∞)
(−∞, −z1−α )
(−∞, −z1− α2 ) ∪ (z1− α2 , +∞)
(z1−α , +∞)
(−∞, −z1−α )
(−∞, −z1− α2 ) ∪ (z1− α2 , +∞)
(z1−α , +∞)
(−∞, −z1−α )
(0, χn−1, α2 ) ∪ (χn−1,1− α2 , +∞)
(χn−1,1−α , +∞)
(0, χn−1,α )
Región de Rechazo
M. Iniesta
Universidad de Murcia
Página: 7
6= 0
>0
<0
6= 0
>0
<0
µ1 − µ2
µ1 − µ2
µ1 − µ2
µ1 − µ2
µ1 − µ2
µ1 − µ2
p1 − p2 =
6 0
p1 − p2 > 0
p1 − p2 < 0
6= 0
>0
<0
6= 0
>0
<0
<1
>1
6= 1
µ1 − µ2
µ1 − µ2
µ1 − µ2
µ1 − µ2
µ1 − µ2
µ1 − µ2
σ12
σ22
σ12
σ22
σ12
σ22
H1
y
µ2
desconocidas
y
σ2
conocidas
desconocidas
1
n1
(n1
≥ 30, n2 ≥ 30)
1
n2
con
(n1 −1)S12 +(n2 −1)S22
n1+n2 −2
x − x2
r1
pb1 − pb2
q
;
( n11 + n12 )p0 (1 − p0 )
n1 pb1 + n2 pb2
p0 =
n1 + n2
D
SD
√
n
D = X1 − X2
Bernoulli, indep.,
+
x −x
q 12 2 2
S2
S1
n1 + n2
q
x −x
q 12 2 2
σ1
σ2
n1 + n2
S12
S22
Estadístico
Normales apareadas,
σ1 , σ2 desconocidas
n1 > 30, n2 > 30
No Normales indep.,
σ1 = σ2
Normales indep.,
σ1
Normales indep.,
µ1
Normales indep.,
Poblaciones
aprox.
tn−1
N (0, 1)
N (0, 1)
aprox.
tn1 +n2 −2
N (0, 1)
Fn1 −1,n2 −1
Distribución
(−∞, −z1− α2 ) ∪ (z1− α2 , +∞)
(z1−α , +∞)
(−∞, −z1−α )
(−∞, −z1− α2 ) ∪ (z1− α2 , +∞)
(z1−α , +∞)
(−∞, −z1−α )
(−∞, −tn−1,1− α2 ) ∪ (tn−1,1− α2 , +∞)
(tn−1,1−α , +∞)
(−∞, −tn−1,1−α )
(−∞, −z1− α2 ) ∪ (z1− α2 , +∞)
(z1−α , +∞)
(−∞, −z1−α )
(−∞, −tn1 +n2 −2,1− α2 ) ∪ (tn1 +n2 −2,1− α2 , +∞)
(tn1 +n2 −2,1−α , +∞)
(−∞, −tn1 +n2 −2,1−α )
(0, Fn1 −1,n2 −1, α2 ) ∪ (Fn1 −1,n2 −1,1− α2 , +∞)
(Fn1 −1,n2 −1,1−α , +∞)
(0, Fn1 −1,n2 −1,α )
Rechazo
Región de
M. Iniesta
Universidad de Murcia
Página: 8
Descargar