EST-310: TEST DE HIP´OTESIS 1. Introducción Definición 1. Una

Anuncio
EST-310: TEST DE HIPÓTESIS
FELIPE OSORIO
1. Introducción
Definición 1. Una hipótesis es un enunciado con respecto a un parámetro poblacional.
El objetivo de un test de hipótesis es decidir, basado en una muestra, acerca de la
población. Para este efecto, determinaremos cual de dos hipótesis complementarias
es verdad. Escribiremos este tipo de hipótesis, por ejemplo, como:1
H0 : θ = θ 0 ,
versus
H1 : θ = θ 1 ,
aquı́ H0 es llamada hipótesis nula, mientras que H1 se denomina hipótesis alternativa.
En general, para un modelo estadı́stico P = {Pθ : θ ∈ Θ} basado en una muestra
X = (X1 , . . . , Xn )> , un test de hipótesis es formulado mediante introducir una
partición en el espacio paramétrico de la forma:
Θ = Θ0 ∪ Θ1 ,
con
Θ0 ∩ Θ1 = ∅
versus
H1 : θ ∈ Θ1 ,
en cuyo caso, podemos escribir:
H0 : θ ∈ Θ0 ,
se debe destacar que el modelo bajo H0 asume la forma
P0 = {Pθ : θ ∈ Θ0 },
en cuyo caso decimos que la hipótesis H0 es verdadera si la muestra se distribuye
de acuerdo a Pθ ∈ P0 . Para Θ ⊆ R decimos que H0 y H1 son unilaterales si
H0 : θ ≥ θ0 ,
versus
H1 : θ < θ 0 ,
H0 : θ ≤ θ0 ,
versus
H1 : θ > θ 0 ,
versus
H1 : θ 6= θ0 .
o bien
mientras que H1 es bilateral si
H0 : θ = θ0 ,
Ejemplo 2. Suponga que θ representa el cambio medio en la presión sanguinea
de ciertos pacientes luego de recibir una droga. Ası́, podemos estar interesados en
probar:
H0 : θ = 0,
vs.
H1 : θ 6= 0,
es decir, la hipótesis nula establece que el tratamiento no tiene efecto, mientras que
la hipótesis alternativa establece que existe algún efecto.
1
Este tipo de hipótesis es llamado simple pues especifica completamente la distribución.
1
2
FELIPE OSORIO
Definición 3. Un test de hipótesis es un procedimiento o una regla para decidir
si se debe aceptar o rechazar la hipótesis nula basado en un estadı́stico de prueba
T (X)2
Aquél subconjunto del espacio muestral para el que H0 es rechazada se denomina
región de rechazo o región crı́tica. El complemento de la región de rechazo es
llamada región de aceptación. Tı́picamente T (X) es escogido tal que, bajo H0 , este
tienda a ser pequeño, es decir, mientras mayor este sea, habrá evidencia más fuerte
en contra de H0 . De este modo, la hipótesis nula será rechazada si T (X) es “muy
grande”, esto es, se rechaza H0 si:
T (X) ≥ C,
para algún valor crı́tico C.
Observación 4. Es esencial entender que la inferencia estadı́stica asociada a test
de hipótesis está sujeta a aleatoriedad y por tanto siempre existe la posibilidad de
cometer una decisión erronea: podemos erroneamente rechazar H0 (error Tipo I) o
bien aceptar H0 cuando es falsa (error Tipo II). Considere la siguiente tabla
Decisión
Aceptar H0
Rechazar H0
Verdad
H0
H1
decisión correcta
error Tipo II
(1 − α)
(β)
error Tipo I
decisión correcta
(α)
(π = 1 − β)
El objetivo es seleccionar un estadı́stico de prueba que minimice la probabilidad
de cometer una decisión erronea. Aunque desafortunadamente esto es imposible,
podemos escoger un balance entre ámbos tipos de error.
En este curso consideraremos solamente unos pocos procedimientos para definir
test de hipótesis. A continuación revisamos un método muy general, ampliamente
aplicable y que es óptimo en ciertas condiciones.
2. Test de razón de verosimilitudes
Definición 5. El estadı́stico de razón de verosimilitudes para probar H0 : θ ∈ Θ0
versus H1 : θ ∈ Θ1 (= Θc0 ) es dado por
sup L(θ; x)
λ(x) =
Θ0
sup L(θ; x)
.
Θ
Un test de razón de verosimilitudes (LRT) es cualquier test con región de rechazo
de la forma {x : λ(x) ≤ c}, donde c es un número satisfaciendo 0 ≤ c ≤ 1.
b0 el estimador máximo verosı́mil bajo H0 , es decir, asumiendo el
Considere θ
modelo P0 = {Pθ : θ ∈ Θ0 } (esto corresponde a un problema de optimización
2Evidentemente la aceptación/rechazo de H es equivalente a la aceptación/rechazo de H ,
0
1
pero tradicionalmente esta es especificada en términos de H0 .
TEST DE HIPÓTESIS
3
b0 = θ
b0 (x) es aquél valor de θ ∈ Θ0 que maximiza L(θ; x).
restringida), es decir, θ
Entonces, el estadı́stico LRT asume la forma:
b0 ; x)
L(θ
λ(x) =
,
b x)
L(θ;
b corresponde al MLE (no restringido) de θ ∈ Θ.
donde θ
Ejemplo 6. Sea X1 , . . . , Xn una muestra aleatoria de tamaño n desde N (θ, 1) y
considere que deseamos probar H0 : θ = θ0 vs. H1 : θ 6= θ0 , donde θ0 es un valor
fijado (por ejemplo, por un investigador). Sabemos que el MLE de θ es dado por
θb = X, y notando que existe sólo un único valor especificado para θ por la hipótesis
H0 , tenemos:
Pn
(2π)−n/2 exp{− 12 i=1 (xi − θ0 )2 }
L(θ0 ; x)
Pn
=
λ(x) =
b x)
(2π)−n/2 exp{− 12 i=1 (xi − x)2 }
L(θ;
Pn
Pn
2
2
= exp − 21
.
i=1 (xi − θ0 ) −
i=1 (xi − x)
Sabemos que (verificar),
n
n
X
X
(xi − θ0 )2 =
(xi − x)2 + n(x − θ0 )2 ,
i=1
i=1
desde donde sigue que el estadı́stico LRT es dado por
λ(x) = exp{− n2 (x − θ0 )2 }.
Un test LRT es aquél que rechaza H0 para valores pequeños de λ(x). En efecto, la
región de rechazo {x : λ(x) ≤ c} puede ser escrita como:3
{x : − n2 (x − θ0 )2 ≤ log c} ⇔ {x : (x − θ0 )2 ≥ − n2 log c}
q
⇔ {x : |x − θ0 | ≥ − n2 log c}.
De este modo el test LR rechaza H0 : θ = θ0 si el promedio muestral difiere del
valor hipotético θ0 por más que una cantidad especı́ficada.
Observación 7. Dado que un test de razón de verosimilitudes es aquél que rechaza
H0 si λ(x) ≤ c, sigue que, al no especificar c tenemos una clase de LRT, uno para
cada valor de c.4
En general se desea un test LR de tamaño α mediante escoger c tal que:
P(λ(x) ≤ c|H0 es verdadera) = α,
es decir, tal que la probabilidad de error Tipo I sea pequeña (este nivel de error
suele ser fijado por quien realiza el análisis).
Como se debe seleccionar el valor de c depende del problema especı́fico que se
esté considerando. Para el Ejemplo 6, tenemos que si H0 es verdadero, entonces
√
n(X − θ0 ) ∼ N (0, 1)
(es decir si θ = θ0 ). De modo que el test:
Rechazar H0 si
3Conforme c varı́a entre 0 y 1,
zα/2
|x − θ0 | ≥ √ ,
n
p
−2 log(c)/n varı́a entre 0 y ∞.
4Nota para el profesor: Este comentario es opcional.
4
FELIPE OSORIO
donde zα/2 satisface P(Z ≥ zα/2 ) = α/2 con Z ∼ N (0, 1), es un test de razón de
verosimilitudes de tamaño α.5
Es deseable hallar test con la mayor potencia (π = 1 − β) bajo H1 , es decir,
entre todos los test de tamaño α (error tipo I) fijado, tengan una alta probabilidad
de rechazar H0 cuando ésta es falsa. Sin embargo, en muchos casos determinar
este tipo de test puede ser una tarea difı́cil o incluso no existir.6 A continuación
presentamos un test ampliamente usado y que es confı́a en argumentos asintóticos
para obtener su distribución.
3. Test de Wald
Para simplificar
la exposición considere θ un parámetro escalar y θb el MLE de
q
b el error estándar de θ.
b Sabemos que
θ. Sea SE = var(θ),
θb − θ D
−→ N (0, 1),
c
SE
q
q
b = 1/ nF(θ).
b De este modo, el test de Wald tamaño α
c = 1/Fn (θ)
donde SE
para probar H0 : θ = θ0 vs. H1 : θ 6= θ0 es: rechazar H0 cuando |W | > zα/2 , donde
W =
θb − θ0
.
c
SE
D
Note que, bajo H0 : θ = θ0 , tenemos W −→ N (0, 1). De ahı́ que, la probabilidad
de rechazar H0 cuando θ = θ0 es verdadero es:
|θb − θ |
0
Pθ0 (|W | > zα/2 ) = Pθ0
> zα/2 −→ Pθ0 (|Z| > zα/2 ) = α,
c
SE
con Z ∼ N (0, 1).
Ejemplo 8. Considere X ∼ Bin(m, θ1 ) e Y ∼ Bin(n, θ2 ) para probar la hipótesis
H0 : θ1 = θ2 escribimos:
H0 : δ = 0,
vs.
H1 : δ 6= 0,
donde δ = θ1 − θ2 . El MLE es dado por δb = θb1 − θb2 (tarea: determinar θb1 y θb2 )
con error estándar
s
b
b
b
b
c = θ1 (1 − θ1 ) + θ2 (1 − θ2 ) .
SE
m
n
El test de Wald de tamaño α es: rechazar H0 cuando |W | > zα/2 , donde
W =
δb − 0
θb1 − θb2
=q
c
SE
θb1 (1 − θb1 )/m + θb2 (1 − θb2 )/n
Ejemplo 9. Suponga que X1 , . . . , Xn es una muestra aleatoria desde N (θ, σ02 ) con
√
σ02 conocido. Sabemos que el MLE de θ es dado por θb = X y que SE = σ0 / n,
5Note que esto corresponde a escoger c = exp(−z 2 /c) (sin embargo esta elección no es de
α/2
vital importancia en este punto).
6Este tópico está más allá de los objetivos del curso.
TEST DE HIPÓTESIS
5
luego el test de Wald de tamaño α para probar la hipótesis H0 : θ = θ0 versus
H1 : θ 6= θ0 es dado por: rechazar H0 si
x−θ √ 0 > zα/2 .
|W | = σ0 / n
Es decir, en este problema el test de Wald y el test de razón de verosimilitudes son
equivalentes (ver Ejemplo 6 con σ0 = 1).7
7En general es posible probar que los test de Wald y LRT son asintóticamente equivalentes.
Descargar