EST-310: TEST DE HIPÓTESIS FELIPE OSORIO 1. Introducción Definición 1. Una hipótesis es un enunciado con respecto a un parámetro poblacional. El objetivo de un test de hipótesis es decidir, basado en una muestra, acerca de la población. Para este efecto, determinaremos cual de dos hipótesis complementarias es verdad. Escribiremos este tipo de hipótesis, por ejemplo, como:1 H0 : θ = θ 0 , versus H1 : θ = θ 1 , aquı́ H0 es llamada hipótesis nula, mientras que H1 se denomina hipótesis alternativa. En general, para un modelo estadı́stico P = {Pθ : θ ∈ Θ} basado en una muestra X = (X1 , . . . , Xn )> , un test de hipótesis es formulado mediante introducir una partición en el espacio paramétrico de la forma: Θ = Θ0 ∪ Θ1 , con Θ0 ∩ Θ1 = ∅ versus H1 : θ ∈ Θ1 , en cuyo caso, podemos escribir: H0 : θ ∈ Θ0 , se debe destacar que el modelo bajo H0 asume la forma P0 = {Pθ : θ ∈ Θ0 }, en cuyo caso decimos que la hipótesis H0 es verdadera si la muestra se distribuye de acuerdo a Pθ ∈ P0 . Para Θ ⊆ R decimos que H0 y H1 son unilaterales si H0 : θ ≥ θ0 , versus H1 : θ < θ 0 , H0 : θ ≤ θ0 , versus H1 : θ > θ 0 , versus H1 : θ 6= θ0 . o bien mientras que H1 es bilateral si H0 : θ = θ0 , Ejemplo 2. Suponga que θ representa el cambio medio en la presión sanguinea de ciertos pacientes luego de recibir una droga. Ası́, podemos estar interesados en probar: H0 : θ = 0, vs. H1 : θ 6= 0, es decir, la hipótesis nula establece que el tratamiento no tiene efecto, mientras que la hipótesis alternativa establece que existe algún efecto. 1 Este tipo de hipótesis es llamado simple pues especifica completamente la distribución. 1 2 FELIPE OSORIO Definición 3. Un test de hipótesis es un procedimiento o una regla para decidir si se debe aceptar o rechazar la hipótesis nula basado en un estadı́stico de prueba T (X)2 Aquél subconjunto del espacio muestral para el que H0 es rechazada se denomina región de rechazo o región crı́tica. El complemento de la región de rechazo es llamada región de aceptación. Tı́picamente T (X) es escogido tal que, bajo H0 , este tienda a ser pequeño, es decir, mientras mayor este sea, habrá evidencia más fuerte en contra de H0 . De este modo, la hipótesis nula será rechazada si T (X) es “muy grande”, esto es, se rechaza H0 si: T (X) ≥ C, para algún valor crı́tico C. Observación 4. Es esencial entender que la inferencia estadı́stica asociada a test de hipótesis está sujeta a aleatoriedad y por tanto siempre existe la posibilidad de cometer una decisión erronea: podemos erroneamente rechazar H0 (error Tipo I) o bien aceptar H0 cuando es falsa (error Tipo II). Considere la siguiente tabla Decisión Aceptar H0 Rechazar H0 Verdad H0 H1 decisión correcta error Tipo II (1 − α) (β) error Tipo I decisión correcta (α) (π = 1 − β) El objetivo es seleccionar un estadı́stico de prueba que minimice la probabilidad de cometer una decisión erronea. Aunque desafortunadamente esto es imposible, podemos escoger un balance entre ámbos tipos de error. En este curso consideraremos solamente unos pocos procedimientos para definir test de hipótesis. A continuación revisamos un método muy general, ampliamente aplicable y que es óptimo en ciertas condiciones. 2. Test de razón de verosimilitudes Definición 5. El estadı́stico de razón de verosimilitudes para probar H0 : θ ∈ Θ0 versus H1 : θ ∈ Θ1 (= Θc0 ) es dado por sup L(θ; x) λ(x) = Θ0 sup L(θ; x) . Θ Un test de razón de verosimilitudes (LRT) es cualquier test con región de rechazo de la forma {x : λ(x) ≤ c}, donde c es un número satisfaciendo 0 ≤ c ≤ 1. b0 el estimador máximo verosı́mil bajo H0 , es decir, asumiendo el Considere θ modelo P0 = {Pθ : θ ∈ Θ0 } (esto corresponde a un problema de optimización 2Evidentemente la aceptación/rechazo de H es equivalente a la aceptación/rechazo de H , 0 1 pero tradicionalmente esta es especificada en términos de H0 . TEST DE HIPÓTESIS 3 b0 = θ b0 (x) es aquél valor de θ ∈ Θ0 que maximiza L(θ; x). restringida), es decir, θ Entonces, el estadı́stico LRT asume la forma: b0 ; x) L(θ λ(x) = , b x) L(θ; b corresponde al MLE (no restringido) de θ ∈ Θ. donde θ Ejemplo 6. Sea X1 , . . . , Xn una muestra aleatoria de tamaño n desde N (θ, 1) y considere que deseamos probar H0 : θ = θ0 vs. H1 : θ 6= θ0 , donde θ0 es un valor fijado (por ejemplo, por un investigador). Sabemos que el MLE de θ es dado por θb = X, y notando que existe sólo un único valor especificado para θ por la hipótesis H0 , tenemos: Pn (2π)−n/2 exp{− 12 i=1 (xi − θ0 )2 } L(θ0 ; x) Pn = λ(x) = b x) (2π)−n/2 exp{− 12 i=1 (xi − x)2 } L(θ; Pn Pn 2 2 = exp − 21 . i=1 (xi − θ0 ) − i=1 (xi − x) Sabemos que (verificar), n n X X (xi − θ0 )2 = (xi − x)2 + n(x − θ0 )2 , i=1 i=1 desde donde sigue que el estadı́stico LRT es dado por λ(x) = exp{− n2 (x − θ0 )2 }. Un test LRT es aquél que rechaza H0 para valores pequeños de λ(x). En efecto, la región de rechazo {x : λ(x) ≤ c} puede ser escrita como:3 {x : − n2 (x − θ0 )2 ≤ log c} ⇔ {x : (x − θ0 )2 ≥ − n2 log c} q ⇔ {x : |x − θ0 | ≥ − n2 log c}. De este modo el test LR rechaza H0 : θ = θ0 si el promedio muestral difiere del valor hipotético θ0 por más que una cantidad especı́ficada. Observación 7. Dado que un test de razón de verosimilitudes es aquél que rechaza H0 si λ(x) ≤ c, sigue que, al no especificar c tenemos una clase de LRT, uno para cada valor de c.4 En general se desea un test LR de tamaño α mediante escoger c tal que: P(λ(x) ≤ c|H0 es verdadera) = α, es decir, tal que la probabilidad de error Tipo I sea pequeña (este nivel de error suele ser fijado por quien realiza el análisis). Como se debe seleccionar el valor de c depende del problema especı́fico que se esté considerando. Para el Ejemplo 6, tenemos que si H0 es verdadero, entonces √ n(X − θ0 ) ∼ N (0, 1) (es decir si θ = θ0 ). De modo que el test: Rechazar H0 si 3Conforme c varı́a entre 0 y 1, zα/2 |x − θ0 | ≥ √ , n p −2 log(c)/n varı́a entre 0 y ∞. 4Nota para el profesor: Este comentario es opcional. 4 FELIPE OSORIO donde zα/2 satisface P(Z ≥ zα/2 ) = α/2 con Z ∼ N (0, 1), es un test de razón de verosimilitudes de tamaño α.5 Es deseable hallar test con la mayor potencia (π = 1 − β) bajo H1 , es decir, entre todos los test de tamaño α (error tipo I) fijado, tengan una alta probabilidad de rechazar H0 cuando ésta es falsa. Sin embargo, en muchos casos determinar este tipo de test puede ser una tarea difı́cil o incluso no existir.6 A continuación presentamos un test ampliamente usado y que es confı́a en argumentos asintóticos para obtener su distribución. 3. Test de Wald Para simplificar la exposición considere θ un parámetro escalar y θb el MLE de q b el error estándar de θ. b Sabemos que θ. Sea SE = var(θ), θb − θ D −→ N (0, 1), c SE q q b = 1/ nF(θ). b De este modo, el test de Wald tamaño α c = 1/Fn (θ) donde SE para probar H0 : θ = θ0 vs. H1 : θ 6= θ0 es: rechazar H0 cuando |W | > zα/2 , donde W = θb − θ0 . c SE D Note que, bajo H0 : θ = θ0 , tenemos W −→ N (0, 1). De ahı́ que, la probabilidad de rechazar H0 cuando θ = θ0 es verdadero es: |θb − θ | 0 Pθ0 (|W | > zα/2 ) = Pθ0 > zα/2 −→ Pθ0 (|Z| > zα/2 ) = α, c SE con Z ∼ N (0, 1). Ejemplo 8. Considere X ∼ Bin(m, θ1 ) e Y ∼ Bin(n, θ2 ) para probar la hipótesis H0 : θ1 = θ2 escribimos: H0 : δ = 0, vs. H1 : δ 6= 0, donde δ = θ1 − θ2 . El MLE es dado por δb = θb1 − θb2 (tarea: determinar θb1 y θb2 ) con error estándar s b b b b c = θ1 (1 − θ1 ) + θ2 (1 − θ2 ) . SE m n El test de Wald de tamaño α es: rechazar H0 cuando |W | > zα/2 , donde W = δb − 0 θb1 − θb2 =q c SE θb1 (1 − θb1 )/m + θb2 (1 − θb2 )/n Ejemplo 9. Suponga que X1 , . . . , Xn es una muestra aleatoria desde N (θ, σ02 ) con √ σ02 conocido. Sabemos que el MLE de θ es dado por θb = X y que SE = σ0 / n, 5Note que esto corresponde a escoger c = exp(−z 2 /c) (sin embargo esta elección no es de α/2 vital importancia en este punto). 6Este tópico está más allá de los objetivos del curso. TEST DE HIPÓTESIS 5 luego el test de Wald de tamaño α para probar la hipótesis H0 : θ = θ0 versus H1 : θ 6= θ0 es dado por: rechazar H0 si x−θ √ 0 > zα/2 . |W | = σ0 / n Es decir, en este problema el test de Wald y el test de razón de verosimilitudes son equivalentes (ver Ejemplo 6 con σ0 = 1).7 7En general es posible probar que los test de Wald y LRT son asintóticamente equivalentes.