M. Iniesta Universidad de Murcia INFERENCIA ESTADÍSTICA Tema 3.3: Contrastes de signicación Objetivos Dominar el esquema conceptual y el lenguaje propios de los contrastes de hipótesis. Construir contrastes de hipótesis para los parámetros más importantes. Comparar dos medias o dos proporciones muestrales y analizar posibles diferencias signicativas. 1. Elementos básicos en un contraste de hipótesis paramétrico Como siempre va a ser (X1 , ..., Xn ) una m.a.s. de tamaño n, procedente de X ∼ f (x, ϑ) con ϑ desconocido. Supongamos también que Θ es el conjunto de valores posibles del parámetro, denominado espacio paramétrico. Se trata ahora de decidir entre una de dos hipótesis: Hipótesis Nula H0 : ϑ ∈ Θ0 Hipótesis Alternativa H1 : ϑ ∈ Θ1 con Θ = Θ0 ∪ Θ1 . La Hipótesis Nula H0 es siempre una hipótesis conservadora que recoge información histórica acerca del parámetro, mientras que la Hipótesis Alternativa H1 es la hipótesis de trabajo, que recoge información reciente sobre el parámetro y progresista porque suele informar de un cambio respecto al comportamiento histórico del parámetro. La metodología es asumir cierta H0 y únicamente rechazarla si se maniestan discrepancias signicativas, no atribuibles al azar; es decir, si el apoyo de H0 signica asumir que han ocurrido sucesos de probabilidad muy baja. La aceptación de H0 signicará que no ha habido conclusión estadística o que los datos aportados por la investigación empírica no han sido concluyentes. Por el contrario, el rechazo de H0 para aceptar H1 signicará que los datos proporcionados por la investigación empírica están en franco desacuerdo con la hipótesis histórica y diremos entonces que los datos son concluyentes y la hipótesis de trabajo es aceptada. En la aceptación o en el rechazo de H0 podemos cometer dos tipos de errores. Hipótesis H0 Cierta HA Decisión que se toma Aceptar H0 Rechazar H0 Correcto Error (tipo I) Error (tipo II) Correcto Aunque el error de tipo I, rechazar H0 cuando H0 es cierta, tiene más importancia que el error de tipo 2, aceptar H0 cuando H0 es falsa. Si llamamos α a la probabilidad de Página: 1 M. Iniesta Universidad de Murcia cometer un error de tipo I y β a la probabilidad de cometer un error de tipo II, lo anterior signica que supuesto que nunca será α = β = 0 (a no ser de que observemos a toda la población y con ello nunca nos equivocaremos), deberíamos de llevar a cabo test con α controlado y pequeño. Ejemplo 1.1 En un juicio tendremos que decidir entre dos hipótesis: o el acusado es inocente o el acusado es culpable. Puesto que todos somos inocentes, salvo que se demuestre lo contrario, (H0 es la hipótesis apoyada por defecto), el test que debemos plantear es: H0 : El acusado es inocente H1 : El acusado es culpable En este caso es: α = P (Condenar al acusado, siendo éste inocente) β = P (absolver al acusado, siendo éste culpable) Con el ejemplo anterior vemos que el error tipo 1, con probabilidad α, tiene más trascendencia que el error de tipo 2, por lo que tendremos que tenerlo a ralla, jando dicha probabilidad de antemano. A dicho valor prejado α se le denomina nivel de signicación. Lo anterior supone que la conclusión a la que lleguemos puede levar consigo un error tipo I, con probabilidad menor o igual que el nivel de signicación α, (que normalmente se preja como 0.05). Si hay dos posibles test para el mismo problema que cumplan lo anterior, elegiremos el que tiene probabilidad de error tipo II más pequeña. Bajo este enfoque en el que le damos más importancia al error de tipo I que al de tipo II, está claro que ha hay que tener sumo cuidado en establecer la hipótesis nula y la hipótesis alternativa. Si derivado de una investigación experimental, surge una hipótesis de trabajo que queremos contrastar, dicha hipótesis debe de ser siempre la hipótesis alternativa, puesto que la probabilidad de aceptarla, cuando es falsa, es precisamente el nivel de signicación α. Efectivamente: P (Rechazar H0 |H0 cierta) = α = P (Aceptar H1 |H1 f alsa) La metodología seguida en estos tipos de test está basada en las etapas que describimos a continuación: 2. Método de Construcción Sea (X1 , ..., Xn ) una m.a.s. de tamaño n, procedente de X ∼ f (x, ϑ) con ϑ desconocido. Los pasos a seguir para construir un contraste de hipótesis para el parámetro ϑ son: Página: 2 M. Iniesta Universidad de Murcia Metodología para construir un test de hipótesis de nivel de signicación α 1. Planteamiento de las hipótesis a contrastar. Tres tipos de test: el primero denominado test bilateral o de dos colas (test a), y los casos b y c denominados unilaterales o de una sola cola. Test a.Test b.Test c.- Hipótesis Nula Hipótesis Alternativa H0 : ϑ = ϑ0 H1 : ϑ 6= ϑ0 Hipótesis Nula Hipótesis Alternativa H0 : ϑ = ϑ0 H1 : ϑ > ϑ0 Hipótesis Nula Hipótesis Alternativa H0 : ϑ = ϑ0 H1 : ϑ < ϑ0 2. Construir D = g(X1 , . . . , Xn , ϑ0 ), llamada Estadístico de contraste, que mide la discrepancia entre lo que asevera H0 y la información muestral. 3. Si H0 es cierta, la función D tiene distribución conocida. 4. Fijamos el nivel de signicación α y observamos el valor de db de D cuando (X1 , ..., Xn ) = (x1 , ..., xn ). 5. Si el valor observado db pertenece a una región de muy baja probabilidad, supuesto H0 cierta, tengo dos opciones: o creerme que ha sucedido un suceso de muy baja probabilidad o bien que la hipótesis H0 es inaceptable, por lo que deberíamos rechazarla. Más concretamente. 6. Construimos una Región de Rechazo, (RR), jado α, en base a la distribución de probabilidad del estadístico de contraste D. La regla es rechazar H0 si db ∈RR. 7. Alternativamente, puede calcularse lo que denominaremos P-valor, donde b 0 cierta) P-valor = P (D > d|H mide el grado de apoyo de la muestra a H0 . La regla de decisión es la siguiente: Rechazar H0 si P − valor < α Aceptar H0 en caso contrario. Página: 3 M. Iniesta Universidad de Murcia Test de hipótesis para la media µ de una población normal supuesto σ desconocida 1. Planteamiento de las hipótesis a contrastar. Tres tipos de test: Test a.Test b.Test c.- Hipótesis Nula Hipótesis Alternativa H0 : µ = µ0 H1 : µ 6= µ0 Hipótesis Nula Hipótesis Alternativa H0 : µ = µ0 H1 : µ > µ0 Hipótesis Nula Hipótesis Alternativa H0 : µ = µ0 H1 : µ < µ0 2. Consideramos el Estadístico de contraste D = X − µ0 √S n , que mide la discrepancia entre lo que asevera H0 y la información muestral. 3. Si H0 es cierta (µ = µ0 ), la función D ∼ tn−1 4. Fijamos el nivel de signicación α y observamos el valor de db de D cuando x − µ0 (X1 , ..., Xn ) = (x1 , ..., xn ), es decir db = . S √ n 5. Construimos una Región de Rechazo, (RR), jado α, en base a la distribución de probabilidad del estadístico de contraste D. La regla es rechazar H0 si db ∈RR. En este caso: Test a.- RR=(−∞, −tn−1,1− α2 ) ∪ (tn−1,1− α2 , +∞) Test b.- RR=(tn−1,1−α , +∞) Test c.- RR=(−∞, −tn−1,1−α ) 6. Alternativamente, puede calcularse lo que denominaremos P-valor, donde, para cada test es: b + P (tn−1 > |d|) b Test a.- P (tn−1 < −|d|) b Test b.- P (tn−1 > d) b Test c.- P (tn−1 < d) 7. La regla e decisión es la siguiente: Rechazar H0 si P − valor < α Aceptar H0 en caso contrario. Ejemplo 2.1 El proceso de fabricación de un determinado componente industrial produ- ce piezas cuya medida principal está distribuida normalmente de media 5.2 mm., cuando Página: 4 M. Iniesta Universidad de Murcia el proceso se encuentra bajo control. Para contrastar si el proceso sigue bajo control se realiza periódicamente una inspección. En una de estas inspecciones una muestra de tamaño 25 arrojó una media muestral de 5.7. y una cuasidesviación típica 1.3 mm. ¾Debemos de parar el proceso o concluir que el proceso está bajo control?. Si planteamos el test Hipótesis Nula (proceso bajo control) H0 : µ = 5.2 Hipótesis Alternativa (proceso fuera de control) H1 : µ 6= 5.2 El estadístico D= X̄ − 5.2 √S n ∼ tn−1 , si H0 es cierta Dicho estadístico es observado y toma el valor 5.7 − 5.2 = 1.92 db = 1.3 √ 25 Si jamos el nivel de signicación como α = 0.05, la región de rechazo es RR=(−∞, −t24,0.975 )∪ (t24,0.975 , +∞) = (−∞, −2.06) ∪ (2.06, +∞). Como db = 1.92 ∈ / RR, debemos concluir que NO hay suciente evidencia y debemos de aceptar que el proceso se encuentra bajo control. En el ejemplo anterior se ha optado por un test bilateral porque suponemos que, en caso de desajuste, el parámetro µ puede moverse hacia arriba o hacia abajo. Pero imaginemos que disponemos de la información de que el parámetro tiende a subir, en caso de desajuste. Si esto es conocido, es más razonable hacer un test unilateral pues estamos teniendo en cuenta esta información y puede haber evidencia estadística donde antes no la había. Evidentemente, en el caso de usar un test unilateral, hay que recordar que la hipótesis de trabajo ha de estar en la hipótesis alternativa. Ejemplo 2.2 El proceso de fabricación de un determinado componente industrial produ- ce piezas cuya medida principal está distribuida normalmente de media 5.2 mm., cuando el proceso se encuentra bajo control. El proceso se puede desajustar provocando que dicha medida principal aumente. Para contrastar si el proceso sigue bajo control se realiza periódicamente una inspección. En una de estas inspecciones una muestra de tamaño 25 arrojó una media muestral de 5.7. y una cuasidesviación típica 1.3 mm.¾Debemos de parar el proceso o concluir que el proceso está bajo control?. Hipótesis Nula (proceso bajo control) H0 : µ = 5.2 Hipótesis Alternativa (proceso fuera de control) H1 : µ > 5.2 El estadístico D= X̄ − 5.2 √S n ∼ tn−1 , si H0 es cierta Dicho estadístico es observado y toma el valor 5.7 − 5.2 db = = 1.92 1.3 √ 25 Página: 5 M. Iniesta Universidad de Murcia Si jamos el nivel de signicación como α = 0.05, la región de rechazo es RR=(t24,0.95 , +∞) = (1.71, +∞). Como db = 1.92 ∈ RR, debemos concluir que SI hay suciente evidencia y debemos de rechazar H0 para aceptar que el proceso está fuera de control. 3. Contrastes paramétricos más frecuentes Al igual que en el tema de intervalos de conanza, resolvemos test de hipótesis para un solo parámetro mediante una muestra cuya población depende de dicho parámetro desconocido y para dos parámetros a partir de dos muestras. Para cada parámetro o pareja de parámetros tenemos tres opciones de test: uno bilateral o de dos colas y dos unilaterales o de una sola cola. Los test bilaterales producen resultados cuyas conclusiones son completamente equivalentes a las que se producirían de haberse construido el correspondiente intervalo de conanza. Sin embargo en los test unilaterales es posible restringir el espacio paramétrico, si este hecho es conocido de antemano, tal y como se ha visto en el ejemplo anterior, suponiendo que el parámetro sólo puede moverse en una sola dirección a partir de un valor histórico dado. De poder plantear un test unilateral (no siempre es posible hacer el supuesto de que el parámetro se mueve en una sola dirección), la región de rechazo se concentra en una sola cola de la distribución del estadístico pivote y eso puede suponer apreciar diferencias signicativas cuando no se apreciaban en un test bilateral. De ahí la importancia de seleccionar en cada situación el test oportuno. Las siguientes tablas muestran, la primera para el caso de un solo parámetro y la segunda para dos, las situaciones más frecuentes. Cada situación plantea tres posibles hipótesis alternativas H1 6= ϑ0 , H1 > ϑ0 y H1 < ϑ0 , donde ϑ es el parámetro de interés (media, varianza o proporción), de las que tendremos que seleccionar la que reeje nuestra hipótesis de trabajo. La hipótesis nula será H0 = ϑ0 para los tres casos. El procedimiento, tal y como hemos visto anteriormente, consistirá en calcular el estadístico de contraste a partir de una muestra y contrastar si dicho valor pertenece o no a la región de rechazo. De ser así concluiremos rechazando H0 para aceptar nuestra hipótesis de trabajo que se ha concretado en H1 . De no pertenecer el valor del estadístico de contraste a la región de rechazo nuestra hipótesis de trabajo no ha sido avalada por los datos. En esta situación no concluimos que nuestra hipótesis de trabajo sea falsa, sino más bien que los datos no son concluyentes en el sentido de que no ha podido ser aceptada. A modo de resumen, diremos que hay conclusión estadística sólo en el caso del rechazo de la hipótesis nula H0 para aceptar nuestra hipótesis de trabajo H1 . En el caso de aceptar H0 y puesto que ésta es una hipótesis débil porque es la que se considera por defecto por razones históricas o por desconocimiento de la actualidad, diremos que no hay conclusión estadística o que los datos no son concluyentes respecto a nuestra hipótesis de trabajo. Página: 6 H1 µ 6= µ0 µ > µ0 µ < µ0 µ 6= µ0 µ > µ0 µ < µ0 µ 6= µ0 µ > µ0 µ < µ0 µ 6= µ0 µ > µ0 µ < µ0 p 6= p0 p > p0 p < p0 λ 6= λ0 λ > λ0 λ < λ0 σ 2 6= σ02 σ 2 > σ02 σ 2 < σ02 N (0, 1) pb − p0 q desconocida (n ≥ 30) µ desconocida ≥ 30) Normal con Poisson (n Bernoulli (n σ No normal con conocida (n N (0, 1) χ2n−1 x − λ0 p λ0 /n (n − 1)S 2 σ02 p0 (1−p0 ) n N (0, 1) x − µ0 √ S/ n σ No normal con ≥ 30) N (0, 1) x − µ0 √ σ/ n σ Normal con ≥ 30) tn−1 x − µ0 √ S/ n σ Normal con desconocida N (0, 1) x − µ0 √ σ/ n conocida Distribución Estadístico Población (−∞, −z1− α2 ) ∪ (z1− α2 , +∞) (z1−α , +∞) (−∞, −z1−α ) (−∞, −tn−1,1− α2 ) ∪ (tn−1,1− α2 , +∞) (tn−1,1−α , +∞) (−∞, −tn−1,1−α ) (−∞, −z1− α2 ) ∪ (z1− α2 , +∞) (z1−α , +∞) (−∞, −z1−α ) (−∞, −z1− α2 ) ∪ (z1− α2 , +∞) (z1−α , +∞) (−∞, −z1−α ) (−∞, −z1− α2 ) ∪ (z1− α2 , +∞) (z1−α , +∞) (−∞, −z1−α ) (−∞, −z1− α2 ) ∪ (z1− α2 , +∞) (z1−α , +∞) (−∞, −z1−α ) (0, χn−1, α2 ) ∪ (χn−1,1− α2 , +∞) (χn−1,1−α , +∞) (0, χn−1,α ) Región de Rechazo M. Iniesta Universidad de Murcia Página: 7 6= 0 >0 <0 6= 0 >0 <0 µ1 − µ2 µ1 − µ2 µ1 − µ2 µ1 − µ2 µ1 − µ2 µ1 − µ2 p1 − p2 = 6 0 p1 − p2 > 0 p1 − p2 < 0 6= 0 >0 <0 6= 0 >0 <0 <1 >1 6= 1 µ1 − µ2 µ1 − µ2 µ1 − µ2 µ1 − µ2 µ1 − µ2 µ1 − µ2 σ12 σ22 σ12 σ22 σ12 σ22 H1 y µ2 desconocidas y σ2 conocidas desconocidas 1 n1 (n1 ≥ 30, n2 ≥ 30) 1 n2 con (n1 −1)S12 +(n2 −1)S22 n1+n2 −2 x − x2 r1 pb1 − pb2 q ; ( n11 + n12 )p0 (1 − p0 ) n1 pb1 + n2 pb2 p0 = n1 + n2 D SD √ n D = X1 − X2 Bernoulli, indep., + x −x q 12 2 2 S2 S1 n1 + n2 q x −x q 12 2 2 σ1 σ2 n1 + n2 S12 S22 Estadístico Normales apareadas, σ1 , σ2 desconocidas n1 > 30, n2 > 30 No Normales indep., σ1 = σ2 Normales indep., σ1 Normales indep., µ1 Normales indep., Poblaciones aprox. tn−1 N (0, 1) N (0, 1) aprox. tn1 +n2 −2 N (0, 1) Fn1 −1,n2 −1 Distribución (−∞, −z1− α2 ) ∪ (z1− α2 , +∞) (z1−α , +∞) (−∞, −z1−α ) (−∞, −z1− α2 ) ∪ (z1− α2 , +∞) (z1−α , +∞) (−∞, −z1−α ) (−∞, −tn−1,1− α2 ) ∪ (tn−1,1− α2 , +∞) (tn−1,1−α , +∞) (−∞, −tn−1,1−α ) (−∞, −z1− α2 ) ∪ (z1− α2 , +∞) (z1−α , +∞) (−∞, −z1−α ) (−∞, −tn1 +n2 −2,1− α2 ) ∪ (tn1 +n2 −2,1− α2 , +∞) (tn1 +n2 −2,1−α , +∞) (−∞, −tn1 +n2 −2,1−α ) (0, Fn1 −1,n2 −1, α2 ) ∪ (Fn1 −1,n2 −1,1− α2 , +∞) (Fn1 −1,n2 −1,1−α , +∞) (0, Fn1 −1,n2 −1,α ) Rechazo Región de M. Iniesta Universidad de Murcia Página: 8