TEMA 8: SEGUNDA PARTE Contrastes para variables Normales y proporciones 8.7. Contrastes para una población Normal Contrastes para la media Contrastes para la varianza 8.8. Contrastes para dos poblaciones Normales 8.8.1. Muestras independientes Contrastes para la diferencia de medias Contraste de igualdad de varianzas en variables Normales 8.8.2. Muestras pareadas: Contrastes para la diferencia de medias 8.9. Contrastes para proporciones 8.9.1. Contrastes para una proporción 8.9.2. Contrastes para la diferencia de proporciones 1 8.7. CONTRASTES PARA UNA POBLACIÓN NORMAL CONTRASTES PARA LA MEDIA DE UNA DISTRIBUCIÓN NORMAL Ejemplo 1:1 Sea X la variable “rentabilidad de cierto tipo de fondos de inversión”. Se considera que la media de esta variable es 15. Un economista afirma que dicha rentabilidad media ha variado, por lo que lleva a cabo un estudio sobre una muestra de 9 fondos cuya media muestral resulta ser de 15,308 y cuya varianza muestral corregida (cuasivarianza) es 0,193. Con estos datos, y bajo el supuetso de Normalidad, ¿cómo contrastar la afirmación del economista al 5%? Sea (X1,...,Xn) m.a.s. de XN(,) 1 Ejemplo tomado de la asignatura Estadística II de la Universidad Carlos III de Madrid (http://www.est.uc3m.es/esp/nueva_docencia/getafe/economia/estadistica_ii/documentacion_transp_archivos/tema2_2P_esp.pdf) 2 Con varianza 2 conocida 0 H0 :=0Estadístico de contraste: PivoteI.b. Z*= X 0 H N(0,1) / n Hipótesis alternativa: H1 :>0 N(0,1) 1- Rechazo H0 cuando: X 0 z p-valor=p(Z*zobs) / n z H1 :<0 Rechazo H0 cuando: X 0 -z p-valor=p(Z*zobs) / n 1- -z H1 :0 /2 /2 1- -z/2 Rechazo H0 cuando: X 0 z/2 p-valor=2p(Z*|zobs|) / n z/2 3 Con varianza 2 desconocida H0 :=0Estadístico de contraste: PivoteI.c. t*= X 0 Sc / n 0 H tn-1 Hipótesis alternativa: H1 :>0 tn-1 1- Rechazo H0 cuando: X 0 Sc / n t p-valor=p(t*tobs) t H1 :<0 1- tn-1 Rechazo H0 cuando: X 0 Sc / n -t p-valor=p(t*tobs) -t H1 :0 /2 /2 1- -t/2 Rechazo H0 cuando: X 0 Sc / n t/2 p-valor=2p(t*|tobs|) t/2 4 Relación entre contrastes bilaterales e intervalos de confianza: H0 :=0 H1 :0 Región crítica: C={ X 0 Sc / n t/2} = { Región de aceptación: A= {-t/2 X 0 Sc / n X 0 Sc / n -t/2 , X 0 Sc / n t/2} con pH0(C)= t/2 } = { t / 2 Sc X 0 t / 2 Sc }= n n ={ X t / 2 Sc 0 X t / 2 Sc }={ 0 X t / 2 Sc } , con pH0(A)=1- n n n Si 0 Intervalo de Confianza para con nivel de confianza 1- “Acepto” H0:=0 con nivel de significación EN GENERAL: Contrastar H0:=0 frente a H1:0 con nivel de significación EQUIVALE A: Construir un intervalo de confianza para , con nivel de confianza 1-, y rechazar H0 si 0 no está en dicho intervalo. 5 Ejemplo 1: (continuación) Formular la hipótesis nula y la hipótesis alternativa: Definir el estadístico de contraste: Definir la región crítica para el nivel de significación dado: Calcular el valor del estadístico de contraste para la muestra dada: Tomar la decisión: Calcular el p-valor: Obtener el intervalo de confianza para al 95% y comentar resultados 6 CONTRASTES PARA LA VARIANZA DE UNA DISTRIBUCIÓN NORMAL H0 :2= 02 Estadístico de contraste: PivoteI.d. n 2 H0 S n2 -1 02 ∗ Hipótesis alternativa: H1 : 2 > 02 1- H1 : Rechazar H0 cuando: n 2 S n2-1,1- 2 0 2 < 02 H1 : 1- Rechazar H0 cuando: n 2 S n2-1, 2 0 2 02 Rechazar H0 cuando: n 2 n 2 2 S n21,/2 ó S n1,1/2 2 2 0 0 7 8.8. CONTRASTES PARA DOS POBLACIONES NORMALES 8.8.1. MUESTRAS INDEPENDIENTES CONTRASTES PARA LA DIFERENCIA DE MEDIAS Ejemplo 2: El departamento de control de calidad de una empresa sospecha que la calidad media de los productos fabricados en el turno de noche es inferior a la de los productos fabricados en el turno de día. Para contrastar esta sospecha, se eligen al azar 8 productos fabricados en cada turno y se obtienen los siguientes índices de calidad Turno de día Turno de noche 92 82 85 86 X1,...,Xn1 m.a.s. de una N(1,1) 89 96 89 89 93 87 90 86 91 83 95 92 independientes X 1,...,Xn2 m.a.s. de una N(2,2) 8 Varianzas conocidas H0 :1-2≤0 H1 :1-2>0 Estadístico de contraste: Pivote II.a. Bajo H0 Z*= ( X1 X 2 ) 0 12 n1 N(0,1) 1- 0 22 N(0,1) n2 Rechazar H0 si Z* z. z ¿ Y si queremos contrastar alternativas distintas: de otro lado o bilateral? H0 :1-2≥0 H1 :1-2<0 Rechazar H0 si Z*-z. H0 :1-2=0 H1 :1-20 Rechazar H0 si Z*-z/2 o si Z* z/2 si |Z*|z/2 9 Varianzas desconocidas iguales H0 :1-2≤0 H1 :1-2>0 Estadístico de contraste: Pivote II.b. Bajo H0 t*= ( X 1 X 2 ) 0 2 n S2 n1S X 2 X2 1 n1 n2 2 tn1+n2-2 1 1 n1 n 2 tn n 2 1 2 Rechazo H0 cuando: t* t 1- 0 t H0 :1-2≥0 H1 :1-2<0 Rechazar H0 si t*-t H0 :1-2=0 H1 :1-20 Rechazar H0 si t* t / 2 o t * t/2 si |t*|t/2 Varianzas desconocidas distintas: Idem con Pivote II.c. 10 Ejemplo 2: X = índice de calidad de productos fabricados de día N(x,x) Y = índice de calidad de productos fabricados de noche N(y,y) X,Y independientes Formular la hipótesis nula y la hipótesis alternativa: Definir el estadístico de contraste (suponiendo varianzas iguales) Definir la región crítica Calcular el valor del estadístico de contraste para la muestra dada: Tomar la decisión: 11 CONTRASTE DE IGUALDAD DE VARIANZAS Ejemplo 3:2 Un inversor quiere comparar los riesgos asociados a dos mercados diferentes (A y B), teniendo en cuenta que dicho riesgo se mide por la variabilidad en las fluctuaciones diarias de precios. Para ello se obtienen datos de 21 cambios de precios diarios para el mercado A y de 16 para el mercado B, obteniéndose los siguientes resultados: Mercado A = 0,3 ScA= 0,25 X1,...,Xn1 m.a.s. de una N(1,1) Mercado B =0,4 ScB =0,45 independientes X 1,...,Xn2 m.a.s. de una N(2,2) 2 Ejemplo tomado de http://www.est.uc3m.es/esp/nueva_docencia/getafe/economia/estadistica_ii/documentacion_transp_archivos/tema2_2P_esp.pdf) 12 H0 : 12 = 22 H1: 12 22 Contraste bilateral: Estadístico de contraste: PivoteII.d. Bajo H0 F * SC2 1 SC2 2 F n11,n21 /2 /2 1- F/2 Rechazo H0 cuando: { S C2 1 S C2 2 F/2 , F1-/2 S C2 1 S C2 2 F1-/2 } Otra opción: obtener el Intervalo de Confianza 1- para 12 / 22 y rechazar H0 si 1I.C. Contrastes unilaterales: H1: 12 > 22 Rechazar H0 cuando H1: 12 < 22 Rechazar H0 cuando S C2 1 S C2 2 S C2 1 S C2 2 > F1- < F 13 Ejemplo 3: (continuación) X = fluctuaciones diarias de precios en el mercado AN(A,A) Y = fluctuaciones diarias de precios en el mercado BN(B,B) Formular la hipótesis nula y la hipótesis alternativa: Definir el estadístico de contraste y calcular su valor para la muestra dada: Definir la región crítica Calcular el valor del estadístico de contraste para la muestra dada: Tomar la decisión: Obtener el intervalo de confianza para 12 / 22 y comentar resultados 14 Ejemplo 2: (continuación) X = índice de calidad de productos fabricados de día N(x,x) Y = índice de calidad de productos fabricados de noche N(y,y) X,Y independientes Contraste para comparar las medias: H0 :Y≥X H1 :Y<X Para resolver este problema, tendríamos que haber contrastado previamente si las varianzas de las dos variables son iguales contraste previo: H0 : 2X = 2Y H1 : 2X 2Y 15 8.8.2. MUESTRAS PAREADAS: CONTRASTE DE IGUALDAD DE MEDIAS Ejemplo 4: (Casas, 1997, pp. 262-264) Se tienen los siguientes datos del consumo de gasolina por 1000 km de una muestra aleatoria de 9 coches utilizando dos carburantes X e Y (coches conducidos por los mismos conductores, en las mismas carreteras, las mismas distancias, etc). X Y D=X-Y 132 124 8 139 141 -2 126 118 8 114 116 -2 122 114 8 132 132 0 142 145 -3 119 123 -4 126 121 5 Suponiendo normalidad, contrasta al 1% si el consumo medio con ambos carburantes es igual. 16 X 1 ... X n m.a.s. de una Normal bidimensional X N x x2 2 Y Y1 Yn y xy xy y2 2 2 Diferencia: D=X-Y N(D,D), con D=x-y, D = X Y 2 XY Tengo una m.a.s: D1,...,Dn de una v.a. unidimensional: DN(D,D) Contraste bilateral:3 H0 :x-Y=0 H1 :X-Y0 H0 : D =0 H1 : D 0 Estadístico de contraste : Pivote I.c. bajo H0 D 0 SC / n tn-1 D Rechazo H0 si: D 0 SC / n t/2 D Otra opción: obtener el Intervalo de Confianza 1- para D y rechazar H0 si 0I.C. Importante: las muestras pareadas reducen el efecto de otros factores 3 Para alternativas H1 unilaterales se procede como en los casos anteriores 17 Ejemplo 4: (continuación) H0 :D =0 H1 :D 0 Contraste bilateral: 1 n D Di =2; ScD= n i 1 PIVOTE (I.c): 1 n (Di D )2 =5.17 n 1 i 1 D D t n-1 SC D / n I.C. para D al (1-α)% D D t/2 S CD n (1-)=0.99 0.995=p(t8 t/2 ) t/2 =3.355 I.C.: [2 3.355x 5,17 ]=[-3.78, 7.78] Como D=0 I.C. “Acepto” H0 al 1% 9 (1-)=0.95 0.975=p(t8 t/2 ) t/2 =2.306 I.C.: [2 2.306x 5,17 ]=[-1.97, 5.97] Como D=0 I.C. “Acepto” H0 al 5% 9 18 8.9. CONTRASTES PARA PROPORCIONES 8.9.1. CONTRASTES PARA UNA PROPORCIÓN Ejemplo 5: Un fabricante de automóviles trabaja con un proveedor que afirma que no más del 5% de sus piezas son defectuosas. El fabricante decide contrastar esta afirmación seleccionando de su inventario 20 piezas y probándolas. ¿Deberá sospechar el fabricante de la afirmación del proveedor si se descubren 2 piezas defectuosas en la muestra? Ejemplo 6: Peña (2001, p.393) La proporción de gente que votó a cierto partido en las elecciones pasadas fue el 25%. Se toma hoy una muestra de 500 electores y se obtiene que el 22% votaría a dicho partido. ¿Hay evidencia de un descenso en la intención de voto? 1 si ocurre A (éxito) p 0 si ocurre A (fracaso) 1 p Sea X1,...,Xn m.a.s de una Bernoulli b(p), Xi= _ Xi=nº de éxitos en la muestra; p̂ = X = proporción de éxitos en la muestra 19 Muestras “pequeñas” Estadístico de contraste: Xi H0 :p≥p0 H1:p<p0 H0 :p≤p0 H1:p>p0 B(n,p0) H0 :p=p0 H1:pp0 p-valor=p(Xi≤(xi)obs) p-valor=p(Xi≥ xi)obs) p-valor=2min{p(Xi≥(xi)obs),p(Xi≤(xi)obs)} Ejemplo 5: (continuación) Formular la hipótesis nula y la hipótesis alternativa: Definir el estadístico de contraste y su distribución: Definir la región crítica: Obtener el valor del estadístico para la muestra dada y calcular el p-valor: Tomar la decisión: 20 Muestras “grandes”Teorema Central del Límite: Estadístico de contraste: Bajo H0 Z*= pˆ p0 p 0 (1 p 0 ) pˆ p ~ N ( 0,1) p (1 p ) A n ~A N (0,1) n H0 :p≥p0 H1 :p<p0 N(0,1) Rechazo H0 si pˆ p0 -z p-valor=p(Z*≤zobs) p0 (1 p0 ) / n -z H0 :p≤p0 H1 :p>p0 N(0,1) Rechazo H0 si 1- pˆ p0 z p-valor=p(Z*zobs) p0 (1 p0 ) / n z 21 H0 :p=p0 H1 :pp0 N(0,1) /2 /2 1- -z/2 0 Rechazo H0 si: | | z/2 p-valor=p(|Z*||zobs|)=2p(Z*|zobs|) z/2 ¡ OJO ! ¡ diferencia importante respecto al intervalo de confianza ! Para construir el Intervalo de Confianza para p, el pivote es: pˆ p pˆ (1 pˆ ) n ~ A N (0,1) sustituimos p por su estimador En problemas de proporciones, los contrastes bilaterales no se resuelven a través del I.C. sino planteando la región crítica de 2 colas 22 Ejemplo 6: (continuación) Formular la hipótesis nula y la hipótesis alternativa: Definir el estadístico de contraste: Definir la región crítica: Calcular el valor del estadístico de contraste para la muestra dada: Calcular el p-valor: Tomar la decisión: 23 8.9.2. CONTRASTES PARA LA DIFERENCIA DE PROPORCIONES Ejemplo 7: (Newbold, 1998, p. 270) Se extrajeron dos muestras aleatorias independientes de estudiantes universitarios de último curso de sexo masculino y femenino. De 120 hombres seleccionados, 107 esperaban disfrutar de un trabajo fijo en un máximo de 10 años. De 141 mujeres seleccionadas, 73 tenían esa esperanza. ¿Podemos concluir, con un nivel de significación del 5%, que las expectativas de empleo son iguales en hombres y en mujeres con estudios universitarios? X1,...,X m.a.s. de una v.a. Xb(pX) Y1,...,Y m.a.s. de una v.a. Yb(pY) independientes 24 Teorema Central del Límite: ( pˆ X - pˆ Y ) - ( pX - pY ) ~ N (0,1) , donde p̂X = , p̂Y = pX (1 pX ) pY (1 pY ) A nx ny Hipótesis nula: H0 :pX=pY=p0 Estadístico de contraste: Bajo H0 pˆ X pˆ Y pˆ X pˆ Y p0 (1 p0 ) p0 (1 p0 ) 1 1 p0 (1 p0 ) nx ny nx n y Estimar p0 con la media ponderada: pˆ 0 ~ N(0,1) A n x pˆ X n y pˆ Y nx n y Hipótesis alternativa: H1 :pX>pY H1 :pX<pY H1 :pXpY Rechazar H0 si: pˆ X pˆ Y z Rechazar H0 si: pˆ X pˆ Y -z Rechazar H0 si: | pˆ X pˆ Y | z/2 1 1 pˆ 0 (1 pˆ 0 ) nx n y 1 1 pˆ 0 (1 pˆ 0 ) nx n y 1 1 pˆ 0 (1 pˆ 0 ) nx n y 25 Ejemplo 7: (continuación) Formular la hipótesis nula y la hipótesis alternativa: Definir el estadístico de contraste: Definir la región crítica para el nivel de significación dado: Calcular el valor del estadístico de contraste para la muestra dada: Tomar la decisión: Calcular el p-valor: Obtener el intervalo de confianza para al 95% y comentar resultados 26 BIBLIOGRAFÍA BÁSICA Canavos, G.C. (2001) Probabilidad y estadística: aplicaciones y métodos, Madrid: McGraw-Hill. Secciones 9.6, 9.7, 9.8 Casas, J.M. (1997) Inferencia estadística (incluye ejercicios resueltos). Madrid: Centro de Estudios Ramón Areces. Capítulo 6 BIBLIOGRAFÍA COMPLEMENTARIA: Newbold (1998) Estadística para los Negocios y la Economía. 4ª ed. Madrid: Prentice Hall. Capítulo 9 Novales (1997) Estadística y Econometría. Madrid: McGraw Hill. Capítulo 10 Peña, D. (2008) Fundamentos de estadística, Madrid: Alianza. Secciones 10.4, 10.5, 10.6 27