Relación 4. Contrastes de hipótesis. 1.– Defina los siguientes conceptos, interprételos brevemente con sus propias palabras y relaciónelos entre sí: hipótesis nula y alternativa; hipótesis simple y compuesta; función potencia, errores posibles en un contraste de hipótesis, tamaño de un contraste; contraste uniformemente más potente. 2.– Estudie la veracidad o falsedad de las siguientes afirmaciones. Para ello, defina en primer lugar los conceptos y después argumente detalladamente su contestación. a) La función de potencia no es una probabilidad por eso no tiene ninguna relación con la probabilidad del error tipo I y del error tipo II. b) El test uniformemente más potente de tamaño α tiene asociada una función de potencia horizontal. c) El tamaño del test y el p–valor (α–valor) tienen cierta relación. d) En los test de una cola, la regla de rechazo nos proporciona un valor crítico donde se produce un cambio de decisión respecto a la hipótesis nula. e) Los tests de dos colas proporcionan dos valores críticos que delimitan dos zonas para los valores del estadístico del test, la zona de rechazo de la hipótesis nula y la zona de aceptación. f) La región crítica de un test se construye a partir de la regla de rechazo del mismo. 3.– a) Sea una población que se distribuye normalmente con media µ y varianza 1. Se intenta contrastar Ho:µ=0 contra H1:µ=1. A un tamaño dado del 5% determine el test más potente. Aplíquelo suponiendo que se dispone de una m.a.s. de tamaño 5, con los siguientes valores: 3, 1, -2, -5, 4. Calcule la probabilidad de cometer error del tipo II. b) Si la población es normal y σ es desconocida, ¿se podría aplicar el mismo resultado que en el apartado anterior para contrastar H0:µ=µ0 contra H1:µ=µ1?.¿Conoce alguna otra forma de obtener un contraste para esta situación? c) Demuestre cuál es el test uniformemente más potente para contrastar H0:µ=10 frente a H1: µ=8 en una N(µ,3) si n=20 y α=0.05. Obtenga la potencia de dicho contraste. d) Sea una población normal, una muestra suya compuesta de 10 individuos y el contraste habitual para H0: µ=1 frente H1: µ≠1 de tamaño 10%. ¿Qué tipo de error puede ocurrir, según cuál sea el resultado del test, si µ toma cada uno de los tres valores siguientes: 0, 1 y 2?. Halle en cada caso una expresión de la probabilidad de que ocurra. 4.– Una población se distribuye según una distribución de Bernouilli de parámetro p. Se sabe que p=0.5 ó 0.75. Determine el test más potente que le ayude a elegir entre una u otra hipótesis tomando como hipótesis nula la asociada al menor valor de p. Aplíquelo al caso de un experimento en el que p es la probabilidad de tener éxito y al ser repetido 90 veces de forma independiente, produce 65 éxitos. ¿Qué hipótesis rechazaría en esa situación a un tamaño del 5%? 5.– a) Considere la familia de distribuciones B(n,p) con n conocida. ¿Es una familia exponencial? ¿Tiene un cociente de verosimilitudes monótono para el parámetro p en algún estadístico? Razone las respuestas. b) Los artículos que salen de la línea de producción de una empresa A se van empaquetando en cajas de 100 unidades que son enviadas a una segunda empresa B, que utiliza dichos artículos en la fabricación de nuevos productos más elaborados. La Estadística aplicada a la empresa II. 1 empresa A asegura que el número medio de artículos defectuosos por caja es de 3, pero en la empresa B piensan que puede ser superior. Para contrastar estas aseveraciones, los responsables de la empresa B escogen 7 cajas al azar y examinan todos los artículos, obteniendo la siguiente cantidad de defectuosos por caja: 2,5,4,1,3,2,5. En estas condiciones, b1) ¿se aceptará la afirmación del proveedor para un tamaño de test del 5%? y b2) ¿se mantendría la decisión para un tamaño de test inferior al anterior? 6.– Supongamos que a partir de una muestra aleatoria simple de una distribución geométrica se desea contrastar si la probabilidad de éxito es p0 contra que sea p1. a) Determine el mejor test para contrastar lo señalado. ¿Resulta siempre el mismo contraste?. b) Deje claramente señalado cuánto valdrían la función potencia del contraste, su tamaño, la probabilidad de cometer error de tipo I y la de cometer error de tipo II, en cada caso. c) ¿En qué resultado se basa para creer que el test que ha obtenido es el mejor para contrastar esa hipótesis?. Defina formalmente lo que crea que pueda significar el concepto intuitivo de “mejor test” y explique también esa definición con sus propias palabras. 7.– En una centralita de teléfonos, el número de llamadas recibidas por minuto sigue una distribución de Poisson de parámetro λ. En una hora concreta, se han recibido 357. El número de llamadas en minutos diferentes son independientes entre si. a) Se quiere contrastar λ=5 frente a λ=10. Encuentre el test más potente de tamaño α=0.05 y aplíquelo. b) Haga lo mismo si se quiere contrastar λ=5 contra λ=λo donde λo es un valor fijo mayor que 5. c) ¿Existe un test uniformemente más potente para contrastar Ho: λ=5 contra H1: λ>5 ? (Indicación: ¿Se puede utilizar el mismo test que en el caso de H1 simple?). d) ¿Podría encontrar, por el mismo método, un test uniformemente más potente para la hipótesis Ho: λ≤5 contra la alternativa H1: λ>5? ¿Y por otro método? 8.– Una universidad que ha de comprar una partida de lámparas para retroproyector, acude a una empresa que asegura para ellas una duración media –o esperanza de vida– mínima de 600 horas con una desviación típica de 36.5. La duración de las lámparas sigue una distribución normal. Antes de realizar el pedido pone a prueba una muestra de 36 de ellas, y decide que lo efectuará si comprueba que lo afirmado por la empresa es aceptable. En todo caso, el dato acerca de la desviación típica sí que es considerado válido. a) Fijado un riesgo de α=5%, ¿cuál es la duración media que debe arrojar la muestra para hacer el pedido? b) ¿Cuál es la probabilidad de que el pedido sea hecho, si la esperanza de vida de las lámparas es 585? ¿Qué tipo de error mide esa probabilidad? ¿Se contradice su valor con el 5% de riesgo que se fijó para calcular el test? 9.– Se ha aplicado un cierto test de memoria a un gran número de estudiantes de bachillerato, encontrándose 33.5 y 38.2 como desviaciones típicas poblacionales para las alumnas y alumnos respectivamente. Aplicando el test a una muestra de 18 alumnas, dio una media muestral de 183.7, y para una muestra de 25 alumnos, resultó una media de 165.4. ¿Son estos resultados significativos de una diferencia de medias poblacionales entre los dos sexos? (α=0.05 y suponga normalidad en las puntuaciones del test). Estadística aplicada a la empresa II. 2 10.– La distribución del gasto mensual por persona en consumo de alimentos en una determinada ciudad sigue una distribución normal de varianza 225 u.m.2, mientras que en otra ciudad se distribuye también normal pero con varianza 100 u.m.2. Encuestadas 100 personas de cada una de las ciudades, el gasto medio mensual muestral en cada una de ellas es de 36 u.m. y 40 u.m. respectivamente. a) Construya teóricamente un intervalo de confianza al 95% para la diferencia de medias. Halle el valor numérico de dicho intervalo para los datos muestrales del enunciado. b) ¿Se rechazaría la igualdad de medias poblacionales para un nivel de significación del 1%?. Relacione la respuesta de este apartado con la del anterior. c) Para el contraste del apartado b), ¿cuál será el valor de la función de potencia en el caso en que la media poblacional para la primera ciudad fuera de 36,50 u.m. y para la segunda de 38,50 u.m.? 11.– Dos fábricas de válvulas electrónicas utilizan procedimientos diferentes de fabricación. La duración de vida de estas válvulas se supone normal. Se extrae en la primera fábrica una muestra de 20 válvulas y en la segunda una de 25. Para la primera muestra, los resultados muestrales son 1832 horas para la media y 497 horas para la desviación típica. En la segunda son, 1261 h. y 501 h. respectivamente. ¿Puede considerarse la diferencia entre las medias significativa a un nivel del 5%? 12.– La tabla adjunta representa el número de horas de sueño ganadas por 10 pacientes con un cierto somnífero. ¿Según estos datos, podemos admitir que el somnífero no aumenta la media de horas de sueño? Se supone normalidad. (α=0.05). Paciente 1 2 3 4 5 6 7 8 9 10 Horas ganadas 1.2 -1.3 0.7 3.4 0.8 3.1 0.2 1.8 2 3.1 13.– a) Supongamos que los salarios mensuales (en cientos de euros) de los empleados de dos empresas distintas del mismo sector se distribuyen normalmente con varianzas 9 y 3,96, respectivamente. Se extraen de cada empresa sendas muestras aleatorias simples de tamaño n=9, obteniéndose como valor de las medias muestrales, 8,10 y 8,76, respectivamente. ¿A qué nivel es (–2.634,1.314) el intervalo de confianza de longitud mínima para esas realizaciones muestrales si se desea comparar los salarios medios poblacionales entre sí? b) A partir de la información muestral dada, ¿qué decisión adoptaría en un contraste de igualdad de medias si se trabaja con un tamaño del 10%? ¿Y con uno del 5%? Relacione los resultados de este apartado con los del anterior. 14.– Se fabrica una pieza circular que debe ser colocada en el interior de otra. Ello obliga a que los errores en la longitud de su diámetro deban ser controlados con mucho cuidado. Los errores que se cometen siguen una distribución N(0,σ2). Se desea contrastar Ho: σ2≤1; H1:σ2>1. Decidir qué hipótesis debe aceptarse al tamaño 5%, si se han observado los siguientes errores (medidos en décimas de mm.): 0.3, 0.8, -0.6, 1.2, -0.7, -1.8, 0, 2.0, -1.1. 15.– Los creadores de un sistema de enseñanza aseguran que la varianza del nivel de conocimientos en cálculo aritmético para los niños de tercer curso del sistema escolar de un país es como máximo 25. La población sigue una ley normal. Para una muestra de 61 alumnos, se obtiene S2=23. A un tamaño del 5%, ¿se puede concluir que la varianza de las puntuaciones se encuentra dentro del rango señalado por los creadores del sistema de enseñanza? Estadística aplicada a la empresa II. 3 16.– La fabricación de un producto se hace de manera artesanal. Actualmente, un obrero es capaz de elaborar al mes una media de 4000 unidades con una desviación típica en esa cantidad mensual de 20 unidades, siendo la cantidad finalmente producida al mes por cada obrero, una v.a. normal. Se desea contrastar la efectividad de unas nuevas herramientas que en principio deberían de afectar solo a la calidad de la producción no a la productividad de los obreros. Se seleccionan 5 obreros y se les dota de las nuevas herramientas. Tras un mes de prueba, los datos de producción mensual de cada obrero son 4010, 3975, 3992, 4028 y 4055. Se desea contrastar si la desviación típica de la producción usando las herramientas nuevas es menor o igual que antes o no. No se sabe si suponer o no que el uso de las nuevas herramientas no afecta a la media de lo producido. Aplique bajo una posibilidad y otra para la media, el test correspondiente para la desviación típica explicando las diferencias en el planteamiento en cada caso y los estadísticos que usa. 17.– Se cree que en una región española A, la dispersión de los sueldos –medida a través de su varianza– no supera en mas de un 10% a la que existe en otra región B. Se toman muestras de 31 salarios en A (denotados Xi) y 61 en B (denotados Yj). a) Exprese la condición que han de cumplir las respectivas desviaciones típicas muestrales, para que esa hipótesis sea aceptada a un tamaño del 10%. b) Si los resultados de las muestras son –medidos en cientos de euros–: ΣXi =3255, ΣXi2=403155, ΣYi =7015 y ΣYi2 =861625, ¿se aceptaría la hipótesis a ese tamaño? ¿En qué caso cambiaría el resultado del contraste, aumentando o disminuyendo el tamaño? Halle hasta qué niveles habría que llevar el tamaño para que se produjera ese cambio. 18.– Un equipo de pedagogos ha creado un sistema de enseñanza asistida por ordenador que el primer año consigue mejoras, según ellos, en un 40% de los alumnos a lo que se les aplica. Antes de adoptarlo, el Ministerio de Educación de un país desea probar su eficacia. Lo implantaría si el porcentaje de éxitos fuera, como mínimo, el señalado por los creadores. ¿Qué decisión deberá tomar el Ministerio si, tras extraer una muestra de 1020 alumnos, éstos pasan por el sistema y se observa una mejora en el 42% de ellos? ¿Para qué valores del tamaño se aceptaría lo afirmado por el equipo de pedagogos? 19.– ¿Se puede afirmar que es igual la probabilidad de nacer hombre o mujer en una comarca donde se ha escogido al azar una muestra de 1000 niños recién nacidos y de ellos 485 son mujeres y 515 hombres? (α=0.05). 20.– Se realiza una comparación entre las probabilidades pA y pB de aprobar dos asignaturas A y B, en concreto se trabaja con la diferencia entre ambas cantidades pA–pB. Una muestra aleatoria simple de estudiantes de A de tamaño 50, arroja una cifra de 30 aprobados. Una de B, de tamaño 75, muestra 36 aprobados. Ambas muestras son independientes entre sí. Se usa como estimador de cada una de las probabilidades, la proporción de aprobados en cada muestra, y como estimador de la diferencia entre ambas, la diferencia entre esas proporciones muestrales. Empleando resultados asintóticos adecuados para cada proporción muestral, halle una distribución asintótica para la diferencia de las proporciones muestrales –por ahora use tamaños muestrales cualesquiera nA y nB–. Emplee esa distribución para hallar un intervalo aleatorio de nivel p asintóticamente válido para pA–pB –siga empleando tamaños genéricos para las muestras–. Aplíquelo sobre las muestras obtenidas, obtenga un intervalo de confianza de Estadística aplicada a la empresa II. 4 tamaño 95% para pA–pB y, a partir de él, indique si podemos aceptar la hipótesis de que no existe diferencia significativa entre ambas probabilidades. ¿Qué tamaño tendría el test que ha usado para aceptar o rechazar esa última hipótesis? 21.– Una estación A de servicio de gasolina realiza una campaña publicitaria en la que asegura que el índice de octano de sus combustibles se ajusta fielmente a las cifras expuestas en los surtidores. Con objeto de verificar la veracidad del mensaje y, al mismo tiempo, para lanzar una contraofensiva de captación del mercado, el gerente de la estación B más próxima, bajo supervisión oficial, ha dirigido una investigación realizando el análisis de 100 muestras de gasolina de 95 octanos, extraídas al azar en otros tantos días del año, de las estaciones A y B. Las medias y desviaciones típicas de los resultados de los análisis son los que se indican. Las distribuciones correspondientes son, en todo caso, normales: Estación A n1=100 Media muestral=93.2 Varianza muestral=0.96 Estación B n2=100 Media muestral=94.8 Varianza muestral=1.2 a) Contrastar Ho:µA≥95, H1:µ A<95. (α=2%). b) Contrastar Ho:µB≥95, H1:µ B <95. (α=2%). c) Contrastar Ho:µA≥µB, H1:µA<µB. (α=2%). d) Contrastar Ho:σA2≤σB2, H1:σA2>σB2. (α=2.5%). 22.– a) Con el objetivo de determinar si ha cambiado la calidad de la producción, se escogieron 25 objetos, obteniéndose una media muestral de 4.6 y una desviación típica muestral de 0.45. Se supone normalidad en la variable. ¿Se puede considerar que ha cambiado la calidad de la producción si con anterioridad ésta presentaba un nivel medio de 5.5 y se sabe que se mantiene igual la varianza?. Explique y aplique el test que conozca que sirve para responder a esa pregunta a un tamaño del 5%. b) Medir la calidad de un objeto tal y como se hacía en el apartado a), lleva un cierto coste por unidad. Se propone ahora un nuevo método de medición con un coste unitario distinto. En los dos casos, el coste sigue una distribución normal. Para poder comparar costes antiguo y nuevo, se aplican de forma independiente cada uno de los métodos sobre una muestra de 10 artículos. Los costes medios muestrales y las desviaciones típicas muestrales son, respectivamente, 1.4 y 0.21 u.m. para el antiguo método, y 1.6 y 0.25 u.m. para el nuevo. b1) Determine si ambos métodos tienen la misma varianza en su coste. (α=0.05) b2) Suponiendo varianzas iguales, ¿se puede, con un tamaño de error del 10%, afirmar que el coste medio del nuevo método es superior en al menos 0.3 u.m. al del antiguo? SOLUCIONES: 3.– a) El test más potente de tamaño α=0.05 será: ‘rechazar Ho si X ≥0.7357’. La probabilidad de cometer error tipo II sera igual a 0.2776. b) El método aplicado en el apartado anterior (el Lema de Neyman–Pearson) no se puede emplear aquí pues las hipótesis no son simples. Se podría utilizar el cociente de verosimilitudes generalizado, aunque su aplicación sería muy complicada. Tomando como base el estadístico T=( X –µ0)/(S/(n–1)½) que sigue una distribución tn–1 bajo H0, se puede plantear el siguiente contraste: si µ0≤µ1, ‘rechazar si T>tn–1,α’; si µ0≥µ1, ‘rechazar si T<–tn–1,α’. c) Rechazar Ho si X ≤8.896. β(µ=8)=Pµ=8(Rechazar Ho)=0.9099=1–Pµ=8(Error tipo II) Estadística aplicada a la empresa II. 5 d) El contraste es ‘rechazar H0 si 3( X –1)/S es >t9,α/2 ó <–t9,α/2’. Si µ=0 ⇒ el error posible es de tipo II. P(µ=0,σ)(Error tipo II)=P(µ=0,σ)(–t9,α/2<3( X –1)/S<t9,α/2) Si µ=1 ⇒ el error posible es de tipo I. P(µ=1,σ)(Error tipo I)=α Si µ=2 ⇒ el error posible es de tipo II. P(µ=2,σ)(Error tipo II)=P(µ=2,σ)(–t9,α /2<3( X –1)/S<t9,α /2) 4.– El test más potente de tamaño 5% será: ‘rechazar Ho si ∑Xi≥53.30292’. En el caso propuesto, se rechaza Ho. 5.– a) Es una familia exponencial con c.v.m. no decreciente para p en el estadístico T=∑Xi. b1) El contraste adecuado rechazaría H0 si ∑Xi>27,924. A la vista de la muestra, como 22<27,924, no existe evidencia para rechazar H0 (np=3 ó p=0.03) frente H1 (np>3 ó p>0.03). b2) La decisión anterior solo se cambiaría para tamaños superiores a 36.98%. 6.– a) Si p0<p1 el mejor test consiste en ‘rechazar H0 si ∑Xi≤A’. Si p0>p1 el mejor test consiste en ‘rechazar H0 si ∑Xi≥A’. En ambos casos, A se calcula de forma que el tamaño del test sea el deseado. b) Si p0<p1 β(p)=Pp(∑Xi≤A). Además β(p0)=P(Error tipo I)=α y β(p1)=1–P(Error tipo II). Si p0>p1 solo habría que cambiar la desigualdad ∑Xi≤A por ∑Xi≥A. 7.– El test más potente de tamaño 5% será: ‘rechazar Ho si ∑Xi≥328.98969’. En los dos primeros apartados se obtiene el test aplicando el Lema de Neyman–Pearson. Este test es también el test u.m.p. para las hipótesis de los otros dos apartados gracias al mismo tipo de razonamiento en el que se basa la demostración de los resultados conocidos para familias de distribuciones con cociente de verosimilitudes monótono. De hecho, también se pueden aplicar estos resultados para demostrar en ambos apartados que es el test u.m.p. 8.– a) Si X ≤ 589.993 , rechazo Ho. b) Pµ=585 ( X ≥ 589.993 ) =0.2061. No se contradice con el 5%. Ese 5% es probabilidad máxima de error de tipo I –rechazar Ho siendo esta cierta–, mientras que la probabilidad calculada aquí es probabilidad de cometer error de tipo II –aceptar H0– cuando µ=585. 9.– Al ser –1.96<1.6656<1.96, se acepta Ho:µ1–µ2=0. 10.– a) µ1–µ2∈(–7.533,–0.467) con una confianza del 95%. b) No se rechaza H0 porque 0∈(–8.644,0.644) (intervalo al 99% para µ1–µ2). c) β(µ1–µ2=–2)=0.07089 11.– Como 3.728>2.020, se rechaza Ho:µ1-µ2=0. 12.– Como 3.1964>1.8331, se acepta que se ganan horas de sueño en media (H1:µ>0). 13.– a) 90% b) Al 5% no se rechaza Ho:µ1-µ2=0 porque 0∈(–3.012,1.692). Al 10% tampoco porque 0∈(–2.634, 1.314). 14.– 11.47 < 16.9 así que se acepta Ho: σ2≤1. 15.– Al ser 56.12<79.08, se acepta Ho:σ2≤25. 16.– a) Al ser 11.495>11.1 rechazo σ2≤400 frente a σ2>400. b) Al ser 9.695>9.5 rechazo σ2≤400 frente a σ2>400. 17.– a) S1≤1.2369S2 b) Como 2,0328>1.4755 rechazamos σ12/σ22≤1.1. Para no rechazar esa hipótesis habría que tomar tamaños iguales o inferiores a 0.98%. 18.– Dados los resultados muestrales, lo asegurado por los creadores del sistema es muy creíble. ¡¡Solo con valores del tamaño superiores al 90.38% se rechazaría la hipótesis nula!! 19.– Por analogía con el caso conocido normal y empleando una aproximación asintótica normal para la distribución del porcentaje muestral de hombres (o del de mujeres), se toma como contraste el que tiene el siguiente criterio: ‘rechazar la nula si el porcentaje muestral de hombres (mujeres) supera al 53.1% o baja del 46.9%.’. Como en este caso el porcentaje Estadística aplicada a la empresa II. 6 muestral de hombres es del 51.5% (el de mujeres es 48.5%), no se rechaza la hipótesis de que es la misma la probabilidad de que nazca un hombre o una mujer. 20.– pA–pB∈(–0.057,0.297) al 95%. No hay evidencia suficiente para rechazar H0:pA–pB=0 frente a H1:pA–pB≠0 a un tamaño del 5% o tamaños menores que este. 21.– a) Aproximando a una normal, como –18.2791<–2.06, se rechaza Ho. b) Aproximando a una normal, como –1.8166>–2.06, se acepta Ho. c) Aproximando a una normal, como –10.832<–2.06, se rechaza Ho. d) Tomando F99,99=F120,120, al ser 0.8<1.43, se acepta Ho. 22.– a) Al ser –9.798<–2.064 rechazamos H0:µ=5.5 frente a H1: µ≠5.5 b1) Como 0.248<0.7056<4.026 no hay evidencia suficiente para rechazar H0:σ12/σ12=1. b2) Como 0.9188>–1.33, no hay evidencia suficiente para rechazar H0:µ1–µ2≤–0.3. Estadística aplicada a la empresa II. 7