Relación nº4. Contraste de hipótesis.

Anuncio
Relación 4.
Contrastes de hipótesis.
1.– Defina los siguientes conceptos, interprételos brevemente con sus propias palabras y
relaciónelos entre sí: hipótesis nula y alternativa; hipótesis simple y compuesta; función
potencia, errores posibles en un contraste de hipótesis, tamaño de un contraste; contraste
uniformemente más potente.
2.– Estudie la veracidad o falsedad de las siguientes afirmaciones. Para ello, defina en
primer lugar los conceptos y después argumente detalladamente su contestación.
a) La función de potencia no es una probabilidad por eso no tiene ninguna relación con
la probabilidad del error tipo I y del error tipo II.
b) El test uniformemente más potente de tamaño α tiene asociada una función de
potencia horizontal.
c) El tamaño del test y el p–valor (α–valor) tienen cierta relación.
d) En los test de una cola, la regla de rechazo nos proporciona un valor crítico donde se
produce un cambio de decisión respecto a la hipótesis nula.
e) Los tests de dos colas proporcionan dos valores críticos que delimitan dos zonas
para los valores del estadístico del test, la zona de rechazo de la hipótesis nula y la zona
de aceptación.
f) La región crítica de un test se construye a partir de la regla de rechazo del mismo.
3.– a) Sea una población que se distribuye normalmente con media µ y varianza 1. Se
intenta contrastar Ho:µ=0 contra H1:µ=1. A un tamaño dado del 5% determine el test más
potente. Aplíquelo suponiendo que se dispone de una m.a.s. de tamaño 5, con los siguientes
valores: 3, 1, -2, -5, 4. Calcule la probabilidad de cometer error del tipo II.
b) Si la población es normal y σ es desconocida, ¿se podría aplicar el mismo
resultado que en el apartado anterior para contrastar H0:µ=µ0 contra H1:µ=µ1?.¿Conoce
alguna otra forma de obtener un contraste para esta situación?
c) Demuestre cuál es el test uniformemente más potente para contrastar H0:µ=10
frente a H1: µ=8 en una N(µ,3) si n=20 y α=0.05. Obtenga la potencia de dicho contraste.
d) Sea una población normal, una muestra suya compuesta de 10 individuos y el
contraste habitual para H0: µ=1 frente H1: µ≠1 de tamaño 10%. ¿Qué tipo de error puede
ocurrir, según cuál sea el resultado del test, si µ toma cada uno de los tres valores
siguientes: 0, 1 y 2?. Halle en cada caso una expresión de la probabilidad de que ocurra.
4.– Una población se distribuye según una distribución de Bernouilli de parámetro p. Se
sabe que p=0.5 ó 0.75. Determine el test más potente que le ayude a elegir entre una u otra
hipótesis tomando como hipótesis nula la asociada al menor valor de p. Aplíquelo al caso de
un experimento en el que p es la probabilidad de tener éxito y al ser repetido 90 veces de
forma independiente, produce 65 éxitos. ¿Qué hipótesis rechazaría en esa situación a un
tamaño del 5%?
5.– a) Considere la familia de distribuciones B(n,p) con n conocida. ¿Es una familia
exponencial? ¿Tiene un cociente de verosimilitudes monótono para el parámetro p en
algún estadístico? Razone las respuestas.
b) Los artículos que salen de la línea de producción de una empresa A se van
empaquetando en cajas de 100 unidades que son enviadas a una segunda empresa B,
que utiliza dichos artículos en la fabricación de nuevos productos más elaborados. La
Estadística aplicada a la empresa II.
1
empresa A asegura que el número medio de artículos defectuosos por caja es de 3, pero
en la empresa B piensan que puede ser superior. Para contrastar estas aseveraciones,
los responsables de la empresa B escogen 7 cajas al azar y examinan todos los artículos,
obteniendo la siguiente cantidad de defectuosos por caja: 2,5,4,1,3,2,5. En estas
condiciones, b1) ¿se aceptará la afirmación del proveedor para un tamaño de test del
5%? y b2) ¿se mantendría la decisión para un tamaño de test inferior al anterior?
6.– Supongamos que a partir de una muestra aleatoria simple de una distribución
geométrica se desea contrastar si la probabilidad de éxito es p0 contra que sea p1.
a) Determine el mejor test para contrastar lo señalado. ¿Resulta siempre el mismo
contraste?.
b) Deje claramente señalado cuánto valdrían la función potencia del contraste, su tamaño,
la probabilidad de cometer error de tipo I y la de cometer error de tipo II, en cada caso.
c) ¿En qué resultado se basa para creer que el test que ha obtenido es el mejor para
contrastar esa hipótesis?. Defina formalmente lo que crea que pueda significar el
concepto intuitivo de “mejor test” y explique también esa definición con sus propias
palabras.
7.– En una centralita de teléfonos, el número de llamadas recibidas por minuto sigue una
distribución de Poisson de parámetro λ. En una hora concreta, se han recibido 357. El
número de llamadas en minutos diferentes son independientes entre si.
a) Se quiere contrastar λ=5 frente a λ=10. Encuentre el test más potente de tamaño α=0.05
y aplíquelo.
b) Haga lo mismo si se quiere contrastar λ=5 contra λ=λo donde λo es un valor fijo mayor
que 5.
c) ¿Existe un test uniformemente más potente para contrastar Ho: λ=5 contra H1: λ>5 ?
(Indicación: ¿Se puede utilizar el mismo test que en el caso de H1 simple?).
d) ¿Podría encontrar, por el mismo método, un test uniformemente más potente para la
hipótesis Ho: λ≤5 contra la alternativa H1: λ>5? ¿Y por otro método?
8.– Una universidad que ha de comprar una partida de lámparas para retroproyector, acude
a una empresa que asegura para ellas una duración media –o esperanza de vida– mínima
de 600 horas con una desviación típica de 36.5. La duración de las lámparas sigue una
distribución normal. Antes de realizar el pedido pone a prueba una muestra de 36 de ellas, y
decide que lo efectuará si comprueba que lo afirmado por la empresa es aceptable. En todo
caso, el dato acerca de la desviación típica sí que es considerado válido.
a) Fijado un riesgo de α=5%, ¿cuál es la duración media que debe arrojar la muestra para
hacer el pedido?
b) ¿Cuál es la probabilidad de que el pedido sea hecho, si la esperanza de vida de las
lámparas es 585? ¿Qué tipo de error mide esa probabilidad? ¿Se contradice su valor con
el 5% de riesgo que se fijó para calcular el test?
9.– Se ha aplicado un cierto test de memoria a un gran número de estudiantes de
bachillerato, encontrándose 33.5 y 38.2 como desviaciones típicas poblacionales para las
alumnas y alumnos respectivamente. Aplicando el test a una muestra de 18 alumnas, dio
una media muestral de 183.7, y para una muestra de 25 alumnos, resultó una media de
165.4. ¿Son estos resultados significativos de una diferencia de medias poblacionales entre
los dos sexos? (α=0.05 y suponga normalidad en las puntuaciones del test).
Estadística aplicada a la empresa II.
2
10.– La distribución del gasto mensual por persona en consumo de alimentos en una
determinada ciudad sigue una distribución normal de varianza 225 u.m.2, mientras que en
otra ciudad se distribuye también normal pero con varianza 100 u.m.2. Encuestadas 100
personas de cada una de las ciudades, el gasto medio mensual muestral en cada una de
ellas es de 36 u.m. y 40 u.m. respectivamente.
a) Construya teóricamente un intervalo de confianza al 95% para la diferencia de medias.
Halle el valor numérico de dicho intervalo para los datos muestrales del enunciado.
b) ¿Se rechazaría la igualdad de medias poblacionales para un nivel de significación del
1%?. Relacione la respuesta de este apartado con la del anterior.
c) Para el contraste del apartado b), ¿cuál será el valor de la función de potencia en el
caso en que la media poblacional para la primera ciudad fuera de 36,50 u.m. y para la
segunda de 38,50 u.m.?
11.– Dos fábricas de válvulas electrónicas utilizan procedimientos diferentes de fabricación.
La duración de vida de estas válvulas se supone normal. Se extrae en la primera fábrica una
muestra de 20 válvulas y en la segunda una de 25. Para la primera muestra, los resultados
muestrales son 1832 horas para la media y 497 horas para la desviación típica. En la
segunda son, 1261 h. y 501 h. respectivamente. ¿Puede considerarse la diferencia entre las
medias significativa a un nivel del 5%?
12.– La tabla adjunta representa el número de horas de sueño ganadas por 10 pacientes
con un cierto somnífero. ¿Según estos datos, podemos admitir que el somnífero no aumenta
la media de horas de sueño? Se supone normalidad. (α=0.05).
Paciente
1
2
3
4
5
6
7
8
9
10
Horas ganadas
1.2
-1.3
0.7
3.4
0.8
3.1
0.2
1.8
2
3.1
13.– a) Supongamos que los salarios mensuales (en cientos de euros) de los empleados
de dos empresas distintas del mismo sector se distribuyen normalmente con varianzas 9 y
3,96, respectivamente. Se extraen de cada empresa sendas muestras aleatorias simples
de tamaño n=9, obteniéndose como valor de las medias muestrales, 8,10 y 8,76,
respectivamente. ¿A qué nivel es (–2.634,1.314) el intervalo de confianza de longitud
mínima para esas realizaciones muestrales si se desea comparar los salarios medios
poblacionales entre sí?
b) A partir de la información muestral dada, ¿qué decisión adoptaría en un contraste de
igualdad de medias si se trabaja con un tamaño del 10%? ¿Y con uno del 5%? Relacione
los resultados de este apartado con los del anterior.
14.– Se fabrica una pieza circular que debe ser colocada en el interior de otra. Ello obliga
a que los errores en la longitud de su diámetro deban ser controlados con mucho cuidado.
Los errores que se cometen siguen una distribución N(0,σ2). Se desea contrastar Ho: σ2≤1;
H1:σ2>1. Decidir qué hipótesis debe aceptarse al tamaño 5%, si se han observado los
siguientes errores (medidos en décimas de mm.): 0.3, 0.8, -0.6, 1.2, -0.7, -1.8, 0, 2.0, -1.1.
15.– Los creadores de un sistema de enseñanza aseguran que la varianza del nivel de
conocimientos en cálculo aritmético para los niños de tercer curso del sistema escolar de un
país es como máximo 25. La población sigue una ley normal. Para una muestra de 61
alumnos, se obtiene S2=23. A un tamaño del 5%, ¿se puede concluir que la varianza de las
puntuaciones se encuentra dentro del rango señalado por los creadores del sistema de
enseñanza?
Estadística aplicada a la empresa II.
3
16.– La fabricación de un producto se hace de manera artesanal. Actualmente, un obrero
es capaz de elaborar al mes una media de 4000 unidades con una desviación típica en
esa cantidad mensual de 20 unidades, siendo la cantidad finalmente producida al mes por
cada obrero, una v.a. normal. Se desea contrastar la efectividad de unas nuevas
herramientas que en principio deberían de afectar solo a la calidad de la producción no a
la productividad de los obreros. Se seleccionan 5 obreros y se les dota de las nuevas
herramientas. Tras un mes de prueba, los datos de producción mensual de cada obrero
son 4010, 3975, 3992, 4028 y 4055. Se desea contrastar si la desviación típica de la
producción usando las herramientas nuevas es menor o igual que antes o no. No se sabe
si suponer o no que el uso de las nuevas herramientas no afecta a la media de lo
producido. Aplique bajo una posibilidad y otra para la media, el test correspondiente para
la desviación típica explicando las diferencias en el planteamiento en cada caso y los
estadísticos que usa.
17.– Se cree que en una región española A, la dispersión de los sueldos –medida a través
de su varianza– no supera en mas de un 10% a la que existe en otra región B. Se toman
muestras de 31 salarios en A (denotados Xi) y 61 en B (denotados Yj).
a) Exprese la condición que han de cumplir las respectivas desviaciones típicas
muestrales, para que esa hipótesis sea aceptada a un tamaño del 10%.
b) Si los resultados de las muestras son –medidos en cientos de euros–: ΣXi =3255,
ΣXi2=403155, ΣYi =7015 y ΣYi2 =861625, ¿se aceptaría la hipótesis a ese tamaño? ¿En
qué caso cambiaría el resultado del contraste, aumentando o disminuyendo el tamaño?
Halle hasta qué niveles habría que llevar el tamaño para que se produjera ese cambio.
18.– Un equipo de pedagogos ha creado un sistema de enseñanza asistida por ordenador
que el primer año consigue mejoras, según ellos, en un 40% de los alumnos a lo que se les
aplica. Antes de adoptarlo, el Ministerio de Educación de un país desea probar su eficacia.
Lo implantaría si el porcentaje de éxitos fuera, como mínimo, el señalado por los creadores.
¿Qué decisión deberá tomar el Ministerio si, tras extraer una muestra de 1020 alumnos,
éstos pasan por el sistema y se observa una mejora en el 42% de ellos? ¿Para qué valores
del tamaño se aceptaría lo afirmado por el equipo de pedagogos?
19.– ¿Se puede afirmar que es igual la probabilidad de nacer hombre o mujer en una
comarca donde se ha escogido al azar una muestra de 1000 niños recién nacidos y de ellos
485 son mujeres y 515 hombres? (α=0.05).
20.– Se realiza una comparación entre las probabilidades pA y pB de aprobar dos
asignaturas A y B, en concreto se trabaja con la diferencia entre ambas cantidades pA–pB.
Una muestra aleatoria simple de estudiantes de A de tamaño 50, arroja una cifra de 30
aprobados. Una de B, de tamaño 75, muestra 36 aprobados. Ambas muestras son
independientes entre sí. Se usa como estimador de cada una de las probabilidades, la
proporción de aprobados en cada muestra, y como estimador de la diferencia entre
ambas, la diferencia entre esas proporciones muestrales. Empleando resultados
asintóticos adecuados para cada proporción muestral, halle una distribución asintótica
para la diferencia de las proporciones muestrales –por ahora use tamaños muestrales
cualesquiera nA y nB–. Emplee esa distribución para hallar un intervalo aleatorio de nivel p
asintóticamente válido para pA–pB –siga empleando tamaños genéricos para las
muestras–. Aplíquelo sobre las muestras obtenidas, obtenga un intervalo de confianza de
Estadística aplicada a la empresa II.
4
tamaño 95% para pA–pB y, a partir de él, indique si podemos aceptar la hipótesis de que
no existe diferencia significativa entre ambas probabilidades. ¿Qué tamaño tendría el test
que ha usado para aceptar o rechazar esa última hipótesis?
21.– Una estación A de servicio de gasolina realiza una campaña publicitaria en la que
asegura que el índice de octano de sus combustibles se ajusta fielmente a las cifras
expuestas en los surtidores. Con objeto de verificar la veracidad del mensaje y, al mismo
tiempo, para lanzar una contraofensiva de captación del mercado, el gerente de la estación
B más próxima, bajo supervisión oficial, ha dirigido una investigación realizando el análisis
de 100 muestras de gasolina de 95 octanos, extraídas al azar en otros tantos días del año,
de las estaciones A y B. Las medias y desviaciones típicas de los resultados de los análisis
son los que se indican. Las distribuciones correspondientes son, en todo caso, normales:
Estación A n1=100 Media muestral=93.2
Varianza muestral=0.96
Estación B n2=100 Media muestral=94.8
Varianza muestral=1.2
a) Contrastar Ho:µA≥95, H1:µ A<95. (α=2%).
b) Contrastar Ho:µB≥95, H1:µ B <95. (α=2%).
c) Contrastar Ho:µA≥µB, H1:µA<µB. (α=2%).
d) Contrastar Ho:σA2≤σB2, H1:σA2>σB2. (α=2.5%).
22.– a) Con el objetivo de determinar si ha cambiado la calidad de la producción, se
escogieron 25 objetos, obteniéndose una media muestral de 4.6 y una desviación típica
muestral de 0.45. Se supone normalidad en la variable. ¿Se puede considerar que ha
cambiado la calidad de la producción si con anterioridad ésta presentaba un nivel medio
de 5.5 y se sabe que se mantiene igual la varianza?. Explique y aplique el test que
conozca que sirve para responder a esa pregunta a un tamaño del 5%.
b) Medir la calidad de un objeto tal y como se hacía en el apartado a), lleva un cierto coste
por unidad. Se propone ahora un nuevo método de medición con un coste unitario distinto.
En los dos casos, el coste sigue una distribución normal. Para poder comparar costes
antiguo y nuevo, se aplican de forma independiente cada uno de los métodos sobre una
muestra de 10 artículos. Los costes medios muestrales y las desviaciones típicas muestrales
son, respectivamente, 1.4 y 0.21 u.m. para el antiguo método, y 1.6 y 0.25 u.m. para el
nuevo.
b1) Determine si ambos métodos tienen la misma varianza en su coste. (α=0.05)
b2) Suponiendo varianzas iguales, ¿se puede, con un tamaño de error del 10%, afirmar
que el coste medio del nuevo método es superior en al menos 0.3 u.m. al del antiguo?
SOLUCIONES:
3.– a) El test más potente de tamaño α=0.05 será: ‘rechazar Ho si X ≥0.7357’. La
probabilidad de cometer error tipo II sera igual a 0.2776.
b) El método aplicado en el apartado anterior (el Lema de Neyman–Pearson) no se puede
emplear aquí pues las hipótesis no son simples. Se podría utilizar el cociente de
verosimilitudes generalizado, aunque su aplicación sería muy complicada. Tomando como
base el estadístico T=( X –µ0)/(S/(n–1)½) que sigue una distribución tn–1 bajo H0, se puede
plantear el siguiente contraste: si µ0≤µ1, ‘rechazar si T>tn–1,α’; si µ0≥µ1, ‘rechazar si T<–tn–1,α’.
c) Rechazar Ho si X ≤8.896. β(µ=8)=Pµ=8(Rechazar Ho)=0.9099=1–Pµ=8(Error tipo II)
Estadística aplicada a la empresa II.
5
d) El contraste es ‘rechazar H0 si 3( X –1)/S es >t9,α/2 ó <–t9,α/2’.
Si µ=0 ⇒ el error posible es de tipo II. P(µ=0,σ)(Error tipo II)=P(µ=0,σ)(–t9,α/2<3( X –1)/S<t9,α/2)
Si µ=1 ⇒ el error posible es de tipo I. P(µ=1,σ)(Error tipo I)=α
Si µ=2 ⇒ el error posible es de tipo II. P(µ=2,σ)(Error tipo II)=P(µ=2,σ)(–t9,α /2<3( X –1)/S<t9,α /2)
4.– El test más potente de tamaño 5% será: ‘rechazar Ho si ∑Xi≥53.30292’. En el caso
propuesto, se rechaza Ho.
5.– a) Es una familia exponencial con c.v.m. no decreciente para p en el estadístico T=∑Xi.
b1) El contraste adecuado rechazaría H0 si ∑Xi>27,924. A la vista de la muestra, como
22<27,924, no existe evidencia para rechazar H0 (np=3 ó p=0.03) frente H1 (np>3 ó p>0.03).
b2) La decisión anterior solo se cambiaría para tamaños superiores a 36.98%.
6.– a) Si p0<p1 el mejor test consiste en ‘rechazar H0 si ∑Xi≤A’. Si p0>p1 el mejor test
consiste en ‘rechazar H0 si ∑Xi≥A’. En ambos casos, A se calcula de forma que el tamaño
del test sea el deseado.
b) Si p0<p1 β(p)=Pp(∑Xi≤A). Además β(p0)=P(Error tipo I)=α y β(p1)=1–P(Error tipo II). Si
p0>p1 solo habría que cambiar la desigualdad ∑Xi≤A por ∑Xi≥A.
7.– El test más potente de tamaño 5% será: ‘rechazar Ho si ∑Xi≥328.98969’. En los dos
primeros apartados se obtiene el test aplicando el Lema de Neyman–Pearson. Este test es
también el test u.m.p. para las hipótesis de los otros dos apartados gracias al mismo tipo de
razonamiento en el que se basa la demostración de los resultados conocidos para familias
de distribuciones con cociente de verosimilitudes monótono. De hecho, también se pueden
aplicar estos resultados para demostrar en ambos apartados que es el test u.m.p.
8.– a) Si X ≤ 589.993 , rechazo Ho.
b) Pµ=585 ( X ≥ 589.993 ) =0.2061. No se contradice con el 5%. Ese 5% es probabilidad
máxima de error de tipo I –rechazar Ho siendo esta cierta–, mientras que la probabilidad
calculada aquí es probabilidad de cometer error de tipo II –aceptar H0– cuando µ=585.
9.– Al ser –1.96<1.6656<1.96, se acepta Ho:µ1–µ2=0.
10.– a) µ1–µ2∈(–7.533,–0.467) con una confianza del 95%.
b) No se rechaza H0 porque 0∈(–8.644,0.644) (intervalo al 99% para µ1–µ2).
c) β(µ1–µ2=–2)=0.07089
11.– Como 3.728>2.020, se rechaza Ho:µ1-µ2=0.
12.– Como 3.1964>1.8331, se acepta que se ganan horas de sueño en media (H1:µ>0).
13.– a) 90% b) Al 5% no se rechaza Ho:µ1-µ2=0 porque 0∈(–3.012,1.692). Al 10% tampoco
porque 0∈(–2.634, 1.314).
14.– 11.47 < 16.9 así que se acepta Ho: σ2≤1.
15.– Al ser 56.12<79.08, se acepta Ho:σ2≤25.
16.– a) Al ser 11.495>11.1 rechazo σ2≤400 frente a σ2>400.
b) Al ser 9.695>9.5 rechazo σ2≤400 frente a σ2>400.
17.– a) S1≤1.2369S2 b) Como 2,0328>1.4755 rechazamos σ12/σ22≤1.1. Para no rechazar
esa hipótesis habría que tomar tamaños iguales o inferiores a 0.98%.
18.– Dados los resultados muestrales, lo asegurado por los creadores del sistema es muy
creíble. ¡¡Solo con valores del tamaño superiores al 90.38% se rechazaría la hipótesis nula!!
19.– Por analogía con el caso conocido normal y empleando una aproximación asintótica
normal para la distribución del porcentaje muestral de hombres (o del de mujeres), se toma
como contraste el que tiene el siguiente criterio: ‘rechazar la nula si el porcentaje muestral de
hombres (mujeres) supera al 53.1% o baja del 46.9%.’. Como en este caso el porcentaje
Estadística aplicada a la empresa II.
6
muestral de hombres es del 51.5% (el de mujeres es 48.5%), no se rechaza la hipótesis de
que es la misma la probabilidad de que nazca un hombre o una mujer.
20.– pA–pB∈(–0.057,0.297) al 95%. No hay evidencia suficiente para rechazar H0:pA–pB=0
frente a H1:pA–pB≠0 a un tamaño del 5% o tamaños menores que este.
21.– a) Aproximando a una normal, como –18.2791<–2.06, se rechaza Ho.
b) Aproximando a una normal, como –1.8166>–2.06, se acepta Ho.
c) Aproximando a una normal, como –10.832<–2.06, se rechaza Ho.
d) Tomando F99,99=F120,120, al ser 0.8<1.43, se acepta Ho.
22.– a) Al ser –9.798<–2.064 rechazamos H0:µ=5.5 frente a H1: µ≠5.5
b1) Como 0.248<0.7056<4.026 no hay evidencia suficiente para rechazar H0:σ12/σ12=1.
b2) Como 0.9188>–1.33, no hay evidencia suficiente para rechazar H0:µ1–µ2≤–0.3.
Estadística aplicada a la empresa II.
7
Descargar