1.-Prueba de hipotesis para una media conocida
La duración de las bombillas de 100 watt que fabrica una empresa sigue una distribución normal con
una desviación de 120 horas. Su vida media está garantizada durante un mínimo de 800 horas.
Se escoge al azar una muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una
vida media de 750 horas.
a) Con un nivel de significación de 0,01¿habría que rechazar el lote por no cumplir la garantía?
ÍTEM A
Queremos hacer una prueba de hipotesis sobre la media de la duración de las bombillas. ¿Durán en
promedio más de 800 horas o menos?
La variable es X: duración (en horas) de una bombilla de 100 watts, fabricada por cierta empresa.
Se sabe que:
X∼N(μ=?;σ=120)
No conocemos el valor de la media. Pero sí conocemos la media muestral de una muestra de
tamaño 50:
n=50;¯x=750
A primera vista parecería que las bombillas están durando menos que lo prometido por el fabricante.
(El fabricante garantiza que duran en promedio 800 horas o más y obtuvimos una media muestral
de 750 horas.)
Pero no podemos tomar la decisión “a ojo”.
Tenemos que realizar una prueba de hipótesis.
Vamos a hacer la prueba de hipótesis realizando los pasos recomendados.
No es necesario escribir todos estos pasos, pero lo hacemos porque lo hace mucho más fácil de
entender.
Paso 1: Definir la variable.
X: duración (en horas) de una bombilla de 100 watts, fabricada por cierta empresa.
X∼N(μ=?;σ=120)
Paso 2: Plantear las hipótesis estadísticas
El fabricante afirma que duran 800 horas o más:
H0:μ≥800
Queremos contrastar esa hipótesis con:
H1:μ<800
Paso 3: Establecer un estadístico de prueba.
En este caso hay dos posibles. Que son equivalentes.
Cómo X∼N y σ es conocida, conocemos la distribución de la variable media muestral:
¯X∼N(μ,σ√ n )
Este es un estadístico de prueba adecuado.
Pero también se puede estandarizar esta variable, y obtener:
¯X–μσ√ n ∼N(0,1)
Cualquiera de los dos sirve.
(Son básicamente el mismo. En un caso está estandarizada la variable normal y en el otro no está
estandarizada).
Vamos a usar los dos para poder explicar cómo se hace con ambos.
Pero no es necesario que usen los dos.
Paso 4: Seleccionar un nivel de significación
El enunciado determina que:
α=0,01
Paso 5: Determinar la zona de rechazo y la regla de decisión
Cómo la hipótesis alternativa afirma que μμ es menor que un cierto valor, entonces decimos que la
prueba es unilateral izquierda: la zona de rechazo queda ubicada a la izquierda.
La distribución de ambos estadísticos es normal.
Así que el diagrama con la distribución del estadístico y la zona de rechazo a izquierda es así:
Pero ahora queremos determinar exactamente cuál es la región de rechazo. ¿Cuál es el valor de la
abscisa que define la región de rechazo?
Si usamos el estadístico de prueba ¯X–μσ√ n ∼N(0,1) el diagrama con la zona de rechazo unilateral
izquierda y el nivel de significación sería así:
¿Cuál es el valor de la variable normal estándar que acumula una probabilidad de 0,010,01 a su
izquierda?
z0,01=–2,33z0,01=–2,33
(Eso se busca en la tabla de la normal estándar o usando software)
Entonces la regla de decisión es:
•
•
Rechazo H0H0 si ep≤–2,33
No rechazo H0H0 si ep>–2,33
Si quisiéramos usar el otro estadístico de prueba posible ¯X∼N(800,120√ 50 ≅16,97), la lógica es
exactamente la misma:
Pero ¿cómo averiguamos el valor crítico ¯XCX¯C que acumula una probabilidad de 0,01 a su izquierda?
-Opción 1: usando software cómo Probability Distributions (para Android) o GeoGebra (para
Windows).
-Opción 2: usando la tabla de probabilidad normal estándar. En general en un examen no se permite
usar software. Así que no nos queda otra que esta opción. Veamos cómo es.
Si ¯XC es aquel valor que acumula una probabilidad de 0,01 a su izquierda, entonces al estandarizarlo
obtendremos z0,01=–2,33z:
–2,33=¯XC–800120√ 50 –2,33=X¯C–80012050
De acá podemos despejar ¯XC:
⇒¯XC=–2,33.120√ 50 +800≅760,46
Obtenemos que el valor crítico es ¯XC=760,46X¯C=760,46. Luego la regla de decisión es:
•
Rechazo H0H0 si ¯X≤760,46X¯≤760,46.
•
No rechazo H0H0 si ¯X>760,46.
Paso 6: Calcular el valor observado del estadístico de prueba
Usando el estadístico de prueba ¯XX¯:
El valor observado ¯X=750pertenece a la zona de rechazo (–∞;760,46)
Si usamos el estadístico estandarizado tenemos que realizar el siguiente cálculo:
ep,obs=750–800120√ 50 ≅–2,95
También ocurre que el valor observado (–2,95) pertenece a la zona de rechazo (–∞;–2,33).
Paso 7: Obtener la conclusión
Decidimos rechazar la hipótesis nula.
La conclusión podría ser:
“Con un nivel de significación del 1% hay evidencias suficientes para afirmar que la media de la duración
de las bombillas es inferior a 800 horas.”
Referencia:
https://probafacil.com/prueba-de-hipotesis-sobre-la-media-poblacional/
2.-
Referencia : https://www.ugr.es/~mvargas/Infe2.pdf
Prueba de hipotesis para la diferencia de dos medias con sigmas conocidas
1.
Ejemplo 1:
Para tomar una importante decisión a nivel profesional se desea determinar si existen diferencias
significativas fundamentadas entre dos empresas referentes al salario de sus empleados. Se realiza
una investigación revisando el salario de 60 trabajadores de la empresa A y 70 de la empresa B.
Se obtiene un salario medio de 30000 euros anuales con una desviación típica de 1000 euros en
el primer grupo y un salario medio de 25000 euros anuales con una desviación típica de 1500 en
el segundo grupo. ¿Podríamos decidir a favor de alguna de las dos empresas con un nivel de
significación del 1 % ?
1. Se formula la hipótesis nula H0 y la hipótesis alternativa H1.
Hipótesis
nula
:
H0 :
μx μy =
0
Hipótesis
alternativa
:
H1 :
μx μy ≠
0
En este caso tenemos un contraste bilateral, ya que nuestra hipótesis nula se encuentra
formulada en forma de igualdad.
2. Identificamos la distribución de probabilidad y el tamaño de la muestra.
Tenemos una distribución de la diferencia de las medias, con μ1 - μ2 = 5000, un tamaño de
muestra en A de n = 60 y en B de n = 70. La distribución de las medias se distribuye :
3. Construimos las regiones de aceptación y rechazo.
4. Calcular el estadistíco de contraste y verificar la hipótesis.
El estadístico de contraste que emplearemos será la diferencia de las medias de las muestras,
μ1 μ2 =
30000
25000
=
5000.
5000 ∉ ( -569,99 ; 569,99 ) ⇒ Nuestro estadístico de contraste no pertenece a nuestra región
de aceptación.
5. Interpretación de la decisión.
Dado que nuestro estadístico de contraste no pertenece a la región de aceptación, rechazamos
la
hipótesis
nula.
Consideramos por tanto que existen diferencias significativas y hay diferencias entre las dos
empresas.
Referencia: https://calculo.cc/temas/temas_estadistica/hipotesis/teoria/hipo_dif_medias.html
2.Se quieren probar dos tipos de alimentos para los 75 pingüinos de un zoológico cuyo peso se
distribuye normalmente. Se separan en dos grupos, uno formado por 40 pingüinos y otro
por 35. Al cabo de un mes son pesados, y se obtiene para el primer grupo un peso medio de 13
kg y desviación típica de 0,7 y para el segundo grupo, un peso medio de 11 kg y desviación
típica
0,3.
¿Se puede afirmar, con el nivel de confianza del 99 %, que están mejor alimentados los del primer
grupo que los del segundo?
1. Se formula la hipótesis nula H0 y la hipótesis alternativa H1.
Hipótesis
nula
:
H0 :
μx μy >
0
Hipótesis
alternativa
:
H1 :
μx μy ≤
0
En este caso tenemos un contraste unilateral, ya que nuestra hipótesis nula se encuentra
formulada en forma de igualdad.
2. Identificamos la distribución de probabilidad y el tamaño de la muestra.
Tenemos una distribución de la diferencia de las medias, con μ1 - μ2 = 2, un tamaño de
muestra n = 40 en el primer grupo y n = 35 en el segundo grupo. La distribución de las
medias
se
distribuye
:
3. Construimos las regiones de aceptación y rechazo.
4. Calcular el estadistíco de contraste y verificar la hipótesis.
El estadístico de contraste que emplearemos será la diferencia de las medias de las muestras,
μ1 μ2 =
13
11
=
2.
2 ∈ ( -2,208 ; +∞ ) ⇒ Nuestro estadístico de contraste sí pertenece a nuestra región de
aceptación.
5. Interpretación de la decisión.
Dado que nuestro estadístico de contraste sí pertenece a la región de aceptación, aceptamos
la
hipótesis
nula.
Consideramos por tanto que los pingüinos del primer grupo están mejor alimentados que los
del segundo.
Referencia: https://calculo.cc/temas/temas_estadistica/hipotesis/teoria/hipo_dif_medias.html
3.-Prueba de hipotesis para una media desconocida
X=17
Referencia:
https://es.slideshare.net/chcluz/tarea-10-prueba-de-hipotesis-con-desconocida
Referencia:
https://es.slideshare.net/chcluz/tarea-10-prueba-de-hipotesis-con-desconocida
4.-Prueba de hipotesis para la diferenciacion de dos medias con sigmas desconocidos pero iguales.
1. Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en cemento
estándar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el
mecanismo de hidratación del cemento queda bloqueado y esto permite que el agua ataque
varias partes de una estructura de cemento. Al tomar diez muestras de cemento estándar, se
encontró que el peso promedio de calcio es de 90 con una desviación estándar de 5; los
resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en
promedio con una desviación estándar de 4. Supóngase que el porcentaje de peso de calcio
está distribuido de manera normal. Encuéntrese un intervalo de confianza del 95% para la
diferencia entre medias de los dos tipos de cementos. Por otra parte, supóngase que las dos
poblaciones normales tienen la misma desviación estándar.
Solución:
El estimador combinado de la desviación estándar es:
Al calcularle raíz cuadrada a este valor nos queda que sp = 4.41
expresión que se reduce a � 0.72
1-
2
6.72
Nótese que el intervalo de confianza del 95% incluye al cero; por consiguiente, para este nivel
confianza, no puede concluirse la existencia de una diferencia entre las medias.
Referencia:
https://virtual.uptc.edu.co/ova/estadistica/docs/libros/estadistica1/cap03d.html
1. Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano
para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada
medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente.
Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en
minutos que tardó en alcanzar un nivel específico en la sangre. Calcule un intervalo de
confianza del 95% para la diferencia del tiempo promedio. Suponga varianzas iguales.
Solución:
Medicamento A
Medicamento B
nA = 12
nB = 12
SA2= 15.57
SB2 = 17.54
2.35
B-
A
9.25
Con un nivel confianza del 95% se sabe que el tiempo promedio para alcanzar un nivel específico es
mayor para el medicamento B.
Referencia:
Descargar