Subido por jhonnatan lozano

ESTADISTICA DESCRIPTIVA TALLER

Anuncio
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 1 (Ref: Pág. 223 - Ej. 5)
Una máquina de refrescos se ajusta para que la cantidad de bebida que sirve promedie 240 mililitros
con una desviación estándar de 15mililitros. La máquina se verifica periódicamente tomando una
muestra de 40 bebidas y se calcula el contenido promedio. Si la media de las 40 bebidas es un valor
dentro del intervalo μ x ± 2σ x , se piensa que la máquina opera satisfactoriamente, de otra forma, se
ajusta. En la sección 8.4, el funcionario de la compañía encuentra que la media de 40 bebidas es x =
236 mililitros y concluye que la máquina no necesita un ajuste ¿Esta fue una decisión razonable?
Datos:
Variable aleatoria
Tamaño de la muestra
Desviación estándar poblacional
Media poblacional
Media muestral
Desviación estándar muestral
X: cantidad de bebida que sirve una máquina (en mililitros).
n = 40 bebidas.
σx = 15 mililitros.
μx = 240 mililitros.
x = μ x = 240 mililitros.
σ
σ x = x ≃2.3717 mililitros.
n
Incógnita:
μ x − 2σ x ≤ x ≤ μ x + 2σ x
Solución:
Reemplazando con nuestros datos
240 ml. – (2)(2.372 ml.) ≤ x ≤ 240 ml. + (2)(2.372 ml.)
240 ml. – 4.744 ml. ≤ x ≤ 240 ml. + 4.744 ml.
235.257 ml. ≤ x ≤ 244.743 ml.
Respuesta:
Esta fue una decisión razonable puesto que 236 ml., que es la media encontrada se encuentra dentro del
intervalo definido.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 1 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 2 (Ref: Pág. 223 - Ej. 9)
La vida media de una máquina para hacer pasta es de siete años, con una desviación estándar de un
año. Suponga que las vidas de estas máquinas siguen aproximadamente una distribución normal,
encuentre:
a) La probabilidad de que la vida media de una muestra aleatoria de nueve de estas máquinas caiga
entre 6.4 y 7.2 años;
b) El valor de x a la derecha del cual caería el 15% de las medias calculadas de muestras aleatorias de
tamaño nueve.
Datos:
Variable aleatoria
Media poblacional
Desviación estándar poblacional
Tamaño de la muestra
X: vida útil de una máquina de hacer pasta (en años).
μx = 7 años.
σx = 1 año.
n = 9 máquinas.
X ~ N( μ x , σ x ) ⇒ μ x = μ x = 7 (años)
σ
1
1
σx = x =
= (años )
n
9 3
a) Incógnita:
P(6.4 ≤ x ≤ 7.2)
Solución:


 6.4 − 7 X − μx 7.2 − 7 
P
≤
≤
 = P( −1.8 ≤ z ≤ 0.6 ) = P( z ≤ 0.6 ) − P( z ≤ −1.8) =⇒
σx
1
 13
3 
n


Aplicando Tabla A.3. = 0.7257 – 0.0359 = 0.6898 = 68.98%.
Respuesta:
La probabilidad de que la vida media de una muestra de 9 de esas máquinas caiga entre 6.4 años y 7.2 años es
del 68.98%.
b) Incógnita:
Un valor de x que deje a su derecha un área del 15% y por lo tanto un área del 85% a su izquierda.
Solución:
Con µx = 7 años y α = 1 − 0.15 = 0.85
_
_
Zα = Z 0.85 = 1.04 ⇒ Z 0.85
_
x −7
1

=
⇒ (1.04) *  + 7 = x = 7.346667 Años
1
3

3
x = 7.35 años
Lafata Desio Fernando, Warlet Iván Lautaro
Página 2 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Respuesta:
El valor de x que deja a su derecha un área del 15% es 7.35 años.
Problema 3 (Ref: Pág. 223/224 - Ej. 10)
El tiempo que el cajero de un banco con servicio en el automóvil atiende a un cliente es una variable
aleatoria con media μ = 3.2 minutos y una desviación estándar σ = 1.6 minutos. Si se observa una
muestra aleatoria de 64 clientes, encuentre la probabilidad de que su tiempo medio con el cajero sea:
a) a lo más 2.7 minutos;
b) más de 3.5 minutos;
c) al menos 3.2 minutos pero menos de 3.4 minutos.
Datos:
Variable aleatoria
Media poblacional
Desviación estándar poblacional
Tamaño de la muestra
X: tiempo que un cajero atiende a un cliente (en minutos).
μx = 3.2 minutos.
σx = 1.6 minutos.
n = 64 clientes.
X ~ N( μ x , σ x ) ⇒ μ x = μ x = 3.2 (años)
σx =
σx
n
=
1.6
64
=
1 .6
(años )
8
a) Incógnita:
P( x ≤ 2.7)
Solución:


 X − μx
2.7 − 3.2 
P
≤
 = P( z ≤ −2.5) = Aplicando Tabla A.3. = 0.0062 = 0.62%
1.6
 σx
8 
n


Respuesta:
La probabilidad de que el tiempo promedio de los cliente con el cajero sea a lo más 2.7 minutos es de 0.62%.
b) Incógnita:
P( x > 3.5)
Solución:


 X − μx 3.5 − 3.2 
P
>
 = P( z >1.5) =1 − P( z ≤ .5) =1 − 0.9332 = Aplicando Tabla A.3. = 0.0668 =
1.6
 σx

n
64 

6.68%.
Respuesta:
La probabilidad de que el tiempo promedio de los cliente con el cajero sea más 3.5 minutos es de 6.68%.
c) Incógnita:
P(3.2 ≤ x ≤ 3.4)
Solución:


 3.2 − 3.2 X − μx 3.4 − 3.2 
P
≤
≤
 = P( 0 ≤ z ≤ 1) = P( z ≤ 1) − P( z ≤ 0 ) =⇒
σx
1.6
 1.6

64
n
64 

Aplicando Tabla A.3 = 0.8413 – 0.5000 = 0.3413 = 34.13%.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 3 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Respuesta:
La probabilidad de que el tiempo promedio de los cliente con el cajero este entre 3.2 y 3.4 minutos es de
34.13%.
Problema 4 (Ref: Pág. 224 - Ej. 12)
Se toma una muestra aleatoria de tamaño 25 de una población normal que tiene una media de 80 y una
desviación estándar de 5. Una segunda muestra aleatoria de tamaño 36 se toma de una población
normal diferente que tiene una media de 75 y una desviación estándar de 3. Encuentre la probabilidad
de que la media muestral calculada de las 25 mediciones exceda de media muestral calculada de las 36
mediciones por al menos 3.4 pero en menos de 5.9. Suponga que las medias se miden al décimo más
cercano.
Datos:
Tamaño de la primer muestra
n1 = 25.
Media de la primer población
μ1= 80.
Desviación estándar de la primer población
σ1 = 5.
Tamaño de la segunda muestra
n2 = 36.
Media de la segunda población
μ2= 75.
(
)
X 1 ~ N μ x1 , σ x1 ⇒ μ x1 = μ x1 = 80
σ x1 =
(
σx
1
n1
=
5
25
=1
)
X 2 ~ N μ x 2 , σ x 2 ⇒ μ x 2 = μ x 2 = 75
σ x2 =
Desviación estándar de la segunda población σ2 = 3.
σx
2
n2
=
3
36
=
1
2
Incógnita:
P( 3.4 ≤ ( X1 − X 2 ) ≤ 5.9 )
Solución:
Utilizando el Teorema 8.3; el que dice:
Si se extraen al azar muestras independientes de tamaño n 1 y n 2 de dos poblaciones, discreta o continuas,
con medias μ 1 y μ 2 y varianzas σ 12 y σ 22 , respectivamente, entonces la distribución muestral de las
diferencias de las medias, X 1 − X 2 , está distribuida aproximadamente de forma normal con media y
varianza dadas por
μ x1 - x1 = μ 1 − μ 2
σ 2x1 - x 2 =
y
σ 12 σ 22
+
.
n1 n 2
De aquí
Z=
(X − X ) − (μ
(σ n ) + (σ
1
2
1
2
1
1
2
2
− μ2 )
n2 )
es aproximadamente una variable normal estándar.
con nuestros datos:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 4 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
μ x1 - x 2 = 80 – 75 = 5
σ x1 - x 2 =
y
25
9
+
= 1.118
25 36






 3.4 −5
X −X
− μ −μ
5.9 −5 
1
2
1
2
 =P(−1.4311 ≤z ≤0.8050 ) =
P 3.4 ≤ X1 −X 2 ≤5.9 =P
≤
≤
1.118034 
1.118034
σ 2
 σ 2

 1
  2



+

n 
n 



 



1
2


 



(
(
)
)
(
) (
)
= P(z ≤ 0.8050) − P( z ≤ −1.4311) =⇒Aplicando Tabla A.3. = 0.7896 – 0.0762 = 0.7134 = 71.34%.
Respuesta:
La probabilidad de que la media muestral calculada de las 25 mediciones exceda de media muestral calculada
de las 36 mediciones por al menos 3.4 pero en menos de 5.9 es de 71.34%.
Problema 5 (Ref: Pág. 236 - Ej. 1)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 5 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Para una distribución ji cuadrada encuentre.
2
a) χ 0.025
cuando υ = 15;
2
b) χ 0.01
cuando υ = 7;
2
c) χ 0.05
cuando υ = 24.
2
a) Según Tabla A.5 χ 0.025
cuando υ = 15 => 27.488
Respuesta:
El valor χ2 con 15 grados de libertad, que deja un área de 0.025 a su derecha es 27.488.
Gráfica:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 6 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
2
b) Según Tabla A.5 χ 0.01
cuando υ = 7 => 18.475
Respuesta:
El valor χ2 con 7 grados de libertad, que deja un área de 0.01 a su derecha es 18.475.
Gráfica:
2
c) Según Tabla A.5 χ 0.05
cuando υ = 24 => 36.415
Lafata Desio Fernando, Warlet Iván Lautaro
Página 7 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Respuesta:
El valor χ2 con 24 grados de libertad, que deja un área de 0.05 a su derecha es 36.415.
Gráfica:
Problema 6 (Ref: Pág. 236 - Ej. 3)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 8 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Para una distribución ji cuadrada encuentre χ α2 tal que:
a) P(χ2 > χ α2 ) = 0.99 cuando υ = 4;
b) P(χ2 > χ α2 ) = 0.025 cuando υ = 19;
c) P(37.652 < χ2 < χ α2 ) = 0.045 cuando υ = 25.
a) P(χ2 > χ α2 ) = 0.99 cuando υ = 4
Según Tabla A.5 => χ α2 = 0.297
Respuesta:
El valor de χ2 que deja a su derecha una probabilidad igual a 0.99 es decir 99 %, con 4 grados de libertad es
0.297.
b) P(χ2 > χ α2 ) = 0.025 cuando υ = 19
Lafata Desio Fernando, Warlet Iván Lautaro
Página 9 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Según Tabla A.5 => χ α2 = 32.852
Respuesta:
El valor de χ2 que deja a su derecha una probabilidad igual a 0.025 es decir 2.5 %, con 19 grados de libertad
es 32.852.
Gráfica:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 10 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
c) P(37.652 < χ2 < χ α2 ) = 0.045 cuando υ = 25
=> χ α2 = 37.652 => α = 0.05
2
=> α = 0.05 - 0.045 = 0.005 => χ α2 = χ 0.005 cuando υ = 25
2
Según Tabla A. 5 => χ 0.005 = 46.928
Respuesta:
El valor de χ2 debe ser igual a 46.928 para que la probabilidad entre 37.652 y dicho valor calculado sea igual a
0.045, es decir 4.5%, con 25 grados de libertad.
Gráfica:
Problema 7 (Ref: Pág. 236 – Ej. 5)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 11 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal
con varianza σ2 = 6, tenga una varianza s2
a) mayor que 9.1;
b) entre 3.462 y 10.745.
Suponga que las varianzas muestrales son mediciones continuas.
Datos:
Tamaño de la muestra
Varianza de la muestra
n = 25 observaciones.
σ2 = 6.
a) Incógnita:
P (s2 > 9.1)
Solución:
χ
2
(
n − 1) s 2
=
σ2
con (n – 1) grados de libertad
con nuestros datos:
( 25 − 1)( 9.1) = ( 24)( 9.1) = 218.4 = 36.4
χ2 =
6
6
6
Según Tabla A.5 χ 2 = 36.4 cuando υ = 24 =>0.05
Respuesta:
La probabilidad de que la varianza de esa muestra sea mayor que 9.1 es del 5%.
b) Incógnita:
P (3.462 ≤ s2 ≤ 10.745)
Solución:
χ2 =
( n − 1)s 2
σ2
con (n – 1) grados de libertad
con nuestros datos:
( 25 − 1)( 3.462) = 24 × 3.462 = 83.088 = 13.848
χ2 =
6
6
6
2
χ
=
13
.
848
Según Tabla A.5
cuando υ = 24 =>0.95
χ2 =
( 25 − 1) ×10.745 = 24 ×10.745 = 257.88 = 42.98
6
6
6
Según Tabla A.5 χ 2 = 42.98 cuando υ = 24 =>0.01
P (3.462 ≤ s2 ≤ 10.745) = 0.95 – 0.01 = 0.94
Respuesta:
La probabilidad de que la varianza de esa muestra se encuentre entre 3.462 y 10.745 es del 94%.
Problema 8 (Ref: Pág. 236 – Ej. 6)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 12 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Las clasificaciones de un examen de colocación que se aplicó a estudiantes de primer año de
licenciatura durante los últimos cinco años están aproximadamente distribuidas de forma normal con
una media μ = 74 y una varianza σ2 = 8. ¿Consideraría aún que σ2 =8 es un valor válido de la varianza
si una muestra aleatoria de 20 estudiantes que realizan este examen de colocación este año obtienen un
valor de s2 = 20?
Datos:
P: estudiantes de primer año de licenciatura.
X: calificación de un examen de colocación.
Media poblacional
Varianza poblacional
Tamaño de la muestra
Varianza muestral
μx = 74.
σ 2x = 8.
n = 20 estudiantes.
s2 = 20.
(
X ~ N μ x = 74, σ x = 8
)
Incógnita:
Considerar si es válida σ 2x = 8
Solución:
χ2 =
( n − 1)s 2
σ2
con (n – 1) grados de libertad
con nuestros datos
χ2 =
( 20 − 1)( 20) = (19)( 20) = 380 = 47.5
8
2
χ 0..975
= 8.907
8
8
2
χ 0.025
= 32.852
Respuesta:
Es un valor de una distribución ji cuadrada con 19 grados de libertad.
Como 95% de los valores χ2 con 19 grados de libertad caen entre 8.907 y 32.852, el valor calculado con σ 2 = 8
no es razonable y por lo tanto se tiene razón suficiente para sospechar que la varianza es diferente a ocho.
Es muy probable que el valor supuesto de σ2 sea un error.
Problema 9 (Ref: Pág. 236 – Ej. 8)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 13 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
a) Encuentre t0.025 cuando υ =14;
b) Encuentre –t0.10 cuando υ = 10;
c) Encuentre t0.995 cuando υ =7.
a) Según Tabla A.4 t0.025 cuando υ =14 => 2.145
Respuesta:
El valor t con 14 grados de libertad, que deja un área de 0.025 a su derecha es 2.145.
Gráfica:
b) Según Tabla A.4 –t0.10 cuando υ = 10 => -1.372
Lafata Desio Fernando, Warlet Iván Lautaro
Página 14 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Respuesta:
El valor t con 10 grados de libertad, que deja un área de 0.10 a su izquierda es -1.372.
Gráfica:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 15 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
c) Según Tabla A.4 t0.995 cuando υ =7 => -3.499
Respuesta:
El valor t con 7 grados de libertad, que deja un área de 0.995 a su derecha y por lo tanto un área de 0.005 a su
izquierda es -3.499.
Gráfica:
Problema 10 (Ref: Pág. 236 – Ej. 9)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 16 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
a) Encuentre P(T < 2.365) cuando υ =7;
b) Encuentre P(T > 1.318) cuando υ = 24;
c) Encuentre P(-1.356 < T <2.179) cuando υ =12;
d) Encuentre P(T > -2.567) cuando υ =17.
a) P(T < 2.365) cuando υ =7
1 – P(T ≥ 2.365) cuando υ =7
Según Tabla A.4 =>
= 1 – 0.025 = 0.975
Respuesta:
La probabilidad de que un valor t sea menor que 2.365 con 7 grados de libertad es del 97.5%.
Gráfica:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 17 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
b) P(T > 1.318) cuando υ = 24
Según Tabla A.4 =>0.10
Respuesta:
La probabilidad de que un valor t sea mayor que 1.318 con 24 grados de libertad es del 10%.
Gráfica:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 18 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
c) P(-1.356 < T < 2.179) cuando υ =12
P(T ≥ -1.356) – P(T ≥ 2.179) cuando υ =12
Según Tabla A.4 =>
= (1 – 0.10) – 0.025 =
= 0.90 – 0.025 = 0.875
Respuesta:
La probabilidad de que un valor t se encuentre entre -1.356 y 2.179 con 12 grados de libertad es del 87.5%.
Gráfica:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 19 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
d) P(T > -2.567) cuando υ =17
1 – P( T > 2.567) cuando υ =17
Según Tabla A.4 =>
= 1– 0.01 = 0.99
Respuesta:
La probabilidad de que un valor t sea mayor que -2.567 con 17 grados de libertad es del 99%.
Gráfica:
Problema 11 (Ref: Pág. 236 – Ej. 12)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 20 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Una empresa manufacturera afirma que las baterías que utiliza en sus juegos electrónicos duran un
promedio de 30 horas. Para mantener este promedio se prueban 16 baterías cada mes. Si el valor t que
se calcula cae entre –t0.025 y t0.025, la empresa queda satisfecha con su afirmación.¿Qué conclusiones
extraería la empresa de una muestra que tiene una media de x = 27.5 horas y una desviación estándar
de s = 5 horas? Suponga que la distribución de las duraciones de las baterías es aproximadamente
normal.
Datos:
P: baterías de juegos electrónicos.
X: rendimiento en horas de una bajaría de juegos electrónicos.
Media poblacional
μx = 30 horas.
Tamaño de la muestra
n = 16 baterías.
Media muestral
x = 27.5 horas.
Desviación estándar muestral
s = 5 horas.
Solución:
De la tabla A.4 encontramos que t0.025 = 2.131 para 15 grados de libertad. Por tanto, la empresa queda
satisfecha con esta afirmación si una muestra de 16 baterías rinde un valor t entre –2.131 y 2.131. si μ = 30,
entonces
T=
X −μ
con (n – 1) grados de libertad
s
n
Con nuestros datos:
T=
27.5 − 30
5
16
= −2 ,
Respuesta:
La empresa estaría satisfecha con su afirmación ya que el valor hallado de t pertenece al intervalo establecido
como parámetro para poder afirmar que sus baterías promedian las 30 horas de duración.
Problema 12 (Ref: Pág. 236 – Ej. 13)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 21 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Una población normal con varianza desconocida tiene una media de 20. ¿Se tiene posibilidad de
obtener una muestra aleatoria de tamaño 9 de esta población con una media de 24 y una desviación
estándar de 4.1? Si no, ¿qué conclusión sacaría?
Datos:
Media poblacional
Tamaño de la muestra
Media muestral
Desviación estándar muestral
μx = 20.
n = 9.
x = 24.
s = 4.1.
Solución:
T=
X −μ
con (n – 1) grados de libertad
s
n
con nuestros datos:
P (│ X - μ│=│ X - 20│ > 4) =
= 1 – P (│ X - 20│ ≤ 4) =
= 1 – P (-4 ≤ X - 20 ≤ 4) =


4 
 −4
≤ X − 20 ≤
=1–P 
=
4.1 
 4.1
3
3

= 1 – P (-2.92 ≤ t8 ≤ 2.92) =
= P (t8 ≤ 2.92) – P (t8 ≤ 2.92) = 0.00959 + 0.00959 = 0.01918 = 1.918%.
Respuesta:
Si se tiene la posibilidad de obtener una muestra de tamaño 9 con esas condiciones, con una probabilidad del
1.918%
Problema 13 (Ref: Pág. 236 – Ej. 14)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 22 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Un fabricante de cierta marca de barras de cereal bajo de grasa afirma que su contenido promedio de
grasa saturada es 0.5 gramos. En una muestra aleatoria de 8 barras de cereal de esta marca el
contenido de grasa saturada fue 0.6, 0.7, 0.7, 0.3, 0.4, 0.5, 0.4 y 0.2. ¿Estaría de acuerdo con la
afirmación?
Datos:
P: barras de cereal bajo de grasa.
X: contenido de grasa en gramos de una barra de cereal.
Media poblacional
μx = 0.5 gramos.
Tamaño de la muestra
n = 8.
n
Media muestral
x=
∑X
i
i =1
n
=
0.6 + 0.7 + 0.7 + 0.3 + 0.4 + 0.5 + 0.4 + 0.2 3.8
=
= 0.475 gramos
8
8
n
Desviación estándar muestral
i =1
i
− X)
2
n −1
( 0.6 −0.475) 2 +(0.7 −0.475) 2 +(0.7 −0.475) 2 +(0.3−0.475) 2 +(0.4 −0.475) 2 +(0.5 −0.475) 2 +(0.4 −0.475) 2 +(0.2 −0.475
s=
=
s=
∑ (X
7
( 0.125) 2 + ( 0.225) 2 + ( 0.225) 2 + ( − 0.175) 2 + ( − 0.075) 2 + ( 0.025) 2 + ( − 0.075) 2 + ( − 0.275) 2 =
7
0.26
=
7
Incógnita:
μx = 0.5
Solución:
T=
X −μ
con (n – 1) grados de libertad
s
n
con nuestros datos
T=
0.475 −0.5
= 0.3860
0.1832
8

 X −μ
X −μ0
P
≥
s
s

n
n

con nuestros datos





P(-0.3860 ≤ t7 ≤ 0.3860) = 0.3754 + 0.3754 = 0.7508 = 75.08%.
Respuesta:
Hay razones suficiente (75,08%) para considerar que la afirmación es cierta.
Problema 14 (Ref: Pág. 236 – Ej. 15)
Para una distribución F encuentre:
a) ƒ0.05 con υ1 = 7 y υ2 = 15;
Lafata Desio Fernando, Warlet Iván Lautaro
Página 23 de 104
0.037 ≈ 0.18
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
b) ƒ0.05 con υ1 = 15 y υ2 = 7;
c) ƒ0.01 con υ1 = 24 y υ2 = 19;
d) ƒ0.95 con υ1 = 19 y υ2 = 24;
e) ƒ0.99 con υ1 = 28 y υ2 = 12.
a) Según Tabla A.6 ƒ0.05 con υ1 = 7 y υ2 = 15 => 2.71
Respuesta:
El valor f con 7 y 15 grados de libertad, que deja un área de 0.05 a su derecha es 2.71.
Gráfica:
b) Según Tabla A.6 ƒ0.05 con υ1 = 15 y υ2 = 7 => 3.51
Lafata Desio Fernando, Warlet Iván Lautaro
Página 24 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Respuesta:
El valor f con 15 y 7 grados de libertad, que deja un área de 0.05 a su derecha es 3.51.
Gráfica:
c) Según Tabla A.6 ƒ0.01 con υ1 = 24 y υ2 = 19 => 2.92
Lafata Desio Fernando, Warlet Iván Lautaro
Página 25 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Respuesta:
El valor f con 24 y 19 grados de libertad, que deja un área de 0.01 a su derecha es 2.92.
Gráfica:
d) ƒ0.95 con υ1 = 19 y υ2 = 24
1
Lafata Desio Fernando, Warlet
Iván
fα (υ
υ1 )
2 , Lautaro
f 1−α ( υ1, υ2 ) =
Página 26 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
con nuestros datos
f 0.95 (19,24) =
1
1
=
= 0.4739
f 0.05 ( 24,19 ) 2.11
Respuesta:
El valor f con 19 y 24 grados de libertad, que deja un área de 0.95 a su derecha es 0.4739.
Gráfica:
e) ƒ0.99 con υ1 = 28 y υ2 = 12
Lafata Desio Fernando, Warlet Iván Lautaro
Página 27 de 104
Cátedra: Probabilidad y Estadística
UADER
f 1−α ( υ1, υ2 ) =
Trabajo Final
6 de Agosto de 2008
1
f α ( υ 2 , υ1 )
con nuestros datos
f 0.99 ( 28,12 ) =
1
1
=
= 0.3448
f 0.01 (12,28) 2.90
Respuesta:
El valor f con 28 y 12 grados de libertad, que deja un área de 0.99 a su derecha es 0.3448.
Gráfica:
Problema 15 (Ref: Pág. 237 – Ej. 5)
Una muestra aleatoria de cinco presidentes de bancos indican salarios anuales de $163000, $148000,
$152000, $135000 y $141000. Encuentre la varianza de este conjunto.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 28 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Datos:
Variable aleatoria
Tamaño de la muestra
X: salarios anuales de presidentes de bancos (en pesos)
n = 5 presidentes.
n
Media muestral
x=
∑X
i
i =1
n
163000 + 148000 + 152000 + 135000 + 141000 739000
=
=
= 147800 $
5
5
Incógnita:
Varianza muestral s2
Solución:
∑(X
n
s2 =
i =1
i
−X
)
2
n −1
con nuestros datos
s2 =
=
(163000 − 147800) 2 + (148000 − 147800) 2 + (152000 − 147800) 2 + (135000 − 147800) 2 + (141000 − 147800) 2
(15200 ) 2 + ( 200) 2 + ( 4200) 2 + ( − 12800) 2 + ( − 6800) 2
4
4
458800000
=
= 114700000 $
4
Respuesta:
La varianza de este conjunto es 114700000 $.
Problema 16 (Ref: Pág. 237 – Ej. 9)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 29 de 104
=
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Si S21 y S22 representan las varianzas de muestras aleatorias independientes de tamaño n 1 = 25 y n2 =
31, tomadas de poblaciones normales con varianzas σ21 = 10 y σ22 = 15, respectivamente, encuentre
P S 12 S 22 > 1.26 .
(
)
Datos:
Tamaño de la primer muestra
Tamaño de la segunda muestra
Varianza de la primera muestra
n1 = 25.
n2 = 31.
Varianza de la segunda muestra
σ 22 = 15 .
Incógnita:
(
P S12 S 22 > 1.26
σ12 =10 .
)
Solución:
Utilizando el Teorema 8.8; el que dice:
Si s12 y s 22 son las varianzas de muestras aleatorias independientes de tamaño n 1 y n 2 tomadas de
poblaciones normales con varianzas σ 12 y σ 22 , respectivamente, entonces
s12 σ 22 s12 σ 22
F= 2 2 = 2 2
σ1 s 2 s 2 σ 1
Tiene una distribución F con υ1 = n1 – 1 y υ2 = n2 – 1 grados de libertad.
con nuestros datos
 s12

P =  2 > 1.26  =
 s2

 s12

 2

σ
(
)
(
)
15
*
1
.
26
1
 = P( F > 1.89) ≅ 0.05 = 5%.
P 2 >
 s2
10 
 σ2

 2

F0.05(24, 30) = 1.89
Respuesta:
La probabilidad de que F con 24 y 30 grados de libertad sea mayor que 1.26 es de 0.05, es decir, 5%.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 30 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 17 (Ref: Pág. 251 – Ej. 4)
Una empresa eléctrica fabrica focos que tienen una duración aproximadamente distribuida de forma
normal con una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una duración
promedio de 780 horas, encuentre un intervalo de confianza de 96 % para la media de la población de
todos los focos que produce esta empresa.
Datos:
P: focos fabricados por la empresa.
X: duración de esa muestra de focos.
Desviación estándar poblacional
σx = 40 horas.
Tamaño de la muestra
n = 30 focos.
Media muestral
x = 780 horas.
Intervalo de confianza
IC = 96%.
X ~ N( μ x = 780, σ x = 40)
Incógnita:
Intervalo de confianza para la media poblacional, μ x, con 96% de confianza.
Solución:
X − z 1−α
σ
2
n
≤ μ ≤ X + z 1−α
σ
2
n
100γ% =100(1-α)% = 96% =>α = 0.04 => z1−α 2 => z0.98 = 2.054
con nuestros datos
780 − ( 2.054 )
40
30
≤ μ x ≤ 780 + ( 2.054)
40
30
765 hs. ≤ μ x ≤ 795 hs.
Respuesta:
Podemos afirmar con un nivel de confianza del 96% que la media poblacional se encuentra entre 765 y 795
horas.
Problema 18 (Ref: Pág. 252 – Ej. 8)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 31 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
¿De que tamaño se necesita una muestra en el ejercicio 4 si deseamos tener 96% de confianza que
nuestra media muestral esté dentro de 10 horas de la media real?
Datos:
Desviación estándar poblacional σx = 40 horas.
Media muestral
x = 780 horas.
Intervalo de confianza
IC = 96%.
Intervalo de error
e = 10 horas.
n ∈Ζ+
2
 z 1−α 2 σ 

n ≥
 e



con nuestros datos
n ∈Ζ+
2
 2.054.40 
n ≥
 = 67.5 → n = 68
10


Respuesta:
Por lo tanto, podemos tener una confianza 96% de que una muestra aleatoria de tamaño 68 proporcionara una
estimación x que difiere de μ por una cantidad menor que 0.04.
Problema 19 (Ref: Pág. 252 – Ej. 6)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 32 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Las estaturas de una muestra aleatoria de 50 estudiantes universitarios muestra una media de 174.5
centímetros y una desviación estándar de 6.9 centímetros.
a) Construya un intervalo de confianza de 98% para la estatura media de todos los estudiantes de la
universidad;
b) ¿Qué podemos afirmar con 98% de confianza sobre el tamaño posible de nuestro error si estimamos
que la estatura media de todos los estudiantes de la universidad de 174.5 centímetros?.
Datos:
P: estudiantes universitarios.
Variable aleatoria
Tamaño de la muestra
Media muestral
Desviación estándar muestral
Intervalo de confianza
X: medidas de esos estudiantes universitarios (en centímetros)
n = 50 estudiantes.
x = 174.5 centímetros.
s = 6.9 centímetros.
IC = 98%.
100γ% =100(1-α)% = 98% =>α = 0.02 => α
2 = 0.01
t49, 0.01 = 2.4048
a) Incógnita:
Intervalo de confianza para la media poblacional, μ x, con 98% de confianza.
Solución:
X − tα 2
s
s
≤ μ ≤ X + tα 2
n
n
con nuestros datos
174.5 − ( 2.4048)
6.9
≤ µ ≤174.5 + ( 2.4048)
50
172.15 cm. ≤ μ ≤176.85 cm.
6.9
50
Respuesta:
Podemos afirmar con 98% de confianza que la media poblacional se encuentra entre 172.15 y 176.85
centímetros.
b) Incógnita:
Posible error de estimación.
Solución:
Ε= X - μ =174.5 −
172.15 =2.35
cm.
Respuesta:
Podemos afirmar con 98% de confianza que el error de estimación es igual a 2.35 cm.
Problema 20(Ref: Pág. 252 – Ej. 13)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 33 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de las piezas y los
diámetros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 centímetros. Encuentre un intervalo de
confianza de 99% para el diámetro medio de las piezas de esta máquina, suponga una distribución
aproximadamente normal.
Datos:
P: piezas metálicas de forma cilíndricas.
X: diámetro de las piezas cilíndricas(en centímetros).
Tamaño de la muestra
n = 9 piezas.
Intervalo de confianza
IC = 99%.
n
Media muestral
x=
∑X
i
i =1
=
n
1.01 + 0.97 + 1.03 + 1.04 + 0.99 + 0.98 + 0.99 + 1.01 + 1.03
= 1.0055
9
cm.
n
Desviación estándar muestral
s=
=
s=
∑ (X
i =1
i
− X)
2
n −1
(1.01 −1.0055) 2 + (0.97 −1.0055) 2 + (1.03 −1.0055) 2 + (1.04 −1.0055) 2 + (0.99 −1.0055) 2 + (0.98 −1.0055) 2 + (0
8
( 0.0045)2 + (0.0355)2 + ( 0.0245)2 + (0.0345)2 + ( 0.0155)2 + ( 0.0255)2 + (0.0155)2 + ( 0.0045)2 + ( 0.0245) 2
8
100γ% =100(1-α)% = 99% =>α = 0.01 => α
2 = 0.005
t8, 0.005 = 3.355
Incógnita:
Intervalo de confianza para la media poblacional, μ x, con 99% de confianza.
Solución:
X − tα 2
s
s
≤ μ ≤ X + tα 2
n
n
con nuestros datos
1.0055 − ( 3.355)
0.0245
0.0245
≤ μ ≤ 1.0055 + ( 3.355)
9
9
0.9781 cm. ≤ μ ≤1.0329 cm.
Respuesta:
Podemos afirmar con 99% de confianza que la media poblacional se encuentra entre 0.9781 y 1.0329
centímetros.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 34 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 21 (Ref: Pág. 252/253 – Ej. 17)
Una muestra aleatoria de 25 botellas de aspirinas contiene, en promedio, 325.05 mg. de aspirina con
una desviación estándar de 0.5. Encuentre los límites de tolerancia del 95% que contendrán 90% del
contenido de aspirina para esta marca. Suponga que el contenido de aspirina se distribuye
normalmente.
Datos:
P: botellas de aspirinas.
X: cantidad de aspirina que contienen las botellas de aspirina (en miligramos).
Tamaño de la muestra
n = 25 botellas de aspirina.
Media muestral
x = 325.05 mg. de aspirina.
Desviación estándar muestral
s = 0.5 mg. de aspirina.
1– γ = 95% => γ = 0.05 y 1– α = 90% => 0.9
Según Tabla A.7 => k = 2.208
Incógnita:
Limites de tolerancia del 95% que contendrán 90% de aspirina.
Solución:
x ± ks
con nuestros datos
325.05 ± 2.208.0.5 = [323.946 ; 326.154]mg.
Respuesta:
Los límites de tolerancia del 95% que contendrán 90% de aspirina para esta marca son 323.946 mg y 326.154
mg,
Lafata Desio Fernando, Warlet Iván Lautaro
Página 35 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 22 (Ref: Pág. 262 – Ej. 1)
Una muestra aleatoria de tamaño n1 = 25 que se toma de una población normal con una desviación
estándar σ1 = 5 tiene una media x 1 = 80. Una segunda muestra aleatoria de tamaño n2 = 36, que se
toma de una población normal diferente con una desviación estándar σ2 = 3, tiene una media x 2 = 75.
Encuentre un intervalo de confianza de 95% para μ1 - μ2.
Datos:
Tamaño de la primer muestra
Desviación estándar de la primer población
Media de la primer muestra
n1 = 25.
σ1 = 5.
x 1 = 80.
P1 ↔ X 1 ~ N μ x1 = 80, σ x1 = 5
Tamaño de la segunda muestra
n2 = 36.
Desviación estándar de la segunda población σ2 = 3.
x 2 = 75.
Media de la segunda muestra
P2 ↔ X 2 ~ N μ x 2 = 75, σ x 2 = 3
(
)
(
)
Intervalo de confianza
IC = 95% para μ1 − μ 2
100(1-α)% = 95% =>α = 0.05 => z1−α 2 => z0.025 = 1.96 Aplicando Tabla A.3
Incógnita:
Intervalo de confianza para la diferencia de las medias poblacionales, μ 1 – μ2, con 95% de confianza.
Solución:
μ x1 − x 2 = μ 1 − μ 2
σ x1 − x 2 =
y
σ12 σ 22
+
n1 n 2
con nuestro datos
μ x1 − x 2 = 80 − 75 = 5
( x1 − x 2 ) − z α
2
.
y
σ x 1 −x 2 =
25 9
+
=
25 36
5
= 1.25 ≅ 1.118
4
σ12 σ 22
σ2 σ2
+
< μ1 − μ 2 < ( x1 − x 2 ) + z α . 1 + 2
2
n1 n 2
n1 n 2
con nuestros datos
5 – 1.96 · 1.118 < μ1 – μ2 < 5 + 1.96 · 1.118
5 – 2.19 < μ1 – μ2 < 5 + 2.19
2.80 < μ1 – μ2 < 7.19
Respuesta:
Podemos afirmar con 95% de confianza que la diferencia entre las medias poblacionales se encuentra entre
2.80 y 7.19.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 36 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 23 (Ref: Pág. 263 – Ej. 9)
Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su flotilla
de taxis. Para estimar la diferencia de las dos marcas, se lleva cabo un experimento, utilizando 12 de
cada marca. Los neumáticos se utilizan hasta que se gastan. Los resultados son:
x 1 = 36300 kilómetros.
s1 = 5000 kilómetros.
x 2 = 38100 kilómetros.
s2 = 6100 kilómetros.
Marca A:
Marca B:
Calcule un intervalo de confianza de 95% para μ1 – μ2,suponga que las poblaciones se distribuyen de
forma aproximadamente normal. Puede no suponer que las varianzas son iguales.
Datos:
P1 : neumáticos de la marca A.
P2 : neumáticos de la marca B.
X1 : duración en kilómetros de un neumático de la marca A.
X2 : duración en kilómetros de un neumáticos de la marca B.
Tamaño de la primer muestra
n1 = 12 neumáticos.
Tamaño de la segunda muestra
n2 = 12 neumáticos.
x 1 = 36300 Km.
Media de la primer muestra
x 2 = 38100 Km.
Media de la segunda muestra
s 1 = 5000 Km.
Desviación estándar de la primer muestra
Desviación estándar de la segunda muestra s 2 = 6100 Km.
Intervalo de confianza
IC = 95%.
100(1-α) % = 95% =>α = 0.05 => t α 2 Aplicando Tabla A.4 t0.025 = 2.07892 con υ = 21.18 grados de libertad.
Incógnita:
Intervalo de confianza para la diferencia de las medias poblacionales, μ 1 – μ2, con 95% de confianza.
Solución:
( x1 − x 2 ) − t α
(s12
2
s12 s 22
s12 s 22
+
< μ1 − μ 2 < ( x1 − x 2 ) + t α
+
2 n1
n1 n 2
n2
)
donde t α 2 es el valor t con
2
n1 + s 2
n
( 25000000 12 + 37210000 12 ) 2 = ( 2083333.3 + 3100833.3) 2 = 21.18
2 2
υ=
=
2
2
( 25000000 12 ) 2 + ( 37210000 12 ) 2 ( 2083333.3) 2 + ( 3100833.3) 2
s12 n1
s2
n2
2
+
12 − 1
12 − 1
11
11
n1 − 1
n 2 −1
(
) (
)
con nuestros datos
( 36300 − 38100) − 2.078
25000000 37210000
25000000 37210000
+
< µ1 − µ 2 < ( 36300 − 38100 ) + 2.080
+
12
12
12
12
( − 1800) − ( 2.080)( 2276.87 ) < µ1 − µ 2 < ( − 1800) + ( 2.080)( 2276.87 )
− 6533.4 < µ1 − µ 2 < 2933.4
Respuesta:
Podemos afirmar con 95% de confianza que la diferencia entre las medias poblacionales se encuentra entre
–6533.4 y 2933.4.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 37 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 24 (Ref: Pág. 263 Ej. 7)
Los siguientes datos, registrados en días, representan el tiempo de recuperación para pacientes que se
tratan al azar con uno de dos medicamentos para curar infecciones graves en la vejiga:
Medicamento 1
n1 = 14
x 1 = 17
Medicamento 2
n 2 = 16
x 2 = 19
s 12 = 1.5
s 22 = 1.8
Encuentre un intervalo de confianza de 99% para la diferencia μ2 – μ1 en el tiempo promedio de
recuperación para los dos medicamentos, suponga poblaciones normales con varianzas iguales.
Datos:
P1 : pacientes que se tratan con el medicamento 1.
X 1 : tiempo de recuperación en días para un paciente tratado con el medicamento 1.
Tamaño de la primer muestra
n1 = 14 días.
x 1 = 17 días.
Primer media muestral
s 12 = 1.5 días.
Primer varianza muestral
P2 : pacientes que se tratan con el medicamento 2.
X 2 : tiempo de recuperación en días para un paciente tratado con el medicamento 2.
Tamaño de la segunda muestra
n2 = 16 días.
x 2 = 19 días.
Segunda media muestral
Segunda varianza muestral
s 22 = 1.8 días.
Intervalo de confianza
IC = 99% para μ 2 − μ1 .
100(1-α)% = 99% =>α = 0.01 => t α 2 Aplicando Tabla A.4 t0.005 = 2.763 con (n1 + n2 – 2) = 28 grados de
libertad.
Incógnita:
Intervalo de confianza para la diferencia de las medias poblacionales, μ 2 − μ1 , con 99% de confianza.
Solución:
μ x 2 − x1 = μ 2 − μ 1
σ x 2 − x1 =
y
1
1
+
n 2 n1
con nuestros datos
μ x 2 −x1 = 19 − 17 = 2
s 2p =
y
σ x 2 − x1 =
1
1
+
= 0,1339 ≅ 0.3659
14 16
( n 1 − 1) * ( s12 ) + ( n 2 − 1) * ( s 22 )
n1 + n 2 − 2
con nuestros datos
Lafata Desio Fernando, Warlet Iván Lautaro
Página 38 de 104
Cátedra: Probabilidad y Estadística
UADER
s 2p =
(14 −1) * (1.5) + (16 −1) * (1.8)
14 +16 − 2
Trabajo Final
6 de Agosto de 2008
= 1.6607 ⇒ s p ≅ 1.2886
luego,
( x 2 − x1 ) − t α
2
sp
1
1
1
1
+
< μ 2 - μ1 < ( x 2 − x1 ) + t α s p
+
2
n 2 n1
n 2 n1
con nuestros datos
2 – (2.763)*(1.2886)*(0.3659) < μ 2 - μ1 < 2 + (2.763)*(1.1886)*(0.3659)
2 – 1.30 < μ 2 - μ1 < 2 + 1.30
0.70 < μ 2 - μ1 < 3.30
Respuesta:
Podemos afirmar con 99% de confianza que la diferencia entre las medias ( μ 2 - μ1 ) poblacionales se
encuentra entre 0.70 y 3.30.
Problema 25 (Ref: Pág. 270 - Ej. 1)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 39 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
a) Se selecciona una muestra aleatoria de 200 votantes y se encuentra que 114 apoyan un convenio de
anexión. Encuentre un intervalo de confianza de 96% para la fracción de la población votante que
favorece el convenio.
b) ¿Qué podemos asegurar con 96% de confianza acerca de la posible magnitud de nuestro error si
estimamos que la fracción de votantes que favorecen la anexión es 0.57?
Datos:
Tamaño de la muestra
Números de éxitos
Intervalo de confianza
Proporción de éxitos en una muestra
n = 200 votantes.
x = 114 votantes.
IC = 96% para p: proporción de votante que favorecen el convenio.
x 114
p̂ = =
= 0.57 .
n 200
Proporción de fracasos en una muestra q̂ =1 −p̂ =1 −0.57 =0.43
100γ = 100(1 - α)% = 96% =>α =0.04 => z1−α 2 => z0.98 ≅ 2.054
a) Incógnita:
Intervalo de confianza de 96% para la fracción de la población que favorece el convenio.
Solución:
p̂ * q̂
=
n
p̂ − z α *
2
( 0.57 ) * ( 0.43)
200
=
0.2451
= 0,0012255 ≅ 0.035
200
p̂ * q̂
p̂ * q̂
< p < p̂ + z α *
2
n
n
con nuestros datos
0.57 – (2.054)*(0.035) < p < 0.57 + (2.054)*(0.035)
0.57 – 0.07189 < p < 0.57 + 0.07189
0.49811 < p < 0.64189
Respuesta:
Podemos afirmar con 96% de confianza que la fracción que favorece el convenio se encuentra entre 0.49811
y 0.64189, es decir, 49.81% y 64.19% respectivamente.
b) Incógnita:
Posible error de estimación.
Solución:
Ε = p̂ - p = 0.57 −0.49811 ≤0.72 =7.2%
Respuesta:
Podemos afirmar con 96% de confianza que le error de estimación no superará el 7.2 %.
Problema 26 (Ref: Pág. 270 - Ej. 9)
¿ Que tan grande se requiere que sea la muestra si deseamos tener una confianza de 96% de que
nuestra proporción de la muestra estará dentro del 0.02 de la fracción real de la población votante?.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 40 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Datos:
Sabemos que:
p̂ ≅ 0.57
q̂
≅ 0.43
Y que
Incógnita:
n =? tal que p( p̂ - p ≤0.02 ) =0.96
Solución:
Con
Intervalo de error
n=
e = 0.02.
z α2 2 p̂q̂
e2
con nuestros datos
n=
( 2.054) 2 ( 0.57 )( 0.43)
( 0.02) 2
=
1.030
≅ 2575 votantes
0.0004
Respuesta:
Si basamos nuestra estimación de p sobre una muestra aleatoria de tamaño 2575, podemos tener una
confianza de 96% de que nuestra proporción muestral no diferirá de la proporción real por más de 0.02.
Problema 27 (Ref: Pág. 271 – Ej. 15)
Cierto genetista se interesa en la proporción de hombres y mujeres en la población que tienen cierto
trastorno sanguíneo menor. En una muestra aleatoria de 1000 hombres se encuentra que 250 lo
padecen, mientras que 275 de 1000 mujeres examinadas parecen tener el trastorno. Calcule un
Lafata Desio Fernando, Warlet Iván Lautaro
Página 41 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
intervalo de confianza de 95% para la diferencia entre la proporción de hombres y mujeres que
padecen el trastorno sanguíneo.
Datos:
P1 : hombres
P2 : mujeres
p1 : proporción de hombres que tienen cierto trastorno sanguíneo menor.
p2 : proporción de mujeres que tienen cierto trastorno sanguíneo menor.
Tamaño de la primer muestra
n1 = 1000 hombres.
Tamaño de la segunda muestra
n2 = 1000 mujeres.
Número de éxitos de la primer muestra
x1 = 250.
Número de éxitos de la segunda muestra
x2 = 275.
x
250
p̂1 = =
= 0.25
Proporción de éxitos de la primer muestra
n 1000
x
275
p̂ 2 = =
= 0.275
Proporción de éxito de la segunda muestra
n 1000
q̂ 1 = 1 − p̂1 = 1 − 0.25 = 0.75
Proporción de fracasos de la primer muestra
q̂ 2 = 1 − p̂ 2 = 1 − 0.275 = 0.725
Proporción de fracasos de la segunda muestra
p̂ 1 − p̂ 2 = 0.25 − 0.275 = −0.025
Diferencia entre proporciones de éxitos
Intervalo de confianza
IC = 95%
z
100γ = 100(1 - α)% = 95% =>α =0.05 => 1−α 2 => z0.025 ≅ 1.96
Incógnita:
Intervalo de confianza de 96% para la diferencia de las fracciones de población que favorece el convenio.
Solución:
p̂1 * q̂ 1 p̂ 2 * q̂ 2
+
n1
n2
( p̂ 2 − p̂1 ) − z α
2
*
con nuestros datos
( 0.25) * ( 0.75) + ( 0.275) * ( 0.725)
1000
1000
≅ 0.01967
p̂1 * q̂ 1 p̂ 2 * q̂ 2
p̂ * q̂ p̂ * q̂
+
< p 2 − p1 < ( p̂ 2 − p̂1 ) + z α * 1 1 + 2 2
2
n1
n2
n1
n2
con nuestros datos
0.025 – (1.96)*(0.01967) < p2 – p1 < 0.025 + (1.96)*(0.01967)
0.025 – 0.0385532 < p2 – p1< 0.025 + 0.0385532
– 0.01355 < p2 – p1< 0.06355
Respuesta:
Podemos afirmar con 95% de confianza que la diferencia entre la proporción de hombres y mujeres que
padecen el trastorno sanguíneo se encuentra entre – 0.01355 y 0.06355.
Problema 28 (Ref: Pág. 271 – Ej. 20)
De acuerdo con USA Today (17 de marzo de 1997), las mujeres constituían 33.7% del personal editorial
en las estaciones locales de televisión en 1990 y el 36.2% en 1994. Suponga que se contrataron 20 nuevos
empleados para el personal editorial.
a) Estime el número que habrían sido mujeres en cada año respectivamente.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 42 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
b) Calcule un intervalo de confianza de 95% para ver si hay evidencia de que la proporción de mujeres
contratadas como personal editorial en 1994 fue mayor que la proporción contratada en 1990.
Datos:
Tamaño de la muestra
n = 20 empleados.
6.74
Pˆ1 =
= 0.337
20
7.24
= 0.362
Proporción de éxitos en 1994 las mujeres constituían 36,2 % de 20 empleados Pˆ2 =
20
q̂ 1 = 1 − p̂1 = 1 − 0.337 = 0.663
Proporción de fracasos de la muestra en 1990
q̂ 2 = 1 − p̂ 2 = 1 − 0.362 = 0.638
Proporción de fracasos de la muestra en 1994
Intervalo de confianza
IC = 95%
100γ = 100(1 - α) % = 95% =>α =0.05 => z1−α 2 => z0.025 ≅ 1.96 .
Proporción de éxitos en 1990 las mujeres constituían 33,7 % de 20 empleados
a) Incógnita:
Estimar el número que habrían sido mujeres en cada año.
Solución:
En 1990 el 33.7% de 20
n * Pˆ1 = 20 * 0.337 = 6.74 ≈ 7 mujeres
En 1994 el 36.2% de 20
n * Pˆ2 = 20 * 0.362 = 7.24 ≈ 7 mujeres
Respuesta:
Estimamos que en 1990 habría sido de 6.74 ≈ 7 mujeres, y en 1994 la estimación habría sido de 7.24 ≈ 7
mujeres.
b) Incógnita:
Intervalo de confianza de 95% para ver si hay evidencia de que la proporción de mujeres contratadas
como personal editorial en 1994 fue mayor que la proporción contratada en 1990.
Solución:
( Pˆ − Pˆ ) − Z
2
1
α /2
*
(
( 0.337 - 0.362) − (1.96) *
( − 0.025) − (1.96) *
)
pˆ 1 * qˆ1 pˆ 2 * qˆ 2
+
< p 2 − p1 < Pˆ2 − Pˆ1 + Z α / 2 *
n1
n2
pˆ 1 * qˆ1 pˆ 2 * qˆ 2
+
n1
n2
(0.337) * (0.663) (0.362) * (0.638)
(0.337)
+
< p 2 − p1 < ( 0.337 - 0.362) + (1.96) *
20
20
2
(0.337) * (0.663) (0.362) * (0.638)
(0.337) * (0.663)
+
< p 2 − p1 < ( − 0.025) + (1.96) *
+
20
20
20
( − 0.025) − 0.295430 < p2 − p1 < ( − 0.025) + 0.295430
− 0.32043 < p 2 − p1 < 0.27043
Respuesta:
Podemos afirmar con 95% de confianza que no hay ninguna evidencia para asegurar que la proporción de
mujeres contratadas como personal en 1994 fue mayor que la proporción contratada en 1990.
Problema 29 (Ref: Pág. 275 – Ej. 1)
Un fabricante de baterías para automóvil afirma que sus baterías duraran, en promedio, tres años con
una varianza de un año. Si cinco de estas baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años,
construya un intervalo de confianza de 95% para σ2 y decida si la afirmación del fabricante de que σ2 =
1 es válida. Suponga que la población de duraciones de las baterías se distribuye de forma
aproximadamente normal.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 43 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Datos:
P: baterías de automóvil.
X: tiempo de duración en años de una batería.
Media poblacional
μx = 3 años.
Desviación estándar poblacional
σx = 1 año.
Intervalo de varianza
IC = 95%.
Tamaño de la muestra
n = 5 baterías.
X ~ N( μ x = 3, σ x = 1)
Incógnita:
σ2 = 1 año 2
Solución:
Se desea estimar el valor de la varianza utilizando S 2 como estimador.
n
 n

n ∑ x i2 −  ∑ x i 
 i =1 
s 2 = i =1
n ( n − 1)
s2 =
2
( 5) * ( 48.26 ) − (15) 2
( 5)( 4)
=
241.3 − 225
= 0.815 año 2
20
S = 0.902774 años
Para el intervalo de confianza del 95%
α = 0.05
χ α2
= 0.484 con (n-1) grados de libertad Según Tabla A.5
2
=
2
χ 0.025
( n − 1) s 2
χ α2
χ 12−α
= 11.113
<σ
2
2
=
2
χ 0.975
(
n − 1) s 2
<
2
χ 12− α
2
con nuestros datos
( 5 − 1)( 0.815) < σ 2 < ( 5 − 1)( 0.815) ⇒ ( 4)( 0.815) < σ 2 < ( 4)( 0.815)
11.113
0.484
11.113
0.484
3.26
3.26
<σ2 <
11.113
0.484
0.292639 < σ 2 < 6.735537 ( año 2 )
Respuesta:
Podemos afirmar con 95% de confianza que, ya que este intervalo 0.292639 < σ 2 < 6.735537 contiene a 1,
que la afirmación del fabricante, de que σ2 = 1, es válida.
Problema 30 (Ref: Pág. 275 – Ej. 8 ligado al Ej. 9 – Pág. 263)
Ref. Pág. 263 – Ej. 9
Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su flotilla
de taxis. Para estimar la diferencia de las dos marcas, se lleva cabo un experimento, utilizando 12 de
cada marca. Los neumáticos se utilizan hasta que se gastan. Los resultados son:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 44 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
x 1 = 36300 kilómetros.
s1 = 5000 kilómetros.
x 2 = 38100 kilómetros.
s2 = 6100 kilómetros.
Marca A:
Marca B:
a) Calcule un intervalo de confianza de 95% para μ1 – μ2, suponga que las poblaciones se distribuyen de
forma aproximadamente normal. Puede no suponer que las varianzas son iguales.
Ref. Pág. 275 – Ej. 8
b) Construya un intervalo de confianza de 90% para σ 12 σ 22 . ¿Estamos justificados al suponer que σ21
= σ22 cuando construyamos nuestro intervalo de confianza para μ1 – μ2?
Datos:
P1 : neumáticos de la marca A.
P2 : neumáticos de la marca B.
X1 : duración en kilómetros de un neumático de la marca A.
X2 : duración en kilómetros de un neumáticos de la marca B.
Tamaño de la primer muestra
n1 = 12 neumáticos.
Tamaño de la segunda muestra
n2 = 12 neumáticos.
x 1 = 36300 Km.
Media de la primer muestra
x 2 = 38100 Km.
Media de la segunda muestra
s 1 = 5000 Km.
Desviación estándar de la primer muestra
s 2 = 6100 Km.
Desviación estándar de la segunda muestra
Intervalo de confianza
IC = 95%.
100(1-α) % = 95% =>α = 0.05 => t α 2 Aplicando Tabla A.4 t0.025 = 2.07892
libertad.
con υ = 21.18 grados de
a) Incógnita:
Intervalo de confianza para la diferencia de las medias poblacionales, μ 1 – μ2, con 95% de confianza.
Solución:
( x1 − x 2 ) − t α
(s12
2
s12 s 22
s12 s 22
+
< μ1 − μ 2 < ( x1 − x 2 ) + t α
+
2 n1
n1 n 2
n2
)
donde t α 2 es el valor t con
2
n1 + s 2
n2
2
υ=
2
2
s12 n1
s2
n2
2
+
n1 −1
n 2 −1
(
) (
)
con nuestros datos
υ=
( 25000000 12 + 37210000 12 ) 2
( 25000000 12) 2 ( 37210000 12 ) 2
12 − 1
+
12 − 1
Lafata Desio Fernando, Warlet Iván Lautaro
=
( 2083333.3 + 3100833.3) 2
( 2083333.3) 2 + ( 3100833.3) 2
11
= 21.18
11
Página 45 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
con nuestros datos
( 36300 − 38100) − 2.078
25000000 37210000
25000000 37210000
+
< µ1 − µ2 < ( 36300 − 38100) + 2.080
+
12
12
12
12
( − 1800) − ( 2.080) * ( 2276.87 ) < µ1 − µ 2 < ( − 1800) + ( 2.080) * ( 2276.87 )
− 6533.4 < µ1 − µ 2 < 2933.4
Respuesta:
Podemos afirmar con un 95% de confianza que la diferencia entre las medias poblacionales se encuentra entre
–6533.4 y 2933.4.
b) Incógnita:
Intervalo de confianza de 90% para σ 21/ σ22.
Solución:
Intervalo de confianza
100(1-α)% = 90% =>α = 0.10 => f α
IC = 90%.
2
Aplicando Tabla A.6
f0.05 = 2.80 con (n1 – 1, n2 - 1), es decir, con (11, 11) grados de libertad.
s12
σ12 s12
1
<
< f α ( υ1, υ 2 )
s 22 f α ( υ1, υ 2 ) σ 22 s 22 2
2
con nuestros datos
2
 25000000  1  σ 1  25000000 


< 2 <
( 2.80 )
 37210000  2.80  σ 2  37210000 
0.238249 <
σ 12
< 1.894652
σ 22
Respuesta:
Podemos afirmar con 90% de confianza que σ 12 σ 22 se encuentra entre 0.238249 y 1.894652, ya que el
intervalo contiene a 1 es razonable asumir que σ21 = σ22.
Problema 31 (Ref: Pág. 304 – Ej. 1)
Suponga que un alergólogo desea probar la hipótesis de que al menos 30% del público es alérgico a
algunos productos de queso. Explique como el alergólogo puede cometer:
a) Un error tipo I.
b) Un error tipo II.
Solución:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 46 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
H 0 ) Al menos el 30% del público es alérgico a algunos productos de queso.
H 1 ) Menos del 30% del público es alérgico a algunos productos de queso.
p = proporción de público que es alérgico a algunos productos de queso.
En símbolos:
H 0 ) p ≥ 0.30
H 1 ) p < 0.30
El rechazo de la hipótesis nula cuando es verdadera se llama error de tipo I.
a) Cuando concluye que al menos de 30% del público es alérgico a algunos productos de queso cuando, de
hecho, el 30% o más son alérgicos.
El no rechazo de la hipótesis nula cuando es falsa se llama error tipo II.
b) Cuando concluye que al menos el 30% del público es alérgico a algunos productos de queso cuando, de
hecho, menos del 30% son alérgicos.
Problema 32 (Ref: Pág. 304 – Ej. 4)
Se estima que la proporción de adultos que viven en una pequeña ciudad que son graduados
universitarios es p = 0.6. Para probar esta hipótesis se selecciona una muestra aleatoria de 15 adultos.
Si el número de graduados en nuestra muestra es cualquier número de 6 a 12, aceptaremos la hipótesis
nula de que p = 0.6 en caso contrario, concluiremos que p ≠ 0.6
a) Evalúe α con la suposición de que p = 0.6. Utilice la distribución binomial.
b) Evalúe β para las alternativas p = 0.5 y p = 0.7.
c) ¿Es este un buen procedimiento de prueba?.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 47 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Datos:
P : adultos graduados universitarios.
p : proporción de adultos graduados universitarios.
X : un adulto graduado universitario de esa población.
Tamaño de la muestra
n = 15 adultos.
Región de aceptación
6 ≤ x ≤ 12 graduados universitarios.
Hipótesis nula
Hipótesis alternativa
H0 : p = 0.6.
H1 : p ≠ 0.6.
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de adultos graduados universitarios
x
α = P(error tipo I) = P(6 <
=
i =5
i =15
i =0
i =13
p = 0.6 graduados universitarios.
< 12 | p = 0.6) = P( x ≤ 6 | p = 0.6) + P( x ≤ 12 | p = 0.6) =
∑b( x;15;0.6) + ∑b( x;15;0.6) = 0.0338 +(1 – 0.9729) = 0.0609 = 6.09%.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 6.09%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
Proporción de adultos graduados universitarios
β = P(error tipo II) =P(6 ≤
x
p = 0.5 graduados universitarios.
i =12
≤ 12 | p = 0.5) =
∑b( x;15;0.5) = Aplicando Tabla A.1 = 0.8464 =
i =6
84.64%.
Proporción de adultos graduados universitarios
β = P(error tipo II) =P(6 ≤
x
p = 0.7 graduados universitarios.
i =12
≤ 12 | p = 0.7) =
∑b( x;15;0.7) = Aplicando Tabla A.1 = 0.8695 =
i =6
86.95%.
Respuesta:
La probabilidad de cometer un error tipo II con p = 0.5 es del 84.64%.
La probabilidad de cometer un error tipo II con p = 0.7 es del 86.95%.
c) Incógnita:
Es este un buen procedimiento de prueba?
Solución:
El procedimiento empleado para este ejercicio no es un buen procedimiento de prueba ya que la probabilidad
β es muy alta.
Problema 33 (Ref: Pág. 304 – Ej. 5)
Repita el ejercicio 4 cuando se seleccionan 200 adultos y la región de aceptación se define como 110 ≤
x ≤ 130 donde x es el número de graduados universitarios en nuestra muestra. Utilice la
aproximación normal.
Datos:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 48 de 104
Cátedra: Probabilidad y Estadística
UADER
Tamaño de la muestra
Región de aceptación
Hipótesis nula
Hipótesis alternativa
Trabajo Final
6 de Agosto de 2008
n = 200 adultos.
110 ≤ x ≤ 130 graduados universitarios.
H0: p = 0.6.
H1: p ≠ 0.6.
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de adultos graduados universitarios
p = 0.6 graduados universitarios.
Media
µ = n * p = ( 200 ) * ( 0.6) = 120 .
σ = n * p * q = 200 * 0.6 * 0.4 = 6.9282
Desviación estándar
Necesitamos conocer el área bajo la curva normal entre
110 ≤ x ≤ 130 → 110 - 0.5 ≤ y ≤ 130 + 0.5 → 109.5 ≤ y ≤ 130.5
Z=
z=
y −µ
σ
109.5 −120
≅ −1.52
6.928
y
z=
130.5 −120
≅ 1.52
6.928
α = P(error tipo I) = P(110 > x > 130 | p = 0.6) = P( x < 110 | p = 0.6) + P( x > 130 | p = 0.6) =
= P(z < -1.52) + P(z < 1.52) = (2)*(0.0643) = 0.1286 = 12.86%.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 12.86%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
Proporción de adultos graduados universitarios
p = 0.5 graduados universitarios.
Media
µ = n * p = ( 200 ) * ( 0.5) = 100 .
Desviación estándar
σ = n * p * q = 200 * 0.5 * 0.5 = 7.0712
Necesitamos conocer el área bajo la curva normal entre
110 ≤ x ≤ 130 → 110 - 0.5 ≤ y ≤ 130 + 0.5 → 109.5 ≤ y ≤ 130.5
Z=
y −µ
σ
Lafata Desio Fernando, Warlet Iván Lautaro
Página 49 de 104
Cátedra: Probabilidad y Estadística
UADER
z=
109.5 −100
≅ 1.34
7.07
Trabajo Final
6 de Agosto de 2008
y
z=
130.5 −100
≅ 4.31
7.07
β = P(error tipo II) =P(110 < x < 130 | p = 0.5) =P(1.34 < z < 4.31) = P(z ≤ 4.31) – P(z ≤ 1.34) =
= 1 – 0.9099 = 0.0901 = 9.01%.
Proporción de adultos graduados universitarios
p = 0.7 graduados universitarios.
Media
µ = n * p = ( 200 ) * ( 0.7 ) = 140 .
σ = n * p * q = 200 * 0.7 * 0.3 = 6.4807
Desviación estándar
Necesitamos conocer el área bajo la curva normal entre
110 ≤ x ≤ 130 → 110 - 0.5 ≤ y ≤ 130 + 0.5 → 109.5 ≤ y ≤ 130.5
Z=
z=
y −µ
σ
109.5 −140
≅ −4.71
6.480
y
z=
130.5 −140
≅ −1.47
6.480
β = P(error tipo II) =P(110 < x < 130 | p = 0.7) = P(-4.71< z < -1.47) = P(z ≤ -1.47) – P(z ≤ -4.71) =
= 0.0708 – 0 = 0.0708 = 7.08%.
Respuesta:
La probabilidad de cometer un error tipo II con p = 0.5 es del 9.01%.
La probabilidad de cometer un error tipo II con p = 0.7 es del 7.08%.
c) Incógnita:
Es este un buen procedimiento de prueba?
Solución:
Para este procedimiento la probabilidad de cometer un error Tipo I es algo alto, aunque se reduce
dramáticamente la probabilidad de cometer un error Tipo II.
Problema 34 (Ref: Pág. 305 – Ej. 12)
Se pregunta a una muestra aleatoria de 400 votantes en cierta ciudad si están a favor de un impuesto
adicional de 4% sobre la venta de gasolina para proporcionar ingresos que se necesitan con urgencia
para la reparación de calles. Si más de 220 pero menos de 260 favorecen el impuesto sobre ventas,
concluiremos que 60% de los votantes lo apoyan.
a) Encuentre la probabilidad de cometer un error tipo I si 60% de los votantes están a favor del
aumento de impuestos.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 50 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
b) ¿Cuál es la probabilidad de cometer un error de tipo II al utilizar este procedimiento de prueba si en
realidad sólo 48% de los votantes está a favor del impuesto adicional a la gasolina?
Datos:
P : votantes de una cierta ciudad.
p : proporción de votantes a favor del impuesto.
X : un votante de esa ciudad.
Tamaño de la muestra
n = 400 votantes.
Región de aceptación
220 < x < 260 → 221 ≤
Hipótesis nula
Hipótesis alternativa
x
≤ 259 votantes que favorecen el impuesto.
H 0: p = 0.6.
H1: p ≠ 0.6.
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de votantes a favor del impuesto
p = 0.6 votantes a favor del impuesto.
Media
μ = n*p = (400)*(0.6) = 240.
Desviación estándar
σ=
n* p*q =
( 400) * ( 0.6) * ( 0.4) ≅
9.79
Necesitamos conocer el área bajo la curva normal entre
221 ≤ x ≤ 259 → 221 - 0.5 ≤ y ≤ 259 + 0.5 → 220.5 ≤ y ≤ 259.5
Z=
z=
y −µ
σ
220.5 − 240
≅ −1.99
9.79
y
z=
259.5 − 240
≅ 1.99
9.79
α = P(error tipo I) = P(221 > x > 259 | p = 0.6) = P( x < 221 | p = 0.6) + P( x > 259 | p = 0.6) =
=P(z < -1.99) + P(z < 1.99) = (2)*(0.0233) = 0.0466 = 4.66%.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 4.66%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 51 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Proporción de adultos graduados universitarios
p = 0.48 graduados universitarios.
Media
μ = n*p = (400)*(0.48) = 192.
Desviación estándar
σ=
n* p*q =
( 400 ) * ( 0.48) * ( 0.52)
≅
9.99
Necesitamos conocer el área bajo la curva normal entre 220.5 y 259.5
Z=
z=
y −µ
σ
220.5 −192
≅ 2.85
9.99
y
z=
259.5 −192
≅ 6.75
9.99
β = P(error tipo II) =P(221 < x < 259 | p = 0.48) = P(2.85< z < 6.75) = P(z ≤ 6.75) – P(z ≤ 2.85) =
=1 – 0.9978 = 0.0022 = 0.22%.
Respuesta:
La probabilidad de cometer un error tipo II con p = 0.48 es del 0.22%.
Problema 35 (Ref: Pág. 305 – Ej. 13)
Suponga que, en el ejercicio 12, concluimos que 60% de los votantes está a favor del impuesto a la venta
de gasolina si más de 214 pero menos de 266 votantes de nuestra muestra lo favorece. Muestre que esta
nueva región de aceptación tiene como resultado un valor más pequeño para α a costa de aumentar β.
Datos:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 52 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Tamaño de la muestra
Región de aceptación
n = 400 votantes.
214 < x < 266 → 215 ≤
Hipótesis nula
Hipótesis alternativa
x
≤ 265 votantes que favorecen el impuesto.
H 0: p = 0.6.
H1: p ≠ 0.6.
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de votantes a favor del impuesto
p = 0.6 votantes a favor del impuesto.
Media
μ = n*p = (400)*(0.6) = 240.
Desviación estándar
σ = n * p * q = ( 400 ) * ( 0.6 ) * ( 0.4) ≅ 9.79
Necesitamos conocer el área bajo la curva normal entre
215 ≤ x ≤ 265 → 215 - 0.5 ≤ y ≤ 265 + 0.5 → 214.5 ≤ y ≤ 265.5
Z=
y −µ
σ
z=
214.5 − 240
≅ −2.60 y
9.79
z=
265.5 − 240
≅ 2.60
9.79
α = P(error tipo I) = P(214 > x > 266, cuando p = 0.6) = (2)*P(z < -2.60) = (2)*(0.0047) = 0.0094 = 0.94%.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 0.94%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
Proporción de adultos graduados universitarios
p = 0.48 graduados universitarios.
Media
μ = n*p = (400)*(0.48) = 192.
Desviación estándar
σ = n * p * q = ( 400 ) * ( 0.48) * ( 0.52 ) ≅ 9.99
Necesitamos conocer el área bajo la curva normal entre 214.5 y 265.5
215 ≤ x ≤ 265 → 215 - 0.5 ≤ y ≤ 265 + 0.5 → 214.5 ≤ y ≤ 265.5
Z=
y −µ
σ
z=
214.5 −192
≅ 2.25
9.99
y
z=
265.5 −192
≅ 7.35
9.99
β = P(error tipo II) =P(214 < x < 266, cuando p = 0.48) =P(2.25≤ z ≤ 7.35) = P(z ≤ 7.35) – P(z ≤ 2.25) =
= 1 – 0.9878 = 0.0122 = 1.22%.
Respuesta:
La probabilidad de cometer un error tipo II con p = 0.48 es del 1.22%.
Problema 36 (Ref: Pág. 305 – Ej. 15)
Una máquina de refrescos en un restaurante de carnes asadas se ajusta de modo que la cantidad de
bebida que sirva esté distribuida de forma aproximadamente normal con una media de 200 mililitros y
una desviación estándar de 15 mililitros. La máquina se verifica periódicamente con una muestra de
nueve bebidas y con el cálculo del contenido promedio. Si x cae en el intervalo 191 < x < 209, se
considera que la máquina opera de manera satisfactoria: de otro modo, concluimos que μ ≠ 200
mililitros.
a) Encuentre la probabilidad de cometer un error tipo I cuando μ = 200 mililitros.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 53 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
b) Encuentre la probabilidad de cometer un error tipo II cuando μ = 215 mililitros.
Datos:
P : bebida que sirve cierta maquina de refresco.
X : medida en mililitros de esa maquina de refresco.
Tamaño de la muestra
n = 9 bebidas.
Desviación estándar poblacional
σ = 15 mililitros.
σ
15 15
σx = x =
=
Desviación estándar muestral
= 5 mililitros.
n
9 3
Región de aceptación
191 < x < 209.
Hipótesis nula
Hipótesis alternativa
H 0: μ = 200 mililitros.
H1: μ ≠ 200 mililitros.
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Media
μ = 200 mililitros.
Necesitamos conocer el área bajo la curva normal entre 191 y 209
z=
191 − 200
= -1.80
5
y
z=
X ~ N( μ x = 200, σ x = 15)
209 − 200
= 1.80
5
α = P(error tipo I) = P(191 > x > 209) = (2)*P(z < -1.80) = (2)*(0.0359) = 0.0718 = 7.18%.
Respuesta:
La probabilidad de cometer un error tipo I con es del 7.18%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
Media
μ = 215 mililitros.
Necesitamos conocer el área bajo la curva normal entre 191 y 209
z=
191 − 215
= -4.80
5
y
z=
X ~ N( μ x = 200, σ x = 15)
209 − 215
= -1.20
5
β = P(error tipo II) =P(191 < x < 209) =P(-4.80 ≤ z ≤ -1.20) = P(z ≤ -1.20) – P(z ≤ -4.80) =
= 0.1151 – 0 = 0.1151 = 11.51%.
Respuesta:
La probabilidad de cometer un error tipo II es del 11.51%.
Problema 37 (Ref: Pág. 325 – Ej. 1)
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma
aproximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Prueba
la hipótesis de que μ = 800 horas contra la alternativa de que μ ≠ 800 horas si una muestra aleatoria de
30 focos tiene una duración promedio de 788 horas. Utilice un nivel de significancia de 0.04.
Datos:
P : focos fabricados en cierta empresa eléctrica.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 54 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
X : duración en horas de un foco fabricado en esa empresa eléctrica.
Tamaño de la muestra
n = 30 focos.
Desviación estándar poblacional
σ = 40 horas.
Media muestral
x = 788 horas.
σ
40
σx = x =
≅ 7.30 mililitros.
Desviación estándar muestral
n
30
Nivel de significancia
α = 0.04
Hipótesis nula
Hipótesis alternativa
H0: μ = 800 horas.
H1: μ ≠ 800 horas.
X ~ N ( μ x = 788, σ x = 40 )
Incógnita:
Rechazo o aceptación de la hipótesis nula.
Solución:
Es conveniente estandarizar X e incluir de manera formal la variable aleatoria normal estándar Z, donde
z=
z=
X −μ
σ
n
788 − 800
=-1.64
7.30
Si − z α < z < z α , no se rechaza H0.
2
2
− z 0.04 < z < z 0.04
2
2
− z 0.02 < z < z 0.02
Aplicando Tabla A.3.
– 2.055 < z < 2.055
Respuesta:
No rechazamos la hipótesis nula ya que el valor de z hallado se encuentra dentro de la región de no rechazo.
Problema 38 (Ref: Pág. 326 – Ej. 5)
Se afirma que un automóvil se maneja en promedio más de 20000 kilómetros por año. Para probar esta
afirmación, se pide a una muestra de 100 propietarios de automóviles que lleven un registro de los
kilómetros que viajen. ¿Está de acuerdo con esta afirmación si la muestra aleatoria muestra un
promedio de 23500 kilómetros y una desviación estándar de 3900 kilómetros?. Utilice un valor P en su
conclusión.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 55 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Datos:
Tamaño de la muestra
Media muestral
Desviación estándar muestral
n = 100 automóviles.
x = 23500 kilómetros.
σx = 3900 kilómetros.
Hipótesis nula
Hipótesis alternativa
H0: μ ≤ 20000 kilómetros.
H1: μ > 20000 kilómetros.
Incógnita:
Rechazo o aceptación de la hipótesis nula.
Solución:
Es conveniente estandarizar X e incluir de manera formal la variable aleatoria normal estándar Z, donde
z=
z=
X −μ
σ
n
23500 − 20000
= 8.97.
3900 / 100
P= P(Z > 8.97)
≅
1-1 = 0
Respuesta:
Rechazamos la hipótesis nula y concluimos que μ ≠ 20000 Kilómetros.
Problema 39 (Ref: Pág. 326 – Ej. 7 ligado al Ej. 1 – Pág. 339)
a) Ref. Pág. 326 – Ej. 7
Pruebe la hipótesis de que el contenido promedio de los envases de un lubricante particular es de 10
litros si los contenidos de una muestra aleatoria de 10 envases son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9,
10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que la distribución del
contenido es normal.
b) Ref. Pág. 339 – Ej.1
Lafata Desio Fernando, Warlet Iván Lautaro
Página 56 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Se sabe que el volumen de los envases de un lubricante particular se distribuye normalmente con una
varianza de 0.03 litros. Pruebe la hipótesis de que σ2 = 0.03 contra la alternativa de que σ2 ≠ 0.03 para la
muestra aleatoria de 10 envases del ejercicio 7 de la página 326. Use un nivel de significancía de 0.01.
a) Ref. Pág. 326 – Ej. 7
Datos:
P : envases de un lubricante.
X : contenido en litros de un envase de ese lubricante.
Tamaño de la muestra
n = 10 envases.
n
Media muestral
x=
∑X
i
i =1
n
10.2 + 9.7 + 10.1 + 10.3 + 10.1 + 9.8 + 9.9 + 10.4 + 10.3 + 9.8
=
= 10.06 litros.
10
n
Desviación estándar muestral
s=
=
s=
∑ (X
i =1
i
− X)
2
n −1
(10.2 −10.06 )2 + (9.7 −10.06) 2 + (10.1 −10.06) 2 + (10.3 −10.06) 2 + (10.1 −10.06) 2 + (9.8 −10.06) 2 + (9.9 −10.06
9
(0.14 )2 + ( −0.36 )2 + ( 0.04 )2 + ( 0.24 )2 + (0.04)2 + ( − 0.26 )2 + ( − 0.16 )2 + (0.34)2 + ( 0.24 ) 2 + ( − 0.26 )2
9
Nivel de significancia
α = 0.01
Hipótesis nula
Hipótesis alternativa
H0: μ = 10 litros.
H1: μ ≠ 10 litros.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
X −μ
t=
s
n
Si − t α
2
− t 0.01
, n −1
2
,9
t=
< t < tα
2
< t < t 0.01
, n −1 ,
2
10.06 −10
= 0.7722 .
0.0777
no se rechaza H0.
,9
− t 0.005,9 < t < t 0.005,9 Aplicando Tabla A.4.
- 3.250 < t < 3.250
Respuesta:
No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región de No Rechazo.
b) Ref. Pág. 339 – Ej.1
Datos:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 57 de 104
=
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Tamaño de la muestra
n = 10 envases.
n
Media muestral
x=
∑X
i =1
i
=
n
10.2 + 9.7 + 10.1 + 10.3 + 10.1 + 9.8 + 9.9 + 10.4 + 10.3 + 9.8
= 10.06
10
litros.
n
Desviación estándar muestral
(10.2 −10.06 )
s =
=
2
s=
+ (9.7 −10.06)
2
∑ (X
i =1
i
− X)
2
n −1
+ (10.1 −10.06)
2
+ (10.3 −10.06)
2
+ (10.1 −10.06)
2
+ (9.8 −10.06)
2
+ (9.9 −10.06
9
(0.14 )2 + ( − 0.36 )2 + ( 0.04 )2 + ( 0.24 )2 + (0.04 )2 + ( − 0.26 )2 + ( − 0.16 )2 + ( 0.34 )2 + ( 0.24 ) 2 + ( − 0.26 )2
9
Nivel de significancia
α = 0.01
H0: σ2 = 0.03 litros.
H1: σ2 ≠ 0.03 litros.
Hipótesis nula
Hipótesis alternativa
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
x2 =
x2 =
( n −1) * s 2
σ2
(10 −1) * ( 0.2458) 2
0.03
=
( 9 ) * ( 0.0604 )
0.03
=
0.5436
≅ 18.13
0.03
Si χ α2 = 18.13 cuando v = 10 – 1 = 9 grados de libertad
Según Tabla A.5 => 0.025 < P(χ2 >18.13) < 0.05
Respuesta:
No rechazamos la hipótesis nula ya que la muestra de 10 envases no es suficiente para mostrar que σ2 no es
igual a 0.03.
Problema 40 (Ref: Pág. 326 – Ej. 12)
Una muestra aleatoria de tamaño n1 = 25, que se toma de una población normal con una desviación
estándar σ1 = 5.2, tiene una media x 1 = 81. Una segunda muestra aleatoria de tamaño n2 = 36, que se
Lafata Desio Fernando, Warlet Iván Lautaro
Página 58 de 104
=
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
toma de una población normal diferente con una desviación estándar σ2 = 3.4, tiene una media x 2 =
76. Pruebe la hipótesis de que μ1 = μ2 contra la alternativa μ1 ≠ μ2. Cite un valor P en su conclusión.
Datos:
Tamaño de la primer muestra
Desviación estándar de la primer población
Media de la primer muestra
n1 = 25.
σ1= 5.2.
x 1 = 81.
X 1 ~ N μ x1 = 81, σ x1 = 5.2
Tamaño de la segunda muestra
Desviación estándar de la segunda población
Media de la segunda muestra
n2 = 36.
σ2 = 3.4.
x 2 = 76.
X 2 ~ N μ x 2 = 76, σ x 2 = 3.4
Hipótesis nula
Hipótesis alternativa
(
)
(
)
H0: μ1 = μ2.
H 1: μ 1 ≠ μ 2.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
z=
z=
(X
1
− X 2 ) − ( μ1 − μ 2 )
σ12 σ 22
+
n1 n 2
( 81 − 76) − ( 0)
27.04 11.56
+
25
36
p = P(z > 4.222)
≅
=
5
≅ 4.222
1.184
1-1 = 0
Respuesta:
Rechazamos la hipótesis nula ya que la probabilidad de que ocurra es aproximadamente del 0%.
Problema 41 (Ref: Pág. 327 – Ej. 18 ligado al Ej. 9 – Pág. 340)
a)Ref. Pág. 327 – Ej.18
Lafata Desio Fernando, Warlet Iván Lautaro
Página 59 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Una compañía armadora de automóviles trata de decidir si compra llantas de la marca A o de la B para
sus modelos nuevos. Se lleva a cabo un experimento, para ayudar a llegar a una decisión, en el que se
usan 12 llantas de cada marca. Las llantas se utilizan hasta que se acaban. Los resultados son:
x 1 = 37900 kilómetros.
s1 = 5100 kilómetros.
x 2 = 39800 kilómetros.
s2 = 5900 kilómetros.
Marca A:
Marca B:
Prueba la hipótesis de que no hay diferencias en las dos marcas de llantas con un nivel de significancia
de 0.05. Suponga que las poblaciones se distribuyen de forma aproximadamente normal con varianzas
iguales.
b) Ref. Pág. 340 – Ej.9
Con referencia al ejercicio 18 de la página 327, pruebe la hipótesis de que σ 1 = σ 2 contra la alternativa
de que σ 1 < σ 2, donde σ 1 y σ 2 son las desviaciones estándar de las distancias que se obtienen por las
llantas marca A y marca B, respectivamente. Utilice un nivel de significancia de 0.05.
a)Ref. Pág. 327 – Ej.18
Datos:
Tamaño de la primer muestra
Tamaño de la segunda muestra
Desviación estándar de la primer muestra
Desviación estándar de la segunda muestra
Media de la primer muestra
Media de la segunda muestra
Hipótesis nula
Hipótesis alternativa
n1 = 12 llantas.
n2 = 12 llantas.
s1= 5100 Km.
s2 = 5900 Km.
x 1 = 37900 Km.
x 2 = 39800 Km.
H0: μ1 = μ2.
H1: μ1 ≠ μ2.
Nivel de significancia
α = 0.05
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
( s ) * ( n − 1) + ( s ) * ( n
2
1
sp =
2
2
1
2
− 1)
n1 + n2 − 2
Con nuestros datos:
sp =
( 26010000) * (11) + ( 34810000) * (11)
12 + 12 − 2
− X 2 ) − ( μ1 − μ 2 )
1
1
sp
+
n1 Warlet
n 2 Iván Lautaro
Lafata Desio Fernando,
t=
=
286110000 + 382910000
669020000
=
= 5514.52 Km.
22
22
(X
1
Página 60 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Con nuestros datos:
t=
( 37900 − 39800) − ( 0)
1
1
+
12 12
5514.52
Si − t α
2
, n1 + n 2 − 2
− t 0.05
2
< t < tα
,12 +12 − 2
2
=
− 1900
− 1900
=
≅ −0.84
( 5514.52 )( 0.408) 2249.92
,n1 + n 2 − 2
< t < t 0.05
2
, no se rechaza H0.
,12 +12 − 2
− t 0.025, 22 < t < t 0.025, 22 Aplicando Tabla A.4.
− 2.074 < t < 2.074
Respuesta:
No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región crítica.
b) Ref. Pág. 340 – Ej.9
Datos:
Tamaño de la primer muestra
Tamaño de la segunda muestra
Desviación estándar de la primer muestra
Desviación estándar de la segunda muestra
Media de la primer muestra
Media de la segunda muestra
n1 = 12 llantas.
n2 = 12 llantas.
s1= 5100 Km.
s2 = 5900 Km.
x 1 = 37900 Km.
x 2 = 39800 Km.
H 0: σ 1 = σ 2
H 1: σ 1 < σ 2
Hipótesis nula
Hipótesis alternativa
Nivel de significancia
α = 0.05
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Sabemos que:
ƒα ( v1 , v 2 ) con v1 = n1 −1 y v2 = n2 −1 grados de libertad
con nuestros datos:
v1 = 12 −1 = 11
y
v 2 = 12 − 1 = 11 grados de libertad
f 0.05 (11,11) = 2.82 Según Tabla A.6
f 1−α ( υ1, υ2 ) =
1
con v1 = n1 −1 y v2 = n2 −1 grados de libertad
f α ( υ 2 , υ1 )
Lafata Desio Fernando, Warlet Iván Lautaro
Página 61 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Con nuestros datos:
f 0.95 (11,11) =
1
1
=
≅ 0.35
f 0.05 (11,11) 2.82
Gráficamente:
2
La hipótesis nula se rechaza cuando f > 2.82 ó f < 0.35 , donde
f = s1
s 22
, con v1 = 11 y v1 = 11
grados de libertad.
con nuestros datos:
S12 = ( 5100 ) = 26010000km.
2
y por ello f =
S 22 = ( 5900 ) = 34810000km.
2
23010000
= 0.7472
34810000
Respuesta:
Rechazamos la hipótesis nula, para σ12 = σ22 , ya que el valor de f hallado es f < 0.35, 0.7472 < 0.35.
Problema 42 (Ref: Pág. 328 – Ej. 21 ligado al Ej. 10 – Pág. 340)
Lafata Desio Fernando, Warlet Iván Lautaro
Página 62 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
a)Ref. Pág. 328 – Ej. 21
Los siguientes datos representan los tiempos de duración de películas producidas por dos compañías
cinematográficas:
Compañía
1
2
Tiempo (minutos)
102 86 98 109 92
81 165 97 134 92 87 114
Pruebe la hipótesis de que el tiempo de duración promedio de las películas producidas por la compañía
2 excede el tiempo promedio de duración de la que produce la compañía 1 en 10 minutos, contra la
alternativa unilateral de que la diferencia es de más de 10 minutos. Utilice un nivel de significancia de
0.1 y suponga que las distribuciones de los tiempos son aproximadamente normales con varianzas
iguales.
b) Ref. Pág. 340 – Ej. 10
Con referencia al ejercicio 21 de la página 328, pruebe la hipótesis de que σ 21 = σ22 contra la alternativa
de que σ21 ≠ σ22, donde σ21 y σ22 son las varianzas para los tiempos de duración de películas producidas
por la compañía 1 y la compañía 2, respectivamente. Utilice un nivel de significancia de 0.10.
a)Ref. Pág. 328 – Ej. 21
Datos:
X1 : tiempo de duración en minutos de una película producida por la compañía 1.
X2 : tiempo de duración en minutos de una película producida por la compañía 2.
Tamaño de la primer muestra
n1 = 5 películas.
Tamaño de la segunda muestra
n2 = 7 películas.
n
Media de la primer muestra
x1 =
∑X
i
=
i =1
n1
102 + 86 + 98 + 109 + 92
= 97.4 minutos.
5
n
Media de la segunda muestra
(
X 1 ~ N μ x1 = 97.4, σ x1 = 19.86
x2 =
∑X
i
i =1
=
n2
81 + 165 + 97 + 134 + 92 + 87 + 114
= 110. minutos.
7
)
(
X 2 ~ N μ x 2 = 110, σ x 2 = 79.95
n
Desviación estándar de la primer muestra
s1 =
=
s1 =
∑ (X
i =1
i
− X)
2
n1 − 1
(102 − 97.4) 2 + (86 − 97.4) 2 + (98 − 97.4) 2 + (109 − 97.4) 2 + (92 − 97.4) 2
4
( 4.6 ) 2 + ( − 11.4) 2 + ( 0.6 ) 2 + (11.6) 2 + ( - 5.4) 2
4
Lafata Desio Fernando, Warlet Iván Lautaro
=
)
315.2
4
=
= 78.8 = 8.87minutos
Página 63 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
∑ (X
n
Desviación estándar de la segunda muestra
s2 =
s2 =
i =1
− X)
2
n2 −1
( 81 − 110 ) 2 + (165 − 110)2 + (97 − 110) 2 + (134 − 110)2 + (92 − 110)2 + (87 − 110)2 + (114 − 110) 2
6
( - 29) 2 + ( 55) 2 + ( - 13) 2 + ( 24) 2 + ( - 18) 2 + ( − 23) ) 2 + ( 4) 2
=
i
6
=
Hipótesis nula
Hipótesis alternativa
H0: μ2 - μ1 ≤ 10 minutos.
H1: μ2 - μ1 > 10 minutos.
Nivel de significancia
α = 0.1
5480
6
=
= 913.3 = 30.22 min utos
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
t=
(X
2
− X1 ) − ( μ 2 − μ1 )
s 22 s12
+
n 2 n1
con nuestros datos:
t=
(110 − 97.4) − (10 )
913.24 78.67
+
7
5
Si − t α
2
,υ
< t < tα
2
,υ
=
12.6 − 10
130.46 + 15.73
=
2.6
146.19
=
2.6
≈ 0.22
12.09
, no se rechaza H0.
Con
2
2
2
2
2
(
s1 n1 + s 2 n 2 )
(
78.68 5 + 913.25 7 )
(
15.74 + 130.46 )
υ≅
=
=
=
2
2
2
2
2
2
2
2
(
)
(
)
(
)
(
)
78
.
68
5
913
.
25
7
15
.
74
130
.
46
( s1 n1 ) + ( s2 n2 )
+
+
n1 − 1
=
( 146.2) 2
247.75 17019.81
+
4
6
entonces:
− t 0.1
5−1
n2 − 1
2
,7
=
21374.44
61.90 + 2836.75
< t < t 0.1
2
7−1
=
21374.44
2898.65
4
6
≈ 7.38 → υ = 7
,7
−t 0.05, 7 < t < t 0.05, 7 Aplicando Tabla A.4.
− 2.998 < t < 2.998
Lafata Desio Fernando, Warlet Iván Lautaro
Página 64 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Respuesta:
No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región crítica.
b) Ref. Pág. 340 – Ej. 10
Datos:
Tamaño de la primer muestra
Tamaño de la segunda muestra
n1 = 5 películas.
n2 = 7 películas.
n
Media de la primer muestra
x1 =
∑X
i
=
102 + 86 + 98 + 109 + 92
= 97.4 minutos.
5
i
=
81 + 165 + 97 + 134 + 92 + 87 + 114
= 110. minutos
7
i =1
n1
n
Media de la segunda muestra
x2 =
∑X
i =1
n2
n
Desviación estándar de la primer muestra
s1 =
=
∑ (X
i
i =1
s1 =
− X)
n1 − 1
(102 − 97.4) 2 + (86 − 97.4) 2 + (98 − 97.4) 2 + (109 − 97.4) 2 + (92 − 97.4) 2
4
( 4.6 ) 2 + ( − 11.4) 2 + ( 0.6 ) 2 + (11.6) 2 + ( - 5.4) 2
4
315.2
=
4
Desviación estándar de la segunda muestra
=
s2 =
=
= 78.8 = 8.87minutos
∑ (X
n
s2 =
2
i =1
i
− X)
2
n2 −1
( 81 − 110 ) 2 + (165 − 110) 2 + (97 − 110) 2 + (134 − 110)2 + (92 − 110)2 + (87 − 110)2 + (114 − 110) 2
6
( - 29 ) 2 + ( 55) 2 + ( - 13) 2 + ( 24) 2 + ( - 18) 2 + ( − 23) ) 2 + ( 4) 2
6
Hipótesis nula
Hipótesis alternativa
H0: σ12 = σ22.
H1: σ12 ≠ σ22.
Nivel de significancia
α = 0.1
=
5480
6
=
= 913.3 = 30.22 min utos
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Sabemos que:
ƒα ( v1 , v 2 ) con v1 = n1 −1 y v2 = n2 −1 grados de libertad
Con nuestros datos:
v1 = 5 − 1 = 4
y
v 2 = 7 − 1 = 6 grados de libertad entonces:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 65 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
ƒ 0.05 ( 4,6 ) = 4.53 Según Tabla A.6
f 1−α ( υ1, υ2 ) =
1
con v1 = n1 −1 y v2 = n2 −1 grados de libertad
f α ( υ 2 , υ1 )
Con nuestros datos:
f 0.95 ( 4,6 ) =
1
1
=
≅ 0.16
f 0.05 ( 6,4 ) 6.16
Gráficamente:
La hipótesis nula se rechaza cuando f > 4.53 ó f < 0.16 , donde
2
s
1
f =
s 22
, con v1 = 4 y v1 = 6
grados de libertad.
con nuestros datos:
S12 = ( 8.87 ) = 78.7 min utos.
2
Lafata Desio Fernando, Warlet Iván Lautaro
y
S 22 = ( 30.22) = 913.25 min utos.
2
Página 66 de 104
Cátedra: Probabilidad y Estadística
UADER
y por ello f =
Trabajo Final
6 de Agosto de 2008
78.7
= 0.09
913.25
Respuesta:
Rechazamos la hipótesis nula, para σ12 = σ22 , ya que el valor de f hallado es f < 0.16, 0.09 < 0.16.
Problema 43 (Ref: Pág. 335 – Ej. 6)
En cierta universidad se estima que a lo más 25% de los estudiantes van en bicicleta a la escuela. ¿ Esta
parece ser una estimación valida si, en una muestra aleatoria de 90 estudiantes universitarios, se
encuentra que 28 van en bicicleta a la escuela?. Utilice un nivel de significancia de 0.05.
Datos:
P : estudiantes de cierta universidad.
X : un estudiante de esa universidad.
Tamaño de la muestra
n = 90 estudiantes.
Cantidad de estudiantes que van en bicicleta
x = 28 estudiantes.
Proporción de estudiantes que en bicicleta
p = 0.25
q = 0.75
Proporción de estudiantes que no andan en bicicleta
Media
μ = n*p = (90)*(0.25) = 22.5 estudiantes.
Desviación estándar
σ = n * p * q = ( 90) * ( 0.25) * ( 0.75) ≅ 4.10 estudiantes.
X ~ N( μ x = 22.5, σ x = 4.10)
Hipótesis nula
Hipótesis alternativa
H0: p ≤ 0.25.
H1: p > 0.25.
Nivel de significancia
α = 0.05
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Rechazamos H0 si Z < -1.64 siendo
Z=
x −μ
σ
Con nuestros datos:
Z =
28 − 22.5
= 1.338877 ≈ 1.34
4.107919
P = P( Z > 1.34 ) = 1 − ( Z ≤ 1.34 ) = 1 − 0.909 = 0.091 = 9.1%
Respuesta:
No rechazamos la hipótesis nula ya que no hay suficiente evidencia para concluir que P> 0.25.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 67 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 44 (Ref: Pág. 335 – Ej. 9)
En un estudio para estimar la proporción de residentes de cierta ciudad y sus suburbios que están a
favor de la construcción de una planta de energía nuclear, se encuentra que 63 de 100 residentes
urbanos están a favor de la construcción mientras que solo 59 de 125 residentes suburbanos la
favorecen. ¿ Hay una diferencia significativa entre la proporción de residentes urbanos y suburbanos
que favorecen la construcción de la planta nuclear?. Use un valor P.
Datos:
P1 : residentes urbanos de cierta ciudad.
P2 : residentes suburbanos de cierta ciudad.
p1 : proporción de residentes urbanos a favor de la construcción de una planta de energía nuclear.
p2 : proporción de residentes suburbanos a favor de la construcción de una planta de energía nuclear.
Tamaño de la primer muestra
n1 = 100 residentes urbanos.
Tamaño de la segunda muestra
n2 = 125 residentes suburbanos.
Cantidad de urbanos a favor
x1 = 63 residentes urbanos.
Cantidad de suburbanos a favor
x2 = 59 residentes suburbanos.
x
63
p̂1 = 1 =
= 0.63
Proporción de urbanos a favor
n 1 100
x2
59
=
= 0.472
n 2 125
x + x2
63 + 59
122
p̂ = 1
=
=
= 0.542
Combinación de las proporciones
n 1 + n 2 100 + 125 225
Hipótesis nula
H0: p1 = p2.
Hipótesis alternativa
H1: p1 ≠ p2.
Proporción de suburbanos a favor
p̂ 2 =
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Utilizamos la aproximación normal
z=
z=
pˆ 1 − pˆ 2
pˆ qˆ[ (1 n1 ) + (1 n2 ) ]
0.63 − 0.472
( 0.542)( 0.458) 
1   1 
+

 100   125 
=
0.158
( 0.542)( 0.458)( 0.018)
=
0.158
0.0044
=
0.158
= 2.36
0.066
P(z > 2.36 ) = 2* P(z > 2.36) = 2*(1 – 0.9909) = 0.0182 = 1.82%
Respuesta:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 68 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Rechazamos la hipótesis nula ya que hay una probabilidad de que ocurra del 1.82%. La proporción de los
residentes urbanos a favor de la construcción de una planta de energía nuclear es mayor que la proporción de
los residentes suburbanos a favor de la construcción de dicha planta.
Problema 45 (Ref: Pág. 335/336 – Ej. 10)
En un estudio sobre la fertilidad de mujeres casadas por Martín O`Connell y Carolyn C. Rogers para
la Oficina de Censos en 1979, se seleccionaron al azar dos grupos de esposas con edades de 25 a 29 sin
hijos y a cada mujer se le preguntó si planeaba tener un hijo. Se seleccionó un grupo entre las mujeres
con menos de dos años de casadas y otro entre las que tenían cinco años de casadas. Suponga que 240
de 300 con menos de dos años de casadas planean tener algún día un hijo comparadas con 288 de las
400 con cinco años de casadas. ¿ Podemos concluir que la proporción de mujeres con menos de dos
años de casadas que planean tener hijos es significativamente más alta que la proporción con cinco años
de casadas?. Use un valor P.
Datos:
P1 : mujeres con menos de dos años de casada.
P2 : mujeres con cinco años de casadas.
p1 : proporción de mujeres con menos de dos años de casadas.
p2 : proporción de mujeres con cinco años de casadas.
Tamaño de la primer muestra
n1 = 300 mujeres con menos de dos años de casadas.
Tamaño de la segunda muestra
n2 = 400 mujeres con cinco años de casadas.
Cantidad con menos de dos años de casadas
x1 = 240 mujeres.
Cantidad con cinco años de casadas
x2 = 288 mujeres.
x
240
p̂1 = 1 =
= 0.80
Proporción con menos de dos años
n 1 300
x 2 288
=
= 0.72
n 2 400
x + x 2 240 + 288 528
pˆ = 1
=
=
= 0.754
n1 + n 2 300 + 400 700
p̂ 2 =
Proporción con cinco años
Combinación de las proporciones
H0: p1 ≤ p2.
H1: p1 > p2.
Hipótesis nula
Hipótesis alternativa
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Utilizamos la aproximación normal
z=
z=
pˆ 1 − pˆ 2
pˆ qˆ[ (1 n1 ) + (1 n2 ) ]
0.80 − 0.72
( 0.754)( 0.246) 
1   1 
+

 300   400 
Lafata Desio Fernando, Warlet Iván Lautaro
=
0.08
( 0.754)( 0.246)( 0.0055)
=
0.08
0.00108199
=
0.08
≅ 2.44
0.032893616
Página 69 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
P(z > 2.44 ) = 1 – P(z ≤ 2.44) = 1 – 0.9927 = 0.0073 = 0.73%.
Respuesta:
Rechazamos la hipótesis nula. La proporción de mujeres con menos de 2 años de casadas que planean tener
hijos es considerablemente más alta que la proporción de mujeres con 5 años de casadas que planean tener
hijos.
Problema 46 (Ref: Pág. 328 – Ej. 24)
Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un
análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro. Cada
muestra se divide en dos submuestras y se aplican los dos tipos de análisis. A continuación se presentan
los datos codificados que muestran los análisis de contenido de hierro:
Muestra
Análisis
Rayos X
Químico
1
2,0
2,2
2
2,0
1,9
3
2,3
2,5
4
2,1
2,3
5
2,4
2,4
Suponga que las poblaciones son normales, pruebe con un nivel de signficancia de 0.05 si los dos
métodos de análisis dan, en promedio, el mismo resultado.
Datos:
Tamaño de la muestra
n = 5 muestras.
Hipótesis nula
Hipótesis alternativa
H0: μ1 = μ2 .
H1: μ1 ≠ μ2.
Nivel de significancia
α = 0.05
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Región critica
− t α < t < tα
2
2
− t 0.05 < t < t 0.05
2
2
− t 0.025 < t < t 0.025 Aplicando Tabla A.4.
− 2.776 < t < 2.776
_
d− d 0
Donde t = s
d
con v = n-1 grados de libertad
n
Calculando:
 n 
∑d 
La media muestral _  i =1 i 
d=
n
Muestra
Análisis
Rayos X
1
2,0
Lafata Desio Fernando, Warlet Iván Lautaro
2
2,0
3
2,3
4
2,1
5
2,4
Página 70 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Químico
2,2
1,9
2,5
2,3
2,4
di
-0,2
0,1
-0,2
-0,2
0,0
_
d=
( − 0.2) + ( 0.1) + ( − 0.2) + ( − 0.2) + ( 0.0)
5
= −0.1
la desviación estándar
n

  n

 n * ∑ d i2  -  ∑ d i 
i =1

  i =1 
sd =
n * ( n − 1)
2
con nuestros datos:
sd =
sd =
[
]
5 * ( - 0.2 ) + ( 0.1) + ( - 0.2 ) + ( - 0.2 ) + ( 0.0 ) - [ ( − 0.2) + ( 0.1) + ( − 0.2) + ( − 0.2) + ( 0.0 ) ]
2
2
2
2
2
2
5 * ( 5 − 1)
5 * [ ( 0.13) ] - [ ( − 0.5) ]
5 * ( 4)
2
=
0.4
= 0.1414
20
_
d− d 0
Calculamos t = s
con nuestros datos
d
n
t=
− 0.1
0.1414
= −1.58
5
Respuesta:
No rechazamos la hipótesis nula. Concluimos que ambos métodos no son considerablemente diferentes.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 71 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 47 (Ref: Pág. 329 – Ej. 25)
El administrador de una compañía de taxis trata de decidir si el uso de llantas radiales en lugar de
llantas regulares de cinturón mejora la economía de combustible. Se equipan 12 autos con llantas
radiales y se manejan por un recorrido de prueba preestablecido. Sin cambiar de conductores, los
mismos autos se equipan con llantas comunes con cinturón y se manejan otra vez por el recorrido de
prueba. El consumo de gasolina, en kilómetros por litro, se registró como sigue:
Auto
1
2
3
4
5
6
7
8
9
10
11
12
Kilómetros por litro
Llantas radiales Llantas con cinturón
4,2
4,1
4,7
4,9
6,6
6,2
7,0
6,9
6,7
6,8
4,5
4,4
5,7
5,7
6,0
5,8
7,4
6,9
4,9
4,7
6,1
6,0
5,2
4,9
¿ Podemos concluir que los autos equipados con llantas radianes dan una economía de combustible
mejor que los equipados con llantas de cinturón?. Suponga que las poblaciones se distribuyen
normalmente. Utilice un valor P en su conclusión.
Datos:
Tamaño de la muestra
n = 12 autos.
Hipótesis nula
Hipótesis alternativa
H0: μ1 = μ2 .
H1: μ1 > μ2.
Nivel de significancia
α = 0.05
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
_
d− d 0
Donde t = s
con v = n-1 grados de libertad
d
n
Calculando:
 n 
∑d 
La media muestral _  i =1 i 
d=
n
Lafata Desio Fernando, Warlet Iván Lautaro
Página 72 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Kilómetros por litro
Auto Llantas radiales Llantas con cinturón
1
4,2
4,1
2
4,7
4,9
3
6,6
6,2
4
7,0
6,9
5
6,7
6,8
6
4,5
4,4
7
5,7
5,7
8
6,0
5,8
9
7,4
6,9
10
4,9
4,7
11
6,1
6,0
12
5,2
4,9
_
d=
di
0,1
-0,2
0,4
0,1
-0,1
0,1
0,0
0,2
0,5
0,2
0,1
0,3
( 0.1) + ( − 0.2) + ( 0.4) + ( 0.1) + ( − 0.1) + ( 0.1) + ( 0.0 ) + ( 0.2) + ( 0.5) + ( 0.2 ) + ( 0.1) + ( 0.3)
12
= 0.1417 Km
la desviación estándar
n

  n

 n * ∑ d i2  -  ∑ d i 
i =1

  i =1 
sd =
n * ( n − 1)
2
con nuestros datos:
sd =
12 * [ ( 0.67 ) ] - [1.7 ]
12 * (11)
2
=
5.15
= 0.198 Km
132
_
d− d 0
Calculamos t = s
con nuestros datos
d
n
t=
0.1417
= 2.48
0.198
12
Y P = P(
t
> 2.48) = 0.02 con 11 grados de libertad
Respuesta:
Rechazamos hipótesis nula ya que el nivel de significancia esta por encima del 0.02.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 73 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 48 (Ref: Pág. 329 – Ej. 26)
En el ejercicio 2 de la página 287, utilice la distribución t para probar la hipótesis de que la dieta
reduce el peso de una persona en 4.5 kilogramos en promedio contra la hipótesis alternativa de que la
diferencia media en peso es menor que 4.5 kilogramos. Utilice un valor P.
Datos:
Tamaño de la muestra
n = 7 mujeres.
Hipótesis nula
Hipótesis alternativa
H0: μ1 - μ2 = 4.5 Kilogramos
H1: μ1 - μ2 < 4.5 Kilogramos
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
_
d− d 0
Donde t = s
con v = n-1 grados de libertad
d
n
Calculando:
 n 
∑d 
La media muestral _  i =1 i 
d=
n
Peso
1
58,
Antes
5
60,
Después
0
di
-1,5
_
d=
2
60,
3
54,
9
5,4
Mujeres
3
4
5
61, 69, 64,
7
0
0
58, 62, 58,
1
1
5
3,6 6,9 5,5
6
7
62,
6 56,7
59,
9 54,4
2,7 2,3
( − 1.5) + ( 5.4) + ( 3.6) + ( 6.9) + ( 5.5) + ( 2.7 ) + ( 2.3)
7
= 3.557 Kilogramos
la desviación estándar
n

  n

 n * ∑ d i2  -  ∑ d i 
i =1

  i =1 
sd =
n * ( n − 1)
2
Lafata Desio Fernando, Warlet Iván Lautaro
Página 74 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
con nuestros datos:
sd =
7 * [ (134.81) ] - [24.9 ]
7 * (6 )
2
=
323.66
= 2.776 Kilogramos
42
_
3.557 − 4.5
d− d 0
t=
= −0.896
Calculamos t = s
con nuestros datos
2.776
d
7
n
Y P = P(
t
> 0.896) = 0.3 con 6 grados de libertad
Respuesta:
No rechazamos la hipótesis nula.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 75 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 49 (Ref: Pág. 329/330 – Ej. 28)
En un estudio realizado por el Departamento de Nutrición Humana y Alimentos del Instituto
Politécnico y Universidad Estatal de Virginia se registraron los siguientes datos acerca de la
comparación de residuos de ácido sórbico, en partes por millón, en jamón inmediatamente después de
sumergirlo en una solución de ácido y después de 60 días de almacenamiento:
Residuos de ácido sórbico en jamón
Rebanada Antes del almacenamiento Después del almacenamiento
1
224
116
2
270
96
3
400
239
4
444
329
5
590
437
6
660
597
7
1400
689
8
680
576
Si se supone que las poblaciones se distribuyen normalmente, ¿ hay suficiente evidencia, al nivel de
significancia de 0.05, para decir que la duración del almacenamiento influye en las concentraciones
residuales de ácido sórbico?
Datos:
Tamaño de la muestra
n = 8 rebanadas.
Hipótesis nula
Hipótesis alternativa
H0: μ1 = μ2.
H1: μ1 ≠ μ2.
Nivel de significancia
α = 0.05
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Región critica
− tα < t < tα
2
2
− t 0.05 < t < t 0.05
2
2
− t 0.025 < t < t 0.025 Aplicando Tabla A.4.
− 2.365 < t < 2.365
_
d− d 0
Donde t = s
con v = n-1 grados de libertad
d
n
Lafata Desio Fernando, Warlet Iván Lautaro
Página 76 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Calculando:
 n 
∑d 
La media muestral _  i =1 i 
d=
n
Residuos de ácido sórbico en jamón
Rebanada Antes del almacenamiento Despues del almacenamiento
1
224
116
2
270
96
3
400
239
4
444
329
5
590
437
6
660
597
7
1400
689
8
680
576
_
d=
(108) + (174) + (161) + (115) + (153) + ( 63) + ( 711) + (104) = 198.625
8
di
108
174
161
115
153
63
711
104
Millón/partes
la desviación estándar
n

  n

 n * ∑ d i2  -  ∑ d i 
i =1

  i =1 
sd =
n * ( n − 1)
sd =
8 * [ (624801) ] - [1589 ]
8 * (7 )
2
2
=
2473487
= 210.165 Millón/partes
56
_
d− d 0
Calculamos t = s
con nuestros datos
d
n
t=
198.625
210.165
= 2.67
8
Respuesta:
Rechazamos la hipótesis nula. La duración de almacenamiento influye en las concentraciones residuales de
ácido sórbico.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 77 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Problema 50 (Ref: Pág. 353 – Ej. 6)
Se seleccionan tres canicas de una urna que contiene cinco canicas rojas y tres verdes. Después de
registrar el número X de canicas rojas, las canicas se reemplazan en la urna y el experimento se repite
112 veces. Los resultados que se obtienen son los siguientes:
x 0 1
3
f 1 1
2 3
5
5 25
Pruebe la hipótesis con un nivel de significancia de 0.05 de que los datos registrados se pueden ajustar
con una distribución hipergeométrica h (x; 8, 3, 5), x = 0, 1, 2, 3.
Datos:
Variable aleatoria
Repeticiones del experimento
X: números de canicas rojas.
m = 112 veces.
Hipótesis nula
Hipótesis alternativa
H0: X ~ h(x, 8, 3, 5) x = 0, 1, 2, 3.
H 1: es falso.
Nivel de significancia
α = 0.05.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
 k  N − k
   
 x  n − x  ,
 N
 
n 
Aplicando la distribución hipergeométrica a nuestros datos:
X ~ h(x, N, n, k) => P(x = xi) =
Lafata Desio Fernando, Warlet Iván Lautaro
x = 0, 1, 2, 3,....., n.
Página 78 de 104
Cátedra: Probabilidad y Estadística
UADER
P(x = 0)=
 5 8 − 3

03− (1)
= = ≅0.1786
8 56

3
Trabajo Final
6 de Agosto de 2008
e0 = (112)*(0.01786) = 2.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 79 de 104
Cátedra: Probabilidad y Estadística
UADER
P(x = 1)=
 5 8 − 3

13− 2(5)31
= = ≅0.2678
 8  56

3
Trabajo Final
6 de Agosto de 2008
e1 = (112)*(0.26786) = 30.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 80 de 104
Cátedra: Probabilidad y Estadística
UADER
P(x = 2)=
 5 8− 3

23− 1(0)3
= = ≅0.5371
 8 56

3
Trabajo Final
6 de Agosto de 2008
e2 = (112)*(0.53571) = 60.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 81 de 104
Cátedra: Probabilidad y Estadística
UADER
P(x = 3)=
I
 5 8 − 3

3− 0(1)
= = ≅0.1785
 8  56

3
Trabajo Final
6 de Agosto de 2008
e3 = (112)*(0.17857) = 20.
xi
Lafata Desio Fernando, Warlet Iván Lautaro
P(x = xi)
ei = mpi
oi
j
Página 82 de 104
Cátedra: Probabilidad y Estadística
UADER
1
2
3
4
0
1
2
3
Trabajo Final
6 de Agosto de 2008
0.01786
0.26786
0.53571
0.17857
~1
Totales
2
30
60
20
112
1
31
55
25
112
1
2
3
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de cuatro a tres, lo que tiene como resultado υ = 2 grados de libertad.
Utilizando el Teorema 10.1; que dice:
Una prueba de la bondad de ajuste entre las frecuencias observadas y esperadas se basa en la cantidad
χ
2
(
n o i − ei
= ∑
i =1
ei
)2
Donde χ2 es un valor de una variable aleatoria cuya distribución muestral se aproxima muy de cerca con la
distribución ji cuadrada con υ = k – 1grados de libertad. Los símbolos oi y ei representan las frecuencias
observada y esperada, respectivamente, para la i-ésima celda.
Con nuestros datos, el valor χ2 está dado entonces por
χ
2
(
n o i − ei
= ∑
i =1
ei
) 2 ( 32 − 32 ) 2 ( 55 − 60) 2 ( 25 − 20 ) 2
=
+
+
32
60
20
=0+
25
60
+
25
20
= 1.667
2
Para un nivel de significancia igual a α, encontramos el valor crítico χα
de la tabla A.5., y entonces
χ 2 > χ α2 constituye la región critica.
Con el uso de la tabla A.5., encontramos χ02.05 = 5.991 con υ = 2 grados de libertad.
Respuesta:
Como χ 2 < χ α2 , 1.667 < 5.991, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es hipergeométrica.
Problema 51 (Ref: Pág. 353 – Ej. 7)
Se lanza una moneda hasta que sale una cara y se registra el número de lanzamientos X. Después de
repetir el experimento 256 veces, obtenemos los siguientes resultados:
x
f
1
13
6
2
6
0
3
3
4
4 5 6 7 8
1
2 9 1 3 1
Lafata Desio Fernando, Warlet Iván Lautaro
Página 83 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Prueba la hipótesis con un nivel de significancia de 0.05 de que la distribución observada de X se puede
ajustar por una distribución geométrica g (x; 1/2), x = 1, 2, 3,......
Datos:
Variable aleatoria
Repeticiones del experimento
X: números de lanzamientos hasta que sale una cara.
m = 256 veces.
Hipótesis nula
Hipótesis alternativa
H0: X ~ G(x, ½) x = 1, 2, 3,…..
H 1: es falso.
Nivel de significancia
α = 0.05.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
X ~ G(x, p) => P(x = xi) = pqx-1, x = 1, 2, 3,.....
Aplicando la distribución hipergeométrica a nuestros datos
P(x = 1) = ( 0.5)( 0.5) 0 = ( 0.5)(1) = 0.5
e1 = (256)*(0.5) = 128
P(x = 2) = ( 0.5)( 0.5)1 = ( 0.5)( 0.5) = 0.25
e2 = (256)*(0.25) = 64
P(x = 3) = ( 0.5)( 0.5) 2 = ( 0.5)( 0.25) = 0.125
e3 = (256)*(0.125) = 32
P(x = 4) = ( 0.5)( 0.5) 3 = ( 0.5)( 0.125) = 0.0625
e4 = (256)*(0.0625) = 16
P(x = 5) = ( 0.5)( 0.5) 4 = ( 0.5)( 0.0625) = 0.03125
e5 = (256)*(0.03125) = 8
P(x = 6) = ( 0.5)( 0.5) 5 = ( 0.5)( 0.03125) = 0.15625
e6 = (256)*(0.15625) = 4
P(x = 7) = ( 0.5)( 0.5) 6 = ( 0.5)( 0.15625) = 0.0078125
e7 = (256)*(0.0078125) = 2
P(x = 8) = ( 0.5)( 0.5) 7 = ( 0.5)( 0.0078125) = 0.00390625
e8 = (256)*(0.0078125) = 2
i
1
2
3
4
5
6
7
xi
1
2
3
4
5
6
7
Lafata Desio Fernando, Warlet Iván Lautaro
P(x = xi)
0.5
0.25
0.125
0.0625
0.03125
0.015625
0.0078125
ei = mpi
128
64
32
16
8
4
2
oi
136
60
34
12
9
1
3
j
1
2
3
4
5
6
Página 84 de 104
Cátedra: Probabilidad y Estadística
UADER
8
8
Trabajo Final
6 de Agosto de 2008
0.00390625
~1
Totales
2
256
1
256
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de ocho a seis, lo que tiene como resultado υ = 5 grados de libertad.
Con nuestros datos el valor χ2 está dado entonces por
χ
2
(
n oi − ei
= ∑
i =1
ei
) 2 (136 − 128) 2 ( 60 − 64) 2 ( 34 − 32 ) 2 (12 − 16 ) 2 ( 9 − 8) 2 ( 5 − 8) 2
=
+
+
+
+
+
128
64
32
16
8
8
=
64
128
+
16
64
+
4
32
+
16
16
+
2
Para un nivel de significancia igual a α, encontramos el valor critico χα
de la tabla A.5., y entonces
χ 2 > χ α2 constituye la región critica.
Con el uso de la tabla A.5., encontramos χ02.05 = 11.070 con υ = 5 grados de libertad.
Respuesta:
Como χ 2 < χ α2 , 3.125 < 11.070, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es geométrica.
Problema 52 (Ref: Pág. 353 – Ej. 10)
En el ejercicio 1 de la pagina 68, pruebe la bondad de ajuste entre las frecuencias de clase que se
observan y las frecuencias esperadas correspondientes de una distribución normal con μ = 65 y σ = 21,
utilice un nivel de significancia de 0.05.
Datos:
Calificaciones
Intervalos
Media
Desviación estándar
Lafata Desio Fernando, Warlet Iván Lautaro
m = 60.
i = 9.
μ = 65.
σ = 21.
Página 85 de 104
1
8
+
9
8
=
25
8
=
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Hipótesis nula
Hipótesis alternativa
H0: X ~ N(x, 65, 21)
H 1: es falso.
Nivel de significancia
α = 0.05.
De acuerdo con el ejercicio 1 de la página 68, los intervalos y las frecuencias que se observan son
i
1
2
3
4
5
6
7
8
9
Limite de
clases
- ∞ – 19.5
19.5 – 29.5
29.5 – 39.5
39.5 – 49.5
49.5 – 59.5
59.5 – 69.5
69.5 – 79.5
79.5 – 89.5
89.5 – + ∞
oi
3
2
3
4
5
11
14
14
4
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Los valores z que corresponden a los límites de las clases son:
− ∞ − 65 − ∞
19.5 − 65 − 45.5
=
= −∞
z12 =
=
≅ −2.17
21
21
21
21
de la tabla A.3. encontramos que el área entre z 11 y z12 es
P(- ∞< z < -2.17) = P(z < -2.17) – P(z < - ∞) = 0.0150 – 0 = 0.0150
De aquí, la frecuencia esperada para la primer clase es
e1 = (60)*(0.0150) = 0.9
z11 =
19.5 − 65 − 45.5
29.5 − 65 − 35.5
=
≅ −2.17 z 22 =
=
≅ −1.69
21
21
21
21
de la tabla A.3. encontramos que el área entre z 21 y z22 es
P(-2.17 < z < -1.69) = P(z < -1.69) – P(z < -2.17) = 0.0455 – 0.0150 = 0.0305
De aquí, la frecuencia esperada para la segunda clase es
e2 = (60)*(0.0305) = 1.83
z 21 =
29.5 − 65 − 35.5
39.5 − 65 − 25.5
=
≅ −1.69
z 32 =
=
≅ −1.21
21
21
21
21
de la tabla A.3. encontramos que el área entre z 31 y z32 es
P(-1.69 < z < -1.21) = P(z < -1.21) – P(z < -1.69) = 0.1131 – 0.0455 = 0.0676
De aquí, la frecuencia esperada para la tercer clase es
e3 = (60)*(0.0676) = 4.056
z 31 =
39.5 − 65 − 25.5
49.5 − 65 −15.5
=
≅ −1.21
z 42 =
=
≅ −0.74
21
21
21
21
de la tabla A.3. encontramos que el área entre z 41 y z42 es
P(-1.21 < z < -0.74) = P(z < -0.74) – P(z < -1.21) = 0.2296 – 0.1131 = 0.1165
De aquí, la frecuencia esperada para la cuarta clase es
z 41 =
Lafata Desio Fernando, Warlet Iván Lautaro
Página 86 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
e4 = (60)*(0.1165) = 6.99
49.5 − 65 −15.5
59.5 − 65 − 5.5
=
≅ −0.74
z 52 =
=
≅ −0.26
21
21
21
21
de la tabla A.3. encontramos que el área entre z 51 y z52 es
P(-0.74 < z < -0.26) = P(z < -0.26) – P(z < -0.74) = 0.3974 – 0.2296 = 0.1678
De aquí, la frecuencia esperada para la quinta clase es
e5 = (60)*(0.1678) = 10.068
z 51 =
59.5 − 65 − 5.5
69.5 − 65 4.5
=
≅ −0.26
z 62 =
=
≅ 0.21
21
21
21
21
de la tabla A.3. encontramos que el área entre z 61 y z62 es
P(-0.26 < z < 0.21) = P(z < 0.21) – P(z < -0.26) = 0.5832 – 0.3974 = 0.1858
De aquí, la frecuencia esperada para la sexta clase es
e6 = (60)*(0.1858) = 11.148
z 61 =
69.5 − 65 4.5
79.5 − 65 14.5
=
≅ 0.21
z 72 =
=
≅ 0.69
21
21
21
21
de la tabla A.3. encontramos que el área entre z 71 y z72 es
P(0.21 < z < 0.69) = P(z < 0.69) – P(z < 0.21) = 0.7549 – 0.5832 = 0.1717
De aquí, la frecuencia esperada para la séptima clase es
e7 = (60)*(0.1717) = 10.302
z 71 =
79.5 − 65 14.5
89.5 − 65 24.5
=
≅ 0.69
z 82 =
=
≅ 1.17
21
21
21
21
de la tabla A.3. encontramos que el área entre z 81 y z82 es
P(0.69 < z < 1.17) = P(z < 1.17) – P(z < 0.69) = 0.8790 – 0.7549 = 0.1241
De aquí, la frecuencia esperada para la octava clase es
e8 = (60)*(0.1241) = 7.446
z 81 =
+ ∞ − 65 + ∞
89.5 − 65 24.5
z 92 =
=
= +∞
=
≅ 1.17
21
21
21
21
de la tabla A.3. encontramos que el área entre z 91 y z92 es
P(1.17 < z < +∞) = P(z < +∞) – P(z < 1.17) = 1 – 0.8790 = 0.121
De aquí, la frecuencia esperada para la novena clase es
e9 = (60)*(0.121) = 7.26
z 91 =
i
1
2
3
4
5
6
7
8
9
Totales
P(x = xi)
0.0150
0.0305
0.0676
0.1165
0.1678
0.1858
0.1717
0.1241
0.1210
~1
Lafata Desio Fernando, Warlet Iván Lautaro
ei = mpi
0.9000
1.8300
4.0560
6.9900
10.068
11.148
10.302
7.4460
7.2600
60
oi
3
2
3
4
5
11
14
14
4
60
j
1
2
3
4
5
6
Página 87 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de nueve a seis, lo que tiene como resultado υ = 5 grados de libertad.
Con nuestros datos el valor χ2 está dado entonces por
(
)
2
n oi − ei
( 8 − 6.786 ) 2 + ( 4 − 6.99) 2 + ( 5 −10.068) 2 + (11 −11.148) 2 + (14 −10.302 ) 2 + (18 −14.706 ) 2 =
=
ei
6.786
6.99
10.068
11.148
10.302
14.706
i =1
1.473796 8.9401 25.684624 0.021904 13.675204 10.850436
=
+
+
+
+
+
≅ 6.11
14.706
6.786
6.99
10.068
11.148
10.302
χ2 = ∑
2
Para un nivel de significancia igual a α, encontramos el valor critico χα
de la tabla A.5., y entonces
χ 2 > χ α2 constituye la región critica.
Con el uso de la tabla A.5., encontramos χ02.05 = 11.070 con υ = 5 grados de libertad.
Respuesta:
Como χ 2 < χ α2 , 6.11 < 11.070, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es normal.
Problema 53 (Ref: Pág. 353 – Ej. 11)
En el ejercicio 5 de la pagina 69, pruebe la bondad de ajuste entre las frecuencias de clase que se
observan y las frecuencias esperadas correspondientes de una distribución normal con μ = 1.8 y σ = 0.4,
utilice un nivel de significancia de 0.01.
Datos:
Calificaciones
Intervalos
Media
Desviación estándar
m = 40.
i = 10.
μ = 1.8.
σ = 0.4.
Hipótesis nula
Hipótesis alternativa
H0: X ~ N(x, 1.8, 0.4)
H 1: es falso.
Nivel de significancia
α = 0.01.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 88 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
De acuerdo con el ejercicio 5 de la página 69, los intervalos y las frecuencias que se observan son
i
1
2
3
4
5
6
7
8
9
10
Limite de
clases
- ∞ – 0.795
0.795 – 0.995
0.995 – 1.195
1.195 – 1.395
1.395 – 1.595
1.595 – 1.795
1.795 – 1.995
1.995 – 2.195
2.195 – 2.395
2.395 – + ∞
oi
1
1
1
2
4
13
8
5
3
2
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Los valores z que corresponden a los límites de las clases son:
− ∞ − 1.8 − ∞
0.795 −1.8 −1.005
=
= −∞
z12 =
=
= -2.51
0.4
0. 4
0 .4
0 .4
de la tabla A.3. encontramos que el área entre z 11 y z12 es
P(- ∞ < z < -2.51) = P(z < -2.51) – P(z < - ∞) = 0.0060 – 0 = 0.0060
De aquí, la frecuencia esperada para la primer clase es
e1 = (40)*(0.0060) = 0.24
z11 =
0.795 −1.8 −1.005
0.995 −1.8 − 0.805
=
z 22 =
=
= -2.51
= -2.01
0.4
0.4
0.4
0.4
de la tabla A.3. encontramos que el área entre z 21 y z22 es
P(-2.51 < z < -2.01) = P(z < -2.01) – P(z < -2.51) = 0.0222 – 0.0060 = 0.0162
De aquí, la frecuencia esperada para la segunda clase es
e2 = (40)*(0.0162) = 0.648
z 21 =
0.995 −1.8 − 0.805
1.195 −1.8 − 0.605
=
z 32 =
=
= -2.01
= -1.51
0.4
0.4
0.4
0.4
de la tabla A.3. encontramos que el área entre z 31 y z32 es
P(-2.01 < z < -1.51) = P(z < -1.51) – P(z < -2.01) = 0.0655 – 0.0222 = 0.0433
De aquí, la frecuencia esperada para la tercer clase es
e3 = (40)*(0.0433) = 1.732
z 31 =
1.195 −1.8 − 0.605
1.395 −1.8 − 0.405
=
z 42 =
=
= -1.51
= -1.01
0 .4
0 .4
0.4
0.4
de la tabla A.3. encontramos que el área entre z 41 y z42 es
P(-1.51 < z < -1.01) = P(z < -1.01) – P(z < -1.51) = 0.1562 – 0.0655 = 0.0907
De aquí, la frecuencia esperada para la cuarta clase es
e4 = (40)*(0.0907) = 3.628
z 41 =
Lafata Desio Fernando, Warlet Iván Lautaro
Página 89 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
1.395 −1.8 − 0.405
1.595 −1.8 − 0.205
=
z 52 =
=
= -1.01
= -0.51
0.4
0.4
0.4
0.4
de la tabla A.3. encontramos que el área entre z 51 y z52 es
P(-1.01 < z < -0.51) = P(z < -0.51) – P(z < -1.01) = 0.3050 – 0.1562 = 0.1488
De aquí, la frecuencia esperada para la quinta clase es
e5 = (40)*(0.1488) = 5.952
z 51 =
1.595 −1.8 − 0.205
1.795 −1.8 0.005
=
z 62 =
=
= -0.51
= 0.01
0.4
0 .4
0.4
0.4
de la tabla A.3. encontramos que el área entre z 61 y z62 es
P(-0.51 < z < 0.01) = P(z < 0.01) – P(z < -0.51) = 0.4960 – 0.3050 = 0.191
De aquí, la frecuencia esperada para la sexta clase es
e6 = (40)*(0.191) = 7.64
z 61 =
1.795 −1.8 0.005
1.995 −1.8 0.195
=
z 72 =
=
= 0.01
= 0.49
0.4
0.4
0 .4
0.4
de la tabla A.3. encontramos que el área entre z 71 y z72 es
P(0.01 < z < 0.49) = P(z < 0.49) – P(z < 0.01) = 0.6879 – 0.4960 = 0.1919
De aquí, la frecuencia esperada para la séptima clase es
e7 = (40)*(0.1919) = 7.676
z 71 =
1.995 −1.8 0.195
2.195 −1.8 0.395
=
z 82 =
=
= 0.49
= 0.99
0 .4
0 .4
0.4
0.4
de la tabla A.3. encontramos que el área entre z 81 y z82 es
P(0.49 < z < 0.99) = P(z < 0.99) – P(z < 0.49) = 0.8389 – 0.6879 = 0.151
De aquí, la frecuencia esperada para la octava clase es
e8 = (40)*(0.151) = 6.04
z 81 =
2.195 −1.8 0.395
2.395 −1.8 0.595
=
z 92 =
=
= 0.99
= 1.49
0.4
0.4
0.4
0 .4
de la tabla A.3. encontramos que el área entre z 91 y z92 es
P(0.99 < z < 1.49) = P(z < 1.49) – P(z < 0.99) = 0.9319 – 0.8389 = 0.093
De aquí, la frecuencia esperada para la novena clase es
e9 = (40)*(0.093) = 3.72
z 91 =
2.395 −1.8 0.595
+ ∞ − 1 .8 + ∞
=
z102 =
=
= +∞
= 1.49
0.4
0.4
0.4
0.4
de la tabla A.3. encontramos que el área entre z 101 y z102 es
P(1.49 < z < + ∞) = P(z < + ∞) – P(z < 1.49) = 1 – 0.9319 = 0.0681
De aquí, la frecuencia esperada para la décima clase es
e9 = (40)*(0.0681) = 2.724
z101 =
i
1
2
3
4
5
6
7
8
9
P(x = xi)
0,006
0,0162
0,0433
0,0907
0,1488
0,191
0,1919
0,1510
0,0930
Lafata Desio Fernando, Warlet Iván Lautaro
ei = mpi
0,240
0,648
1,732
3,628
5,952
7,640
7,676
6,040
3,72
oi
1
1
1
2
4
13
8
5
3
j
1
2
3
4
5
6
Página 90 de 104
Cátedra: Probabilidad y Estadística
UADER
10
Totales
Trabajo Final
6 de Agosto de 2008
0,0681
~1
2,724
40
2
40
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de diez a seis, lo que tiene como resultado υ = 5 grados de libertad.
Con nuestros datos el valor χ2 está dado entonces por
(
)
2
n oi − ei
( 5 − 6.248) 2 + ( 4 − 5.952) 2 + (13 − 7.64) 2 + ( 8 − 7.676) 2 + ( 5 − 6.04 ) 2 + ( 5 − 6.444 ) 2 =
=
ei
6.248
5.952
7.64
7.676
6.04
6.444
i =1
1.56
3.81
28.73
0.10
1.08
=
+
+
+
+
+ 2.08 ≅ 5.166
6.248 5.952
7.64
7.676 6.04 6.444
χ2 = ∑
2
Para un nivel de significancia igual a α, encontramos el valor critico χα
de la tabla A.5., y entonces
χ 2 > χ α2 constituye la región critica.
Con el uso de la tabla A.5., encontramos χ02.01 = 15.086 con υ = 5 grados de libertad.
Respuesta:
Como χ 2 < χ α2 , 5.166 < 15.086, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es normal.
Problema 54 (Ref: Pág. 353 – Ej. 12)
En un experimento para estudiar la dependencia de la hipertensión de los hábitos de fumar, se tomaron
los siguientes datos de 180 individuos:
Con hipertensión
Sin hipertensión
No
fumadores
21
48
Fumadores
modernos
36
26
Fumadores
empedernidos
30
19
Pruebe la hipótesis de que la presencia y ausencia de hipertensión es independiente de los hábitos de
fumar. Utilice un nivel de significancia de 0.05.
Datos:
Tamaño de la muestra
n = 180 individuos.
Hipótesis nula
Hipótesis alternativa
H0: independientes.
H 1: dependientes.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 91 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Nivel de significancia
α = 0.05.
Incógnita:
Dependencia o no de la hipertensión de los hábitos de fumar.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 2
siguientes eventos.
N: Un individuo seleccionado es no fumador.
M: Un individuo seleccionado es fumador moderado.
E: Un individuo seleccionado es fumador empedernido.
S: Un individuo seleccionado tiene hipertensión.
C: Un individuo seleccionado no tiene hipertensión.
×
3 y definimos los
Tabla de contingencia 2 X 3:
N
C
2
1
S
4
8
Total 6
9
M
3
6
2
6
6
2
E
3
0
1
9
4
9
Total
87
93
180
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad:
P( N ) =
69
≃ 0.383
180
P( M ) =
62
≃ 0.344
180
P( E ) =
49
≃ 0.272
180
P( C ) =
87
≃ 0.483
180
P ( S) =
93
≃ 0.517
180
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
P( N  C ) = P( N ) P( C ) =
P ( N  S) = P ( N ) P ( S) =
( 69)( 87 )
180
( 69)( 93)
180
Lafata Desio Fernando, Warlet Iván Lautaro
≃ 33.35
≃ 35.65
Página 92 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
P ( M  C ) = P( M ) P( C ) =
P ( M  S) = P ( M ) P ( S) =
P( E  C ) = P ( E ) P( C ) =
P ( E  S) = P ( E ) P ( S) =
( 62)( 87 )
180
( 62 )( 93)
180
( 49)( 87 )
180
( 49 )( 93)
180
≃ 29.97
≃ 32.03
≃ 23.68
≃25.32
Con las frecuencias esperadas rearmamos la tabla de contingencia:
N
33.3
5
S
35.6
5
Total 69
C
M
29.9
7
32.0
3
62
E
23.6
8
25.3
2
49
Total
87
93
180
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, que dice:
Calcular
χ
2
=∑
i
( o i − ei ) 2
ei
Donde la suma se extiende a todas las celdas rc en la tabla de contingencia r X c. Si χ 2 > χ α2 con
υ = (r - 1)(c - 1) grados de libertad, rechazar la hipótesis nula de independencia al nivel de significancia α;
en cualquier otro caso, aceptar la hipótesis nula.
Aplicando este criterio con nuestros datos, encontramos que:
(
n o − ei
χ2 = ∑ i
ei
i =1
) 2 ( 21 − 33.35) 2 ( 36 − 29.97) 2 ( 30 − 23.68) 2 ( 48 − 35.65) 2 ( 26 − 32.03) 2 (19 − 25.32) 2
=
+
+
+
+
+
=
33.35
29.97
23.68
35.65
32.03
25.32
152.52 36.36 39.94 152.52 36.36 39.94
+
+
+
+
+
= 14.46
33.35 29.97 23.68 35.65 32.03 25.32
Si χ 2 > χ α2 con υ =(r – 1)(c – 1) grados de libertad, rechazar la hipótesis nula de independencia.
=
De la tabla A.5. encontramos que χ02.05 = 5.991 para υ = (2 – 1)(3 – 1) = 2 grados de libertad.
Respuesta:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 93 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Como χ 2 > χ α2 , 14.46 > 5.991, se rechaza la hipótesis nula. Concluimos que la presencia o ausencia de
hipertensión y el hábito de fumar no son independientes.
Problema 55 (Ref: Pág. 354 – Ej. 14)
Una muestra aleatoria de 200 hombres casados, todos retirados, se clasifica de acuerdo con la
educación y el número de hijos:
Educación
Elemental
Secundaria
Universidad
0-1
14
19
12
Número de hijos
2-3
Over 3
37
32
42
17
17
10
Prueba la hipótesis, con un nivel de significancia de 0.05, de que el tamaño de la familia es
independiente del nivel de instrucción del padre.
Datos:
Tamaño de la muestra
n = 200 hombres casados.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 94 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Hipótesis nula
Hipótesis alternativa
H0: independientes.
H1: dependientes.
Nivel de significancia
α = 0.05.
Incógnita:
Dependencia o no del tamaño de la familia del nivel de instrucción del padre.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 3
siguientes eventos.
E: Un hombre seleccionado tiene un nivel de educación elemental.
S: Un hombre seleccionado tiene un nivel de educación secundaria.
U: Un hombre seleccionado tiene un nivel de educación universitaria.
0: Un hombre seleccionado tiene a lo más un hijo.
2: Un hombre seleccionado tiene entre dos y tres hijos.
3: Un hombre seleccionado tiene más de tres hijos.
×
3 y definimos los
Tabla de contingencia 3 X 3:
0
1
4
S
1
9
U
1
2
Total 4
5
E
2
3
7
4
2
1
7
9
6
3
3
2
1
7
1
0
5
9
Total
83
78
39
200
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad:
P( E ) =
83
≃ 0.415
200
78
≃ 0.39
200
39
P( U ) =
≃0.195
200
P ( S) =
P( 0 ) =
45
≃ 0.225
200
P( 2 ) =
96
≃ 0.48
200
P ( 3) =
59
≃ 0.295
200
Lafata Desio Fernando, Warlet Iván Lautaro
Página 95 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
( 83)( 45)
P ( E  0 ) = P ( E ) P( 0 ) =
( 83)( 96)
P( E  2 ) = P( E ) P( 2 ) =
P ( S  2 ) = P ( S) P ( 2 ) =
P( S  3) = P( S) P( 3) =
≃ 39.84
200
( 83)( 59)
P( E  3) = P( E ) P( 3) =
P ( S  0 ) = P ( S) P ( 0 ) =
≃ 18.675
200
≃ 24.485
200
( 78)( 45)
200
( 78)( 96)
200
( 78)( 59)
200
P ( U  0 ) = P( U ) P( 0 ) =
P ( U  2 ) = P( U ) P( 2 ) =
P ( U  3) = P ( U ) P ( 3) =
≃ 17.55
≃ 37.44
≃ 23.01
( 39)( 45)
200
( 39)( 96)
200
( 39)( 59 )
200
≃ 8.775
≃18.72
≃ 11.505
Con las frecuencias esperadas rearmamos la tabla de contingencia:
S
0
18.67
5
17.55
U
8.775
E
Total 45
2
39.8
4
37.4
4
18.7
2
96
3
24.48
5
23.01
Total
83
11.50
5
59
39
78
180
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos:
χ
2
=
(
n oi − ei
= ∑
i =1
ei
)2
=
(14 − 18.675 ) 2
18.675
+
( 37 − 39.84 ) 2
39.84
+
( 32 − 24.485 ) 2
24.485
+
(19 − 17.55 ) 2
17.55
+
( 42 − 37.44 ) 2
+
37.44
(17 − 23.01) 2
+
23.01
21.85
8.06
56.47
2.10
20.79 36.12 10.40
2.95
2.26
+
+
+
+
+
+
+
+
= 7.46
18.675 39.84 24.485 17.55 37.44 23.01 8.775 18.72 11.505
Si χ 2 > χ α2 con υ =(r – 1)(c – 1) grados de libertad, rechazar la hipótesis nula de independencia.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 96 de 104
(12 − 8.775 ) 2
8.775
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
De la tabla A.5. encontramos que χ02.05 = 9.488 para υ = (3 – 1)(3 – 1) = 4 grados de libertad.
Respuesta:
Como χ 2 < χ α2 , 7.46 < 9.488, no se rechaza la hipótesis nula. Concluimos que el tamaño de la familia es
independiente del nivel de instrucción del padre.
Problema 56 (Ref: Pág. 354 – Ej.15)
Un criminólogo realizó una investigación para determinar si la incidencia de ciertos tipos de crímenes
varían de una parte otra en una ciudad grande. Los crímenes particulares de interés son asalto, robo,
hurto y homicidio. La siguiente tabla muestra el número de crímenes cometidos en cuatro áreas de la
ciudad durante el año pasado.
Distrito
1
2
3
Asalto
162
310
258
Tipo de crimen
Robo
Hurto
118
451
196
996
193
458
Lafata Desio Fernando, Warlet Iván Lautaro
Homicidio
18
25
10
Página 97 de 104
Cátedra: Probabilidad y Estadística
UADER
4
Trabajo Final
6 de Agosto de 2008
280
175
390
19
Datos:
Tamaño de la muestra
n = 4159.
Hipótesis nula
Hipótesis alternativa
H0: independientes.
H1: dependientes.
Nivel de significancia
α = 0.01.
Incógnita:
Dependencia o no del tamaño de la familia del nivel de instrucción del padre.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 4
siguientes eventos.
A: El tipo de crimen es asalto.
R: El tipo de crimen es robo.
U: El tipo de crimen es hurto
H: El tipo de crimen es homicidio
1: El distrito seleccionado es el 1.
2: El distrito seleccionado es el 2.
3: El distrito seleccionado es el 3.
4: El distrito seleccionado es el 4
×
4 y definimos los
Tabla de contingencia 4 X 4:
1
A
162
2
310
3
358
4
280
Total 111
0
R
11
8
19
6
19
3
17
5
68
2
U
451
996
458
390
229
5
H
1
8
2
5
1
0
1
9
7
2
Total
749
1527
1019
864
4159
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad:
1110
≃ 0.27
4159
682
P( R ) =
≃ 0.16
4159
P( A ) =
P( U ) =
2295
≃0.55
4159
Lafata Desio Fernando, Warlet Iván Lautaro
Página 98 de 104
Cátedra: Probabilidad y Estadística
UADER
P( H ) =
Trabajo Final
6 de Agosto de 2008
72
≃0.02
4159
P(1) =
749
≃ 0.18
4159
P( 2 ) =
1527
≃ 0.37
4159
P( 3) =
1019
≃ 0.24
4159
P( 4 ) =
864
≃ 0.21
4159
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
(1110 )( 749)
P( A  1) = P( A ) P (1) =
4159
P( U  1) = P( U ) P(1) =
P( A  2 ) = P( A ) P( 2 ) =
P ( U  2 ) = P( U ) P ( 2 ) =
( 2295)( 749)
≃ 413.31
4159
(1110)(1527 )
( 2295)(1527 )
4159
4159
P( U  3) = P( U ) P( 3) =
P( A  4 ) = P( A ) P ( 4 ) =
P( U  4 ) = P( U ) P( 4 ) =
≃ 407.55
4159
(1110)(1019)
P( A  3) = P( A ) P( 3) =
P( R  1) = P( R ) P(1) =
≃ 199.90
≃ 271.96
( 2295)(1019)
4159
(1110)( 864)
≃ 562.30
≃ 230.59
4159
( 2295)( 864)
4159
≃ 842.62
≃ 476.77
( 682)( 749)
≃ 122.82
4159
( 72)( 749)
P( H  1) = P( H ) P(1) =
≃ 12.97
4159
P( R  2 ) = P( R ) P ( 2 ) =
( 682 )(1527 )
4159
Lafata Desio Fernando, Warlet Iván Lautaro
≃ 250.40
Página 99 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
P ( H  2 ) = P( H ) P( 2 ) =
P( R  3) = P( R ) P( 3) =
4159
( 682 )(1019)
4159
P( H  3) = P( H ) P( 3) =
P( R  4 ) = P( R ) P ( 4 ) =
( 72)(1527 )
( 72)(1019)
4159
( 682)( 864)
P ( H  4 ) = P( H ) P ( 4 ) =
4159
( 72)( 864)
4159
≃ 26.43
≃ 167.10
≃ 17.64
≃ 141.68
≃ 14.96
Con las frecuencias esperadas rearmamos la tabla de contingencia:
1
A
199.9
2
407.5
5
3
271.9
6
4
230.5
9
Total 1110
R
122.8
2
250.4
167.1
0
141.6
8
682
U
413.3
1
842.6
2
562.3
0
476.7
7
2295
H
12.9
7
26.4
3
17.6
4
14.9
6
72
Total
749
1527
1019
864
4159
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos:
(
)
2
n o − ei
(162 −199.9 ) 2 + (118 −122.82 ) 2 + ( 451 − 413.31) 2 + (18 −12.96 ) 2 + ( 310 − 407.54 ) 2 + (196
χ2 = ∑ i
=
ei
199.9
122.82
413.31
12.96
407.54
i =1
( 25 − 26.43) 2 + ( 358 − 271.96 ) 2 + (193 −167.09 ) 2 + ( 458 − 562.3) 2 + (10 −17.64 ) 2 + ( 280 − 230.59 ) 2 + (175 −
+
26.43
271.96
167.09
562.3
17.64
230.59
14
2
(19 −14.96 ) = 1436.41 + 23.23 + 1420.53 + 25.40 + 9514.05 + 2959.36 + 23525.42 + 2.04 + 7402.88 + 671.3
+
14.96
199.9
122.82
413.31
12.96
407.54
250.4
842.62
26.43
271.96
167.09
1096.27
7527.29 16.32
+
+
=165.01
141.89
476.76
14.96
Si χ 2 > χ α2 con υ =(r – 1)(c – 1) grados de libertad, rechazar la hipótesis nula de independencia.
De la tabla A.5. encontramos que χ02.01 = 21.666 para υ = (4 – 1)(4 – 1) = 9 grados de libertad.
Respuesta:
Como χ 2 > χ α2 , 165.01 > 21.666, se rechaza la hipótesis nula. Concluimos que el tipo de crimen no es
independiente del distrito de la ciudad.
Problema 57 (Ref: Pág. 354 – Ej. 16)
La enfermería de una universidad realiza un experimento para determinar el grado de alivio que
proporcionan tres remedios para la tos. Cada remedio para la tos se trata en cincuenta estudiantes y se
registran los siguientes datos:
Lafata Desio Fernando, Warlet Iván Lautaro
Página 100 de 104
Cátedra: Probabilidad y Estadística
UADER
Sin alivio
Cierto alivio
Alivio completo
Trabajo Final
6 de Agosto de 2008
Remedio para la tos
NyQuil Robitussin
Triaminic
11
13
9
32
28
27
7
9
14
Pruebe la hipótesis, con un nivel de significancia de 0.05, de que los tres remedios para la tos son
igualmente efectivos.
Datos:
Tamaño de la muestra
n = 150 estudiantes.
Hipótesis nula
Hipótesis alternativa
H0: los tres remedios son igualmente efectivos.
H1: los tres remedios no son igualmente efectivos.
Nivel de significancia
α = 0.05.
Incógnita:
Homogeneidad o no entre los remedios.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 3
siguientes eventos.
S: El remedio no proporciona alivio.
A: El remedio proporciona cierto alivio.
C: El remedio proporciona alivio completo.
N: El remedio seleccionado es NyQuil.
R: El remedio seleccionado es Robitussin.
T: El remedio seleccionado es Triaminic.
×
3 y definimos los
Tabla de contingencia 3 X 3:
N
1
1
3
2
7
R
1
3
2
8
9
Total 5
0
5
0
S
A
C
T
9
Total
33
2
7
1
4
5
0
87
30
150
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad.
P ( S) =
33
= 0.22
150
Lafata Desio Fernando, Warlet Iván Lautaro
Página 101 de 104
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
87
≃ 0.053
150
30
P( C ) =
= 0.2
150
P( A ) =
P( N ) =
50
≃ 0.33
150
P( R ) =
50
≃ 0.33
150
P( T ) =
50
≃ 0.34
150
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
( 33)( 50)
P ( S  N ) = P ( S) P ( N ) =
( 33)( 50 )
P ( S  R ) = P ( S) P ( R ) =
P ( S  T ) = P ( S) P ( T ) =
150
( 33)( 5)
150
P( A  N ) = P( A ) P( N ) =
P( A  R ) = P( A ) P( R ) =
P( A  R ) = P( A ) P( R ) =
P( C  R ) = P ( C ) P ( R ) =
= 11
= 11
( 87 )( 50)
= 29
150
( 87 )( 50)
150
( 87 )( 50)
150
P( C  N ) = P( C ) P( N ) =
P( C  R ) = P ( C ) P ( R ) =
= 11
150
= 29
= 29
( 30)( 50)
150
( 30)( 50)
150
( 30)( 50)
150
= 10
=10
= 10
Con las frecuencias esperadas rearmamos la tabla de contingencia:
S
N R T
1 1 1
Total
33
Lafata Desio Fernando, Warlet Iván Lautaro
Página 102 de 104
Cátedra: Probabilidad y Estadística
UADER
1
2
9
C
1
0
Total 5
0
A
1
2
9
1
0
5
0
1
2
9
1
0
5
0
Trabajo Final
6 de Agosto de 2008
87
30
150
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos:
χ
2
(
n oi − ei
= ∑
i =1
ei
=0+
) 2 ( 11 − 11) 2 ( 13 − 11) 2 ( 9 − 11) 2 ( 32 − 29 ) 2 ( 28 − 29 ) 2 ( 27 − 29 ) 2 ( 7 − 10 ) 2 ( 9 − 10 ) 2 ( 14 − 10 ) 2
=
+
11
+
11
+
11
+
29
+
29
+
29
+
+
10
10
10
4
4
9
1
4
9
1 16
+
+
+
+
+
+
+
= 3.81
11 11 29 29 29 10 10 10
Si χ 2 > χ α2 con υ =(r – 1) (c – 1) grados de libertad, rechazar la hipótesis nula de independencia.
De la tabla A.5. encontramos que χ02.05 = 9.488 para υ = (3 – 1) (3 – 1) = 4 grados de libertad.
Respuesta:
Como χ 2 < χ α2 , 3.81 < 9.488, no se rechaza la hipótesis nula. Concluimos que los tres remedios son
igualmente efectivos.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 103 de 104
=
Cátedra: Probabilidad y Estadística
UADER
Trabajo Final
6 de Agosto de 2008
Bibliografías:
 Walpole, Myers y Myers, “Probabilidad y Estadística para Ingenieros”, sexta
edición.
 Apuntes de la cátedra.
 Los recursos computacionales utilizados: Calculadora científica, EasyFit (versión
gratuita), Excel 2007 y Word 2007.
Lafata Desio Fernando, Warlet Iván Lautaro
Página 104 de 104
Descargar