Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 1 (Ref: Pág. 223 - Ej. 5) Una máquina de refrescos se ajusta para que la cantidad de bebida que sirve promedie 240 mililitros con una desviación estándar de 15mililitros. La máquina se verifica periódicamente tomando una muestra de 40 bebidas y se calcula el contenido promedio. Si la media de las 40 bebidas es un valor dentro del intervalo μ x ± 2σ x , se piensa que la máquina opera satisfactoriamente, de otra forma, se ajusta. En la sección 8.4, el funcionario de la compañía encuentra que la media de 40 bebidas es x = 236 mililitros y concluye que la máquina no necesita un ajuste ¿Esta fue una decisión razonable? Datos: Variable aleatoria Tamaño de la muestra Desviación estándar poblacional Media poblacional Media muestral Desviación estándar muestral X: cantidad de bebida que sirve una máquina (en mililitros). n = 40 bebidas. σx = 15 mililitros. μx = 240 mililitros. x = μ x = 240 mililitros. σ σ x = x ≃2.3717 mililitros. n Incógnita: μ x − 2σ x ≤ x ≤ μ x + 2σ x Solución: Reemplazando con nuestros datos 240 ml. – (2)(2.372 ml.) ≤ x ≤ 240 ml. + (2)(2.372 ml.) 240 ml. – 4.744 ml. ≤ x ≤ 240 ml. + 4.744 ml. 235.257 ml. ≤ x ≤ 244.743 ml. Respuesta: Esta fue una decisión razonable puesto que 236 ml., que es la media encontrada se encuentra dentro del intervalo definido. Lafata Desio Fernando, Warlet Iván Lautaro Página 1 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 2 (Ref: Pág. 223 - Ej. 9) La vida media de una máquina para hacer pasta es de siete años, con una desviación estándar de un año. Suponga que las vidas de estas máquinas siguen aproximadamente una distribución normal, encuentre: a) La probabilidad de que la vida media de una muestra aleatoria de nueve de estas máquinas caiga entre 6.4 y 7.2 años; b) El valor de x a la derecha del cual caería el 15% de las medias calculadas de muestras aleatorias de tamaño nueve. Datos: Variable aleatoria Media poblacional Desviación estándar poblacional Tamaño de la muestra X: vida útil de una máquina de hacer pasta (en años). μx = 7 años. σx = 1 año. n = 9 máquinas. X ~ N( μ x , σ x ) ⇒ μ x = μ x = 7 (años) σ 1 1 σx = x = = (años ) n 9 3 a) Incógnita: P(6.4 ≤ x ≤ 7.2) Solución: 6.4 − 7 X − μx 7.2 − 7 P ≤ ≤ = P( −1.8 ≤ z ≤ 0.6 ) = P( z ≤ 0.6 ) − P( z ≤ −1.8) =⇒ σx 1 13 3 n Aplicando Tabla A.3. = 0.7257 – 0.0359 = 0.6898 = 68.98%. Respuesta: La probabilidad de que la vida media de una muestra de 9 de esas máquinas caiga entre 6.4 años y 7.2 años es del 68.98%. b) Incógnita: Un valor de x que deje a su derecha un área del 15% y por lo tanto un área del 85% a su izquierda. Solución: Con µx = 7 años y α = 1 − 0.15 = 0.85 _ _ Zα = Z 0.85 = 1.04 ⇒ Z 0.85 _ x −7 1 = ⇒ (1.04) * + 7 = x = 7.346667 Años 1 3 3 x = 7.35 años Lafata Desio Fernando, Warlet Iván Lautaro Página 2 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Respuesta: El valor de x que deja a su derecha un área del 15% es 7.35 años. Problema 3 (Ref: Pág. 223/224 - Ej. 10) El tiempo que el cajero de un banco con servicio en el automóvil atiende a un cliente es una variable aleatoria con media μ = 3.2 minutos y una desviación estándar σ = 1.6 minutos. Si se observa una muestra aleatoria de 64 clientes, encuentre la probabilidad de que su tiempo medio con el cajero sea: a) a lo más 2.7 minutos; b) más de 3.5 minutos; c) al menos 3.2 minutos pero menos de 3.4 minutos. Datos: Variable aleatoria Media poblacional Desviación estándar poblacional Tamaño de la muestra X: tiempo que un cajero atiende a un cliente (en minutos). μx = 3.2 minutos. σx = 1.6 minutos. n = 64 clientes. X ~ N( μ x , σ x ) ⇒ μ x = μ x = 3.2 (años) σx = σx n = 1.6 64 = 1 .6 (años ) 8 a) Incógnita: P( x ≤ 2.7) Solución: X − μx 2.7 − 3.2 P ≤ = P( z ≤ −2.5) = Aplicando Tabla A.3. = 0.0062 = 0.62% 1.6 σx 8 n Respuesta: La probabilidad de que el tiempo promedio de los cliente con el cajero sea a lo más 2.7 minutos es de 0.62%. b) Incógnita: P( x > 3.5) Solución: X − μx 3.5 − 3.2 P > = P( z >1.5) =1 − P( z ≤ .5) =1 − 0.9332 = Aplicando Tabla A.3. = 0.0668 = 1.6 σx n 64 6.68%. Respuesta: La probabilidad de que el tiempo promedio de los cliente con el cajero sea más 3.5 minutos es de 6.68%. c) Incógnita: P(3.2 ≤ x ≤ 3.4) Solución: 3.2 − 3.2 X − μx 3.4 − 3.2 P ≤ ≤ = P( 0 ≤ z ≤ 1) = P( z ≤ 1) − P( z ≤ 0 ) =⇒ σx 1.6 1.6 64 n 64 Aplicando Tabla A.3 = 0.8413 – 0.5000 = 0.3413 = 34.13%. Lafata Desio Fernando, Warlet Iván Lautaro Página 3 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Respuesta: La probabilidad de que el tiempo promedio de los cliente con el cajero este entre 3.2 y 3.4 minutos es de 34.13%. Problema 4 (Ref: Pág. 224 - Ej. 12) Se toma una muestra aleatoria de tamaño 25 de una población normal que tiene una media de 80 y una desviación estándar de 5. Una segunda muestra aleatoria de tamaño 36 se toma de una población normal diferente que tiene una media de 75 y una desviación estándar de 3. Encuentre la probabilidad de que la media muestral calculada de las 25 mediciones exceda de media muestral calculada de las 36 mediciones por al menos 3.4 pero en menos de 5.9. Suponga que las medias se miden al décimo más cercano. Datos: Tamaño de la primer muestra n1 = 25. Media de la primer población μ1= 80. Desviación estándar de la primer población σ1 = 5. Tamaño de la segunda muestra n2 = 36. Media de la segunda población μ2= 75. ( ) X 1 ~ N μ x1 , σ x1 ⇒ μ x1 = μ x1 = 80 σ x1 = ( σx 1 n1 = 5 25 =1 ) X 2 ~ N μ x 2 , σ x 2 ⇒ μ x 2 = μ x 2 = 75 σ x2 = Desviación estándar de la segunda población σ2 = 3. σx 2 n2 = 3 36 = 1 2 Incógnita: P( 3.4 ≤ ( X1 − X 2 ) ≤ 5.9 ) Solución: Utilizando el Teorema 8.3; el que dice: Si se extraen al azar muestras independientes de tamaño n 1 y n 2 de dos poblaciones, discreta o continuas, con medias μ 1 y μ 2 y varianzas σ 12 y σ 22 , respectivamente, entonces la distribución muestral de las diferencias de las medias, X 1 − X 2 , está distribuida aproximadamente de forma normal con media y varianza dadas por μ x1 - x1 = μ 1 − μ 2 σ 2x1 - x 2 = y σ 12 σ 22 + . n1 n 2 De aquí Z= (X − X ) − (μ (σ n ) + (σ 1 2 1 2 1 1 2 2 − μ2 ) n2 ) es aproximadamente una variable normal estándar. con nuestros datos: Lafata Desio Fernando, Warlet Iván Lautaro Página 4 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 μ x1 - x 2 = 80 – 75 = 5 σ x1 - x 2 = y 25 9 + = 1.118 25 36 3.4 −5 X −X − μ −μ 5.9 −5 1 2 1 2 =P(−1.4311 ≤z ≤0.8050 ) = P 3.4 ≤ X1 −X 2 ≤5.9 =P ≤ ≤ 1.118034 1.118034 σ 2 σ 2 1 2 + n n 1 2 ( ( ) ) ( ) ( ) = P(z ≤ 0.8050) − P( z ≤ −1.4311) =⇒Aplicando Tabla A.3. = 0.7896 – 0.0762 = 0.7134 = 71.34%. Respuesta: La probabilidad de que la media muestral calculada de las 25 mediciones exceda de media muestral calculada de las 36 mediciones por al menos 3.4 pero en menos de 5.9 es de 71.34%. Problema 5 (Ref: Pág. 236 - Ej. 1) Lafata Desio Fernando, Warlet Iván Lautaro Página 5 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Para una distribución ji cuadrada encuentre. 2 a) χ 0.025 cuando υ = 15; 2 b) χ 0.01 cuando υ = 7; 2 c) χ 0.05 cuando υ = 24. 2 a) Según Tabla A.5 χ 0.025 cuando υ = 15 => 27.488 Respuesta: El valor χ2 con 15 grados de libertad, que deja un área de 0.025 a su derecha es 27.488. Gráfica: Lafata Desio Fernando, Warlet Iván Lautaro Página 6 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 2 b) Según Tabla A.5 χ 0.01 cuando υ = 7 => 18.475 Respuesta: El valor χ2 con 7 grados de libertad, que deja un área de 0.01 a su derecha es 18.475. Gráfica: 2 c) Según Tabla A.5 χ 0.05 cuando υ = 24 => 36.415 Lafata Desio Fernando, Warlet Iván Lautaro Página 7 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Respuesta: El valor χ2 con 24 grados de libertad, que deja un área de 0.05 a su derecha es 36.415. Gráfica: Problema 6 (Ref: Pág. 236 - Ej. 3) Lafata Desio Fernando, Warlet Iván Lautaro Página 8 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Para una distribución ji cuadrada encuentre χ α2 tal que: a) P(χ2 > χ α2 ) = 0.99 cuando υ = 4; b) P(χ2 > χ α2 ) = 0.025 cuando υ = 19; c) P(37.652 < χ2 < χ α2 ) = 0.045 cuando υ = 25. a) P(χ2 > χ α2 ) = 0.99 cuando υ = 4 Según Tabla A.5 => χ α2 = 0.297 Respuesta: El valor de χ2 que deja a su derecha una probabilidad igual a 0.99 es decir 99 %, con 4 grados de libertad es 0.297. b) P(χ2 > χ α2 ) = 0.025 cuando υ = 19 Lafata Desio Fernando, Warlet Iván Lautaro Página 9 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Según Tabla A.5 => χ α2 = 32.852 Respuesta: El valor de χ2 que deja a su derecha una probabilidad igual a 0.025 es decir 2.5 %, con 19 grados de libertad es 32.852. Gráfica: Lafata Desio Fernando, Warlet Iván Lautaro Página 10 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 c) P(37.652 < χ2 < χ α2 ) = 0.045 cuando υ = 25 => χ α2 = 37.652 => α = 0.05 2 => α = 0.05 - 0.045 = 0.005 => χ α2 = χ 0.005 cuando υ = 25 2 Según Tabla A. 5 => χ 0.005 = 46.928 Respuesta: El valor de χ2 debe ser igual a 46.928 para que la probabilidad entre 37.652 y dicho valor calculado sea igual a 0.045, es decir 4.5%, con 25 grados de libertad. Gráfica: Problema 7 (Ref: Pág. 236 – Ej. 5) Lafata Desio Fernando, Warlet Iván Lautaro Página 11 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza σ2 = 6, tenga una varianza s2 a) mayor que 9.1; b) entre 3.462 y 10.745. Suponga que las varianzas muestrales son mediciones continuas. Datos: Tamaño de la muestra Varianza de la muestra n = 25 observaciones. σ2 = 6. a) Incógnita: P (s2 > 9.1) Solución: χ 2 ( n − 1) s 2 = σ2 con (n – 1) grados de libertad con nuestros datos: ( 25 − 1)( 9.1) = ( 24)( 9.1) = 218.4 = 36.4 χ2 = 6 6 6 Según Tabla A.5 χ 2 = 36.4 cuando υ = 24 =>0.05 Respuesta: La probabilidad de que la varianza de esa muestra sea mayor que 9.1 es del 5%. b) Incógnita: P (3.462 ≤ s2 ≤ 10.745) Solución: χ2 = ( n − 1)s 2 σ2 con (n – 1) grados de libertad con nuestros datos: ( 25 − 1)( 3.462) = 24 × 3.462 = 83.088 = 13.848 χ2 = 6 6 6 2 χ = 13 . 848 Según Tabla A.5 cuando υ = 24 =>0.95 χ2 = ( 25 − 1) ×10.745 = 24 ×10.745 = 257.88 = 42.98 6 6 6 Según Tabla A.5 χ 2 = 42.98 cuando υ = 24 =>0.01 P (3.462 ≤ s2 ≤ 10.745) = 0.95 – 0.01 = 0.94 Respuesta: La probabilidad de que la varianza de esa muestra se encuentre entre 3.462 y 10.745 es del 94%. Problema 8 (Ref: Pág. 236 – Ej. 6) Lafata Desio Fernando, Warlet Iván Lautaro Página 12 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Las clasificaciones de un examen de colocación que se aplicó a estudiantes de primer año de licenciatura durante los últimos cinco años están aproximadamente distribuidas de forma normal con una media μ = 74 y una varianza σ2 = 8. ¿Consideraría aún que σ2 =8 es un valor válido de la varianza si una muestra aleatoria de 20 estudiantes que realizan este examen de colocación este año obtienen un valor de s2 = 20? Datos: P: estudiantes de primer año de licenciatura. X: calificación de un examen de colocación. Media poblacional Varianza poblacional Tamaño de la muestra Varianza muestral μx = 74. σ 2x = 8. n = 20 estudiantes. s2 = 20. ( X ~ N μ x = 74, σ x = 8 ) Incógnita: Considerar si es válida σ 2x = 8 Solución: χ2 = ( n − 1)s 2 σ2 con (n – 1) grados de libertad con nuestros datos χ2 = ( 20 − 1)( 20) = (19)( 20) = 380 = 47.5 8 2 χ 0..975 = 8.907 8 8 2 χ 0.025 = 32.852 Respuesta: Es un valor de una distribución ji cuadrada con 19 grados de libertad. Como 95% de los valores χ2 con 19 grados de libertad caen entre 8.907 y 32.852, el valor calculado con σ 2 = 8 no es razonable y por lo tanto se tiene razón suficiente para sospechar que la varianza es diferente a ocho. Es muy probable que el valor supuesto de σ2 sea un error. Problema 9 (Ref: Pág. 236 – Ej. 8) Lafata Desio Fernando, Warlet Iván Lautaro Página 13 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 a) Encuentre t0.025 cuando υ =14; b) Encuentre –t0.10 cuando υ = 10; c) Encuentre t0.995 cuando υ =7. a) Según Tabla A.4 t0.025 cuando υ =14 => 2.145 Respuesta: El valor t con 14 grados de libertad, que deja un área de 0.025 a su derecha es 2.145. Gráfica: b) Según Tabla A.4 –t0.10 cuando υ = 10 => -1.372 Lafata Desio Fernando, Warlet Iván Lautaro Página 14 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Respuesta: El valor t con 10 grados de libertad, que deja un área de 0.10 a su izquierda es -1.372. Gráfica: Lafata Desio Fernando, Warlet Iván Lautaro Página 15 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 c) Según Tabla A.4 t0.995 cuando υ =7 => -3.499 Respuesta: El valor t con 7 grados de libertad, que deja un área de 0.995 a su derecha y por lo tanto un área de 0.005 a su izquierda es -3.499. Gráfica: Problema 10 (Ref: Pág. 236 – Ej. 9) Lafata Desio Fernando, Warlet Iván Lautaro Página 16 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 a) Encuentre P(T < 2.365) cuando υ =7; b) Encuentre P(T > 1.318) cuando υ = 24; c) Encuentre P(-1.356 < T <2.179) cuando υ =12; d) Encuentre P(T > -2.567) cuando υ =17. a) P(T < 2.365) cuando υ =7 1 – P(T ≥ 2.365) cuando υ =7 Según Tabla A.4 => = 1 – 0.025 = 0.975 Respuesta: La probabilidad de que un valor t sea menor que 2.365 con 7 grados de libertad es del 97.5%. Gráfica: Lafata Desio Fernando, Warlet Iván Lautaro Página 17 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 b) P(T > 1.318) cuando υ = 24 Según Tabla A.4 =>0.10 Respuesta: La probabilidad de que un valor t sea mayor que 1.318 con 24 grados de libertad es del 10%. Gráfica: Lafata Desio Fernando, Warlet Iván Lautaro Página 18 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 c) P(-1.356 < T < 2.179) cuando υ =12 P(T ≥ -1.356) – P(T ≥ 2.179) cuando υ =12 Según Tabla A.4 => = (1 – 0.10) – 0.025 = = 0.90 – 0.025 = 0.875 Respuesta: La probabilidad de que un valor t se encuentre entre -1.356 y 2.179 con 12 grados de libertad es del 87.5%. Gráfica: Lafata Desio Fernando, Warlet Iván Lautaro Página 19 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 d) P(T > -2.567) cuando υ =17 1 – P( T > 2.567) cuando υ =17 Según Tabla A.4 => = 1– 0.01 = 0.99 Respuesta: La probabilidad de que un valor t sea mayor que -2.567 con 17 grados de libertad es del 99%. Gráfica: Problema 11 (Ref: Pág. 236 – Ej. 12) Lafata Desio Fernando, Warlet Iván Lautaro Página 20 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Una empresa manufacturera afirma que las baterías que utiliza en sus juegos electrónicos duran un promedio de 30 horas. Para mantener este promedio se prueban 16 baterías cada mes. Si el valor t que se calcula cae entre –t0.025 y t0.025, la empresa queda satisfecha con su afirmación.¿Qué conclusiones extraería la empresa de una muestra que tiene una media de x = 27.5 horas y una desviación estándar de s = 5 horas? Suponga que la distribución de las duraciones de las baterías es aproximadamente normal. Datos: P: baterías de juegos electrónicos. X: rendimiento en horas de una bajaría de juegos electrónicos. Media poblacional μx = 30 horas. Tamaño de la muestra n = 16 baterías. Media muestral x = 27.5 horas. Desviación estándar muestral s = 5 horas. Solución: De la tabla A.4 encontramos que t0.025 = 2.131 para 15 grados de libertad. Por tanto, la empresa queda satisfecha con esta afirmación si una muestra de 16 baterías rinde un valor t entre –2.131 y 2.131. si μ = 30, entonces T= X −μ con (n – 1) grados de libertad s n Con nuestros datos: T= 27.5 − 30 5 16 = −2 , Respuesta: La empresa estaría satisfecha con su afirmación ya que el valor hallado de t pertenece al intervalo establecido como parámetro para poder afirmar que sus baterías promedian las 30 horas de duración. Problema 12 (Ref: Pág. 236 – Ej. 13) Lafata Desio Fernando, Warlet Iván Lautaro Página 21 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Una población normal con varianza desconocida tiene una media de 20. ¿Se tiene posibilidad de obtener una muestra aleatoria de tamaño 9 de esta población con una media de 24 y una desviación estándar de 4.1? Si no, ¿qué conclusión sacaría? Datos: Media poblacional Tamaño de la muestra Media muestral Desviación estándar muestral μx = 20. n = 9. x = 24. s = 4.1. Solución: T= X −μ con (n – 1) grados de libertad s n con nuestros datos: P (│ X - μ│=│ X - 20│ > 4) = = 1 – P (│ X - 20│ ≤ 4) = = 1 – P (-4 ≤ X - 20 ≤ 4) = 4 −4 ≤ X − 20 ≤ =1–P = 4.1 4.1 3 3 = 1 – P (-2.92 ≤ t8 ≤ 2.92) = = P (t8 ≤ 2.92) – P (t8 ≤ 2.92) = 0.00959 + 0.00959 = 0.01918 = 1.918%. Respuesta: Si se tiene la posibilidad de obtener una muestra de tamaño 9 con esas condiciones, con una probabilidad del 1.918% Problema 13 (Ref: Pág. 236 – Ej. 14) Lafata Desio Fernando, Warlet Iván Lautaro Página 22 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Un fabricante de cierta marca de barras de cereal bajo de grasa afirma que su contenido promedio de grasa saturada es 0.5 gramos. En una muestra aleatoria de 8 barras de cereal de esta marca el contenido de grasa saturada fue 0.6, 0.7, 0.7, 0.3, 0.4, 0.5, 0.4 y 0.2. ¿Estaría de acuerdo con la afirmación? Datos: P: barras de cereal bajo de grasa. X: contenido de grasa en gramos de una barra de cereal. Media poblacional μx = 0.5 gramos. Tamaño de la muestra n = 8. n Media muestral x= ∑X i i =1 n = 0.6 + 0.7 + 0.7 + 0.3 + 0.4 + 0.5 + 0.4 + 0.2 3.8 = = 0.475 gramos 8 8 n Desviación estándar muestral i =1 i − X) 2 n −1 ( 0.6 −0.475) 2 +(0.7 −0.475) 2 +(0.7 −0.475) 2 +(0.3−0.475) 2 +(0.4 −0.475) 2 +(0.5 −0.475) 2 +(0.4 −0.475) 2 +(0.2 −0.475 s= = s= ∑ (X 7 ( 0.125) 2 + ( 0.225) 2 + ( 0.225) 2 + ( − 0.175) 2 + ( − 0.075) 2 + ( 0.025) 2 + ( − 0.075) 2 + ( − 0.275) 2 = 7 0.26 = 7 Incógnita: μx = 0.5 Solución: T= X −μ con (n – 1) grados de libertad s n con nuestros datos T= 0.475 −0.5 = 0.3860 0.1832 8 X −μ X −μ0 P ≥ s s n n con nuestros datos P(-0.3860 ≤ t7 ≤ 0.3860) = 0.3754 + 0.3754 = 0.7508 = 75.08%. Respuesta: Hay razones suficiente (75,08%) para considerar que la afirmación es cierta. Problema 14 (Ref: Pág. 236 – Ej. 15) Para una distribución F encuentre: a) ƒ0.05 con υ1 = 7 y υ2 = 15; Lafata Desio Fernando, Warlet Iván Lautaro Página 23 de 104 0.037 ≈ 0.18 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 b) ƒ0.05 con υ1 = 15 y υ2 = 7; c) ƒ0.01 con υ1 = 24 y υ2 = 19; d) ƒ0.95 con υ1 = 19 y υ2 = 24; e) ƒ0.99 con υ1 = 28 y υ2 = 12. a) Según Tabla A.6 ƒ0.05 con υ1 = 7 y υ2 = 15 => 2.71 Respuesta: El valor f con 7 y 15 grados de libertad, que deja un área de 0.05 a su derecha es 2.71. Gráfica: b) Según Tabla A.6 ƒ0.05 con υ1 = 15 y υ2 = 7 => 3.51 Lafata Desio Fernando, Warlet Iván Lautaro Página 24 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Respuesta: El valor f con 15 y 7 grados de libertad, que deja un área de 0.05 a su derecha es 3.51. Gráfica: c) Según Tabla A.6 ƒ0.01 con υ1 = 24 y υ2 = 19 => 2.92 Lafata Desio Fernando, Warlet Iván Lautaro Página 25 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Respuesta: El valor f con 24 y 19 grados de libertad, que deja un área de 0.01 a su derecha es 2.92. Gráfica: d) ƒ0.95 con υ1 = 19 y υ2 = 24 1 Lafata Desio Fernando, Warlet Iván fα (υ υ1 ) 2 , Lautaro f 1−α ( υ1, υ2 ) = Página 26 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 con nuestros datos f 0.95 (19,24) = 1 1 = = 0.4739 f 0.05 ( 24,19 ) 2.11 Respuesta: El valor f con 19 y 24 grados de libertad, que deja un área de 0.95 a su derecha es 0.4739. Gráfica: e) ƒ0.99 con υ1 = 28 y υ2 = 12 Lafata Desio Fernando, Warlet Iván Lautaro Página 27 de 104 Cátedra: Probabilidad y Estadística UADER f 1−α ( υ1, υ2 ) = Trabajo Final 6 de Agosto de 2008 1 f α ( υ 2 , υ1 ) con nuestros datos f 0.99 ( 28,12 ) = 1 1 = = 0.3448 f 0.01 (12,28) 2.90 Respuesta: El valor f con 28 y 12 grados de libertad, que deja un área de 0.99 a su derecha es 0.3448. Gráfica: Problema 15 (Ref: Pág. 237 – Ej. 5) Una muestra aleatoria de cinco presidentes de bancos indican salarios anuales de $163000, $148000, $152000, $135000 y $141000. Encuentre la varianza de este conjunto. Lafata Desio Fernando, Warlet Iván Lautaro Página 28 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Datos: Variable aleatoria Tamaño de la muestra X: salarios anuales de presidentes de bancos (en pesos) n = 5 presidentes. n Media muestral x= ∑X i i =1 n 163000 + 148000 + 152000 + 135000 + 141000 739000 = = = 147800 $ 5 5 Incógnita: Varianza muestral s2 Solución: ∑(X n s2 = i =1 i −X ) 2 n −1 con nuestros datos s2 = = (163000 − 147800) 2 + (148000 − 147800) 2 + (152000 − 147800) 2 + (135000 − 147800) 2 + (141000 − 147800) 2 (15200 ) 2 + ( 200) 2 + ( 4200) 2 + ( − 12800) 2 + ( − 6800) 2 4 4 458800000 = = 114700000 $ 4 Respuesta: La varianza de este conjunto es 114700000 $. Problema 16 (Ref: Pág. 237 – Ej. 9) Lafata Desio Fernando, Warlet Iván Lautaro Página 29 de 104 = Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Si S21 y S22 representan las varianzas de muestras aleatorias independientes de tamaño n 1 = 25 y n2 = 31, tomadas de poblaciones normales con varianzas σ21 = 10 y σ22 = 15, respectivamente, encuentre P S 12 S 22 > 1.26 . ( ) Datos: Tamaño de la primer muestra Tamaño de la segunda muestra Varianza de la primera muestra n1 = 25. n2 = 31. Varianza de la segunda muestra σ 22 = 15 . Incógnita: ( P S12 S 22 > 1.26 σ12 =10 . ) Solución: Utilizando el Teorema 8.8; el que dice: Si s12 y s 22 son las varianzas de muestras aleatorias independientes de tamaño n 1 y n 2 tomadas de poblaciones normales con varianzas σ 12 y σ 22 , respectivamente, entonces s12 σ 22 s12 σ 22 F= 2 2 = 2 2 σ1 s 2 s 2 σ 1 Tiene una distribución F con υ1 = n1 – 1 y υ2 = n2 – 1 grados de libertad. con nuestros datos s12 P = 2 > 1.26 = s2 s12 2 σ ( ) ( ) 15 * 1 . 26 1 = P( F > 1.89) ≅ 0.05 = 5%. P 2 > s2 10 σ2 2 F0.05(24, 30) = 1.89 Respuesta: La probabilidad de que F con 24 y 30 grados de libertad sea mayor que 1.26 es de 0.05, es decir, 5%. Lafata Desio Fernando, Warlet Iván Lautaro Página 30 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 17 (Ref: Pág. 251 – Ej. 4) Una empresa eléctrica fabrica focos que tienen una duración aproximadamente distribuida de forma normal con una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una duración promedio de 780 horas, encuentre un intervalo de confianza de 96 % para la media de la población de todos los focos que produce esta empresa. Datos: P: focos fabricados por la empresa. X: duración de esa muestra de focos. Desviación estándar poblacional σx = 40 horas. Tamaño de la muestra n = 30 focos. Media muestral x = 780 horas. Intervalo de confianza IC = 96%. X ~ N( μ x = 780, σ x = 40) Incógnita: Intervalo de confianza para la media poblacional, μ x, con 96% de confianza. Solución: X − z 1−α σ 2 n ≤ μ ≤ X + z 1−α σ 2 n 100γ% =100(1-α)% = 96% =>α = 0.04 => z1−α 2 => z0.98 = 2.054 con nuestros datos 780 − ( 2.054 ) 40 30 ≤ μ x ≤ 780 + ( 2.054) 40 30 765 hs. ≤ μ x ≤ 795 hs. Respuesta: Podemos afirmar con un nivel de confianza del 96% que la media poblacional se encuentra entre 765 y 795 horas. Problema 18 (Ref: Pág. 252 – Ej. 8) Lafata Desio Fernando, Warlet Iván Lautaro Página 31 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 ¿De que tamaño se necesita una muestra en el ejercicio 4 si deseamos tener 96% de confianza que nuestra media muestral esté dentro de 10 horas de la media real? Datos: Desviación estándar poblacional σx = 40 horas. Media muestral x = 780 horas. Intervalo de confianza IC = 96%. Intervalo de error e = 10 horas. n ∈Ζ+ 2 z 1−α 2 σ n ≥ e con nuestros datos n ∈Ζ+ 2 2.054.40 n ≥ = 67.5 → n = 68 10 Respuesta: Por lo tanto, podemos tener una confianza 96% de que una muestra aleatoria de tamaño 68 proporcionara una estimación x que difiere de μ por una cantidad menor que 0.04. Problema 19 (Ref: Pág. 252 – Ej. 6) Lafata Desio Fernando, Warlet Iván Lautaro Página 32 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Las estaturas de una muestra aleatoria de 50 estudiantes universitarios muestra una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. a) Construya un intervalo de confianza de 98% para la estatura media de todos los estudiantes de la universidad; b) ¿Qué podemos afirmar con 98% de confianza sobre el tamaño posible de nuestro error si estimamos que la estatura media de todos los estudiantes de la universidad de 174.5 centímetros?. Datos: P: estudiantes universitarios. Variable aleatoria Tamaño de la muestra Media muestral Desviación estándar muestral Intervalo de confianza X: medidas de esos estudiantes universitarios (en centímetros) n = 50 estudiantes. x = 174.5 centímetros. s = 6.9 centímetros. IC = 98%. 100γ% =100(1-α)% = 98% =>α = 0.02 => α 2 = 0.01 t49, 0.01 = 2.4048 a) Incógnita: Intervalo de confianza para la media poblacional, μ x, con 98% de confianza. Solución: X − tα 2 s s ≤ μ ≤ X + tα 2 n n con nuestros datos 174.5 − ( 2.4048) 6.9 ≤ µ ≤174.5 + ( 2.4048) 50 172.15 cm. ≤ μ ≤176.85 cm. 6.9 50 Respuesta: Podemos afirmar con 98% de confianza que la media poblacional se encuentra entre 172.15 y 176.85 centímetros. b) Incógnita: Posible error de estimación. Solución: Ε= X - μ =174.5 − 172.15 =2.35 cm. Respuesta: Podemos afirmar con 98% de confianza que el error de estimación es igual a 2.35 cm. Problema 20(Ref: Pág. 252 – Ej. 13) Lafata Desio Fernando, Warlet Iván Lautaro Página 33 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de las piezas y los diámetros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 centímetros. Encuentre un intervalo de confianza de 99% para el diámetro medio de las piezas de esta máquina, suponga una distribución aproximadamente normal. Datos: P: piezas metálicas de forma cilíndricas. X: diámetro de las piezas cilíndricas(en centímetros). Tamaño de la muestra n = 9 piezas. Intervalo de confianza IC = 99%. n Media muestral x= ∑X i i =1 = n 1.01 + 0.97 + 1.03 + 1.04 + 0.99 + 0.98 + 0.99 + 1.01 + 1.03 = 1.0055 9 cm. n Desviación estándar muestral s= = s= ∑ (X i =1 i − X) 2 n −1 (1.01 −1.0055) 2 + (0.97 −1.0055) 2 + (1.03 −1.0055) 2 + (1.04 −1.0055) 2 + (0.99 −1.0055) 2 + (0.98 −1.0055) 2 + (0 8 ( 0.0045)2 + (0.0355)2 + ( 0.0245)2 + (0.0345)2 + ( 0.0155)2 + ( 0.0255)2 + (0.0155)2 + ( 0.0045)2 + ( 0.0245) 2 8 100γ% =100(1-α)% = 99% =>α = 0.01 => α 2 = 0.005 t8, 0.005 = 3.355 Incógnita: Intervalo de confianza para la media poblacional, μ x, con 99% de confianza. Solución: X − tα 2 s s ≤ μ ≤ X + tα 2 n n con nuestros datos 1.0055 − ( 3.355) 0.0245 0.0245 ≤ μ ≤ 1.0055 + ( 3.355) 9 9 0.9781 cm. ≤ μ ≤1.0329 cm. Respuesta: Podemos afirmar con 99% de confianza que la media poblacional se encuentra entre 0.9781 y 1.0329 centímetros. Lafata Desio Fernando, Warlet Iván Lautaro Página 34 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 21 (Ref: Pág. 252/253 – Ej. 17) Una muestra aleatoria de 25 botellas de aspirinas contiene, en promedio, 325.05 mg. de aspirina con una desviación estándar de 0.5. Encuentre los límites de tolerancia del 95% que contendrán 90% del contenido de aspirina para esta marca. Suponga que el contenido de aspirina se distribuye normalmente. Datos: P: botellas de aspirinas. X: cantidad de aspirina que contienen las botellas de aspirina (en miligramos). Tamaño de la muestra n = 25 botellas de aspirina. Media muestral x = 325.05 mg. de aspirina. Desviación estándar muestral s = 0.5 mg. de aspirina. 1– γ = 95% => γ = 0.05 y 1– α = 90% => 0.9 Según Tabla A.7 => k = 2.208 Incógnita: Limites de tolerancia del 95% que contendrán 90% de aspirina. Solución: x ± ks con nuestros datos 325.05 ± 2.208.0.5 = [323.946 ; 326.154]mg. Respuesta: Los límites de tolerancia del 95% que contendrán 90% de aspirina para esta marca son 323.946 mg y 326.154 mg, Lafata Desio Fernando, Warlet Iván Lautaro Página 35 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 22 (Ref: Pág. 262 – Ej. 1) Una muestra aleatoria de tamaño n1 = 25 que se toma de una población normal con una desviación estándar σ1 = 5 tiene una media x 1 = 80. Una segunda muestra aleatoria de tamaño n2 = 36, que se toma de una población normal diferente con una desviación estándar σ2 = 3, tiene una media x 2 = 75. Encuentre un intervalo de confianza de 95% para μ1 - μ2. Datos: Tamaño de la primer muestra Desviación estándar de la primer población Media de la primer muestra n1 = 25. σ1 = 5. x 1 = 80. P1 ↔ X 1 ~ N μ x1 = 80, σ x1 = 5 Tamaño de la segunda muestra n2 = 36. Desviación estándar de la segunda población σ2 = 3. x 2 = 75. Media de la segunda muestra P2 ↔ X 2 ~ N μ x 2 = 75, σ x 2 = 3 ( ) ( ) Intervalo de confianza IC = 95% para μ1 − μ 2 100(1-α)% = 95% =>α = 0.05 => z1−α 2 => z0.025 = 1.96 Aplicando Tabla A.3 Incógnita: Intervalo de confianza para la diferencia de las medias poblacionales, μ 1 – μ2, con 95% de confianza. Solución: μ x1 − x 2 = μ 1 − μ 2 σ x1 − x 2 = y σ12 σ 22 + n1 n 2 con nuestro datos μ x1 − x 2 = 80 − 75 = 5 ( x1 − x 2 ) − z α 2 . y σ x 1 −x 2 = 25 9 + = 25 36 5 = 1.25 ≅ 1.118 4 σ12 σ 22 σ2 σ2 + < μ1 − μ 2 < ( x1 − x 2 ) + z α . 1 + 2 2 n1 n 2 n1 n 2 con nuestros datos 5 – 1.96 · 1.118 < μ1 – μ2 < 5 + 1.96 · 1.118 5 – 2.19 < μ1 – μ2 < 5 + 2.19 2.80 < μ1 – μ2 < 7.19 Respuesta: Podemos afirmar con 95% de confianza que la diferencia entre las medias poblacionales se encuentra entre 2.80 y 7.19. Lafata Desio Fernando, Warlet Iván Lautaro Página 36 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 23 (Ref: Pág. 263 – Ej. 9) Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva cabo un experimento, utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se gastan. Los resultados son: x 1 = 36300 kilómetros. s1 = 5000 kilómetros. x 2 = 38100 kilómetros. s2 = 6100 kilómetros. Marca A: Marca B: Calcule un intervalo de confianza de 95% para μ1 – μ2,suponga que las poblaciones se distribuyen de forma aproximadamente normal. Puede no suponer que las varianzas son iguales. Datos: P1 : neumáticos de la marca A. P2 : neumáticos de la marca B. X1 : duración en kilómetros de un neumático de la marca A. X2 : duración en kilómetros de un neumáticos de la marca B. Tamaño de la primer muestra n1 = 12 neumáticos. Tamaño de la segunda muestra n2 = 12 neumáticos. x 1 = 36300 Km. Media de la primer muestra x 2 = 38100 Km. Media de la segunda muestra s 1 = 5000 Km. Desviación estándar de la primer muestra Desviación estándar de la segunda muestra s 2 = 6100 Km. Intervalo de confianza IC = 95%. 100(1-α) % = 95% =>α = 0.05 => t α 2 Aplicando Tabla A.4 t0.025 = 2.07892 con υ = 21.18 grados de libertad. Incógnita: Intervalo de confianza para la diferencia de las medias poblacionales, μ 1 – μ2, con 95% de confianza. Solución: ( x1 − x 2 ) − t α (s12 2 s12 s 22 s12 s 22 + < μ1 − μ 2 < ( x1 − x 2 ) + t α + 2 n1 n1 n 2 n2 ) donde t α 2 es el valor t con 2 n1 + s 2 n ( 25000000 12 + 37210000 12 ) 2 = ( 2083333.3 + 3100833.3) 2 = 21.18 2 2 υ= = 2 2 ( 25000000 12 ) 2 + ( 37210000 12 ) 2 ( 2083333.3) 2 + ( 3100833.3) 2 s12 n1 s2 n2 2 + 12 − 1 12 − 1 11 11 n1 − 1 n 2 −1 ( ) ( ) con nuestros datos ( 36300 − 38100) − 2.078 25000000 37210000 25000000 37210000 + < µ1 − µ 2 < ( 36300 − 38100 ) + 2.080 + 12 12 12 12 ( − 1800) − ( 2.080)( 2276.87 ) < µ1 − µ 2 < ( − 1800) + ( 2.080)( 2276.87 ) − 6533.4 < µ1 − µ 2 < 2933.4 Respuesta: Podemos afirmar con 95% de confianza que la diferencia entre las medias poblacionales se encuentra entre –6533.4 y 2933.4. Lafata Desio Fernando, Warlet Iván Lautaro Página 37 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 24 (Ref: Pág. 263 Ej. 7) Los siguientes datos, registrados en días, representan el tiempo de recuperación para pacientes que se tratan al azar con uno de dos medicamentos para curar infecciones graves en la vejiga: Medicamento 1 n1 = 14 x 1 = 17 Medicamento 2 n 2 = 16 x 2 = 19 s 12 = 1.5 s 22 = 1.8 Encuentre un intervalo de confianza de 99% para la diferencia μ2 – μ1 en el tiempo promedio de recuperación para los dos medicamentos, suponga poblaciones normales con varianzas iguales. Datos: P1 : pacientes que se tratan con el medicamento 1. X 1 : tiempo de recuperación en días para un paciente tratado con el medicamento 1. Tamaño de la primer muestra n1 = 14 días. x 1 = 17 días. Primer media muestral s 12 = 1.5 días. Primer varianza muestral P2 : pacientes que se tratan con el medicamento 2. X 2 : tiempo de recuperación en días para un paciente tratado con el medicamento 2. Tamaño de la segunda muestra n2 = 16 días. x 2 = 19 días. Segunda media muestral Segunda varianza muestral s 22 = 1.8 días. Intervalo de confianza IC = 99% para μ 2 − μ1 . 100(1-α)% = 99% =>α = 0.01 => t α 2 Aplicando Tabla A.4 t0.005 = 2.763 con (n1 + n2 – 2) = 28 grados de libertad. Incógnita: Intervalo de confianza para la diferencia de las medias poblacionales, μ 2 − μ1 , con 99% de confianza. Solución: μ x 2 − x1 = μ 2 − μ 1 σ x 2 − x1 = y 1 1 + n 2 n1 con nuestros datos μ x 2 −x1 = 19 − 17 = 2 s 2p = y σ x 2 − x1 = 1 1 + = 0,1339 ≅ 0.3659 14 16 ( n 1 − 1) * ( s12 ) + ( n 2 − 1) * ( s 22 ) n1 + n 2 − 2 con nuestros datos Lafata Desio Fernando, Warlet Iván Lautaro Página 38 de 104 Cátedra: Probabilidad y Estadística UADER s 2p = (14 −1) * (1.5) + (16 −1) * (1.8) 14 +16 − 2 Trabajo Final 6 de Agosto de 2008 = 1.6607 ⇒ s p ≅ 1.2886 luego, ( x 2 − x1 ) − t α 2 sp 1 1 1 1 + < μ 2 - μ1 < ( x 2 − x1 ) + t α s p + 2 n 2 n1 n 2 n1 con nuestros datos 2 – (2.763)*(1.2886)*(0.3659) < μ 2 - μ1 < 2 + (2.763)*(1.1886)*(0.3659) 2 – 1.30 < μ 2 - μ1 < 2 + 1.30 0.70 < μ 2 - μ1 < 3.30 Respuesta: Podemos afirmar con 99% de confianza que la diferencia entre las medias ( μ 2 - μ1 ) poblacionales se encuentra entre 0.70 y 3.30. Problema 25 (Ref: Pág. 270 - Ej. 1) Lafata Desio Fernando, Warlet Iván Lautaro Página 39 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 a) Se selecciona una muestra aleatoria de 200 votantes y se encuentra que 114 apoyan un convenio de anexión. Encuentre un intervalo de confianza de 96% para la fracción de la población votante que favorece el convenio. b) ¿Qué podemos asegurar con 96% de confianza acerca de la posible magnitud de nuestro error si estimamos que la fracción de votantes que favorecen la anexión es 0.57? Datos: Tamaño de la muestra Números de éxitos Intervalo de confianza Proporción de éxitos en una muestra n = 200 votantes. x = 114 votantes. IC = 96% para p: proporción de votante que favorecen el convenio. x 114 p̂ = = = 0.57 . n 200 Proporción de fracasos en una muestra q̂ =1 −p̂ =1 −0.57 =0.43 100γ = 100(1 - α)% = 96% =>α =0.04 => z1−α 2 => z0.98 ≅ 2.054 a) Incógnita: Intervalo de confianza de 96% para la fracción de la población que favorece el convenio. Solución: p̂ * q̂ = n p̂ − z α * 2 ( 0.57 ) * ( 0.43) 200 = 0.2451 = 0,0012255 ≅ 0.035 200 p̂ * q̂ p̂ * q̂ < p < p̂ + z α * 2 n n con nuestros datos 0.57 – (2.054)*(0.035) < p < 0.57 + (2.054)*(0.035) 0.57 – 0.07189 < p < 0.57 + 0.07189 0.49811 < p < 0.64189 Respuesta: Podemos afirmar con 96% de confianza que la fracción que favorece el convenio se encuentra entre 0.49811 y 0.64189, es decir, 49.81% y 64.19% respectivamente. b) Incógnita: Posible error de estimación. Solución: Ε = p̂ - p = 0.57 −0.49811 ≤0.72 =7.2% Respuesta: Podemos afirmar con 96% de confianza que le error de estimación no superará el 7.2 %. Problema 26 (Ref: Pág. 270 - Ej. 9) ¿ Que tan grande se requiere que sea la muestra si deseamos tener una confianza de 96% de que nuestra proporción de la muestra estará dentro del 0.02 de la fracción real de la población votante?. Lafata Desio Fernando, Warlet Iván Lautaro Página 40 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Datos: Sabemos que: p̂ ≅ 0.57 q̂ ≅ 0.43 Y que Incógnita: n =? tal que p( p̂ - p ≤0.02 ) =0.96 Solución: Con Intervalo de error n= e = 0.02. z α2 2 p̂q̂ e2 con nuestros datos n= ( 2.054) 2 ( 0.57 )( 0.43) ( 0.02) 2 = 1.030 ≅ 2575 votantes 0.0004 Respuesta: Si basamos nuestra estimación de p sobre una muestra aleatoria de tamaño 2575, podemos tener una confianza de 96% de que nuestra proporción muestral no diferirá de la proporción real por más de 0.02. Problema 27 (Ref: Pág. 271 – Ej. 15) Cierto genetista se interesa en la proporción de hombres y mujeres en la población que tienen cierto trastorno sanguíneo menor. En una muestra aleatoria de 1000 hombres se encuentra que 250 lo padecen, mientras que 275 de 1000 mujeres examinadas parecen tener el trastorno. Calcule un Lafata Desio Fernando, Warlet Iván Lautaro Página 41 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 intervalo de confianza de 95% para la diferencia entre la proporción de hombres y mujeres que padecen el trastorno sanguíneo. Datos: P1 : hombres P2 : mujeres p1 : proporción de hombres que tienen cierto trastorno sanguíneo menor. p2 : proporción de mujeres que tienen cierto trastorno sanguíneo menor. Tamaño de la primer muestra n1 = 1000 hombres. Tamaño de la segunda muestra n2 = 1000 mujeres. Número de éxitos de la primer muestra x1 = 250. Número de éxitos de la segunda muestra x2 = 275. x 250 p̂1 = = = 0.25 Proporción de éxitos de la primer muestra n 1000 x 275 p̂ 2 = = = 0.275 Proporción de éxito de la segunda muestra n 1000 q̂ 1 = 1 − p̂1 = 1 − 0.25 = 0.75 Proporción de fracasos de la primer muestra q̂ 2 = 1 − p̂ 2 = 1 − 0.275 = 0.725 Proporción de fracasos de la segunda muestra p̂ 1 − p̂ 2 = 0.25 − 0.275 = −0.025 Diferencia entre proporciones de éxitos Intervalo de confianza IC = 95% z 100γ = 100(1 - α)% = 95% =>α =0.05 => 1−α 2 => z0.025 ≅ 1.96 Incógnita: Intervalo de confianza de 96% para la diferencia de las fracciones de población que favorece el convenio. Solución: p̂1 * q̂ 1 p̂ 2 * q̂ 2 + n1 n2 ( p̂ 2 − p̂1 ) − z α 2 * con nuestros datos ( 0.25) * ( 0.75) + ( 0.275) * ( 0.725) 1000 1000 ≅ 0.01967 p̂1 * q̂ 1 p̂ 2 * q̂ 2 p̂ * q̂ p̂ * q̂ + < p 2 − p1 < ( p̂ 2 − p̂1 ) + z α * 1 1 + 2 2 2 n1 n2 n1 n2 con nuestros datos 0.025 – (1.96)*(0.01967) < p2 – p1 < 0.025 + (1.96)*(0.01967) 0.025 – 0.0385532 < p2 – p1< 0.025 + 0.0385532 – 0.01355 < p2 – p1< 0.06355 Respuesta: Podemos afirmar con 95% de confianza que la diferencia entre la proporción de hombres y mujeres que padecen el trastorno sanguíneo se encuentra entre – 0.01355 y 0.06355. Problema 28 (Ref: Pág. 271 – Ej. 20) De acuerdo con USA Today (17 de marzo de 1997), las mujeres constituían 33.7% del personal editorial en las estaciones locales de televisión en 1990 y el 36.2% en 1994. Suponga que se contrataron 20 nuevos empleados para el personal editorial. a) Estime el número que habrían sido mujeres en cada año respectivamente. Lafata Desio Fernando, Warlet Iván Lautaro Página 42 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 b) Calcule un intervalo de confianza de 95% para ver si hay evidencia de que la proporción de mujeres contratadas como personal editorial en 1994 fue mayor que la proporción contratada en 1990. Datos: Tamaño de la muestra n = 20 empleados. 6.74 Pˆ1 = = 0.337 20 7.24 = 0.362 Proporción de éxitos en 1994 las mujeres constituían 36,2 % de 20 empleados Pˆ2 = 20 q̂ 1 = 1 − p̂1 = 1 − 0.337 = 0.663 Proporción de fracasos de la muestra en 1990 q̂ 2 = 1 − p̂ 2 = 1 − 0.362 = 0.638 Proporción de fracasos de la muestra en 1994 Intervalo de confianza IC = 95% 100γ = 100(1 - α) % = 95% =>α =0.05 => z1−α 2 => z0.025 ≅ 1.96 . Proporción de éxitos en 1990 las mujeres constituían 33,7 % de 20 empleados a) Incógnita: Estimar el número que habrían sido mujeres en cada año. Solución: En 1990 el 33.7% de 20 n * Pˆ1 = 20 * 0.337 = 6.74 ≈ 7 mujeres En 1994 el 36.2% de 20 n * Pˆ2 = 20 * 0.362 = 7.24 ≈ 7 mujeres Respuesta: Estimamos que en 1990 habría sido de 6.74 ≈ 7 mujeres, y en 1994 la estimación habría sido de 7.24 ≈ 7 mujeres. b) Incógnita: Intervalo de confianza de 95% para ver si hay evidencia de que la proporción de mujeres contratadas como personal editorial en 1994 fue mayor que la proporción contratada en 1990. Solución: ( Pˆ − Pˆ ) − Z 2 1 α /2 * ( ( 0.337 - 0.362) − (1.96) * ( − 0.025) − (1.96) * ) pˆ 1 * qˆ1 pˆ 2 * qˆ 2 + < p 2 − p1 < Pˆ2 − Pˆ1 + Z α / 2 * n1 n2 pˆ 1 * qˆ1 pˆ 2 * qˆ 2 + n1 n2 (0.337) * (0.663) (0.362) * (0.638) (0.337) + < p 2 − p1 < ( 0.337 - 0.362) + (1.96) * 20 20 2 (0.337) * (0.663) (0.362) * (0.638) (0.337) * (0.663) + < p 2 − p1 < ( − 0.025) + (1.96) * + 20 20 20 ( − 0.025) − 0.295430 < p2 − p1 < ( − 0.025) + 0.295430 − 0.32043 < p 2 − p1 < 0.27043 Respuesta: Podemos afirmar con 95% de confianza que no hay ninguna evidencia para asegurar que la proporción de mujeres contratadas como personal en 1994 fue mayor que la proporción contratada en 1990. Problema 29 (Ref: Pág. 275 – Ej. 1) Un fabricante de baterías para automóvil afirma que sus baterías duraran, en promedio, tres años con una varianza de un año. Si cinco de estas baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años, construya un intervalo de confianza de 95% para σ2 y decida si la afirmación del fabricante de que σ2 = 1 es válida. Suponga que la población de duraciones de las baterías se distribuye de forma aproximadamente normal. Lafata Desio Fernando, Warlet Iván Lautaro Página 43 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Datos: P: baterías de automóvil. X: tiempo de duración en años de una batería. Media poblacional μx = 3 años. Desviación estándar poblacional σx = 1 año. Intervalo de varianza IC = 95%. Tamaño de la muestra n = 5 baterías. X ~ N( μ x = 3, σ x = 1) Incógnita: σ2 = 1 año 2 Solución: Se desea estimar el valor de la varianza utilizando S 2 como estimador. n n n ∑ x i2 − ∑ x i i =1 s 2 = i =1 n ( n − 1) s2 = 2 ( 5) * ( 48.26 ) − (15) 2 ( 5)( 4) = 241.3 − 225 = 0.815 año 2 20 S = 0.902774 años Para el intervalo de confianza del 95% α = 0.05 χ α2 = 0.484 con (n-1) grados de libertad Según Tabla A.5 2 = 2 χ 0.025 ( n − 1) s 2 χ α2 χ 12−α = 11.113 <σ 2 2 = 2 χ 0.975 ( n − 1) s 2 < 2 χ 12− α 2 con nuestros datos ( 5 − 1)( 0.815) < σ 2 < ( 5 − 1)( 0.815) ⇒ ( 4)( 0.815) < σ 2 < ( 4)( 0.815) 11.113 0.484 11.113 0.484 3.26 3.26 <σ2 < 11.113 0.484 0.292639 < σ 2 < 6.735537 ( año 2 ) Respuesta: Podemos afirmar con 95% de confianza que, ya que este intervalo 0.292639 < σ 2 < 6.735537 contiene a 1, que la afirmación del fabricante, de que σ2 = 1, es válida. Problema 30 (Ref: Pág. 275 – Ej. 8 ligado al Ej. 9 – Pág. 263) Ref. Pág. 263 – Ej. 9 Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva cabo un experimento, utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se gastan. Los resultados son: Lafata Desio Fernando, Warlet Iván Lautaro Página 44 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 x 1 = 36300 kilómetros. s1 = 5000 kilómetros. x 2 = 38100 kilómetros. s2 = 6100 kilómetros. Marca A: Marca B: a) Calcule un intervalo de confianza de 95% para μ1 – μ2, suponga que las poblaciones se distribuyen de forma aproximadamente normal. Puede no suponer que las varianzas son iguales. Ref. Pág. 275 – Ej. 8 b) Construya un intervalo de confianza de 90% para σ 12 σ 22 . ¿Estamos justificados al suponer que σ21 = σ22 cuando construyamos nuestro intervalo de confianza para μ1 – μ2? Datos: P1 : neumáticos de la marca A. P2 : neumáticos de la marca B. X1 : duración en kilómetros de un neumático de la marca A. X2 : duración en kilómetros de un neumáticos de la marca B. Tamaño de la primer muestra n1 = 12 neumáticos. Tamaño de la segunda muestra n2 = 12 neumáticos. x 1 = 36300 Km. Media de la primer muestra x 2 = 38100 Km. Media de la segunda muestra s 1 = 5000 Km. Desviación estándar de la primer muestra s 2 = 6100 Km. Desviación estándar de la segunda muestra Intervalo de confianza IC = 95%. 100(1-α) % = 95% =>α = 0.05 => t α 2 Aplicando Tabla A.4 t0.025 = 2.07892 libertad. con υ = 21.18 grados de a) Incógnita: Intervalo de confianza para la diferencia de las medias poblacionales, μ 1 – μ2, con 95% de confianza. Solución: ( x1 − x 2 ) − t α (s12 2 s12 s 22 s12 s 22 + < μ1 − μ 2 < ( x1 − x 2 ) + t α + 2 n1 n1 n 2 n2 ) donde t α 2 es el valor t con 2 n1 + s 2 n2 2 υ= 2 2 s12 n1 s2 n2 2 + n1 −1 n 2 −1 ( ) ( ) con nuestros datos υ= ( 25000000 12 + 37210000 12 ) 2 ( 25000000 12) 2 ( 37210000 12 ) 2 12 − 1 + 12 − 1 Lafata Desio Fernando, Warlet Iván Lautaro = ( 2083333.3 + 3100833.3) 2 ( 2083333.3) 2 + ( 3100833.3) 2 11 = 21.18 11 Página 45 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 con nuestros datos ( 36300 − 38100) − 2.078 25000000 37210000 25000000 37210000 + < µ1 − µ2 < ( 36300 − 38100) + 2.080 + 12 12 12 12 ( − 1800) − ( 2.080) * ( 2276.87 ) < µ1 − µ 2 < ( − 1800) + ( 2.080) * ( 2276.87 ) − 6533.4 < µ1 − µ 2 < 2933.4 Respuesta: Podemos afirmar con un 95% de confianza que la diferencia entre las medias poblacionales se encuentra entre –6533.4 y 2933.4. b) Incógnita: Intervalo de confianza de 90% para σ 21/ σ22. Solución: Intervalo de confianza 100(1-α)% = 90% =>α = 0.10 => f α IC = 90%. 2 Aplicando Tabla A.6 f0.05 = 2.80 con (n1 – 1, n2 - 1), es decir, con (11, 11) grados de libertad. s12 σ12 s12 1 < < f α ( υ1, υ 2 ) s 22 f α ( υ1, υ 2 ) σ 22 s 22 2 2 con nuestros datos 2 25000000 1 σ 1 25000000 < 2 < ( 2.80 ) 37210000 2.80 σ 2 37210000 0.238249 < σ 12 < 1.894652 σ 22 Respuesta: Podemos afirmar con 90% de confianza que σ 12 σ 22 se encuentra entre 0.238249 y 1.894652, ya que el intervalo contiene a 1 es razonable asumir que σ21 = σ22. Problema 31 (Ref: Pág. 304 – Ej. 1) Suponga que un alergólogo desea probar la hipótesis de que al menos 30% del público es alérgico a algunos productos de queso. Explique como el alergólogo puede cometer: a) Un error tipo I. b) Un error tipo II. Solución: Lafata Desio Fernando, Warlet Iván Lautaro Página 46 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 H 0 ) Al menos el 30% del público es alérgico a algunos productos de queso. H 1 ) Menos del 30% del público es alérgico a algunos productos de queso. p = proporción de público que es alérgico a algunos productos de queso. En símbolos: H 0 ) p ≥ 0.30 H 1 ) p < 0.30 El rechazo de la hipótesis nula cuando es verdadera se llama error de tipo I. a) Cuando concluye que al menos de 30% del público es alérgico a algunos productos de queso cuando, de hecho, el 30% o más son alérgicos. El no rechazo de la hipótesis nula cuando es falsa se llama error tipo II. b) Cuando concluye que al menos el 30% del público es alérgico a algunos productos de queso cuando, de hecho, menos del 30% son alérgicos. Problema 32 (Ref: Pág. 304 – Ej. 4) Se estima que la proporción de adultos que viven en una pequeña ciudad que son graduados universitarios es p = 0.6. Para probar esta hipótesis se selecciona una muestra aleatoria de 15 adultos. Si el número de graduados en nuestra muestra es cualquier número de 6 a 12, aceptaremos la hipótesis nula de que p = 0.6 en caso contrario, concluiremos que p ≠ 0.6 a) Evalúe α con la suposición de que p = 0.6. Utilice la distribución binomial. b) Evalúe β para las alternativas p = 0.5 y p = 0.7. c) ¿Es este un buen procedimiento de prueba?. Lafata Desio Fernando, Warlet Iván Lautaro Página 47 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Datos: P : adultos graduados universitarios. p : proporción de adultos graduados universitarios. X : un adulto graduado universitario de esa población. Tamaño de la muestra n = 15 adultos. Región de aceptación 6 ≤ x ≤ 12 graduados universitarios. Hipótesis nula Hipótesis alternativa H0 : p = 0.6. H1 : p ≠ 0.6. a) Incógnita: Probabilidad de error tipo I, α Solución: Proporción de adultos graduados universitarios x α = P(error tipo I) = P(6 < = i =5 i =15 i =0 i =13 p = 0.6 graduados universitarios. < 12 | p = 0.6) = P( x ≤ 6 | p = 0.6) + P( x ≤ 12 | p = 0.6) = ∑b( x;15;0.6) + ∑b( x;15;0.6) = 0.0338 +(1 – 0.9729) = 0.0609 = 6.09%. Respuesta: La probabilidad de cometer un error tipo I con p = 0.6 es del 6.09%. b) Incógnita: Probabilidad de error tipo II, β Solución: Proporción de adultos graduados universitarios β = P(error tipo II) =P(6 ≤ x p = 0.5 graduados universitarios. i =12 ≤ 12 | p = 0.5) = ∑b( x;15;0.5) = Aplicando Tabla A.1 = 0.8464 = i =6 84.64%. Proporción de adultos graduados universitarios β = P(error tipo II) =P(6 ≤ x p = 0.7 graduados universitarios. i =12 ≤ 12 | p = 0.7) = ∑b( x;15;0.7) = Aplicando Tabla A.1 = 0.8695 = i =6 86.95%. Respuesta: La probabilidad de cometer un error tipo II con p = 0.5 es del 84.64%. La probabilidad de cometer un error tipo II con p = 0.7 es del 86.95%. c) Incógnita: Es este un buen procedimiento de prueba? Solución: El procedimiento empleado para este ejercicio no es un buen procedimiento de prueba ya que la probabilidad β es muy alta. Problema 33 (Ref: Pág. 304 – Ej. 5) Repita el ejercicio 4 cuando se seleccionan 200 adultos y la región de aceptación se define como 110 ≤ x ≤ 130 donde x es el número de graduados universitarios en nuestra muestra. Utilice la aproximación normal. Datos: Lafata Desio Fernando, Warlet Iván Lautaro Página 48 de 104 Cátedra: Probabilidad y Estadística UADER Tamaño de la muestra Región de aceptación Hipótesis nula Hipótesis alternativa Trabajo Final 6 de Agosto de 2008 n = 200 adultos. 110 ≤ x ≤ 130 graduados universitarios. H0: p = 0.6. H1: p ≠ 0.6. a) Incógnita: Probabilidad de error tipo I, α Solución: Proporción de adultos graduados universitarios p = 0.6 graduados universitarios. Media µ = n * p = ( 200 ) * ( 0.6) = 120 . σ = n * p * q = 200 * 0.6 * 0.4 = 6.9282 Desviación estándar Necesitamos conocer el área bajo la curva normal entre 110 ≤ x ≤ 130 → 110 - 0.5 ≤ y ≤ 130 + 0.5 → 109.5 ≤ y ≤ 130.5 Z= z= y −µ σ 109.5 −120 ≅ −1.52 6.928 y z= 130.5 −120 ≅ 1.52 6.928 α = P(error tipo I) = P(110 > x > 130 | p = 0.6) = P( x < 110 | p = 0.6) + P( x > 130 | p = 0.6) = = P(z < -1.52) + P(z < 1.52) = (2)*(0.0643) = 0.1286 = 12.86%. Respuesta: La probabilidad de cometer un error tipo I con p = 0.6 es del 12.86%. b) Incógnita: Probabilidad de error tipo II, β Solución: Proporción de adultos graduados universitarios p = 0.5 graduados universitarios. Media µ = n * p = ( 200 ) * ( 0.5) = 100 . Desviación estándar σ = n * p * q = 200 * 0.5 * 0.5 = 7.0712 Necesitamos conocer el área bajo la curva normal entre 110 ≤ x ≤ 130 → 110 - 0.5 ≤ y ≤ 130 + 0.5 → 109.5 ≤ y ≤ 130.5 Z= y −µ σ Lafata Desio Fernando, Warlet Iván Lautaro Página 49 de 104 Cátedra: Probabilidad y Estadística UADER z= 109.5 −100 ≅ 1.34 7.07 Trabajo Final 6 de Agosto de 2008 y z= 130.5 −100 ≅ 4.31 7.07 β = P(error tipo II) =P(110 < x < 130 | p = 0.5) =P(1.34 < z < 4.31) = P(z ≤ 4.31) – P(z ≤ 1.34) = = 1 – 0.9099 = 0.0901 = 9.01%. Proporción de adultos graduados universitarios p = 0.7 graduados universitarios. Media µ = n * p = ( 200 ) * ( 0.7 ) = 140 . σ = n * p * q = 200 * 0.7 * 0.3 = 6.4807 Desviación estándar Necesitamos conocer el área bajo la curva normal entre 110 ≤ x ≤ 130 → 110 - 0.5 ≤ y ≤ 130 + 0.5 → 109.5 ≤ y ≤ 130.5 Z= z= y −µ σ 109.5 −140 ≅ −4.71 6.480 y z= 130.5 −140 ≅ −1.47 6.480 β = P(error tipo II) =P(110 < x < 130 | p = 0.7) = P(-4.71< z < -1.47) = P(z ≤ -1.47) – P(z ≤ -4.71) = = 0.0708 – 0 = 0.0708 = 7.08%. Respuesta: La probabilidad de cometer un error tipo II con p = 0.5 es del 9.01%. La probabilidad de cometer un error tipo II con p = 0.7 es del 7.08%. c) Incógnita: Es este un buen procedimiento de prueba? Solución: Para este procedimiento la probabilidad de cometer un error Tipo I es algo alto, aunque se reduce dramáticamente la probabilidad de cometer un error Tipo II. Problema 34 (Ref: Pág. 305 – Ej. 12) Se pregunta a una muestra aleatoria de 400 votantes en cierta ciudad si están a favor de un impuesto adicional de 4% sobre la venta de gasolina para proporcionar ingresos que se necesitan con urgencia para la reparación de calles. Si más de 220 pero menos de 260 favorecen el impuesto sobre ventas, concluiremos que 60% de los votantes lo apoyan. a) Encuentre la probabilidad de cometer un error tipo I si 60% de los votantes están a favor del aumento de impuestos. Lafata Desio Fernando, Warlet Iván Lautaro Página 50 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 b) ¿Cuál es la probabilidad de cometer un error de tipo II al utilizar este procedimiento de prueba si en realidad sólo 48% de los votantes está a favor del impuesto adicional a la gasolina? Datos: P : votantes de una cierta ciudad. p : proporción de votantes a favor del impuesto. X : un votante de esa ciudad. Tamaño de la muestra n = 400 votantes. Región de aceptación 220 < x < 260 → 221 ≤ Hipótesis nula Hipótesis alternativa x ≤ 259 votantes que favorecen el impuesto. H 0: p = 0.6. H1: p ≠ 0.6. a) Incógnita: Probabilidad de error tipo I, α Solución: Proporción de votantes a favor del impuesto p = 0.6 votantes a favor del impuesto. Media μ = n*p = (400)*(0.6) = 240. Desviación estándar σ= n* p*q = ( 400) * ( 0.6) * ( 0.4) ≅ 9.79 Necesitamos conocer el área bajo la curva normal entre 221 ≤ x ≤ 259 → 221 - 0.5 ≤ y ≤ 259 + 0.5 → 220.5 ≤ y ≤ 259.5 Z= z= y −µ σ 220.5 − 240 ≅ −1.99 9.79 y z= 259.5 − 240 ≅ 1.99 9.79 α = P(error tipo I) = P(221 > x > 259 | p = 0.6) = P( x < 221 | p = 0.6) + P( x > 259 | p = 0.6) = =P(z < -1.99) + P(z < 1.99) = (2)*(0.0233) = 0.0466 = 4.66%. Respuesta: La probabilidad de cometer un error tipo I con p = 0.6 es del 4.66%. b) Incógnita: Probabilidad de error tipo II, β Solución: Lafata Desio Fernando, Warlet Iván Lautaro Página 51 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Proporción de adultos graduados universitarios p = 0.48 graduados universitarios. Media μ = n*p = (400)*(0.48) = 192. Desviación estándar σ= n* p*q = ( 400 ) * ( 0.48) * ( 0.52) ≅ 9.99 Necesitamos conocer el área bajo la curva normal entre 220.5 y 259.5 Z= z= y −µ σ 220.5 −192 ≅ 2.85 9.99 y z= 259.5 −192 ≅ 6.75 9.99 β = P(error tipo II) =P(221 < x < 259 | p = 0.48) = P(2.85< z < 6.75) = P(z ≤ 6.75) – P(z ≤ 2.85) = =1 – 0.9978 = 0.0022 = 0.22%. Respuesta: La probabilidad de cometer un error tipo II con p = 0.48 es del 0.22%. Problema 35 (Ref: Pág. 305 – Ej. 13) Suponga que, en el ejercicio 12, concluimos que 60% de los votantes está a favor del impuesto a la venta de gasolina si más de 214 pero menos de 266 votantes de nuestra muestra lo favorece. Muestre que esta nueva región de aceptación tiene como resultado un valor más pequeño para α a costa de aumentar β. Datos: Lafata Desio Fernando, Warlet Iván Lautaro Página 52 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Tamaño de la muestra Región de aceptación n = 400 votantes. 214 < x < 266 → 215 ≤ Hipótesis nula Hipótesis alternativa x ≤ 265 votantes que favorecen el impuesto. H 0: p = 0.6. H1: p ≠ 0.6. a) Incógnita: Probabilidad de error tipo I, α Solución: Proporción de votantes a favor del impuesto p = 0.6 votantes a favor del impuesto. Media μ = n*p = (400)*(0.6) = 240. Desviación estándar σ = n * p * q = ( 400 ) * ( 0.6 ) * ( 0.4) ≅ 9.79 Necesitamos conocer el área bajo la curva normal entre 215 ≤ x ≤ 265 → 215 - 0.5 ≤ y ≤ 265 + 0.5 → 214.5 ≤ y ≤ 265.5 Z= y −µ σ z= 214.5 − 240 ≅ −2.60 y 9.79 z= 265.5 − 240 ≅ 2.60 9.79 α = P(error tipo I) = P(214 > x > 266, cuando p = 0.6) = (2)*P(z < -2.60) = (2)*(0.0047) = 0.0094 = 0.94%. Respuesta: La probabilidad de cometer un error tipo I con p = 0.6 es del 0.94%. b) Incógnita: Probabilidad de error tipo II, β Solución: Proporción de adultos graduados universitarios p = 0.48 graduados universitarios. Media μ = n*p = (400)*(0.48) = 192. Desviación estándar σ = n * p * q = ( 400 ) * ( 0.48) * ( 0.52 ) ≅ 9.99 Necesitamos conocer el área bajo la curva normal entre 214.5 y 265.5 215 ≤ x ≤ 265 → 215 - 0.5 ≤ y ≤ 265 + 0.5 → 214.5 ≤ y ≤ 265.5 Z= y −µ σ z= 214.5 −192 ≅ 2.25 9.99 y z= 265.5 −192 ≅ 7.35 9.99 β = P(error tipo II) =P(214 < x < 266, cuando p = 0.48) =P(2.25≤ z ≤ 7.35) = P(z ≤ 7.35) – P(z ≤ 2.25) = = 1 – 0.9878 = 0.0122 = 1.22%. Respuesta: La probabilidad de cometer un error tipo II con p = 0.48 es del 1.22%. Problema 36 (Ref: Pág. 305 – Ej. 15) Una máquina de refrescos en un restaurante de carnes asadas se ajusta de modo que la cantidad de bebida que sirva esté distribuida de forma aproximadamente normal con una media de 200 mililitros y una desviación estándar de 15 mililitros. La máquina se verifica periódicamente con una muestra de nueve bebidas y con el cálculo del contenido promedio. Si x cae en el intervalo 191 < x < 209, se considera que la máquina opera de manera satisfactoria: de otro modo, concluimos que μ ≠ 200 mililitros. a) Encuentre la probabilidad de cometer un error tipo I cuando μ = 200 mililitros. Lafata Desio Fernando, Warlet Iván Lautaro Página 53 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 b) Encuentre la probabilidad de cometer un error tipo II cuando μ = 215 mililitros. Datos: P : bebida que sirve cierta maquina de refresco. X : medida en mililitros de esa maquina de refresco. Tamaño de la muestra n = 9 bebidas. Desviación estándar poblacional σ = 15 mililitros. σ 15 15 σx = x = = Desviación estándar muestral = 5 mililitros. n 9 3 Región de aceptación 191 < x < 209. Hipótesis nula Hipótesis alternativa H 0: μ = 200 mililitros. H1: μ ≠ 200 mililitros. a) Incógnita: Probabilidad de error tipo I, α Solución: Media μ = 200 mililitros. Necesitamos conocer el área bajo la curva normal entre 191 y 209 z= 191 − 200 = -1.80 5 y z= X ~ N( μ x = 200, σ x = 15) 209 − 200 = 1.80 5 α = P(error tipo I) = P(191 > x > 209) = (2)*P(z < -1.80) = (2)*(0.0359) = 0.0718 = 7.18%. Respuesta: La probabilidad de cometer un error tipo I con es del 7.18%. b) Incógnita: Probabilidad de error tipo II, β Solución: Media μ = 215 mililitros. Necesitamos conocer el área bajo la curva normal entre 191 y 209 z= 191 − 215 = -4.80 5 y z= X ~ N( μ x = 200, σ x = 15) 209 − 215 = -1.20 5 β = P(error tipo II) =P(191 < x < 209) =P(-4.80 ≤ z ≤ -1.20) = P(z ≤ -1.20) – P(z ≤ -4.80) = = 0.1151 – 0 = 0.1151 = 11.51%. Respuesta: La probabilidad de cometer un error tipo II es del 11.51%. Problema 37 (Ref: Pág. 325 – Ej. 1) Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma aproximadamente normal con una media de 800 horas y una desviación estándar de 40 horas. Prueba la hipótesis de que μ = 800 horas contra la alternativa de que μ ≠ 800 horas si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas. Utilice un nivel de significancia de 0.04. Datos: P : focos fabricados en cierta empresa eléctrica. Lafata Desio Fernando, Warlet Iván Lautaro Página 54 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 X : duración en horas de un foco fabricado en esa empresa eléctrica. Tamaño de la muestra n = 30 focos. Desviación estándar poblacional σ = 40 horas. Media muestral x = 788 horas. σ 40 σx = x = ≅ 7.30 mililitros. Desviación estándar muestral n 30 Nivel de significancia α = 0.04 Hipótesis nula Hipótesis alternativa H0: μ = 800 horas. H1: μ ≠ 800 horas. X ~ N ( μ x = 788, σ x = 40 ) Incógnita: Rechazo o aceptación de la hipótesis nula. Solución: Es conveniente estandarizar X e incluir de manera formal la variable aleatoria normal estándar Z, donde z= z= X −μ σ n 788 − 800 =-1.64 7.30 Si − z α < z < z α , no se rechaza H0. 2 2 − z 0.04 < z < z 0.04 2 2 − z 0.02 < z < z 0.02 Aplicando Tabla A.3. – 2.055 < z < 2.055 Respuesta: No rechazamos la hipótesis nula ya que el valor de z hallado se encuentra dentro de la región de no rechazo. Problema 38 (Ref: Pág. 326 – Ej. 5) Se afirma que un automóvil se maneja en promedio más de 20000 kilómetros por año. Para probar esta afirmación, se pide a una muestra de 100 propietarios de automóviles que lleven un registro de los kilómetros que viajen. ¿Está de acuerdo con esta afirmación si la muestra aleatoria muestra un promedio de 23500 kilómetros y una desviación estándar de 3900 kilómetros?. Utilice un valor P en su conclusión. Lafata Desio Fernando, Warlet Iván Lautaro Página 55 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Datos: Tamaño de la muestra Media muestral Desviación estándar muestral n = 100 automóviles. x = 23500 kilómetros. σx = 3900 kilómetros. Hipótesis nula Hipótesis alternativa H0: μ ≤ 20000 kilómetros. H1: μ > 20000 kilómetros. Incógnita: Rechazo o aceptación de la hipótesis nula. Solución: Es conveniente estandarizar X e incluir de manera formal la variable aleatoria normal estándar Z, donde z= z= X −μ σ n 23500 − 20000 = 8.97. 3900 / 100 P= P(Z > 8.97) ≅ 1-1 = 0 Respuesta: Rechazamos la hipótesis nula y concluimos que μ ≠ 20000 Kilómetros. Problema 39 (Ref: Pág. 326 – Ej. 7 ligado al Ej. 1 – Pág. 339) a) Ref. Pág. 326 – Ej. 7 Pruebe la hipótesis de que el contenido promedio de los envases de un lubricante particular es de 10 litros si los contenidos de una muestra aleatoria de 10 envases son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que la distribución del contenido es normal. b) Ref. Pág. 339 – Ej.1 Lafata Desio Fernando, Warlet Iván Lautaro Página 56 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Se sabe que el volumen de los envases de un lubricante particular se distribuye normalmente con una varianza de 0.03 litros. Pruebe la hipótesis de que σ2 = 0.03 contra la alternativa de que σ2 ≠ 0.03 para la muestra aleatoria de 10 envases del ejercicio 7 de la página 326. Use un nivel de significancía de 0.01. a) Ref. Pág. 326 – Ej. 7 Datos: P : envases de un lubricante. X : contenido en litros de un envase de ese lubricante. Tamaño de la muestra n = 10 envases. n Media muestral x= ∑X i i =1 n 10.2 + 9.7 + 10.1 + 10.3 + 10.1 + 9.8 + 9.9 + 10.4 + 10.3 + 9.8 = = 10.06 litros. 10 n Desviación estándar muestral s= = s= ∑ (X i =1 i − X) 2 n −1 (10.2 −10.06 )2 + (9.7 −10.06) 2 + (10.1 −10.06) 2 + (10.3 −10.06) 2 + (10.1 −10.06) 2 + (9.8 −10.06) 2 + (9.9 −10.06 9 (0.14 )2 + ( −0.36 )2 + ( 0.04 )2 + ( 0.24 )2 + (0.04)2 + ( − 0.26 )2 + ( − 0.16 )2 + (0.34)2 + ( 0.24 ) 2 + ( − 0.26 )2 9 Nivel de significancia α = 0.01 Hipótesis nula Hipótesis alternativa H0: μ = 10 litros. H1: μ ≠ 10 litros. Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: X −μ t= s n Si − t α 2 − t 0.01 , n −1 2 ,9 t= < t < tα 2 < t < t 0.01 , n −1 , 2 10.06 −10 = 0.7722 . 0.0777 no se rechaza H0. ,9 − t 0.005,9 < t < t 0.005,9 Aplicando Tabla A.4. - 3.250 < t < 3.250 Respuesta: No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región de No Rechazo. b) Ref. Pág. 339 – Ej.1 Datos: Lafata Desio Fernando, Warlet Iván Lautaro Página 57 de 104 = Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Tamaño de la muestra n = 10 envases. n Media muestral x= ∑X i =1 i = n 10.2 + 9.7 + 10.1 + 10.3 + 10.1 + 9.8 + 9.9 + 10.4 + 10.3 + 9.8 = 10.06 10 litros. n Desviación estándar muestral (10.2 −10.06 ) s = = 2 s= + (9.7 −10.06) 2 ∑ (X i =1 i − X) 2 n −1 + (10.1 −10.06) 2 + (10.3 −10.06) 2 + (10.1 −10.06) 2 + (9.8 −10.06) 2 + (9.9 −10.06 9 (0.14 )2 + ( − 0.36 )2 + ( 0.04 )2 + ( 0.24 )2 + (0.04 )2 + ( − 0.26 )2 + ( − 0.16 )2 + ( 0.34 )2 + ( 0.24 ) 2 + ( − 0.26 )2 9 Nivel de significancia α = 0.01 H0: σ2 = 0.03 litros. H1: σ2 ≠ 0.03 litros. Hipótesis nula Hipótesis alternativa Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: x2 = x2 = ( n −1) * s 2 σ2 (10 −1) * ( 0.2458) 2 0.03 = ( 9 ) * ( 0.0604 ) 0.03 = 0.5436 ≅ 18.13 0.03 Si χ α2 = 18.13 cuando v = 10 – 1 = 9 grados de libertad Según Tabla A.5 => 0.025 < P(χ2 >18.13) < 0.05 Respuesta: No rechazamos la hipótesis nula ya que la muestra de 10 envases no es suficiente para mostrar que σ2 no es igual a 0.03. Problema 40 (Ref: Pág. 326 – Ej. 12) Una muestra aleatoria de tamaño n1 = 25, que se toma de una población normal con una desviación estándar σ1 = 5.2, tiene una media x 1 = 81. Una segunda muestra aleatoria de tamaño n2 = 36, que se Lafata Desio Fernando, Warlet Iván Lautaro Página 58 de 104 = Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 toma de una población normal diferente con una desviación estándar σ2 = 3.4, tiene una media x 2 = 76. Pruebe la hipótesis de que μ1 = μ2 contra la alternativa μ1 ≠ μ2. Cite un valor P en su conclusión. Datos: Tamaño de la primer muestra Desviación estándar de la primer población Media de la primer muestra n1 = 25. σ1= 5.2. x 1 = 81. X 1 ~ N μ x1 = 81, σ x1 = 5.2 Tamaño de la segunda muestra Desviación estándar de la segunda población Media de la segunda muestra n2 = 36. σ2 = 3.4. x 2 = 76. X 2 ~ N μ x 2 = 76, σ x 2 = 3.4 Hipótesis nula Hipótesis alternativa ( ) ( ) H0: μ1 = μ2. H 1: μ 1 ≠ μ 2. Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: z= z= (X 1 − X 2 ) − ( μ1 − μ 2 ) σ12 σ 22 + n1 n 2 ( 81 − 76) − ( 0) 27.04 11.56 + 25 36 p = P(z > 4.222) ≅ = 5 ≅ 4.222 1.184 1-1 = 0 Respuesta: Rechazamos la hipótesis nula ya que la probabilidad de que ocurra es aproximadamente del 0%. Problema 41 (Ref: Pág. 327 – Ej. 18 ligado al Ej. 9 – Pág. 340) a)Ref. Pág. 327 – Ej.18 Lafata Desio Fernando, Warlet Iván Lautaro Página 59 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Una compañía armadora de automóviles trata de decidir si compra llantas de la marca A o de la B para sus modelos nuevos. Se lleva a cabo un experimento, para ayudar a llegar a una decisión, en el que se usan 12 llantas de cada marca. Las llantas se utilizan hasta que se acaban. Los resultados son: x 1 = 37900 kilómetros. s1 = 5100 kilómetros. x 2 = 39800 kilómetros. s2 = 5900 kilómetros. Marca A: Marca B: Prueba la hipótesis de que no hay diferencias en las dos marcas de llantas con un nivel de significancia de 0.05. Suponga que las poblaciones se distribuyen de forma aproximadamente normal con varianzas iguales. b) Ref. Pág. 340 – Ej.9 Con referencia al ejercicio 18 de la página 327, pruebe la hipótesis de que σ 1 = σ 2 contra la alternativa de que σ 1 < σ 2, donde σ 1 y σ 2 son las desviaciones estándar de las distancias que se obtienen por las llantas marca A y marca B, respectivamente. Utilice un nivel de significancia de 0.05. a)Ref. Pág. 327 – Ej.18 Datos: Tamaño de la primer muestra Tamaño de la segunda muestra Desviación estándar de la primer muestra Desviación estándar de la segunda muestra Media de la primer muestra Media de la segunda muestra Hipótesis nula Hipótesis alternativa n1 = 12 llantas. n2 = 12 llantas. s1= 5100 Km. s2 = 5900 Km. x 1 = 37900 Km. x 2 = 39800 Km. H0: μ1 = μ2. H1: μ1 ≠ μ2. Nivel de significancia α = 0.05 Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: ( s ) * ( n − 1) + ( s ) * ( n 2 1 sp = 2 2 1 2 − 1) n1 + n2 − 2 Con nuestros datos: sp = ( 26010000) * (11) + ( 34810000) * (11) 12 + 12 − 2 − X 2 ) − ( μ1 − μ 2 ) 1 1 sp + n1 Warlet n 2 Iván Lautaro Lafata Desio Fernando, t= = 286110000 + 382910000 669020000 = = 5514.52 Km. 22 22 (X 1 Página 60 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Con nuestros datos: t= ( 37900 − 39800) − ( 0) 1 1 + 12 12 5514.52 Si − t α 2 , n1 + n 2 − 2 − t 0.05 2 < t < tα ,12 +12 − 2 2 = − 1900 − 1900 = ≅ −0.84 ( 5514.52 )( 0.408) 2249.92 ,n1 + n 2 − 2 < t < t 0.05 2 , no se rechaza H0. ,12 +12 − 2 − t 0.025, 22 < t < t 0.025, 22 Aplicando Tabla A.4. − 2.074 < t < 2.074 Respuesta: No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región crítica. b) Ref. Pág. 340 – Ej.9 Datos: Tamaño de la primer muestra Tamaño de la segunda muestra Desviación estándar de la primer muestra Desviación estándar de la segunda muestra Media de la primer muestra Media de la segunda muestra n1 = 12 llantas. n2 = 12 llantas. s1= 5100 Km. s2 = 5900 Km. x 1 = 37900 Km. x 2 = 39800 Km. H 0: σ 1 = σ 2 H 1: σ 1 < σ 2 Hipótesis nula Hipótesis alternativa Nivel de significancia α = 0.05 Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: Sabemos que: ƒα ( v1 , v 2 ) con v1 = n1 −1 y v2 = n2 −1 grados de libertad con nuestros datos: v1 = 12 −1 = 11 y v 2 = 12 − 1 = 11 grados de libertad f 0.05 (11,11) = 2.82 Según Tabla A.6 f 1−α ( υ1, υ2 ) = 1 con v1 = n1 −1 y v2 = n2 −1 grados de libertad f α ( υ 2 , υ1 ) Lafata Desio Fernando, Warlet Iván Lautaro Página 61 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Con nuestros datos: f 0.95 (11,11) = 1 1 = ≅ 0.35 f 0.05 (11,11) 2.82 Gráficamente: 2 La hipótesis nula se rechaza cuando f > 2.82 ó f < 0.35 , donde f = s1 s 22 , con v1 = 11 y v1 = 11 grados de libertad. con nuestros datos: S12 = ( 5100 ) = 26010000km. 2 y por ello f = S 22 = ( 5900 ) = 34810000km. 2 23010000 = 0.7472 34810000 Respuesta: Rechazamos la hipótesis nula, para σ12 = σ22 , ya que el valor de f hallado es f < 0.35, 0.7472 < 0.35. Problema 42 (Ref: Pág. 328 – Ej. 21 ligado al Ej. 10 – Pág. 340) Lafata Desio Fernando, Warlet Iván Lautaro Página 62 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 a)Ref. Pág. 328 – Ej. 21 Los siguientes datos representan los tiempos de duración de películas producidas por dos compañías cinematográficas: Compañía 1 2 Tiempo (minutos) 102 86 98 109 92 81 165 97 134 92 87 114 Pruebe la hipótesis de que el tiempo de duración promedio de las películas producidas por la compañía 2 excede el tiempo promedio de duración de la que produce la compañía 1 en 10 minutos, contra la alternativa unilateral de que la diferencia es de más de 10 minutos. Utilice un nivel de significancia de 0.1 y suponga que las distribuciones de los tiempos son aproximadamente normales con varianzas iguales. b) Ref. Pág. 340 – Ej. 10 Con referencia al ejercicio 21 de la página 328, pruebe la hipótesis de que σ 21 = σ22 contra la alternativa de que σ21 ≠ σ22, donde σ21 y σ22 son las varianzas para los tiempos de duración de películas producidas por la compañía 1 y la compañía 2, respectivamente. Utilice un nivel de significancia de 0.10. a)Ref. Pág. 328 – Ej. 21 Datos: X1 : tiempo de duración en minutos de una película producida por la compañía 1. X2 : tiempo de duración en minutos de una película producida por la compañía 2. Tamaño de la primer muestra n1 = 5 películas. Tamaño de la segunda muestra n2 = 7 películas. n Media de la primer muestra x1 = ∑X i = i =1 n1 102 + 86 + 98 + 109 + 92 = 97.4 minutos. 5 n Media de la segunda muestra ( X 1 ~ N μ x1 = 97.4, σ x1 = 19.86 x2 = ∑X i i =1 = n2 81 + 165 + 97 + 134 + 92 + 87 + 114 = 110. minutos. 7 ) ( X 2 ~ N μ x 2 = 110, σ x 2 = 79.95 n Desviación estándar de la primer muestra s1 = = s1 = ∑ (X i =1 i − X) 2 n1 − 1 (102 − 97.4) 2 + (86 − 97.4) 2 + (98 − 97.4) 2 + (109 − 97.4) 2 + (92 − 97.4) 2 4 ( 4.6 ) 2 + ( − 11.4) 2 + ( 0.6 ) 2 + (11.6) 2 + ( - 5.4) 2 4 Lafata Desio Fernando, Warlet Iván Lautaro = ) 315.2 4 = = 78.8 = 8.87minutos Página 63 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 ∑ (X n Desviación estándar de la segunda muestra s2 = s2 = i =1 − X) 2 n2 −1 ( 81 − 110 ) 2 + (165 − 110)2 + (97 − 110) 2 + (134 − 110)2 + (92 − 110)2 + (87 − 110)2 + (114 − 110) 2 6 ( - 29) 2 + ( 55) 2 + ( - 13) 2 + ( 24) 2 + ( - 18) 2 + ( − 23) ) 2 + ( 4) 2 = i 6 = Hipótesis nula Hipótesis alternativa H0: μ2 - μ1 ≤ 10 minutos. H1: μ2 - μ1 > 10 minutos. Nivel de significancia α = 0.1 5480 6 = = 913.3 = 30.22 min utos Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: t= (X 2 − X1 ) − ( μ 2 − μ1 ) s 22 s12 + n 2 n1 con nuestros datos: t= (110 − 97.4) − (10 ) 913.24 78.67 + 7 5 Si − t α 2 ,υ < t < tα 2 ,υ = 12.6 − 10 130.46 + 15.73 = 2.6 146.19 = 2.6 ≈ 0.22 12.09 , no se rechaza H0. Con 2 2 2 2 2 ( s1 n1 + s 2 n 2 ) ( 78.68 5 + 913.25 7 ) ( 15.74 + 130.46 ) υ≅ = = = 2 2 2 2 2 2 2 2 ( ) ( ) ( ) ( ) 78 . 68 5 913 . 25 7 15 . 74 130 . 46 ( s1 n1 ) + ( s2 n2 ) + + n1 − 1 = ( 146.2) 2 247.75 17019.81 + 4 6 entonces: − t 0.1 5−1 n2 − 1 2 ,7 = 21374.44 61.90 + 2836.75 < t < t 0.1 2 7−1 = 21374.44 2898.65 4 6 ≈ 7.38 → υ = 7 ,7 −t 0.05, 7 < t < t 0.05, 7 Aplicando Tabla A.4. − 2.998 < t < 2.998 Lafata Desio Fernando, Warlet Iván Lautaro Página 64 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Respuesta: No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región crítica. b) Ref. Pág. 340 – Ej. 10 Datos: Tamaño de la primer muestra Tamaño de la segunda muestra n1 = 5 películas. n2 = 7 películas. n Media de la primer muestra x1 = ∑X i = 102 + 86 + 98 + 109 + 92 = 97.4 minutos. 5 i = 81 + 165 + 97 + 134 + 92 + 87 + 114 = 110. minutos 7 i =1 n1 n Media de la segunda muestra x2 = ∑X i =1 n2 n Desviación estándar de la primer muestra s1 = = ∑ (X i i =1 s1 = − X) n1 − 1 (102 − 97.4) 2 + (86 − 97.4) 2 + (98 − 97.4) 2 + (109 − 97.4) 2 + (92 − 97.4) 2 4 ( 4.6 ) 2 + ( − 11.4) 2 + ( 0.6 ) 2 + (11.6) 2 + ( - 5.4) 2 4 315.2 = 4 Desviación estándar de la segunda muestra = s2 = = = 78.8 = 8.87minutos ∑ (X n s2 = 2 i =1 i − X) 2 n2 −1 ( 81 − 110 ) 2 + (165 − 110) 2 + (97 − 110) 2 + (134 − 110)2 + (92 − 110)2 + (87 − 110)2 + (114 − 110) 2 6 ( - 29 ) 2 + ( 55) 2 + ( - 13) 2 + ( 24) 2 + ( - 18) 2 + ( − 23) ) 2 + ( 4) 2 6 Hipótesis nula Hipótesis alternativa H0: σ12 = σ22. H1: σ12 ≠ σ22. Nivel de significancia α = 0.1 = 5480 6 = = 913.3 = 30.22 min utos Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: Sabemos que: ƒα ( v1 , v 2 ) con v1 = n1 −1 y v2 = n2 −1 grados de libertad Con nuestros datos: v1 = 5 − 1 = 4 y v 2 = 7 − 1 = 6 grados de libertad entonces: Lafata Desio Fernando, Warlet Iván Lautaro Página 65 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 ƒ 0.05 ( 4,6 ) = 4.53 Según Tabla A.6 f 1−α ( υ1, υ2 ) = 1 con v1 = n1 −1 y v2 = n2 −1 grados de libertad f α ( υ 2 , υ1 ) Con nuestros datos: f 0.95 ( 4,6 ) = 1 1 = ≅ 0.16 f 0.05 ( 6,4 ) 6.16 Gráficamente: La hipótesis nula se rechaza cuando f > 4.53 ó f < 0.16 , donde 2 s 1 f = s 22 , con v1 = 4 y v1 = 6 grados de libertad. con nuestros datos: S12 = ( 8.87 ) = 78.7 min utos. 2 Lafata Desio Fernando, Warlet Iván Lautaro y S 22 = ( 30.22) = 913.25 min utos. 2 Página 66 de 104 Cátedra: Probabilidad y Estadística UADER y por ello f = Trabajo Final 6 de Agosto de 2008 78.7 = 0.09 913.25 Respuesta: Rechazamos la hipótesis nula, para σ12 = σ22 , ya que el valor de f hallado es f < 0.16, 0.09 < 0.16. Problema 43 (Ref: Pág. 335 – Ej. 6) En cierta universidad se estima que a lo más 25% de los estudiantes van en bicicleta a la escuela. ¿ Esta parece ser una estimación valida si, en una muestra aleatoria de 90 estudiantes universitarios, se encuentra que 28 van en bicicleta a la escuela?. Utilice un nivel de significancia de 0.05. Datos: P : estudiantes de cierta universidad. X : un estudiante de esa universidad. Tamaño de la muestra n = 90 estudiantes. Cantidad de estudiantes que van en bicicleta x = 28 estudiantes. Proporción de estudiantes que en bicicleta p = 0.25 q = 0.75 Proporción de estudiantes que no andan en bicicleta Media μ = n*p = (90)*(0.25) = 22.5 estudiantes. Desviación estándar σ = n * p * q = ( 90) * ( 0.25) * ( 0.75) ≅ 4.10 estudiantes. X ~ N( μ x = 22.5, σ x = 4.10) Hipótesis nula Hipótesis alternativa H0: p ≤ 0.25. H1: p > 0.25. Nivel de significancia α = 0.05 Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: Rechazamos H0 si Z < -1.64 siendo Z= x −μ σ Con nuestros datos: Z = 28 − 22.5 = 1.338877 ≈ 1.34 4.107919 P = P( Z > 1.34 ) = 1 − ( Z ≤ 1.34 ) = 1 − 0.909 = 0.091 = 9.1% Respuesta: No rechazamos la hipótesis nula ya que no hay suficiente evidencia para concluir que P> 0.25. Lafata Desio Fernando, Warlet Iván Lautaro Página 67 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 44 (Ref: Pág. 335 – Ej. 9) En un estudio para estimar la proporción de residentes de cierta ciudad y sus suburbios que están a favor de la construcción de una planta de energía nuclear, se encuentra que 63 de 100 residentes urbanos están a favor de la construcción mientras que solo 59 de 125 residentes suburbanos la favorecen. ¿ Hay una diferencia significativa entre la proporción de residentes urbanos y suburbanos que favorecen la construcción de la planta nuclear?. Use un valor P. Datos: P1 : residentes urbanos de cierta ciudad. P2 : residentes suburbanos de cierta ciudad. p1 : proporción de residentes urbanos a favor de la construcción de una planta de energía nuclear. p2 : proporción de residentes suburbanos a favor de la construcción de una planta de energía nuclear. Tamaño de la primer muestra n1 = 100 residentes urbanos. Tamaño de la segunda muestra n2 = 125 residentes suburbanos. Cantidad de urbanos a favor x1 = 63 residentes urbanos. Cantidad de suburbanos a favor x2 = 59 residentes suburbanos. x 63 p̂1 = 1 = = 0.63 Proporción de urbanos a favor n 1 100 x2 59 = = 0.472 n 2 125 x + x2 63 + 59 122 p̂ = 1 = = = 0.542 Combinación de las proporciones n 1 + n 2 100 + 125 225 Hipótesis nula H0: p1 = p2. Hipótesis alternativa H1: p1 ≠ p2. Proporción de suburbanos a favor p̂ 2 = Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: Utilizamos la aproximación normal z= z= pˆ 1 − pˆ 2 pˆ qˆ[ (1 n1 ) + (1 n2 ) ] 0.63 − 0.472 ( 0.542)( 0.458) 1 1 + 100 125 = 0.158 ( 0.542)( 0.458)( 0.018) = 0.158 0.0044 = 0.158 = 2.36 0.066 P(z > 2.36 ) = 2* P(z > 2.36) = 2*(1 – 0.9909) = 0.0182 = 1.82% Respuesta: Lafata Desio Fernando, Warlet Iván Lautaro Página 68 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Rechazamos la hipótesis nula ya que hay una probabilidad de que ocurra del 1.82%. La proporción de los residentes urbanos a favor de la construcción de una planta de energía nuclear es mayor que la proporción de los residentes suburbanos a favor de la construcción de dicha planta. Problema 45 (Ref: Pág. 335/336 – Ej. 10) En un estudio sobre la fertilidad de mujeres casadas por Martín O`Connell y Carolyn C. Rogers para la Oficina de Censos en 1979, se seleccionaron al azar dos grupos de esposas con edades de 25 a 29 sin hijos y a cada mujer se le preguntó si planeaba tener un hijo. Se seleccionó un grupo entre las mujeres con menos de dos años de casadas y otro entre las que tenían cinco años de casadas. Suponga que 240 de 300 con menos de dos años de casadas planean tener algún día un hijo comparadas con 288 de las 400 con cinco años de casadas. ¿ Podemos concluir que la proporción de mujeres con menos de dos años de casadas que planean tener hijos es significativamente más alta que la proporción con cinco años de casadas?. Use un valor P. Datos: P1 : mujeres con menos de dos años de casada. P2 : mujeres con cinco años de casadas. p1 : proporción de mujeres con menos de dos años de casadas. p2 : proporción de mujeres con cinco años de casadas. Tamaño de la primer muestra n1 = 300 mujeres con menos de dos años de casadas. Tamaño de la segunda muestra n2 = 400 mujeres con cinco años de casadas. Cantidad con menos de dos años de casadas x1 = 240 mujeres. Cantidad con cinco años de casadas x2 = 288 mujeres. x 240 p̂1 = 1 = = 0.80 Proporción con menos de dos años n 1 300 x 2 288 = = 0.72 n 2 400 x + x 2 240 + 288 528 pˆ = 1 = = = 0.754 n1 + n 2 300 + 400 700 p̂ 2 = Proporción con cinco años Combinación de las proporciones H0: p1 ≤ p2. H1: p1 > p2. Hipótesis nula Hipótesis alternativa Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: Utilizamos la aproximación normal z= z= pˆ 1 − pˆ 2 pˆ qˆ[ (1 n1 ) + (1 n2 ) ] 0.80 − 0.72 ( 0.754)( 0.246) 1 1 + 300 400 Lafata Desio Fernando, Warlet Iván Lautaro = 0.08 ( 0.754)( 0.246)( 0.0055) = 0.08 0.00108199 = 0.08 ≅ 2.44 0.032893616 Página 69 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 P(z > 2.44 ) = 1 – P(z ≤ 2.44) = 1 – 0.9927 = 0.0073 = 0.73%. Respuesta: Rechazamos la hipótesis nula. La proporción de mujeres con menos de 2 años de casadas que planean tener hijos es considerablemente más alta que la proporción de mujeres con 5 años de casadas que planean tener hijos. Problema 46 (Ref: Pág. 328 – Ej. 24) Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro. Cada muestra se divide en dos submuestras y se aplican los dos tipos de análisis. A continuación se presentan los datos codificados que muestran los análisis de contenido de hierro: Muestra Análisis Rayos X Químico 1 2,0 2,2 2 2,0 1,9 3 2,3 2,5 4 2,1 2,3 5 2,4 2,4 Suponga que las poblaciones son normales, pruebe con un nivel de signficancia de 0.05 si los dos métodos de análisis dan, en promedio, el mismo resultado. Datos: Tamaño de la muestra n = 5 muestras. Hipótesis nula Hipótesis alternativa H0: μ1 = μ2 . H1: μ1 ≠ μ2. Nivel de significancia α = 0.05 Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: Región critica − t α < t < tα 2 2 − t 0.05 < t < t 0.05 2 2 − t 0.025 < t < t 0.025 Aplicando Tabla A.4. − 2.776 < t < 2.776 _ d− d 0 Donde t = s d con v = n-1 grados de libertad n Calculando: n ∑d La media muestral _ i =1 i d= n Muestra Análisis Rayos X 1 2,0 Lafata Desio Fernando, Warlet Iván Lautaro 2 2,0 3 2,3 4 2,1 5 2,4 Página 70 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Químico 2,2 1,9 2,5 2,3 2,4 di -0,2 0,1 -0,2 -0,2 0,0 _ d= ( − 0.2) + ( 0.1) + ( − 0.2) + ( − 0.2) + ( 0.0) 5 = −0.1 la desviación estándar n n n * ∑ d i2 - ∑ d i i =1 i =1 sd = n * ( n − 1) 2 con nuestros datos: sd = sd = [ ] 5 * ( - 0.2 ) + ( 0.1) + ( - 0.2 ) + ( - 0.2 ) + ( 0.0 ) - [ ( − 0.2) + ( 0.1) + ( − 0.2) + ( − 0.2) + ( 0.0 ) ] 2 2 2 2 2 2 5 * ( 5 − 1) 5 * [ ( 0.13) ] - [ ( − 0.5) ] 5 * ( 4) 2 = 0.4 = 0.1414 20 _ d− d 0 Calculamos t = s con nuestros datos d n t= − 0.1 0.1414 = −1.58 5 Respuesta: No rechazamos la hipótesis nula. Concluimos que ambos métodos no son considerablemente diferentes. Lafata Desio Fernando, Warlet Iván Lautaro Página 71 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 47 (Ref: Pág. 329 – Ej. 25) El administrador de una compañía de taxis trata de decidir si el uso de llantas radiales en lugar de llantas regulares de cinturón mejora la economía de combustible. Se equipan 12 autos con llantas radiales y se manejan por un recorrido de prueba preestablecido. Sin cambiar de conductores, los mismos autos se equipan con llantas comunes con cinturón y se manejan otra vez por el recorrido de prueba. El consumo de gasolina, en kilómetros por litro, se registró como sigue: Auto 1 2 3 4 5 6 7 8 9 10 11 12 Kilómetros por litro Llantas radiales Llantas con cinturón 4,2 4,1 4,7 4,9 6,6 6,2 7,0 6,9 6,7 6,8 4,5 4,4 5,7 5,7 6,0 5,8 7,4 6,9 4,9 4,7 6,1 6,0 5,2 4,9 ¿ Podemos concluir que los autos equipados con llantas radianes dan una economía de combustible mejor que los equipados con llantas de cinturón?. Suponga que las poblaciones se distribuyen normalmente. Utilice un valor P en su conclusión. Datos: Tamaño de la muestra n = 12 autos. Hipótesis nula Hipótesis alternativa H0: μ1 = μ2 . H1: μ1 > μ2. Nivel de significancia α = 0.05 Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: _ d− d 0 Donde t = s con v = n-1 grados de libertad d n Calculando: n ∑d La media muestral _ i =1 i d= n Lafata Desio Fernando, Warlet Iván Lautaro Página 72 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Kilómetros por litro Auto Llantas radiales Llantas con cinturón 1 4,2 4,1 2 4,7 4,9 3 6,6 6,2 4 7,0 6,9 5 6,7 6,8 6 4,5 4,4 7 5,7 5,7 8 6,0 5,8 9 7,4 6,9 10 4,9 4,7 11 6,1 6,0 12 5,2 4,9 _ d= di 0,1 -0,2 0,4 0,1 -0,1 0,1 0,0 0,2 0,5 0,2 0,1 0,3 ( 0.1) + ( − 0.2) + ( 0.4) + ( 0.1) + ( − 0.1) + ( 0.1) + ( 0.0 ) + ( 0.2) + ( 0.5) + ( 0.2 ) + ( 0.1) + ( 0.3) 12 = 0.1417 Km la desviación estándar n n n * ∑ d i2 - ∑ d i i =1 i =1 sd = n * ( n − 1) 2 con nuestros datos: sd = 12 * [ ( 0.67 ) ] - [1.7 ] 12 * (11) 2 = 5.15 = 0.198 Km 132 _ d− d 0 Calculamos t = s con nuestros datos d n t= 0.1417 = 2.48 0.198 12 Y P = P( t > 2.48) = 0.02 con 11 grados de libertad Respuesta: Rechazamos hipótesis nula ya que el nivel de significancia esta por encima del 0.02. Lafata Desio Fernando, Warlet Iván Lautaro Página 73 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 48 (Ref: Pág. 329 – Ej. 26) En el ejercicio 2 de la página 287, utilice la distribución t para probar la hipótesis de que la dieta reduce el peso de una persona en 4.5 kilogramos en promedio contra la hipótesis alternativa de que la diferencia media en peso es menor que 4.5 kilogramos. Utilice un valor P. Datos: Tamaño de la muestra n = 7 mujeres. Hipótesis nula Hipótesis alternativa H0: μ1 - μ2 = 4.5 Kilogramos H1: μ1 - μ2 < 4.5 Kilogramos Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: _ d− d 0 Donde t = s con v = n-1 grados de libertad d n Calculando: n ∑d La media muestral _ i =1 i d= n Peso 1 58, Antes 5 60, Después 0 di -1,5 _ d= 2 60, 3 54, 9 5,4 Mujeres 3 4 5 61, 69, 64, 7 0 0 58, 62, 58, 1 1 5 3,6 6,9 5,5 6 7 62, 6 56,7 59, 9 54,4 2,7 2,3 ( − 1.5) + ( 5.4) + ( 3.6) + ( 6.9) + ( 5.5) + ( 2.7 ) + ( 2.3) 7 = 3.557 Kilogramos la desviación estándar n n n * ∑ d i2 - ∑ d i i =1 i =1 sd = n * ( n − 1) 2 Lafata Desio Fernando, Warlet Iván Lautaro Página 74 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 con nuestros datos: sd = 7 * [ (134.81) ] - [24.9 ] 7 * (6 ) 2 = 323.66 = 2.776 Kilogramos 42 _ 3.557 − 4.5 d− d 0 t= = −0.896 Calculamos t = s con nuestros datos 2.776 d 7 n Y P = P( t > 0.896) = 0.3 con 6 grados de libertad Respuesta: No rechazamos la hipótesis nula. Lafata Desio Fernando, Warlet Iván Lautaro Página 75 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 49 (Ref: Pág. 329/330 – Ej. 28) En un estudio realizado por el Departamento de Nutrición Humana y Alimentos del Instituto Politécnico y Universidad Estatal de Virginia se registraron los siguientes datos acerca de la comparación de residuos de ácido sórbico, en partes por millón, en jamón inmediatamente después de sumergirlo en una solución de ácido y después de 60 días de almacenamiento: Residuos de ácido sórbico en jamón Rebanada Antes del almacenamiento Después del almacenamiento 1 224 116 2 270 96 3 400 239 4 444 329 5 590 437 6 660 597 7 1400 689 8 680 576 Si se supone que las poblaciones se distribuyen normalmente, ¿ hay suficiente evidencia, al nivel de significancia de 0.05, para decir que la duración del almacenamiento influye en las concentraciones residuales de ácido sórbico? Datos: Tamaño de la muestra n = 8 rebanadas. Hipótesis nula Hipótesis alternativa H0: μ1 = μ2. H1: μ1 ≠ μ2. Nivel de significancia α = 0.05 Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: Región critica − tα < t < tα 2 2 − t 0.05 < t < t 0.05 2 2 − t 0.025 < t < t 0.025 Aplicando Tabla A.4. − 2.365 < t < 2.365 _ d− d 0 Donde t = s con v = n-1 grados de libertad d n Lafata Desio Fernando, Warlet Iván Lautaro Página 76 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Calculando: n ∑d La media muestral _ i =1 i d= n Residuos de ácido sórbico en jamón Rebanada Antes del almacenamiento Despues del almacenamiento 1 224 116 2 270 96 3 400 239 4 444 329 5 590 437 6 660 597 7 1400 689 8 680 576 _ d= (108) + (174) + (161) + (115) + (153) + ( 63) + ( 711) + (104) = 198.625 8 di 108 174 161 115 153 63 711 104 Millón/partes la desviación estándar n n n * ∑ d i2 - ∑ d i i =1 i =1 sd = n * ( n − 1) sd = 8 * [ (624801) ] - [1589 ] 8 * (7 ) 2 2 = 2473487 = 210.165 Millón/partes 56 _ d− d 0 Calculamos t = s con nuestros datos d n t= 198.625 210.165 = 2.67 8 Respuesta: Rechazamos la hipótesis nula. La duración de almacenamiento influye en las concentraciones residuales de ácido sórbico. Lafata Desio Fernando, Warlet Iván Lautaro Página 77 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Problema 50 (Ref: Pág. 353 – Ej. 6) Se seleccionan tres canicas de una urna que contiene cinco canicas rojas y tres verdes. Después de registrar el número X de canicas rojas, las canicas se reemplazan en la urna y el experimento se repite 112 veces. Los resultados que se obtienen son los siguientes: x 0 1 3 f 1 1 2 3 5 5 25 Pruebe la hipótesis con un nivel de significancia de 0.05 de que los datos registrados se pueden ajustar con una distribución hipergeométrica h (x; 8, 3, 5), x = 0, 1, 2, 3. Datos: Variable aleatoria Repeticiones del experimento X: números de canicas rojas. m = 112 veces. Hipótesis nula Hipótesis alternativa H0: X ~ h(x, 8, 3, 5) x = 0, 1, 2, 3. H 1: es falso. Nivel de significancia α = 0.05. Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: k N − k x n − x , N n Aplicando la distribución hipergeométrica a nuestros datos: X ~ h(x, N, n, k) => P(x = xi) = Lafata Desio Fernando, Warlet Iván Lautaro x = 0, 1, 2, 3,....., n. Página 78 de 104 Cátedra: Probabilidad y Estadística UADER P(x = 0)= 5 8 − 3 03− (1) = = ≅0.1786 8 56 3 Trabajo Final 6 de Agosto de 2008 e0 = (112)*(0.01786) = 2. Lafata Desio Fernando, Warlet Iván Lautaro Página 79 de 104 Cátedra: Probabilidad y Estadística UADER P(x = 1)= 5 8 − 3 13− 2(5)31 = = ≅0.2678 8 56 3 Trabajo Final 6 de Agosto de 2008 e1 = (112)*(0.26786) = 30. Lafata Desio Fernando, Warlet Iván Lautaro Página 80 de 104 Cátedra: Probabilidad y Estadística UADER P(x = 2)= 5 8− 3 23− 1(0)3 = = ≅0.5371 8 56 3 Trabajo Final 6 de Agosto de 2008 e2 = (112)*(0.53571) = 60. Lafata Desio Fernando, Warlet Iván Lautaro Página 81 de 104 Cátedra: Probabilidad y Estadística UADER P(x = 3)= I 5 8 − 3 3− 0(1) = = ≅0.1785 8 56 3 Trabajo Final 6 de Agosto de 2008 e3 = (112)*(0.17857) = 20. xi Lafata Desio Fernando, Warlet Iván Lautaro P(x = xi) ei = mpi oi j Página 82 de 104 Cátedra: Probabilidad y Estadística UADER 1 2 3 4 0 1 2 3 Trabajo Final 6 de Agosto de 2008 0.01786 0.26786 0.53571 0.17857 ~1 Totales 2 30 60 20 112 1 31 55 25 112 1 2 3 Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia, el numero total de intervalos se reduce de cuatro a tres, lo que tiene como resultado υ = 2 grados de libertad. Utilizando el Teorema 10.1; que dice: Una prueba de la bondad de ajuste entre las frecuencias observadas y esperadas se basa en la cantidad χ 2 ( n o i − ei = ∑ i =1 ei )2 Donde χ2 es un valor de una variable aleatoria cuya distribución muestral se aproxima muy de cerca con la distribución ji cuadrada con υ = k – 1grados de libertad. Los símbolos oi y ei representan las frecuencias observada y esperada, respectivamente, para la i-ésima celda. Con nuestros datos, el valor χ2 está dado entonces por χ 2 ( n o i − ei = ∑ i =1 ei ) 2 ( 32 − 32 ) 2 ( 55 − 60) 2 ( 25 − 20 ) 2 = + + 32 60 20 =0+ 25 60 + 25 20 = 1.667 2 Para un nivel de significancia igual a α, encontramos el valor crítico χα de la tabla A.5., y entonces χ 2 > χ α2 constituye la región critica. Con el uso de la tabla A.5., encontramos χ02.05 = 5.991 con υ = 2 grados de libertad. Respuesta: Como χ 2 < χ α2 , 1.667 < 5.991, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia para sospechar que la distribución no es hipergeométrica. Problema 51 (Ref: Pág. 353 – Ej. 7) Se lanza una moneda hasta que sale una cara y se registra el número de lanzamientos X. Después de repetir el experimento 256 veces, obtenemos los siguientes resultados: x f 1 13 6 2 6 0 3 3 4 4 5 6 7 8 1 2 9 1 3 1 Lafata Desio Fernando, Warlet Iván Lautaro Página 83 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Prueba la hipótesis con un nivel de significancia de 0.05 de que la distribución observada de X se puede ajustar por una distribución geométrica g (x; 1/2), x = 1, 2, 3,...... Datos: Variable aleatoria Repeticiones del experimento X: números de lanzamientos hasta que sale una cara. m = 256 veces. Hipótesis nula Hipótesis alternativa H0: X ~ G(x, ½) x = 1, 2, 3,….. H 1: es falso. Nivel de significancia α = 0.05. Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: X ~ G(x, p) => P(x = xi) = pqx-1, x = 1, 2, 3,..... Aplicando la distribución hipergeométrica a nuestros datos P(x = 1) = ( 0.5)( 0.5) 0 = ( 0.5)(1) = 0.5 e1 = (256)*(0.5) = 128 P(x = 2) = ( 0.5)( 0.5)1 = ( 0.5)( 0.5) = 0.25 e2 = (256)*(0.25) = 64 P(x = 3) = ( 0.5)( 0.5) 2 = ( 0.5)( 0.25) = 0.125 e3 = (256)*(0.125) = 32 P(x = 4) = ( 0.5)( 0.5) 3 = ( 0.5)( 0.125) = 0.0625 e4 = (256)*(0.0625) = 16 P(x = 5) = ( 0.5)( 0.5) 4 = ( 0.5)( 0.0625) = 0.03125 e5 = (256)*(0.03125) = 8 P(x = 6) = ( 0.5)( 0.5) 5 = ( 0.5)( 0.03125) = 0.15625 e6 = (256)*(0.15625) = 4 P(x = 7) = ( 0.5)( 0.5) 6 = ( 0.5)( 0.15625) = 0.0078125 e7 = (256)*(0.0078125) = 2 P(x = 8) = ( 0.5)( 0.5) 7 = ( 0.5)( 0.0078125) = 0.00390625 e8 = (256)*(0.0078125) = 2 i 1 2 3 4 5 6 7 xi 1 2 3 4 5 6 7 Lafata Desio Fernando, Warlet Iván Lautaro P(x = xi) 0.5 0.25 0.125 0.0625 0.03125 0.015625 0.0078125 ei = mpi 128 64 32 16 8 4 2 oi 136 60 34 12 9 1 3 j 1 2 3 4 5 6 Página 84 de 104 Cátedra: Probabilidad y Estadística UADER 8 8 Trabajo Final 6 de Agosto de 2008 0.00390625 ~1 Totales 2 256 1 256 Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia, el numero total de intervalos se reduce de ocho a seis, lo que tiene como resultado υ = 5 grados de libertad. Con nuestros datos el valor χ2 está dado entonces por χ 2 ( n oi − ei = ∑ i =1 ei ) 2 (136 − 128) 2 ( 60 − 64) 2 ( 34 − 32 ) 2 (12 − 16 ) 2 ( 9 − 8) 2 ( 5 − 8) 2 = + + + + + 128 64 32 16 8 8 = 64 128 + 16 64 + 4 32 + 16 16 + 2 Para un nivel de significancia igual a α, encontramos el valor critico χα de la tabla A.5., y entonces χ 2 > χ α2 constituye la región critica. Con el uso de la tabla A.5., encontramos χ02.05 = 11.070 con υ = 5 grados de libertad. Respuesta: Como χ 2 < χ α2 , 3.125 < 11.070, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia para sospechar que la distribución no es geométrica. Problema 52 (Ref: Pág. 353 – Ej. 10) En el ejercicio 1 de la pagina 68, pruebe la bondad de ajuste entre las frecuencias de clase que se observan y las frecuencias esperadas correspondientes de una distribución normal con μ = 65 y σ = 21, utilice un nivel de significancia de 0.05. Datos: Calificaciones Intervalos Media Desviación estándar Lafata Desio Fernando, Warlet Iván Lautaro m = 60. i = 9. μ = 65. σ = 21. Página 85 de 104 1 8 + 9 8 = 25 8 = Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Hipótesis nula Hipótesis alternativa H0: X ~ N(x, 65, 21) H 1: es falso. Nivel de significancia α = 0.05. De acuerdo con el ejercicio 1 de la página 68, los intervalos y las frecuencias que se observan son i 1 2 3 4 5 6 7 8 9 Limite de clases - ∞ – 19.5 19.5 – 29.5 29.5 – 39.5 39.5 – 49.5 49.5 – 59.5 59.5 – 69.5 69.5 – 79.5 79.5 – 89.5 89.5 – + ∞ oi 3 2 3 4 5 11 14 14 4 Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: Los valores z que corresponden a los límites de las clases son: − ∞ − 65 − ∞ 19.5 − 65 − 45.5 = = −∞ z12 = = ≅ −2.17 21 21 21 21 de la tabla A.3. encontramos que el área entre z 11 y z12 es P(- ∞< z < -2.17) = P(z < -2.17) – P(z < - ∞) = 0.0150 – 0 = 0.0150 De aquí, la frecuencia esperada para la primer clase es e1 = (60)*(0.0150) = 0.9 z11 = 19.5 − 65 − 45.5 29.5 − 65 − 35.5 = ≅ −2.17 z 22 = = ≅ −1.69 21 21 21 21 de la tabla A.3. encontramos que el área entre z 21 y z22 es P(-2.17 < z < -1.69) = P(z < -1.69) – P(z < -2.17) = 0.0455 – 0.0150 = 0.0305 De aquí, la frecuencia esperada para la segunda clase es e2 = (60)*(0.0305) = 1.83 z 21 = 29.5 − 65 − 35.5 39.5 − 65 − 25.5 = ≅ −1.69 z 32 = = ≅ −1.21 21 21 21 21 de la tabla A.3. encontramos que el área entre z 31 y z32 es P(-1.69 < z < -1.21) = P(z < -1.21) – P(z < -1.69) = 0.1131 – 0.0455 = 0.0676 De aquí, la frecuencia esperada para la tercer clase es e3 = (60)*(0.0676) = 4.056 z 31 = 39.5 − 65 − 25.5 49.5 − 65 −15.5 = ≅ −1.21 z 42 = = ≅ −0.74 21 21 21 21 de la tabla A.3. encontramos que el área entre z 41 y z42 es P(-1.21 < z < -0.74) = P(z < -0.74) – P(z < -1.21) = 0.2296 – 0.1131 = 0.1165 De aquí, la frecuencia esperada para la cuarta clase es z 41 = Lafata Desio Fernando, Warlet Iván Lautaro Página 86 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 e4 = (60)*(0.1165) = 6.99 49.5 − 65 −15.5 59.5 − 65 − 5.5 = ≅ −0.74 z 52 = = ≅ −0.26 21 21 21 21 de la tabla A.3. encontramos que el área entre z 51 y z52 es P(-0.74 < z < -0.26) = P(z < -0.26) – P(z < -0.74) = 0.3974 – 0.2296 = 0.1678 De aquí, la frecuencia esperada para la quinta clase es e5 = (60)*(0.1678) = 10.068 z 51 = 59.5 − 65 − 5.5 69.5 − 65 4.5 = ≅ −0.26 z 62 = = ≅ 0.21 21 21 21 21 de la tabla A.3. encontramos que el área entre z 61 y z62 es P(-0.26 < z < 0.21) = P(z < 0.21) – P(z < -0.26) = 0.5832 – 0.3974 = 0.1858 De aquí, la frecuencia esperada para la sexta clase es e6 = (60)*(0.1858) = 11.148 z 61 = 69.5 − 65 4.5 79.5 − 65 14.5 = ≅ 0.21 z 72 = = ≅ 0.69 21 21 21 21 de la tabla A.3. encontramos que el área entre z 71 y z72 es P(0.21 < z < 0.69) = P(z < 0.69) – P(z < 0.21) = 0.7549 – 0.5832 = 0.1717 De aquí, la frecuencia esperada para la séptima clase es e7 = (60)*(0.1717) = 10.302 z 71 = 79.5 − 65 14.5 89.5 − 65 24.5 = ≅ 0.69 z 82 = = ≅ 1.17 21 21 21 21 de la tabla A.3. encontramos que el área entre z 81 y z82 es P(0.69 < z < 1.17) = P(z < 1.17) – P(z < 0.69) = 0.8790 – 0.7549 = 0.1241 De aquí, la frecuencia esperada para la octava clase es e8 = (60)*(0.1241) = 7.446 z 81 = + ∞ − 65 + ∞ 89.5 − 65 24.5 z 92 = = = +∞ = ≅ 1.17 21 21 21 21 de la tabla A.3. encontramos que el área entre z 91 y z92 es P(1.17 < z < +∞) = P(z < +∞) – P(z < 1.17) = 1 – 0.8790 = 0.121 De aquí, la frecuencia esperada para la novena clase es e9 = (60)*(0.121) = 7.26 z 91 = i 1 2 3 4 5 6 7 8 9 Totales P(x = xi) 0.0150 0.0305 0.0676 0.1165 0.1678 0.1858 0.1717 0.1241 0.1210 ~1 Lafata Desio Fernando, Warlet Iván Lautaro ei = mpi 0.9000 1.8300 4.0560 6.9900 10.068 11.148 10.302 7.4460 7.2600 60 oi 3 2 3 4 5 11 14 14 4 60 j 1 2 3 4 5 6 Página 87 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia, el numero total de intervalos se reduce de nueve a seis, lo que tiene como resultado υ = 5 grados de libertad. Con nuestros datos el valor χ2 está dado entonces por ( ) 2 n oi − ei ( 8 − 6.786 ) 2 + ( 4 − 6.99) 2 + ( 5 −10.068) 2 + (11 −11.148) 2 + (14 −10.302 ) 2 + (18 −14.706 ) 2 = = ei 6.786 6.99 10.068 11.148 10.302 14.706 i =1 1.473796 8.9401 25.684624 0.021904 13.675204 10.850436 = + + + + + ≅ 6.11 14.706 6.786 6.99 10.068 11.148 10.302 χ2 = ∑ 2 Para un nivel de significancia igual a α, encontramos el valor critico χα de la tabla A.5., y entonces χ 2 > χ α2 constituye la región critica. Con el uso de la tabla A.5., encontramos χ02.05 = 11.070 con υ = 5 grados de libertad. Respuesta: Como χ 2 < χ α2 , 6.11 < 11.070, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia para sospechar que la distribución no es normal. Problema 53 (Ref: Pág. 353 – Ej. 11) En el ejercicio 5 de la pagina 69, pruebe la bondad de ajuste entre las frecuencias de clase que se observan y las frecuencias esperadas correspondientes de una distribución normal con μ = 1.8 y σ = 0.4, utilice un nivel de significancia de 0.01. Datos: Calificaciones Intervalos Media Desviación estándar m = 40. i = 10. μ = 1.8. σ = 0.4. Hipótesis nula Hipótesis alternativa H0: X ~ N(x, 1.8, 0.4) H 1: es falso. Nivel de significancia α = 0.01. Lafata Desio Fernando, Warlet Iván Lautaro Página 88 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 De acuerdo con el ejercicio 5 de la página 69, los intervalos y las frecuencias que se observan son i 1 2 3 4 5 6 7 8 9 10 Limite de clases - ∞ – 0.795 0.795 – 0.995 0.995 – 1.195 1.195 – 1.395 1.395 – 1.595 1.595 – 1.795 1.795 – 1.995 1.995 – 2.195 2.195 – 2.395 2.395 – + ∞ oi 1 1 1 2 4 13 8 5 3 2 Incógnita: Rechazo o No Rechazo de la hipótesis nula. Solución: Los valores z que corresponden a los límites de las clases son: − ∞ − 1.8 − ∞ 0.795 −1.8 −1.005 = = −∞ z12 = = = -2.51 0.4 0. 4 0 .4 0 .4 de la tabla A.3. encontramos que el área entre z 11 y z12 es P(- ∞ < z < -2.51) = P(z < -2.51) – P(z < - ∞) = 0.0060 – 0 = 0.0060 De aquí, la frecuencia esperada para la primer clase es e1 = (40)*(0.0060) = 0.24 z11 = 0.795 −1.8 −1.005 0.995 −1.8 − 0.805 = z 22 = = = -2.51 = -2.01 0.4 0.4 0.4 0.4 de la tabla A.3. encontramos que el área entre z 21 y z22 es P(-2.51 < z < -2.01) = P(z < -2.01) – P(z < -2.51) = 0.0222 – 0.0060 = 0.0162 De aquí, la frecuencia esperada para la segunda clase es e2 = (40)*(0.0162) = 0.648 z 21 = 0.995 −1.8 − 0.805 1.195 −1.8 − 0.605 = z 32 = = = -2.01 = -1.51 0.4 0.4 0.4 0.4 de la tabla A.3. encontramos que el área entre z 31 y z32 es P(-2.01 < z < -1.51) = P(z < -1.51) – P(z < -2.01) = 0.0655 – 0.0222 = 0.0433 De aquí, la frecuencia esperada para la tercer clase es e3 = (40)*(0.0433) = 1.732 z 31 = 1.195 −1.8 − 0.605 1.395 −1.8 − 0.405 = z 42 = = = -1.51 = -1.01 0 .4 0 .4 0.4 0.4 de la tabla A.3. encontramos que el área entre z 41 y z42 es P(-1.51 < z < -1.01) = P(z < -1.01) – P(z < -1.51) = 0.1562 – 0.0655 = 0.0907 De aquí, la frecuencia esperada para la cuarta clase es e4 = (40)*(0.0907) = 3.628 z 41 = Lafata Desio Fernando, Warlet Iván Lautaro Página 89 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 1.395 −1.8 − 0.405 1.595 −1.8 − 0.205 = z 52 = = = -1.01 = -0.51 0.4 0.4 0.4 0.4 de la tabla A.3. encontramos que el área entre z 51 y z52 es P(-1.01 < z < -0.51) = P(z < -0.51) – P(z < -1.01) = 0.3050 – 0.1562 = 0.1488 De aquí, la frecuencia esperada para la quinta clase es e5 = (40)*(0.1488) = 5.952 z 51 = 1.595 −1.8 − 0.205 1.795 −1.8 0.005 = z 62 = = = -0.51 = 0.01 0.4 0 .4 0.4 0.4 de la tabla A.3. encontramos que el área entre z 61 y z62 es P(-0.51 < z < 0.01) = P(z < 0.01) – P(z < -0.51) = 0.4960 – 0.3050 = 0.191 De aquí, la frecuencia esperada para la sexta clase es e6 = (40)*(0.191) = 7.64 z 61 = 1.795 −1.8 0.005 1.995 −1.8 0.195 = z 72 = = = 0.01 = 0.49 0.4 0.4 0 .4 0.4 de la tabla A.3. encontramos que el área entre z 71 y z72 es P(0.01 < z < 0.49) = P(z < 0.49) – P(z < 0.01) = 0.6879 – 0.4960 = 0.1919 De aquí, la frecuencia esperada para la séptima clase es e7 = (40)*(0.1919) = 7.676 z 71 = 1.995 −1.8 0.195 2.195 −1.8 0.395 = z 82 = = = 0.49 = 0.99 0 .4 0 .4 0.4 0.4 de la tabla A.3. encontramos que el área entre z 81 y z82 es P(0.49 < z < 0.99) = P(z < 0.99) – P(z < 0.49) = 0.8389 – 0.6879 = 0.151 De aquí, la frecuencia esperada para la octava clase es e8 = (40)*(0.151) = 6.04 z 81 = 2.195 −1.8 0.395 2.395 −1.8 0.595 = z 92 = = = 0.99 = 1.49 0.4 0.4 0.4 0 .4 de la tabla A.3. encontramos que el área entre z 91 y z92 es P(0.99 < z < 1.49) = P(z < 1.49) – P(z < 0.99) = 0.9319 – 0.8389 = 0.093 De aquí, la frecuencia esperada para la novena clase es e9 = (40)*(0.093) = 3.72 z 91 = 2.395 −1.8 0.595 + ∞ − 1 .8 + ∞ = z102 = = = +∞ = 1.49 0.4 0.4 0.4 0.4 de la tabla A.3. encontramos que el área entre z 101 y z102 es P(1.49 < z < + ∞) = P(z < + ∞) – P(z < 1.49) = 1 – 0.9319 = 0.0681 De aquí, la frecuencia esperada para la décima clase es e9 = (40)*(0.0681) = 2.724 z101 = i 1 2 3 4 5 6 7 8 9 P(x = xi) 0,006 0,0162 0,0433 0,0907 0,1488 0,191 0,1919 0,1510 0,0930 Lafata Desio Fernando, Warlet Iván Lautaro ei = mpi 0,240 0,648 1,732 3,628 5,952 7,640 7,676 6,040 3,72 oi 1 1 1 2 4 13 8 5 3 j 1 2 3 4 5 6 Página 90 de 104 Cátedra: Probabilidad y Estadística UADER 10 Totales Trabajo Final 6 de Agosto de 2008 0,0681 ~1 2,724 40 2 40 Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia, el numero total de intervalos se reduce de diez a seis, lo que tiene como resultado υ = 5 grados de libertad. Con nuestros datos el valor χ2 está dado entonces por ( ) 2 n oi − ei ( 5 − 6.248) 2 + ( 4 − 5.952) 2 + (13 − 7.64) 2 + ( 8 − 7.676) 2 + ( 5 − 6.04 ) 2 + ( 5 − 6.444 ) 2 = = ei 6.248 5.952 7.64 7.676 6.04 6.444 i =1 1.56 3.81 28.73 0.10 1.08 = + + + + + 2.08 ≅ 5.166 6.248 5.952 7.64 7.676 6.04 6.444 χ2 = ∑ 2 Para un nivel de significancia igual a α, encontramos el valor critico χα de la tabla A.5., y entonces χ 2 > χ α2 constituye la región critica. Con el uso de la tabla A.5., encontramos χ02.01 = 15.086 con υ = 5 grados de libertad. Respuesta: Como χ 2 < χ α2 , 5.166 < 15.086, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia para sospechar que la distribución no es normal. Problema 54 (Ref: Pág. 353 – Ej. 12) En un experimento para estudiar la dependencia de la hipertensión de los hábitos de fumar, se tomaron los siguientes datos de 180 individuos: Con hipertensión Sin hipertensión No fumadores 21 48 Fumadores modernos 36 26 Fumadores empedernidos 30 19 Pruebe la hipótesis de que la presencia y ausencia de hipertensión es independiente de los hábitos de fumar. Utilice un nivel de significancia de 0.05. Datos: Tamaño de la muestra n = 180 individuos. Hipótesis nula Hipótesis alternativa H0: independientes. H 1: dependientes. Lafata Desio Fernando, Warlet Iván Lautaro Página 91 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Nivel de significancia α = 0.05. Incógnita: Dependencia o no de la hipertensión de los hábitos de fumar. Solución: Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 2 siguientes eventos. N: Un individuo seleccionado es no fumador. M: Un individuo seleccionado es fumador moderado. E: Un individuo seleccionado es fumador empedernido. S: Un individuo seleccionado tiene hipertensión. C: Un individuo seleccionado no tiene hipertensión. × 3 y definimos los Tabla de contingencia 2 X 3: N C 2 1 S 4 8 Total 6 9 M 3 6 2 6 6 2 E 3 0 1 9 4 9 Total 87 93 180 Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad: P( N ) = 69 ≃ 0.383 180 P( M ) = 62 ≃ 0.344 180 P( E ) = 49 ≃ 0.272 180 P( C ) = 87 ≃ 0.483 180 P ( S) = 93 ≃ 0.517 180 Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias esperadas: P( N C ) = P( N ) P( C ) = P ( N S) = P ( N ) P ( S) = ( 69)( 87 ) 180 ( 69)( 93) 180 Lafata Desio Fernando, Warlet Iván Lautaro ≃ 33.35 ≃ 35.65 Página 92 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 P ( M C ) = P( M ) P( C ) = P ( M S) = P ( M ) P ( S) = P( E C ) = P ( E ) P( C ) = P ( E S) = P ( E ) P ( S) = ( 62)( 87 ) 180 ( 62 )( 93) 180 ( 49)( 87 ) 180 ( 49 )( 93) 180 ≃ 29.97 ≃ 32.03 ≃ 23.68 ≃25.32 Con las frecuencias esperadas rearmamos la tabla de contingencia: N 33.3 5 S 35.6 5 Total 69 C M 29.9 7 32.0 3 62 E 23.6 8 25.3 2 49 Total 87 93 180 Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, que dice: Calcular χ 2 =∑ i ( o i − ei ) 2 ei Donde la suma se extiende a todas las celdas rc en la tabla de contingencia r X c. Si χ 2 > χ α2 con υ = (r - 1)(c - 1) grados de libertad, rechazar la hipótesis nula de independencia al nivel de significancia α; en cualquier otro caso, aceptar la hipótesis nula. Aplicando este criterio con nuestros datos, encontramos que: ( n o − ei χ2 = ∑ i ei i =1 ) 2 ( 21 − 33.35) 2 ( 36 − 29.97) 2 ( 30 − 23.68) 2 ( 48 − 35.65) 2 ( 26 − 32.03) 2 (19 − 25.32) 2 = + + + + + = 33.35 29.97 23.68 35.65 32.03 25.32 152.52 36.36 39.94 152.52 36.36 39.94 + + + + + = 14.46 33.35 29.97 23.68 35.65 32.03 25.32 Si χ 2 > χ α2 con υ =(r – 1)(c – 1) grados de libertad, rechazar la hipótesis nula de independencia. = De la tabla A.5. encontramos que χ02.05 = 5.991 para υ = (2 – 1)(3 – 1) = 2 grados de libertad. Respuesta: Lafata Desio Fernando, Warlet Iván Lautaro Página 93 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Como χ 2 > χ α2 , 14.46 > 5.991, se rechaza la hipótesis nula. Concluimos que la presencia o ausencia de hipertensión y el hábito de fumar no son independientes. Problema 55 (Ref: Pág. 354 – Ej. 14) Una muestra aleatoria de 200 hombres casados, todos retirados, se clasifica de acuerdo con la educación y el número de hijos: Educación Elemental Secundaria Universidad 0-1 14 19 12 Número de hijos 2-3 Over 3 37 32 42 17 17 10 Prueba la hipótesis, con un nivel de significancia de 0.05, de que el tamaño de la familia es independiente del nivel de instrucción del padre. Datos: Tamaño de la muestra n = 200 hombres casados. Lafata Desio Fernando, Warlet Iván Lautaro Página 94 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Hipótesis nula Hipótesis alternativa H0: independientes. H1: dependientes. Nivel de significancia α = 0.05. Incógnita: Dependencia o no del tamaño de la familia del nivel de instrucción del padre. Solución: Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 3 siguientes eventos. E: Un hombre seleccionado tiene un nivel de educación elemental. S: Un hombre seleccionado tiene un nivel de educación secundaria. U: Un hombre seleccionado tiene un nivel de educación universitaria. 0: Un hombre seleccionado tiene a lo más un hijo. 2: Un hombre seleccionado tiene entre dos y tres hijos. 3: Un hombre seleccionado tiene más de tres hijos. × 3 y definimos los Tabla de contingencia 3 X 3: 0 1 4 S 1 9 U 1 2 Total 4 5 E 2 3 7 4 2 1 7 9 6 3 3 2 1 7 1 0 5 9 Total 83 78 39 200 Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad: P( E ) = 83 ≃ 0.415 200 78 ≃ 0.39 200 39 P( U ) = ≃0.195 200 P ( S) = P( 0 ) = 45 ≃ 0.225 200 P( 2 ) = 96 ≃ 0.48 200 P ( 3) = 59 ≃ 0.295 200 Lafata Desio Fernando, Warlet Iván Lautaro Página 95 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias esperadas: ( 83)( 45) P ( E 0 ) = P ( E ) P( 0 ) = ( 83)( 96) P( E 2 ) = P( E ) P( 2 ) = P ( S 2 ) = P ( S) P ( 2 ) = P( S 3) = P( S) P( 3) = ≃ 39.84 200 ( 83)( 59) P( E 3) = P( E ) P( 3) = P ( S 0 ) = P ( S) P ( 0 ) = ≃ 18.675 200 ≃ 24.485 200 ( 78)( 45) 200 ( 78)( 96) 200 ( 78)( 59) 200 P ( U 0 ) = P( U ) P( 0 ) = P ( U 2 ) = P( U ) P( 2 ) = P ( U 3) = P ( U ) P ( 3) = ≃ 17.55 ≃ 37.44 ≃ 23.01 ( 39)( 45) 200 ( 39)( 96) 200 ( 39)( 59 ) 200 ≃ 8.775 ≃18.72 ≃ 11.505 Con las frecuencias esperadas rearmamos la tabla de contingencia: S 0 18.67 5 17.55 U 8.775 E Total 45 2 39.8 4 37.4 4 18.7 2 96 3 24.48 5 23.01 Total 83 11.50 5 59 39 78 180 Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos: χ 2 = ( n oi − ei = ∑ i =1 ei )2 = (14 − 18.675 ) 2 18.675 + ( 37 − 39.84 ) 2 39.84 + ( 32 − 24.485 ) 2 24.485 + (19 − 17.55 ) 2 17.55 + ( 42 − 37.44 ) 2 + 37.44 (17 − 23.01) 2 + 23.01 21.85 8.06 56.47 2.10 20.79 36.12 10.40 2.95 2.26 + + + + + + + + = 7.46 18.675 39.84 24.485 17.55 37.44 23.01 8.775 18.72 11.505 Si χ 2 > χ α2 con υ =(r – 1)(c – 1) grados de libertad, rechazar la hipótesis nula de independencia. Lafata Desio Fernando, Warlet Iván Lautaro Página 96 de 104 (12 − 8.775 ) 2 8.775 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 De la tabla A.5. encontramos que χ02.05 = 9.488 para υ = (3 – 1)(3 – 1) = 4 grados de libertad. Respuesta: Como χ 2 < χ α2 , 7.46 < 9.488, no se rechaza la hipótesis nula. Concluimos que el tamaño de la familia es independiente del nivel de instrucción del padre. Problema 56 (Ref: Pág. 354 – Ej.15) Un criminólogo realizó una investigación para determinar si la incidencia de ciertos tipos de crímenes varían de una parte otra en una ciudad grande. Los crímenes particulares de interés son asalto, robo, hurto y homicidio. La siguiente tabla muestra el número de crímenes cometidos en cuatro áreas de la ciudad durante el año pasado. Distrito 1 2 3 Asalto 162 310 258 Tipo de crimen Robo Hurto 118 451 196 996 193 458 Lafata Desio Fernando, Warlet Iván Lautaro Homicidio 18 25 10 Página 97 de 104 Cátedra: Probabilidad y Estadística UADER 4 Trabajo Final 6 de Agosto de 2008 280 175 390 19 Datos: Tamaño de la muestra n = 4159. Hipótesis nula Hipótesis alternativa H0: independientes. H1: dependientes. Nivel de significancia α = 0.01. Incógnita: Dependencia o no del tamaño de la familia del nivel de instrucción del padre. Solución: Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 4 siguientes eventos. A: El tipo de crimen es asalto. R: El tipo de crimen es robo. U: El tipo de crimen es hurto H: El tipo de crimen es homicidio 1: El distrito seleccionado es el 1. 2: El distrito seleccionado es el 2. 3: El distrito seleccionado es el 3. 4: El distrito seleccionado es el 4 × 4 y definimos los Tabla de contingencia 4 X 4: 1 A 162 2 310 3 358 4 280 Total 111 0 R 11 8 19 6 19 3 17 5 68 2 U 451 996 458 390 229 5 H 1 8 2 5 1 0 1 9 7 2 Total 749 1527 1019 864 4159 Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad: 1110 ≃ 0.27 4159 682 P( R ) = ≃ 0.16 4159 P( A ) = P( U ) = 2295 ≃0.55 4159 Lafata Desio Fernando, Warlet Iván Lautaro Página 98 de 104 Cátedra: Probabilidad y Estadística UADER P( H ) = Trabajo Final 6 de Agosto de 2008 72 ≃0.02 4159 P(1) = 749 ≃ 0.18 4159 P( 2 ) = 1527 ≃ 0.37 4159 P( 3) = 1019 ≃ 0.24 4159 P( 4 ) = 864 ≃ 0.21 4159 Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias esperadas: (1110 )( 749) P( A 1) = P( A ) P (1) = 4159 P( U 1) = P( U ) P(1) = P( A 2 ) = P( A ) P( 2 ) = P ( U 2 ) = P( U ) P ( 2 ) = ( 2295)( 749) ≃ 413.31 4159 (1110)(1527 ) ( 2295)(1527 ) 4159 4159 P( U 3) = P( U ) P( 3) = P( A 4 ) = P( A ) P ( 4 ) = P( U 4 ) = P( U ) P( 4 ) = ≃ 407.55 4159 (1110)(1019) P( A 3) = P( A ) P( 3) = P( R 1) = P( R ) P(1) = ≃ 199.90 ≃ 271.96 ( 2295)(1019) 4159 (1110)( 864) ≃ 562.30 ≃ 230.59 4159 ( 2295)( 864) 4159 ≃ 842.62 ≃ 476.77 ( 682)( 749) ≃ 122.82 4159 ( 72)( 749) P( H 1) = P( H ) P(1) = ≃ 12.97 4159 P( R 2 ) = P( R ) P ( 2 ) = ( 682 )(1527 ) 4159 Lafata Desio Fernando, Warlet Iván Lautaro ≃ 250.40 Página 99 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 P ( H 2 ) = P( H ) P( 2 ) = P( R 3) = P( R ) P( 3) = 4159 ( 682 )(1019) 4159 P( H 3) = P( H ) P( 3) = P( R 4 ) = P( R ) P ( 4 ) = ( 72)(1527 ) ( 72)(1019) 4159 ( 682)( 864) P ( H 4 ) = P( H ) P ( 4 ) = 4159 ( 72)( 864) 4159 ≃ 26.43 ≃ 167.10 ≃ 17.64 ≃ 141.68 ≃ 14.96 Con las frecuencias esperadas rearmamos la tabla de contingencia: 1 A 199.9 2 407.5 5 3 271.9 6 4 230.5 9 Total 1110 R 122.8 2 250.4 167.1 0 141.6 8 682 U 413.3 1 842.6 2 562.3 0 476.7 7 2295 H 12.9 7 26.4 3 17.6 4 14.9 6 72 Total 749 1527 1019 864 4159 Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos: ( ) 2 n o − ei (162 −199.9 ) 2 + (118 −122.82 ) 2 + ( 451 − 413.31) 2 + (18 −12.96 ) 2 + ( 310 − 407.54 ) 2 + (196 χ2 = ∑ i = ei 199.9 122.82 413.31 12.96 407.54 i =1 ( 25 − 26.43) 2 + ( 358 − 271.96 ) 2 + (193 −167.09 ) 2 + ( 458 − 562.3) 2 + (10 −17.64 ) 2 + ( 280 − 230.59 ) 2 + (175 − + 26.43 271.96 167.09 562.3 17.64 230.59 14 2 (19 −14.96 ) = 1436.41 + 23.23 + 1420.53 + 25.40 + 9514.05 + 2959.36 + 23525.42 + 2.04 + 7402.88 + 671.3 + 14.96 199.9 122.82 413.31 12.96 407.54 250.4 842.62 26.43 271.96 167.09 1096.27 7527.29 16.32 + + =165.01 141.89 476.76 14.96 Si χ 2 > χ α2 con υ =(r – 1)(c – 1) grados de libertad, rechazar la hipótesis nula de independencia. De la tabla A.5. encontramos que χ02.01 = 21.666 para υ = (4 – 1)(4 – 1) = 9 grados de libertad. Respuesta: Como χ 2 > χ α2 , 165.01 > 21.666, se rechaza la hipótesis nula. Concluimos que el tipo de crimen no es independiente del distrito de la ciudad. Problema 57 (Ref: Pág. 354 – Ej. 16) La enfermería de una universidad realiza un experimento para determinar el grado de alivio que proporcionan tres remedios para la tos. Cada remedio para la tos se trata en cincuenta estudiantes y se registran los siguientes datos: Lafata Desio Fernando, Warlet Iván Lautaro Página 100 de 104 Cátedra: Probabilidad y Estadística UADER Sin alivio Cierto alivio Alivio completo Trabajo Final 6 de Agosto de 2008 Remedio para la tos NyQuil Robitussin Triaminic 11 13 9 32 28 27 7 9 14 Pruebe la hipótesis, con un nivel de significancia de 0.05, de que los tres remedios para la tos son igualmente efectivos. Datos: Tamaño de la muestra n = 150 estudiantes. Hipótesis nula Hipótesis alternativa H0: los tres remedios son igualmente efectivos. H1: los tres remedios no son igualmente efectivos. Nivel de significancia α = 0.05. Incógnita: Homogeneidad o no entre los remedios. Solución: Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 3 siguientes eventos. S: El remedio no proporciona alivio. A: El remedio proporciona cierto alivio. C: El remedio proporciona alivio completo. N: El remedio seleccionado es NyQuil. R: El remedio seleccionado es Robitussin. T: El remedio seleccionado es Triaminic. × 3 y definimos los Tabla de contingencia 3 X 3: N 1 1 3 2 7 R 1 3 2 8 9 Total 5 0 5 0 S A C T 9 Total 33 2 7 1 4 5 0 87 30 150 Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad. P ( S) = 33 = 0.22 150 Lafata Desio Fernando, Warlet Iván Lautaro Página 101 de 104 Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 87 ≃ 0.053 150 30 P( C ) = = 0.2 150 P( A ) = P( N ) = 50 ≃ 0.33 150 P( R ) = 50 ≃ 0.33 150 P( T ) = 50 ≃ 0.34 150 Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias esperadas: ( 33)( 50) P ( S N ) = P ( S) P ( N ) = ( 33)( 50 ) P ( S R ) = P ( S) P ( R ) = P ( S T ) = P ( S) P ( T ) = 150 ( 33)( 5) 150 P( A N ) = P( A ) P( N ) = P( A R ) = P( A ) P( R ) = P( A R ) = P( A ) P( R ) = P( C R ) = P ( C ) P ( R ) = = 11 = 11 ( 87 )( 50) = 29 150 ( 87 )( 50) 150 ( 87 )( 50) 150 P( C N ) = P( C ) P( N ) = P( C R ) = P ( C ) P ( R ) = = 11 150 = 29 = 29 ( 30)( 50) 150 ( 30)( 50) 150 ( 30)( 50) 150 = 10 =10 = 10 Con las frecuencias esperadas rearmamos la tabla de contingencia: S N R T 1 1 1 Total 33 Lafata Desio Fernando, Warlet Iván Lautaro Página 102 de 104 Cátedra: Probabilidad y Estadística UADER 1 2 9 C 1 0 Total 5 0 A 1 2 9 1 0 5 0 1 2 9 1 0 5 0 Trabajo Final 6 de Agosto de 2008 87 30 150 Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos: χ 2 ( n oi − ei = ∑ i =1 ei =0+ ) 2 ( 11 − 11) 2 ( 13 − 11) 2 ( 9 − 11) 2 ( 32 − 29 ) 2 ( 28 − 29 ) 2 ( 27 − 29 ) 2 ( 7 − 10 ) 2 ( 9 − 10 ) 2 ( 14 − 10 ) 2 = + 11 + 11 + 11 + 29 + 29 + 29 + + 10 10 10 4 4 9 1 4 9 1 16 + + + + + + + = 3.81 11 11 29 29 29 10 10 10 Si χ 2 > χ α2 con υ =(r – 1) (c – 1) grados de libertad, rechazar la hipótesis nula de independencia. De la tabla A.5. encontramos que χ02.05 = 9.488 para υ = (3 – 1) (3 – 1) = 4 grados de libertad. Respuesta: Como χ 2 < χ α2 , 3.81 < 9.488, no se rechaza la hipótesis nula. Concluimos que los tres remedios son igualmente efectivos. Lafata Desio Fernando, Warlet Iván Lautaro Página 103 de 104 = Cátedra: Probabilidad y Estadística UADER Trabajo Final 6 de Agosto de 2008 Bibliografías: Walpole, Myers y Myers, “Probabilidad y Estadística para Ingenieros”, sexta edición. Apuntes de la cátedra. Los recursos computacionales utilizados: Calculadora científica, EasyFit (versión gratuita), Excel 2007 y Word 2007. Lafata Desio Fernando, Warlet Iván Lautaro Página 104 de 104