Universidad Central de Venezuela Facultad de Ciencias Escuela de Computación Probabilidad y Estadística Taller 2 A ser realizado en los laboratorios docentes 1. Objetivos: • • • Determinación de los intervalos de confianza para los estimadores vistos en clases. Determinación de los intervalos de confianza para el estimador de la probabilidad de éxitos en una muestra y la diferencia de proporciones de éxito en dos muestras. Determinación de los intervalos de confianza para el estimador de la varianza de una muestra y la razón de los estimadores de la varianza para dos muestras. 2. Actividades preliminares al taller: • Investigue cómo puede usar Excel para calcular valores estadísticos como promedio, desviación estándar y varianza. • Consulte la documentación de la hoja de cálculo MS-Excel, para saber cómo calcular probabilidades para las distribuciones Normal, Normal Estándar, T-Student, Chi Cuadrado, F. En particular, revise en la ayuda en línea, la documentación de las siguientes funciones: o DISTR.NORM, DISTR.NORM.INV, DISTR.NORM.ESTAND.INV. o DISTR.T, DISTR.T.INV o DISTR.CHI, PRUEBA.CHI.INV o DISTR.F, DIST.F.INV DISTR.NORM.ESTAND, 3. Desarrollo del taller: Instrucciones Generales: • El taller es individual y debe ser entregado a más tardar el martes 17’Julio. a las 7pm. • Debe entregar los resultados del taller en un único libro de Excel. Nombre el archivo con su nombre, C.I. y sección de la siguiente forma nombre_cedula_seccion.xls (ejemplo: CarlosPerez_11996567_A1.xls) En la hoja, identifique claramente cada ejercicio, indicando número del ejercicio. Se recomienda que agregue rótulos descriptivos a los valores de entrada, cálculos intermedios y resultado. • Deben enviar los archivos del taller, comprimidos en un archivo zip al correo electrónico del preparador Oskar Cahueñas oskarcah@gmail.com. Indicando en el asunto del email “Taller #1 Probabilidad y Estadística” nombre y CI. Utilizando las funciones estadísticas de la hoja de cálculo MS-Excel, resuelva los siguiente problemas: 1. Una muestra aleatoria sobre 100 propietarios de automóviles en Caracas, muestra que en promedio, un vehículo recorre 23500 Km. con una desviación estándar de 3900 Km. a) Construya los intervalos de confianza del 95%,96%,97%,98% y 99% para el número promedio de Kms. que recorre un automóvil al año en la ciudad. b) ¿Qué se puede afirmar con un 99% de confianza acerca de la magnitud del error, si se estima que el número promedio de kilómetros recorridos anualmente por los automóviles en Caracas es igual a 23500. 2. Se toman dos muestras del tiempo de ejecución de una transacción en un servidor Web (medida en ms). Los resultados de las muestras se presentan en la siguiente tabla: Muestra 1 Muestra 2 3,4 4,8 2,5 2,7 4,8 3,6 2,9 3,1 3,6 4,0 Tiempo de ejecución (ms.) 2,8 3,3 5,6 3,7 2,8 2,9 5,5 5,0 2,4 5,0 4,4 4,0 4,0 3,0 5,2 2,6 3,0 2,1 a) Calcule los intervalos de confianza del 95%, y 99% para el tiempo promedio de cada una de las muestras. b) ¿Difieren considerablemente dichos intervalos de confianza de una muestra a otra? ¿Qué puede concluir? c) Se requiere una estimación de la media del tiempo de ejecución de transacciones en el servidor, tal que se garantice que no difiera en más de 0,25ms con certeza del 98%. de la media real. ¿Es el tamaño de las muestras 1 y 2 adecuado para satisfacer este requerimiento? De no ser así ¿De qué tamaño debe ser la muestra? 3. Se registraron los siguientes resultados, medidos en días, del tiempo de recuperación para pacientes que se tratan de manera aleatoria con uno de dos nuevos antibióticos para combatir cierta infección intestinal: Tamaño de la muestra Medicamento 1 Medicamento 2 14 16 Número de días promedio 17 19 Desviación Estándar 1.5 1.8 Encuentre el intervalo de confianza del 99% para la diferencia de las medias de los tiempos de recuperación para cada medicamento. Suponga poblaciones normales con varianzas iguales. 4. Se desarrolla una nueva cura para cierto tipo de cemento, que tiene como resultado un coeficiente de compresión de 5000 Kg/cm2 y desviación estándar de 120 Kg/cm2 . Para probar la hipótesis de que medio μ = 5000 contra la alternativa μ < 5000, se realizan pruebas con una muestra aleatoria de 50+D2 piezas de cemento. La región crítica se define como x < 4970 + D1 , donde D1 y D2 son el último y penúltimo dígito de su cédula de identidad respectivamente. a) Encuentre α = P (Error tipo I). b) Encuentre β= P(Error tipo II) para las hipótesis alternativas μ = 4970 + D1 y μ = 4960 + D1, donde D1 es el último dígito de su cédula de identidad. 5. Una muestra aleatoria de 100 fallecidos en Caracas, da como resultado una edad de vida promedio de 71+ (D1/ 10) años, con una desviación estándar de 8 + (D2/10) años. ¿Esto es evidencia suficiente para determinar que la esperanza de vida de los habitantes caraqueños es mayor a 70 años, con un nivel de significancia de (D3 + 1) / 100? Realice la prueba de hipótesis asumiendo varianza conocida y varianza desconocida y compare los resultados (D1,D2,D3 son el último, penúltimo y antepenúltimo dígito de su Cédula de Identidad, respectivamente), 6. Los siguientes datos representan los tiempos de duración (en minutos) de las películas producidas por dos compañías cinematográficas: Compañía 1 Compañía 2 102 81 86 165 Tiempo de cada película (min.) 98 109 92 97 134 92 87 114 Pruebe la hipótesis de que el tiempo promedio de las películas producidas por la compañía 2 supera al de la compañía 1 en 10 min., contra la alternativa de que la diferencia de los tiempos promedio es de más de 10 min. Utilice un nivel de significancia de 0.1 y asuma que en ambas compañías el tiempo de las películas se distribuye normalmente con varianzas iguales. ORCC Febrero 2007