Taller 2 - Facultad de Ciencias-UCV

Anuncio
Universidad Central de Venezuela
Facultad de Ciencias
Escuela de Computación
Probabilidad y Estadística
Taller 2
A ser realizado en los laboratorios docentes
1. Objetivos:
•
•
•
Determinación de los intervalos de confianza para los estimadores vistos en clases.
Determinación de los intervalos de confianza para el estimador de la probabilidad de éxitos en
una muestra y la diferencia de proporciones de éxito en dos muestras.
Determinación de los intervalos de confianza para el estimador de la varianza de una muestra y la
razón de los estimadores de la varianza para dos muestras.
2. Actividades preliminares al taller:
•
Investigue cómo puede usar Excel para calcular valores estadísticos como promedio, desviación
estándar y varianza.
•
Consulte la documentación de la hoja de cálculo MS-Excel, para saber cómo calcular
probabilidades para las distribuciones Normal, Normal Estándar, T-Student, Chi Cuadrado, F. En
particular, revise en la ayuda en línea, la documentación de las siguientes funciones:
o
DISTR.NORM,
DISTR.NORM.INV,
DISTR.NORM.ESTAND.INV.
o
DISTR.T, DISTR.T.INV
o
DISTR.CHI, PRUEBA.CHI.INV
o
DISTR.F, DIST.F.INV
DISTR.NORM.ESTAND,
3. Desarrollo del taller:
Instrucciones Generales:
• El taller es individual y debe ser entregado a más tardar el martes 17’Julio. a las 7pm.
• Debe entregar los resultados del taller en un único libro de Excel. Nombre el archivo con su
nombre, C.I. y sección de la siguiente forma nombre_cedula_seccion.xls
(ejemplo:
CarlosPerez_11996567_A1.xls) En la hoja, identifique claramente cada ejercicio, indicando número
del ejercicio. Se recomienda que agregue rótulos descriptivos a los valores de entrada, cálculos
intermedios y resultado.
• Deben enviar los archivos del taller, comprimidos en un archivo zip al correo electrónico del
preparador Oskar Cahueñas oskarcah@gmail.com. Indicando en el asunto del email “Taller #1
Probabilidad y Estadística” nombre y CI.
Utilizando las funciones estadísticas de la hoja de cálculo MS-Excel, resuelva los siguiente problemas:
1.
Una muestra aleatoria sobre 100 propietarios de automóviles en Caracas, muestra que en promedio,
un vehículo recorre 23500 Km. con una desviación estándar de 3900 Km.
a) Construya los intervalos de confianza del 95%,96%,97%,98% y 99% para el número promedio de
Kms. que recorre un automóvil al año en la ciudad.
b) ¿Qué se puede afirmar con un 99% de confianza acerca de la magnitud del error, si se estima que
el número promedio de kilómetros recorridos anualmente por los automóviles en Caracas es igual
a 23500.
2.
Se toman dos muestras del tiempo de ejecución de una transacción en un servidor Web (medida en
ms). Los resultados de las muestras se presentan en la siguiente tabla:
Muestra 1
Muestra 2
3,4
4,8
2,5
2,7
4,8
3,6
2,9
3,1
3,6
4,0
Tiempo de ejecución (ms.)
2,8
3,3
5,6
3,7
2,8
2,9
5,5
5,0
2,4
5,0
4,4
4,0
4,0
3,0
5,2
2,6
3,0
2,1
a) Calcule los intervalos de confianza del 95%, y 99% para el tiempo promedio de cada una de las
muestras.
b) ¿Difieren considerablemente dichos intervalos de confianza de una muestra a otra? ¿Qué puede
concluir?
c) Se requiere una estimación de la media del tiempo de ejecución de transacciones en el servidor, tal
que se garantice que no difiera en más de 0,25ms con certeza del 98%. de la media real. ¿Es el
tamaño de las muestras 1 y 2 adecuado para satisfacer este requerimiento? De no ser así ¿De qué
tamaño debe ser la muestra?
3.
Se registraron los siguientes resultados, medidos en días, del tiempo de recuperación para pacientes
que se tratan de manera aleatoria con uno de dos nuevos antibióticos para combatir cierta infección
intestinal:
Tamaño de la muestra
Medicamento 1
Medicamento 2
14
16
Número de días
promedio
17
19
Desviación Estándar
1.5
1.8
Encuentre el intervalo de confianza del 99% para la diferencia de las medias de los tiempos de
recuperación para cada medicamento. Suponga poblaciones normales con varianzas iguales.
4.
Se desarrolla una nueva cura para cierto tipo de cemento, que tiene como resultado un coeficiente de
compresión de 5000 Kg/cm2 y desviación estándar de 120 Kg/cm2 . Para probar la hipótesis de que medio μ =
5000 contra la alternativa μ < 5000, se realizan pruebas con una muestra aleatoria de 50+D2 piezas de
cemento. La región crítica se define como x < 4970 + D1 , donde D1 y D2 son el último y penúltimo dígito
de su cédula de identidad respectivamente.
a) Encuentre α = P (Error tipo I).
b) Encuentre β= P(Error tipo II) para las hipótesis alternativas μ = 4970 + D1 y μ = 4960 + D1,
donde D1 es el último dígito de su cédula de identidad.
5.
Una muestra aleatoria de 100 fallecidos en Caracas, da como resultado una edad de vida promedio de
71+ (D1/ 10) años, con una desviación estándar de 8 + (D2/10) años. ¿Esto es evidencia suficiente para
determinar que la esperanza de vida de los habitantes caraqueños es mayor a 70 años, con un nivel de
significancia de (D3 + 1) / 100? Realice la prueba de hipótesis asumiendo varianza conocida y varianza
desconocida y compare los resultados (D1,D2,D3 son el último, penúltimo y antepenúltimo dígito de su
Cédula de Identidad, respectivamente),
6.
Los siguientes datos representan los tiempos de duración (en minutos) de las películas producidas
por dos compañías cinematográficas:
Compañía 1
Compañía 2
102
81
86
165
Tiempo de cada película (min.)
98
109
92
97
134
92
87
114
Pruebe la hipótesis de que el tiempo promedio de las películas producidas por la compañía 2 supera al de
la compañía 1 en 10 min., contra la alternativa de que la diferencia de los tiempos promedio es de más de 10
min. Utilice un nivel de significancia de 0.1 y asuma que en ambas compañías el tiempo de las películas se
distribuye normalmente con varianzas iguales.
ORCC
Febrero 2007
Descargar