Universidad Austral Estadística II Práctico No 2 Distribución Chi- cuadrado. Pruebas de bondad de ajuste Ejercicio 1: a.- Calcular el 95 avo percentil de la distribución chi-cuadrado con 10 grados de libertad. b.- Calcular el quinto percentil de la distribución chi-cuadrado con 10 grados de libertad. c.- Calcular P 10.98 2 36.78 con 2 una variable con distribución chi-cuadrado con 22 grados de libertad. d.- Calcular P 2 14.611 ó 2 37.652 con 2 una variable con distribución chicuadrado con 25 grados de libertad. Ejercicio 2: Supóngase que se extraen muestras de una población normal cuya varianza es igual a 8.25. a.- Si el tamaño muestral es 3, ¿cuál es la probabilidad de que el valor chi-cuadrado, con (n-1) grados de libertad, sea mayor que 5.66? b.- Si el tamaño muestral es 3, ¿cuál es la probabilidad de que la varianza muestral sea mayor que 3 veces la varianza poblacional? Ejercicio 3: Se determinó la cantidad de expansión lateral (mils) para una muestra de 9 soldaduras de arco de metal y gas accionado por pulsos, empleados en tanques contenedores de gas licuado natural en barcos. La desviación estándar muestral es de 2.81 mils. Suponiendo normalidad, determine un intervalo de confianza de 95% para 2 y para . Ejercicio 4: Se hicieron las siguientes observaciones de resistencia a la fractura de placas base de 18% de acero maragizado al níquel, dadas en orden creciente: 69.5 71.9 72.6 73.1 73.3 73.5 75.5 75.7 75.8 76.1 76.2 76.2 77.0 77.9 78.1 79.6 79.7 79.9 80.1 82.2 83.7 93.7 Calcule un intervalo de confianza del 99% para la desviación estándar de la distribución de la resistencia a la fractura. ¿Es válido este intervalo cualquiera sea la distribución de la resistencia a la fractura? Explique. Ejercicio 5: El propietario de una cadena de locales de hamburguesas tiene interés en la variabilidad de la cantidad de carne que contienen sus hamburguesas. Se supone que dicha cantidad de carne tiene una desviación estándar no mayor que 0.2 onzas. Una muestra aleatoria de 20 hamburguesas presenta una desviación estándar muestral de 0.4 onzas. a.- ¿Cuál es la probabilidad de ocurrencia de este valor? 7 Práctico 2 Distribución Chi-cuadrado. Pruebas de bondad de ajuste b.- ¿Cuál es la probabilidad de que la desvío estándar muestral no supere 0.2 onzas? c.- ¿Hay razón para creer que es excesiva la variación en la cantidad de carne? Ejercicio 6: Se debe controlar la variación de los anchos de las ventanas de contacto de determinado chips para circuito integrado si se desea que los circuitos funcionen en forma correcta. Las especificaciones establecen que la variación de los anchos debe ser de 0.30 (µm)2. Se estudian en 10 especímenes detectándose los siguientes anchos (en µm): 3.21; 2.49; 2.94; 4.38; 4.02; 3.82; 3.30; 2.85; 3.34; 3.91. ¿Se podrá rechazar la afirmación de que se cumple con dicha especificación con un nivel del 5%? Ejercicio 7: La dispersión, o variancia, de tiempos de acarreo en un proyecto de construcción son de gran importancia para el sobrestante, ya que los tiempos muy variables de acarreo originan problemas en la programación de los trabajos. El encargado de los transportes dice que el intervalo del tiempo de acarreo no debe ser mayor que 40 minutos (ese intervalo es la diferencia entre el tiempo mayor y el menor). Si se supone que los tiempos de acarreo se distribuyen normalmente, el sobrestante cree que la afirmación acerca de los límites quiere decir que el desvío estándar debe ser aproximadamente de 10 minutos. Se midieron 15 tiempos de acarreo obteniéndose un promedio de 142 minutos y un desvío estándar de 12 minutos. ¿Puede refutarse, en base a la evidencia muestral, la afirmación de que el desvío es de 10 minutos en el nivel de significación del 5%? Ejercicio 8: El gerente de una empresa ha recopilado datos acerca del número de veces que se interrumpió el servicio a los usuarios por fallas de los equipos en cada día, durante los últimos 500 días; obteniéndose la siguiente distribución de frecuencias: Interrupciones diarias 0 1 2 3 4 5 6 Total Número de días 160 175 86 41 18 12 8 500 ¿Se puede decir que la distribución de las interrupciones del servicio cumple con el modelo de la distribución de Poisson con un nivel de significación del 1%? Ejercicio 9: El tiempo, en segundos, entre las llegadas de vehículos a determinado cruce, se midió durante determinado período de tiempo con los siguientes resultados: 9.0 8.9 10.1 10.5 10.2 10.0 9.3 18.1 9.5 10.6 9.8 16.8 14.2 13.6 16.1 11.1 a.- Probar la hipótesis de que los datos provienen de una distribución exponencial con = 0.05. 8 Práctico 2 Distribución Chi-cuadrado. Pruebas de bondad de ajuste b.- Probar la hipótesis de que los datos provienen de una distribución exponencial con un promedio de 12 segundos, usando = 0.05. Ejercicio 10: Se reportan los siguientes datos relacionados con la rapidez de oxigenación en arroyos a 20 oC en cierta región. La media muestral y la desviación estándar calculadas son 0.173 y 0.066 respectivamente. Con base a la siguiente distribución de frecuencia, ¿se puede concluir que la rapidez de oxigenación es una variable normalmente distribuida? Rapidez (por día) Menos de 0.100 0.100 – menos de 0.150 0.150 – menos de 0.200 0.200 – menos de 0.250 0.250 ó más Frecuencia 12 20 23 15 13 Ejercicio 11: Se supone que los pesos de los gránulos de cobre siguen una distribución normal logarítmica, es decir, que los logaritmos de los pesos deben seguir una distribución normal. Veinte determinaciones, en 10-4 gramos, dieron los siguientes resultados: 2.0 6.1 3.0 6.6 3.1 7.3 4.3 7.6 4.4 8.3 4.8 9.1 4.9 11.2 5.1 14.4 5.4 16.7 5.7 19.8 Probar la hipótesis mencionada con un nivel de significación del 5%. Ejercicio 12: El consejo directivo de una universidad quiere determinar la opinión de diversos grupos en relación con el calendario académico cuatrimestral propuesto. Una muestra aleatoria seleccionada entre 100 estudiantes de grado, 50 de posgrado y 50 profesores condujo a: Opinión Favorable Desfavorable Total grado 63 37 100 postgrado 27 23 50 profesores 30 20 50 Con un nivel de significación del 1%, determinar si hay pruebas de una diferencia en la opinión de los grupos. Ejercicio 13: Un agrónomo está estudiando 3 variedades de tomates para determinar si hay diferencia en la proporción de germinación de sus semillas. Se sometieron muestras aleatorias de 100 semillas de cada variedad (A, B y C) a las mismas condiciones iniciales con los siguientes resultados: Opinión Germinaron No germinaron Total Tomate A Tomate B Tomate C 82 18 100 70 30 100 58 42 100 Determinar si existe alguna diferencia entre las variedades de tomates y la proporción de semillas que germinan, con un nivel de significación del 10%. 9 Práctico 2 Distribución Chi-cuadrado. Pruebas de bondad de ajuste Ejercicio 14: El gerente de un centro comercial quiere saber si hay diferencia en la proporción de mujeres compradoras en diversos centros de atención. Se seleccionaron muestras de 300 clientes en horario diurno, 300 en horario nocturno y 400 clientes de fin de semana. Los resultados se muestran en la siguiente tabla: Sexo Hombres Mujeres Total Diurno 90 210 300 Nocturno 125 175 300 Fin de semana 185 215 400 ¿Se verifica la diferencia que se quiere probar, al nivel de significación del 5%? Ejercicio 15: El gerente de control de calidad de una fábrica de autopartes quiere saber si hay una diferencia en la proporción de partes defectuosas producidas en diversos días de la semana laboral. Se obtuvieron muestras de 100 partes de cada día con los siguientes resultados: Defectuosas Buenas Total Lunes 12 88 100 Martes 7 93 100 Miércoles 7 93 100 Jueves 10 90 100 Viernes 14 86 100 Determinar si existe diferencia en la proporción de piezas defectuosas en los diversos días de la semana a un nivel de significación del 5%. Ejercicio 16: El departamento de Estadística de una universidad quiere saber si hay relación entre el interés de los estudiantes por la Estadística y su capacidad para las matemáticas. Se selecciona una muestra de 200 estudiantes a modo de encuesta, obteniéndose los siguientes resultados: Interés en Estadística Bajo Promedio Alto Total Capacidad para matemática Baja Promedio Alta 60 15 15 15 45 10 5 10 25 80 70 50 Total 90 70 40 200 ¿Se verifica esta relación al nivel de significación del 1%? Ejercicio 17: Un fabricante de baterías para automóviles desea saber si existe una relación entre el medio de publicidad empleado y el grado de reconocimiento del producto. Los resultados arrojados por una encuesta de análisis de mercado fueron los siguientes: Grado de Medio publicitario reconocimiento Prensa Televisión Radio 25 10 7 Positivo 73 93 108 Negativo 98 103 115 Total Total 42 274 316 ¿Existe la relación planteada con un nivel de significación del 10%? 10 Práctico 2 Distribución Chi-cuadrado. Pruebas de bondad de ajuste Ejercicio 18: Se efectuó una encuesta para determinar las preferencias de hombres de diferentes edades acerca de diversos deportes. Sobre una muestra de 1000 hombres, a cada uno se le pidió que indique cuál era su deporte favorito, obteniéndose los siguientes resultados: Edad (años) Menos de 20 20 - 29 30 - 39 40 - 49 50 ó más Total Beisbol 26 38 72 96 134 366 Deporte favorito Fútbol Basket 47 41 84 80 68 38 48 30 44 18 291 207 Hockey 36 48 22 26 4 136 Total 150 250 200 200 200 1000 A un nivel de significación del 1%, ¿hay relación entre la edad de los hombres y su preferencia por los deportes? Ejercicio 19: La tabla siguiente recoge los resultados de un estudio acerca de si la edad de los conductores de vehículos, mayores de 21 años, afecta al número de accidentes que sufren. Al nivel de significación del 1%, contrastar la hipótesis de que el número de accidentes es independiente de la edad del conductor. Edad (años) 21- 30 31 - 40 41 - 50 51 - 60 61- 70 Número de accidentes 0 748 821 786 720 672 1 74 60 51 66 50 2 31 25 22 16 15 Más de 2 9 10 6 5 7 Ejercicio 20: El artículo “Susceptibility of Mice to Audiogenic Seizure is Increased by Handling Their Dams During Gestation” (Science, 1976, pp 427-428) reporta sobre la investigación del efecto de diferentes tratamientos con inyecciones sobre las frecuencias de las convulsiones audiogénicas. Tratamiento Tienilalanina Solvente Falsificación No se maneja Sin respuesta 21 15 23 47 Carrera salvaje 7 14 10 13 Convulsión clónica 24 20 23 28 Convulsión tónica 44 54 48 32 ¿La información sugiere que los verdaderos porcentajes de las diferentes categorías de respuesta dependen de la naturaleza del tratamiento con inyecciones? Exprese y pruebe las hipótesis pertinentes con un nivel del 5%. Ejercicio 21: Los siguientes datos sobre combinaciones de sexo de dos recombinantes, los cuales resultan de seis diferentes genotipos masculinos, aparecen en el artículo “A New 11 Práctico 2 Distribución Chi-cuadrado. Pruebas de bondad de ajuste Method for Distinguishing Between Meiotic and Premeiotic Recombintional Events in Drosophila melanogaster” (Genetic, 1979, pp 543 – 554). ¿Los datos soportan la hipótesis de que la distribución de frecuencia entre las tres combinaciones de sexo es homogénea con respecto a los diferentes genotipos? Defina los parámetros de interés, exprese Ho y H1 pertinentes y realice el análisis. Combinación de sexos M/M M/F F/F Genotipo masculino 1 2 3 4 5 6 35 41 33 8 5 30 80 84 87 26 11 65 39 45 31 8 6 20 Ejercicio 22: La siguiente salida de Statistics corresponde a un test chi-cuadrado con datos referidos a marcas en hojas encontradas en muestras de tréboles blancos seleccionadas de lugares de pasto largo (726 muestras) y de lugares de pasto corto (761 muestras). Las marcas de hojas se clasifican en: L, LL Y+YL, O y otras ¿Es un test de homogeneidad o de independencia? ¿Cuál es la hipótesis testeada y cuál es la conclusión? ¿Con que nivel se trabajó? CHI-SQUARE TEST FOR HETEROGENEITY OR INDEPENDENCE FOR 1 = MARCA TIPOPASTO TIPOPASTO MARCA Pastolargo Pastocorto +-----------+-----------+ Marca L OBS | 409 | 512 | 921 EXPECTED | 449.66 | 471.34 | CELL CHI-SQ | 3.68 | 3.51 | +-----------+-----------+ Marca LL OBS | 11 | 4 | 15 EXPECTED | 7.32 | 7.68 | CELL CHI-SQ | 1.85 | 1.76 | +-----------+-----------+ Marca Y+YL OBS | 22 | 14 | 36 EXPECTED | 17.58 | 18.42 | CELL CHI-SQ | 1.11 | 1.06 | +-----------+-----------+ Marca 0 OBS | 7 | 11 | 18 EXPECTED | 8.79 | 9.21 | CELL CHI-SQ | 0.36 | 0.35 | +-----------+-----------+ Otras OBSERVED | 277 | 220 | 497 EXPECTED | 242.65 | 254.35 | CELL CHI-SQ | 4.86 | 4.64 | +-----------+-----------+ 726 761 1487 OVERALL CHI-SQUARE P-VALUE DEGREES OF FREEDOM CASES INCLUDED 1487 23.18 0.0001 4 MISSING CASES 0 12 Práctico 2 Distribución Chi-cuadrado. Pruebas de bondad de ajuste