Práctica 2 - Universidad Austral

Anuncio
Universidad Austral
Estadística II
Práctico No 2
Distribución Chi- cuadrado. Pruebas de bondad de ajuste
Ejercicio 1:
a.- Calcular el 95 avo percentil de la distribución chi-cuadrado con 10 grados de
libertad.
b.- Calcular el quinto percentil de la distribución chi-cuadrado con 10 grados de
libertad.
c.- Calcular P 10.98   2  36.78  con  2 una variable con distribución chi-cuadrado
con 22 grados de libertad.
d.- Calcular P   2  14.611 ó  2  37.652  con  2 una variable con distribución chicuadrado con 25 grados de libertad.
Ejercicio 2:
Supóngase que se extraen muestras de una población normal cuya varianza es igual a 8.25.
a.- Si el tamaño muestral es 3, ¿cuál es la probabilidad de que el valor chi-cuadrado, con
(n-1) grados de libertad, sea mayor que 5.66?
b.- Si el tamaño muestral es 3, ¿cuál es la probabilidad de que la varianza muestral sea
mayor que 3 veces la varianza poblacional?
Ejercicio 3:
Se determinó la cantidad de expansión lateral (mils) para una muestra de 9 soldaduras
de arco de metal y gas accionado por pulsos, empleados en tanques contenedores de gas
licuado natural en barcos. La desviación estándar muestral es de 2.81 mils. Suponiendo
normalidad, determine un intervalo de confianza de 95% para 2 y para .
Ejercicio 4:
Se hicieron las siguientes observaciones de resistencia a la fractura de placas base de
18% de acero maragizado al níquel, dadas en orden creciente:
69.5 71.9 72.6 73.1 73.3 73.5 75.5 75.7
75.8 76.1 76.2 76.2 77.0 77.9 78.1 79.6
79.7 79.9 80.1 82.2 83.7 93.7
Calcule un intervalo de confianza del 99% para la desviación estándar de la distribución
de la resistencia a la fractura. ¿Es válido este intervalo cualquiera sea la distribución de
la resistencia a la fractura? Explique.
Ejercicio 5:
El propietario de una cadena de locales de hamburguesas tiene interés en la variabilidad
de la cantidad de carne que contienen sus hamburguesas. Se supone que dicha cantidad
de carne tiene una desviación estándar no mayor que 0.2 onzas. Una muestra aleatoria
de 20 hamburguesas presenta una desviación estándar muestral de 0.4 onzas.
a.- ¿Cuál es la probabilidad de ocurrencia de este valor?
7
Práctico 2
Distribución Chi-cuadrado. Pruebas de bondad de ajuste
b.- ¿Cuál es la probabilidad de que la desvío estándar muestral no supere 0.2 onzas?
c.- ¿Hay razón para creer que es excesiva la variación en la cantidad de carne?
Ejercicio 6:
Se debe controlar la variación de los anchos de las ventanas de contacto de determinado
chips para circuito integrado si se desea que los circuitos funcionen en forma correcta.
Las especificaciones establecen que la variación de los anchos debe ser de 0.30 (µm)2.
Se estudian en 10 especímenes detectándose los siguientes anchos (en µm): 3.21; 2.49;
2.94; 4.38; 4.02; 3.82; 3.30; 2.85; 3.34; 3.91. ¿Se podrá rechazar la afirmación de que se
cumple con dicha especificación con un nivel del 5%?
Ejercicio 7:
La dispersión, o variancia, de tiempos de acarreo en un proyecto de construcción son de
gran importancia para el sobrestante, ya que los tiempos muy variables de acarreo
originan problemas en la programación de los trabajos. El encargado de los transportes
dice que el intervalo del tiempo de acarreo no debe ser mayor que 40 minutos (ese
intervalo es la diferencia entre el tiempo mayor y el menor). Si se supone que los tiempos
de acarreo se distribuyen normalmente, el sobrestante cree que la afirmación acerca de
los límites quiere decir que el desvío estándar debe ser aproximadamente de 10 minutos.
Se midieron 15 tiempos de acarreo obteniéndose un promedio de 142 minutos y un
desvío estándar de 12 minutos. ¿Puede refutarse, en base a la evidencia muestral, la
afirmación de que el desvío es de 10 minutos en el nivel de significación del 5%?
Ejercicio 8:
El gerente de una empresa ha recopilado datos acerca del número de veces que se
interrumpió el servicio a los usuarios por fallas de los equipos en cada día, durante los
últimos 500 días; obteniéndose la siguiente distribución de frecuencias:
Interrupciones diarias
0
1
2
3
4
5
6
Total
Número de días
160
175
86
41
18
12
8
500
¿Se puede decir que la distribución de las interrupciones del servicio cumple con el
modelo de la distribución de Poisson con un nivel de significación del 1%?
Ejercicio 9:
El tiempo, en segundos, entre las llegadas de vehículos a determinado cruce, se midió
durante determinado período de tiempo con los siguientes resultados:
9.0
8.9
10.1
10.5
10.2
10.0
9.3
18.1
9.5
10.6
9.8
16.8
14.2
13.6
16.1
11.1
a.- Probar la hipótesis de que los datos provienen de una distribución exponencial con
 = 0.05.
8
Práctico 2
Distribución Chi-cuadrado. Pruebas de bondad de ajuste
b.- Probar la hipótesis de que los datos provienen de una distribución exponencial con
un promedio de 12 segundos, usando  = 0.05.
Ejercicio 10:
Se reportan los siguientes datos relacionados con la rapidez de oxigenación en arroyos a
20 oC en cierta región. La media muestral y la desviación estándar calculadas son 0.173
y 0.066 respectivamente. Con base a la siguiente distribución de frecuencia, ¿se puede
concluir que la rapidez de oxigenación es una variable normalmente distribuida?
Rapidez (por día)
Menos de 0.100
0.100 – menos de 0.150
0.150 – menos de 0.200
0.200 – menos de 0.250
0.250 ó más
Frecuencia
12
20
23
15
13
Ejercicio 11:
Se supone que los pesos de los gránulos de cobre siguen una distribución normal
logarítmica, es decir, que los logaritmos de los pesos deben seguir una distribución
normal. Veinte determinaciones, en 10-4 gramos, dieron los siguientes resultados:
2.0
6.1
3.0
6.6
3.1
7.3
4.3
7.6
4.4
8.3
4.8
9.1
4.9
11.2
5.1
14.4
5.4
16.7
5.7
19.8
Probar la hipótesis mencionada con un nivel de significación del 5%.
Ejercicio 12:
El consejo directivo de una universidad quiere determinar la opinión de diversos grupos
en relación con el calendario académico cuatrimestral propuesto. Una muestra aleatoria
seleccionada entre 100 estudiantes de grado, 50 de posgrado y 50 profesores condujo a:
Opinión
Favorable
Desfavorable
Total
grado
63
37
100
postgrado
27
23
50
profesores
30
20
50
Con un nivel de significación del 1%, determinar si hay pruebas de una diferencia en la
opinión de los grupos.
Ejercicio 13:
Un agrónomo está estudiando 3 variedades de tomates para determinar si hay diferencia
en la proporción de germinación de sus semillas. Se sometieron muestras aleatorias de
100 semillas de cada variedad (A, B y C) a las mismas condiciones iniciales con los
siguientes resultados:
Opinión
Germinaron
No germinaron
Total
Tomate A
Tomate B
Tomate C
82
18
100
70
30
100
58
42
100
Determinar si existe alguna diferencia entre las variedades de tomates y la proporción
de semillas que germinan, con un nivel de significación del 10%.
9
Práctico 2
Distribución Chi-cuadrado. Pruebas de bondad de ajuste
Ejercicio 14:
El gerente de un centro comercial quiere saber si hay diferencia en la proporción de
mujeres compradoras en diversos centros de atención. Se seleccionaron muestras de 300
clientes en horario diurno, 300 en horario nocturno y 400 clientes de fin de semana. Los
resultados se muestran en la siguiente tabla:
Sexo
Hombres
Mujeres
Total
Diurno
90
210
300
Nocturno
125
175
300
Fin de semana
185
215
400
¿Se verifica la diferencia que se quiere probar, al nivel de significación del 5%?
Ejercicio 15:
El gerente de control de calidad de una fábrica de autopartes quiere saber si hay una
diferencia en la proporción de partes defectuosas producidas en diversos días de la
semana laboral. Se obtuvieron muestras de 100 partes de cada día con los siguientes
resultados:
Defectuosas
Buenas
Total
Lunes
12
88
100
Martes
7
93
100
Miércoles
7
93
100
Jueves
10
90
100
Viernes
14
86
100
Determinar si existe diferencia en la proporción de piezas defectuosas en los diversos
días de la semana a un nivel de significación del 5%.
Ejercicio 16:
El departamento de Estadística de una universidad quiere saber si hay relación entre el
interés de los estudiantes por la Estadística y su capacidad para las matemáticas. Se
selecciona una muestra de 200 estudiantes a modo de encuesta, obteniéndose los
siguientes resultados:
Interés en
Estadística
Bajo
Promedio
Alto
Total
Capacidad para matemática
Baja
Promedio
Alta
60
15
15
15
45
10
5
10
25
80
70
50
Total
90
70
40
200
¿Se verifica esta relación al nivel de significación del 1%?
Ejercicio 17:
Un fabricante de baterías para automóviles desea saber si existe una relación entre el
medio de publicidad empleado y el grado de reconocimiento del producto. Los
resultados arrojados por una encuesta de análisis de mercado fueron los siguientes:
Grado de
Medio publicitario
reconocimiento Prensa Televisión
Radio
25
10
7
Positivo
73
93
108
Negativo
98
103
115
Total
Total
42
274
316
¿Existe la relación planteada con un nivel de significación del 10%?
10
Práctico 2
Distribución Chi-cuadrado. Pruebas de bondad de ajuste
Ejercicio 18:
Se efectuó una encuesta para determinar las preferencias de hombres de diferentes
edades acerca de diversos deportes. Sobre una muestra de 1000 hombres, a cada uno se
le pidió que indique cuál era su deporte favorito, obteniéndose los siguientes resultados:
Edad
(años)
Menos de 20
20 - 29
30 - 39
40 - 49
50 ó más
Total
Beisbol
26
38
72
96
134
366
Deporte favorito
Fútbol
Basket
47
41
84
80
68
38
48
30
44
18
291
207
Hockey
36
48
22
26
4
136
Total
150
250
200
200
200
1000
A un nivel de significación del 1%, ¿hay relación entre la edad de los hombres y su
preferencia por los deportes?
Ejercicio 19:
La tabla siguiente recoge los resultados de un estudio acerca de si la edad de los
conductores de vehículos, mayores de 21 años, afecta al número de accidentes que
sufren. Al nivel de significación del 1%, contrastar la hipótesis de que el número de
accidentes es independiente de la edad del conductor.
Edad
(años)
21- 30
31 - 40
41 - 50
51 - 60
61- 70
Número de accidentes
0
748
821
786
720
672
1
74
60
51
66
50
2
31
25
22
16
15
Más de 2
9
10
6
5
7
Ejercicio 20:
El artículo “Susceptibility of Mice to Audiogenic Seizure is Increased by Handling
Their Dams During Gestation” (Science, 1976, pp 427-428) reporta sobre la
investigación del efecto de diferentes tratamientos con inyecciones sobre las frecuencias
de las convulsiones audiogénicas.
Tratamiento
Tienilalanina
Solvente
Falsificación
No se maneja
Sin
respuesta
21
15
23
47
Carrera
salvaje
7
14
10
13
Convulsión
clónica
24
20
23
28
Convulsión
tónica
44
54
48
32
¿La información sugiere que los verdaderos porcentajes de las diferentes categorías de
respuesta dependen de la naturaleza del tratamiento con inyecciones? Exprese y pruebe
las hipótesis pertinentes con un nivel del 5%.
Ejercicio 21:
Los siguientes datos sobre combinaciones de sexo de dos recombinantes, los cuales
resultan de seis diferentes genotipos masculinos, aparecen en el artículo “A New
11
Práctico 2
Distribución Chi-cuadrado. Pruebas de bondad de ajuste
Method for Distinguishing Between Meiotic and Premeiotic Recombintional Events in
Drosophila melanogaster” (Genetic, 1979, pp 543 – 554).
¿Los datos soportan la hipótesis de que la distribución de frecuencia entre las tres
combinaciones de sexo es homogénea con respecto a los diferentes genotipos? Defina
los parámetros de interés, exprese Ho y H1 pertinentes y realice el análisis.
Combinación de sexos
M/M
M/F
F/F
Genotipo
masculino
1
2
3
4
5
6
35
41
33
8
5
30
80
84
87
26
11
65
39
45
31
8
6
20
Ejercicio 22:
La siguiente salida de Statistics corresponde a un test chi-cuadrado con datos referidos a
marcas en hojas encontradas en muestras de tréboles blancos seleccionadas de lugares de
pasto largo (726 muestras) y de lugares de pasto corto (761 muestras). Las marcas de hojas
se clasifican en: L, LL Y+YL, O y otras ¿Es un test de homogeneidad o de independencia?
¿Cuál es la hipótesis testeada y cuál es la conclusión? ¿Con que nivel se trabajó?
CHI-SQUARE TEST FOR HETEROGENEITY OR INDEPENDENCE
FOR 1 = MARCA TIPOPASTO
TIPOPASTO
MARCA
Pastolargo Pastocorto
+-----------+-----------+
Marca L
OBS |
409
|
512
|
921
EXPECTED |
449.66 |
471.34 |
CELL CHI-SQ |
3.68 |
3.51 |
+-----------+-----------+
Marca LL
OBS |
11
|
4
|
15
EXPECTED |
7.32 |
7.68 |
CELL CHI-SQ |
1.85 |
1.76 |
+-----------+-----------+
Marca Y+YL OBS |
22
|
14
|
36
EXPECTED |
17.58 |
18.42 |
CELL CHI-SQ |
1.11 |
1.06 |
+-----------+-----------+
Marca 0
OBS |
7
|
11
|
18
EXPECTED |
8.79 |
9.21 |
CELL CHI-SQ |
0.36 |
0.35 |
+-----------+-----------+
Otras OBSERVED |
277
|
220
|
497
EXPECTED |
242.65 |
254.35 |
CELL CHI-SQ |
4.86 |
4.64 |
+-----------+-----------+
726
761
1487
OVERALL CHI-SQUARE
P-VALUE
DEGREES OF FREEDOM
CASES INCLUDED 1487
23.18
0.0001
4
MISSING CASES 0
12
Práctico 2
Distribución Chi-cuadrado. Pruebas de bondad de ajuste
Descargar