SoluciónCartilla2N Unidad1

Anuncio
Cartilla 2
Unidad 1: Estadística descriptiva
1)
a) Diámetro de la tubería (pulgadas): Variable cuantitativa continua
b) Material de la tubería: Variable cualitativa nominal
c) Edad (Año de instalación): Variable cuantitativa continua
d) Longitud de la tubería: Variable cuantitativa continua
e) Estabilidad del suelo: Variable cualitativa ordinal
f) Corrosividad del suelo circundante: Variable cualitativa nominal
2) Variables: Ubicación, Cualitativa nominal
Nivel de PCB, Cuantitativa continua
3)
a) X = “Tiempo de vida de cierto tipo de baterías”
Rec X = [0,∞). Variable Cuantitativa continua
b)
Distribución de Frecuencias para el tiempo de vida de cierto tipo de batería:
Clases
(100, 115]
(115, 130]
(130, 145]
(145, 160]
(160, 175]
Total
Frec.
5
9
3
2
1
20
c) 30% de las baterías duraron más de 130 horas.
d) 25%
4)
a) V = “tiempo en minutos que tarda una persona en dormirse”
Variable cuantitativa continua
C = “Condición de fumador”
Variable cualitativa nominal
b)
Distribución de Frecuencia para el tiempo en minutos que tarda un Fumador en quedar
dormido:
Clases
(10, 25]
(25, 40]
(40, 55]
(55, 70]
Total
Frec.
3
1
5
3
12
1
Cartilla 2
Distribución de Frecuencia para el tiempo en minutos que tarda un NO Fumador en quedar
dormido:
Clases
(20, 25]
(25, 30]
(30, 35]
(35, 40]
(40, 45]
Total
Frec.
1
5
4
3
1
14
c) Para el Grupo de Fumadores el 66% tardó más de 40 minutos para quedarse dormido y en
el grupo de los NO Fumadores el 7%.
d) Según los datos analizados, los Fumadores tardan mas en dormirse que los NO Fumadores.
5)
T = “Causas subyacentes por las que fracasan empresas”
Variable cualitativa nominal.
Distribución de Frecuencias porcentual de las causas subyacentes por las que fracasan las
empresas.
Causas Subyacentes
Incompetencia
Experiencia desequilibrada
Falta de experiencia gerencial
Falta de experiencia de línea
Causas desconocidas
Otras causas
Porcentaje
(%)
48
22
16
8
6
0.1
b) El 6 % de las empresas fracasaron debido a causas desconocidas
c) La causa que más fracasos ha producido fue la incompetencia.
8)
2
Cartilla 2
b) Distribución de Frecuencias de la duración de baterías (en horas).
Duración de baterías presentada en ejercicio 8
Clases
(100, 115]
(115,130]
(130, 145]
(145, 160]
(160, 175]
Frecuencia
5
9
3
2
1
Fuente: Datos del Ejercicio 8
Duración de las baterías
9
8
Frequency
7
6
5
4
3
2
1
0
107.5
122.5
137.5
152.5
167.5
Datos
c) X = 126,
~
X = 119
x−~
x
× 100 = 40
σˆ
Por lo que la diferencia se debe a que la muestra no es simétrica (Asimétrica positiva).
d) Para eso analizamos el coeficiente de Asimetría:
9) a) Distribución de Frecuencias del tiempo (en segundos) que 20 trabajos estuvieron en
control en un CPU:
Clases frecuencia
[0, 1)
6
[1, 2)
6
[2, 3)
4
[3, 4)
3
[4, 5)
1
3
Cartilla 2
Histograma del tiempo (en segundo), que 20 trabajos
estuvieron en control en un CPU
6
5
Frecuencia
4
3
2
1
0
0.5
1.5
2.5
3.5
4.5
tiempo (en segundos)
b) Datos redondeados:
1.2, 1.6, 1.2, 3.5,
2.0, 0.9, 0.7, 2.6,
1.2,
3.1,
3.8,
1.4,
1.9,
1.
4.8,
2.4,
0.8,
0.8,
0.5,
2.2,
Ordeno y calculo Q1 y Q3.
Se debe analizar si hay valores alejados para realizar el diagrama de tallo y hojas:
Q1= 0.95, Q3= 2.5
Q1 -1.5 (Q3- Q1) = -1.375 ⇒ no hay valores alejados por defecto
Q3 +1.5 (Q3- Q1) = 4.825 ⇒ no hay valores alejados por exceso
Diagrama de Tallo y Hoja del tiempo en segundos, que 20 trabajos estuvieron en control
en un CPU:
Tiempo [seg]
Unidad 0.1
0
1
2
3
4
57889
0222469
0246
158
8
c) Obtenido de los datos sin redondear:
~
x = 1.871,
x = 1.505 , en los datos sin redondear no hay moda.
Obtenido de los datos redondeados:
~
x = 1.9,
x = 1.5 , Moda = 1.2
2
d) σˆ = 1.30, σˆ = 1.14
s2 = 1.37,
s = 1.17
Estas medidas de dispersión están asociadas a la media, ya que la utilizan como centro de la
distribución.
4
Cartilla 2
RI= 1.55
Meda = 0.7
Estas medidas de dispersión están asociadas a la mediana, ya que la utilizan como centro de la
distribución.
e) Para esto analizamos la simetría de los datos:
x−~
x
× 100 = 35 ⇒ Por lo tanto es asimétrica, con lo que la mediana y la meda o el Rango
σˆ
intercuartil, describen mejor este conjunto de datos, porque sabemos que la mediana no se ve
afectada por asimetría.
10) a)
Tiempo que tardan en quedarse dormido fumadores y no fumadores
Condicion
No
f umadores
Fumadores
20
30
40
50
60
70
tiempo en quedarse dormido
~
b) Para Fumadores: x = 43.7,
x = 48, σˆ = 16.18 , Meda: 10
~
x−x
× 100 = 26 ⇒ Asimetría.
σˆ
Las medidas que describen mejor este conjunto de datos son Mediana y Meda.
No hay valores alejados.
~
Para NO Fumadores: x = 31.57
x = 30.50, σˆ = 5.65 ,
~
x−x
×100 = 19 ⇒ con este valor, y observando el gráfico decimos que es simétrica.
σˆ
No hay valores alejados.
Por lo tanto las medidas que describen mejor este conjunto de datos son Media y σ̂ .
5
Cartilla 2
c) INFORME:
Se estudió el tiempo que tardan en quedarse dormido un grupo de 12 personas
fumadoras y 14 personas no fumadoras, con el objetivo de investigar el efecto del hábito de
fumar sobre los patrones de sueño.
En el grupo de fumadores se observaron tiempos entre 14 y 69 minutos, mientras que en el
grupo de no fumadores los tiempos estuvieron entre 21 y 42 minutos.
El 50% de los tiempos en el grupo de fumadores fue mayor o igual a 48 minutos, y en el
grupo de no fumadores solo a 30.5
Observamos entonces que los datos en el grupo fumador están centrados en un valor mayor
que en el grupo de no fumadores y que están además más dispersos.
En el grupo de no fumadores los datos se encuentran simétricamente distribuidos alrededor
del valor central, mientras que en el grupo de fumadores los tiempos menores a 48 minutos
están más dispersos que los mayores.
11) a) Para realizar los diagrama tipo caja se debe analizar si hay valores alejados:
Para la ubicación antigua:
Q1=9.91; Q3=10.135;
Q1 -1.5 (Q3- Q1) = 9.57 ⇒ no hay valores alejados por defecto
Q3 +1.5 (Q3- Q1) = 10.47 ⇒ no hay valores alejados por exceso
Para la ubicación nueva:
Q1=8.98 ; Q3= 9.93
Q1 -1.5 (Q3- Q1) = 7.55 ⇒ no hay valores alejados por defecto
Q3 +1.5 (Q3- Q1) = 11.35 ⇒ no hay valores alejados por exceso
Lecturas de Voltaje de un proceso:
10.5
10.0
9.5
LECTURAS
9.0
8.5
8.0
N=
15
15
1.00
2.00
UBIC
Ubicación 1: Corresponde a Antigua y Ubicación 2 a Nueva.
6
Cartilla 2
~
b) Para la ubicación antigua: x = 10.018,
x = 10.03, σˆ = 0.16
~
x−x
× 100 =6 ⇒ Simétrica, y no hay valores alejados, por lo tanto la media y σ̂ describen
σˆ
mejor el conjunto de datos.
~
Para la ubicación nueva: x = 9.45,
x = 9.63 σˆ = 0.54 , Meda = 0.44, Q1 = 8.98, Q3 = 9.93,
por lo tanto RI = 0.95
x−~
x
× 100 =33 ⇒ Asimétrica, por lo tanto la mediana y la meda o el rango intercuartil
σˆ
describen mejor el conjunto de datos.
c)CVANTIG=
0.16
= 0.016
10.018
CVNUEVA=
0.54
= 0.057
9.45
d) El proceso nuevo no es tan bueno como el anterior ya que tiene media más baja y
variabilidad más alta, y el coeficiente de variación también es mayor.
12) Porcentajes de Hierro de 25 muestras de mineral recolectados en cierta zona:
~
x = 62.64,
x = 61 σˆ = 10.07 , Q1= 53, Q3= 72,
x ± 2σ = ( 42.4,82.8)
~
x−x
× 100 =16 ⇒ Del valor coeficiente y observando el gráfico decimos que es simétrica,
σˆ
por lo tanto la media y el desvío estándar describen mejor el conjunto de datos.
De nuevo debemos analizar primero la presencia de valores alejados:
Q1= 54.26 ; Q3= 71.01;
Q1 -1.5 (Q3- Q1) = 29.14 ⇒ no hay valores alejados por defecto
Q3 +1.5 (Q3- Q1) = 96.14 ⇒ no hay valores alejados por exceso
80
datos
70
60
50
7
Cartilla 2
INFORME:
Se estudió el porcentaje de hierro de 25 muestras de mineral recolectados en determinada
zona.
Se observaron que los porcentajes varían entre 45 y 80 %.
El porcentaje promedio de hierro encontrado en la muestra es de 62.6%.
Los porcentajes observados se encuentran muy concentrados y en forma simétrica alrededor
de ese valor promedio.
14)
a) Trabajadores de la fábrica XX en el año XX clasificados de acuerdo a la tasa de defectos
Tasa de Defectos
Cantidad de trabajadores
Alta
24
Baja
76
Total
100
Trabajadores de la fábrica XX en el año XX clasificados de acuerdo a sus años de
experiencia
Años de Exp. Cantidad de
trabajadores
[0, 2)
22
[2, 6)
36
[6,10)
42
Total
100
b) 42%
c) 7%
d) 32%
e) 19%
Para responder e) y d) calculamos los porcentajes en el sentido apropiado:
Tasa de def./Años de exp.
Alta
Baja
[0,2)
32%
68%
100%
[2,6)
25%
75%
100%
[6,10)
19%
81%
100%
Por lo que se puede decir que existe relación ya que a mayor años de experiencia disminuye el
porcentaje de trabajadores con tasa alta de defectos, y por ende aumenta el porcentaje con tasa
baja de defectos.
15) a)
Empresas de la Provincia XX en el año XX clasificados según el nivel de Tecnología:
Tecnología Cantidad de
Empresas
Alta
161
No alta
596
Total
757
8
Cartilla 2
Empresas de la Provincia XX en el año XX clasificadas según la conversión al sistema
métrico de medición:
Convirtió Cantidad de
Empresas
Si
377
No
380
Total
757
b)
Convirtió/Nivel
Tecnolog.
Si
No
Alta
No alta
50%
50%
100%
50%
50%
100%
Por lo que podemos decir que las empresas de alta tecnología no presentan una mayor
tendencia a convertirse que las empresas de baja tecnología, en otras palabras no influye el
nivel de tecnología en la decisión de convertir al sistema métrico de medición.
9
Descargar