Subido por JOSE ALEJANDRO BOADA COVILLA

Taller est descriptiva

Anuncio
Análisis Cuantitativo y Cualitativo de Variables
Facultad de ingeniería civil
Estadística Descriptiva e Inferencial
Docente: Carlos Martínez Acuña
Integrantes: Andrés David Guerra Pastrana
José Alejandro Boada Covilla
Fundación Universitaria Área Andina
Valledupar, Cesar
7/03/2022
1.Los siguientes resultados presentan las calificaciones finales de un curso de
estadística descriptiva y cálculo de probabilidades.
23
65
55
10
78
98
41
54
80
85
60
92
76
64
25
81
71
64
17
74
79
85
52
75
80
67
83
72
82
63
32
52
36
81
88
48
15
67
69
61
57
70
80
95
62
60
76
84
79
74
74
82
77
41
74
78
84
90
34
60
a) Construir una distribución de frecuencias
Intervalos
Inferior
10
21
32
43
54
65
76
87
Superior
21
32
43
54
65
76
87
98
Marca frecuencia
de clase absoluta
xi
15,5
26,5
37,5
48,5
59,5
70,5
81,5
92,5
Total
Valor Máximo
Valor Mínimo
Rango (r)
# Intervalos(m)
Amplitud del intervalo(c)
fi
3
3
4
4
11
13
17
5
60
frecuencia
Frecuencia
frecuencia
Absoluta
relativa
Relativa
acumulada
acumulada
Fi
3
6
10
14
25
38
55
60
𝑉
𝑉
𝑉𝑚á𝑥 − 𝑉𝑚𝑖𝑛
𝑚 = √𝑛
𝑐 = 𝑟/𝑚
hi
5
5
6,7
6,7
18,3
21,7
28,3
8,3
Hi
5
10
16,7
23,3
41,7
63,3
91,7
100
98
10
88
11,36
7,74
Xi(fi)
46,5
79,5
150
194
654,5
916,5
1385,5
462,5
3889
b) Dibuje un histograma, un Polígono de frecuencias y una ojiva
Histograma y Poligono de Frecuencia
18
16
# de Personas
14
12
10
8
6
4
2
0
15,5
26,5
37,5
48,5
59,5
70,5
81,5
92,5
70,5
81,5
92,5
Notas Obtenidas
Ojiva
70
# de Personas
60
50
40
30
20
10
0
15,5
26,5
37,5
48,5
59,5
Notas Obtenidas
c) Hallar: Media, mediana, Moda, varianza, coeficiente de variación, los cuartiles,
deciles 4 y 7, percentil, 65 y 89, describir su significado
𝑴𝒆𝒅𝒊𝒂 =
=
(
∑(𝑥 ∗ 𝑓 )
𝑛
. )( ) (
. )( ) (
. )( ) (
. )( ) (
. )(
) (
. )(
) (
. )(
) (
. )( )
=
= 64.82
𝑛
+ 𝑓𝑖 − 1
𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = 𝑙𝑖 + 𝑐 2
𝑓𝑖
60
− 25
55
= 65 + 2
11 = 65 +
= 69,23
13
13
𝑴𝒐𝒅𝒂 = 𝑙𝑖 + 𝑐
= 76 +
; Δ =f −𝑓 −1𝑦Δ =f −𝑓 +1
17 − 13
4
44
11 = 76 +
11 = 76 +
= 78.75
(17 − 13) + (17 − 5)
16
16
𝐕𝐚𝐫𝐢𝐚𝐧𝐳𝐚 =
∑(𝑥 − 𝜇)
𝑛
𝒙𝟏
15,5
26,5
37,5
48,5
59,5
70,5
81,5
92,5
𝒙𝒊 − 𝝁
-49,32
-38,32
-27,32
-16,32
-5,32
5,68
16,68
27,68
(𝒙𝒊 − 𝝁)𝟐
2432,46
1468,42
746,38
266,34
28,30
32,26
278,22
766,18
=
2432,46 + 1468,42 + 746,38 − 266,34 − 28,30 − 32,26 − 278,22 − 766,18
60
=
6018,58
= 100.31
60
𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢ó𝐧 𝐭í𝐩𝐢𝐜𝐚 =
𝜎
√100.31 = 10.02
𝐂𝐨𝐞𝐟𝐢𝐜𝐢𝐞𝐧𝐭𝐞 𝐝𝐞 𝐕𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧 =
𝐶𝑉 =
10.02
∗ 100 = 15.46%
64.82
𝜎
∗ 100
𝜇
𝑘𝑛
−𝐹 −1
𝑪𝒖𝒂𝒓𝒕𝒊𝒍𝒆𝒔 = 𝑙𝑖 + 4
𝑐
𝑓
60
− 14
𝑄 = 54 + 4
11 = 55
11
3(60)
− 38
4
𝑄 = 76 +
11 = 80.53
17
2(60)
− 25
4
𝑄 = 65 +
11 = 69.23
13
4(60)
− 55
4
𝑄 = 87 +
11 = 98
5
𝑘𝑛
−𝐹 −1
𝑫𝒆𝒄𝒊𝒍𝒆𝒔 = 𝑙𝑖 + 10
𝑐
𝑓
4(60)
− 14
10
𝐷 = 54 +
11 = 64
11
7(60)
− 38
10
𝐷 = 76 +
11 = 78.59
17
𝑘𝑛
−𝐹 −1
100
𝑷𝒆𝒓𝒄𝒆𝒏𝒕𝒊𝒍 = 𝑙𝑖 +
∗𝑐
𝑓
𝑃
65(6)
− 38
10
= 76 +
∗ 11 = 76.65
17
𝑃
89(6)
− 38
10
= 76 +
∗ 11 = 85.9
17
Conclusión: Se encontró en las notas de los estudiantes de estadística
descriptiva y cálculo de probabilidades:
1. Su promedio (64.82) resulto por encima de la media de la máxima nota
2. La nota que más sacaron los estudiantes fue de 78.75
3. En relación con la desviación típica y la varianza se evidencio que las notas
entre estudiantes tuvieron un alto grado de variabilidad y dispersión
4. Las notas en relación con el promedio tuvieron una dispersión del 15.46%
5. En relación con las medidas de posición encontramos datos como la nota
en la posición central69.23, la nota máxima 98, etc.
2. Los contenidos de la nicotina, miligramo, de 40 cigarrillos de una cierta marca
se registraron de la siguiente manera:
1,09
1,37
1,4
1,9
2,11
2,31
2,08
2,09
1,51
2,17
2,38
2,46
1,63
0,72
2,03
1,47
1,82
1,75
1,85
1,24
0,85
1,69
1,69
1,79
1,79
1,58
1,64
2,37
1,88
1,74
1,7
1,68
1,75
1,67
1,79
2,55
1,86
1,64
1,93
1,92
a) Construya una distribución de frecuencias
Intervalos
Inferior Superior
0,72
1,01
1,01
1,30
1,30
1,59
1,59
1,88
1,88
2,17
2,17
2,46
2,46
2,75
Marca frecuencia
de clase absoluta
xi
0,86
1,15
1,44
1,73
2,02
2,31
2,60
Total
frecuencia
Frecuencia
frecuencia
Absoluta
Relativa
Relativa
acumulada
Acumulada
fi
2
2
5
17
8
4
2
40
Fi
2
4
9
26
34
38
40
hi
5
5
12,5
42,5
20
10
5
Hi
5
10
22,5
65
85
95
100
Xi(fi)
1,72
2,31
7,22
29,46
16,18
9,25
5,20
71,33
b) Hallar: Varianza, coeficiente de variación, percentil 50, 75 y 90 y que significado
tienen estos resultados
𝑴𝒆𝒅𝒊𝒂 =
∑(𝑥 ∗ 𝑓 ) 71,33
=
= 1.78
𝑛
40
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 =
∑(𝑥 − 𝜇)
2,36
=
= 0,059
𝑛
40
𝒙𝟏
0,86
1,15
1,44
1,73
2,02
2,31
2,60
𝒙𝒊 − 𝝁
-0,92
-0,63
-0,34
-0,05
0,24
0,53
0,82
(𝒙𝒊 − 𝝁)𝟐
0,84
0,39
0,11
0,00
0,06
0,28
0,67
2,36
𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝑻𝒊𝒑𝒊𝒄𝒂 𝑷𝒐𝒃𝒍𝒂𝒄𝒊𝒐𝒏𝒂𝒍 =
𝑪𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝑽𝒂𝒓𝒊𝒂𝒄𝒊ó𝒏 =
𝜎 =
0,059 = 0.24
𝜎
0.24
∗ 100 =
∗ 100 = 13,6%
𝜇
1.78
𝑘𝑛
−𝐹 −1
𝑷𝒆𝒓𝒄𝒆𝒏𝒕𝒊𝒍 = 𝑙𝑖 + 100
∗𝑐
𝑓
𝑃
5(4)
−9
1
= 1.59 +
∗ 0.29 = 1.78
17
𝑃
= 2.17 +
𝑃
= 1.88 +
30 − 26
∗ 0.29 = 2.03
8
9(4) − 34
∗ 0.29 = 2.32
4
Conclusión: Al realizar el estudio de los datos de nicotina en los 40 cigarrillos se
encontró:
1. La cantidad de nicotina entre cigarros tiene un grado de variabilidad bajo
2. La media de nicotina encontrado en un cigarro es de 1.78
3. El porcentaje de cigarrillos que tienen más nicotina de lo usual es de 13,6%
3. Los siguientes datos corresponde a la estatura de 10 estudiantes de la
universidad
160
180
158
170
182
159
163
175
176
175
a) Encuentre: Media, mediana, media geométrica, varianza, desviación típica y
coeficiente de variación. Darle interpretación a cada Resultado
𝑴𝒆𝒅𝒊𝒂 =
∑𝑥
160 + 180 + 158 + 170 + 182 + 159 + 163 + 175 + 176 + 175
=
𝑛
10
1698
=
= 169,8
10
Mediana: Ordenamos los datos:158;159;160;163;170;175;175;176;180;182
-Sacamos promedio con los 2 datos; 𝒎𝒆𝒅𝒊𝒂𝒏𝒂 =
𝑴𝒆𝒅𝒊𝒂 𝑮𝒆𝒐𝒎𝒆𝒕𝒓𝒊𝒄𝒂 xḡ =
𝑛
=
x1 ∗ 𝑥2 … 𝑥𝑛
𝑥̄ = √160 ∗ 180 ∗ 158 ∗ 170 ∗ 182 ∗ 159 ∗ 163 ∗ 175 ∗ 176 ∗ 175
𝑥̄ = 169,58
= 172.5
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝑴𝒖𝒆𝒔𝒕𝒓𝒂𝒍 =
∑(𝒙𝒊 − 𝒙̄ )𝟐
𝒏−𝟏
𝒙𝟏
160
180
158
170
183
159
163
175
176
175
𝒔𝟐 =
𝒙𝟏 − 𝒙̄
-9,8
10,2
-11,8
0,2
13,2
-10,8
-6,8
5,2
6,2
5,2
Total
(𝒙𝟏 − 𝒙̄ )𝟐
96,04
104,04
139,24
0,04
174,24
116,64
46,24
27,04
38,44
27,04
769
769
= 85,5
10 − 1
𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝑻𝒊𝒑𝒊𝒄𝒂 𝑴𝒖𝒆𝒔𝒕𝒓𝒂𝒍 =
𝑠 = 85,5 = 9.25
𝑪𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝑽𝒂𝒓𝒊𝒂𝒄𝒊ó𝒏 =
𝐶𝑉 =
9,25
∗ 100 = 5.5%
169,8
𝑠
𝑠
∗ 100
𝑥̄
Conclusión: Al realizarse el estudio 10 estudiantes universitarios se evidencio
que:
1. La altura promedio de un estudiante de cada 10 es de 169,8
2. Se evidencia que las alturas de los estudiantes tienen un bajo porcentaje de
dispersión (5.5%) tomando como referencia a la media
4. La siguiente distribución corresponde a las edades de los inmigrantes
extranjeros que llegaron a norte América, en un mes x del año y
Intervalos
de clase
Inmigrantes
0-10
10-20 20-30 30-40 40-50 50-60 60-70
70-80
80-90
640
684
154
13
Intervalos
Inferior
0
10
20
30
40
50
60
70
80
Superior
10
20
30
40
50
60
70
80
90
863
876
753
Marca de
Clase
Frecuencia
Absoluta
𝒙𝒊
5
15
25
35
45
55
65
75
85
total
𝒇𝒊
640
684
863
876
753
663
414
154
13
5060
663
414
Frecuencia
Absoluta
Acumulada
𝑭𝒊
640
1324
2187
3063
3816
4479
4893
5047
5060
𝒙𝒊 ∗ 𝒇 𝒊
3200
10260
21575
30660
33885
36465
26910
11550
1105
175610
a) Calcular: Media de las edades de esta distribución
𝑥̄ =
∑(
∗
)
=
= 34,71
b) Construir un polígono de frecuencias y una ojiva
# de Persona
Poligono de Frecuencias
1000
900
800
700
600
500
400
300
200
100
0
5
15
25
35
45
Edades
55
65
75
85
Ojiva
6000
# de Pesonas
5000
4000
3000
2000
1000
0
5
15
25
35
45
55
65
75
85
Edades
5. Considere las siguientes notas obtenidas por dos grupos de estudiantes:
GRUPO A
GRUPO B
80
97
80
95
75
70
83
72
82
73
81
96
82
80
75
72
79
70
78
70
Determine de manera analítica cuál de es la media mas representativa de los dos
grupos de notas, es decir, cual de los dos grupos de notas tiene mayor
uniformidad
Grafica de manera analítica
150
100
50
0
1
2
3
4
5
GRUPO A
6
7
8
9
10
GRUPO B
- Evidenciamos que el grupo A tiene mayor uniformidad y esto lo podemos concluir
con sus valores máximos y mínimos (75-83) que en comparación con el grupo B
(70-97) están menos alejados, es decir, el conjunto de datos del primer grupo tiene
una longitud menor que el del grupo B por lo que sus datos van a estar mas
unidos y menos dispersos, arrojándonos como resultado una media más
representativa.
6. Se desea escoger entre 3 candidatos una persona para que se encargue del
control de calidad de un producto, en una empresa de fabricación de aparatos
electrodomésticos. Para el efecto, se someten a prueba los 3 candidatos, y los
resultados obtenidos fueron los siguientes, sobre la base de su capacidad
intelectual, destreza, capacidad de análisis en el trabajo y relación con los demás.
Total
Promedio
CANDIDATO A
PUNTAJE
65
35
96
58
24
88
36
98
46
75
621
62,1
CANDIDATO B
PUNTAJE
95
65
86
78
36
58
70
93
20
25
626
62,6
CANDIDATO C
PUNTAJE
68
57
55
68
59
68
53
52
65
75
620
62,0
Si se analiza los datos obtenidos en las pruebas a que se sometieron los
candidatos y se toman en cuenta los puntajes promedios estaríamos inclinados a
escoger cualquiera de los candidatos, puesto que en términos generales tienen
aproximadamente el mismo promedio en los puntajes, entonces si a usted se le
delega seleccionar la persona que mejor desempeño obtuvo en la prueba. ¿Cuál
candidato seleccionaría? ¿Porqué? Susténtelo mediante un proceso estadístico
analítico.
- Al realizar el análisis de datos:
1. El valor mínimo y máximo de cada candidato obtenemos
Candidato A
Candidato B
Candidato C
24-98
20-95
52-75
2. AL analizar quien obtuvo un mayor promedio y total de puntos encontramos
Candidato A
Candidato B
Candidato C
621
626
620
62,1
62,6
62,0
3. Ordenando los puntajes de cada candidato concluyendo que cada fila
equivale a una prueba distinta
CANDIDATO A
PUNTAJE
65
35
96
58
24
88
36
98
46
75
Pr. 1
Pr. 2
Pr. 3
Pr. 4
Pr. 5
Pr. 6
Pr. 7
Pr. 8
Pr. 9
Pr. 10
CANDIDATO B
PUNTAJE
95
65
86
78
36
58
70
93
20
25
CANDIDATO C
PUNTAJE
68
57
55
68
59
68
53
52
65
75
120
100
80
60
40
20
0
1
2
3
CANDIDATO A
4
5
6
CANDIDATO B
7
8
9
10
CANDIDATO C
Conclusión: Lo anterior nos permite elegir al candidato c, ya que, si observamos
los valores mínimos y máximos en comparación con los otros dos tiene una menor
dispersión, por lo que su media sería más representativa, es decir en relación
puntaje- prueba en el candidato c tiene un grado de variabilidad bajo, lo que nos
dice que el candidato c no fue excelente en algunas pruebas, pero mantuvo un
puntaje en todas las pruebas sobre el 50% del puntaje máximo. Y en comparación
con el candidato a y b en su relación prueba-puntaje vemos puntajes muy altos en
unas y muy bajos en otras.
Descargar