Análisis Cuantitativo y Cualitativo de Variables Facultad de ingeniería civil Estadística Descriptiva e Inferencial Docente: Carlos Martínez Acuña Integrantes: Andrés David Guerra Pastrana José Alejandro Boada Covilla Fundación Universitaria Área Andina Valledupar, Cesar 7/03/2022 1.Los siguientes resultados presentan las calificaciones finales de un curso de estadística descriptiva y cálculo de probabilidades. 23 65 55 10 78 98 41 54 80 85 60 92 76 64 25 81 71 64 17 74 79 85 52 75 80 67 83 72 82 63 32 52 36 81 88 48 15 67 69 61 57 70 80 95 62 60 76 84 79 74 74 82 77 41 74 78 84 90 34 60 a) Construir una distribución de frecuencias Intervalos Inferior 10 21 32 43 54 65 76 87 Superior 21 32 43 54 65 76 87 98 Marca frecuencia de clase absoluta xi 15,5 26,5 37,5 48,5 59,5 70,5 81,5 92,5 Total Valor Máximo Valor Mínimo Rango (r) # Intervalos(m) Amplitud del intervalo(c) fi 3 3 4 4 11 13 17 5 60 frecuencia Frecuencia frecuencia Absoluta relativa Relativa acumulada acumulada Fi 3 6 10 14 25 38 55 60 𝑉 𝑉 𝑉𝑚á𝑥 − 𝑉𝑚𝑖𝑛 𝑚 = √𝑛 𝑐 = 𝑟/𝑚 hi 5 5 6,7 6,7 18,3 21,7 28,3 8,3 Hi 5 10 16,7 23,3 41,7 63,3 91,7 100 98 10 88 11,36 7,74 Xi(fi) 46,5 79,5 150 194 654,5 916,5 1385,5 462,5 3889 b) Dibuje un histograma, un Polígono de frecuencias y una ojiva Histograma y Poligono de Frecuencia 18 16 # de Personas 14 12 10 8 6 4 2 0 15,5 26,5 37,5 48,5 59,5 70,5 81,5 92,5 70,5 81,5 92,5 Notas Obtenidas Ojiva 70 # de Personas 60 50 40 30 20 10 0 15,5 26,5 37,5 48,5 59,5 Notas Obtenidas c) Hallar: Media, mediana, Moda, varianza, coeficiente de variación, los cuartiles, deciles 4 y 7, percentil, 65 y 89, describir su significado 𝑴𝒆𝒅𝒊𝒂 = = ( ∑(𝑥 ∗ 𝑓 ) 𝑛 . )( ) ( . )( ) ( . )( ) ( . )( ) ( . )( ) ( . )( ) ( . )( ) ( . )( ) = = 64.82 𝑛 + 𝑓𝑖 − 1 𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = 𝑙𝑖 + 𝑐 2 𝑓𝑖 60 − 25 55 = 65 + 2 11 = 65 + = 69,23 13 13 𝑴𝒐𝒅𝒂 = 𝑙𝑖 + 𝑐 = 76 + ; Δ =f −𝑓 −1𝑦Δ =f −𝑓 +1 17 − 13 4 44 11 = 76 + 11 = 76 + = 78.75 (17 − 13) + (17 − 5) 16 16 𝐕𝐚𝐫𝐢𝐚𝐧𝐳𝐚 = ∑(𝑥 − 𝜇) 𝑛 𝒙𝟏 15,5 26,5 37,5 48,5 59,5 70,5 81,5 92,5 𝒙𝒊 − 𝝁 -49,32 -38,32 -27,32 -16,32 -5,32 5,68 16,68 27,68 (𝒙𝒊 − 𝝁)𝟐 2432,46 1468,42 746,38 266,34 28,30 32,26 278,22 766,18 = 2432,46 + 1468,42 + 746,38 − 266,34 − 28,30 − 32,26 − 278,22 − 766,18 60 = 6018,58 = 100.31 60 𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢ó𝐧 𝐭í𝐩𝐢𝐜𝐚 = 𝜎 √100.31 = 10.02 𝐂𝐨𝐞𝐟𝐢𝐜𝐢𝐞𝐧𝐭𝐞 𝐝𝐞 𝐕𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧 = 𝐶𝑉 = 10.02 ∗ 100 = 15.46% 64.82 𝜎 ∗ 100 𝜇 𝑘𝑛 −𝐹 −1 𝑪𝒖𝒂𝒓𝒕𝒊𝒍𝒆𝒔 = 𝑙𝑖 + 4 𝑐 𝑓 60 − 14 𝑄 = 54 + 4 11 = 55 11 3(60) − 38 4 𝑄 = 76 + 11 = 80.53 17 2(60) − 25 4 𝑄 = 65 + 11 = 69.23 13 4(60) − 55 4 𝑄 = 87 + 11 = 98 5 𝑘𝑛 −𝐹 −1 𝑫𝒆𝒄𝒊𝒍𝒆𝒔 = 𝑙𝑖 + 10 𝑐 𝑓 4(60) − 14 10 𝐷 = 54 + 11 = 64 11 7(60) − 38 10 𝐷 = 76 + 11 = 78.59 17 𝑘𝑛 −𝐹 −1 100 𝑷𝒆𝒓𝒄𝒆𝒏𝒕𝒊𝒍 = 𝑙𝑖 + ∗𝑐 𝑓 𝑃 65(6) − 38 10 = 76 + ∗ 11 = 76.65 17 𝑃 89(6) − 38 10 = 76 + ∗ 11 = 85.9 17 Conclusión: Se encontró en las notas de los estudiantes de estadística descriptiva y cálculo de probabilidades: 1. Su promedio (64.82) resulto por encima de la media de la máxima nota 2. La nota que más sacaron los estudiantes fue de 78.75 3. En relación con la desviación típica y la varianza se evidencio que las notas entre estudiantes tuvieron un alto grado de variabilidad y dispersión 4. Las notas en relación con el promedio tuvieron una dispersión del 15.46% 5. En relación con las medidas de posición encontramos datos como la nota en la posición central69.23, la nota máxima 98, etc. 2. Los contenidos de la nicotina, miligramo, de 40 cigarrillos de una cierta marca se registraron de la siguiente manera: 1,09 1,37 1,4 1,9 2,11 2,31 2,08 2,09 1,51 2,17 2,38 2,46 1,63 0,72 2,03 1,47 1,82 1,75 1,85 1,24 0,85 1,69 1,69 1,79 1,79 1,58 1,64 2,37 1,88 1,74 1,7 1,68 1,75 1,67 1,79 2,55 1,86 1,64 1,93 1,92 a) Construya una distribución de frecuencias Intervalos Inferior Superior 0,72 1,01 1,01 1,30 1,30 1,59 1,59 1,88 1,88 2,17 2,17 2,46 2,46 2,75 Marca frecuencia de clase absoluta xi 0,86 1,15 1,44 1,73 2,02 2,31 2,60 Total frecuencia Frecuencia frecuencia Absoluta Relativa Relativa acumulada Acumulada fi 2 2 5 17 8 4 2 40 Fi 2 4 9 26 34 38 40 hi 5 5 12,5 42,5 20 10 5 Hi 5 10 22,5 65 85 95 100 Xi(fi) 1,72 2,31 7,22 29,46 16,18 9,25 5,20 71,33 b) Hallar: Varianza, coeficiente de variación, percentil 50, 75 y 90 y que significado tienen estos resultados 𝑴𝒆𝒅𝒊𝒂 = ∑(𝑥 ∗ 𝑓 ) 71,33 = = 1.78 𝑛 40 𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 = ∑(𝑥 − 𝜇) 2,36 = = 0,059 𝑛 40 𝒙𝟏 0,86 1,15 1,44 1,73 2,02 2,31 2,60 𝒙𝒊 − 𝝁 -0,92 -0,63 -0,34 -0,05 0,24 0,53 0,82 (𝒙𝒊 − 𝝁)𝟐 0,84 0,39 0,11 0,00 0,06 0,28 0,67 2,36 𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝑻𝒊𝒑𝒊𝒄𝒂 𝑷𝒐𝒃𝒍𝒂𝒄𝒊𝒐𝒏𝒂𝒍 = 𝑪𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝑽𝒂𝒓𝒊𝒂𝒄𝒊ó𝒏 = 𝜎 = 0,059 = 0.24 𝜎 0.24 ∗ 100 = ∗ 100 = 13,6% 𝜇 1.78 𝑘𝑛 −𝐹 −1 𝑷𝒆𝒓𝒄𝒆𝒏𝒕𝒊𝒍 = 𝑙𝑖 + 100 ∗𝑐 𝑓 𝑃 5(4) −9 1 = 1.59 + ∗ 0.29 = 1.78 17 𝑃 = 2.17 + 𝑃 = 1.88 + 30 − 26 ∗ 0.29 = 2.03 8 9(4) − 34 ∗ 0.29 = 2.32 4 Conclusión: Al realizar el estudio de los datos de nicotina en los 40 cigarrillos se encontró: 1. La cantidad de nicotina entre cigarros tiene un grado de variabilidad bajo 2. La media de nicotina encontrado en un cigarro es de 1.78 3. El porcentaje de cigarrillos que tienen más nicotina de lo usual es de 13,6% 3. Los siguientes datos corresponde a la estatura de 10 estudiantes de la universidad 160 180 158 170 182 159 163 175 176 175 a) Encuentre: Media, mediana, media geométrica, varianza, desviación típica y coeficiente de variación. Darle interpretación a cada Resultado 𝑴𝒆𝒅𝒊𝒂 = ∑𝑥 160 + 180 + 158 + 170 + 182 + 159 + 163 + 175 + 176 + 175 = 𝑛 10 1698 = = 169,8 10 Mediana: Ordenamos los datos:158;159;160;163;170;175;175;176;180;182 -Sacamos promedio con los 2 datos; 𝒎𝒆𝒅𝒊𝒂𝒏𝒂 = 𝑴𝒆𝒅𝒊𝒂 𝑮𝒆𝒐𝒎𝒆𝒕𝒓𝒊𝒄𝒂 xḡ = 𝑛 = x1 ∗ 𝑥2 … 𝑥𝑛 𝑥̄ = √160 ∗ 180 ∗ 158 ∗ 170 ∗ 182 ∗ 159 ∗ 163 ∗ 175 ∗ 176 ∗ 175 𝑥̄ = 169,58 = 172.5 𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝑴𝒖𝒆𝒔𝒕𝒓𝒂𝒍 = ∑(𝒙𝒊 − 𝒙̄ )𝟐 𝒏−𝟏 𝒙𝟏 160 180 158 170 183 159 163 175 176 175 𝒔𝟐 = 𝒙𝟏 − 𝒙̄ -9,8 10,2 -11,8 0,2 13,2 -10,8 -6,8 5,2 6,2 5,2 Total (𝒙𝟏 − 𝒙̄ )𝟐 96,04 104,04 139,24 0,04 174,24 116,64 46,24 27,04 38,44 27,04 769 769 = 85,5 10 − 1 𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝑻𝒊𝒑𝒊𝒄𝒂 𝑴𝒖𝒆𝒔𝒕𝒓𝒂𝒍 = 𝑠 = 85,5 = 9.25 𝑪𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝑽𝒂𝒓𝒊𝒂𝒄𝒊ó𝒏 = 𝐶𝑉 = 9,25 ∗ 100 = 5.5% 169,8 𝑠 𝑠 ∗ 100 𝑥̄ Conclusión: Al realizarse el estudio 10 estudiantes universitarios se evidencio que: 1. La altura promedio de un estudiante de cada 10 es de 169,8 2. Se evidencia que las alturas de los estudiantes tienen un bajo porcentaje de dispersión (5.5%) tomando como referencia a la media 4. La siguiente distribución corresponde a las edades de los inmigrantes extranjeros que llegaron a norte América, en un mes x del año y Intervalos de clase Inmigrantes 0-10 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 640 684 154 13 Intervalos Inferior 0 10 20 30 40 50 60 70 80 Superior 10 20 30 40 50 60 70 80 90 863 876 753 Marca de Clase Frecuencia Absoluta 𝒙𝒊 5 15 25 35 45 55 65 75 85 total 𝒇𝒊 640 684 863 876 753 663 414 154 13 5060 663 414 Frecuencia Absoluta Acumulada 𝑭𝒊 640 1324 2187 3063 3816 4479 4893 5047 5060 𝒙𝒊 ∗ 𝒇 𝒊 3200 10260 21575 30660 33885 36465 26910 11550 1105 175610 a) Calcular: Media de las edades de esta distribución 𝑥̄ = ∑( ∗ ) = = 34,71 b) Construir un polígono de frecuencias y una ojiva # de Persona Poligono de Frecuencias 1000 900 800 700 600 500 400 300 200 100 0 5 15 25 35 45 Edades 55 65 75 85 Ojiva 6000 # de Pesonas 5000 4000 3000 2000 1000 0 5 15 25 35 45 55 65 75 85 Edades 5. Considere las siguientes notas obtenidas por dos grupos de estudiantes: GRUPO A GRUPO B 80 97 80 95 75 70 83 72 82 73 81 96 82 80 75 72 79 70 78 70 Determine de manera analítica cuál de es la media mas representativa de los dos grupos de notas, es decir, cual de los dos grupos de notas tiene mayor uniformidad Grafica de manera analítica 150 100 50 0 1 2 3 4 5 GRUPO A 6 7 8 9 10 GRUPO B - Evidenciamos que el grupo A tiene mayor uniformidad y esto lo podemos concluir con sus valores máximos y mínimos (75-83) que en comparación con el grupo B (70-97) están menos alejados, es decir, el conjunto de datos del primer grupo tiene una longitud menor que el del grupo B por lo que sus datos van a estar mas unidos y menos dispersos, arrojándonos como resultado una media más representativa. 6. Se desea escoger entre 3 candidatos una persona para que se encargue del control de calidad de un producto, en una empresa de fabricación de aparatos electrodomésticos. Para el efecto, se someten a prueba los 3 candidatos, y los resultados obtenidos fueron los siguientes, sobre la base de su capacidad intelectual, destreza, capacidad de análisis en el trabajo y relación con los demás. Total Promedio CANDIDATO A PUNTAJE 65 35 96 58 24 88 36 98 46 75 621 62,1 CANDIDATO B PUNTAJE 95 65 86 78 36 58 70 93 20 25 626 62,6 CANDIDATO C PUNTAJE 68 57 55 68 59 68 53 52 65 75 620 62,0 Si se analiza los datos obtenidos en las pruebas a que se sometieron los candidatos y se toman en cuenta los puntajes promedios estaríamos inclinados a escoger cualquiera de los candidatos, puesto que en términos generales tienen aproximadamente el mismo promedio en los puntajes, entonces si a usted se le delega seleccionar la persona que mejor desempeño obtuvo en la prueba. ¿Cuál candidato seleccionaría? ¿Porqué? Susténtelo mediante un proceso estadístico analítico. - Al realizar el análisis de datos: 1. El valor mínimo y máximo de cada candidato obtenemos Candidato A Candidato B Candidato C 24-98 20-95 52-75 2. AL analizar quien obtuvo un mayor promedio y total de puntos encontramos Candidato A Candidato B Candidato C 621 626 620 62,1 62,6 62,0 3. Ordenando los puntajes de cada candidato concluyendo que cada fila equivale a una prueba distinta CANDIDATO A PUNTAJE 65 35 96 58 24 88 36 98 46 75 Pr. 1 Pr. 2 Pr. 3 Pr. 4 Pr. 5 Pr. 6 Pr. 7 Pr. 8 Pr. 9 Pr. 10 CANDIDATO B PUNTAJE 95 65 86 78 36 58 70 93 20 25 CANDIDATO C PUNTAJE 68 57 55 68 59 68 53 52 65 75 120 100 80 60 40 20 0 1 2 3 CANDIDATO A 4 5 6 CANDIDATO B 7 8 9 10 CANDIDATO C Conclusión: Lo anterior nos permite elegir al candidato c, ya que, si observamos los valores mínimos y máximos en comparación con los otros dos tiene una menor dispersión, por lo que su media sería más representativa, es decir en relación puntaje- prueba en el candidato c tiene un grado de variabilidad bajo, lo que nos dice que el candidato c no fue excelente en algunas pruebas, pero mantuvo un puntaje en todas las pruebas sobre el 50% del puntaje máximo. Y en comparación con el candidato a y b en su relación prueba-puntaje vemos puntajes muy altos en unas y muy bajos en otras.