METODOLOGÍA DE LA INVESTIGACIÓN CIENTÍFICA Sesión 4.3. El tratamiento estadístico de los datos: Estadística Descriptiva: Modelos de regresión. Prueba de hipótesis y de comparación de medias. Análisis de varianza y de regresión. 4.4. Procesamiento de datos. Organización y presentación de datos Video: Organización y Presentación de Datos Cualitativos Tiempo: 0.57 https://www.youtube.com/watch?v=ncnDxlNVJLI 1. Medidas de tendencia central ■ Cuando hablamos de tendencia central nos estamos refiriendo a la existencia de un punto medio de una distribución. Estas medidas normalmente las utilizamos cuando todos nuestros datos son homogéneos Media Es también conocida como media aritmética, se define como la suma de todos los datos observados, divididos entre el número de estos Moda Dato que más se repite en un grupo de datos o dicho de otra manera es el dato con mayor frecuencia. Mediana También se le suele llamar media posicional, porque ubica exactamente a la mitad de una distribución de datos, esto quiere decir que un 50% de los datos se ubican por debajo de la mediana y el otro 50% por encima de esta Media σ 𝑥𝑖 𝑥ҧ = 𝑁 15 16 𝑥ҧ = 14 77 5 𝑥ҧ = 15.4 años 17 15 3 1 0 1 𝑥ҧ = 2 13 9 𝑥ҧ = 1.4 hermanos 2 1 3 0 Mediana 𝑀𝑒 Impar Par 15 17 14 15 16 13 15 14 16 14 15 14 15 15 16 17 13 14 14 15 15 16 𝑀𝑒 = 15 𝑥ҧ = 14+15 2 𝑀𝑒 = 14,5 Moda 𝑀𝑜 una bimodal 15 14 16 15 15 14 15 15 15 16 𝑀𝑜= 15 17 17 12 Multimodal 13 13 𝑀𝑜 = 13 y 15 14 15 15 16 Ejercicio ■ Peso de 13 alumnos 𝑥ҧ = 46, 6 42 47 53 47 𝑀𝑒 =47 50 45 46 48 41 49 45 40 54 𝑀𝑜 =45, 47 2. Medidas de variabilidad ■ Nos proporcionan una información adicional que nos ayuda a evaluar la confiabilidad de nuestras medidas de tendencia central de una distribución, por ejemplo, si estamos frente a datos muy dispersos las medidas de tendencia central no serán tan significativas para su análisis debido a su variabilidad y para medir esa variabilidad nacen estas medidas Varianza y Desviación Estándar Coeficiente de variación La varianza es definida como el promedio de las distancias elevadas al a cuadrado a la media del conjunto de dato Es esa mediada que nos representa la desviación estándar como porcentaje de la media. Varianza 5 6 σ 𝑥𝑖 𝑥ҧ = 𝑁 7 6 𝑥ҧ = 8 (𝛿)2 = (5 − 6,4)2 + (6 − 6,4)2 +(6 − 6,4)2 + (7 − 6,4)2 (8 − 6,4)2 32 5 𝑥ҧ =6,4 5 (𝛿)2 = 5.2 5 (𝛿)2 = 1.04(𝑐𝑢𝑟𝑠𝑜)2 𝛿 = 1.01 𝑐𝑢𝑟𝑠𝑜𝑠 Ejercicio Muestra 52 55 58 𝑆 2 S=3 =9 3. Medidas de Forma Sesgo o coeficiente de asimetría Las curvas de frecuencia o la distribución de probabilidad pueden ser simétrica o sesgadas. La forma de las curvas simétricas es tal que, la línea que pasa por el punto más pronunciado divide a esta en dos partes iguales, en este tipo de curvas la media, la moda y la mediana coinciden en el mismo punto Curtosis Nos ayuda medir el grado de concentración que presentan las variables aleatorias, tomando como referencia la zona central de su distribución, de esta manera, diremos que estamos frente a una distribución leptocúrtica si la distribución presenta un apuntamiento con respecto a la medida central, de lo contrario, diremos que una distribución es platicúrtica si esta es aplanada y para una distribución en donde los valores de la variable aleatoria tiene la forma de una distribución normal diremos que es una distribución mesocúrtica