Subido por evolutionblu

Estadística y Procesamiento

Anuncio
METODOLOGÍA DE LA
INVESTIGACIÓN CIENTÍFICA
Sesión
4.3. El tratamiento estadístico de los datos: Estadística Descriptiva: Modelos de regresión.
Prueba de hipótesis y de comparación de medias. Análisis de varianza y de regresión.
4.4. Procesamiento de datos.
Organización y presentación de datos
Video: Organización y Presentación de Datos Cualitativos
Tiempo: 0.57
https://www.youtube.com/watch?v=ncnDxlNVJLI
1. Medidas de tendencia central
■ Cuando hablamos de tendencia central nos estamos refiriendo a la existencia de un
punto medio de una distribución. Estas medidas normalmente las utilizamos
cuando todos nuestros datos son homogéneos
Media
Es también conocida como media aritmética, se define como la suma de
todos los datos observados, divididos entre el número de estos
Moda
Dato que más se repite en un grupo de datos o dicho de otra manera es el
dato con mayor frecuencia.
Mediana
También se le suele llamar media posicional, porque ubica exactamente a la
mitad de una distribución de datos, esto quiere decir que un 50% de los
datos se ubican por debajo de la mediana y el otro 50% por encima de esta
Media
σ 𝑥𝑖
𝑥ҧ =
𝑁
15
16
𝑥ҧ =
14
77
5
𝑥ҧ = 15.4 años
17
15
3
1
0
1
𝑥ҧ =
2
13
9
𝑥ҧ = 1.4 hermanos
2
1
3
0
Mediana 𝑀𝑒
Impar
Par
15
17
14
15
16
13
15
14
16
14
15
14
15
15
16
17
13
14
14
15
15
16
𝑀𝑒 = 15
𝑥ҧ =
14+15
2
𝑀𝑒 = 14,5
Moda 𝑀𝑜
una
bimodal
15
14
16
15
15
14
15
15
15
16
𝑀𝑜= 15
17
17
12
Multimodal
13
13
𝑀𝑜 = 13 y 15
14
15
15
16
Ejercicio
■ Peso de 13 alumnos
𝑥ҧ = 46, 6
42 47 53 47
𝑀𝑒 =47
50 45 46 48
41 49 45 40
54
𝑀𝑜 =45, 47
2. Medidas de variabilidad
■ Nos proporcionan una información adicional que nos ayuda a evaluar la
confiabilidad de nuestras medidas de tendencia central de una distribución, por
ejemplo, si estamos frente a datos muy dispersos las medidas de tendencia central
no serán tan significativas para su análisis debido a su variabilidad y para medir esa
variabilidad nacen estas medidas
Varianza y Desviación
Estándar
Coeficiente de
variación
La varianza es definida como el promedio de las distancias elevadas al a
cuadrado a la media del conjunto de dato
Es esa mediada que nos representa la desviación estándar como porcentaje
de la media.
Varianza
5
6
σ 𝑥𝑖
𝑥ҧ =
𝑁
7
6
𝑥ҧ =
8
(𝛿)2 = (5 − 6,4)2 + (6 − 6,4)2 +(6 − 6,4)2 + (7 − 6,4)2 (8 − 6,4)2
32
5
𝑥ҧ =6,4
5
(𝛿)2 = 5.2
5
(𝛿)2 = 1.04(𝑐𝑢𝑟𝑠𝑜)2
𝛿 = 1.01 𝑐𝑢𝑟𝑠𝑜𝑠
Ejercicio
Muestra
52 55 58
𝑆
2
S=3
=9
3. Medidas de Forma
Sesgo o
coeficiente de
asimetría
Las curvas de frecuencia o la distribución de probabilidad pueden ser simétrica o
sesgadas. La forma de las curvas simétricas es tal que, la línea que pasa por el punto más
pronunciado divide a esta en dos partes iguales, en este tipo de curvas la media, la moda y
la mediana coinciden en el mismo punto
Curtosis
Nos ayuda medir el grado de concentración que presentan las variables aleatorias,
tomando como referencia la zona central de su distribución, de esta manera, diremos
que estamos frente a una distribución leptocúrtica si la distribución presenta un
apuntamiento con respecto a la medida central, de lo contrario, diremos que una
distribución es platicúrtica si esta es aplanada y para una distribución en donde los
valores de la variable aleatoria tiene la forma de una distribución normal diremos que es
una distribución mesocúrtica
Descargar