Análisis de Datos Estadísticos. Descriptiva y Medidas de Resumen. Estadística Descriptiva: Rama del conocimiento que permite describir a resumir una serie de informaciones diferentes. Inferencias Estadísticas: Conclusión en base a análisis de datos. Análisis de Datos: -De acuerdo al tipo de variable graficarlos. -Decidir: -Normalidad si se cumple, seguir con el análisis. -Valores anormales revisar ingreso de los datos. eliminar (definir el criterio de eliminación). volver a evaluar. Medidas de Resumen indican variaciones de obs. *Son fundamentales: -Número de observaciones. -Promedio o media. -Desviación estándar (DS). *Secundariamente: -Mediana. -Moda. -Percentiles. -Error estándar de la media (SEM). 1.-Media o Promedio: Sinónimos promedio, media aritmética. X = xi ni Otras medias media aritmética, media geométrica. *Media: -De una población -De una muestra x -Si al hacer la campana de Gauss, ésta no es simétrica, indica que la distribución es anormal. 2.-Mediana: Valor que deja la mitad de los individuos por debajo de él y la otra mitad por encima. Se utiliza cuando la distribución no es normal. 3.-Moda: Es la categoría con más frecuencia. Medidas de Dispersión: Hace referencia a como se agrupan los datos alrededor de la medida de centralización, generalmente la media. -Rango es la diferencia entre los valores extremos, es edcir, entre el mínimo y el máximo de una muestra. Recorrido Intercualtil: Se ordenan los datos y se divide en cuatro partes iguales (cuartiles). indica el 50% vigote (25%) Desviación media: Indica cuanto se aleja cada valor con respecto a la media (X - X). Suma de las diferencias: Cuando la diferencia de cualquier conjunto de datos es igual a 0, esto no dice mucho. (X - X). Varianza: Suma de desviación al cuadrado (se eliminan de esa forma valores negativos), divididos por el número de observaciones. S2 = (X - X)2 N Desviación Estandar: Como varían los datos con respecto al promedio. Es la raíz de la varianza. DS = (X - X)2 N - 1 -Se resta N-1 solo si quiero calcular los valores de una muestra no de una pobablación. -Si la distribución es normal, se utiliza la D.S y el promedio. -Si la distribución es anormal, se debe utilizar: Mediana. Recorrido intercuantil Como por ejemplo el flujo salival. Valores percentiles para una distribución normal: *Los percentiles dicen: -2,5 promedio – 2DS. -16 promedio – 1DS. -50 promedio. -84 promedio + 1DS. -97,5 promedio + 2DS. *Ejemplo: -Promedio 4. -D.S. +- 0,5. (3,5 – 4,5) 68% menos de 3,5 o más de 4,5 16% Sesgo: Asimetría de la curva, una cola o extremo es mayor que otro. *Tipos de sesgos: -Asimetría al lado derecho sesgo +. -Asimetría al lado izquierdo sesgo negativo. Curtosis: Curva más o menos aplanada, depende de la cantidad de casos, donde: a MAYOR número de casos más picuda. Campana de Gauss: Es asintótica, es decir, no toca los ejes. -Teorema Central del límite: La distribución de medias de la muestra será aproximadamente normal, indiferente de la distribución de valores en la población original de donde fueron tomados los valores. El valor de la media de la colección, de todas las posibles medias, será igual a la media de la población. La D.S. de la media (error estándar de la media o ESM), depende de la DS de la muestra y el tamaño de la muestra. -ESM variación de los promedios si fueran repetidos. ESM = D.S. N -Si la población está o no distribuida normalmente, el promedio de muestras grandes (n mayor a 30), se distribuye de forma normal. Valor tificado: Procedimiento que permite expresar cualquier valor inicial en términos de unidades de D.S, se denomina Z. Z = X – X D.S. Z = X – D.S. -Permite trabajar con una tabla única de la distribución normal. -Sirve para comparar valores procedentes de varios tests o medidas. Distribución Normal o Campana de Gauss: -1DS 68%. -2DS 95%. -3DS 99%. -La población tiene distribución definida por una media de y una desviación estándar de . -Normalmente se utiliza o analiza una muestra: X +-DS *Propiedades de la curva normal: Al se simétrica: -La media, mediana y nodo tienen el mismo valor. -La curva es simétrica respecto de la media, donde el sesgo es cero. -La curtosis es 0. -Las colas están cada vez más cercana al eje pero sin tocarlos (curva asintótica). -Campana de Gauss promedio, mediana moda = 0 = 1 -Curva no simétrica. moda media mediana Resumen: VARIABLE Nominal Ordinal Intervalar MEDIA Moda Moda y Mediana Moda, Mediana, Media, Recorrido Intercuantil, DS