Análisis de datos estadísticos

Anuncio
Análisis de Datos Estadísticos.
Descriptiva y Medidas de Resumen.
 Estadística Descriptiva:
Rama del conocimiento que permite describir a resumir una serie de
informaciones diferentes.
 Inferencias Estadísticas:
Conclusión en base a análisis de datos.
 Análisis de Datos:
-De acuerdo al tipo de variable  graficarlos.
-Decidir:
-Normalidad  si se cumple, seguir con el análisis.
-Valores anormales  revisar ingreso de los datos.
 eliminar (definir el criterio de eliminación).
 volver a evaluar.
 Medidas de Resumen  indican variaciones de obs.
*Son fundamentales:
-Número de observaciones.
-Promedio o media.
-Desviación estándar (DS).
*Secundariamente:
-Mediana.
-Moda.
-Percentiles.
-Error estándar de la media (SEM).
1.-Media o Promedio:
Sinónimos  promedio, media aritmética.
X = xi
ni
Otras medias  media aritmética, media geométrica.
*Media:
-De una población  
-De una muestra  x
-Si al hacer la campana de Gauss, ésta no es simétrica, indica que la
distribución es anormal.
2.-Mediana:
Valor que deja la mitad de los individuos por debajo de él y la otra mitad
por encima.
Se utiliza cuando la distribución no es normal.
3.-Moda:
Es la categoría con más frecuencia.
 Medidas de Dispersión:
Hace referencia a como se agrupan los datos alrededor de la medida de
centralización, generalmente la media.
-Rango  es la diferencia entre los valores extremos, es edcir, entre el
mínimo y el máximo de una muestra.
 Recorrido Intercualtil:
Se ordenan los datos y se divide en cuatro partes iguales (cuartiles).
indica el 50%
vigote (25%)
 Desviación media:
Indica cuanto se aleja cada valor con respecto a la media (X - X).
 Suma de las diferencias:
Cuando la diferencia de cualquier conjunto de datos es igual a 0, esto no dice
mucho.  (X - X).
 Varianza:
Suma de desviación al cuadrado (se eliminan de esa forma valores negativos),
divididos por el número de observaciones.
S2 =  (X - X)2
N
 Desviación Estandar:
Como varían los datos con respecto al promedio.
Es la raíz de la varianza.
DS =
 (X - X)2
N - 1
-Se resta N-1 solo si quiero calcular los valores de una muestra no de una
pobablación.
-Si la distribución es normal, se utiliza la D.S y el promedio.
-Si la distribución es anormal, se debe utilizar:
Mediana.
Recorrido intercuantil
Como por ejemplo el flujo salival.
 Valores percentiles para una distribución normal:
*Los percentiles dicen:
-2,5  promedio – 2DS.
-16  promedio – 1DS.
-50  promedio.
-84  promedio + 1DS.
-97,5  promedio + 2DS.
*Ejemplo:
-Promedio  4.
-D.S.  +- 0,5.
(3,5 – 4,5)  68%
menos de 3,5 o más de 4,5  16%
 Sesgo:
Asimetría de la curva, una cola o extremo es mayor que otro.
*Tipos de sesgos:
-Asimetría al lado derecho  sesgo +.
-Asimetría al lado izquierdo  sesgo negativo.
 Curtosis:
Curva más o menos aplanada, depende de la cantidad de casos, donde:
a MAYOR número de casos  más picuda.
 Campana de Gauss:
Es asintótica, es decir, no toca los ejes.
-Teorema Central del límite:
La distribución de medias de la muestra será aproximadamente normal,
indiferente de la distribución de valores en la población original de donde
fueron tomados los valores.
El valor de la media de la colección, de todas las posibles medias, será
igual a la media de la población.
La D.S. de la media (error estándar de la media o ESM), depende de la
DS de la muestra y el tamaño de la muestra.
-ESM  variación de los promedios si fueran repetidos.
ESM = D.S.
N
-Si la población está o no distribuida normalmente, el promedio de muestras
grandes (n mayor a 30), se distribuye de forma normal.
 Valor tificado:
Procedimiento que permite expresar cualquier valor inicial en términos de
unidades de D.S, se denomina Z.
Z = X – X
D.S.
Z = X – 
D.S.
-Permite trabajar con una tabla única de la distribución normal.
-Sirve para comparar valores procedentes de varios tests o medidas.
 Distribución Normal o Campana de Gauss:
-1DS  68%.
-2DS  95%.
-3DS  99%.
-La población tiene distribución definida por una media de  y una desviación
estándar de .
-Normalmente se utiliza o analiza una muestra:
X +-DS
*Propiedades de la curva normal:
Al se simétrica:
-La media, mediana y nodo tienen el mismo valor.
-La curva es simétrica respecto de la media, donde el sesgo es cero.
-La curtosis es 0.
-Las colas están cada vez más cercana al eje pero sin tocarlos (curva
asintótica).
-Campana de Gauss
promedio, mediana
moda
= 0
 = 1
-Curva no simétrica.
moda media
mediana
 Resumen:
VARIABLE
Nominal
Ordinal
Intervalar
MEDIA
Moda
Moda y Mediana
Moda, Mediana, Media, Recorrido
Intercuantil, DS
Documentos relacionados
Descargar