Taller 2. Análisis previo de los datos El segundo taller sobre análisis previos de datos, usted debe comprender el siguiente archivo. a. Hatco.sav Por favor, determine: Determinar la información presentada. Listar lo que significa cada una de las variables. Leer el archivo hatco_documentation.pdf Determine el tipo de escala de cada una de las variables Determine el posible uso de la información recolectada Explicar la validez y confianza de los datos presentados Evaluar los supuestos de normalidad, linealidad, ξ~N(0,σ2), varianza constante Análisis gráfica de forma de distribución: histograma con curva normal, diagrama de tallos y hojas Análisis de relación entre variables: gráfico de dispersión por variables, r y gráfico de cajas y bigotes. Escriba una páginas explicando esta base de datos Análisis previo de los datos 1. Leer el texto del la base de datos HATCO 2. Cargar la base de datos HATCO en SPSS 3. Análisis de la forma de la distribución. Histograma de frecuencia con curva normal Diagrama de tallos y hojas ANALISIS DE LAS DIFERENCIAS ENTRE GRUPOS ANALISIS DE LA DIFERENCIA ENTRE GRUPOS ESTANDARIZAR VARIABLES CUANTITATIVAS Y COMPARAr EL FRÁFICO DE CAJA VIGOTES Z(i)=(x(i)-media)/var DATOS AUSENTES Método de la media Método de la moda en el rango Dato típico en la población Imputación mediante la regresión Eliminación de la observación Eliminación de la variable DETECCION DE CASOS ATIPICOS DISTANCIA DE MAHALANOBIS POR CASOS Y VARIABLES DECISION CASO ATIPICO VALORACION DE LOS SUPUESTOS FRENTE A LOS MODELO NORMALIDAD Gráficos P-P gráficos de probabilidad,gráficos de probabilidad,gráficos de probabilidad gráficos de probabilidad,gráficos de probabilidad,gráficos de probabilidad P-P...,P-P...,P-P... gráficos de probabilidad P-P,gráficos de probabilidad P-P,gráficos de probabilidad P-P gráficos de probabilidad normal,gráficos de probabilidad normal,gráficos de probabilidad normal gráficos de probabilidad normal,gráficos de probabilidad normal,gráficos de probabilidad normal P-P...,P-P...,P-P... gráficos,gráficos,gráficos gráficos de probabilidad,gráficos de probabilidad,gráficos de probabilidad Representa las proporciones acumuladas de una variable respecto a las proporciones acumuladas de cualquiera de las integrantes en una serie de distribuciones de contraste. Los gráficos de probabilidad se suelen utilizar para determinar si la distribución de una variable coincide con otra distribución especificada. Si la variable seleccionada coincide, los puntos se agruparán en torno a una línea recta. Entre las distribuciones de contraste disponibles se incluyen Beta, Chi-Cuadrado, Exponencial, Gamma, Semi-Normal, Laplace, Logística, Lognormal, Normal, Pareto, t de Student, Weibull y Uniforme. Según la distribución seleccionada, podrá especificar los grados de libertad y otros parámetros. Se obtendrán gráficos de probabilidad para los valores transformados. Entre las opciones de transformación se incluyen Transformación log natural, Tipificar los valores, Diferenciar y Diferenciar ciclo. Puede especificar los métodos para calcular las distribuciones esperadas y para deshacer los "empates" o las múltiples observaciones con el mismo valor. Asimetría. Medida de la asimetría de una distribución. La distribución normal es simétrica y tiene un valor de asimetría igual a 0. Una distribución que tenga una asimetría positiva significativa tiene una cola derecha larga. Una distribución que tenga una asimetría negativa significativa tiene una cola izquierda larga. Como regla aproximada, un valor de la asimetría mayor que el doble de su error típico se asume que indica una desviación de la simetría. Curtosis. Medida del grado en que las observaciones están agrupadas en torno al punto central. Para una distribución normal, el valor del estadístico de curtosis es 0. Una curtosis positiva indica que las observaciones se concentran más y presentan colas más largas que las de una distribución normal. Una curtosis negativa indica que las observaciones se agrupan menos y presentan colas más cortas. HOMOCEDASTICIDAD MATRIZ DE VIRIANZA COVARIANZA LINEALIDAD El segundo taller sobre análisis previos de datos, usted debe leer los siguientes archivos b. Colombia.xls c. Colombiaagrupaso.xls Por favor, determine: Validez y confianza de los datos Homogeneidad de los datos Proponga un método de organización de los datos Crear un archivo en SPSS “colombia” Aplique los procesos anteriormente enunciados en el presente taller Escriba tres páginas explicando esta base de datos