Objetivos específicos de TEMAS 1 y 2: Una primera aproximación al paquete estadístico R (menús, tipo de archivos que trata). Aprender a introducir la información en archivos de datos Script. Manipular los resultados llevándolos a editores de texto como Word. Abrir archivos generados por otras aplicaciones tales como archivos de texto y de Excel. Realización de operaciones típicas de calculadora, que permiten transformar los datos. Realización de análisis estadísticos descriptivos sobre las variables. Representación gráfica de la información mediante la realización de diversos tipos de gráficos. Tabulación. Manejo de modelos de probabilidad. Data frames: Muchas de las tareas a realizar en R comienzan por manipulación datos estructurados en lo que R denomina data frames. De este modo se manipularán las columnas (variables) y filas (casos) ya sea modificándolas en nuevos valores o tratándolas con alguna función estadística. Organización de la información en un archivo de datos. Introducción de datos: Casos y variables (data frame) La edición de datos en R: Editor Script Esta ventana muestra el contenido del archivo de datos. Con el Editor de datos puede crear nuevos archivos de datos o modificar los existentes. La ventana de edición de data frames Permite crear nuevos data frames o modificar los existentes La edición el linea permite introducir los datos directamente desde la ventana principal de R Introducción de datos y generación de archivos de datos: Descripción de las variables: Tipo, Formato, Valores perdidos, Etiquetas de niveles de variables cualitativas. Traspaso de información a otras aplicaciones: Importación/exportación de archivos de Excel Traslado de resultados a un procesador de textos (Word) Leer datos de texto Departamento de Estadística e Investigación Operativa 1 Aprender a manipular y transformar la información guardada en archivos Script para adaptarla a las necesidades del tratamiento estadístico a aplicar. Transformación y generación de variables Transformar, calcular nuevas variables Factorizar, recodificar variables Selección de casos que cumplen determinadas condiciones: Aplicación de operadores lógicos para selección de parte de la información de variables o de data frames. Extracción de columnas, filas de un data frame. Extracción de elementos de un vector o data frame. Nota: Sólo para los casos seleccionados estarán activos los procesos. División o segmentación de un data frame o variable en grupos o niveles de uno o más factores: Nota: el análisis se efectúa para cada grupo por separado. Operaciones entre data frames: Fundir dos data frames en uno: Las mismas variables y casos diferentes: añadir casos. Fundir dos data frames en uno: Los mismos casos pero variables diferentes: añadir variables. Aprender a hacer un análisis descriptivo completo con resúmenes de tendencia central, de dispersión, de forma de distribuciones de variables. Tablas de frecuencia. Gráficos de barras, de sectores, histogramas, caja, de tallo y hojas. Análisis descriptivo unidimensional: Medidas de tendencia central, dispersión, forma y posición. Interpretación de los resultados Tablas de frecuencias. Gráficos: barras, sectores, gráfico de tallo y hojas, diagramas de caja, valores atípicos. Departamento de Estadística e Investigación Operativa 2 Tratamiento tabular de distribuciones bidimensionales y de mayor dimensión. Expresión de las distribuciones en tablas en frecuencias relativas, en frecuencias condicionadas. Tablas de contingencia Cálculo de porcentajes (filas, columnas, total) Frecuencias esperadas bajo independencia Estudio de la asociación entre variables: el test Chi-cuadrado Una aproximación a los modelos de probabilidad con R Modelos discretos (Binomial, Poisson,…) Modelos continuos (Uniforme, Normal, t de Student, Chi-cuadrado,…) Funciones: Función de densidad o de probabilidad Función de distribución Cuantiles Selección aleatoria de una muestra Representación gráfica NOTA: Es imprescindible que el alumno domine estas tareas de modo que esté capacitado para realizar con R un análisis a nivel descriptivo de los diferentes datos con los que pueda trabajar en un futuro y manipular y transformar la información disponible adecuándola a los objetivos del análisis estadístico. Las siguientes sesiones correspondientes al resto de los temas suponen un complemento más avanzado que requiere mayor dedicación y esfuerzo. El objetivo es aportar los conocimientos básicos que permitan preparar el camino para profundizar sobre ellos. Departamento de Estadística e Investigación Operativa 3