MATERIA: CÓDIGO: REQUISITO: PROGRAMAS: Inferencia Estadística 08171 Teoría de Probabilidades (08131) Ingenierías, Economía, Contaduría y Finanzas, Administración de Empresas, Mercadeo y Publicidad. PERIODO ACADÉMICO: 162 (Segundo semestre de 2016) INTENSIDAD SEMANAL: 4 horas CRÉDITOS: 3 OBJETIVO GENERAL Al finalizar este curso, el alumno estará en capacidad de: Describir, utilizar e interpretar los resultados de los métodos que hacen posible la estimación de una o varias características de una población de interés, o la toma de una decisión con respecto a una población, basada sólo en los resultados de una muestra. OBJETIVOS TERMINALES DE APRENDIZAJE Como resultado de este curso el estudiante estará en capacidad de: 1.1 Tomar decisiones con base en el análisis de información cuantificando los riesgos asumidos. 1.2 Comprender las distribuciones de muestreo y su incidencia sobre la toma de decisiones basadas en el muestreo. 1.3 Plantear, resolver y analizar pruebas de hipótesis respecto a los parámetros poblacionales más utilizados. 1.4 Utilizar y valorar el uso de Microsoft Excel en el procesamiento de información y la solución de problemas de inferencia estadística. 1.5 Identificar, aplicar y analizar el método de regresión lineal simple y el análisis de correlación. OBJETIVOS ESPECÍFICOS DE CADA MÓDULO Módulo 1 Diferenciar entre población y muestra y describir los métodos para seleccionar una muestra. Explicar la razón por la cual una muestra, es con frecuencia, la única forma viable para identificar una característica sobre una población. Repasar la Distribución normal e identificarla como una distribución clave en los resultados de la Inferencia Estadística. Módulo 2 Definir y construir la distribución muestral para la media, la proporción y la varianza Explicar las aplicaciones de las distribuciones muestrales. Explicar y aplicar el teorema central del límite en las distribuciones muestrales de la media y la proporción. Módulo 3 Identificar y calcular los principales estimadores puntuales y diferenciar entre estimador puntual y estimación. Definir y explicar las principales propiedades de los estimadores puntuales. Identificar el método de la máxima verosimilitud para encontrar buenos estimadores. Definir nivel de confianza Definir y construir un intervalo de confianza Identificar la distribución t de Student Identificar la distribución chi cuadrado. Construir intervalos de confianza para la estimación de la media, la proporción y la varianza poblacionales. Determinar y calcular el tamaño de muestra adecuado para estimar la media o la proporción poblacionales. Módulo 4 Definir una hipótesis e identificar los componentes o partes de una hipótesis. Describir el procedimiento general para probar una hipótesis. Definir los errores tipo I y tipo II y calcular la probabilidad de cometer error tipo I (nivel de significancia) y error tipo II en las pruebas de hipótesis. Distinguir entre pruebas de hipótesis de una cola y de dos colas. Describir y aplicar los procedimientos para probar hipótesis sobre la media y la proporción poblacionales. Definir y calcular el valor-p en las pruebas de hipótesis. Distinguir entre pruebas de hipótesis con una sola muestra y con dos muestras. Listar las características de la distribución F. Realizar pruebas de hipótesis con dos muestras, para dos varianzas. Realizar pruebas de hipótesis con dos muestras para la diferencia entre medias poblacionales independientes, para la diferencia entre dos proporciones poblacionales, para la media de dos muestras dependientes. Distinguir entre muestras dependientes e independientes. Explicar la idea general del análisis de varianza. Organizar datos en una tabla de ANOVA de una y dos vías. Realizar una prueba de hipótesis entre tres o más medias de tratamiento. Desarrollar intervalos de confianza para la diferencia en medias de tratamiento. Realizar una prueba de hipótesis entre medias de tratamiento con una variable de bloque. Módulo 5 Identificar cómo y cuándo emplear la prueba chi cuadrado para variables categóricas en tablas de contingencia Utilizar la prueba chi cuadrado para comparar un grupo de datos observado de frecuencias con una distribución esperada Realizar una prueba de hipótesis para determinar si hay alguna relación entre dos criterios de clasificación. Módulo 6 Calcular, interpretar y hacer inferencias sobre el coeficiente de correlación entre dos variables. Interpretar los términos variable dependiente e independiente. Usar el análisis de regresión lineal simple para predecir el valor de una variable dependiente con base en una variable independiente. Interpretar el significado de los coeficientes de regresión. Estimar la recta de regresión por el método de mínimos cuadrados. Estimar e interpretar los intervalos de confianza y de predicción para la variable dependiente. Evaluar las suposiciones de la regresión mediante pruebas de hipótesis y saber qué hacer si estas suposiciones son infringidas. METODOLOGIA El enfoque: En concordancia con los propósitos de la universidad, en el desarrollo de este curso se considera que el aprendizaje es el resultado de un proceso de construcción del conocimiento, que tiene como centro al estudiante y como guía al profesor. Este enfoque se concretará en la práctica con el aprovechamiento de los resultados del estudio previo hecho por los estudiantes, como elemento generador de preguntas, discusiones y conclusiones. La discusión en clase: La discusión, orientada por el profesor es el elemento central en la metodología del curso. Se fundamenta en el estudio preliminar de las secciones asignadas, en las preguntas de los estudiantes y en sus respuestas a sus preguntas y a las del profesor, que alimenten el proceso de aprendizaje activo. El profesor interviene esencialmente como guía y moderador de las discusiones, y se encarga de hacer la síntesis final para socializar el conocimiento consolidado en clase y de indicar al estudiante la labor que debe realizar como preparación para la clase siguiente y los objetivos que debe alcanzar como parte de tal preparación. Las actividades del estudiante: Para el logro de los objetivos de aprendizaje el estudiante debe desarrollar con total responsabilidad un conjunto de actividades antes, durante y después de la clase, así: Antes de la clase: Realizar todas las actividades indicadas por el profesor para la preparación del tema de clase, hacer explícitas las dudas e inquietudes que le surjan como resultado de este proceso y preparar las preguntas que formulará durante la clase de presentación del tema, con el fin de resolver las dudas e inquietudes. Durante la clase: Participar activamente en las discusiones que se generen a partir de las preguntas formuladas por los estudiantes y por el profesor, y de las respuestas a las mismas. Igualmente, presentar las dudas e inquietudes que le surgieron al prepararse para esta clase, y discutir alternativas propias de solución de problemas, cuando las tenga. Después de la clase: Asegurarse de consolidar el nuevo conocimiento resolviendo ejercicios y problemas que en la fase de preparación no haya podido resolver, o que revisten mayor complejidad, y relacionándolo con conocimientos previamente adquiridos. Prácticas en la sala de Cómputo: Se complementará el conocimiento adquirido en el aula de clase con prácticas de realizadas en la sala de cómputo. Estas prácticas serán dirigidas por el profesor; se utilizarán el software Microsoft Excel y su complemento MEGASTAT o cualquiera de los software licenciados que tiene la universidad para estadística, además del texto guía para el desarrollo de los talleres correspondientes. CONTENIDO Módulo 1: El Muestreo y la Inferencia Estadística (1 semana) 1.1 Introducción: Estadística Descriptiva versus Inferencia Estadística Población, muestra, parámetro, estadístico. 1.2 Tipos de Métodos de Muestreo. 1.3 Razones para obtener una muestra. 1.4 Muestreo Aleatorio Simple, Muestreo Estratificado, Muestreo sistemático, Muestreo por conglomerados. 1.5 Error de Muestreo 1.6 Repaso de la Distribución Normal. Módulo 2: Distribuciones Muestrales y Estimación puntual(2 semanas) 2.1 Distribuciones Muestrales, Distribución Muestral de la Media. 2.2 Teorema del Límite Central. Error Estándar de la Media Muestral 2.3 Uso de la distribución muestral de la media. 2.4 Distribución muestral de la proporción 2.5 Distribución muestral de la varianza 2.6 Estimador puntual y estimación 2.7 Propiedades de un buen estimador:Sesgo, eficiencia, consistencia. 2.8 Módulo 3: Estimación por intervalos (2 semanas) 3.1 Intervalos de confianza. Introducción, construcción y conceptualización básica. 3.2 Estimación del Intervalo de confianza para la media (σ conocida). 3.3 Estimación del Intervalo de confianza para la media (σ desconocida). 3.4 Distribución muestral t de STUDENT. Propiedades. Concepto de Grados de Libertad. 3.5 Estimación del Intervalo de Confianza para la Proporción 3.6 Estimación del Intervalo de confianza para la Varianza. 3.7 Determinación del tamaño de muestra para la media y para la proporción. Módulo 4: Prueba de Hipótesis (6 semanas) 4.1 ¿Qué es una hipótesis?¿Qué es la Prueba de Hipótesis? Procedimiento de 5 pasos para probar una Hipótesis. Hipótesis nula e hipótesis alternativa. Nivel de Significancia. Estadístico de Prueba y su valor crítico. Regla de decisión, regiones de rechazo y no rechazo. 4.2 Riesgos en la toma de decisiones al usar la metodología de pruebas de hipótesis. Errores tipo I y II. 4.3 Pruebas de significancia de una y dos colas. 4.4 Pruebas para la media de una población (σ conocida) Prueba de dos colas y de una cola. Valor p en las pruebas de hipótesis. 4.5 Prueba de la media poblacional (σ desconocida). 4.6 Pruebas relacionadas con proporciones. 4.7 Error tipo II – Cálculo del error tipo II 4.8 Prueba de hipótesis con dos muestras: Muestras Independientes. 4.9 Prueba de proporciones con dos muestras 4.10 Comparación de medias con desviaciones estándares de la población desconocidas (la prueba t conjunta) 4.11 Comparación de medias poblacionales con desviaciones estándares desiguales. 4.12 Prueba de hipótesis con dos muestras: Muestras Dependientes. 4.13 Comparación de muestras dependientes e independientes. 4.14 Distribución F. 4.15 Comparación de dos varianzas poblacionales. 4.16 Suposiciones en el análisis de la varianza (ANOVA) 4.17 La prueba ANOVA 4.18 Inferencias sobre pares de medias de tratamiento. Pruebas post-ANOVA, comparaciones múltiples. Prueba de Levene. 4.19 Análisis de Varianza de dos vías Módulo 5: Pruebas de bondad de ajuste y tablas de contingencia (2 semanas) 5.1 Prueba de bondad de Ajuste: frecuencias esperadas iguales 5.2 Prueba de bondad de ajuste: frecuencias esperadas desiguales 5.3 Bondad de ajuste para distribuciones binomial y poisson. 5.4 Limitaciones de la X²chi cuadrado 5.5 Análisis de tablas de contingencia. 5.6 Prueba X² de Independencia. 5.7 Prueba de bondad de ajusteKOLMOGOROV-SMIRNOV.Conceptos básicos. Módulo 6: Correlación y Regresión Lineal (3 semanas) 6.1 ¿Qué es el análisis de correlación? 6.2 Coeficiente de correlación. 6.3 Prueba de la importancia del coeficiente de correlación 6.4 Análisis de Regresión.Principio de los mínimos cuadrados 6.5 Error estándar de la estimación 6.6 Suposiciones de la regresión lineal. 6.7 Intervalos de confianza e intervalos de predicción 6.8 Coeficiente de Determinación 6.9 Más sobre el coeficiente de determinación. 6.10 Relaciones entre el coeficiente de correlación, el coeficiente de determinación y el error estándar de estimación. 6.11 Evaluación de las Suposiciones de la regresión lineal 6.12 Medición de la Autocorrelación: Estadístico DURBIN-WATSON 6.13 Un contraste de Homogeneidad de varianza de los residuales. EVALUACION Primer parcial: (sesión10) Tema: Lo visto hasta la sesión anterior al examen. 20% Segundo parcial: (sesión 22) Tema: Lo visto hasta la sesión anterior al examen. 20% Examen final: Toda la materia (60% lo visto después del segundo parcial) 30% Nov. 22 de 2016- 9:30 a 12:00 salón publicado oportunamente en la cartelera del departamento. Pruebas cortas Tres pruebas cortas 20% Control de Estudio Previo 10% Las pruebas cortas se efectuarán en las sesiones 6, 16 y 28 (Se elimina la de menor nota, no hay supletorios de pruebas cortas) Se efectuarán tres controles de estudio (no se elimina ninguna nota de controles de estudio previo) Supletorios: De parciales: Oct. 29 de 2016 de 9:30 a 12:00 De examen final: Dic. 05 de 2016 de 9:30 a 12:00 De conformidad con lo determinado en el Departamento de Matemáticas y Estadística para los cursos con examen final acumulativo, si la nota definitiva obtenida en el curso es mayor o igual que 2.8 pero menor que 3.0 y la calificación del examen final es 3.3 o mayor, la nota definitiva del curso será 3.0 ASISTENCIA A CLASE. El profesor es autónomo en la decisión de llevar control de asistencia a cada clase. Si por los alumnos es conocido que se lleva control de asistencia, el alumno que no haya asistido al menos al 80% del total de horas del curso obtendrá una calificación de “No Aprobado” (Ver artículo 74, literal c “Libro de derechos, deberes y normas de los estudiantes de pregrado de la Universidad Icesi”). En los casos en los que el profesor no lleve el registro de asistencia o éste no sea conocido por los estudiantes, no se podrán aplicar las normas sobre calificación de las materias con “No Aprobado” por faltas de asistencia (ver parágrafo 2° del artículo 74 “Libro de derechos, deberes y normas de los estudiantes de pregrado de la Universidad Icesi”) Nota: Esta asignatura tiene 32 sesiones de 2 horas cada unaen el semestre. Si usted falta a siete (7) o más sesiones en el semestre, obtendrá una calificación de “No Aprobado”, siempre que el profesor lleve el registro de asistencia. BIBLIOGRAFIA Texto Guía:(Tg) “Estadística aplicada a los negocios y la economía”. Lind, Marchal, Wathen. Editorial Mc Graw Hill. Décimo sexta edición 2015. Libros de Consulta: Ref 1“Estadística para Administración”, BERENSON, LEVINE, KREHBIEL. Editorial PRENTICE HALL. Cuarta edición 2006 Ref 2“Estadística para los negocios y la economía”, PAUL NEWBOLD. Editorial PRENTICE HALL. Octava edición2013. Ref 3“Estadística para administración y economía”, Levin, Rubin, Balderas, del Valle, Gómez. Editorial PRENTICE HALL. Séptima edición 2004. Ref 4“Probabilidad y Estadística”. WALPOLE, MYERS.Editorial MCGRAW HILL. Cuarta edición 1992 Ref 5“Estadística para Administración”, BERENSON, LEVINE, KREHBIEL. Editorial PRENTICE HALL. Segunda edición 2001 Ref 6“Estadística Matemática con Aplicaciones”, Mendenhall, Scheaffer, Wackerly. 6ª edición 2002. Editorial Thomson. Ref 7 “Probabilidad y Estadística Aplicaciones y métodos”. Canavos, George C. Editorial Mc Graw Hill. Primera edición 1987 TRABAJO DE CLASE EN LA SALA DE CÓMPUTO: En las sesiones programadas para ser llevadas a cabo en las salas de cómputo, los alumnos se abstendrán de navegar en Internet, enviarse mensajes a través de correo electrónico o de los software diseñados para tal fin o de tener abierto cualquier software diferente al que se debe usar en la clase. A discreción del profesor, el alumno que sea sorprendido infringiendo esta norma, será retirado de la sala, se le colocará falta de asistencia y si se tiene previsto que se debe presentar algún trabajo en clase, el alumno tendrá una calificación de 0 (cero) en dicho trabajo(Ver artículo 76 “Libro de derechos, deberes y normas de los estudiantes de pregrado de la Universidad Icesi”). . Programación Curso de Inferencia Estadística S#: Sesión número SAE: Sección del texto guía o texto de consulta asignado al estudiante para la clase siguiente RC: Ejercicios para resolver en casa S# Tema SAE RC* 1 2 3 Presentación del Programa. Texto guía. Tgpag 221-228, Forma de evaluación, Metodología del curso. Ref 1 pag220-224 Conceptos: Población, Muestra, Parámetro, Estadístico.Objetivos de la inferencia Estadística. Tipos de Métodos de Muestreo. Razones para Tg pag 229-240, obtener una muestra. Error de muestreo Repaso distribución normal Distribuciones Muestrales. Distribución muestral de la media. Teorema del límite central. Error estándar de la media muestral. Uso de la distribución muestral de la media Distribución muestral de la proporción Distribución muestral de la varianza. Estimador puntual y estimación. Propiedades de un buen estimador: Sesgo, Eficiencia y Consistencia. Introducción a la estimación de intervalos de confianza. Estimación de Intervalos de confianza para la media(σ conocida). Distribución muestral t STUDENT. Grados de libertad. Estimación de Intervalos de confianza para la media (σ desconocida). Estimación de intervalo de confianza para la proporción. Quiz 1 Estimación de intervalo de confianza para la varianza Determinación del tamaño de muestra para la media y para la proporción. Factor de corrección para poblaciones finitas Elementos básicos de las pruebas de hipótesis. Hipótesis Estadísticas. Hipótesis nula e Hipótesis alternativa. Estadístico de Prueba y su valor crítico. Reglas de Decisión:regiones de rechazo y no rechazo. Nivel de Significancia. Riesgos en la toma de decisión al utilizar pruebas de hipótesis: Error tipo I y Error tipo II Pruebas de significancia de una y dos colas Prueba de Hipótesis para la media (σ conocida) de una y dos colas. Primer examen parcial Ref 1 pag 217218 Ref 2 pag 277284. Tgpag 250-257 11 Valor p en las pruebas de hipótesis. Prueba de la media poblacional (σ desconocida) 12 Pruebas relacionadas con proporciones Error tipo II. Cálculo del error tipo II Prueba de Hipótesis para la varianza Tgpag 301 – 304 Ref 2 pag384387 Tgpag 311-316, 478-481 13 Pruebas de hipótesis de dos muestras. Muestras Tgpag 316-323 independientes. Pruebas de proporciones de dos muestras 14 Comparación de medias poblacionales con Tgpag 324-329 desviaciones estándares desconocidas. Medias poblacionales con desviaciones estándares desiguales 4 5 6 7 8 9 10 Tgpag 258-263 Tgpag 264-266 Tg ejerc 5 a 10 pag 232, ejerc 11 a 14 pag 239, ejerc 15 a 18 pag 242, ejerc 31 a 45 pág 245 Ref 1 ejerc 7.14 al 7.22 pag 219. Ref 2 ejerc 7.47 al 7.62 pag 284 Tg ejerc 1 a 8 pag 257, Ref 2 pag 340343 Tgpag 267-272 Tg ejerc 9 a 14 pag 263 Tg ejerc 15 a 18 pag 266. Tg pag 282-287 Ref 2 ejerc 9.23 al 9.31 pag 343 Tg ejerc 19 a 26 pag 270. Tg ejerc 27 a 30 pag 272. Ref 1 ejerc 9.1 a 9.19 pag 277. Tg ejerc 1 a 8 pag 293 Tg pag 287 - 292 Tg ejerc 9 a 14 pag 298 Tg ag 292 – 298 Tg ejerc 15 a 20 pag 301, Tg ejerc 21 a 22 pag 304, 23 a 49 pag 305, 1 a 6 pag 478, Ref2 pag 387 ejerc 9.47 a 9.52 Tg ejerc 1 a 6 pag 315, ejerc 7 a 12 pag 481 Ref 2 ejerc 10.14 al 10.21 pag 415 Tg ejerc 7 a 12 pag 320, 13 a 16 pag 324 15 Prueba de hipótesis de dos muestras: muestras Tg pag 339-342 dependientes. Comparación de muestras dependientes e independientes Tg ejerc 17 a 20 pag 329 16 Distribución F. Comparación de 2 varianzas poblacionales. Quiz 2 Suposiciones en el análisis de varianza La prueba ANOVA Tg pag 343-350 Tg ejerc 1 a 6 pag 343 Tg pag 351-353 Ref 1 pag 353357 Tg pag 355-358 Tg ejerc 7 a 10 pag 350 17 18 20 Inferencias sobre pares de medias de tratamiento. Pruebas post-ANOVA: comparaciones múltiples: Prueba de Levene Ejercicios de la Anova y Análisis de Varianza de dos vías Ejercicios de ANOVA de dos vías 21 Práctica en Excel con Anova y Anova de dos vías 22 Segundo examen parcial 19 23 24 25 26 27 28 29 30 31 32 Tg ejerc 28 a 32 pag 367 Tg ejerc 39 a 45 pag 372 Tgpag 482-490, Ref 2 pag 661663 Prueba de bondad de ajuste, frecuencias esperadas Tg pag 491-493 iguales. Prueba de bondad de ajuste, frecuencias esperadas desiguales. Bondad de ajuste para distribuciones binomial y Poisson. Limitaciones de la ² . Prueba de hipótesis de que la distribución de datos Tg pag 494-498 proviene de una población normal. Ref 1 pag 386391,393-397 Ref 7 pag 368Análisis de tablas de contingencia 370 Prueba ² de independencia Bondad de Ajuste Kolmogorov-Smirnov. Conceptos básicos para distribución normal. ¿Qué es el análisis de correlación? Coeficiente de correlación. Coeficiente de Determinación. Prueba de la importancia del coeficiente de correlación Análisis de regresión. Principio de los mínimos cuadrados. Error estándar de la estimación. Suposiciones de la regresión lineal. Intervalos de confianza e intervalos de predicción Quiz 3 Más sobre el coeficiente de determinación. Relaciones entre el coeficiente de correlación, el coeficiente de determinación y el error estándar de la estimación. Transformación de datos Evaluación de las suposiciones de la regresión lineal. Medición de la autocorrelación: estadístico DurbinWatson.Un contraste de homogeneidad de varianza para los residuales Uso de Herramientas Estadísticas utilizando Microsoft Excel. Repaso y revisión del cumplimiento de los objetivos del curso Tg ejerc 11 a 14 pag 353 Ref 1 ejerc 10.55 al 10.68 pag 358 Tg ejerc 15 a 18 pag 359 Tg pag 381-391 Tg ejerc 13 a 20 pag 486 21 a 24 pag 490. Ref 2 ejerc 14.1 al 14.10 pag 647, 14.11 y 14.12 pag 653 Tg ejerc 25 a 26 pag 494 Ref 1 ejerc 11.11 a 11.23 pag 391, 11.24 a 11.31 pag 398. Tg ejerc 27 a 30 pag 497 y 47 a 60 pag 500 Ref 7 ejerc 10.12 pag 376 Tgpag 392-397 Tg ejerc 1 a 6 pag 388, 7 a 12 pag 391 Tgpag 399-411 Tg ejerc 13 a 20 pag 397, 21 a 24 pag 401, 25 a 28 pag 403 Ref 1 pag 433436 Ref 2 pag 602607 Tg ejerc 29 y 30 pag 405, 31 a 34 pag 409, 35 y 36 pag 412, 37 a 61 pag 414 Ref 1 ejerc 12.34 al 12.37 pag 436 Ref 2 ejerc 14.26 y 14.27 pag 607 *Del texto guía, usted debe revisar los ejercicios que se encuentran al final de cada capítulo.