Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Técnicas Cuantitativas para el Management y los Negocios Mag. María del Carmen Romero – 2014 romero@econ.unicen.edu.ar Módulo II Módulo II: ESTADÍSTICA INFERENCIAL Contenidos Unidad 4. Probabilidad Conceptos básicos de probabilidad: experimento aleatorio, espacio muestral y evento. Probabilidad. Definición. Enfoques de la probabilidad: clásico, de la frecuencia relativa y subjetivo. Probabilidad simple. Cálculo de probabilidades: regla de la adición y de la multiplicación. Conceptos de exclusión e independencia. Probabilidad condicional. Teorema de Bayes. Unidad 5. Variables Aleatorias Variables aleatorias discretas y continuas. Función de probabilidades. Indicadores de posición y dispersión. Esperanza matemática. Varianza y desviación estándar. Interpretación y aplicaciones de la esperanza y la desviación estándar. Unidad 6. Algunas distribuciones de probabilidad especiales Distribuciones discretas. Ensayos Bernoulli. Distribución Binomial, hipergeométrica y Poisson Distribuciones continuas. Distribución Normal. Distribución estandarizada. Aproximación Normal de las distribuciones Binomial y Poisson. Distribución t de Student, Chi-cuadrado y F de Fisher. Aplicaciones. Unidad 7. Muestreo y Estimación Nociones básicas de muestreo. Distribuciones muestrales en poblaciones infinitas y finitas. Teorema central del límite. Estimación y estimador. Estimación puntual. Propiedades deseables de los estimadores. Principales estimadores puntuales. Estimación por intervalos. Intervalos de confianza para la media, proporción y varianza. Cálculo del tamaño muestral. Aplicaciones. Unidad 8. Prueba de hipótesis Conceptos básicos. Hipótesis estadística. Hipótesis nula y alternativa. Estadígrafo de contraste. Región crítica y región de aceptación. Error de Tipo I y de Tipo II. Nivel de significación y potencia. Tipo de contraste. p-valor. Contrastes de hipótesis referentes a media, proporción y varianza poblacional. Aplicaciones. Mag. María del Carmen Romero 1 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo y Estimación Contenidos Nociones básicas de muestreo. Distribuciones muestrales en poblaciones infinitas y finitas. Teorema central del límite. Estimación y estimador. Estimación puntual. Propiedades deseables de los estimadores. Principales estimadores puntuales. Estimación por intervalos. Intervalos de confianza para la media, proporción y varianza. Cálculo del tamaño muestral. Aplicaciones. Muestreo y Estimación Etapas de una investigación Formulación o definición del problema Diseño de la investigación Recolección de los datos Organización y descripción de los datos Decisión o inferencia final Mag. María del Carmen Romero 2 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo y Estimación Decisión o inferencia final Consiste en responder la pregunta original planteada en la formulación del problema (que siempre se refiere a la población). Si se trabajó con toda la población, pueden tomarse decisiones acerca del problema. Si se trabajó con una muestra, es necesario realizar inferencias acerca de la población basándose en la información contenida en una muestra extraída de ella. ESTADÍSTICA INDUCTIVA o INFERENCIAL Muestreo y Estimación Decisión o inferencia final Se emplean los estadísticos (muestra) para estimar los parámetros (población). ESTIMACIÓN Los datos de la muestra se usan para corroborar o rechazar alguna hipótesis planteada. COMPROBACIÓN DE HIPÓTESIS Mag. María del Carmen Romero 3 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo Muestreo La inferencia estadística se define como la colección de técnicas que permiten formular inferencias inductivas y que proporcionan una medida del riesgo de éstas. Si se obtiene una muestra técnicamente buena, puede contener información útil con respecto al estado de la naturaleza y a partir de ello se podrán formular inferencias. (se está sujeto a riesgo dado que representan un razonamiento que va de lo particular a lo general) Mag. María del Carmen Romero 4 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo Selección de una muestra Para poder generalizar los valores muestrales a la población, es necesario tener en cuenta: • Tamaño de la muestra (n) • Método de selección de la muestra Muestreo Selección de una muestra “Buena muestra” El proceso proporciona, a cada objeto de la población, una oportunidad igual e independiente de ser incluido en la muestra. Debe asegurar que cada muestra de tamaño n tenga la misma probabilidad de ser seleccionada. Muestra aleatoria simple Mag. María del Carmen Romero 5 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo Situación 1 Población: Constituida por un número infinito de posibles resultados (objetos no tangibles) Variables: nivel de concentración de un contaminante, demanda de un producto, tiempo de espera de un servicio. Muestreo aleatorio con reemplazo Cada una de las observaciones X1, X2, …, Xn es una variable aleatoria cuya distribución de probabilidad es igual a la de la población Muestreo Situación 2 Población: Constituida por un número finito de objetos tangibles (seres humanos, animales, componentes mecánicos o eléctricos, etc.). Variables: opinión de una persona, tiempo de duración de un componente, etc. Muestreo aleatorio con reemplazo. X1, X2, …, Xn conjunto de variables aleatorias independientes e idénticamente distribuidas (IID). (la distribución de probabilidad es igual a la de la población) Mag. María del Carmen Romero 6 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo Situación 3 Muestreo aleatorio sin reemplazo Cada una de las observaciones X1, X2, …, Xn es una variable aleatoria cuya distribución de probabilidad es igual a la de la población pero no son independientes Muestreo La Situación 2 es un caso particular de la Situación 1. Si el tamaño de la población es pequeño, puede preferirse el muestreo aleatorio sin reemplazo. Si la población es muy grande, es irrelevante si el muestreo se hace con o sin reemplazo. Mag. María del Carmen Romero 7 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo Muestra aleatoria (base teórica necesaria para la inferencia) Todo muestreo probabilístico (sistemático, estratificado, conglomerados) se basa en el concepto de muestra aleatoria. Muestreo Parámetro Caracterización numérica de la distribución de población de manera que describe, parcial completamente, la función de densidad de característica de interés (µ, σ2, σ, p). la o la Estadístico Variable aleatoria. Cualquier función de las variables aleatorias que observaron en la muestra de manera que esta función no contiene cantidades desconocidas (x, s2, s, proporción estimada). Mag. María del Carmen Romero 8 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo Los parámetros o sus funciones se estiman con base en estadísticos que, a su vez, se obtienen a partir de la información contenida en una muestra aleatoria Muestreo Muestra de n variables aleatorias IID Función de densidad que depende de un parámetro desconocido θ Estadísticos Si se emplea un estadístico T para estimar un parámetro desconocido θ , T es el estimador de θ y el valor específico de t como un resultado de los datos muestrales es la estimación de θ Mag. María del Carmen Romero 9 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo Ejemplo Duración promedio de cierta clase de batería Idénticos procesos de manufactura y materiales Se seleccionan aleatoriamente cinco pilas diarias durante 20 días Prueba de duración (se registra el tiempo de operación) 20 muestras aleatorias distintas donde cada una contiene 5 variables aleatorias IID (independientes idénticamente distribuidas) Cada muestra diaria proporciona una estimación de la duración promedio de las baterías Muestreo Estadístico: variable aleatoria Variabilidad Mag. María del Carmen Romero 10 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo La distribución en el muestreo de un estadístico es la distribución de probabilidad del estadístico que puede obtenerse como resultado de un número infinito de muestras aleatorias independientes, cada una de tamaño n, provenientes de la población de interés. Hace posible realizar un análisis de probabilidad para valorar el riesgo inherente cuando se formulan inferencias. Muestreo Distribución en el muestreo de la media Muestreo con reemplazo Muestreo sin reemplazo Mag. María del Carmen Romero 11 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo Distribución en el muestreo de la media Si la distribución de la variable poblacional es normal Distribución normal de las medias muestrales Si no se conoce la distribución de la variable Si n ≥ 30 Distribución normal de las medias muestrales Si 15 ≤ n < 30 y la distribución es aproximadamente simétrica Distribución normal de las medias muestrales Si n < 15 … Muestreo Teorema central del límite Mag. María del Carmen Romero 12 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Muestreo Distribución en el muestreo de la varianza Distribución en el muestreo de la proporción Distribución en el muestreo de la diferencia entre dos medias muestrales Distribución en el muestreo de poblaciones finitas … Muestreo Distribución en el muestreo de la varianza Mag. María del Carmen Romero 13 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación Estimación Los estadísticos se emplean para estimar los valores de parámetros desconocidos o funciones de éstos. La estimación de un parámetro involucra el uso de los datos muestrales en conjunción con algún estadístico. Estimación puntual Estimación por intervalos Mag. María del Carmen Romero 14 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación Estimación puntual ¿Cómo seleccionar un buen estimador de θ? ¿Con qué criterios puede decirse si un estimador es “bueno” o “malo”? El problema es encontrar una función que proporcione la “mejor” estimación del parámetro θ El estimador de un parámetro debe tener una distribución de muestreo concentrada alrededor del parámetro y la varianza debe ser la menor posible Estimación puntual Propiedades deseables de los estimadores Insesgado Es deseable que un estimador tenga una media igual a la del parámetro que se está estimando Consistente Es razonable esperar que un buen estimador de un parámetro sea cada vez mejor conforme crece el tamaño de la muestra Insesgado de mínima varianza Eficiente Debe buscarse aquél estimador insesgado con mínima varianza Una estadística suficiente para un parámetro es aquélla que utiliza toda la información contenida en la muestra aleatoria con respecto al parámetro Mag. María del Carmen Romero 15 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación puntual Algunos métodos de estimación puntual Máxima verosimilitud En general, proporciona estimadores que son funciones de estadísticas suficientes, estimadores eficientes y sesgados. Momentos Mínimos cuadrados Estimación puntual Ejemplo Interesa conocer el ingreso promedio de nuestros potenciales compradores y se toma una muestra de n individuos aletoriamente seleccionados: {X1,... Xn} Dos estimadores de la media podrían ser: µˆ1 = x1 n µˆ 2 = ∑ X i i =1 1 n Ambos son insesgados Pero var( µˆ1 ) = σ 2 var( µˆ 2 ) = σ 2 / n El segundo es más eficiente que el primero Mag. María del Carmen Romero 16 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación puntual Estimador de la media poblacional Sea X una v.a. con E(X)=µ (media poblacional) desconocida ∞ µ = ∑ xi pi i =1 Un estimador de µ es la “media muestral” (n tamaño muestral, muestra aleatoria IID) n µˆ = X = ∑ X i i =1 ¿Parámetro? ¿Estadístico? ¿Estimador? ¿Estimación? 1 n Estimación puntual Estimador de la varianza poblacional Sea X una v.a. con var(X)=σ2 (varianza poblacional) desconocida ∞ σ = ∑ ( X i − µ )2 pi 2 i =1 Un estimador de σ2 es la “varianza muestral” N ∑ ( X − X) i S= i=1 n −1 Mag. María del Carmen Romero 2 ¿Parámetro? ¿Estadístico? ¿Estimador? ¿Estimación? ¿Por qué el denominador de S es (n-1)? 17 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación puntual Estimador de la proporción poblacional Si se tiene una población con Distribución Binomial (1: éxito, 0: fracaso) la probabilidad de éxito puede ser estimada como: pˆ = n: tamaño muestral # exitos n ¿Parámetro? ¿Estadístico? ¿Estimador? ¿Estimación? Estimación puntual Problemas de la estimación puntual El valor obtenido sólo da una idea aproximada del verdadero valor del parámetro a estimar No se conoce el grado de bondad de la aproximación, esto es, en qué medida el valor obtenido se aproxima al verdadero valor del parámetro estimado. Estimación por intervalos Mag. María del Carmen Romero 18 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos Una tienda mantiene muy buenos registros con respecto al número de unidades de cierto producto que vende mensualmente. Para la tienda es muy importante conocer la demanda promedio ya que con base a ésta se lleva a cabo el mantenimiento del inventario. Suponer que la demanda del producto no se ve afectada por fluctuaciones en la temporada. Media muestral de la demanda (calculada en base a los últimos 36 meses) = 200 unidades ¿Implica que la demanda media desconocida no es mayor de 250 ni menor de 150? No se tiene indicación del posible error en el estimador puntual. Estimación por intervalos Estimación por intervalos Para la estimación del intervalo se consideran, tanto el estimador puntual del parámetro como su distribución de muestreo, con el objetivo de determinar un intervalo que con cierta seguridad/confianza (1-α) contiene al parámetro (θ). El intervalo de confianza se construye teniendo en cuenta: • Estimador • Desviación estándar del estimador • Confianza Mag. María del Carmen Romero 19 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos Notación: P (xinf < θ < xsup) = (1-α) IC (xinf ; xsup) con una confianza (1-α) El parámetro u es fijo, xinf y xsup son variables aleatorias Estimación por intervalos IC para µ cuando se muestrea de una distribución normal con varianza conocida (distribución normal) Mag. María del Carmen Romero 20 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos P (xinf < θ < xsup) = (1-α) IC (xinf ; xsup) con una confianza (1-α) Interpretación La probabilidad de que el intervalo planteado contenga al parámetro θ es (1-α) Si se obtienen muestras aleatorias del mismo tamaño en forma repetida de una población, y cada vez que se seleccionan se calculan los valores específicos, debe esperarse que el (1-α)% contengan el valor del parámetro desconocido. La probabilidad que el parámetro desconocido tome valores entre xinf y xsup es (1-α) Estimación por intervalos Si se repitiera muchas veces el experimento con muestras extraídas al azar, se verificaría que: el 100 (1-α)% de las ocasiones, se obtendrían xinf y xsup de los intervalos de confianza correspondientes que contendrían al verdadero valor del parámetro µ, mientras que el 100α% restante, no lo contendrían Mag. María del Carmen Romero 21 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos Estimación por intervalos Intervalo de confianza para la media µ de una distribución normal de varianza conocida Mag. María del Carmen Romero 22 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos Intervalo de confianza para la media µ de una distribución normal de varianza conocida Estimación por intervalos Intervalo de confianza para la media µ de una distribución desconocida de varianza conocida n es lo suficientemente grande (n ≥30) Mag. María del Carmen Romero 23 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos Intervalo de confianza para la media µ de una distribución normal de varianza desconocida Si n es lo suficientemente grande (n ≥30), se aproxima a una distribución normal Estimación por intervalos Intervalo de confianza para la varianza y el desvío estándar de una distribución normal Mag. María del Carmen Romero 24 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos Intervalo de confianza para la proporción Con reemplazo Sin reemplazo IC para la proporción considerando que las proporciones se distribuyen normalmente? Estimación por intervalos IC para la diferencia de medias cuando se muestrean dos distribuciones normales independientes: con varianzas conocidas (distribución normal) con varianzas desconocidas e iguales (distribución t-student) IC para el cociente de dos varianzas cuando se muestrean dos distribuciones normales independientes (distribución F) Mag. María del Carmen Romero 25 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Tamaño muestral Cálculo del tamaño muestral Depende de qué parámetro se quiere estimar. Tiene en cuenta el error máximo que se está dispuesto a “tolerar”, el nivel de confianza y la variabilidad. Estimación de la media (con varianza conocida y distribución normal) ¿Si se quiere estimar la proporción? Ejemplo Mag. María del Carmen Romero 26 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos Problema: El dueño de una librería que está localizada cerca del campus de una universidad quiere iniciar una campaña de marketing. Para ello, necesita conocer el promedio del dinero que gastan anualmente sus clientes en la librería. Se supone, a partir de estudios anteriores, que el desvío estándar de los gastos de los clientes es $11.5 (en cientos). Estimación por intervalos a) Calcular los intervalos de confianza para la media poblacional considerando los siguientes niveles de confianza – para un tamaño de muestra de 64 con una media muestral de $28 (en cientos): i. 0.90 ii. 0.95 iii. 0.99 ¿Qué sucede con la amplitud de los intervalos a medida que se incrementa el nivel de confianza? ¿Qué justificación encuentra a esto? Mag. María del Carmen Romero 27 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos Datos: Variable: “Gasto mensual de los clientes en la librería” Forma de la distribución: desconocida n = 64 σ = $ 11.5 x = $ 28 Estimación de un intervalo de confianza para la media poblacional: Varianza conocida n ≥ 30 Por T. Central del Límite: LI = x − z c σ / n y LS = x + zc σ / n Estimación por intervalos (1-α) 0.90 0.95 0.99 zc 1.64 1.96 2.58 LI $ 25.64 $ 25.18 $ 24.29 LS $ 30.36 $ 30.82 $ 31.71 0.28 0.28 0.28 0.21 0.21 0.21 0.14 0.14 0.14 0.07 0.07 0.07 0.00 20.75 24.38 28.00 31.62 Medias Mues trales Mag. María del Carmen Romero 35.25 0.00 20.75 24.38 28.00 31.62 Med ias Mu es tra le s 35.25 0.00 20.75 24.38 28.00 31.62 35.25 Medias Mues trales 28 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos b) Calcular los intervalos de confianza para la media poblacional considerando los siguientes tamaños de muestra – para un nivel de confianza del 95% y una media muestral de $28: i. 64 ii. 100 iii. 1000 ¿Qué sucede con la amplitud de los intervalos a medida que se incrementa el tamaño de muestra?. ¿Qué justificación encuentra a esto?. Estimación por intervalos n 64 100 1000 zc 1.96 1.96 1.96 LI $ 25.18 $ 25.75 $ 27.64 LS $ 30.82 $ 30.25 $ 28.36 Amplitud del interv. $ 5.64 $ 4.5 $ 0.72 Mag. María del Carmen Romero 29 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos c) Presentar un informe al dueño de la librería con la estimación de un intervalo de confianza para la media poblacional considerando un riesgo del 5%. En dicho se informe se debe incluir información acerca: Límites del intervalo Tamaño de muestra Nivel de confianza y riesgo Explicación sencilla de los anteriores y del método empleado términos Estimación por intervalos Debido a la cercanía que tiene la librería al campus estatal y a que la mayoría de sus clientes son estudiantes de la universidad, el dueño está pensando en vender CDs educativos relacionados con cursos como estadística, cálculo y contabilidad. Para ello, a los mismos 64 clientes seleccionados, se les preguntó - además del gasto promedio mensual en la librería - si considerarían la compra de dichos CDs (48 de ellos respondieron que sí la considerarían). Estimar un intervalo de confianza del 90% de confianza para la proporción de la población de clientes que considerarían la compra de los CDs. Mag. María del Carmen Romero 30 Técnicas Cuantitativas para el Manag. y los Negocios - Clase 7 Segundo cuatrimestre - 2014 Estimación por intervalos Datos: Variable: “Proporción de clientes que tendrían en cuenta la compra de CDs” n = 64 p̂ = 48/64 = 0.75 Forma de la distribución: desconocida Estimación de un intervalo de confianza para la proporción poblacional: n ≥ 30 Por T. Central del Límite: ˆ ˆ /n y LS = pˆ + z c pq ˆ ˆ /n LI = pˆ − z c pq Mag. María del Carmen Romero 31