Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS LECTURA 05: INTERVALOS DE CONFIANZA Y TAMAÑO DE MUESTRA (PARTE I) TEMA 9: INTERVALOS DE CONFIANZA: INTRODUCCIÓN Y DEFINICIÓN 1. INTRODUCCION Actualmente se debe estar bien consciente de que las poblaciones son generalmente muy grandes como para ser estudiadas en su totalidad. Su tamaño requiere que se selecciones muestras las cuales se pueden utilizar para hacer inferencias sobre poblaciones. Por ejemplo si un gerente de una tienda minorista desea saber sobre sus ventas diarias promedios por cliente durante el año anterior, podría encontrar difícil calcular el promedio de las ventas a cientos o quizás miles de clientes que pasaron por la tienda. Seria muchos mas fácil estimar la media poblacional con la media de una muestra representativa. Hay dos tipos de estimadores que se utilizan más comúnmente para este propósito: un estimador puntual y un estimador por intervalo. Un estimador puntual utiliza un estadístico para estimar el parámetro en un solo valor o punto. El estimador puntual por ser un solo numero, no proporciona por si mismo información alguna sobre la precisión y confiabilidad de la estimación. Debido a la variabilidad de la muestra, nunca se tendrá que x . El estimado puntual nada dice sobre lo cercano que esta de . El gerente de la tienda puede seleccionar una muestra de n=500 clientes y halla el gasto promedio de x $120 , este valor sirve como estimación puntual para la media poblacional. Una alternativa para reportar un solo valor del parámetro que se esta estimando es calcular e informar todo un intervalo de valores factibles, un intervalo de confianza. El gerente puede decidir que la media poblacional esté entre $116 y $124. Tal intervalo con frecuencia va acompañado de una afirmación sobre el nivel de confianza que se da con exactitud. Por lo tanto se llama intervalo de confianza. En realidad hay tres niveles relacionados comúnmente con los intervalos de confianza: 99%, 95% y 90%. El gerente mencionado puede tener un 95% de confianza en que la media poblacional está entre $116 y $124. ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 1 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS 2. DEFINICION Es el rango dentro del cual se encuentra el parámetro desconocido con un nivel de confianza dado. correspondiente estadística q̂ , se trata de encontrar un intervalo [L1, L2] llamado Intervalo de Confianza que debe contener el parámetro con una probabilidad dada (1-) llamado nivel de confianza. En base a una muestra aleatoria y la Si ̂ es una estadística f( ̂ ) 1- /2 /2 ̂ L1 L2 θ fig. 11 El intervalo [L1, L2] es un intervalo aleatorio ya que sus extremos L 1, L2 llamados límites de confianza son variables cuyos valores varían de una muestra a otra. La Estimación Interválica consiste en calcular L 1, L2 dada una muestra aleatoria y un nivel de confianza (1-) y decir que se tiene confianza del 100 (1-) % que el intervalo contiene el valor desconocido . Por ejemplo: Si 1- = 0.95, se dice que se tiene una confianza del 95% que el intervalo contenga el valor desconocido ; o bien, de 100 intervalos aleatorios que se tomen 95 de las veces contendrá el parámetro y sólo 5 veces no lo contendrá. ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 2 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS TEMA 10: INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL HACIENDO USO DE LA ESTADISTICA Z Y T. 1. INTRODUCCIÓN Uno de los usos más comunes de los intervalos es estimar la media poblacional. Un fabricante puede querar estimar la producción mensual promedio de su planta, un representate de ventas puede estar interesado en estimar su comisión media anual ganada por captaciones, el jefe financiero de un banco puede estar interesado en estimar el ahorro mensual promedio de sus clientes en un año dado, etc. El número de circunstancias que se encuentran comunmente en el mundo de los negocios y que requiere de una estimación de la media poblacional es casi ilimitado. 2. DEFINICIÓN Es el rango dentro del cual se encuentra la media poblacional con un nivel de confianza dado. PL 1 L 2 1 1- /2 μ L1 /2 L2 fig. 12 Se presentan los siguientes casos: CASO I: Uso de la Estadística Z. i) Muestra grande (n 30), varianza poblacional conocida 2 y población normal o no. L1 = x - Z0 ´ s x = x - Z0 ´ s n L 2 = x + Z0 ´ s x = x + Z0 ´ s n ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 3 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS ii) 2 2 Muestra grande (n 30), varianza poblacional desconocida s y población normal o no. iii) L1 = x - Z 0 ´ s x = x - Z0 ´ s n L2 = x + Z0 ´ s x = x + Z0 ´ s n Muestra pequeña (n < 30), varianza poblacional conocida 2 y población normal. L1 = x - Z 0 ´ s x = x - Z 0 ´ s n L 2 = x + Z0 ´ s x = x + Z0 ´ s n CASO II: Uso de la Estadística t. Muestra pequeña (n < 30), varianza poblacional desconocida 2 s2 y población normal. L1 = x - t 0 ´ s x = x - t 0 ´ s n L2 = x + t 0 ´ s x = x + t 0 ´ s n Donde: t 0 t 1 / 2 , n -1 2. ERROR ESTÁNDAR DE LA MEDIA El error estándar es una medida de la dispersión de las medias de muestras alrededor de la media de la población. Si la dispersión disminuye (si se hace más pequeña), entonces los valores tomados por la media de la muestra tienden a agruparse mas cercanamente alrededor de . Y a la inversa, si la dispersión se incrementa (si se agranda), los valores tomados por la media de la muestra tienden a agruparse menos cercanamente alrededor de . Al disminuir el error estándar, el valor de cualquier media de muestra probablemente se acercara al valor de la población, lo que quiere decir que al disminuir el error estándar, se incrementa la precisión con que se puede usar la media de la muestra para estimar la media de la población. ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 4 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS Si el muestreo es con o sin reposición en una población infinita (o con sustitución en una población finita de tamaño N), el error estándar de la media muestral es: ( 2 conocida ) i) x n ii) s ( 2 desconocida ) n sx Si el muestreo es sin reposición en una población finita de tamaño N, el error estándar de la media muestra es: i) x Nn ( 2 conocida ) N 1 n ii) s x s Nn ( 2 desconocida ) N 1 n Donde: Nn es el factor de corrección para población finita. N 1 NOTA: Generalmente se utiliza el muestreo sin reposición en poblaciones infinitas y finitas de tamaño N Ejemplo 1: Se desea estimar el sueldo mensual promedio de los trabajadores de una Empresa “X” para ello se selecciona una muestra aleatoria de 40 trabajadores donde se obtiene que x = 720 soles y s = 9 soles . Obtener un intervalo de confianza para el sueldo promedio de todos los trabajadores con un nivel de confianza del 95%. Solución: a) Se desea estimar: μ: El sueldo mensual promedio poblacional de los trabajadores. b) Análisis: n = 40 (n>30) x = 720 soles s = 9 soles. ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 5 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS 2 2 Varianza poblacional desconocida s se estima a través de la muestra. Es decir si s = 9 soles entonces s 2 = 81 soles 2 Población no normal Para un nivel de confianza 1 – α = 0.95 Error estándar de la media muestral x es: sx = s = n Z O 1.96 9 = 1.42 40 c) Haremos uso de la estadística Z descrita en el Caso I – ii: d) Hallando el intervalo de confianza: s 9 L1 = x - Z0 ´ = 720 - 1.96 ´ n 40 s 9 L 2 = x + Z0 ´ = 720 + 1.96 ´ n 40 L1 = 720 - 1.96 ´ 1.42 L 2 = 720 - 1.96 ´ 1.42 L1 = 720 - 2.78 = 717.22 soles L 2 = 720 + 2.78 = 722.78 soles e) Interpretación: El sueldo mensual promedio de los trabajadores varia entre 717.22 soles y 722.78 soles con una confianza del 95%. Ejemplo 2: El gerente de una cadena de tiendas de ropa desea el número de clientes que realizan compras, para esto selecciona una muestra al azar entre todas las cadenas de tiendas donde obtuvo los siguientes resultados respecto al número de clientes: 907, 926, 506, 741, 789, 889, 874, 510, 529, 420 Si se supone que la variable número de clientes se distribuye normalmente con varianza 40000 clientes2 . Hallar el intervalo de confianza del 95% para el número de clientes promedio que realizan compras. ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 6 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS Solución: a) Se desea estimar: μ: El número de clientes promedio de clientes que realizan compras. b) Análisis: ● n=10 (n<30) x = 709.1 clientes ( Varianza poblacional conocida s = 40000 clientes 2 2 ), entonces la desviación estándar es s = 200 clientes. Población normal. Para el nivel de confianza 1 – α = 0.95 Error estándar de la media muestral x : sx = Z O 1.96 s 200 = = 63.24 clientes n 10 c) Haremos uso de la estadística Z descrita en el Caso I - iii d) Hallando el intervalo de confianza: s 63.24 L1 = x - Z0 ´ = 709.1 - 1.96 ´ n 10 s 63.24 L 2 = x + Z0 ´ = 709.1 + 1.96 ´ n 10 L1 = 709.1 - 1.96 ´ 19.20 L 2 = 709.1 - 1.96 ´ 19.20 L1 = 709.1 - 37.63 = 671.47 @ 671 clientes L 2 = 709.1 + 37.63 = 746.73 @ 747 clientes e) Interpretación: Con una confianza del 95% el número de clientes promedio que realizan compras en las tiendas varia entre 671 y 747 clientes. ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 7 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS Ejemplo 3: Se desea estimar el gasto medio mensual de consumo de teléfono para ello se elige una muestra aleatoria de 81 clientes de Telefónica S.A., obteniéndose una media x 250 soles y una desviación estándar s 16 soles . Obtener un intervalo de confianza del 90% para µ. Solución: a) Se desea estimar: μ: El gasto medio mensual de consumo de teléfono en soles. b) Análisis: ● x = 250 soles n = 81 (n>30) s = 16 soles. Varianza poblacional desconocida (s2 @ s 2 ) se estima a través de la muestra. Es decir si s = 16 soles entonces s 2 = 256 soles 2 Población normal. Para el nivel de confianza 1 – α = 0.90 ZO = 1.645 El error estándar de la media muestral sx = es: s 16 = = 1.78 n 81 c) Haremos uso de la estadística Z descrita en el Caso I – ii d) Hallando el intervalo de confianza: ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 8 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS s = 250 - 1.645 ´ n s L 2 = x + Z0 ´ = 250 + 1.645 ´ n L1 = x - Z0 ´ 16 81 16 81 L1 = 250 - 1.645 ´ 1.78 L 2 = 250 - 1.645 ´ 1.78 L1 = 250 - 2.93 = 247.07 soles L 2 = 250 + 2.93 = 252.93 soles e) Interpretación: Con una seguridad del 90% el gasto medio mensual de consumo mensual varía entre 247.07 soles y 252.93 soles. Ejemplo 4: Con el fin de medir el rendimiento de una máquina (N° de unidades producidas), se toma una muestra y se obtiene los siguientes resultados: 20, 24, 22, 22, 21, 27, 25. Si sabe que el rendimiento sigue una distribución normal. Encontrar un intervalo de confianza del 99% para el rendimiento medio. Solución: a) Se desea estimar: μ: Tiempo medio poblacional de ejecución en milisegundos de un programa. b) Análisis: x = 23 unidades n=7 (n<30) s = 2.45 unidades 2 2 Varianza poblacional desconocida s se estima a través de la muestra. 2 2 Es decir s = 2.45 unidades entonces s = 6.00 unidades Población normal. t O = t 0.995,6 = 3.707 Para el nivel de confianza 1 – α = 0.99 El error estándar de la media muestral x es: ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 9 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS sx = s 23 = = 8.69 n 7 c) Haremos uso de la estadística t: d) Hallando el intervalo de confianza: s 2.45 = 23 - 3.707 ´ n 7 s 2.45 L2 = x + t 0 ´ = 23 + 3.707 ´ n 7 L1 = x - t 0 ´ L1 = 23 - 3.707 ´ 0.93 L 2 =@ 23 - 3.707 ´ 0.93 L1 = 23 - 3.45 = 19.55 @ 20 unidades L 2 = 23 + 3.45 = 26.45 @ 26unidades e) Interpretación: El rendimiento medio de la máquina varía entre 20 y 26 unidades con una confianza del 99%. Ejemplo 5: En una empresa distribuidora de productos informáticos trabajan 500 personas. Un estudio realizado sobre un tamaño de muestra de 30 trabajadores demostró que el sueldo anual promedio era $450, con una desviación estándar de $50. Estime el sueldo anual promedio de todos los trabajadores de la empresa con un nivel de confianza del 95%. Solución: a) Se desea estimar: μ: Sueldo anual promedio de todos los trabajadores. ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 10 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS b) Análisis: x $450 n=30 s $50 Varianza poblacional desconocida 2 s 2 es estima a través de la muestra. Es decir s = 50 $ entonces s = 250$ Población normal. Se tiene una población finita de tamaño N=500, entonces El error estándar de la 2 2 media muestral x es: sx s Nn 50 500 30 8.86 N 1 500 1 n 30 c) Haremos uso de la estadística Z descrita en el Caso I - ii: d) Hallando el intervalo de confianza: L1 = x - Z0 ´ s ´ n N-n 45 500 - 30 = 450 - 1.96 ´ ´ N -1 500 -1 30 L 2 = x + Z0 ´ s ´ n N-n 45 500 - 30 = 450 + 1.96 ´ ´ N -1 500 - 1 30 L1 = 450 - 1.96 ´ 8.86 L 2 = 450 - 1.96 ´ 8.86 L1 = 450 - 17.37 = $432.63 soles L 2 = 450 + 17.37 = $467.63 soles e) Interpretación: El sueldo anual promedio de todos los trabajadores varía entre $432.63 y $467.37 con una confianza del 95%. ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 11 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS TEMA 11: TAMAÑO DE MUESTRA CUANDO EL PARAMETRO ES LA MEDIA POBLACIONAL USANDO EL MUESTREO ALEATORIO SIMPLE 1. CALCULO DEL TAMAÑO MUESTRAL USANDO EL MUESTREO ALEATORIO SIMPLE Característica de la Población Tamaño de la población infinita o desconocido. Tamaño de la población finita. Tamaño de la muestra Z12 2 2 n e2 Z12 2 2 N n 2 Z 2 e 2 ( N 1) Donde: n N Tamaño de la muestra. Tamaño de la población. Valor correspondiente a la distribución de Gauss Z1-/2 Z0.975 = 1.96 para = 0.05 y Z0.995 = 2.576 para = 0.01. (Utilizar Tabla II). Valor de la varianza poblacional. En caso de no conocerse se estima por la varianza muestral (s2) a través de una muestra e piloto Error que se prevé cometer. e L1 m L2 x fig. 13 Ejemplo 6: Una muestra de 1225 familias reveló un gasto semanal de promedio de 250 soles y una desviación estándar de 30 soles. ¿Cuál deberá ser el tamaño mínimo de la muestra para un error máximo semanal de 4 soles, para un nivel de confianza del 99%? Solución: La desviación estándar se ha obtenido a través de una muestra entonces: ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 12 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS s=30 soles. Para el nivel de confianza 1 – α = 0.99 e = 4 soles. La población es infinita o desconocida. Z0.975 = 2.576 La formula a utilizar será la siguiente: n= n= Z12 2 2 ´ s2 e (2.5.76) 2 ´ (30) 2 (4) 2 n = 373.3 @ 373 familias Ejemplo 7: Una muestra aleatoria de los salarios en soles por hora para nueve trabajadores es: 10.5, 11, 9.5, 12, 10, 11.5, 13, 9, 8.5. El muestro se realizó sobre una población distribuida normalmente y se desea calcular un intervalo de confianza para el salario promedio de los trabajadores. Hallar el tamaño mínimo que debe tener la muestrea para que con un nivel de confianza del 95%, el error de estimación no supere a los 0.3 soles, en una población de 600 trabajadores. Solución: La desviación estándar es desconocida y se ha obtiene a través de la muestra: s = 1.47 soles ´ hora Para el nivel de confianza 1 – α = 0.95 tener una muestra menor que 30 datos. e = 0.3 soles. La población es finita de tamaño N=600 trabajadores. t 0.95,8 = 1.86 . Se utiliza la estadística t por La formula a utilizar será la siguiente: n= t12-a 2 ´ s 2 ´ N t12-a 2 ´ s2 + e2 ´ (N - 1) ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 13 Universidad Los Ángeles de Chimbote CURSO ESTADÍSTICA APLICADA FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS n= (1.86) 2 ´ (1.47) 2 ´ 600 (1.86) 2 ´ (1.47) 2 + (0.3) 2 ´ (600 - 1) n = 76.03 @ 76 trabajadores. Ejemplo 8: Se quiere hacer una encuesta para estimar el tiempo promedio por semana que los niños utilizan la Internet. Por estudios anteriores se sabe que la desviación estándar de dicho tiempo es de 2.5 horas, con un nivel de confianza del 95% ¿Qué tamaño de muestra se debería elegir si el error de estimación puntual no es superior a media hora, si se población de 500 niños de un colegio “X”? Solución: La desviación estándar es conocida se ha obtenido a través de la población. 2.5 horas. Para el nivel de confianza 1 – α = 0.95 e 0.5 horas. Z 0.975 1.96 La población es infinita o desconocida. La formula a utilizar será la siguiente: n Z12 2 2 N Z12 2 2 e 2 ( N 1) 1.96 2 2.5 2 500 n 1.96 2 2.5 2 0.5 2 (500 1) n 81 niños. ___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Setiembre 2010 Versión :2 14