- ACREDITADA POR ACCREDITATION COUNCIL FOR BUSINESS SCHOOLS AND PROGRAMS (ACBSP), EUROPEAN COUNCIL FOR BUSINESS EDUCATION (ECBE) Y AXENCIA PARA A CALIDADE DO SISTEMA UNIVERSITARIO DE GALICIA (ACSUG) ESCUELA PROFESIONAL DE CONTABILIDAD Y FINANZAS MANUAL: MÉTODOS CUANTITATIVOS I CICLO III SEMESTRE ACADÉMICO 2013- I – II Material didáctico para uso exclusivo de clase. LIMA - PERÚ 1 UNIVERSIDAD DE SAN MARTIN DE PORRES RECTOR ING. JOSÉ ANTONIO CHANG ESCOBEDO VICE RECTOR ING. RAÚL EDUARDO BAO GARCÍA FACULTAD DE CIENCIAS CONTABLES, ECONÓMICASY FINANCIERAS DECANO DR. DOMINGO FÉLIX SÁENZ YAYA DIRECTOR DE LA ESCUELA PROFESIONAL DE CONTABILIDAD Y FINANZAS DR. JUAN AMADEO ALVA GÓMEZ DIRECTOR ESCUELA DE ECONOMÍA DR. LUIS CARRANZA UGARTE DIRECTOR DEL DEPARTAMENTO ACADÉMICO DE CONTABILIDAD, ECONOMÍA Y FINANZAS DR. LUIS HUMBERTO LUDEÑA SALDAÑA DIRECTOR DE LA SECCIÓN DE POSTGRADO DR. AUGUSTO HIPÓLITO BLANCO FALCÓN DIRECTOR DE LA OFICINA DE GRADOS Y TÍTULOS DR. VICTOR LORET DE MOLA COBARRUBIA DIRECTOR DE LA OFICINA DE EXTENSIÓN Y PROYECCIÓN UNIVERSITARIA DR. REYNALDO ULADISLAO BRINGAS DELGADO DIRECTOR DEL INSTITUTO DE INVESTIGACIÓN DR.SABINO TALLA RAMOS SECRETARIO DE FACULTAD DR. LUIS ANTONIO CUEVA ZAMBRANO JEFE DE LA OFICINA DE REGISTROS ACADÉMICOS SRA. BELINDA MARGOT QUICAÑO MACEDO JEFE DE LA OFICINA DE BIENESTAR UNIVERSITARIO LIC. MARÍA RICARDINA PIZARRO DIOSES JEFE DE LA OFICINA DE ADMINISTRACIÓN Mo. ABOG. LUIS FLORES BARROS COORDINADOR ACADÉMICO DE LA ESCUELA PROFESIONAL DE CONTABILIDAD Y FINANZAS TURNO MAÑANA DRA. YOLANDA MAURINA SALINAS GUERRERO COORDINADOR ACADÉMICO DE LA ESCUELA PROFESIONAL DE CONTABILIDAD Y FINANZAS TURNO NOCHE DR. ANTONIO AMILCAR ULLOA LLERENA COORDINADOR ACADÉMICO DE LA ESCUELA PROFESIONAL DE ECONOMÍA TURNO MAÑANA Y NOCHE MG. RENZO JAIR VIDAL CAYCHO COORDINADOR DE LA SECCIÓN DE POSTGRADO DE CONTABILIDAD Y FINANZAS DR. CRISTIAN YONG CASTAÑEDA COORDINADOR DE LA SECCIÓN DE POSTGRADO DE ECONOMÍA DR. VICTOR LORET DE MOLA COBARRUBIA 2 DERECHOS RESERVADOS El texto de este trabajo o parte del mismo, no puede ser reproducido o transmitido por métodos o forma alguna, sean estos electrónicos o mecánicos, incluyendo copias fotostáticas, cintas magnetofónicas, acumulación en un sistema de información con memoria, Internet u otra forma, sin autorización escrita dela Escuela Profesional de Contabilidad y Finanzas. FCCEF. USMP. Si desea un ejemplar, gestiónelo en la Facultad de Ciencias Contables, Económicas y Financieras de la Universidad de San Martín de Porres. 3 INTRODUCCIÓN El presente manual contiene el desarrollo teórico-práctico del sílabo de la asignatura de Métodos Cuantitativos I del III Ciclo de la Facultad de Ciencias Contables, Económicas y Financieras, ESCUELA PROFESIONAL DE CONTABILIDAD Y FINANZAS de la USMP. Tiene como meta principal: Combinar las bases teóricas y prácticas de los instrumentos metodológicos cuantitativos en cada proceso de la Estadística Descriptiva e Inferencial, establecer la relación coherente de las formas analíticas, aplicativas y por computadora en la gestión empresarial, y así apreciar sus efectos en la formación del educando. Mediante el aprendizaje de los temas listados en la sumilla de la asignatura, aplicados a la gestión empresarial, el educando al término del desarrollo por competencias, logrará interpretar los resultados, y tomará las decisiones pertinentes de los problemas que se le presenten, haciendo uso del software estadístico, fundamental en el ejercicio profesional del Contador Público, así como en la práctica de áreas conexas, como son La Administración, La Economía y La Ingeniería aplicadas a las ciencias de la empresa. El presente Manual de Métodos Cuantitativos I, está organizado en cuatro unidades didácticas : Unidad I Estadística Descriptiva ; Unidad II: Probabilidades – Distribución de Probabilidades; Unidad III: La Distribución Normal – Distribución de la Media Muestral, Muestreo y Unidad IV Estimación con Intervalos de Confianza, Prueba JI CUADRADA ,Prueba de Hipótesis , donde se interpretarán los resultados de los problemas resueltos , se proponen problemas aplicados a la contabilidad, para que los alumnos puedan desarrollarlos e interpretarlos, para tomar las decisiones pertinentes . Cabe mencionar que al finalizar cada Tema de estudio, se presenta el Taller y Software Estadístico, donde los alumnos pueden complementar la parte teórica y práctica, así como el uso de la computadora y multimedia con los programas estadísticos MINITAB Y SPSS respectivos. 4 ÍNDICE PORTADA INTRODUCCIÓN INDICE DE CONTENIDO OBJETIVOS PAUTAS PARA EL ESTUDIO Y LOS TRABAJOS DE APLICACION UNIDAD I : ESTADÍSTICA DESCRIPTIVA TEMA 1: RECOLECCION Y PRESENTACIÓN DE DATOS 1. Concepto de los métodos cuantitativos, naturaleza 2. toma y presentación de datos, procedimiento 3. tablas y gráficas de frecuencias ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES 9-26 TEMA 2 : MEDIDAS DE TENDENCIA CENTRAL 30-38 1. Concepto, métodos, procedimientos y técnicas para desarrollar las Medidas de tendencia central ó de posición de los datos 2. La Media, Mediana, Moda ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES TEMA 3 DATOS AGRUPADOS Y NO AGRUPADOS 39-48 1. Concepto, métodos y aplicaciones de: Cuartiles.- Deciles.- Percentiles. 2. Media Geométrica.- Media Armónica.- Media Cuadrática ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES TEMA N° 4 : MEDIDAS DE DISPERSIÓN O VARIACIÓN DE LOS DATOS 1. El Rango y La Desviación Media 2. La Varianza y la Desviación Estándar ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES 49-60 UNIDAD II : PROBABILIDAD Y DISTRIBUCIÓN DE PROBABILIDADES TEMA N° 5 EVENTOS MUTUAMENTE EXCLUYENTES Y NO EXCLUYENTES 1. Concepto, Análisis y Aplicación de Probabilidades 2. Adición de Probabilidades ACTIVIDADES APLICATIVAS 61-67 5 AUTOEVALUACION REFERENCIAS DOCUMENTALES TEMA N°6 MULTIPLICACIÓN DE PROBABILIDADES 1. Probabilidad Condicional 2. Eventos Dependientes e Independientes 3. Teorema de Bayes ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES 67-73 TEMA N° 7 DISTRIBUCION DE PROBABILIDADES 1. Concepto de Distribución de Probabilidades 2. Esperanza Matemática ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES 75-76 TEMA N° 8 DISTRIBUCION BINOMIAL 1. Concepto de Distribución Binomial 2. Uso de las Tablas de Distribución Binomial ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES 76-79 TEMA N° 9. DISTRIBUCIÓN POISSON 1. ¿Qué es la Distribución de Poisson 2. Uso de las Tablas de Distribución de Poisson ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES 79-84 UNIDAD III. DISTRIBUCIÓN PARA VARIABLES CONTINUAS TEMA N° 10 DISTRIBUCION NORMAL 1. ¿Qué es la Distribución Normal? 2. Uso de las Tablas de Distribución Normal ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES 85-89 TEMA N° 11 DISTRIBUCION DE LA MEDIA MUESTRAL 1. Error Estándar 2. Factor de Corrección ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES 90-94 6 TEMA N° 12 DISTRIBUCIÓN DE LAS PROPORCIONES 1. Proporción Muestral de Éxitos 2. Error Estándar de la Proporción ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES 94-99 UNIDAD IV: ESTIMACIONES CON INTERVALOS DE CONFIANZA, PRUEBA DE HIPÓTESIS TEMA N°13 INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL 1. Definición de Intervalos de Confianza 2. Estimación Puntual ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES TEMA N° 14 DISTRIBUCIÓN T DE STUDENT 1. Requisitos para usar la Distribución t 2. Uso de las Tablas t ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES 100-103 103-105 TEMA N° 15 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES 105-109 1. ¿Qué es IC para la Diferencia entre dos medias Poblacionales? 2. Error Estándar para la Diferencia entre dos medias Poblacionales ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES TEMAN°16 PRUEBA DEHIPÓTESIS – PRUEBA JI CUADRADA 110-137 1. Aceptar la Hipótesis Nula 2. Rechazo de la Hipótesis Nula 3. Nivel de Significancia ACTIVIDADES APLICATIVAS AUTOEVALUACION REFERENCIAS DOCUMENTALES Tablas estadísticas Ejercicios y Problemas Adicionales 7 OBJETIVOS OBJETIVO GENERAL - Contribuir a la formación integral profesional de los futuros Contadores, propiciando el conocimiento de los Métodos Cuantitativos (Estadística I) para aplicarlos en las actividades educativas y profesionales. OBJETIVOS ESPECÍFICOS - Dominar la recolección que datos estadísticos directamente de la comunidad y de registros de su especialidad y áreas conexos. Ordenar y analizar datos estadísticos en distribuciones de frecuencias y presentarlos en diversos tipos de diagramas. Calcular las medidas de tendencia central y de dispersión de datas e interpretar estos resultados. Calcular la probabilidad de eventos naturales y de la empresa con fines de proyección. Analizar los diversos tipos de distribución de probabilidad de datos de su especialidad. Aplicar el muestreo de datos al estudio, análisis y cambios en la empresa. Hacer estimaciones puntuales y de intervalos de confianza así como pruebas de hipótesis en poblaciones finitas e infinitas. PAUTAS PARA APLICACIÓN EL ESTUDIO Y LOS TRABAJOS DE Después de la lectura comprensiva efectuada, deberás desarrollar las Actividades de Aplicación (guías de Práctica) propuestas en el manual, Algunos trabajos son individuales y otros son para desarrollarse en grupos. Pueden ser desarrollados en aula, o requerir efectuarlo en el laboratorio de computo (Software Estadístico) ambas modalidades fortalecen la capacidad de autoaprendizaje del estudiante. También deberás resolver los problemas planteados en la Autoevaluación, desarrollo de las Guías de Prácticas (talleres) indicadas por el profesor. Si tuvieras dificultad consulta a tu profesor, compañero o efectúa la investigación conveniente. 8 METODOS CUANTITATIVOS I ESTADÍSTICA DESCRIPTIVA PROBABILIDAD Y DISTRIBUCIÓN DE PROBABILIDADES DISTRIBUCIÓN PARA VARIABLES CONTINUAS ESTIMACIÓN CON INTERVALOS DE CONFIANZA PRUEBA DE HIPÓTESIS 9 UNIDAD I: ESTADÍSTICA DESCRIPTIVA La rama de la disciplina estadística que se ocupa del desarrollo y utilización de técnicas para la presentación eficaz de información numérica , con objeto de poner de relieve los modelos que de otra forma quedarían ocultos en un conjunto de datos ,se llama estadística Descriptiva. CONTENIDOS PROCEDIMENTALES Elabora Tablas de frecuencias para muestras discretas y continuas. Elabora Gráficas de frecuencias reconoce e identifica la situación problemática de dichas medidas. Formula preguntas relacionadas con el uso de las medidas de tendencia central y de dispersión., intentan explicar los usos actuales. Resuelve problemas estadísticos aplicados a la contabilidad. CONTENIDOS ACTITUDINALES Valora adecuadamente la utilidad de presentar e interpretar los datos Acepta y toma parte con Eficiencia de los grupos asignados en actitud de Ayuda mutua y responsabilidad. Desarrolla en forma personal su trabajo del Software estadístico asignado CONTENIDOS CONCEPTUALES TEMA N°1: RECOLECCION Y PRESENTACIÓN DE DATOS TEMA N°2: MEDIDAS DE TENDENCIA CENTRAL TEMA N°3: DATOS AGRUPADOS Y NO AGRUPADOS TEMA N°4: MEDIDAS DE DISPERSIÓN O VARIACIÓN DE LOS DATOS 10 ESTADÍSTICA DESCRIPTIVA RECOLECCIÓN Y PRESENTACIÓN DE DATOS GRÁFICAS MEDIDAS DE TENDENCIA CENTRAL MEDIDAS DE DISPERSIÓN Ó VARIACIÓN DE LOS DATOS COEFICIENTES DE VARIACIÓN Y DE ASIMETRÍA 11 TEMA N° 01 RECOLECCION Y PRESENTACIÓN DE DATOS PRESENTACIÓN DE LA INFORMACIÓN. Estadística es un término que es usado con mucha frecuencia para hacer referencia a cualquier información o dato; sin embargo, la estadística es mucho más que la simple colección de información ya que involucra todo un conjunto de procesos, que tiene como objeto alcanzar un mayor conocimiento de una realidad que es desconocida y sobre la cual se desea tomar decisiones. ORGANIGRAMA DE LA PRIMERA UNIDAD INTRODUCCIÓN AL ANÁLISIS DE DATOS PRESENTACIÓN DE LA INFORMACIÓN ROL DE LA ESTADÍSTICA Definiciones DESCRIPCIÓN DE LOS CONJUNTOS DE DATOS Importancia Del Muestreo Población Parámetros Muestras Distribución De Frecuencias Estadística Descriptiva Estadística Inferencial Tablas Estadísticas Distribución De Frecuencias Relativas Diseño Tallo y Hoja Visualización Grafica Histograma Polígono de Frecuencias Distribución De Frecuencias Acumuladas Ojivas Variables Continua Distribución De Frecuencias Relativas Acumuladas Diagrama de Barras Grafica de Pastel Circulares Discretas Grafica Pictogramas 12 ¿ALGUNA VEZ SE ENCONTRÓ CON EL HOMBRE “PROMEDIO”? Peruano? Amable, su nombre es Roberto ( lo cual es el nivel nominal de medición), tiene 30 años de edad ( que es el nivel de razón o cociente), tiene 1.82m de estatura, pesa 79Kg., usa zapatos talla 42, tiene una cintura de 65 cm., viste un traje talla mediana. Además, tal hombre promedio come 1.5 Kilos de papas fritas, ve 2230 hrs. De televisión., recibe 470 piezas de correo y come 13 Kilos de plátanos al año. También duerme 7.5 horas por noche. ¿Realmente este es un hombre promedio? ó sería mejor referirnos a él como un hombre “ típico “ ¿ Esperaría encontrar a un hombre con todas estas características?. Actualmente, las empresas efectúan diversas transacciones locales e internacionales como venta de líneas completas, diversidad de productos, contratos de personal, diferencia de precios. A las Empresas les gustaría desarrollar gráficas y cuadros que se puedan revisar mensualmente para observar en donde tienden a acumularse los precios de venta, apreciar la variación de los precios de venta y notar cualquier tendencia, en este tema se presentan técnicas que serán útiles para que las personas, empresas y entidades puedan utilizarlas. 1.1 GENERALIDADES (CONCEPTOS BÁSICOS) Algunos de los conceptos más usados en la aplicación de la estadística se describe a continuación: Población Es la totalidad de individuos sobre los cuales se desea hacer un estudio; puede ser finita o infinita. Es el conjunto de todas las unidades que tienen una característica común, la cual se desea estudiar. Por ejemplo: Conjunto de familias de una ciudad. Conjunto de bombillas eléctricas producidas en un día. Muestra Muestra: es una parte de la población, seleccionada para hacer el estudio de dicha población; es finita. Si la muestra es representativa de la población, las conclusiones de la muestra se infieren a la población. Es cualquier subconjunto de unidades elementales, elegidas de una población. Por ejemplo: 200 familias elegidas de una cuidad. 80 bombillas eléctricas elegidas de las producidas en un día. Dependiendo de la forma como se eligen dichas unidades elementales, las muestras pueden ser: 13 Muestras Aleatorias ( Probabilísticas ) Son aquellas cuyos elementos son elegidos usando algún criterio probabilístico. Parámetro Es una función de todas las observaciones de una población. Un parámetro resume la información contenida de las observaciones que comprenden a una población, por lo cual su valor es único y constituye usualmente la incógnita que todo investigador desea conocer. Algunos de los parámetros que estudiaremos son: Media Poblacional, cuya notación es : Varianza Poblacional, cuya notación es: 2 Moda Poblacional, cuya notación es: Mo 1.2. DEFINICIÓN DE ESTADÍSTICA Estadística.- es la ciencia que estudia los métodos científicos en la toma, organización, presentación y análisis de datos, para la deducción de conclusiones y/o toma decisiones razonables. Estadística es la ciencia que se ocupa de la creación, desarrollo y aplicación de las técnicas que permiten hacer un análisis confiable de una población. En términos generales, se ocupa de la colección, resumen y presentación de información, del análisis e interpretación de datos y resultados, de modo tal que pueda evaluarse la confiabilidad y riesgos asociados a las condiciones que se pueden derivar a partir de la información captada. Las dos grandes ramas en que se divide a la estadística son: A. Estadística Descriptiva Es la parte de la estadística que estudia un grupo de datos dado, sin inferir sus conclusiones a un grupo mayor. B. Estadística Inferencialo inductiva es la parte de la estadística que estudia condiciones bajo las cuales las conclusiones de la muestra son vàlidas para la población, la Estadìstica inferencial usa el concepto de PROBABILIDAD, que es la medida de la incertidumbre. IMPORTANCIA DE LA ESTADÍSTICA EN CONTABILIDAD La estadística es un soporte en las siguientes acciones profesionales: . Recolección, Organización, Presentación y Análisis de datos de la especialidad (costos, precios, salarios, impuesto, etc.) . Planificación en la alta dirección de las empresas, según los resultados de la estadística. . Control de la ejecución de lo planificado según la estadística de resultados. 14 . Toma de decisiones y Gestión empresarial según los resultados de la estadística. . Investigación de temas de la especialidad. 1.3. TOMA DE DATOS Variable La variable es una característica de la población que se va a investigar y puede tomar diferentes valores. Se clasifican en: cualitativas y cuantitativas. Variable Cualitativa Se denomina así cuando está asociada a una característica cualitativa que toma niveles de valorización. Variable Cuantitativa Se llama así cuando está asociada a una característica cuantitativa. Estas variables se divide en discretas y continuas. Variable Discreta Se dice que una variable es discreta si sólo asume valores enteros o mejor dicho que varían de uno en uno, Ejm: El número de miembros de una familia o el número de personas que habitan la casa; el número de alumnos aprobados en una asignatura. Variable Continua Una variable es continua cuando puede tomar cualquier valor dentro de un intervalo, dependiendo éste principalmente de la precisión con que se trabaje. Por Ejm: La talla de los individuos medida con la precisión de un centímetro y expresada en metros: 1,69 m; 1,74 m; etc. REDONDEOS DE DATOS. Se usa generalmente para uniformizar datos de variable continua , aproximando a una determinada cifra: milésimas, centésimas, décimas, unidades, decenas, centenas, millares, millones, etc. Con el fin de minorizar los errores, sobre todo cuando con los datos se van a efectuar operaciones. Técnica: . Si la cifra a eliminar es 0, 1, 2, 3,4: se desecha la cifra . Si la cifra a eliminar es 6, 7, 8, 9: se desecha la cifra y se aumenta en una unidad la cifra de orden superior. 15 . Si la cifra a eliminar es 5: se aplica el criterio del “par más cercano”. -Si el digito precedente es par, este no se modifica. -Si el dígito precedente es impar, este será aumentado en una unidad. Ejem: E1. 47.340 => 47.34 E2. 7.730 => 7.73 47.341 47.34 7.731 7.73 47.342 47.34 7.732 7.73 47.343 47.34 7.733 7.73 47.344 47.34 7.734 7.73 47.345 47.34 7.735 7.74 47.346 47.35 7.736 7.74 47.347 47.35 7.737 7.74 47.348 47.35 7.738 7.74 47.349 47.35 7.739 7.74 47.350 47.35 7.740 7.74 E3. Elimina la última cifra 72.8 =>73 72.814 =>72.81 183.575 =>183.58 Toma o recolección de datos: es la obtención de datos tal como se encuentran en la realidad. Puede ser directamente de la realidad, mediante conteos o medicines, o de archivos, formatos,…….., encuestas, experimentos, etc. Ordenación: es la colocación de los datos en orden creciente, decreciente, u otro criterio necesario para el trabajo final. Rango: es la diferencia entre el dato mayor y el dato menor. Ejemplos de Toma de Datos Ejemplo Nº 1 Corresponde a una muestra de 30 familias sobre el número de hijos por familia: A = {1,2,5,3,4,2,0,5,3,2,4,2,1,0,3,2,1,0,3,2,1,0,1,3,5,6,2, 5,4,2,} Generalizando: A = {x1, x2, x3, .................. xi .................., xn } En este caso se tiene que n = 30. Tamaño de la muestra. Ejemplo Nº2 Corresponde a una muestra de 100 observaciones sobre las tallas de los alumnos, expresada en metros: 16 B= 1,60 1,78 1,65 1,78 1,69 1,60 1,71 1,71 1,70 1,59 1,70 1,74 1,69 1,77 1,70 1,63 1,75 1,70 1,72 1,58 1,55 1,65 1,59 1,69 1,71 1,64 1,74 1,72 1,76 1,61 1,68 1,63 1,68 1,71 1,76 1,65 1,71 1,79 1,75 1,65 1,72 1,55 1,70 1,70 1,71 1,68 1,70 1,78 1,70 1,69 1,70 1,68 1,73 1,75 1,72 1,70 1,69 1,82 1,71 1,71 1,63 1,69 1,74 1,76 1,74 1,70 1,68 1,80 1,69 1,75 1,76 1,74 1,76 1,77 1,69 1,72 1,73 1,79 1,68 1,74 1,54 1,80 1,75 1,68 1,58 1,75 1,72 1,71 1,60 1,70 1,71 1,66 1,69 1,64 1,59 1,58 1,74 1,71 1,62 1,78 En este caso n = 100. Tamaño de la muestra. PRESENTACIÓN DE LA INFORMACIÓN Distribución de frecuencias: es distribuir los datos en clases, determinando el número de datos pertenecientes a cada clase, denominado frecuencia de clase (f). Ejem: Las alturas de 100 estudiantes, registradas con aproximación de pulgadas. Clases (Alturas) 60 – 62 63 – 65 66 – 68 69 – 71 72 - 74 Frecuencia(f) (Nº de estudiantes) 5 18 42 27 8 N = 100 Para determinar el número de clases hay varios criterios. . generalmente varían de 5 a 20 dependiendo de los datos. . Nº de clases = √n . Nº de clases =1+3.322 log N . Intervalos de clases y limites de clase. 60 – 62 es el intervalo de clases y 60,62 son los limites de clases . Marca de clases. (x) Es el punto medio del intervalo de clase. Se obtiene como la semi- suma de los límites de clases. 17 los datos de cada clase se consideran que coincide correspondiente marca de clases. - con su . Procedimientos para formar una distribución de frecuencia. - Se determina al rango. - se divide el rango en un numero conveniente de intervalos (5 a 20) o usando alguno de los criterios mencionados. - se determina el tamaño del intervalo y las clases con C =_____R_____ Nº de clases - se determina las marcas de clase Ejem: Sean las alturas en cm. De 40 alumnos 1.2.- 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144 168 126 138 176 163 119 154 165 146 173 142 147 135 140 135 161 145 135 142 150 156 145 128 153 R= 176 – 119 = 57 Nº de clases = √N = √ 40 = 6.3 = 6 ; tamaño del int. C =_____R_____ Nº de clases = 9.5 Para facilitar la construcción de la tabla de frecuencias, por comodidad de cálculo se eligió el tamaño del intervalo de 10. 3.Clases Conteo 118 -127 128 - 137 138 - 147 184 - 157 158 – 167 168 - 177 III IIIII I IIIII IIIII IIII IIIII IIII IIIII III Frecuencia (f)Nº niños 3 6 14 9 5 3 Nº 40 x fR 122.5 7.5 % 132.5 15.0% 142.5 35.0% 152.5 22.0% 162.5 12.5% 172.5 7.5% 100.0% fA fAR 3 9 23 32 37 40 7.5% 22.5% 57.5% 50.0% 92.5% 100.0% 18 Histograma, polígonos y curvas de frecuencia Histograma: rectángulos de bases en el eje x , sus centros coinciden con los marcas de clases y de longitud igual , cada altura igual a su frecuencia f Polígonos Frecuencia: Se obtiene uniendo los puntos medios de las bases superiores de los rectángulos del histograma y dos mascas de clases inferior y superior de frecuencia cero. Curvas de frecuencia: se obtiene suavizando los vértices de polígonos de frecuencia Frecuencia relativas (fR): fR = __f__ x 100 % N Frecuencia Acumulada (FA): FA = f1 + f2 +…………….fn Frecuencia Acumulada Relativa (FAR): FAR =__ f A __ x 100 % N Fig. 1.1 Histograma y Polígono de Frecuencias f 15 12 9 6 3 0 112,5 122,5 132,5 142,5 152,5 162,5 172,5 Marcas de Clase 19 Distribución de Frecuencia de una Muestra Discreta La tabla de distribución de frecuencias que corresponde al ejemplo Nro. 1 es el siguiente: Clases X 0 hijos 1 hijo 2 hijos 3 hijos 4 hijos 5 hijos 6 hijos Conteo IIII IIIII IIIIIIII IIIII III IIII I Frecuencia f f1 = 4 f2 = 5 f3 = 8 f4 = 5 f5 = 3 f6 = 4 f7 = 1 f= n = 30 k=7 Metodología. podemos utilizar la siguiente . Primero se determina el número de clases, de acuerdo a los datos que se disponen, en este caso son 7 datos diferentes. . En la primera columna se ordena en forma ascendente los datos u observaciones que son diferentes. . La segunda columna se utiliza para realizar el conteo de los datos que se repiten (frecuencia) . En la tercera columna, se indica el número de veces (frecuencia) que se repite una clase. Procedimiento alterno para Construir la Tabla de Frecuencias en una Muestra Continua 1. Se resta el mínimo valor del máximo valor de la muestra, esta diferencia representa la anchura o tamaño de la muestra. 2. La diferencia obtenida se divide entre el número de intervalos que se considera en la distribución. Una de las formas para determinar en cuantos intervalos se debe clasificar una muestra, lo dá la regla de Sturges: K = 1 + 3.332 log n Donde: K Nro. De intervalos n Nro. De observaciones que tiene la muestra. 20 3. El cociente obtenido en la división realizada en el segundo paso representa la anchura o tamaño del intervalo de clase (c). Se recomienda que todos los intervalos deben ser del mismo tamaño a fin de tener mejores resultados en los análisis de la muestra. 4. Conociendo la amplitud de cada intervalo y el número de los mismos, se determina en orden ascendente los intervalos de clase. Teniendo como límite inferior del primer intervalo al menor valor de la muestra y como límite superior al valor obtenido al sumar al límite inferior el valor de la amplitud del intervalo. De esta forma sucesivamente se van formando los intervalos. 5. Los puntos medios de los intervalos de clase toman el nombre de marcas de clase, que se obtiene sumando el límite inferior y superior de cada intervalo y dividiendo entre dos. Tabla de Frecuencias de una Muestra Continua Ejemplo de Aplicación de una Muestra Continua La tabla de distribución de frecuencias correspondiente al ejemplo Nro. 2 es el siguiente: Después de realizar el conteo y hallado la frecuencia por intervalo el cálculo del Nro de intervalos (K): Por la regla de Sturges. Para n = 100 k = 1 + 3,332 log n k = 1 + 3,332 log 100 k = 7,7 Consideramos el valor: k =7 q1 = 1.54 q2 = 1.82 q2 – q1 c = k 1,82 – 1,54 c = 7 = 0,04, 21 TABLA DE FRECUENCIAS (EJM 2) Con estos datos se construye la tabla de frecuencias siguiente 1,56 Clases (Estaturas [1,54 – 1,58] IIIII I Frecuencia f 6 1,60 (1,58 – 1,62] IIIII III 8 1,64 (1,62 – 1,66] IIIII IIIII 10 1,68 (1,66 – 1,70] IIIII IIIIIIIIIIIIIIIIIIII III 28 1,72 (1,70 – 1,74] IIIII IIIIIIIIIIIIIIIIIIII I 26 1,76 (1,74 – 1,78] IIIII IIIIIIIIII II 17 1,80 (1,78 – 1,82] IIIII 5 Marcas Conteo f= 100 Gráfica de Frecuencias . Histograma y Polígono de Frecuencias Ejemplo de Aplicación: Con los datos del ejem Nro. 2. Hallar el Histograma y Polígono de frecuencias respectivos. Fig. 1.2 Histograma de Frecuencias FA rl e u cm u n e o n s c i a s 28 30 26 25 20 17 15 10 6 8 10 5 5 1,56 1,60 1,64 1,68 1,72 1,76 1,80 Marcas de clase(Estaturas) 22 Distribución de Frecuencias Relativas Ejemplo: En la muestra del Ejm. Nro. 2, la frecuencia relativa de la segunda clase será: f2 Remplazando por sus valores f R2 = n f R2 = 8 100 = 0,08 que puede expresarse como el 8% Distribución de Frecuencias Acumuladas Absolutas y Relativas. 1. Frecuencias Acumuladas Absolutas (FA). Es la frecuencia total de todos los valores menores o iguales al límite superior del intervalo de clase respectivo, se obtiene sumando las frecuencias absolutas correspondientes a los intervalos inferiores. Ejemplo: En la muestra de Ejm. Nro. 2, la frecuencia absoluta acumulada hasta la tercera clase (FA ) será: FA3 = f1 + f2 + f3 FA = f1 + f2 + f3 + .............. + fn Reemplazando con los valores del ejemplo: FA3 = 6 + 8 + 10 = 24 FA3 = 24 Interpretación: Existen 24 observaciones cuyos estaturas son menores o iguales a 1.66 m. 2. Frecuencias Acumuladas Relativas ( FAR ) Es la frecuencia relativa total de todos los valores menores o iguales al límite superior del intervalo de clase respectivo, se obtiene sumando las frecuencias relativas siguientes a los intervalos inferiores. Ejemplo: En la muestra del Ejm Nro. 2, la frecuencia relativa acumulada hasta la cuarta clase (FAR4) será: 23 FAR4= fR1 + fR2 + fR3 + fR4 Generalizando: FAR= fRt = fR1 + fR2 + fR3+ ..............+ fRk Reemplazando con los valores del ejemplo: FAR4 = 0,06 + 0,08 + 0,10 + 0,28 = 0,52 FAR4 = 0,52 Interpretación: Al multiplicar por 100 para obtener la respuesta en %: Significa que el 52 % de observaciones tienen estaturas menor o igual 1,70 m. Gráfica de las Frecuencias Acumuladas, Ojiva. La gráfica que muestra las frecuencias acumuladas “mayor que” o las que son “menor o igual que” toman el nombre de Polígono de Frecuencias Acumuladas u Ojivas. Ejemplo: Presentaremos las frecuencias acumuladas a partir de la muestra del Ejm. Nro 2. x Clases(estaturas fi ) fR FA FAR 1.56 [1.54 – 1.58] 6 0.06 ; 6% 6 0.06 ; 6% 1.60 (1.58 – 1.62] 8 0.08 : 8% 14 0.14 ; 14% 1.64 (1.62 – 1.66] 10 0.10 ; 10% 24 0.24 ; 24% 1.68 (1.66 – 1.70] 28 0.28 ; 20% 52 0.52 ; 52% 1.72 (1.70 – 1.74] 26 0.26 ; 26% 78 0.78 ; 78% 1.76 (1.74 – 1.78] 17 0.17 ; 17% 95 0.95 ; 95% 1.80 (1.78 – 1.82] 5 0.05 ; 5% 100 1.00 ;100% n = 100 f R =1ó100% 24 Fig. 1.8 Gráfica de Frecuencias Acumuladas Ojiva FA 100 100 100 95 94 86 80 78 76 “Menor oigual” 60 52 48 40 24 “Mayor que” 22 20 14 6 1,54 5 1,58 1,62 1,66 1,70 1,74 1,78 1,82 Intervalos de clase TALLER 01 ACTIVIDAD APLICATIVA – AUTOEVALUACIÓN INTRODUCCIÓN AL ANÁLISIS DE DATOS – PRESENTACIÓN DE LA INFORMACIÓN EJERCICIOS Y PROBLEMAS Estadística Descriptiva e Inferencia Estadística 1. Indique cuáles de los términos u operaciones siguientes se relacionan con muestras (M) ó con una población (P): a) Grupos de medidas llamadas parámetros, b) uso de inferencia estadística, c) hacer un cerco, d) juzgar la calidad de un embarque de fruta inspeccionando varias de las cajas, e) Universo, f) grupos de medidas denominadas estadísticas, g) aplicación de conceptos de probabilidad. Variables Discretas y Continuas 2. Por los siguientes tipos de valores, identifique si corresponde a variables discretas (D) o variables continuas (C): a) el peso del contenido de un paquete de cereales, b) el diámetro de un cilindro, c) el número de artículos defectuosos que se producen, d) el número de personas pensionadas en una área geográfica, e) El número 25 promedio de clientes de una empresa visitadas por un vendedor, f) el total de ventas en soles. 3. Se encuestó a un grupo de 30 alumnos sobre el departamento del Perú en el que nacieron y respondieron como se indica. L T T C P T A A C L L P A AA L LL P C A A T L T C L A L L Donde L, A, T, C y P representa Lima, Arequipa, Trujillo, Cuzco, y Piura, respectivamente. Organizar los datos en un cuadro de distribución de frecuencias. 4. Se encuestó a 30 contadores sobre el número de balances presentados el año pasado y se obtuvo la información siguiente. 614627245686532 525756146459236 Organizar los datos en un cuadro de distribución de frecuencias. 5. Construya una tabla de frecuencias para los datos siguientes, correspondiente al número de faltas a clases en el primer semestre del 2005 para estudiantes del curso de Economía. 9 2 1 7 2 6 3 6. 8 1 1 6 0 9 2 7 0 7 6 9 4 1 8 5 3 4 4 3 4 4 3 2 3 6 5 4 3 2 8 2 9 7 2 Un conjunto de datos tiene 100 observaciones, de las cuales la mayor es 212 y la menor 42. Suponga que desea una tabla de frecuencias con siete clases. a) ¿Cuál es el intervalo de clase? b) ¿Cuál es la marca de la primera clase si el límite inferior se fija en 40?. 7. El Profesor Rojas puso un examen final consistente en 100 preguntas a su grupo de contabilidad I, los datos siguientes representan el número de respuestas correctas en cada examen, constrúyase una tabla de frecuencias agrupadas con 5 clases para que, el profesor Rojas pueda analizar los resultados. 17 4 44 15 22 65 78 34 62 21 42 77 10 9 81 32 9 81 7 82 45 65 79 37 18 98 83 87 4 44 26 77 13 41 16 13 13 82 7 67 88 41 22 22 92 Distribución de Frecuencias, Intervalos de Gráficos. 8. 37 5 54 16 67 85 Clase y Métodos Los siguientes datos constituyen las vidas útiles, en horas de una muestra aleatoria de 60 bombillas de luz de 100 watts. Vida útil de 60 bombillas de luz. 807 660 881 766 1056 832 a) b) c) d) e) 9. 811 753 872 787 1076 863 620 1050 869 923 958 852 650 918 841 792 970 788 817 857 847 803 776 980 732 867 833 933 828 889 747 675 829 947 831 1030 823 880 827 717 781 897 844 878 822 817 1088 755 907 890 811 753 1082 891 Constrúyase una distribución de frecuencias con anchos de clases iguales. Trazar el histograma y polígono de frecuencias. Trazar el Ojiva correspondiente “mayor que” y “menor que”. Hallar la frecuencia Acumulada Relativa (Hi) de la cuarta y sexta clase, interprete su respuesta. Hallar la frecuencia Acumulada Absoluta y Relativa “mayor que” de la primera y segunda clase, interprete su respuesta. Las siguientes observaciones son los tiempos (en minutos) que tardan 30 estudiantes en terminar su primer examen de matemáticas financieras. 42,3 70,0 37,2 69,2 41,9 39,2 a) b) c) d) e) 67,7 52,6 63,2 39,2 58,9 45,5 53,3 61,9 45,7 42,7 69,1 55,5 63,9 41,7 38,9 52,4 68,3 61,2 70,1 39,2 68,3 52,5 64,9 69,8 Determinar el Nº de clases y el intervalo respectivo. Construir la tabla de frecuencias. Marcar el recuento de las observaciones y registrar la frecuencia de c/clase. Construir una distribución de frecuencias acumuladas menor o igual, mayor que. Construir una distribución de frecuencias relativas acumuladas menor o igual, mayor que. Construir un histograma, un polígono de frecuencias una Ojiva. Con los datos de tiempos invertidos por los estudiantes del problema. 27 Uso de Computadoras para Generar Números Aleatorios. AUTOEVALUACION 1. Un analista económico desea obtener una muestra aleatoria simple de 30 empresas de las 435 que están listadas en un área geográfica. Las empresas están identificadas secuencialmente, con números del 001 al 435. Utilizando algún programa de computación, obtenga 30 números de identificación, que determinen las empresas que deben incluirse en la muestra. LISTADO OBTENIDO CON MINITAB 15 MTB > SUBC > MTB > MTB > RANDOM 30 C1; INTEGER 1 435. NAME C1 ’SAMPLE’ PRINT ’SAMPLE’ SAMPLE 277 170 240 351 260 339 377 199 2. 368 24 77 243 180 29 128 299 339 94 124 167 345 402 154 98 359 100 71 204 122 91 Un auditor desea obtener una muestra aleatoria simple de 50 de los 5250 cuentas por cobrar de una empresa grande. Las cuestas están numeradas secuencialmente del 0001 al 5250. Utilice algún programa de computadora para obtener un listado de los 50 números aleatorios que se requieren. Utilización de Computadora para formar una Distribución de Frecuencias. 3. Utilice un paquete de cómputo para formar una distribución de frecuencias para producir un histograma de los datos no agrupados de la tabla dada, que contiene una muestra de los tiempos que 30 empleados requieren para llevar a cabo una tarea de ensamble. Tabla A: Tiempo de ensamble para 30 empleados (minutos) 10 16 15 9 12 11 14 12 18 15 10 19 15 14 9 11 17 12 13 11 14 13 16 14 17 13 14 11 12 15 28 Solución (Datos de entrada y resultados por computadora) DATOS DE ENTRADA MTB DATA DATA DATA DATA MTB > > > > > > SET C1 10 14 15 13 17 16 14 14 9 15 11 13 19 12 14 15 END HISTOGRAM C1 12 11 14 12 11 10 13 17 15 16 18 9 12 11 LISTADO OBTENIDO CON MINITAB Resultados ( desarrollamos en clase ) 4. Utilice algún paquete de cómputo para formar una distribución de frecuencias y producir un histograma de los datos no agrupados de la tabla siguiente, para las cantidades otorgadas en 40 préstamos personales. Resultados ( desarrollaràn los alumnos ) 29 TEMA N° 2 MEDIDAS DE TENDENCIA CENTRAL ORGANIGRAMA Tendencia Central Datos no agrupados Media Aritmética Mediana Moda Media Aritmética Ponderada Media Geométrica Datos agrupados Media Aritmética Mediana Moda CONCEPTOS RELACIONADOS Coeficiente de Variación Coeficiente de Asimetría 30 LA MEDIA ARITMÉTICA De un conjunto de datos numéricos es la suma de todas las observaciones del conjunto, dividida entre el número de observaciones. Simbología.-Fórmulas. Dependiendo de la información disponible ( poblacional o muestral) se puede tener: Media o promedio poblacional (u): u= 1 N N i=1 Xi = x N .............................. (2.1) Media o promedio muestral( X ): x= 1 n Donde : n i=1 Xi = x n .............................. (2.2) Xi = Valor de la i – enésima observación de la variable (suma de todos los datos) N = Tamaño de la población (Nro. De datos) n = Tamaño de la muestra (Nro. De datos) Propiedades: 1. La Media aritmética es un valor representativo debido a que es el centro de gravedad o punto de equilibrio de un conjunto de observaciones. 2. Si se sustituye el valor de cada observación por el valor del Promedio Aritmético no varía la suma de todas las observaciones. 3. La suma de las desviaciones de las observaciones con respecto al promedio aritmético es igual a cero. 4. Si cada observación de una muestra se le suma una constante el promedio de las nuevas observaciones será igual al promedio de la muestra original más la constante. 5. Si a cada observación de una muestra se le multiplica por una constante, el promedio de las nuevas observaciones será igual al promedio de la muestra original multiplicada por la constante. 31 Ejemplos: E1 : Tenemos los salarios anuales (en soles) de 7 supervisores. 34,500; 30,700; 32,900; 36,000; 34,100; 33,800; 32,500. Calcular la media (u). u 34,500 30,700 32,900 36,000 34,100 33,800 32,500 7 u = S/. 33,500; u representa el salario medio anual para los miembros de esta planilla. LA MEDIA PONDERADA Fórmula: upó X P = (px) p .................................... donde: p = factor de ponderación. x = datos Ejemplos E3: Una empresa comercializadora de teléfonos celulares dispone de tres vendedores, c/u. de los cuales cobra diferente comisión por teléfono vendido y realizan diferentes números de ventas. Calcule e interprete el valor medio de la comisión. Vendedor Pedro Juan Pablo XP Número de Telefs. Vendidos ( p ) 30 25 20 Comisión por Venta S/. (x) 30 40 50 30(30) 25(40) 20(50) 2900 30 25 20 75 X P = S/. 38,67 Interpretación: Si se elige al azar un vendedor se espera que cobre una comisión de: S/. 38.67 por cada teléfono vendido. 32 E4: suponga que los costos de producción y las cantidades producidas por tres sucursales A, B y C son: Sucursal A B C Costo de Producción (x) 1,20 1,60 1,05 Cantidad Producida (p) 500 200 900 Calcular el costo de producción promedio por unidad producida. Solución XP = (px) p = 500(1,20) + 200(1,60) + 900 (1,05) = 500 + 200 + 900 1865 1600 X P = 1,16 soles Interpretación: El costo de producción promedio por artículo, para la empresa es de 1,16 soles por cada unidad producida. LA MEDIANA La mediana de un conjunto de observaciones ordenadas de acuerdo a su magnitud, es el valor de la observación que ocupa la posición central de dicho conjunto. Características: 1. La mediana divide a un conjunto de observaciones en dos partes iguales. El 50% con valores mayores a la mediana y el otro 50% con valores menores a la mediana. 2. Como medida de posición, la mediana es influenciada por el número de observaciones y no por los valores de las observaciones. Cálculo de la Mediana: Para determinar la posición de la mediana se usa la siguiente fórmula: Med = X (n/2 + ½) ..............................................(2.4) Si n es impar. Para un grupo con un número par de elementos, la mediana se encuentra a la mitad entre los dos valores adyacentes al centro es decir: Med = X (n/2) + X(n/2 + 1) 2 Si n es par. 33 Ejemplos E1 : Los siguientes datos se refieren al número de clientes atendidos durante los últimos 11 días en una tienda de artefactos. Calcule e interprete la mediana. 12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16 Solución En este caso los datos ordenados son: 5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17 y con n = 11 se tiene: Med = X (n/2 + ½) = X(11/2 + ½) = X6 = 11 Interpretación: Durante 5 días se atendieron a menos de 11 clientes, y durante 5 días se atendieron a mas de 11 clientes. E6: Si se tiene las observaciones: 5, 8, 7, 9, 6, 5, 4, 3. Calcular la Mediana. Solución En este caso los datos ordenados son: 3, 4, 5, 5, 6, 7, 8, 9 y con n = 8 se tiene: Med X (n / 2) X (n / 2 1) X (8 / 2) X (8 / 2 1) X 4 X 5 5 6 5,5 2 2 2 2 El valor de la mediana se encuentra entre los valores cuarto y quinto de este conjunto ordenado, es decir 5 y 6 en este caso, la mediana es 5.5. MODA LA MEDIA ARITMÉTICAPARA DATOS AGRUPADOS Los datos agrupados son datos dados en tablas de frecuencias. Cuando se agrupan datos en una distribución de frecuencias, se utiliza el punto medio de cada clase (xc) como aproximación de todos los valores contenidos en ella. Fórmulas Usadas: Media o promedio Poblacional (u) u= fxi f fx ó en forma simple u = N ................... (2.6) 34 Media o Promedio Muestral ( X ) X = fxi f fx ó en forma simple X n= ................... (2.7) donde: xi = x = Marca de clase (Punto medio) de cada clase. f = frecuencia observada de valores en cada clase respectiva. N = Nº de datos de la Población. n = Nº de datos de la muestra. Ambas fórmulas señalan que cada punto medio de cada clase (X c), se multiplica por la frecuencia de clase correspondiente (f), luego se suman estos productos () para después dividir esta suma entre el número total de observaciones (f) representadas en la distribución de frecuencias. Ejemplos E9: La distribución de frecuencias siguiente, representa los puntajes obtenidos en una evaluación del desempeño aplicado al personal técnico de una empresa. El puntaje máximo de la prueba es 60. Calcule e interprete en Media. Tabla 2.1 Distribución de frecuencias de los puntajes por evaluación de 60 Técnicos. Desempeño (Puntos) 12 – 16 17 – 21 22 – 26 27 – 31 32 – 36 Número de Técnicos (f) 4 8 15 23 10 Total 60 Marca de Clase (x) 14 19 24 29 34 (fx) 56 152 360 667 340 (fx)=1575 Solución En la misma tabla calculamos la marca de clase (xc), es decir el valor intermedio de cada clase ó intervalo, y (fx), obtenemos: x = fx n = 1575 60 = 26,25 x = 26,25 35 Interpretación: Si se elige al azar un técnico se espera que tenga un puntaje de 26.25 en su evaluación de desempeño. E10: En la tabla siguiente se muestra una distribución de frecuencias de salarios mensuales de 100 trabajadores. Calcule e interprete la Media. Tabla 2.2 Salarios Mensuales de 100 trabajadores Número de Marca de Trabajadores (f) Clase (x) 7 2499,50 20 2699,50 33 2899,50 25 3099,50 11 3299,50 4 3499,50 Salario Mensual S/.2400 – 2599 2600 – 2799 2800 – 2999 3000 – 3199 3200 – 3399 3400 – 3599 Total : 100 (fx) = (fx) S/. 17496,50 53990,50 95683,50 77487,50 36294,50 13998,00 S/. 294950,00 Solución En la misma tabla calculamos x y fx, obtenemos: x = fx n = 2949,50 100 = S/. 2949,50 Interpretación: Si se elige al azar un trabajador se espera que tenga un salario mensual de S/. 2949,50. LA MEDIANA PARA DATOS AGRUPADOS Primero, se determina la clase (intervalo) que contiene el valor de la mediana, luego determinar el valor de la mediana dentro de la clase. La clase que contiene la mediana es la primera cuya frecuencia acumulada iguala o excede la mitad del total de observaciones. Fórmula Utilizada: N/2 - faA Med = LI + (fc ) i ..................................... (2,8) Donde: LI = Límite exacto inferior de la clase que contiene la mediana. 36 N = Número Total de observaciones. faA= La frecuencia acumulada de la clase que precede (antes) a la clase que contiene la mediana. fc = Número de observaciones en la clase que contiene la mediana. i = Tamaño del intervalo de clase. Ejemplo E11: la siguiente tabla muestra el salario mensual de 100 trabajadores. Hallar la Mediana. Tabla : Salarios Mensuales de 100 trabajadores Salario Mensual S/. 2400 – 2599 2600 – 2799 2800 – 2999 3000 – 3199 3200 – 3399 3400 - 3599 Número de Trabajadores (f) 7 20 33 25 11 4 Total: 100 Frecuencia (fa) 7 27 60 85 96 100 Acumulada Solución En la misma tabla calculamos (fa); la clase ó intervalo que contiene a la mediana es la que incluye el valor N/2 = 100/2 =50. La Primera cuya frecuencia acumulada es igual o superior a 50 es la clase que tiene los límites 2800 – 2999 ( con límite exacto inferior 2799.50). Para hallar el valor de la mediana en esta clase: n/2 - faA Med = LI +fc( 100/2 - 27 ) i = 2799,50 + 33 ( ) 200 = Med = S/. 2938,89 Interpretación: La mitad de los trabajadores gana menos o igual a S/. 2938,89 y la otra mitad de trabajadores gana más o igual a S/. 2938,89. LA MODA PARA DATOS AGRUPADOS Para datos agrupados en una distribución de frecuencias con intervalos de clases iguales, para hallar la moda, primero se identifica la clase que contiene la moda determinando cuál de ellos tiene el mayor número de observaciones, luego se aplica la fórmula de la moda. 37 Fórmula Utilizada: d1 Mo = LI +d(1 + d2 ) i ............................................ (2.9) Donde: LI = Límite exacto inferior de la clase que contiene la moda. d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase precedente. d2 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase siguiente. i = Tamaño de intervalo de clase. Ejemplo E12: Con referencia a los datos agrupados de la tabla 2.3. Hallar la moda. Tabla : Salarios Mensuales de 100 trabajadores. Salario Mensual 2400 – 2599 2600 – 2799 2800 – 2999 3000 – 3199 3200 – 3399 3400 - 3599 Número de Trabajadores (f) 7 20 33 25 11 4 Total: 100 Frecuencia Acumulada (fa) 7 27 60 85 96 100 Solución La clase ó intervalo que contiene el mayor número de observaciones (frecuencia), es el que corresponde a 2800 – 2999 (clase modal). Para hallar el valor de la moda es esta clase: Mo LI ( d1 13 )i 2799,50 ( )200 S / .2923,31 d1 d 2 13 8 Interpretación: El salario de valor más frecuente es de S/. 2923,31 38 TEMA N°3 DATOS AGRUPADOS Y NO AGRUPADOS CUARTILES, DECILES Y PERCENTILES Mientras que la mediana divide a una distribución de datos en dos mitades. Los Cuartiles los dividen en cuatro cuartos iguales. Los Deciles los dividen en 10 décimas iguales. Los Percentiles los dividen en 100 partes iguales. Fórmulas Usadas para datos no agrupados: Q1 (Primer Cuartil) = X[n/4 + ½] .................................. (2.11) D3 (tercer Decil) = X [3n/10 + ½] ................................... (2.12) P70 (Percentil 70) = X[70n/100 + ½] ................................ (2.13) Ejemplos E13: Los importes mensuales (en soles) de 15 personas en un restaurante, en forma ascendente son: 1000, 1000, 2500, 2500, 2500, 3500, 4000, 5300, 9000, 12500, 13500, 24500, 27500, 30300 y 41000. Determinar los valores de: a) Segundo Cuartil. b) Segundo Decil c) Punto Percentil 40. Solución Siendo n = 15: a) Q2 = X[2n/4 + ½] = X[2x15/4 + ½] = X8 = 5300 Por definición este valor es equivalente a la Mediana. b) D2 = X[2n/10 + ½] = X[2x15/10 + ½] = X3,5 = 2500+2500 = 2500 2 X3,5 corresponde al valor de la mitad entre el 3ro y 4to ascendente. c) P40 = X[40n/100 + ½] = X[40x15/100 + ½] = X6,5 = 3500 + 4000 = 3750 2 X6,5 corresponde al valor de la mitad entre el 6to y 7mo ascendente. 39 CUARTILES, DECILES Y PERCENTILES PARA DATOS AGRUPADOS Se utilizan algunos ejemplos de fórmulas como: Q1 (Primer cuartil) = LI + ( n/4 – faA ) i .......................... (2.14) fc D3 (Terceldecil) = LI + (3n/10 – faA) i ............................ (2.15) fc P70 (Percentil 70) = LI + (70n/100 – faA) i ........................(2.16) Fc Donde: LI = Límite exacto inferior de la clase que contiene Q, D ó P. faA = Frecuencia acumulada de la clase que prescede (antes)a la clase que contiene Q, D ó P. fc = Número de observaciones en la clase que contiene Q, D ó P. i = Tamaño del intervalo de clase. Como podemos observar, la fórmula de la mediana (2,8) se modifica de acuerdo con el punto fraccionario de interés (Q, D, P se encuentran en la clase cuya frecuencia acumulada excede al valor del Q, D, P solicitado). E14: Con referencia a la siguiente tabla la cual indica el tiempo requerido para auditar saldos de cuentas. a) Determinar el valor del Tercer Cuartil. b) El Primer Decil. c) El Punto Percentil 90. Tabla : Tiempo requerido para auditar saldos de cuentas. Tiempo de Auditoría 10 – 19 20 – 29 30 – 39 40 – 49 50 – 59 Número de Registros (f) 3 5 10 12 20 Total: 50 Frecuencia Acumulada (fa) 3 8 18 30 50 Solución En la misma tabla calculamos fa. En primer lugar, calculamos la clase que tiene el punto de interés 3n/4 = 3x50/4 = 37,5 (Quinta clase) de acuerdo con las frecuencias acumuladas. 40 Luego según fórmula: a) Q3 = L1 + ( 3n/4 – faA ) i = 49.5 + ( 3x50/4 – 30 )10 = 53,25 fc 20 Conclusión: 49,5 es el límite exacto inferior de la clase que contiene la medición 3n/4 ó 37.5, por tanto el cuartil 3 se encuentra en el quinto intervalo y su valor es 53,25 min. b) La clase que contiene el punto de interés (primer decil) = 1xn/10 = 50/10 = 5, LI se encuentra en la clase (intervalo) cuya fa excede a n/10 ó 5 x (8). Luego según fórmula: n 10 f aA D1 LI i 19,5 fc 5 10 3 10 23,5 min . 5 Conclusión: 19,5 es el límite superior de la clase que contiene la medición n/10 ó 5, por tanto el decil 1 se encuentra en el segundo intervalo y su valor es 23.5 min. c) La clase que contiene el punto de interés (percentil 90) = 90xn/100 = 90x50/100 = 45 LI se encuentra en el intervalo cuya fa excede a 90n/100 ó 45x 50. Luego según fórmula: P90 = LI + ( 90xn/100 – faA)i = 49,5+ (9500/100 – 30) 10 = 57 fc 20 Conclusión: El valor P90 = 57 min y se encuentra en el quinto intervalo. 9.5 – 19.5 – 29.5 – 39.5 – 49.5 – 59.5 1 2 3 4 5 LA MEDIA GEOMETRICA ( xg) Se utiliza para calcular tasas medias de variación, como la tasa media de crecimiento poblacional, la tasa media de inflación mensual, la tasa media de mortalidad, entre otros. Fórmula xg = n x1 . x2 . x3 . x4 . .................... xn ....................... (2.17) 41 Donde: x = n valores de una serie x1, x2 ............... xn datos de la serie. Ejemplo E15: La siguiente tabla muestra la tasa de aumento en las ventas durante los últimos meses. Calcule e interprete la tasa media mensual. Meses Aumento de Ventas Ene Feb Mar Abril Mayo 2.6 % 5.4 % 3.8 % 0.5 % 1.4 % Solución La tasa 2.6 % también se puede expresar como 0,026 y como se refiere a un aumento a partir de 100%, el factor de variación será 1,026 (1 representa el 100%, aumento representa >1) para los otros datos se procede igual. Reemplazando en la fórmula: xg = n xg = 5 xg = 5 x1 . x2 . x3 . x4 . .................... xn ; para n = 5 (1,026) (1,054) (1,038) (1,005) (1,014) 1,14390337 xg = 1,02725 (factor de Crecimiento o Medio) Tasa Media de Variación = (Xg – 1) 100 = (1,02725 – 1)x 100 = 2,72 % Interpretación: Si se selecciona al azar un mes entre Enero y Mayo, se espera que las ventas se hayan incrementado 2.72% con respecto al mes anterior. LA MEDIA ARMÓNICA (Xh) Se utiliza para calcular el tiempo medio, velocidad y aceleración media, como el tiempo medio para realizar un proceso productivo. 42 Fórmula: Xh 1 1 / x ............................................ (2.18) n Donde: xh = media armónica n = n valores de una serie 1/xi = Suma de todos los datos a la inversa. EJEMPLO E16: Los siguientes datos registran el tiempo medio que utilizan 4 clientes al realizar una compra de un artefacto doméstico. Calcule e interprete el tiempo medio. Cliente Tiempo (Minutos) A B 45 38 C D 52 40 SOLUCIÓN Para n = 4 Reemplazando en la fórmula Xh 4 4 x88920 1 1 1 1 1976 2340 1710 2223 45 38 52 40 X h = 43,117953 min. 43 TALLER 02 ACTIVIDAD APLICATIVA – AUTOEVALUACIÓN MEDIDA DE TENDENCIA CENTRAL O POSICIÓN DE LOS DATOS EJERCICIOS Y PROBLEMAS Media, Mediana Y Moda 1. De en una empresa que tiene 200 empleados, el ingreso promedio es S/. 1200,¿cual es la cantidad de dinero destinado al pago sueldos? 2. Una empresa tiene 100 trabajadores cuyo sueldo promedio es de S/. 900. El próximo mes se piensa incrementar el sueldo de cada trabajador en S/. 100¿Con cuanto dinero se debe contar para poder pagar los nuevos sueldos? 3.Una empresa tiene 100 trabajadores cuyo sueldo promedio es de S/. 900. El próximo mes se piensa incrementar el sueldo de cada trabajador en 20% de su sueldo actual ¿Con cuanto dinero se debe contar para poder pagar los nuevos sueldos? 4 Una empresa tiene 100 trabajadores cuyo sueldo promedio es de S/. 900. El próximo mes se piensa incrementar el sueldo de cada trabajador en 20% de su sueldo actual y además da una bonificación de S/. 50 ¿Con cuanto dinero se debe contar para poder pagar los nuevos sueldos? 5. Una muestra de 20 trabajadores de una compañía pequeña obtuvieron los siguientes salarios para un mes determinado. (En dólares) 240, 240, 240, 240, 240, 240, 240, 240, 255, 255, 265, 265, 280, 280, 290, 300, 305, 325, 330 y 340. Calcule: a) la media, b) la mediana y c) la moda, para este conjunto de salarios. 6. Si estuviera usted en cada uno de las siguientes situaciones, señale qué medida de “promedio” reportaría para los datos del problema anterior y en qué sentido puede considerarse típico cada valor. a) Como Vicepresidente responsable de las negociaciones colectivas con los trabajadores, b) Como Presidente de los representantes de los trabajadores. 7. El número de accidentes ocurridos durante determinado mes en 13 áreas de manufactura de una planta industrial fueron: 2, 0, 0, 3, 3, 12, 1, 0, 8, 1, 0, 5, 1. Calcule: a) la media, b) la mediana, y c) la moda para el número de accidentes por área. 44 8. En una compañía que maneja 4 productos, los márgenes de utilidad correspondientes a c/u de ellos durante el año fiscal anterior fueron: producto A, 4,2 %; producto B, 5,5 %; producto C, 7,4 % y producto D, 10,1 %. Hallar el margen de utilidad promedio. 9. Supongamos que Ramiro el dueño de un grifo vende (en miles de soles) 5 tipos de combustibles. En la tabla siguiente se muestra c/u de ellos junto con el costo por galón y el número de galones vendidos. Calcular la media aritmética simple y la media ponderada del costo obtenido por Ramiro. Combustible Diesel 84 90 97 95 Costo por Galón S/.2,00 3,50 5,00 7,50 6,00 Volumen de Ventas en balones 3 7 15 12 15 La Media Ponderada 10. Suponga que los precios al menudeo de determinados artículos han sufrido los cambios que se muestran en la tabla siguiente. Determine el cambio porcentual promedio de los precios al menudeo con referencia al promedio de gastos que se indica en la tabla. Tabla (d) Cambios en los precios al menudeo de algunos artículos durante un año. Artículo Aumento Gasto Mensual Promedio Porcentual (Antes del Aumento) Leche 10% S/. 2000,00 Carne Molida -6 3000,00 Ropa -8 3000,00 Gasolina 20 5000,00 Media, Mediana y Moda Para Datos Agrupados 11. Con referencia a la tabla (c) la cual muestra la distribución de frecuencias por el pago mensual alquiler de departamento. Determinar el alquiler mensual promedio en termino de: 1) Media (u), Mediana (Med), c) Moda (Mo), interprete su respuesta: Solución En la misma tabla calculamos el punto medio de clase (x), f(x) y fa obteniendo: 45 Tabla (c). Distribución de Frecuencias para alquiler mensual por departamento. Punto Alquiler Medio de Mensual Clase (x) 350-379 364,50 380-409 394,50 410-439 424,50 440-439 454,50 470-499 484,50 500-529 514,50 530-559 544,50 560-589 574,50 590-619 604,50 620-649 634,50 1.- u ( fx) N Número de Departamentos (f) 3 8 10 13 33 40 35 30 16 12 Total 200 fx 1093,50 3156,00 4245,00 5908,50 15988,50 20580,00 19057,50 17235,00 9672,00 7614,00 (fx)=S/104550,00 Frecuencia Acumulada (fa) 3 11 21 34 67 107 142 172 188 200 104500 S / .522.75 200 2.- Med = LI + ( (N/2) – faA) i = 499.50 + ( 100 – 67 ) 30 fc 40 = S/. 524.25 Nota: S/. 499.50 es el límite exacto, inferior de la clase que contiene a la medición N/2 es decir, la centésima medición. 3.- Mo = LI + ( d1 ) i = 499,50 + ( 7 ) 30 = S/. 517,00 d1 + d 2 7+5 S/. 499,50 es el límite exacto inferior de la clase que contiene la frecuencia más alta. 12. Las siguientes cifras son los importes del consumo en dólares de quince personas en un restaurante en orden ascendente; 10, 10, 25, 25, 25, 35, 40, 53, 90, 125, 135, 245, 275, 309, 410. Determinar: a) La media, la mediana y la moda. b) El segundo cuartil, el segundo decil y el percentil 40. 13. Una muestra de doce trabajadores sé probó en cuanto a su capacidad de sostener firmemente un objeto; las medidas, ordenadas de menor a mayor fueron: 80,6; 89,9; 101,4; 102,6; 115,0; 120,1; 123,4; 126,3; 131,8; 138,6; 151,6 y 160,5. Determine: 46 a) El primero, segundo y tercer cuantil. b) El segundo decil. 14. Hallar la media geométrica de una serie 18, 21, 23, 24 y 22 tomada en este orden. 15. La siguiente Tabla muestra la tasa de incremento en los pagos de impuestos de una empresa durante los últimos meses. Calcule e interprete la tasa media mensual. Meses Ago Increm. 1,6% Impuestos Set 2,8% Oct Nov Dic 2,2% 0,8% 2,5% SOFTWARE ESTADÍSTICO (Aplicación por Computadora) MEDIDA DE TENDENCIA CENTRAL O POSICIÓN DE LOS DATOS Resultados por computadora de la Media y la Mediana Ejercicios y Problemas 1. Utilice una computadora para calcular la media y la mediana de los datos de la tabla A del primer capitulo, que contiene los tiempos que una muestra de 30 empleados requieren para llevar a cabo un trabajo de ensamble. Solución MTB DATA > 10 DATA DATA DATA MTB MTB > SET C1 14 15 13 17 16 12 14 11 13 15 18 9 > 14 14 9 15 11 13 11 12 10 17 16 12 11 > 16 12 14 15 > END > NAME C1 ’TIME’ > MEAN ‘TIME’ MEAN = 13.3 MTB >MEDIAN ’TIME’ MEDIAN = 13.5 Como puede observarse el tiempo medio de ensamble es 13.3 minutos, el tiempo mediano de ensamble es 13.5 minutos 2. Utilice una computadora para calcular la media y la mediana de los datos de la tabla B del primer capítulo, que contiene los montos de 40 préstamos personales. 3. Utilice una computadora para calcular la media y la mediana de los datos de la tabla siguiente, que contiene las utilidades combinadas en 47 millones de dólares, obtenidas en transacciones nacionales e internacionales por las 100 empresas multinacionales con oficina matriz en los E.U. Las columnas sucesivas de número corresponden a la lista alfabética de las empresas en la tabla original. Tabla: B Montos de 40 préstamos Personales (en miles de soles) S/. 932 S/. 1000 S/. 356 S/.2227 515 554 1130 354 452 973 300 2112 1900 660 1610 445 1200 720 1525 784 1278 1388 1000 870 2540 851 1830 630 586 329 335 3000 1650 1423 532 334 1219 727 655 1590 TABLA C: UTILIDADES COMBINADAS EN MILLONES DE DÓLARES DE 100 EMPRESAS AMERICANAS 1071 784 197 835 960 724 447 600 448 1159 457 283 405 254 473 2060 5423 258 119 119 722 2,276 312 772 803 499 3308 430 60 1576 81 - 353 579 708 1169 524 2433 535 754 1369 115 133 592 145 749 108 165 489 1177 791 441 1671 403 445 188 412 215 - 476 531 918 863 522 536 916 1467 370 -1060 1652 532 333 512 1231 1181 338 580 97 838 220 519 252 348 2762 339 668 627 409 437 98 2,227 1567 2380 1992 1281 1851 2310 458 580 729 257 598 48 TEMA N°4 MEDIDAS DE DISPERSIÓN O VARIACIÓN DE LOS DATOS ORGANIGRAMA MEDIDAS DE VARIACIÓN (DISPERSIÓN) DE LOS DATOS VARIACIÓN (DISPERSIÓN) Datos No Agrupados Rango (Amplitud) Desviación Media Varianza y Desviación Estandar Datos Agrupados Rango (Amplitud) Cuartiles, Deciles, Percentiles Varianza y Desviación Estandar CONCEPTOS RELACIONADOS Coeficiente de Variación Coeficiente de Asimetría (Sesgo) 49 Mientras que las medidas de Tendencia Central identifican el valor “Típico” representativo en un conjunto de datos en contraste: Las medidas de variación (dispersión) describen la medida de esta variabilidad según sea grande o pequeña con respeto a una Medida de Tendencia Central (Media) x o u. Ejemplo: Conocidos los porcentajes o notas (x) de 80 estudiantes de Métodos Cuantitativos 1 se les puede disponer formando una distribución de frecuencias que da una idea más ordenada de las características de la variable x (calificación o puntos). 1ro se le calcula la media de la variable x. Con este valor se puede representar la distribución de frecuencias. Si los puntajes (Notas) son muy altos con respeto a la media la variabilidad será grande. Si los puntajes (Notas) son muy próximos a la media, la variabilidad será pequeña. La Medida de esta variabilidad es lo que se llama Medidas de Variación o Dispersión. EL RANGO (AMPLITUD TOTAL) (R) Es la diferencia entre los valores mayor y menor del conjunto de datos. R = My – Mn Donde: R = Rango o Amplitud. My = mayor valor del grupo. Mn = Menor valor del grupo. E1: Durante un mes determinado del verano, 8 vendedores de aparatos eléctricos vendieron el siguiente Nº de ventiladores: 8, 11, 5, 14, 8, 11, 16, 11. Hallar el rango de unidades vendidas. Solución R = My – Mn = 16 – 5 = 11,0 unidades. E2: Dos grupos de estudiantes (A y B) tienen la misma media = 70 puntos c/grupo. Los puntajes más altos y más bajo de cada grupo son: A: 93 y 25. B: 73 y 66. Hallar el Rango ó Amplitud. Solución Para A: 93-25 = 68 puntos Para B: 73 – 66 = 7 Observamos: Que la Medida del Rango se funda sólo en los valores extremos pero no se analiza la variabilidad de los datos internos por consiguiente estudiaremos la Desviación Media. 50 LA DESVIACIÓN MEDIA Incluye todos los datos. Es la media de las desviaciones a partir de algún valor central. Tal como la media o la mediana de una distribución. Cuando se refiere a la Media como valor central se tiene la Desviación Media es decir alrededor de la Media. E3: Para encontrar las fórmulas: Si tenemos las siguientes calificaciones de alumnos (sobre 100 puntos) 50, 55, 60, 70, 75, 80. Hallar al Desviación Media: Solución 1ro Seleccionamos la Media. 2do Medimos la variabilidad a partir de la media. 3ro Se halla el promedio de variabilidad. 1) x x 50 55 60 70 75 80 390 65 n 6 6 2) Los desvíos de este valor son: -15, -10, -5, 5, 10, 15. El signo (-) indica que la dirección de los desvíos es hacia la izquierda. 3) La distancia de las desviaciones (Cantidad de Variabilidad): Ignorando los signos (-) (Observamos que la suma algebraica de los desvíos a partir de la media es siempre = 0). Hallamos la media de las desviaciones: 15 10 5 5 10 5 60 10 6 6 Entonces la Desviación media (DM) = 10. Por Tanto: La fórmula empleada para hallar la desviación Media: D M Poblacional = DM Muestral = xu N xx n Donde: x = datos del Problema. u = media poblacional de los datos. n,N = Nº de datos. x = media muestral de los datos. 51 E4: Para los datos de ventas de aparatos eléctricos que se dieron en el E1, hallar la Desviación Media (DM). Solución 1ro u = x 5 8 8 11 11 11 14 16 10,5 n 8 X x-u x-u 5 5-10,5=-5,5 5,5 8 8-10,5=-2,5 2,5 8 8-10,5=-2,5 2,5 11 11-10,5=0,5 0,5 11 11-10,5=0,5 0,5 11 11-10,5=0,5 0,5 14 14-10,5=3,5 3,5 16 16-10,5=5,5 5,5 Total 21,0 DM = xu N 21,0 2,625 2,6 unidades 8 Interpretación: En Promedio, las ventas de ventiladores por vendedor difiere en 2,6 unidades de la media del grupo, en cualquier dirección. LA VARIANZA. LA DESVIACIÓN ESTÁNDAR Debido a que se dificulta la interpretación del significado del valor de una varianza, porque las unidades en que se expresa son valores al cuadrado. Surge la Desviación estándar (,s), que es la raíz cuadrada de la varianza, representada mediante la letra griega o s para una muestra; su fórmula es: Desviación Estándar Poblacional Desviación Estándar Muestral s ( x u ) 2 N ( x x ) 2 n 1 E4: De acuerdo al ejemplo dado Donde: 8 vendedores vendieron el siguiente Nº de ventiladores 8, 11, 5, 14, 8, 11, 16, 11. 52 2do Tabla: Considerando estas ventas como población: X 5 8 8 11 11 11 14 16 (x-u)2 30,25 6,25 6,25 0,25 0,25 0,25 12,25 30,25 86,00 x-u -5,5 -2,5 -2,5 0,5 0,5 0,5 3,5 5,5 Total ( x u ) 2 86 10,75 3,3unidades Desviación Estándar N 8 CÁLCULOS ABREVIADOS DE LA VARIANZA YLA DESVIACIÓN ESTÁNDAR. Para no realizar el cálculo de c/u de las desviaciones con respecto a la Media Grupal, existen Fórmulas abreviadas equivalentes, las cuales son: x 2 Nu 2 Varianza Poblacional: 2 N Desviación Estándar Poblacional: x 2 n x Varianza Muestral: s n 1 x 2 Nu 2 N 2 2 x 2 n x Desviación Estándar Muestral: s n 1 E5: Como verificación de resultados, calcular por fórmula abreviada la desviación estándar respectiva del problema anterior, siendo x = u = 10,5. x x2 5 25 8 64 8 64 11 121 11 121 11 121 14 196 16 256 Total 968 2 53 x 2 Nu 2 968 8(10,5)2 10,75 3,3 unidades N 8 MEDIDAS DE VARIABILIDAD (DISPERSIÓN) ASIMETRÍA CURTOSIS DE LOS DATOS. Y Formas de Curvas de frecuencias. Después de haber dibujado el polígono de frecuencias y la curva ojiva para la distribución de frecuencias acumuladas, también tenemos los siguientes tipos de curvas: En términos de ASIMETRÍA (Lados Laterales), una curva de frecuencia puede ser: (1) Asimétrica Negativa: Asimétrica con la cola hacia la izquierda. (2) Asimétrica Positiva: Con la “cola” hacia la derecha. (3) Simétrica. FIG.3.1. ASIMETRÍA DE PEARSON f f f x (1) Asimétrica Negativa (Esta sesgada hacia la izquierda) (2) Asimétrica Positiva (Sesgada hacia la derecha) x (3) Simétrica (Insesgada) x En términos de Kurtosis (vértice superior), una curva de frecuencia puede ser: (1) Platikúrtica: Plana, con las observaciones distribuidas de manera relativamente uniforme en todas las clases. (2) Leptokúrtica: Puntiaguda, con las observaciones concéntricas en un estrecho rango de valores. (3) Mesocúrtica: Ni plana ni puntiaguda, en términos de la distribución de los valores observados. FIG. 3.2. KURTOSIS f f f x (1) Platikúrtica x (2) Leptokúrtica 54 (3) Mesocúrtica x EL COEFICIENTE DE VARIACIÓN (C.V.) Indica la Magnitud relativa de la Media de la Distribución: Su fórmula es: Población: CV = x 100 u s Muestra: CV = x 100 x Donde: CV = Coeficiente de Variación = desviación estándar. x , u = media. Si consideramos 2 o más distribuciones con medios bastantes diferentes o si se miden en unidades distintas, será peligroso extraer conclusiones sobre la dispersión a partir de un único valor de la Desviación Estándar. Es como comparar manzanas con naranjos: por tanto se recurre frecuentemente al uso del C.V. Se aplica para comparar la variabilidad de 2 conjuntos de datos con respeto al nivel general de los valores de c/conjunto (y, por ello respeto a la media). E6: Para 2 Acciones Comunes de Empresas (Telefónica A –Claro B) El precio promedio de cierre en la bolsa de un mes fue: Acción A = $15000 con desviación estándar de 500. Acción B = $5000, con desviación estándar de 300. Haciendo una comparación absoluta, resultó ser superior la variabilidad en el precio de la acción A, debido a que muestra una mayor desviación estándar. Pero con respecto al nivel de precios, deben compararse los respetivos coeficientes de variación: CV ( A) u 500 0,033 15000 y CV ( B) 300 0,060 5000 Interpretación: El Precio de la acción B ha sido casi 2 veces más variable que la acción A. (Con respecto al precio promedio para c/u de las 2). COEFICIENTE DE ASIMETRÍA DE PEARSON (SESGO) Mide la desviación de la simetría, expresando la diferencia entre la media y la mediana con respecto a la desviación estándar del grupo de mediciones. 55 Su Fórmula: Asimetría Poblacional: 3(u Med ) 3( x Med ) Asimetría de la Muestra: S Para una distribución Simétrica, el valor del coeficiente de asimetría siempre es = 0, porque la media y la mediana son iguales. Para una distribución con asimetría (+), la x es siempre > que la Med. => Asimetría = (+). Para una distribución con asimetría (-) la x es siempre < que la Med. => Asimetría = (-). E8: Del ejemplo dado E1 de 8 vendedores que vendieron ventiladores. x 84 10,5 u = x =10.5 = n 8 X X5 Med = X (5 8 8 11 11 11 14 16) = 4 2 11 11 11 Med = 2 = 3,3 3(u Med ) 3(10,5 11,0) Asimetría = 0,45 3,3 (El grado en que están sesgados se refleja en este valor) Así, la distribución de las unidades vendidas tiene una ligera asimetría negativa, es decir, está sesgada hacia la izquierda. FIG. 3.3. ASIMETRÍA DE PEARSON. f Asimetría Negativa X 56 EL RANGO Y LOS RANGOS MODIFICADOS PARA DATOS AGRUPADOS. Para datos agrupados en una Dist. De frecuencias el Rango (R): Limite Exacto Superior de la clase (intervalo) más alto Ls(A) y el límite exacto inferior de la clase (Intervalo) más baja L I (B) Así: R= Ls (A)- LI (B) E9: En los siguientes datos agrupados de las salarios mensuales de 100 trabajadores hallar el rango. Salario Mensual Límites Exactos $ De Clase 2400 – 2599 2399,50 – 2599,50 2600 – 2799 2599,50 – 2799,50 2800 – 2999 2799,50 – 2999,50 3000 – 3199 2999,50 – 3199,50 3200 – 3399 3199,50 – 3399,50 3400 – 3599 3399,50 – 3599,50 R = Ls(A) – LI(B) = 3599,50 – 2399,50 = 1200 DESVIACIÓN MEDIA PARA DATOS AGRUPADOS Para los datos agrupados en una distribución de frecuencias, se asume que el punto medio de cada clase (Intervalo), representa a todas las mediciones incluídas en esa clase (intervalo); es igual que el cálculo de la media para datos agrupados. Fórmula Empleada: DMPOBLACIONAL = ( f ) x u N E10: Para los datos de salarios diarios del Problema anterior calcular la Desviación Media. Solución Salario Mensual 2400 2599 2600 2799 2800 2999 3000 3199 3200 3399 3400 3599 Pto. Medio de clase (Intervalo) x 2499,50 2699,50 2899,50 3099,50 3299,50 3499,50 Total: (f) Nº de Trabajadores 7 20 33 25 11 4 100 f(x) 17496,50 53990,00 95683,50 77487,50 36294,50 13998,00 294950,00 | x u| f x u 450 250 50 150 350 550 Total: 3150 5000 1650 3750 3850 2200 19600 57 LA VARIANZA YLA DESVIACIÓN ESTANDAR PARA DATOS AGRUPADOS. Se asume que el punto medio de clase (intervalo) representa a todas las mediciones incluidas en esa clase. Fórmulas Empleadas: 2 f x u 2 Varianza Poblacional: N f x x 2 Varianza Muestral: S 2 n 1 f x u 2 Desviación Estándar Poblacional: N f x x 2 Desviación Estándar Muestral: S n 1 E11: Para los datos de salarios diarios que se presentan a continuación. Hallar la Desviación Estándarmuestral Salario Diario 2400 - 2599 2600 - 2799 2800 - 2999 3000 - 3199 3200 - 3399 3400 - 3599 Pto. Medio (f) Nº de 2 2 de clase f(x) x x x x f x x Trabajadores (Intervalo)x 2499,50 7 17496,50 -450 202500 1417500 2699,50 20 53990,00 -250 62500 1250000 2899,50 33 95683,50 -50 2500 82500 3099,50 25 77487,50 150 22500 562500 3299,50 11 36294,50 350 122500 1347500 3499,50 4 13998,00 550 302500 1210000 Total: 100 294900,50 Total : 5870000 Solución 1ro: Cálculo del Pto. Medio de Intervalo 2do: Cálculo f x f x 294950 2949,50 3ro: Cálculo de la media x n 100 4to: x x Tabla 5to: f x x Tabla 2 58 f x x 2 6to:Reemplazo de fórmula S n 1 5870000 59292.93 99 S 243.50 3.12 FORMULAS ABREVIADAS PARA DATOS AGRUPADOS SON LOS SIGUIENTES: f x 2 Nu 2 Varianza Poblacional: 2 N f x 2 Nu 2 Desviación Estándar Poblacional: N f x nx 2 Varianza Muestral: S 2 n 1 2 fx n x 2 Desviación Estándar Muestral: S 2 n 1 E12: Del problema anterior calcular la Desviación Estándar resultante probando de esta manera la Respuesta, usando Fórmulas abreviadas. Salario Diario 2400 2599 2600 2799 2800 2999 3000 3199 3200 3399 3400 3599 Pto. Medio de clase (Intervalo)x 2499,50 2699,50 2899,50 3099,50 3299,50 3499,50 Total (f) Nº de x2 Trabajadores 7 20 33 25 11 4 100 6247500,25 7287300,25 8407100,25 9606900,25 10886700,25 12246500,25 Total: fx2 43732501,00 145746005,00 277434308,25 240172506,25 119753702,75 48986001,00 875825025.00 875825025 1002949 243,50 100 1 2 S 59 TALLER 03 ACTIVIDAD APLICATIVA – AUTOEVALUACIÓN GUÍA DE PRACTICAS (Problemas Propuestos) MEDIDAS DE VARIACIÓN (DISPERSIÓN) DE DATOS RANGO – DESVIACIÓN MEDIA – VARIANZA – DESVIACIÓN ESTANDAR – COEFICIENTES DE VARIACIÓN Y DE ASIMETRIA MEDIDAS DE DISPERSIÓN (VARIACIÓN) 1. En un estudio contable, las utilidades de empresas son: 15, 9, 11,10 y 11 en millones de S/. Calcule la varianza y desviación estándar de estas utilidades. 2. Una empresa fabrica clavos que se venden por cajas. Para una muestra de 40 cajas, se observaron los siguientes números de clavos por caja. Nùmero de clavos 18 Nùmero de Cajas 4 19 9 20 15 21 10 22 2 Hallar la varianza y desviación estándar 3. Calcule la Desviación Media para los siguientes datos: 1000, 1000, 2500, 2500, 2500, 3500, 4000, 5300, 9000, 12500, 13500, 24500, 27500, 30900 y 41000. 4. Calcular la desviación estándar muestral para los datos del problema anterior utilizando: a) La Fórmula de Desviaciones y b) La Fórmula abreviada alternativa, y demuestre que las respuestas son iguales. 5. Una muestra de 20 trabajadores calificados de una compañía pequeña obtuvieron los siguientes salarios en un mes determinado: $240000, 240000, 240000, 240000, 240000, 240000, 240000, 240000, 255000, 255000, 265000, 265000, 280000, 280000, 290000, 300000, 305000, 325000, 330000 y 340000.Determine: La Desviación Media, La Varianza Muestral, La Desviación EstándarMuestral, utilizando las fórmulas de desviación. 6. Determine el coeficiente de variación según datos del problema anterior. 7. Calcule el coeficiente de asimetría para los datos del problema 3. 8. Para los siguientes datos de las rentas por departamento. 60 Renta Mensual 350-379 380-409 410-439 440-469 470-499 500-529 530-559 560-589 590-619 620-649 Nro. De Departamentos 3 8 10 13 33 40 35 30 16 12 TOTAL 200 Calcule: La Desviación Media y la Desviación Estándar utilizando las fórmulas de desviaciones, las fórmulas abreviadas y demuestra que las fórmulas son equivalentes. 9. En la siguiente tabla se reproducen los datos sobre el número promedio de lesiones por millar de horas – hombre en una industria especifica. Número Promedio de Lesiones 1,5 – 1,7 1,8 – 2,0 2,1 – 2,3 2,4 – 2,6 2,7 – 2,9 3,0 – 3,2 Número de Empresas 3 12 14 9 7 5 Total: 50 Calcule: a) La Desviación Media b) La Varianza Muestral c) La Desviación Estándar Utilizando las fórmulas abreviadas. SOFTWARE ESTADÍSTICO (Aplicación por Computadora) MEDIDAS DE VARIACIÓN (DISPERSIÓN) Utilice una computadora para determinar el rango y la desviación estándar para los datos dados sobre el tiempo de una muestra de 30 empleados en una tarea de ensamblaje. MTB > SET C1 DATA > 10 14 15 13 17 16 12 14 11 13 15 18 9 DATA > 14 14 9 15 11 13 11 12 10 17 16 12 11 DATA >16 12 14 15 DATA > END. MTB > NAME C1 ’ TIME ’ MTB >MAXIMUN ’ TIME ’ K1 61 MAXIMUN OF TIME MAXIMUM of TIME = 18 MTB >MINIMIM ’ TIME ’ K2 MAXIMUN OF TIME MINIMUM of TIME = 9 MTB > SUBTRACT K2 K1 K3 Answer = 9.0000 MTB >stdev ’ TIME ’ Standard Deviation of time Standard deviation of time = 62 UNIDAD II PROBABILIDADES, DISTRIBUCIÓN DE PROBABILIDADES CONTENIDOS PROCEDIMENTALES Formula serie de preguntas relacionadas con probabilidades.Elabora en un cuadro las diferencias entre los sucesos de suma y multiplicación Reconoce e identifica la situación problemática del promedio en probabilidades. Elabora un resumen de la relación entre distribución Binomial y Poisson Expresa su punto de vista sobre las distribuciones de Probabilidad estudiadas y argumenta con propiedad sus ideas en la aplicación de los problemas para su profesión. Elabora un cuadro de las aplicaciones informáticas. CONTENIDOS ACTITUDINALES Acepta formar parte de los grupos en el desarrollo de los problemas de probabilidad para la contabilidad con actitud motivadora.2| Evalúa las diferentes distribuciones de probabilidades bajo el contexto de aplicación a su profesión. Respeta las consideraciones emitidas por sus compañeros con actitud de compresión Asiste al laboratorio de Computo para comprobar y emitir resultados informáticos. CONTENIDOS CONCEPTUALES TEMA N° 5 EVENTOS MUTUAMENTE EXCLUYENTES Y NO EXCLUYENTES TEMA N° 6 MULTIPLICACION DE PROBABILIDADES TEMA N° 7 DISTRIBUCION DE PROBABILIDADES TEMA N° 8 DISTRIBUCION BINOMIAL TEMA N° 9 DISTRIBUCION POISSON 63 PROBABILIDAD Y DISTRIBUCIÓN DE PROBABILIDADES SUMA DE PROBABILIDADES EVENTOS MUTUAMENTE EXCLUYENTES Y NO EXCLUYENTES MULTIPLICACIÓN DE PROBABILIDADES EVENTOS DEPENDIENTES E INDEPENDIENTES DISTRIBUCIÓN DE PROBABILIDADES BINOMIAL Y DE POISSON 64 ORGANIGRAMA PROBABILIDAD, DISTRIBUCIÓN DE PROBABILIDADES PROBABILIDAD ENFOQUES DE LA PROBABILIDAD Clásico Subjetivo REGLAS DE LA PROBABILIDAD ÁRBOLES DE PROBABILIDADES Regla de La Suma Teorema De Bayes Regla de la Multiplicación Probabilidad Condicional CONCEPTOS RELACIONADOS RELACIONES ENTRE SUCESOS Mutuamente Excluyentes Independientes Y dependientes Complementarios 65 DEFINICIÓN DE PROBABILIDAD Es un número real que expresa la confianza o incertidumbre de un suceso o evento, cuyo resultado no se puede predecir con certeza. EXPERIMENTO ALEATORIO (E) ESPACIO MUESTRAL () EVENTO EVENTOS MUTUAMENTE EXCLUYENTES Dos o más eventos son mutuamente excluyentes si no tiene elementos comunes es decir, si no pueden ocurrir al mismo tiempo. También, la ocurrencia de un evento automáticamente impide la ocurrencia del otro(u otros). Por ejm: supongan que se consideren dos posibles eventos “as” y “rey” con respecto a la extracción de una carta de una baraja (52 cartas). Estos eventos son mutuamente excluyentes porque ninguna carta puede ser al mismo tiempo as y rey, otro ejemplo sería obtener un as y un cinco al lanzar un dado. EVENTOS NO EXCLUYENTES Dos o más eventos son no excluyentes cuando es posible que ocurran al mismo tiempo Ejm: Evento A: masculino Evento B: menor de 30 años No son mutuamente excluyentes porque una persona elegida al azar podría estar en ambas categorías . En los dos eventos “as” y “oros”, estos eventos no son mutuamente excluyentes porque una carta determinada puede ser al mismo tiempo as y oro, sin embargo, esto no indica que todo as sea oro o todo oro sea as. EVENTOS COMPLEMENTARIOS Dos eventos A y B son complementarios si son mutuamente excluyentes y su unión es el espacio muestral. Es decir si A B = y A B = A y B son eventos complementarios, y se puede expresar que: Ac A =B Bc = A B DEFINICIÓN CLÁSICA DE PROBABILIDAD Es una fracción cuyo numerador es el No de casos favorables y cuyo denominador es el número total de los casos posibles. 66 Fórmula: N ( A) P( A) N( S ) Donde P(A)= Probabilidad de Ocurrencia del Evento A N(A)= N° de casos Favorables de ocurrencia del evento A. N(S) = Todos los casos posibles en el evento A. E4: En una cantidad de cartas bien barajadas que contiene 4 ases y 48 cartas de otras tipo, la probabilidad de obtener 1 (as) en una sola extracción es: P(A) = N A N S = 4/52 = 1/13 E5: Aparte de los ejemplos dados tenemos: Si se lanzan 3 monedas. Hallar: a) El Espacio Muestral, b) P(A) = obtener exactamente 2 caras, c) Exactamente 2 sellos y d) Exactamente 3 caras. Solución a) El Espacio Muestral () = {CCC CCS CSC SCC CSS SCS SSC SSS} 1/8 cada uno. b) Evento A: obtener exactamente 2 caras. A= { CCS, CSC. SCC} 1/8 1/8 1/8 P(A)3/8 c) Exactamente 2 sellos? 3/8 d) Exactamente 3 caras 1/8 PROBABILIDAD SUBJETIVA CONSIDERACIONES GENERALES 1.La Probabilidad de ocurrencia de cada Punto Muestral, debe estar entre 0 y 1. 0 P(A) 1 67 2.La Suma de las Probabilidades de todos los puntos Muestrales debe ser igual a 1. P(A) + P(A’) = 1 Es decir en una observación o experimento dados, el evento debe ocurrir o No. Por ello la suma de la probabilidad de ocurrencia + la Probabilidad de no ocurrencia siempre es igual a 1. REGLAS DEPROBABILIDAD:SUMA PROBABILIDADES Ó ADICIÓN DE 1. Para eventos mutuamente excluyentes es decir cuando no tiene elementos comunes. (AB = ): A B P(AB)=PA+PB E6: Se extrae una carta de una baraja de 52, los eventos “as” (A) y “rey” (R) son mutuamente excluyentes. Hallar la probabilidad de extraer ya sea un as o un rey en una sola extracción. Solución De: P(A o R) = P(A) + P(R) = 4/52 + 4/52 = 8/52 = 2/13 2. Reglas de Adición para eventos que no son mutuamente excluyentes. E7: Un cliente ingresa a una panadería. La Probabilidad de que compre (a) pan es 0,60, b) Leche es 0,50 y c) Pan y leche es 0,30. ¿Cuál es la Probabilidad de que compre pan, leche o ambos?. Solución P(P) = 0,60 P(L) = 0,50 P(PL) = 0,30 P(PL) = P(P) + P(L) – P(PL) P(PL) = 0,60 + 0,50 – 0,30 P(PL) = 0,80 E8: Cuando se extrae una carta de un mazo de 52 cartas, los eventos “as” y una espada no son mutuamente excluyentes. Hallar la Probabilidad de obtener un AS (A) o una Espada (E) o ambos en una sola extracción. 68 Solución P(AoE) = P(A) + P(E) – P(A y E) = 4/52 + 13/52 – 1/52 = 16/52 = 4/13 EVENTOS DEPENDIENTES E INDEPENDIENTES Dos eventos son independientes cuando la ocurrencia o no ocurrencia de uno, no tiene ningún efecto sobre la probabilidad de ocurrencia del otro. Y son dependientes cuando la ocurrencia o no ocurrencia de uno si afecta la probabilidad de ocurrencia del otro evento. E9: El lanzamiento de una moneda por dos veces se considera eventos independientes, porque el resultado del primer lanzamiento no tiene ningún efecto sobre las respectivas probabilidades de que ocurra una cara o sello en el segundo lanzamiento. E10: La extracción de dos cartas sin reemplazo de un mazo de barajas son eventos dependientes, por que las probabilidades asociadas con la segunda extracción dependen del resultado de la primera extracción. Específicamente si saliera un as en la primera extracción entonces la probabilidad de que salga as en la segunda extracción, es la razón del número de ases que sigue habiendo en las barajas con respecto al número total de cartas, o 3/51. PROBABILIDAD CONDICIONAL Definición: Una medida de la probabilidad de que ocurra un evento particular, dado el hecho que otro ya ha ocurrido o de que hay certeza de que ocurra, se llama probabilidad condicional. Para dos eventos A y B, dicha probabilidad se denota, siempre por P (A/B) o P (B/A), lo que se lee como “la probabilidad de A, dado B” o “la probabilidad de B, dada A” ya que la línea vertical quiere decir “dada” ó “dado”. Cuando dos eventos son dependientes usamos la siguiente fórmula de probabilidad condicional. P( B / A) P( AyB) P( A B) P( A) P( A) Donde: P(B/A) = Probabilidad de que ocurra el evento B dado que ocurre el evento A. <<B/A>> no es fracción. P(AB) = Probabilidad conjunta de 2 eventos. 69 P(A) = Probabilidad simple no, condicional de un primer evento A. PROBABILIDAD CONJUNTA: Definición: Una Medida de la Probabilidad del acontecer simultáneo de dos o más eventos se llama probabilidad conjunta. Para los eventos A y B, esta probabilidad se simboliza por P(AyB) o P(AB). Solución Consideramos los siguientes conjuntos. = 1, 2, 3, 4, 5, 6 espacio muestral. A = 2, 4, 6 conjunto de resultados pares. B = 4, 5, 6 conjunto de resultados mayores que 3. AB = 4, 6 conjunto de resultados pares mayores que 3. Como el dado es no cargado, asignamos a cada punto muestral una probabilidad de 1/6. P(A) = 3/6, P(AB) = 2/6 = 1/3. De la fórmula de Probabilidad Condicional podemos determinar la probabilidad de obtener un número > que 3 dado que es par. P A B 2 / 6 2 P A 3/ 6 3 Este resultado queda comprobado por el hecho que de los 3 resultados pares 2, 4, 6 sólo 2 son mayores que 3. P B / A TEMA N° 6 MULTIPLICACION DE PROBABILIDADES REGLA DE LA MULTIPLICACIÓN (AB) : INDEPENDIENTES. PARA EVENTOS Los sucesos A y B se consideran independientes cuando la ocurrencia de uno no influye sobre la probabilidad de ocurrencia del otro (Ejm. Lanzar dos veces una moneda al aire). Esto significa de que lo que haya ocurrido en A, la probabilidad asignada a B es siempre la misma. Por Tanto: P(B/A) = P(B) Obtenemos la Fórmula: P(AB) = P(A) .P(B) E13: Cuál es la probabilidad de que en una familia con 2 hijos ambos sean varones. P(V1) = 0.5 P(V2) = 0.5 P(V1V2) = P(V1) . P(V2) = (0.5) (0.5) = 0.25 = 1/4 70 E14: Si se lanza dos veces una moneda la probabilidad de que ambos eventos sean cara es: P(AyB) = P(AB) = P(A). P(B) = ½ x ½ = ¼ Uso de Diagramas de árbol para eventos Independientes. Útiles para ilustrar los posibles eventos asociados con observaciones o ensayos secuenciales, del ejemplo anterior obtenemos: Resultado Primer Lanzamiento 1/2 1/2 C2 Probabilidad Del Evento Conjunto C1 y C2 1/4 C1 y S2 S1 y C2 1/4 1/4 C1 1/2 1/2 1/2 Evento Conjunto Resultado 2do.Lanz. S2 C2 S1 1/2 S2 S1 y S2 1/4 4/4 = 1.00 REGLA DE LA MULTIPLICACIÓN: PARA EVENTOS DEPENDIENTES. Esta dada por la fórmula: P(AB) = P(A) Probabilidad Probabilidad de ocurrencia de A. conjunta de A y B. P(B/A) Probabilidad de B dado A. En Palabras: Expresa que la probabilidad de que ocurra A y B es igual a la probabilidad de A multiplicada por la probabilidad de que ocurra B, dado que A ha ocurrido. Uso del Diagrama de Árbol para Eventos Dependientes. E17: Una urna contiene 6 bolitas blancas y 4 negras, se extraen 2 bolitas sucesivamente y sin restitución. a) ¿Cuál es la probabilidad de que ambas bolitas sean blancas?. b) ¿Cuál es la probabilidad de que la primera sea blanca y la segunda negra?. c) ¿Cuál es la probabilidad de que la primera sea negra y la segunda blanca?. d) ¿Cuál es la probabilidad de que ambas sean negras?. 71 Solución P(B 1 B 2 ) = = P(B 1 ) . P(B 2 /B 1 ) 6/10 . 5/9 = 30/90 = 1/3. P(B 1 N 2 ) = P(B 1 ) . P(N 2 /B 1 ) = 6/10 . 4/9 = 24/90 = 4/15. P(N 1 B 2 ) = P(N 1 ) . P(B 2 /N 1 ) = 4/10 . 6/9 = 24/90 = 4/15. P(N 1 N 2 ) = P(N 1 ) . P(N 2 /N 1 ) = 4/10 . 3/9 = 12/90 = 2/15. Resumen de Resultados: Resultado Probabilidad Probabilidad Posible Simple Condicional P(A B)=P(A).P(B/A) P(A) P(B/A) B 1 B 2 P(B 1 )=6/10 P(B 2 /B 1 )=5/9 B 1 N 2 P(B 1 )=6/10 P(N 2 /B 1 )=4/9 N 1 B 2 P(N 1 )=4/10 P(B 2 /N 1 )=6/9 N 1 N 2 P(N 1 )=4/10 P(N 2 /N 1 )=3/9 Probabilidad Conjunta 6/10.5/9=30/90 6/10.4/9=24/90 4/10.6/9=24/90 4/10.3/9=12/90 1,00 Estos mismos resultados lo expresamos en el diagrama de árbol siguiente. Prob. Simple x Prob. Condicional = Prob. Conjunta P(B2/B1)=5/9 B1 y B2 (6/10 . 5/9) = 30/90 B1 y N2 (6/10 . 4/9) = 24/90 N2 N1 y B2 (4/10 . 6/9) = 24/90 B2 N1 y N2 (4/10 . 3/9) = 12/90 = 1,00 B2 B1 P(B1)=6/10 P(N2/B1)=4/9 P(N1)=4/10 P(B2/N1)=6/9 N1 90/90 P(N2/N1)=3/9 N2 72 TALLER 04 ACTIVIDAD APLICATIVA - AUTOEVALUACIÓN GUÍA PRACTICA POR RESOLVER Cálculo de Probabilidades 1. Se lanza un dado: a) Enumérese los elementos del espacio muestral. b) Enumérese los elementos de contenido en el suceso de que el resultado sea par. c) Enumérese los elementos de contenidos en el suceso de que el resultado sea, mayor que 4. 2. Un experimento consiste en lanzar dos monedas simultáneamente. a) Enumérese los elementos del espacio muestral. b) Enumérese los elementos de contenidos en el suceso de que salga exactamente una cara. c) Enumérese los elementos de contenidos en el suceso de que salga al menos una cara. 3. Se lanza un par de dados: a) Enumérese los elementos del espacio muestral. b) Enumérese los elementos contenidos en el suceso de que la suma de los puntajes sea 9. c) Enumérese los elementos contenidos en el suceso de que la suma sea 4 ó 5. 4. Un experimento consiste en seleccionar tres piezas en un proceso manufacturero y observar si son defectuosos D o no son defectuosos D’. a) Enumérese todos los elementos del espacio muestral. b) Enumérese los elementos contenidos en el suceso de que el número de piezas defectuosas sea 1. c) Enumérese los elementos contenidos en el suceso de que los números de piezas defectuosas sea al menos 1. 5. Se lanza dos monedas. ¿ Cuál es la probabilidad de obtener. a) Exactamente una cara?. b) Por lo menos una cara?. c) No obtener una cara?. 6. Se lanzan dos dados no cargados. ¿ Cuál es la probabilidad de obtener?. a) 7?. b) 7 u 11?. c) Suma divisible por 3?. d) No obtener 7?. 73 7. Se elige una carta de una baraja. ¿ Cuál es la probabilidad de que sea?. a) Un as?. b) Una espada?. c) Un as o una espada?. d) Un as o una carta roja?. e) Una carta con una figura?. 8. La probabilidad de que llueva el 12 de octubre es 0,10; de que truene es 0,05 y de que llueva y truene es 0,03. ¿Cuál es la probabilidad de que llueva o truene en ese día?. 9. En cierta zona de la ciudad, la probabilidad de que una persona tenga televisor es 0,80; una máquina lavadora es 0,50 y que tenga ambos es 0,45. ¿Cuál es la probabilidad de que una familia tengan televisor o máquina lavadora o ambas cosas?. 10. La probabilidad de que un vendedor de autos venda por lo menos 3 autos en un día es 0,20. ¿ Cuál es la probabilidad de que venda 0, 1 ó 2 autos en ese día?. 11. La probabilidad de que la señora hablantina reciba a lo más 5 llamadas telefónicas en un día es 0,20; y por lo menos 9 llamadas telefónicas en un día es 0,50. ¿Cuál es la probabilidad de que la señora hablantina reciba 6, 7 ú 8 llamadas en un día?. 12. Una caja contiene 100 tubos de televisor. La probabilidad de que haya al menos un tubo defectuoso es 0,05 y de que tenga al menos dos tubos defectuosos es 0,01. ¿Cuál es la probabilidad de que la caja contenga: a) Ningún tubo defectuoso?. b) Exactamente un tubo defectuoso?. c) A lo más un tubo defectuoso?. Cálculo de Probabilidades Regla de la Multiplicación 13. Dado que p(A) = 0,50 y p(AB) = 0,30, encontrar p(B/A) = 14. De los estudiantes de una universidad, el 35% son varones y el 8% son varones que estudian contabilidad. Si se elige un estudiante al azar y éste resulta ser varón. ¿Cuál es la probabilidad de que estudie contabilidad?. 15. Una urna contiene 7 bolas blancas y 5 negras, si se saca dos bolas.¿Cuál es la probabilidad de que las dos sean blancas si: a) Se extrae sin restitución. b) Se extrae con restitución. 16. La urna A contiene 5 bolitas blancas y 7 rojas y la urna B contiene 3 bolitas blancas y 6 rojas. Se saca una bolita de la urna A y una de la urna B. ¿Cuál es la probabilidad de que las dos bolitas sean blancas?. 74 17. La urna A contiene 4 bolitas blancas y 6 rojas, la urna B contiene 3 bolitas blancas y 5 rojas y la urna C 7 blancas y 7 rojas. Se saca una bolita de cada urna. ¿Cuál es la probabilidad de que sean las tres del mismo color? 18. Se sacan dos cartas , sin restitución, de una baraja de 52 cartas. ¿Cuál es la probabilidad de que: a) La primera carta sea un as y la segunda un 5?. b) Se obtenga un as y un 5?. c) Ninguna de las dos cartas sea as?. d) Ninguna de las cartas sea as ni 5?. 19. Se sacan dos cartas sin restitución de una baraja de la cual se han eliminado previamente las cartas con figuras. ¿Cuál es la probabilidad de que la suma de los puntos de las cartas sea 19?. 20. Se sacan 5 cartas sin restitución de una baraja. ¿Cuál es la probabilidad de que: a) Las primeras tres cartas sean reynas y las dos ultimas reyes?. b) Sólo las tres primeras cartas sean reinas?. c) Las tres primeras cartas sean reinas?. 21. Se extraen cartas sucesivas y sin restitución una baraja. ¿Cuál es la probabilidad de que: a) La primera reyna aparezca en la tercera extracción?. b) Aparezca una reyna en la tercera extracción?. 22. Se lanza un dado tres veces. ¿Cuál es la probabilidad de que: a) La suma de los puntos sea 3 ó 4?. b) La suma de los puntos obtenidos sea mayor que 4?. 75 TEMA N° 7 DISTRIBUCIONES DE PROBABILIDADES DISTRIBUCIONES DE PROBABILIDAD VARIABLES DISCRETAS VARIABLES CONTINUAS Binomiales Normal Poisson CONCEPTOS RELACIONADOS Esperanza Matemática Valor Esperado 76 ESPERANZA MATEMÁTICA (VALOR ESPERADO O PROMEDIO) Así como en los conjuntos de datos muéstrales y poblacionales ya estudiados; es útil también describir una variable aleatoria en términos de su media El Valor Esperado.Es la Media (A Largo Plazo) de una variable aleatoria x y se denota mediante E(x). Usado también para analizar juegos al azar, esperar una ganancia y otros. Fórmula: E(x) = x P(x) Donde: E(x) = Valor esperado de una variable aleatoria discreta. xP(x) = Valor Ponderado E2: Considerando el Nº de caras que puede resultar al lanzar 3 monedas simultáneamente. Los ocho resultados posibles de este experimento aparecen a continuación en el lado izquierdo. Resultado SSS CSS SCS SSC SCC CSC CCS CCC Nº de Caras 0 1 1 1 2 2 2 3 Probabilidad 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8 Designando cada número posible de caras por x y su probabilidad por P(x), enumeramos en la tabla de la derecha todos los números posibles de caras con sus respectivas probabilidades. Observamos que hay mayor posibilidad de obtener 1 o 2 caras que 0 y 3. Supongamos ahora que las tres monedas se lanzan un número infinito de veces. Si bien en este número infinito de ensayos esperamos obtener un promedio de 1,5 caras por lanzamiento. Este promedio “A largo plazo” de 1,5 caras por lanzamiento se llama esperanza matemática. X (número de caras) 0 1 2 3 P(x) 1/8 3/8 3/8 1/8 xP(x) 0 3/8 6/8 3/8 12 xP( x) 8 77 E(x) = xP(x) = 12/8 = 1,5 caras. E3: Con base en la tabla del 1er. ejemplo, hallar el valor esperado de la variable aleatoria. (Promedio de alquiler diario de camionetas) Solución Cálculo del valor esperado para la demanda de camionetas. Demanda Posible Probabilidad Valor Ponderado X P(x) xP(x) 3 0,06 0,18 4 0,14 0,56 5 0,24 1,20 6 0,28 1,68 7 0,20 1,40 8 0,08 0,64 1,00 E(x) = 5,66 Se espera alquilar diariamente en promedio 5,66 camionetas. E4: Una caja contiene 3 bolitas negras y 7 blancas. Se saca una bolita de la caja si ésta es negra Ud. gana $2, pero si es blanca usted pierde $1. ¿Cuál es la esperanza matemática de este juego? Solución Designamos por x toda posible ganancia o pérdida y por P(x) la probabilidad respectiva, calculamos la esperanza matemática: X(Cantidad de ganancia o pérdida) + $2 - $1 P(x) xP(x) 3 10 7 10 6 10 7 10 xP(x) = 1 = -0,1 10 Interpretación: La esperanza matemática de este juego es una pérdida de $0,10. Suponiendo que se haga este juego varios miles de veces. Cada vez se ganará $2 o perderá $1. Sin embargo en esos miles de juegos se puede esperar una pérdida promedio de $0,10 por juego. 78 5.3 LA DISTRIBUCIÓN BINOMIAL Es una distribución discreta de Probabilidad para aplicarla a diversos modelos de toma de decisiones. Siempre y cuando se ajuste a un proceso Bernoulli Fórmula de Distribución Binomial: Para determinar la Probabilidad de un Nº determinado de éxitos x. P(x/n,p) = n Cxpxqn-x = n! p xqn x x!(n x)! Donde: nCx = C xn = Coeficiente Binomial = n! x!( n x )! (x) = Nº específico de éxitos (n) = Nº de ensayos u observaciones (p) = Probabilidad de éxito en c/u de los ensayos. q = 1-p = Probabilidad de fracaso en cualquier ensayo. El Símbolo n! Se lee “n factorial” donde 0! = 1 => 3! = 3x2x1 E5:La Probabilidad de que un gerente de compras elegido al azar realice una compra es de 0.20. Si un vendedor visita a 6 gerentes de compras, hallar la probabilidad de que realice exactamente 4 ventas. Solución Datos: P = 0.20 q = 1-0.20 = 0.80 n=6 x=4 P(x=4/n=6, p=0.20) = 6C4(0.20)4(0.80)6-4 = 6! (0.20) 4 (0.80) 2 4!(6 4)! = 6 x5 x 4 x3 x 2 (0.0016)(0.64) (4 x3x 2)( 2) = 0.01536 0.015 E6: En relación con el ejemplo anterior, hallar la probabilidad de que el vendedor logre 4 o más ventas. 79 Solución P(x 4/n = 6, P = 0,20) = P(x = 4) + P(x =5) + P(x=6) = 0,01536 + 0,001536 + 0,000064 = 0,016360 0,017 En donde: P(x=4) = 0,01536 (Ejemplo anterior) 6! (0,20)5(0,80) 5! 1! = 6(0,00032) (0,80) = 0,001536 P(x=5) = 6C5 (0,20)5 (0,80)1 = 6! (0,000064)(1) 6! 0! = (1) (0,000064) = 0,000064 P(x=6) = 6C6(0,20)6(0,80)0 = Uso de las Tablas de Probabilidades Binomiales Como el uso de la fórmula binomial implica una cantidad considerable de cálculos cuando la muestra es relativamente grande. Por tanto usamos las tablas de probabilidades binomiales. E7: Si la probabilidad de que un gerente de compras elegido al azar realice una compra es de 0,20. Hallar la probabilidad de que un vendedor que visita a 15 gerentes realice menos de 3 ventas: Solución Sabemos: P(x < 3, n = 15, p = 0,20) = P(x 2) = P(x = 0) + P(x =1) + P(x = 2) = 0,0352 + 0,1319 + 0,2309 (Ver Apéndice 2) = 0,3980 0,40 Ejemplo de Aplicación: Según una revista estudiantil, el 45% de los que terminaron los ciclos en la Universidad trabajan durante el verano con el objeto de ganar dinero para pagar el importe de la enseñanza del curso siguiente. Si se eligen al azar 30 estudiantes. ¿Cuál es la probabilidad de que: a) 13 trabajan en el verano, b) ninguno trabaja, c) mas de 23 trabajan. Solución a) Localizamos en la tabla el valor de n = 30, p = 0,45 y para x = 13 obtenemos un valor de 0,1433, es decir existen 14,33% de 80 probabilidad de que 13 de los 30 estudiantes trabajen en verano para ganarse el dinero de la enseñanza. b) Con n=30 y p=0,45, la tabla indica de que la probabilidad de que no trabaje ninguno es p(x=0) = 0,0000. c) Se observa que la probabilidad de que mas de 23 estudiantes trabajen es de P(x >23) / n =30, p = 0,45 = 0000. Interpretación: Es bastante imposible que no trabaje ninguno o trabajen todos los estudiantes. E8:Ejemplo caso en que p > 0,50 INSTALAR CIRCUITOS ELÉCTRICOS Considérese un caso en el que la probabilidad de éxito en cualquier ensayo, p, es mayor de 0,50, que es el valor más alto del apéndice. Un trabajador instala correctamente circuitos impresos con p = 0,95. Si se instalan 20 circuitos. a) ¿Cuál es la probabilidad de que precisamente 16 se instalen en forma correcta?. Solución n 20 x 16 no contiene valor para p 0,95 p 0,95 La respuesta deseada se puede encontrar si se modifica la pregunta en términos de fracaso en lugar de éxito. El trabajador no instala correctamente los circuitos el 5% del tiempo. Si ahora leemos p como la probabilidad de fracaso en cualquier ensayo. Podemos hallar en la columna p = 0,05 una probabilidad de obtener precisamente cuatro circuitos defectuosos como 0,0133. Esto implica también una probabilidad de obtener 16 circuitos perfectos. Es decir: n = 20 p( x=4/n=20, p=0,05) = 0,0133 x=4 b) Cuál es la probabilidad de obtener al menos cuatro circuitos instalados incorrectamente. ¿Y la de obtener a lo sumo tres circuitos defectuosos? Solución Obtener al menos 4 circuitos defectuosos = P(x=4) + P(x=5) + ... + P(x=20) circuitos defectuosos, ésto suma según tabla 0,0133 + 0,0022 + 0,0003 = 0,0158, del mismo modo. 81 P(a lo sumo 3 circuitos defectuosos), se encuentra como la suma de las probabilidades de obtener 0, 1, 2 y 3 circuitos defectuosos, es decir 0,3583 + 0,3774 + 0,1887 + 0,0596 = 0,9842. Observamos que la suma de ambas respuestas suman 1,00. Es decir: P(x4/n=20, p=0,05) = 1–P(x3/n=20, p=0,05) 5.4 LA DISTRIBUCIÓN POISSON La Distribución Poisson se utiliza para determinar la probabilidad de que ocurra un número designado de eventos, cuando éstos ocurren en un continuo de tiempo o espacio. (Por ejemplo en un intervalo de tiempo) en vez de ocurrir en ensayos u observaciones fijas como en el proceso Bernulli. Ejm. La entrada de llamadas en un conmutador telefónico. Se consideran: a) Los eventos son independientes b) El proceso es estacionario (permanece constante de un ensayo a otro) Sólo se requiere un valor para determinar la probabilidad de que ocurra un número designado de eventos en un proceso de Poisson: Este es el número promedio a largo plazo de eventos para el tiempo o dimensión específico de interés. Esta media es la letra griega “lambda” La fórmula para determinar la probabilidad de un Nº determinado de éxitos N en una distribución de Poisson es: x e P(x/) = x! Donde: e = constante = 2.7183 (base de los logaritmos naturales) e- = Valores de la tabla x = Nº especifico de éxitos. E9: Un departamento de reparación de maquinaria recibe un promedio de cinco solicitudes de servicio por hora. La probabilidad de que se reciban exactamente tres solicitudes en una hora seleccionada al azar es: Solución 53 e5 (125) (0.00674) 0.1404 3! 3x 2 x1 E10: Puede determinarse la respuesta del ejemplo anterior utilizando el apéndice 4 de probabilidades Poisson?. P(x=3/=5.0) = 82 Solución P(x=3/=5.0) = 0.1404 Nota 1: Cuando lo que interesa es la probabilidad de “x o mas” o “x o menos”. Se aplica la regla de adición para eventos mutuamente excluyentes. E11: Si en un Dpto. de reparación de maquinaria se recibe un promedio de 5 solicitudes de servicio por hora, hallar la probabilidad de que se reciban menos de 3 llamadas en una hora elegida al azar. Solución P(x < 3/ = 5.0) = P(x 2) = P(x=0) + P(x=1) + P(x=2) = 0.0067 + 0.0337 + 0.0842 = 0.1246 Respuesta. Donde: P(x=0/=5.0) = 0.0067 P(x=1/=5.0) = 0.0337 Apéndice 4 P(x=2/=5.0) = 0.0842 Como se supone que un proceso Poisson es estacionario, se concluye que la media del Proceso es siempre proporcional a la longitud del continuo del tiempo o espacio. Nota 2: Si se tiene disponible una media para una longitud de tiempo, puede determinarse la media para cualquier otro periodo de tiempo que se requiere. Esto es importante porque el valor de que se utiliza debe aplicarse al periodo de tiempo pertinente. = Promedio por periodo de tiempo o espacio. E12: En promedio, 12 personas hacen preguntas cada hora a un consultor de decoración en una tienda de telas. Calcular la probabilidad de que tres o más personas acudan a un periodo de 10 minutos (1/6 de hora). Solución Dado x = Nº de Personas Promedio por horas = 12 = promedio por 10 minutos = 12/6 = 2.0 P(x 3/=2) = P(x=3/=2.0)+P(x=4/=2.0) + P(x=5/=2.0) + ... = 0.1804 + 0.902 + 0.0361 + 0.0120 +0.0034 + 0.0009 + 0.0002 = 0.3232. 83 En donde: Del apéndice 4 obtenemos: P(x=3)/ = 2.0 = 0.1804 P(x=4)/ = 2.0 = 0.0902 P(x=5)/ = 2.0 = 0.0361 P(x=6)/ = 2.0 = 0.0120 P(x=7)/ = 2.0 = 0.0034 P(x=8)/ = 2.0 = 0.0009 P(x=9)/ = 2.0 = 0.0002 -----------0.3232 También se puede calcular así: más corto P(x 3) = 1 – P(x < 3/=2.0) = 1 – (P(x=2/=2.0)+ P(x=1/=2.0) + P(x=0/=2.0)) = 1 – (0.2707 + 0.2707 + 0.1353) = 1 – (0.6767) = 0.3233 TALLER 05 ACTIVIDAD APLICATIVA - AUTOEVALUACIÓN GUÍA DE PRACTICAS (Problemas Propuestos) DISTRIBUCIONES DE PROBABILIDADES A. Valor Esperado 1. Se ha determinado que el número de camiones que llegan cada hora a un almacén tiene la distribución de probabilidad que se muestra en la tabla dada. Calcule: a) El número esperado de llagada x, por hora. Número de Camiones Probabilidad P(x) 0 1 2 3 4 5 6 0.05 0.10 0.15 0.25 0.30 0.10 0.05 2. Las ventas por hora de una máquina automática pueden se 20, 21 o 22 cajetillas de cigarrillos con probabilidades de 0,3; 0,5; y 0,2 respectivamente. ¿Cuál es la venta por hora esperada para esta máquina? 3. Una urna contiene 5 bolitas negras y 8 blancas. Se saca una bolita de la urna si esta es negra usted gana 15 soles, pero si es blanca usted pierde 13 soles. ¿Cuál es el Valor Esperado de este juego?. 84 B. Distribución Binomial 4. Dada la distribución binomial con p = 0,25 y n = 7, utilícese la fórmula y la tabla de distribución binomial para determinar. a) b) P(X 2) P(X = 2) c) d) P(X 4) P(X = 4) 5. Dada la distribución binomial con p = 0,85 y n = 9, utilícese la tabla de distribución binomial para determinar: a) b) P(X 7) P(X = 7) c) d) P(X 5) P(X = 5) 6. Dada la distribución binomial con p = 0,35 y n = 8, utilícese la formula y la tabla de distribución binomial para determinar: a) b) P(X = 0) P(X = 3) c) d) P(X < 3) P(X 3) 7. Dada la distribución binomial con p = 0,70 y n = 20, utilícese la tabla de distribución binomial para determinar: a) b) P(X = 0) P(X = 12) c) d) P(X > 3) P(X 3) 8. Debido a las elevadas tasas de interés, una empresa reporta que el 30% de sus cuentas por cobrar de otras empresas están vencidas. Si un contador toma una muestra aleatoria de cinco de esas cuentas. Determine la probabilidad de cada uno de los siguientes eventos, utilizando la fórmula de la probabilidad binomial: a. Ninguna de las cuentas está vencida b. Exactamente 2 cuentas están vencidas. c. La mayor parte de las cuentas están vencidas. d. Exactamente el 20% de las cuentas están vencidas. C. Distribución Poisson 9. El número promedio de los homicidios en cierta metrópoli es de 2 por día. Utilizando la distribución de Poisson, determínese la probabilidad de que en un día dado haya. a. No más de 3 homicidios. b. Exactamente 3 homicidios 10. El promedio anual de terremotos en Chile es de 0,5. Utilícese la distribución de Poisson para determinar la probabilidad de que no haya terremotos en Chile en los 3 años. 85 11. El Promedio mensual de incendios grandes en una ciudad es de 1.5. Utilícese la distribución de Poisson para determinar la probabilidad de que haya exactamente un incendio grande en un periodo de dos meses. 12. La mesa conmutadora del Gran Hotel Emperador recibe un promedio de 10 llamadas telefónicas por minuto. Utilícese la distribución de Poisson para determinar la probabilidad de que lleguen exactamente 4 llamadas en un periodo de 30 segundos. 13. El número promedio de fallas en un rollo de un cierto tipo de papel mural es de 2.5. Utilícese la distribución de Poisson para determinar la probabilidad de que un rollo tenga 4 o más fallas. 86 UNIDAD III: DISTRIBUCIÓN NORMAL, DISTRIBUCIÓN DE LA MEDIA MUESTRAL CONTENIDOS PROCEDIMENTALES Formula y soluciona problemas de las Distribuciones Normal y Muestral aplicadas a su profesión. Interpreta gráficos de las Distribuciones respectivas Formula preguntas relacionadas con su profesión , aplicaciones actuales y futuras. Elabora los datos de entrada y salida por computadora. CONTENIDOS ACTITUDINALES Evalúa adecuadamente las Distribuciones Relacionadas con sus usos . Asume con actitud de colaboración y respeto al grupo asignado Valora con propiedad las implicancias para el desarrollo de su profesión de las distribuciones estudiadas CONTENIDOS CONCEPTUALES TEMA N° 10 DISTRIBUCION NORMAL TEMA N° 11 DISTRIBUCION DE LA MEDIA MUESTRAL TEMA N° 12 DISRRIBUCION DE LAS PROPORCIONES 87 DISTRIBUCIÓN PARA VARIABLES CONTINUAS DISTRIBUCIÓN NORMAL DISTRIBUCIÓN DE LA MEDIA MUESTRAL Y DE PROPORCIONES 88 TEMA N°10 DISTRIBUCIÓN DE PROBABILIDADES PARA VARIABLES ALEATORIAS CONTINUAS Distribución Normal E13: Para la distribución continua de probabilidad de la figura dada, la probabilidad de que un embargue seleccionado al azar tenga un peso neto entre 6000 y 8000 kilogramos es igual a la proporción del área total bajo la curva que se encuentre bajo el área sombreada. Es decir se define que el área total bajo la función de densidad de probabilidad es igual a 1, y se puede determinar la proporción de esta área que se encuentra entre dos puntos determinados. f(x) 2000 4000 6000 8000 10000 12000 Peso, Kg Existen diversas distribuciones continuas de probabilidades comunes que son aplicables como modelos a una amplia gama de variables continuas en determinadas circunstancias. Existen tablas de Probabilidades para esas distribuciones estándar para determinar las áreas bajo la curva de probabilidad para estas distribuciones (con la distribución normal). La Distribución Normal de Probabilidad Es una distribución continua de probabilidad que es al mismo tiempo, simétrica y mesokúrtica definidas en él capitulo 3. Se describe a la curva de probabilidad que representa a la distribución normal como una campana. f(x) x 89 Uso de las Tablas de Distribución Normales Las tablas de las probabilidades normales se basan en una distribución específica: la Distribución Normal Estándar. Esta es una distribución normal en la que u = 0 y = 1. Cualquier valor x de una población con distribución normal estándar equivalente, z, mediante la fórmula. xu Z En el apéndice 5 se obtienen las posiciones de área para diversos intervalos de valores para la distribución normal estándar, en donde el límite inferior del intervalo es siempre la media. Aquí se transforman los valores designados de la variable x en valores normales estándar. E14: Se ha ajustado el proceso de fabricación de un tornillo de precisión de manera que la longitud promedio de los tornillos sea u = 13.0 cm. Por supuesto, no todos los tornillos tienen una longitud exacta de 13 centímetros, debido a fuentes aleatorias de variabilidad. La desviación estándar de la longitud de los tornillos es = 0,1 cm. y se sabe que la distribución de las longitudes tienen una forma normal. Determine la probabilidad de que: un tornillo elegido al azar tenga una longitud de entre 13,0 y 13,2 cm., e ilustre la proporción del área bajo la curva normal asociada con este valor de probabilidad. De la figura (a) E15: Del problema anterior ¿Cuál es la probabilidad de que la longitud del tornillo exceda de 13,25 cm?. Ilustre la proporción del área bajo la curva normal correspondiente a este caso. E16: Del problema anterior, ¿Cuál es la Probabilidad de que la longitud del tornillo este entre 12,9 y 13,1. ¿Ilustre la proporción de área bajo la curva normal correspondiente a este caso. E17: Del problema E16, ¿Cuál es la probabilidad de que la longitud de los tornillos se encuentren entre 12, 8 y 13,1 cm.? Ilustre la proporción del área bajo la curva normal para este caso. 90 Solución u = 13,0 = 0,1 P(12,8 x 13,1) Si Z xu 12,8 De la figura: X1 u 13,0 X1 13,1 X2 12,8 13,0 2,0 0,1 X u 13,1 13,0 Z2 2 1,0 0,1 Z1 P(12,8 X 13,1) = P(-2,0 Z +1,0) = 0,4772 + 0,3413 = 0,8185 E18: Del Prob. E16: ¿Cuál es la probabilidad de que la longitud del tornillo este entre 13,1 y 13,2 cm.? Ilustre la proporción del área bajo la curva normal muy importante para este caso. E19:La Distribución Normal de trabajadores de una Industria tiene u = 50 años y = 5 años, 20 % de los trabajadores están bajo una cierta edad. ¿Cuál es la edad?. E20: La estatura media de los soldados de un regimiento es de 170 cm., 10% de estos soldados miden mas de 175 cm. Si tiene una distribución Normal. ¿Cuál es ? TALLER 6 ACTIVIDAD APLICATIVA AUTOEVALUACIÓN Distribución Normal 14. La estatura de los soldados de un regimiento está distribuida normalmente con una media de 69 pulgadas y una desviación estándar de 2 pulgadas. a. ¿Cuál es la probabilidad de que un soldado mida mas de 72 pulgadas? b. ¿Cuál es el porcentaje de soldados cuyas estaturas están entre 69 y 73 pulgadas? c. Si para la realización de una cierta misión, un soldado debe estar en el 20% de los de mayor estatura, ¿Cuál es la estatura mínima para participar en esta misión?. 91 15. Un rodamiento es considerado defectuoso y por lo tanto es rechazado si su diámetro es mayor que 2.02 pulgadas o menor que 1,98 pulgadas. ¿Cuál es el número esperado de rodamientos rechazados si los diámetros de una partida de 10,000 rodamientos están distribuidos, normalmente con una media de 2 pulgadas y una desviación estándar de 0.01 pulgadas?. 16. Los puntajes finales en un curso de Psicología están distribuidos normalmente con una media de 60 y una desviación estándar de 10. a. Si el puntaje mínimo para aprobar es 48, ¿Cuál es el porcentaje de fracasos? b. Si han de aprobar el 80% de los estudiantes, ¿Cuál debe ser el puntaje mínimo aprobatorio? 17. En una industria alimenticia se comercializa harina en paquetes de “PESO NETO 500 grs.”. El proceso automático de llenado de los paquetes puede regularse de modo que la cantidad media de harina por paquete puede ajustarse al nivel que se desee. Suponiendo que la cantidad de harina por paquete se distribuye normalmente con una desviación estándar de 0,2 onzas. a. ¿A qué nivel debe ajustarse el llenado medio de modo que solo el 0,001 de los paquetes tengan un peso neto inferior a 12 onzas? b. ¿A qué nivel debe ajustarse el llenado medio de modo que solo el 0,05 de los paquetes tengan un peso neto superior a 12,4 onzas?. 18. El peso medio de una piña en una partida grande es de 5 libras. El 10% de las piñas pesan menos de 4 libras. Suponiendo que los pesos están distribuidos normalmente. ¿Cuál es la desviación estándar de la partida?. 19. Un estudio reporta los salarios iniciales anuales de los contadores recientemente egresados, y los promediaba en 22500 soles, con una desviación estándar de 2250 soles. Si los salarios siguen una distribución normal. ¿Cuál es la probabilidad y los porcentajes de que un recién egresado gane: a) más de 21,000 soles b) menos de 25000 soles c) entre 24000 y 26000 soles d) como mínimo 20000 soles? 92 SOFTWARE ESTADÍSTICO (Aplicación por Computadora) DISTRIBUCIÒN NORMAL Caso Estudio 1: LA TELEFÓNICA tiene un programa de entrenamiento para mejorar la calidad de las habilidades de supervisión de los supervisores .Un estudio de los participantes indica que el tiempo medio usado para completar el programa es de 500 horas, y que esta variable aleatoria normalmente distribuida tiene una desviación estándar de 100 horas.¿ Cuál es la probabilidad de que un participante elegido al azar requiera entre 500 y 650 horas para completar el programa de entrenamiento? SOLUCIÓN UTILIZANDO EL PROGRAMA ESTADÍSTICO MINITAB 15 1.- Abrir el Minitab. Clic en Graph 2.- Colocarse en el siguiente Menú y opciòn: GraphProbability DistributionPlot: Ver gráfica en clase 3.- Se despliega la ventana de ProbabilityDistributionPlots: Clic en View Probability Clic OK :Ver gráfica en clase 4.- Seleccionar Distribución Normal Introducir los valores de la Media (Mean) y la Desviación Estàndar (Standard deviation): Ver gráfica en clase 5.- Clic en ShadedArea, Seleccionar X Value, clic en Middle y proporcionar los valores de X1 Y X2. Clic OK: Ver gráfica en clase 6.- Minitab despliega la grafica de la distribución normal con el valor de la probabilidad sombreado: Ver gráfica en clase la probabilidad de que un participante elegido al azar se tome entre 500 y 650 horas para completar el programa de entrenamiento es de 0.433. Caso Estudio 2 Una empresa Auditora realiza estudios especiales de Investigación Científica, dichos estudios se distribuyen normalmente con una duración media de 820 horas (desde el inicio hasta el término de dichos estudios). Con una desviación estándar de 42 horas. ¿Cuál es la probabilidad de que un estudio elegido al azar requiera entre 820 y 855 horas para concluirlo? 93 TEMA N°11 DISTRIBUCIÓN DE LA MEDIA MUESTRAL ORG ANIGRAMA DISTRIBUCIONES MUESTRALES De Medias Muestrales Distribución Muestral dela Media Error Estándar Muestral De la Media Aplicación a Distribución Normal Factor de Corrección por población finita Teorema del Limite Central De Proporciones Muestrales Regla de proporciones Muestrales. Error Estándar de la Proporción. Aplicación a Distribución Normal Factor de Corrección Por población finita. Teorema del Limite Central. 94 Debido a factores como tiempo y costo, se estiman los parámetros poblacionales desconocidos por ejemplo la media (u) examinando la información de la muestra ( x ) de la población, la cual debe ser representativa de la población objeto del estudio. Por ejemplo, si deseamos hallar el interés hacia el estudió por parte de los estudiantes universitarios de un facultad; en este caso la población más importante es la recolecci ón de respuestas de los estudiantes de la facultad sobre el interés hacia el estudio. Aquí tomaremos una parte de esta población (muestra), y la usaremos para normar el interés de los estudiantes hacia el estudio. Si nos basamos en las respuestas de miemb ros de otras fuentes u otras instituciones obtendremos sobre todo respuestas sesgadas (visión distorsionada de las actitudes de las actitudes de los estudiantes en conjunto) o desviadas a favor del estudio. CONSIDERACIONES GENERALES Si obtenemos muestras aleatorias de una población, éstas por su naturaleza propia no se pueden predecir, sólo se pueden hacer afirmaciones probabilísticas sobre una población cuándo se usan muestras representativas de la misma. Para cualquier tamaño de muestra n, tomado de una misma población con media (u), los valores de la media muestral x , varían de una muestra a otra. Esta variabilidad sirve de base para la distribución muestral. Si estudiamos un estadístico como la media muestral ( x ), a partir de las medidas en muestras aleatorias, tendremos que enlistar la distribución de los valores posibles de este estadístico asociados a su probabilidad respectiva. DISTRIBUCIÓN MUESTRAL DE LA MEDIA E1: Si tenemos una población de N=4, que indican los ingresos anuales de 4 analistas de sistemas 10, 20, 30 y 40 (en miles de soles) a.- Calcular la media de la población (u) b.- La desviación estándar poblacional ( ) c.- Si tomamos muestras aleatorias de tamaño n=2 hacer una lista de todos los pares posibles de las diferentes muestras de la media. 95 Para cada uno de los pares identificados, calcule la media muestral x con su respectiva probabilidad, y demuestre que la media de todas las medias muestrales posibles (u x ) es igual a la media de la población (u) de donde se seleccionaron las muestras. ERROR ESTÁNDAR MUESTRAL DE LA MEDIA ( x ) S x La Distribuciónmuestral de las medias Muestrales tiene una desviación estándar, a esta desviación estándar de la distribución de todas las medias Muestrales también se le denomina error estándar de la media el cual mide la dispersión de las observaciones individuales (medias muestrales) en torno a la media de las medias muestrales u x = u, también indica la precisión de la media muestral. Fórmula del error estándar: x x Ns Ns x 2 2 donde: x = error estándar de la media Como la fórmula dada requiere mucho cálculo aritmético también podemos hallar el error estándar así; para una población tenemos: x n Error Estándar Estimado S Sx n MUESTRAS DE CORRECCIÓN POBLACIONES FINITAS – FACTOR DE Cuando se muestra a partir de una población finita (no infinita) se debe incluir un factor de corrección en la fórmula para el error estándar de la media como regla general, la corrección es despreciable y puede omitirse cuando n < 0,05 N es decir cuando el tamaño de la muestra es menos del 5% del tamaño de la población. Fórmula del error estándar de la media incluyendo el factor de corrección por población finita: x n N n N 1 96 E2: Del primer ejemplo demostraremos que al utilizar las dos fórmulas del error estándar dadas, el resultado es el mismo. INTERPRETACIÓN: las 6 medias Muestrales posibles tienen una media = 25 = ux = u, las cuales tienden apartarse de 25 en 6,45. E3: Un contador toma una muestra aleatoria de tamaño n =16 de un conjunto de N = 100 cuentas por cobrar. No se conoce la desviación estándar de los montos de las cuentas por cobrar para el total de las 100 cuentas. Sin embargo, la desviación estándar de la muestra es S = $57.00. Hallar el error estándar para la distribución muestral de la Media. Solución sx s n N n 57 N 1 16 100 16 57 84 100 1 4 99 14,25 0,8484 14,25(0,9211) 13,13 En el ejemplo dado se estima el error estándar de la media con base en la desviación estándar muestral, y se requiere utilizar el factor de corrección por población finita por que no es cierto que n < 0,05 N, es decir 16 > 0,05(100) El error estándar de la Media ofrece la base principal para la inferencia estadística con respecto a la media de una población que se desconoce. En este capítulo un teorema de la estadística usado para hallar la utilidad del error estándar de la media es: TEOREMA DEL LIMITE CENTRAL – DISTRIBUCIÓN NORMAL EN DISTRIBUCIÓN MUESTRAL DE LA MEDIA TALLER 8 E4: Un Contador – Auditor toma una muestra de tamaño n = 36 de una población de 1000 cuentas por cobrar. El valor promedio de las cuentas por cobrar de la población es u = $2600 con una desviación estándar poblacional de = $450. ¿Cuál es la probabilidad de que la media muestral sea inferior a $2500? E5: Con referencia al ejemplo anterior. ¿Cuál es la probabilidad de que la media muestral se encuentre a no más de $150 de la media de la población? E6: En un estudio para comparar la producción promedio mensual en miles de unidades producidas por COCA-COLA y KOLA REAL se usará una muestra aleatoria de 20 y 25 trabajadores de c/u de las 97 empresas . Se sabe que la producción por trabajador siguen una distribución normal. El promedio de la producción de todos los trabajadores de COCA_COLA es de 100 unidades y su desviación estándar es de 14.142, mientras que el promedio de la producción de todos los trabajadores KOLA REAL es de 85 unidades y su desviación estándar es de 12.247 unidades. Si y representan el promedio muestral de la producción de los 20 y 25 trabajadores respectivamente. Encuentre la probabilidad de que el promedio de las unidades producidas por los 20 trabajadores sea al menos 20 unidades más que el de los 25 trabajadores. Solución: Datos: 1 = 100 unidades; 2 = 85 unidades ; 1 = 14.142 unidades; 2 = 12.247 unidades ; n1 = 20 trabajadores; n2 = 25 trabajadores; =? Por lo tanto, la probabilidad de que el promedio de las unidades producidas de la muestra de trabajadores de COCA-COLA sea al menos 20 unidades más que el de la muestra de los trabajadores de KOLAREAL es 0.1056. 98 TEMA N° 12 DISTRIBUCIONES MUESTRALES DE PROPORCIONES Las distribuciones Muestrales de proporciones son usadas en muchos casos, sobre todo cuando se trata de hallar si una observación cumple o no una determinada característica. Por ejemplo, los políticos no siempre desean saber cuantas personas votarán por ellos, sino que porcentaje de la gente lo hará, es decir en lugar de medias Muestrales, nos encontramos con proporciones Muestrales. CALCULO DE UNA PROPORCIÓN MUESTRAL DE ÉXITOS – MEDIA DE LAS PROPORCIONES MUESTRALES. Utilizamos la siguiente fórmula: S p n donde : p = proporción muestral de éxitos. S = número de éxitos en una muestra. n = datos de la muestra. E6: Un político entrevista a 500 sufragantes, si sólo 200 de ellos votaron por él, hallar la proporción muestral de éxitos. Solución S 200 0,40 Sabemos: P n 500 Nota: Tal como estudiamos en distribución muestral donde u x (media de todas las medias Muestrales) = u(media de la población). En este caso: P = Donde: = media de las proporciones Muestrales. P = proporción de la población. CALCULO DEL ERROR ESTÁNDAR DE LA PROPORCIÓN Utilizamos la siguiente fórmula: (1 ) P n TEOREMA DEL LIMITE CENTRAL – DISTRIBUCIÓN NORMAL P ARA PROPORCIONES MUESTRALES La distribución de proporciones Muestrales se aproximará a una Distribución Normal cumpliendo el Teorema del Límite 99 Central aplicado a la distribución de proporciones Muestrales. Aquí se debe cumplir lo siguiente: n> 50 y Tanto n como n(1-) son mayores que 5. PARA UNA POBLACIÓN FINITA Se debe cumplir que n > 0,10N, para utilizar el factor de corrección por población finita: P (1 ) N n n N 1 E7: Un médico administra un medicamento a N = 5 pacientes. Los resultados de cada paciente son respectivamente muere, vive, vive, muere, muere. Hallar la media de todas las proporciones Muestrales, si se toman muestras de tamaño n = 2. También hallar el error estándar de las proporciones muestrales. Solución Las muestras posibles de tamaño n = 2 y la proporción de éxitos (vive), se indican en la tabla siguiente. Se cumple también 5C2 = 10. M = muere, Vive = V. Ns = Nº de muestras posibles = 10 S Sabemos: p n Donde: p = proporción muestral de éxitos. S = proporción de éxitos en una muestra. n = 2. Proporción de Muestra Éxitos P M1 V2 0,5 M1 V3 0,5 M1 M4 0,0 M1 M5 0,0 V2 V3 1,0 V2 M4 0,5 V2 M5 0,5 V3 M4 0,5 V3 M5 0,5 M4 M5 0,0 P = 4,0 P 4 0,40 P Ns 10 donde: p = proporciones. p = media de todas las proporciones. Ns = Nº de muestras posibles. 100 Es decir P (media de todas las proporciones ) es igual a u(media de la población) = 0,40. Cálculo del error Estándar de las Proporciones Muestrales. P (1 ) N n n N 1 (0,4)(0,6) 5 2 0,3 2 5 1 E8: Con referencia al problema E7. Si él médico administra el medicamento a muchos pacientes, de los cuales viven = 45%. Si se elige una muestra de 80 pacientes. ¿Cuál es la probabilidad que vivan mas de 40?. APLICACIÓN ESTADÍSTICA ¿Podrá Pedro ir a Hawai? Clairol vende un producto popular ideado para que las personas parezcan más atractivas. Según la empresa el 75% de todos los clientes potenciales con quienes se establece contacto por correo, compran el producto. Pedro envía 200 cartas en las que ofrece vender el producto. Tiene que hacer 160 ventas. Como mínimo para financiar el viaje que tiene programado a Hawai. ¿Cuál es la probabilidad de que lo consiga? TALLER 9 ACTIVIDAD APLICATIVA – AUTOEVALUACIÓN DISTRIBUCIONES MUESTRALES 1. Se sabe que la vida útil promedio de los focos de transparencias es = 9000 horas, con una desviación estándar de 500 horas. Determine el valor esperado y el valor estándar de la distribución muestral de la media, con un tamaño de muestra de n = 25. Interprete el significado de los valores calculados. 2. Para una población grande de saldos de cuentas que tienen distribución normal, se tiene un saldo promedio de = $ 150,000.00, con desviación estándar = $ 35,000 cuál es la probabilidad de que una cuenta muestrada al azar tenga un saldo que excede de $ 160,000. Con referencia al problema anterior, ¿cuál es la probabilidad de que la media de una muestra aleatoria de n = 40 cuentas exceda de $ 160,000? 3. 101 4. De un estudio contable se toma alzar una muestra de 500 empleados de un número mayor a ellos. Los trabajadores realizan labores a destajo y se encuentran que el producto medio de pago por cliente es de 2000 nuevos Soles, con una desviación estandarmuestral S=200 Nuevos Soles. Hallar el pago promedio a destajo para todos los empleados de la empresa, con un intervalo de confianza del 90%. 5. El banco de Crédito toma una muestra n = 600 de una población de 1200 clientes que cuentan con tarjeta de crédito, el valor promedio de los créditos es de 3200 con una desviación estandar poblacional de 600 Nuevos Soles . Hallar la probabilidad de que la media muestral sea superior a 3350 Nuevos Soles. 6. Para ilustrar el significado de la distribución muestral de la media se hace referencia a una población altamente simplificada. Suponga que una población consta solamente de cuatro valores: 3, 5, 7 y 8. Calcule (a) la media de la población , y (b) la desviación estándar de la población . 7.- Para la población que se describió en el problema anterior, suponga que se toma muestras aleatorias simples de tamaño n = 2, de esa población. En cada una de las muestras, antes de elegir el segundo elemento muestral, no se reemplaza el primer elemento escogido. a) Hacer una lista de todos los pares posibles que puede constituir una muestra. b) Para cada uno de los pares identificados en (a), calcule la media muestral X y demuestre que la media de todas las medias muestrales posibles x es igual a la media de la población de donde se seleccionaron las muestras. 8. Para la situación de muestreo que se describió en los problemas anteriores, calcule el error estándar de la media determinando la desviación estándar de las seis medias muestrales posibles que se identificaron en el problema anterior, con respecto a la media poblacional . Después calcule el error estándar de la media con base en la que se conoce y, tratándose de un muestreo en una población finita, utilice la fórmula apropiada y verifique que los dos valores del error estándar sean iguales. 9. Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años con una desviación estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos un año más que la de una muestra aleatoria de 40 tubos de la compañía B. 102 UNIDAD IV ESTIMACIÓN CON INTERVALOS DE CONFIANZA, PRUEBA DEHIPÓTESIS ORGANIGRAMA ESTIMACIONES CON INTERVALOS DE CONFIANZA – PRUEBA DE HIPOTESIS Intervalos De Confianza Prueba De Hipótesis Estimación Puntual Medias Poblacionale s Medias Poblacionales Estadísticos utilizados Distribución t de Student Entre Dos Medias Poblacionales 103 CONTENIDOS PROCEDIMENTALES Interpreta y aplica los intervalos de Confianza y Prueba de Hipótesis Elabora un resumen de las principales aplicaciones en la toma de decisiones de Empresa Formula evidencias de las distintas formas de aplicar estas herramientas estadísticas en el marco empresarial, contable y en el Desarrollo de Tesis. En forma grupal determinan la regla de decisión en el Contraste de Hipótesis CONTENIDOS ACTITUDINALES Valora con propiedad, los resultados de la teoría y problemas expuestos de Intervalos de Confianza y Prueba de Hipótesis en su profesión. Distingue los métodos, procedimientos y técnicas del Contraste de Hipótesis, Acepta formar parte del grupo asignado con actitud de ayuda en el desarrollo de los problemas. CONTENIDOS CONCEPTUALES TEMA N° 13 INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL TEMA N° 14 DISTRIBUCION T DE STUDENT TEMA N° 15 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES TEMA N° 16 PRUEBA DE HIPOTESIS 104 ESTIMACIONES CON INTERVALOS DE CONFIANZA, PRUEBA DE HIPOTESIS INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL, DISTRIBUCIÓN T DE STUDENT DIFERENCIA DE MEDIAS PRUEBA DE HIPOTESIS JI-CUADRADA 105 TEMA N° 13 INTERVALOSDE CONFIANZA PARA LA MEDIA POBLACIONAL En este capítulo aprenderemos a determinar intervalos de confianza de medias poblacionales, proporciones poblacionales prueba de hipótesis, errores Tipo I y II así como intervalos de confianza y prueba de hipótesis con dos poblaciones. Los intervalos de confianza son utilizados para tomar numerosas decisiones relacionadas con la empresa; del mismo modo se estudiará la probabilidad de que una hipótesis sea cierta. Muchos problemas de las empresas exigen comparar dos poblaciones con el objeto de tomar decisiones correctas, estas se tomarán en las circunstancias en las cuales es esencial efectuar las comparaciones y el modo adecuado de efectuarlas. ESTIMACIÓN PUNTUAL – INTERVALOS DE CONFIANZA. E1: La dueña de una tienda, elige una muestra de n = 500 clientes, si x = 37,30 soles (consumo medio de la muestra); este valor seria la estimación puntual de la media poblacional. Una estimación de intervalo es la que define un intervalo dentro del cual puede estar el parámetro desconocido. La dueña de la tienda puede pensar que el promedio (u) de la población puede estar entre 36 y 39 soles. Donde el intervalo suele ir acompañado de una afirmación sobre el nivel de confianza (95%) que se asigna a su precisión. Por ello se llama intervalo de confianza. Relación de Estimadores Puntuales Utilizados: Parámetros de Población Media, u Diferencia entre las medias de 2 poblaciones u1 – u2 I. Proporción, Diferencia entre las propiedades de dos poblaciones; 1 - 2 Varianza, 2 Desviación Estándar, INTERVALO DE CONFIANZA PARA UTILIZANDO LA DISTRIBUCION NORMAL LA MEDIA x x1 x2 p̂ p1 p2 s2 s POBLACIONAL E2: En una semana determinada, se elige al azar una muestra de 300 empleados de un número muy grande de ellos que trabajan en una empresa manufacturera. Los trabajadores realizan una labor a destajo y se encuentra que el promedio de pago por pieza trabajada es de x =1800, con un desviación estándar muestral de S = $140. Hallar el pago promedio a destajo para todos los empleados de la empresa, con una 106 estimación por intervalo que permite tener una confianza del 95% de que ese intervalo incluye el valor de la media poblacional. TALLER 10 ACTIVIDAD APLICATIVA – AUTOEVALUACIÓN E3: En una encuesta política obtienen volantes que votaran por su partido en las próximas elecciones, en la cual se recopila una muestra aleatoria de 550 volantes, de un conjunto de 2000; el promedio del gasto es S/5250, con una desviación estándar de S/2575, utilizando un intervalo de confianza de 90%. hallar el monto promedio de gastos de los 2000 volantes E4: Si la desviación Estándar de la vida útil de focos especiales es = 0,500, no conocemos el promedio de vida útil. Si la distribución de la vida útil de los focos es normal. Para una muestra de n =15, la vida útil promedio es x = 8900 hrs. Construir intervalos de confianza para estimar la media de la población. a) Con el 95% b) Con el 90% de confianza. E5: Un analista de investigación de mercados recopila datos de una muestra aleatoria de 100 clientes, de un conjunto de 400 clientes que adquirieron equipo especial”. Las 100 personas gastaron un promedio x = $ 24570 en la tienda, con una desviación estándar de: S = $6,600. Utilizando un intervalo de confianza del 95%. Estime: a) El monto promedio de las compras para los 400 clientes. b) El monto total en dólares para las compras realizadas por los 400 clientes. TEMA N° 14 INTERVALO DE CONFIANZA PARA LA MEDIA CON DESVIACIÓN ESTANDAR () DESCONOCIDA – DISTRIBUCIÓN t DE STUDENT. Cuando hay que tomar una muestra pequeña (n<30), la distribución normal no siempre es la adecuada; Aquí es donde utilizamos una distribución alternativa, llamada distribución t de Student (o simplemente distribución t), la que debe cumplir las siguientes condiciones. La muestra es pequeña. La es desconocida. La distribución debe ser normal. 107 Así mismo, la distribución t, tiene una media igual a cero, es simétrica respecto de la media y se extiende de - a + . Cálculo del Estadístico (t) Se calcula como el estadístico Z. Su formula es: xu t Sx CALCULO DEL INTERVALO DE CONFIANZA PARA ESTIMAR LA MEDIA DELA POBLACIÓN u PARA MUESTRAS PEQUEÑAS. Despejando u de la fórmula dada obtenemos: x t gl S x x t gl S n Donde los grados de libertad gl<>df = n-1 TALLER 11 ACTIVIDAD APLICATIVA – AUTOEVALUACIÓN E5: Hallar t con un intervalo de confianza del 90, 95 y 99% y una muestra de 20 observaciones. E6: Un supervisor toma una muestra aleatoria de 12 sobres de cocoa en una planta empaquetadora. El peso neto de los sobres de cocoa es el que reporta la tabla siguiente: Determinar: a) El peso neto de la cocoa que se empaqueta en cada sobre. b) La Desviación EstándarMuestral. c) Si el peso de la cocoa empaquetado tiene distribución normal, estimar el peso promedio por sobre de cocoa utilizando un intervalo de confianza del 95%. Gramos por 15,7 sobre Número de sobres 1 15,8 15,9 16,0 16,1 16,2 2 2 3 3 1 Solución x por sobre 15,7 15,8 15,9 16,0 16,1 Nº de sobres 1 2 2 3 3 Total x 15,7 31,6 31,8 48,0 48,3 X2 por sobre 246,49 249,64 252,81 256,00 259,21 X2 Total 246,49 499,28 505,62 768,00 777,63 108 16,2 1 16,2 n = 12 x=191,6 Reemplazando en las fórmulas: a) x x 191,6 15,97 b) S n x 2 ( x ) 2 n 12 n(n 1) 0,0224 0,15 c) x t gl S x 15,97 t11 262,44 262,44 x2=3059,46 x 15,97 gr 12(3059,46 (191,6) 2 ) 12(11) S 0,15gr. S 0,15 15,97 2,201 n 12 15,97 15,97 2,201(0,043) 15,88 a 16,06 grs. INTERPRETACIÓN: El peso promedio por sobre se encuentra ente 15,88 y 16,06 grs TEMA N°15 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES UTILIZANDO LA DISTRIBUCION NORMAL. Existen numerosas ocasiones en que las empresas tienen que tomar decisiones las cuales se centran en las diferencias que puedan existir entre dos poblaciones, por lo cual se han desarrollado procedimientos estadísticos cuyo objetivo es contrastar la diferencia entre dos medias poblacionales o dos proporciones poblacionales. Por ejemplo, existe una diferencia significativa entre la duración media de las baterías para autos fabricadas por BATERIAS CAPSA y las que produce BATERIAS DELCO, así como la diferencia entre los niveles saláriales en dos empresas. Como se indico anteriormente en 8,1, el estimador no sesgado de (u1 – u2) es ( x1 x 2 ). El intervalo de confianza se construye de manera similar como se estima el de la media, así el error estándar de la distribución muestral que corresponde en este caso es el de la diferencia entre medias. El uso de la distribución normal se basa en las mismas condiciones que para el caso de la distribución muestral de la media ( en este caso existen dos medias). Fórmulas para estimar la diferencia entre las medias de dos poblaciones, con intervalos de confianza. u1 – u2 = ( x1 x 2 ) z x1 x2 109 u1 – u2 = ( x1 x 2 ) zS x1 x2 Fórmula del Error Estándar de la Diferencia entre dos medias. Cuando se conocen las desviaciones estándar de las dos poblaciones. x x x2 x2 1 2 1 2 Cuando no se conocen las desviaciones estándar de las dos poblaciones, el error estándar estimado para distribución normal es: S x1 x2 S x21 S x22 En éstas dos fórmulas dadas como hemos visto anteriormente, podemos incluir la posibilidad de utilizar los factores de corrección por población finita cuando sea apropiado. E6: El salario anual promedio para una muestra de n = 30 empleados de una empresa industrial grande es x = S/. 28000, con una desviación estándar de S/. 1400. En otra empresa grande, una muestra aleatoria de n =40 empleados tiene un salario promedio anual de S/. 27000, con desviación estándar muestral de S = S/. 1000. Hallar el intervalo de confianza del 99% para estimar la diferencia entre los niveles anuales de salarios en las dos empresas. Solución Sabemos: Int. del 99% = ( x1 x 2 ) Z S x x 1 S x1 x2 S S 2 x1 2 2 x2 En donde: x1 x 2 = S/. 28000 – S/. 27000 = S/. 1000 Z = 2,58 S x1 S1 1400 1400 255,60 n1 30 5,477 S x2 S2 1000 1000 158,11 n2 40 6,325 110 S x1 x2 (255,60)2 (158,11)2 300,55 Reemplazando Tenemos: Int. del 99% = S/. 1000 2,58 (300,55) = 1000 – 775,4 a 1000 + 775,4 = 225 a 1775 Es decir: 225 u1 – u2 1775 INTERPRETACIÓN: Puede estimarse que el salario anual promedio de la primera empresa es mayor que el correspondiente a ala segunda en una cantidad que va de S/. 225 a S/. 1775 con una confianza del 99% en una estimación por intervalo. TALLER 12 ACTIVIDAD APLICATIVA – AUTOEVALUACIÓN E1: Una revista describía una prueba por Daniel S.A. para comparar la eficacia de dos tipos de fertilizantes químicos. Se trataron 50 hectáreas con cada uno de los tipos . Los incrementos de producción por hectárea de trigo dieron medias de x1 = 14,2 litros para el fertilizante 1 y de x2 = 17,5 litros para el fertilizante 2. Las desviaciones estándar de ambos fertilizantes eran de 1 =1,92 y 2 =2,05. Calcular el intervalo de confianza del 99% para estimar la diferencia de la eficacia en los dos fertilizantes. E2 Un contador toma una muestra de 49 clientes de una empresa industrial que pagan al crédito donde el valor promedio de estos son $1750 con un desviación estándar de $630 , y en la otra empresa comercial en una muestra de 64 clientes el promedio de personas que pagan a crédito es de $1130 con una desviación estándar muestral de $570 . calcular el intervalo de confianza del 99% para estimar la diferencia entre la cantidad de clientes que pagan al crédito. SOFTWARE ESTADISTICO (APLICACIÓN POR COMPUTADORA) CASO ESTUDIO 1. En una Empresa Auditora un contador toma una muestra promedio de 36 cuentas por cobrar diferentes de valor 2.6 mill. de soles. Encuentre el intervalo de confianza del 95% para la media poblacional suponiendo que la desviación estándar de la población es de 0,3 mill. de soles. SOLUCION CON MINITAD 15 1. - Se colocan los datos.(Ver grafico en clase) 2. - Poner en stat-basic statics-1-sample z.(Ver grafico en clase) 111 3. - Colocar los datos.(Ver grafico en clase) 4.- Luego aparecerán los resultados pedidos en la pregunta.(Ver grafico en clase) TEMA N°16 PRUEBA DE HIPÓTESIS ¿Qué es una hipótesis? - Hipótesis: enunciado acerca de una población elaborada con el propósito de ponerse a prueba. - Ejemplos de hipótesis acerca de un parámetro de población son: La media mensual de ingresos para contadores es $ 3625 El 20 % de los delincuentes juveniles son capturados y sentenciados a prisión. ¿Qué es una prueba de hipótesis? Prueba de hipótesis: procedimiento basado en la evidencia muestral y en la teoría de probabilidad que se emplea para determinar si la hipótesis es un enunciado razonable y no debe rechazarse o si no es razonable y debe ser rechazado. Prueba de Hipótesis. Paso 1: Plantear la hipótesis nula y alterna Paso 2 : Seleccionar un nivel de significancia Paso 3: Identificar el valor estadístico de prueba Paso: 4 Formular una regla de decisión Paso 5 : Tomar una muestra, llegar a una decisión No rechazar la hipótesis nula Rechazar la hipótesis nula y aceptar la alterna Prueba de significancia de una cola Una prueba es de una cola cuando la hipótesis alterna, H1, establece una dirección, como: H0: el ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres. H1: el ingreso medio de las mujeres es mayor que el de los hombres. 112 Prueba de significancia de dos colas: Una prueba es de dos colas cuando no se establece una dirección específica de la hipótesis alterna H1, como: H0:el ingreso medio de las mujeres es igual al ingreso medio de los hombres H1: el ingreso medio de las mujeres no es igual al ingreso medio de los hombres. E1: Un Fabricante de “Crispy”un nuevo alimento para el desayuno, esta preocupando por el peso medio de cereales que se envasa en sus cajas. Estas anuncian un peso neto de 36 onzas. Si el fabricante desea realizar la prueba de hipótesis aun nivel de significancia del 5%. Si se elige al azar una muestra de x = 37,6 onzas y una desviación estándar de S = 3 onzas. Determinar el sistema de hipótesis y realizar la prueba Solución u = 36 onzas = 5% x = 37,6 S = 3 onzas n = 100 Ho: u = 36 H1: u 36 Sabemos: xCR uH ZSx = 36 (1,96)(0,3) = 36 0,588 35,41 hasta 36,59 95% 35,41 Rechazo /2 = 0,025 uH=36 36,59 INTERPRETACIÓN. Como la media muestral x = 37,6 la cual está sobre 36,59; entonces se rechaza la hipótesis nula. Es improbable que u = 36, soló hay una probabilidad del 2,5% de que una muestra diera un media mayor que 36,59. TALLER 13 ACTIVIDAD APLICATIVA – AUTOEVALUACIÓN E2: Un contador piensa que el número medio de días necesarios para realizar un trabajo debe ser u = 27. Si la media es menor que 27, el contador teme que el trabajo se ejecute con descuido de calidad, mientras que una media por encima de 27 puede dar lugar a unos gastos innecesarios. Se eligen al azar 50 trabajos con objeto de probar (contrastar esta afirmación). 113 Se encuentra que la media es x =25,3 días, con una desviación estándar S = 2,1 días. El contador desea probar (contrastar) la hipótesis con nivel de significancia del 1% (99% de confianza). Determinar el sistema de hipótesis y realizar la prueba. Si rechaza la Hipótesis nula, el contador tendrá que volver a valorarel proceso de trabajo para garantizar que se siguen procedimientos adecuados Solución u = 27 n = 50 x = 25,3 S = 2,1 = 1% Ho: u = 27 H1: u 27 Ho:0,99 26,23 Rechazo /2 = 0,005 0,4950 uH=27 27,77 Z = 0,99:2 = 0,4950 = 2,58 E3. El Administrador de una comunidad informa a una empresa que para construir un centro comercial el ingreso promedio por hogar es de $3000. si los ingresos siguen distribución normal con S = $411.95, después de un previo estudio, se encuentra que el ingreso promedio por hogar para una muestra aleatoria de 15 hogares es $2910.pruebe la hipótesis con alfa = 5% E4. Si la vida útil de las focos de una marca específica es cuando menos 4200 hrs. La vida útil promedio para una muestra aleatoria de n = 10 focos es x 4000 hrs. con desviación estándar muestral S = 200hrs. Si tiene vida útil D. normal – probar la hipótesis con alfa = 5% Solución n = 10 Ho: 4200 hrs. H1: < 4200 tCRÍTICA (gl = 9, x = 0,05) = -1,833 Sx S 200 200 63,3hrs. n 10 3.16 CAL x 0 4000 4200 3,16 Sx 63.3 HO Acepta HI 114 tCAL = -3,16 tCRITICO = -1,833 Interpretación: Se rechaza Ho, se acepta H1 de que 1< 4200 LA PRUEBA ESTADÍSTICA DE JI – CUADRADA PRUEBAS PARA LA INDEPENDENCIA DE DOS VARIABLES CATEGÓRICAS (PRUEBAS PARA TABLAS DE CONTINGENCIAS) Las “pruebas de independencia” implican dos variables categóricas y lo que se prueba es la suposición de que las variables son estadísticamente independientes. Pero el problema que nos interesa es saber si las dos variables son estadísticamente dependientes o que están relacionadas. Como se trabaja con dos variables, se anotan las frecuencias observadas (f o) y esperadas (fe) en una tabla de clasificación doble o Tabla de contingencias. Mediante la expresión r x c se definen las dimensiones de este tipo de Tablas, en donde r indica el número de renglones (filas) y c el número de columnas. Pero la Ji – cuadrada nos permite también comparar dos atributos (variables) para determinar si hay alguna relación entre ellos. Consideremos, por ejemplo, que un especialista en marketing quisiera determinar si hay alguna conexión entre los niveles de renta de los consumidores y su preferencia por el producto que él vende. Este procedimiento implicaría comparar dos atributos: rentas y preferencias. La comparación de dos atributos para determinar si son independientes se realiza analizando la diferencia entre frecuencias observadas reales y frecuencias esperadas. El cálculo de la JI cuadrada (x2) para el análisis de una tabla de contingencia también es fácil de hallarla e interpretarla usando el programa apropiado de alguno de los paquetes estadísticos como el SAS, Minitab, SPSS y otros. PRESENTACIÓN: EJEMPLO PARA SER APLICAD CON LA PRUEBA ESTADISTICA DE JI-CUADRADA EJEMPLO DEL TIPO 1: Este es un ejemplo del formato mas resumido de una tabla de contingencia donde se consideran las dos variables, se trata de una tabla de contingencia de 2 x 2. CUADRO 1 A1 Jabón B1 40 B2 60 100 A2 110 90 200 Total 150 150 300 Ingresos Total En el Cuadro 1 115 Observamos en los totales de las filas (renglones) y columnas que: 150 + 150 = 300 personas 100 + 200 = 300 Personas 100 tienen ingresos A1, y 200 tienen ingresos A2 También 150 usan jabón B1, y 150 usan jabón B2 Resultando: CUADRO 2 Ingresos Jabón B1 B2 Total A1 100 A2 200 Total 150 150 300 Investigando (Por encuesta, entrevista) Se encontró que 40 de los 100 tienen renta A1 y jabón B1, entonces sin necesidad de investigar se halla automáticamente que 100 – 40 – 60 Del mismo modo se determina los valores de 110 y 90 frfc Utilizando fe = n ygl = (r – 1 ) (c – 1) Donde: fe = Frecuencia esperada fr = Es la frecuencia total de una fila determinada fe = Es la frecuencia total de una columna determinada gl = Grados de libertad fe1 = frfc 100 x150 50 n 300 fe2 = frfc 100 x150 50 n 300 fe3 = frfc 200 x150 100 n 300 fe4 = frfc 200 x150 100 n 300 Obtenemos: CUADRO 3 Ingresos Jabón Total 116 A1 B1 40 (50) B2 60 (50) 100 A2 110 (100) 90 (100) 200 Total 150 150 300 PRUEBA DE HIPÓTESIS NULA DE INDEPENDENCIA PARA LOS DATOS DE LA TABLA ANTERIOR UTILIZANDO UN NIVEL DE SIGNIFICANCIA DEL 5% FORMULADE JI CUADRADA: ( f fe ) X2 = 0 fe Donde: fe = Frecuencia esperada f0 = Frecuencia observada Hipótesis nula = H0 = No existe una relación estadísticamente significativa entre los ingresos de una persona y la clase de jabón que usa. Por tanto son independientes. Hipótesis alterna: HA = Existe una relación estadísticamente significativa entre los ingresos de una persona y la clase de jabón que usa por tanto son dependientes. gl = (r – 1) (c – 1) = (2 – 1 ) (2 – 1) = 1 ( f fe ) X2 = 0 fe X2 = (40 50) 2 (60 50) 2 110 100) 2 (90 100) 2 6 50 50 100 100 En la tabla de la Ji cuadrada (X2), y para un nivel de significancia de 5 por ciento hallamos 3.841 entonces como la estadística de prueba de 6 excede el valor crítico de 3.841. Por ello se rechaza la hipótesis Nula de independencia y se concluye que existe una relación estadísticamente significativa entre los ingresos de una persona y la clase de jabón que usa. TALLER 14 ACTIVIDAD APLICATIVA AUTOEVALUACION ESTIMACIONES CON INTERVALOS DE CONFIANZA – PRUEBA DE HIPOTESIS COMPLEMENTARIOS CON EL TALLER ANTERIOR. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL UTILIZANDO LA DISTRIBUCIÓN NORMAL 1. Un fabricante desea estimar el nivel mensual medio de producción de su empresa, si toma una muestra de n = 100 y una media muestralde 117 x = 112 toneladas, con = 50 toneladas y un intervalo de confianza del 95%. Este promedio mensual será. 2. Si la media muestral es 42,5, construir un intervalo de confianza del 90% para la media poblacional si n = 81 y = 15,3. 3. Con la información del problema anterior, construir un intervalo de confianza del 99%. ¿Por qué es diferente? 4. Una muestra de 100 observaciones tiene una media de 16,3 ¿cuál será el intervalo de confianza de 95% si = 3,7? 5. Construir el intervalo de confianza del 95% con la información del problema anterior si ahora = 5,7. Explicar la diferencia. 6. Si la desviación estándar S de la vida útil de focos especiales es 500, con distribución normal, para una muestra de n = 15, la vida útil promedio x = 8900 hrs. a) Constrúyase el intervalo de confianza del 95% para estimar la media de la población y compare ese intervalo con la respuesta que obtuvo en el problema E3 (a). b) Constrúyase el intervalo de confianza del 90% para estimar la media de la población y compare este intervalo con la respuesta dada al problema E3(b). 7. El JaponésTaguchi inventó el concepto de función de pérdida de calidad (FPC), que establece una relación directa entre el costo de la calidad y la varianza del proceso de producción. IBM y otras empresas norteamericanas han adoptado la enseñanza de Taguchi para reducir costos sin disminuir la calidad del producto. Una muestra de medidas de costo para nuevo coprocesador de IBM ha arrojado una pérdida de 212,10 dólares con una desviación estándar de 57,10 dólares. a) Construir e interpretar un intervalo de confianza del 99% si el tamaño muestral era de 500 coprocesadores. b) Construir e interpretar un intervalo de confianza del 99% si el tamaño muestral era de 100. c) Explicar por que el segundo intervalo es más extenso si el nivel de confianza de los 2 es de 99%. 8. En una empresa constructora, un contrato establece que en un determinado tipo de trabajo se debe gastar una media de 1150 dólares. Para ahorrar tiempo, el tribunal sólo convocó a los directores de 12 agencias gubernamentales para declarar en relación con las cuentas de gasto de la empresa. Si de las declaraciones se dedujo una media de 1275 dólares y una desviación estándar de 325 dólares 118 ¿apoyaría un intervalo de confianza del 95% la postura de la empresa? (La cual fue causada por inflar los gastos de contratos de construcción). Las cuentas de los gastos siguen distribución normal. PRUEBA DE HIPÓTESIS 9. Un auditor desea probar el supuesto de que el valor promedio de toda las cuentas por cobrar en una empresa determinada es 260 000 soles, tomando una muestra de n = 36 y calculando la media muestral, desea rechazar el valor supuesto de 260 000 soles solo si la media muestral lo contradice en forma clara, por lo que debe (darse el beneficio de la duda) al valor hipotético en el procedimiento de prueba. Hallar las hipótesis nula y alternativa para esta prueba. 10.Con referencia al problema 9, determinar los valores críticos de la media muestral para probar la hipótesis con un nivel de significancia del 5%. Sabiendo que a la desviación estándar de las cuentas por cobrar es = 43 000. 11.Con referencia a los 2 problemas anteriores suponga que la x = 240 000. Determine si se debe aceptar o rechazar la hipótesis nula. 12 Con referencia a los problemas anteriores partimos de la hipótesis nula que la media de todas las cuentas por cobrar es de cuando menos 260 000 soles, probar la hipótesis con un nivel de significancia del 5%. 119 APENDICE II: DISTRIBUCION BINOMIAL 120 APENDICE II: DISTRIBUCION BINOMIAL (CONT) 121 122 APENDICE II: DISTRIBUCION BINOMIAL (CONT) 123 APENDICE II: DISTRIBUCION BINOMIAL (CONT) 124 APENDICE II: DISTRIBUCION BINOMIAL (CONT) 125 APENDICE II: DISTRIBUCION BINOMIAL (CONT) 126 APENDICE IV: DISTRIBUCION DE POISSON 127 APENDICE IV: DISTRIBUCION DE POISSON 128 APENDICE IV: DISTRIBUCION DE POISSON (CONT) 129 DISTRIBUCION DE POISSON (CONT) 130 APENDICE IV: DISTRIBUCION DE POISSON (CONT) 131 APENDICE IV: DISTRIBUCION DE POISSON (CONT) 132 APENDICE V: DISTRIBUCION NORMAL 133 APENDICE VI DISTRIBUCION t DE STUDENT 134 EJERCICIOS Y PROBLEMAS ADICIONALES Aproximaciones. 0.9845 3.9855 1,445 aproximar a milésimos:……………………….. aproximar a milésimos:……………………….. aproximar a centenas con un decimal:………… El Número de habitantes de cada una de 40 viviendas son: 5, 6, 1, 7, 3, 1, 4, 8, 2, 3,5,7,1,3,4,5,6,8,3,4,5,2,5,4 6,7,2,3,5,4,6,4,3,2,6,4,3,4,5,6. Determinar su media aritmètica, su mediana y su moda. 3. Para la siguiente distribución CLASES (Alturas cm.) 118-127 128-137 138- 147 148-157 158-167 168-177 178-187 FRECUENCIAS f (Nº Niños) 4 7 16 19 5 6 3 Determine: a) Los límites reales de clase. b) Las frecuencias acumuladas relativas porcentuales. c) La clase media d) La curva de frecuencia acumuladas menor o igual. 4. Para la distribución de frecuencia de la pregunta 3 determine: a) La media aritmetica. b) El decil 9. 5.- En la tabla se enlistan los tiempos requeridos para la conclusiòn de una tarea de ensamble para una muestra de 30 empleados que presentaron su solicitud de ascenso a un puesto de ensamble de preciciòn . Supongamos que nos interesa organizar estos datos en cinco clases de igual tamaño. Determine el tamaño del intervalo correspondiente, redondeando el intervalo a enteros y elabore la distribución de frecuencias para toda las clases y fijando en 9 minutos el limite nominal inferior de la primera clase. 135 136 Tiempos de ensamble de 30 empleados, en minutos 10 14 15 13 17 16 12 14 11 13 15 18 9 14 14 9 15 11 13 11 12 10 17 16 12 11 16 12 14 15. 6.- Elabore una distribución de frecuencias acumuladas, con la distribución obtenida en la pregunta 1, empleando limistes exactos para identificar cada clase e incluya en la tabla tanto frecuencias acumuladas como porcentajes acumulados y trace la ojiva de porcentajes acumulados y determine: a)¿En que punto percentil se encontraría un tiempo de ensamblé de 15 minutos? b)¿Cuál es el tiempo de ensamble de 20º Percentil de la distribución? 7.- Un experto en normas laborales observa, en una muestra, la cantidad de tiempo requerida para la elaboración de 10 cartas comerciales en una oficina, con los siguientes resultados, enlistados en orden ascendente de acuerdo con el minuto mas cercano: 5, 5, 5, 7, 9, 14, 15, 15, 16, 18. Determine a) Rango, b) El Rango del 70% central y c) La desviación media. 8.- Con la distribución obtenida en la pregunta 1. Determine la media y la varianza. 9.- Con distribución obtenida en la pregunta 1 determine la coeficiente de asimetría de Pearson 10.- Los pesos en libras de 40 estudiantes están en la distribución: CLASES 118 – 126 127 – 135 136 – 144 145 – 156 154 – 162 163 – 171 172 – 180 Determine: f 3 5 9 12 5 4 2 a) La desviación estándar b) El coeficiente de variación 11.- Se tienen las Siguientes notas de 38 estudiantes: 1 5 1 0 1 7 1 5 1 4 1 3 0 8 1 2 1 0 0 9 1 5 1 6 1 3 1 2 1 8 0 9 1 1 1 0 0 9 0 8 1 2 1 1 1 5 1 4 1 7 1 6 1 0 1 3 1 7 1 2 1 0 2 0 0 5 0 8 1 9 1 2 137 0 8 1 0 Programe por MINITAB: a) La construcciòn de un histograma b) El calculo de la mediana 12.- de 50 focos, la probabilidad de que haya al menos uno quemado es 0.06; de que al menos dos focos estén quemados es 0.02. Determina la probabilidad de que: a) Ningún foco quemado b) Exactamente dos focos quemados 13.-La ventas por hora de una maquina automática pueden ser de 5, 8, 11, 13, 15 o 20 Gaseosas de ½ litro con las probabilidades de 0.4, 0.3, 0.1, 0.1, 0.005, 0.05 Respectivamente. Determine la venta esperada a liquidar de las 14:00 horas a las 22:00 horas. 14.- Debido a la elevada tasa de interés, una empresa reporta que el 20% de sus cuentas por cobrar están vencidas. Si un contador toma una muestra aleatoria de 6 de estas cuentas. Determine la probabilidad de cada uno de los siguientes eventos con la distribución Binomial: a) Exactamente 3 cuentas están vencidas b) Exactamente el 100% de las cuentas están vencidas 15.- Se ha determinado que el número de clientes que llegan cada hora a una tienda tiene la distribución de probabilidad que se muestra en la tabla: Numero clientes X 0 Probabilidad P(X) 1 2 3 4 5 6 0.03 0.07 0.10 0.15 0.25 0.20 0.20 Calcule el número de clientes esperando promedio que llegue a la tienda por hora. 16.- El promedio anual de incendios grandes es una ciudad es de 8. Utilice la distribución de Posición para determinar la probabilidad de que haya exactamente dos incendios grandes en un periodo de tres meses. 17.-Las remuneraciones de los trabajadores de una empresa se distribuyen normalmente, con una media de S/1250.00 mensual y una desviación estándar de S/150.00. Determine que porcentaje de los trabajadores que tienen sus remuneraciones entre S/900.00 y S/1500.00 mensuales. 18.- Durante una semana determinada, se estima que la probabilidad de que el precio de una acción especifica aumente0 es 0.30, permanezca sin cambios es 0.20 y se reduzca es 0.50. a) Determina la probabilidad de que el precio de la acción aumente o permanezca sin cambio. 138 b) Determina la probabilidad de que el precio de acción cambie durante la semana. 19.- El diámetro medio interior de una muestra de 300 tubos producidos por una fabrica es de 0.530 pulgadas y la desviación estándar es de0.0005 pulgadas. El uso de los tubos permitirá una tolerancia de 0.522 a 0.538 pulgadas; de otro moto se considera defectuosos. Determina el porcentaje de tubos defectuosos suponiendo que los tubos producidos se distribuyen normalmente. 20.- En unas elecciones, una de los candidatos obtuvo el 45 % de los votos. Halla la probabilidad de que en un muestreo de 300 votantes elegidos al azar, saliera mayoria a su favor. 21.- Con referencia a la siguiente tabla determina la probabilidad que una familia elegida al azar tenga ingresos, a) Entre S/. 23000 y S/. 29999 b) Menores S/. 39999.5 Categoría Ingreso anual de Familias Rango de Ingreso 1 2 3 4 5 Menor de S/. 1800 S/. 1800 – S/. 22999 S/. 23000 – S/. 29999 S/. 33000 – S/. 39999 S/. 40000 y mas 500 Numero Familia 60 100 160 140 40 de 22.- Si la probabilidad de que un individuo sufra una reacción negativa ante una inyección de cierto suero es 0.002. ¿Halla la probabilidad de entre 3000 individuos, más de 3 de ellos sufran reacciones negativas, suponiendo una distribución de poisson? 23.-Las lámparas que fabrica cierta empresa tiene una vida media de 1500 horas y una desviación estándar de 100 horas. ¿Halla la probabilidad de que una muestra aleatoria de 25 lámparas tenga una vida media entre 1450 y 1600 horas? 24.- ¿Cual es la probabilidad de que un elemento elegido entre un inventario de cinescopios tenga una vida en almacén entre 3 y 9 semanas? Se sabe que las vidas siguen una distribución normal con una media de 5 semanas y una desviación estándar de 3 semanas. 25.- La distribución normal del peso de los estudiantes de una universidad es en promedio 65 Kg., con una desviación estándar de 5 Kg. ¿Determina los pesos límites del 90 % central alrededor del peso promedio? 139 26.- en un Bufete de abogados hay 6 socios. A continuación se indica el numero de casos que cada miembro llevo a la corta en el mes pasado. Números de Casos Socios Ruud Austin Sass Palmer Wilhelms Schueller 3 6 3 3 0 1 a) Determina la media y el error estándar poblacionales. b) Determina la distribución de muestreo de medias de tamaño 2, el valor medio y error estándar de las medias muéstrales. 27.- Suponiendo que usted en un agente de compras de un supermercado y que toma una muestra aleatoria de 12 alubias en una planta envasadora. el peso neto de las alubias al vació de cada lata aparece en la tabla. Determine: a) El peso neto medio de las alubias envasadas en cada lata de esta muestra. b) La desviación estándar de la muestra. c) Suponiendo que los pesos netos por lata tiene una distribución normal, estime el peso medio por lata de alubias envasadas con un intervalo de confianza de 90 %. Onzas por latas Números de latas 15.7 1 15.8 15.9 2 2 16.0 3 16.1 3 16.2 1 28.- Un contador piensa que el número medio de días necesarios para realizar un trabajo debe ser U = 27 si la media es menor que 27, el contador teme que l trabajo se ejecuta con descuido de calidad, mientras que una media por encima de 27 puede dar lugar a unos gastos innecesarios. Se Eligio al azar 50 trabajos con objeto de probar (contrastar esta afirmación). Se encuentra que la media es x = 26.7 días, con una desviación estándar S =2.1 días, el contador desea probar (contraste) la hipótesis con nivel de significancia de 10% (90% de confianza). Determina el sistema de hipótesis y realizar la prueba. Si rechaza la hipótesis nula, el contador tendrá que volver a valorar el proceso de trabajo para garantizar que se siguen procedimientos adecuados. 140 APLICACIÓN CON EL PROGRAMA DE MINITAB DISTRIBUCION NORMAL 1. Un contador quiere saber el porcentaje de los costos de los insumos que tiene una empresa en el proceso de producción. El costo promedio esta estimado en $ 26234 dólares anuales. Suponga que se aplica una distribución a los costos y que la desviación estándar es de $ 5000 dólares. ¿Cuál es el porcentaje que se obtiene al tener costos mayores a $ 3500 dólares? Abrir el Minitab. Clic en Graph (Grafica). Colocarse en el siguiente Menú y opción: GraphProbabilityDistributionPlot (Grafica de distribución de Probabilidad). Se despliega la ventana de ProbabilityDistributionPlots (parcelas de distribución de probabilidad). Clic en View Probability (ver probabilidad). Clic en Ok. Seleccionar Distribucion Normal Introducir los valores de la Media (mean), en este caso la Media es de $ 26234 dólares Y la desviación estándar (Standarddesviation), este caso la desviación estándar es de $ 5000 dólares. Al introducir estos datos tanto la Media y la desviación estándar se desplego una grafica. Gráfica de distribución Normal, Media=26234, Desv.Est.=5000 0.00009 0.00008 0.00007 Densidad 0.00006 0.00005 0.00004 0.00003 0.00002 0.00001 0.00000 0.05 26234 X 34458 Double-click en Shaded Area (area sombreada). SelccionarXvalue (valor X), además hacer clic en “cola a la” y proporcionar los valor de X, es decir $ 35000dólares. Clic en Ok. 141 Minitab despliega la grafica de la distribución normal con el valor de la probabilidad sombreado. En este caso la grafica muestra que la probabilidad es 0.03978 ó 3.978% Gráfica de distribución Normal, Media=26234, Desv.Est.=5000 0.00009 0.00008 0.00007 Densidad 0.00006 0.00005 0.00004 0.00003 0.00002 0.00001 0.00000 0.03978 26234 X 35000 2. Un contador quiere saber el porcentaje de los costos de los insumos que tiene una empresa en el proceso de producción. El costo promedio esta estimado en $ 26234 dólares anuales. Suponga que se aplica una distribución a los costos y que la desviación estándar es de $ 5000 dólares. Abrir el Minitab. Clic en Graph (Grafica). Colocarse en el siguiente Menú y opción: GraphProbabilityDistributionPlot (Grafica de distribución de Probabilidad). Se despliega la ventana de ProbabilityDistributionPlots (parcelas de distribución de probabilidad). Clic en View Probability (ver probabilidad). Clic en Ok. Seleccionar Distribución Normal. Introducir los valores de la Media (mean), en este caso la Media es de $ 26234 dólares Y la desviación estándar (Standard desviation), este caso la desviación estándar es de $ 5000 dólares. Al introducir estos datos tanto la Media y la desviación estándar se desplego una gráfica. 142 Gráfica de distribución Normal, Media=26234, Desv.Est.=5000 0.00009 0.00008 0.00007 Densidad 0.00006 0.00005 0.00004 0.00003 0.00002 0.00001 0.03978 0.00000 26234 X 35000 Double-click en Shaded Area (area sombreada). SelccionarXvalue (valor X), además hacer clic en “cola a la” y proporcionar los valor de X, es decir $ 20000 dólares. Clic en Ok. Minitab despliega la grafica de la distribución normal con el valor de la probabilidad sombreado. En este caso la grafica muestra que la probabilidad es 0.1062 ó 10.62% Gráfica de distribución Normal, Media=26234, Desv.Est.=5000 0.00009 0.00008 0.00007 Densidad 0.00006 0.00005 0.00004 0.00003 0.00002 0.00001 0.00000 0.1062 20000 26234 X 3. El área de contabilidad de una empresa tiene registrada $25000 dólares en promedio de cuentas por cobrar con una desviación estándar de $3000 dólares. Suponga que se hace distribución normal. ¿Cuál es la probabilidad por lo menos cobre $30000 dólares de las cuentas por cobrar? 143 Abrir el Minitab. Clic en Graph (Grafica). Colocarse en el siguiente Menú y opción: GraphProbabilityDistributionPlot (Grafica de distribución de Probabilidad). Se despliega la ventana de ProbabilityDistributionPlots (parcelas de distribución de probabilidad). Clic en View Probability (ver probabilidad). Clic en Ok. Seleccionar Distribución Normal Introducir los valores de la Media (mean), en este caso la Media es de $ 25000 dólares Y la desviación estándar (Standard desviation), este caso la desviación estándar es de $ 3000 dólares. Al introducir estos datos tanto la Media y la desviación estándar se desplego una grafica. Gráfica de distribución Normal, Media=25000, Desv.Est.=3000 0.00014 0.00012 Densidad 0.00010 0.00008 0.00006 0.00004 0.00002 0.00000 0.05 25000 X 29935 DobleClic en Shaded Area (áreasombreada). SelccionarXvalue (valor X), además hacer clic en “cola a la” y proporcionar los valor de X, es decir $ 30000 dólares. Clic en Ok. Minitab despliega la grafica de la distribución normal con el valor de la probabilidad sombreado. En este caso la grafica muestra que la probabilidad es0.04779 ó 4.779% 144 Gráfica de distribución Normal, Media=25000, Desv.Est.=3000 0.00014 0.00012 Densidad 0.00010 0.00008 0.00006 0.00004 0.00002 0.00000 0.04779 25000 X 30000 4. El área de contabilidad de una empresa tiene registrada $25000 dólares en promedio de cuentas por cobrar con una desviación estándar de $3000 dólares. Suponga que se hace distribución normal. ¿Cuál es la probabilidad de que cobre entre $25000 dólares y 27500 dólares de las cuentas por cobrar? Abrir el Minitab. Clic en Graph (Grafica). Colocarse en el siguiente Menú y opción: GraphProbabilityDistributionPlot (Grafica de distribución de Probabilidad). Se despliega la ventana de ProbabilityDistributionPlots (parcelas de distribución de probabilidad). Clic en View Probability (ver probabilidad). Clic en Ok. Seleccionar Distribución Normal Introducir los valores de la Media (mean), en este caso la Media es de $ 25000 dólares Y la desviación estándar (Standard desviation), este caso la desviación estándar es de $ 3000 dólares. Al introducir estos datos tanto la Media y la desviación estándar se desplego una grafica. 145 Gráfica de distribución Normal, Media=25000, Desv.Est.=3000 0.00014 0.00012 Densidad 0.00010 0.00008 0.00006 0.00004 0.00002 0.00000 0.05 25000 X 29935 DobleClic en Shaded Area (áreasombreada). SelccionarXvalue (valor X), además hacer clic en middle (medio) y proporcionar los valor de X1 y X2, es decir $25000 y $27500 dólares respectivamente. Clic en Ok. Minitab despliega la grafica de la distribución normal con el valor de la probabilidad sombreado. En este caso la grafica muestra que la probabilidad es 0.2977 ó 29.77% Gráfica de distribución Normal, Media=25000, Desv.Est.=3000 0.00014 0.2977 0.00012 Densidad 0.00010 0.00008 0.00006 0.00004 0.00002 0.00000 25000 X 27500 5. El monto de dinero que se les pide en las solicitudes de préstamos en Down River Federal Savings tiene una distribución normal, una media de $70,000 y un desviación estándar de $20,000. Esta mañana se recibió 146 una solicitud de préstamos. ¿Cuál es la probabilidad de que el monto solicitado sea 80,000 o mayor? 𝜇 = 70,000 𝑧= 𝑥−𝜇 𝜎 𝜎 = 20,000 𝑝(𝑥 ≥ 80,000) 80,000−70,000 10,000 𝑧= = 20,000 = 0,50 =La probabilidad acumulada es de 0,1915 20,000 𝑝(𝑥 ≥ 80,000) = 0.5000 − 0,1915 = 0,3085 Rpta: 𝑝(𝑥 ≥ 80,000)z=0,50 entonces por la tabla de distribución normal es igual a 0,1915 de manera que 0,500-0,1915=0,3085 es la probabilidad de que z sea mayor a 0,50 y por lo tanto de que x sea mayor a 80,000.entonces 61,7% de los recibirá en prestamos los$80,000. Abrir el Minitab, y clic en Graph. Colocarse en el siguiente menú y opción: GraphProbabilityDistributionPlot 147 Se despliega la ventana de probalityDistributionPlots Clic en View probability Clic OK SelccionarX Distributions normal Introducir los valores de la media(Mean) y la desviación estándar (standardderivation) 148 Clic en ShadedArea Seleccionar x vakue, clic en Middle. y proporcional los valores de x ₁ y x₂ Clic en OK Minitab despliega la grafica de Minitab con el valor de la probabilidad sombreada Distribution Plot Normal, Mean=70000, StDev=20000 0.000020 Density 0.000015 0.000010 0.000005 0.000000 0.3085 7000080000 X 6. Tel ComSatellite presta servicios de comunicación a los negocios del area metropolitana de Chicago los funcionarios de la compañía han aprendido que la transmisión satélite promedio es de 150 segundos, con la desviación estándar de 15 segundos los tiempos parecen estar distribuidos normalmente. Para estimar de manera apropiada la demanda del cliente por sus servicios y establecer una estructura de tarifa que maximice la utilidades corporativas. TelCom debe determinar que tan probable es que algunas llamadas se presentan. El director de servicios desea que usted proporcione estimados de la probabilidad de que una llamada dure entre 125 y 150 segundos. Resolución 149 𝜇 = 150 Segundos 𝜎 = 15 Segundos 𝑝(125 ≥ 𝑥 ≥ 150) 125−150 𝑍= =-1,67 15 Rpta : 𝑝(125 ≤ 𝑥 ≤ 150)Z=-1,67 pero por la tabla de distribución da una área de 0,4525. Por tanto la probabilidad de que una transmisión dure entre 125 y 150 segundos es 45,25% Solucion utilizando programa minitab 16 Abrir el Minitab,y clic en Graph. Colocarse en el siguiente menú y opción: GraphProbabilityDistributionPlot 150 Se despliega la ventana de probalityDistributionPlots Clic en View probability Clic OK SelecionarDistribucion normal Introducer los valores de la media(Mean) y la desviaciones andar (standardderivation) Clic en ShadedArea Seleccionar x vakue, clic en Middle. y proporcional los valores de x ₁ y x₂ Clic en OK 151 Minitab despliega la grafica de minitab con el valor de la probabilidad sombreada Distribution Plot Normal, Mean=150, StDev=15 0.030 0.025 Density 0.020 0.4522 0.015 0.010 0.005 0.000 125 150 X 7. La compañía Grear Tire Company ha fabricado un nuevo neumático que será vendido por una cadena nacional de tiendas de descuento. Como este neumático es un producto nuevo, los directivos de Grear piensan que la garantía de duración será un factor importante en la aceptación de neumático. Antes de finalizar la póliza de garantía, los directivos necesitan información probabilística acerca de x=duración del neumático en numero de millas. De acuerdo con las pruebas realizadas al neumático. Los ingenieros de Grear estiman que la duración media en millas es 𝜇 = 36500 millas y que las desviaciones estándar es 𝜎 = 5000. Además, los datos recogidos indican que es razonable suponer una distribución normal. ¿Qué porcentaje de los neumáticos se espera que duren más de 40000 millas? Solución 𝜇 = 36500 𝑚𝑖𝑙𝑙𝑎𝑠 𝜎 = 5000 𝑚𝑖𝑙𝑙𝑎𝑠 𝑝(𝑥 ≥ 40000) Para que x=40000, se tiene 𝑥 − 𝜇 40000 − 36500 3500 𝑧= = = = 0,70 𝜎 5000 5000 152 Rpta:𝑝(𝑥 ≥ 40000),z=0,70 entonces por la tabla de distribución normal es igual a 0,7580 de manera que 1000-0,7580=0,2420 es la probabilidad de que z sea mayor a 0,70 y por lo tanto de que x sea mayor a 40000.entonces 24,2% de los neumáticos durara más de 40000 millas. Solución utilizado el programa minitab 16 Abrir el Minitab,y clic en Graph. Colocarse en el siguiente menú y opción: GraphProbabilityDistributionPlot 153 Se despliega la ventana de probalityDistributionPlots Clic en View probability Clic OK SelecionarDistribucion normal Introducir los valores de la media(Mean) y la desviación estándar (standardderivation) Clic en ShadedArea Seleccionar x vakue, clic en ightTail.y proporcional los valores de x Clic en OK Minitab despliega la grafica de minitab con el valor de la probabilidad sombreada 154 Distribution Plot Normal, Mean=36500, StDev=5000 0.00009 0.00008 0.00007 Density 0.00006 0.00005 0.00004 0.00003 0.00002 0.2420 0.00001 0.00000 36500 40000 X DISTRIBUCION MUESTRAL 1. Un asistente contable necesita conocer la probabilidad de que la media muestral de los precios de carpetas sea mayor que 10.5 soles, considerando que el tamaño muestral es 25 y la población es de 2000. Sabiendo que los precios se distribuyen (poblacionalmente) con u = 10 soles con una desviación estándar poblacional de = 1.5 soles. Solución La media muestral se distribuye con media=10 y desviación= 1.5/5= 0.3 (formula) Grafica Gráfica de distribución de probabilidad Ver probabilidad Media 10, desviación 0.3 Área sombreada. Valor de x Cola derecha Escribir 10.5 Aceptar Respuesta: 0.04779= 4.779% 155 Gráfica de distribución Normal, Media=10, Desv.Est.=0.3 1.4 1.2 Densidad 1.0 0.8 0.6 0.4 0.2 0.04779 0.0 10 X 10.5 2. Un supervisor necesita evaluar si los productos terminados no presentan defectos en el momento de llevarlos al inventario. Él sabe que el porcentaje de fallas se distribuye normalmente con media 5 y desviación de 1 (ambos en porcentajes). Determine la probabilidad que una muestra recogida al azar de los inventarios presente en promedio menos del 4.5% de defectos, sabiendo que la muestra que se desea vender es de tamaño 16 y que la población en el inventario es de 10000 productos. Solución La media muestral se distribuye con media=5 y desviación= 1/4= 0.25 (formula) Grafica Gráfica de distribución de probabilidad Ver probabilidad Media 5, desviación 0.25 Área sombreada. Valor de x Cola izquierda Escribir 4.5 Aceptar Respuesta: 0.02275= 2.75% 156 Gráfica de distribución Normal, Media=5, Desv.Est.=0.25 1.8 1.6 1.4 Densidad 1.2 1.0 0.8 0.6 0.4 0.2 0.0 0.02275 4.5 5 X 3. Un analista de crediticio desea conocer la situación financiera de un grupo de potenciales clientes. Sabe que el promedio de ingresos de la población es de 2000 soles y se tiene una desviación de salarios de 600 soles. Determine la probabilidad de que el salario promedio de un grupo de 36 personas escogidas al azar de toda la población (N= 1000 000) sea superior a 2100 soles. Solución La media muestral se distribuye con media=2000 y desviación= 600/6= 100 (formula) Grafica Gráfica de distribución de probabilidad Ver probabilidad Media 2000, desviación 100 Área sombreada. Valor de x Cola derecha Escribir 2100 Aceptar Respuesta: 0.1587= 15.87% 157 Gráfica de distribución Normal, Media=2000, Desv.Est.=100 0.004 Densidad 0.003 0.002 0.001 0.1587 0.000 2000 X 2100 4. La empresa ABC recoge información acerca de sus clientes y determina que en conjunto el volumen de ventas presenta un valor promedio de 4000 soles y una desviación de 2400 soles y el número total de clientes es de 4000. Sin embargo, en un incendio se quemó mucha documentación y solo se pudo recoger esa información, un asistente contable necesita determinar cuál es la probabilidad de que las ventas promedio hechas a 100 clientes escogidos al azar esté entre 3900 y 4200 soles. Solución La media muestral se distribuye con media=4000 y desviación= 2400/10= 240 (formula) Grafica Gráfica de distribución de probabilidad Ver probabilidad Media 4000, desviación 240 Área sombreada. Valor de x Centro Escribir 3900 4200 Aceptar Respuesta: 0.4592= 45.92% 158 Gráfica de distribución Normal, Media=4000, Desv.Est.=240 0.0018 0.4592 0.0016 0.0014 Densidad 0.0012 0.0010 0.0008 0.0006 0.0004 0.0002 0.0000 39004000 X 4200 5. Un estudio determinó que el promedio de los activos de un grupo de empresas que listan en la Bolsa de Valores de Lima asciende a 45 millones de soles con una desviación de 9 millones. Se sabe que hay 169 empresas que listan en bolsa, determine la probabilidad que el promedio de los activos de una muestra de tamaño 25 esté entre 42 y 44.5 millones. Solución La media muestral se distribuye con media=45 y desviación= (9/raíz (25))* raíz ((169-25)/(169-1))= 1.667 (formula con factor de corrección) Grafica Gráfica de distribución de probabilidad Ver probabilidad Media 45, desviación 1.667 Área sombreada. Valor de x Centro Escribir 42 44.5 Aceptar Respuesta: 0.3462= 34.62% 159 Gráfica de distribución Normal, Media=45, Desv.Est.=1.667 0.25 Densidad 0.20 0.15 0.3462 0.10 0.05 0.00 42 44.545 X 6. Una empresa de contadores auditores realiza estudios de investigación ,con una duración media de 520 horas(desde el inicio hasta culminar dichos estudios),si están distribuidos normalmente con una desviación estándar de 37 horas ¿Cuál es la de que un estudio elegido al azar requiera entre 520 a 570 horas para completarlo ? Abrir el minitab – click en graph Colocarse en el siguiente Menú y opción :graphprobability distributionplot Tenemos la ventana de probabilitydistributionplots - Click view probability - Clik en ok 160 Seleccionar Distribución Normal - Introducir los valores de la media (mean) - Introducir la desviación estándar Gráfica de distribución Normal, Media=520, Desv.Est.=37 0.012 0.010 Densidad 0.008 0.006 0.004 0.002 0.05 0.000 520 X 580.9 Click en shaded área -Seleccionar X value -Click en centro -Click en middle y proporcionar los valores de X1 Y X2 - Click en OK En minitab se despliega la grafica de la distribución normal con el valor de la probabilidad sombreada 161 Obtemos la probabilidad 162 FUENTES DE INFORMACIÓN Básica 1. - Anderson, D., Sweeney, D. y Willians, T. (2008). Estadística para administración y economía (10a. ed.). México: Thomson Learning. 2.- Berenson, M.yLevine. D. (1991). Estadística para administración y economía: conceptos y aplicación. México: McGraw-Hill. 3.- Kazmier,L. (2006). Estadística aplicada a la administración y a la economía (4a. ed.). México: McGraw-HiIl. 4.- Levine, R. (2004). Estadística para administración y economía(7a. ed.). México: Pearson Educación. Complementaria 5.- Anderson, D., Sweeney y D., Willians,T. (2009). Estadística para administración y economía. México: Thomson. 6.- Arnaldos, F. (2003). Estadística descriptiva: para economía y administración de empresas. Madrid: Thomson Editores. 7.-Avila, R. (2000). Estadística elemental. Lima: RA. 8.-Kohler, H. (1996). Estadística para negocios y economía, México: Continental. 9.-Martínez, C. (2002). Estadística y muestreo. Bogotá: ECOE. 10.- Romero, F. (2000). Estadística para ti: aplicada a la investigación. Lima: (s.n.). 11.- Spiegel, R. (2009).Estadística (4a. ed.). México: McGarw-Hill. 12.- Webster , A. (2000). Estadística aplicada a los negocios y la economía. Bogotá: McGraw-Hill. FUENTES ELECTRONICAS: Curso virtual: estadística (s.f.), de http://www.iific.edu.pe/ SOFTWARE ESPECIALIZADO: MINITAB - SPSS – EXCEL LIBROS CUYA COMPRA SE ESTÀ SOLICITANDO A LA USMP: 1.-Fadil, Z. (2004). Interamericano Estadística general aplicada.: Fondo Educativo 2.-Hanke, J. y Reitsch, A. (2004). Estadística para negocios. Madrid: McGrawHill 3.-Levin, R. y Rubin, D. (2004). Estadística para administración y economía (7a. ed.) México: Pearson Educación 163