Modalidad Presencial ESTADÍSTICA EMPRESARIAL Edición: 1 Año: 2018 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 1 Misión de UTEPSA: “Lograr que cada estudiante desarrolle una experiencia académica de calidad, excelencia, con valores, responsabilidad social, innovación, competitividad, y habilidades emprendedoras durante su formación integral para satisfacer las demandas de un mercado globalizado.” Esto se sintetiza en: “Educar para emprender y servir” Visión de UTEPSA: “Ser una universidad referente y reconocida por su calidad académica, investigación y compromiso con la comunidad, en la formación de profesionales íntegros, emprendedores e innovadores, según parámetros y normativas nacionales e internacionales”.” CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 2 ¿Qué es la Guía MAAP? Es un documento que marca los objetivos de cada asignatura y que a través de actividades y otros contenidos, orienta los esfuerzos del estudiante para garantizar un exitoso desempeño y el máximo aprovechamiento. Esta herramienta, otorga independencia en el aprendizaje mediante trabajos, lecturas, casos, y otras actividades que son monitoreadas por el profesor permitiendo a los participantes de la clase desarrollar diferentes competencias. I. Recordatorios y Recomendaciones A su servicio Aunque las normas generales están claramente establecidas, si a usted se le presenta una situación particular o si tiene algún problema en el aula, o en otra instancia de la Universidad, el Gabinete Psicopedagógico y su Jefatura de Carrera, están para ayudarlo. Comportamiento en clases Los estudiantes y los docentes, bajo ninguna circunstancia comen o beben dentro el aula y tampoco organizan festejos u otro tipo de agasajos en estos espacios, para este fin está el Patio de Comidas. Toda la comunidad estudiantil, debe respetar los espacios identificados para fumadores. También se debe evitar la desconcentración o interrupciones molestas por el uso indebido de equipos electrónicos como teléfonos y tablets. Asistencia y puntualidad Su asistencia es importante en TODAS las clases. Por si surgiera un caso de fuerza mayor, en el Reglamento de la Universidad se contemplan tres faltas por módulo (Art. 13 Inc. b y c del Reglamento Estudiantil UPTESA). Si usted sobrepasa esta cantidad de faltas REPROBARÁ LA ASIGNATURA. Se considera “asistencia” estar al inicio, durante y al final de la clase. Si llega más de 10 minutos tarde o si se retira de la clase antes de que esta termine, no se considera que haya asistido a clases. Tenga especial cuidado con la asistencia y la puntualidad los días de evaluación. Cualquier falta de respeto a los compañeros, al docente, al personal de apoyo o al personal administrativo, será sancionada de acuerdo al Reglamento de la Universidad. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 3 II. Orientaciones para el aprendizaje La Guía MAAP, contiene diferentes actividades de aprendizaje que han sido clasificadas y marcadas con algunos símbolos. La tabla a continuación, le permitirá comprender y familiarizarse con cada una de estas actividades: Símbolo Actividad Preguntas Prácticos y/o Laboratorios Descripción A través de cuestionarios, se repasan las bases teóricas generales para una mejor comprensión de los temas. Los prácticos permiten una experiencia activa; a través, de la puesta en práctica de lo aprendido las cuales según la carrera, pueden desarrollarse en laboratorios. Casos de Estudio y ABP Son planteamientos de situaciones reales, en los que se aplica los conocimientos adquiridos de manera analítica y propositiva. Investigación Las actividades de investigación, generan nuevos conocimientos y aportes a lo aprendido. Innovación y/o Emprendimiento A través de esta actividad, se agrega una novedad a lo aprendido, con el fin de desarrollar habilidades emprendedoras. Aplicación Al final de cada unidad y después de haber concluido con todas las actividades, se debe indicar, cómo los nuevos conocimientos se pueden aplicar y utilizar a la vida profesional y a las actividades cotidianas. Ética Responsabilidad Serán actividades transversales que Social pueden ser definidas en cualquiera de las Formación anteriores actividades. Internacional Idioma Ingles CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 4 III. Datos Generales ASIGNATURA: ESTADÍSTICA EMPRESARIAL SIGLA: BMA-301 PRERREQUISITO: BMS-300 Matemática Empresarial APORTE DE LA ASIGNATURA AL PERFIL PROFESIONAL: La materia de Estadística Empresarial, constituye en uno de los aportes más importante a la formación de profesionales, la evolución de la estadística ha llegado al punto en que su proyección se percibe en casi todas las áreas de trabajo; abarca la recolección, presentación y caracterización de información para ayudar tanto en el análisis e interpretación de datos como en el proceso de la toma de decisiones correctas en el ejercicio de su profesión. La probabilidad y estadística es parte esencial de la formación profesional, es hasta cierto punto una parte necesaria para toda profesión. El estudiante después de terminar con el contenido de la materia, por una parte con el conocimiento de la Estadística Descriptiva será capaz de recoger, organizar y obtener los parámetros de una serie de datos, mientras que con el conocimiento de la Estadística Inferencial será capaz de describir, predecir, comparar y generalizar los resultados obtenidos de una muestra a toda la población, convirtiéndose en un hábil profesional para la toma de decisiones fundamentadas en datos de la realidad. OBJETIVO GENERAL DE LA ASIGNATURA: El objetivo general de la asignatura es proporcionar al estudiante los modelos estadísticos básicos: descriptivos, probabilísticos e inferenciales que le permitan organizar la información cualitativa y cuantitativamente, presentarla en forma ordena, describirla, interpretarla y hacer inferencia, de tal manera que pueda aplicar dichos modelos en la resolución de problemas sociales, económicos y físicos de las diversas áreas de conocimiento, así mismo incorporar al estudiante en una serie de actividades que le permitan manejar grandes volúmenes de datos reales por los medios tecnológicos apropiados para ello. ESTRUCTURA TEMÁTICA Unidad 1 Unidad 1 Tema: Datos y distribuciones de frecuencia Contenido: 1.1. Clasificación de la estadística 1.2. Población y Muestra 1.3. Variables discretas y continuas CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 5 1.4. 1.5. 1.6. 1.7. 1.8. 1.9. 1.10. 1.11. 1.12. Ordenación de datos Categorías e intervalos de clase Distribución de frecuencias Representación gráfica de los datos agrupados Histogramas Ojivas Diagrama de Sectores Pictogramas Excel en laboratorio Unidad 2 Tema: Medidas de tendencia central y posición Contenido: 2.1 Media 2.2 Moda 2.3 Mediana 2.4 Relación entre media, mediana y moda. 2.5 Media Cuadrática 2.6 Fractiles Unidad 3 Tema: Medidas de dispersión Contenido: 3.1 Rango 3.2 Desviación media 3.3 Rango semintercuartil 3.4 Desviación típica 3.5 Varianza 3.6 Coeficiente de variación 3.7 Diagrama de box plot 3.8 Teorema de Chevychev Unidad 4 Tema: Medidas de forma Contenido: 4.1 Definición CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 6 4.2 Sesgo 4.3 Coeficiente de asimetría de Pearson 4.4 Kurtosis UNIDAD 5 Tema: Índices Contenido: 5.1 Tipos de números índices 5.2 Números índices más usados 5.3 Tasa de interés nominal actual 5.4 Tasa de inflación Unidad 6 Tema: Elementos de probabilidad 6.1 Definiciones básicas 6.2 Introducción a la Teoría de probabilidades. 6.3 Tipos de probabilidad 6.4 Reglas de probabilidad 6.5 Teorema de Bayes Unidad 7 Tema: Variables aleatorias y funciones de probabilidad Contenido: 7.1 Interpretación de variables aleatorias 7.2 Funciones de probabilidad 7.3 Valor esperado en la toma de decisiones Unidad 8 Tema: Distribución de probabilidades Contenido: 8.1 Distribución Binomial 8.2 Distribución de Poisson 8.3 Variables aleatorias continuas 8.4 Distribución Normal 8.5 Tablas de distribución CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 7 Unidad 9 Tema: Estimación Contenido: 9.1 Definición de estimación puntual 9.2 Estimación por intervalos de confianza 9.2.1 Intervalos de confianza para muestras grandes 9.2.2 Intervalos de confianza para muestras pequeñas 9.2.3 Intervalos de confianza para una proporción poblacional Unidad 10 Tema: Muestra Contenido: 10.1 Definición de muestra 10.2 Tipos de muestreo 10.2.1 Método de muestreo aleatorio simple 10.2.2 Método de muestreo sistemático 10.2.3 Método de muestreo estratificado 10.2.3 Método de muestreo por conglomerados 10.3 Cálculo para determinar el tamaño de la muestra. BIBLIOGRAFÍA BÁSICA o Córdova M. (2014). Estadística Descriptiva e Inferencial. Lima Perú: Moshera SRL. o Lind, MArchal, Wathen. (2008). Estadística Aplicada a los negocios y la economía. México: McGraw Hill COMPLEMENTARIA o Castejón P. J. M..; Lafuente Lechuga M.; Faura Martinez U. (2015): Guía Práctica de estadísticas aplicada a la empresa y al marketing. España: Paraninfo. o Casas, J. M.; García, C.; Rivera; Zamora, A.I. (2006): Ejercicios de Estadística Descriptiva y Probabilidad. Ed. Pirámide. o Borrego del Pino S. (2008) Estadística Descriptiva e Inferencial. Granada España. o Casas J. (2008) Inferencia Estadística para Economía y Administración de Empresas. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 8 IV. Sistema de Evaluación A continuación, se presenta el sistema de evaluación sugerido para la asignatura: NÚM. TIPO DE EVALUACIÓN UNIDADES A EVALUAR PUNTOS SOBRE 100 1 PRUEBA PARCIAL Unidades 1 a 4 15 2 PRUEBA PARCIAL 15 3 TRABAJOS PRÁCTICOS (CASOS-EJERCICIOS – TRABAJO FINAL) Unidades 4 a 8 Problemas ABP y solución de casos realizados en clases y en su domicilio. 4 EVALUACIÓN FINAL Todos los temas de forma integral Unidades 1 a 10 20 50 Descripción de las características generales de las evaluaciones: PRUEBA PARCIAL 1 La primera evaluación está referida a conceptos generales de la asignatura y a problemas ABP de aplicación de estadística Descriptiva. PRUEBA PARCIAL 2 La segunda evaluación está referida a la aplicación en problemas ABP de estadística Inferencial. TRABAJOS PRÁCTICOS Esta evaluación corresponde a las actividades de aprendizaje como el Trabajo Final de aplicación de Estadística Descriptiva e Inferencial, que los estudiantes realizarán durante la materia, ya sea en forma individual o grupal. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 9 Se dará un examen final escrito de todo lo avanzado en la asignatura, de los 50 puntos le corresponden 30 puntos. El proyecto final tiene como objetivo la aplicación de todos los contenidos aprendidos en clases. Se realizará en grupos de alumnos no mayores a 4 estudiantes. EVALUACIÓN FINAL Entrega del Trabajo: El trabajo debe ser avanzado durante el desarrollo de la materia. Se valorará la estructura, el contenido, la redacción y ortografía. De los 50 puntos de la casilla Examen Final: 10 corresponden al avance, contenido y entrega del informe escrito y 10 para la presentación y defensa del mismo. Defensa del trabajo: Los grupos defenderán sus trabajos en las clases 19 y 20 del módulo. Los alumnos podrán decidir el orden de exposición de cada uno de sus integrantes, pero el docente podrá hacer preguntas de verificación a cada uno de los miembros del grupo. 5. Guía para el Trabajo Final INSTRUCCIONES Se indica los pasos y procedimientos a seguir para la realización del trabajo final. El trabajo deberá presentarse impreso con las siguientes características: Hoja de papel boom tamaño carta. Margen superior de 3 cm. Inferior de 3 cm. derecho de 4 cm. e inferior 2.5 cm. Letra Calibri 11, Interlineado de 1,5. OBJETIVOS DEL TRABAJO FINAL: Llevar a la práctica los conocimientos adquiridos en la materia de probabilidad y estadística referente a la Estadística Descriptiva en un caso real. ESTRUCTURA DEL TRABAJO FINAL: i) CARÁTULA Nombre de la Universidad Nombre de la Facultad a la que pertenece Nombre de la Carrera Nombre de la Materia Nombre del Docente Nombre de los Integrantes del grupo Fecha y año CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 10 ii) CONTENIDO INTERNO ÍNDICE I. INTRODUCCIÓN Antecedentes. Breve descripción de la organización objeto de estudio: Años de funcionamiento, tipo de empresa, ubicación, tamaño de la empresa. II. OBJETIVOS 2.1. Objetivo general Que se quiere lograr o donde se quiere llegar con la realización del trabajo 2.2. Objetivos específicos Pasos a seguir para llegar al objetivo general III. FUNDAMENTOS TEORICOS Realizar mínimo los conceptos teóricos de las unidades de donde se realiza el trabajo. IV. TABULACIÓN DE DATOS 4.1. Recolección de Información a través de las encuestas (mínimo 200 encuestas) 4.2. Cálculos 4.3. Tabla de datos (Realizar para cada una de las preguntas) 4.4. Gráficos e interpretaciones (Realizar para cada una de las preguntas) V.PROBABILIDADES 5.1 Probabilidades e interpretación 5.2 Modelos de distribución de probabilidades 5.3 Tamaño de la muestra VI. CONCLUSIONES Conclusión general del grupo sobre resultados obtenidos en cada una de las interpretaciones realizadas en el trabajo. VII. RECOMENDACIONES Propuestas de mejora sobre las actividades realizadas que se han analizado en el trabajo. ANEXOS Encuestas, tablas, gráfico, foto o elemento que no sea texto y que se refiera al trabajo. - La EXPOSICIÓN y DEFENSA oral se realizará en la fecha mencionada al inicio de la materia. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 11 V. Objetivos y Actividades de cada Unidad Unidad 1 ELEMENTOS DE LA ESTADÍSTICA DESCRIPTIVA Objetivos de aprendizaje: Lograr que el estudiante comprenda la importancia y uso de la ciencia Estadística en las actividades cotidianas. Que construya e interprete las tablas estadísticas de frecuencias, exprese en forma de gráfico la información contenida en tablas de frecuencias. Identifique sin problemas entre variables media, mediana y moda en Estadística. Reconozca la necesidad de tomar muestras y valorar la representatividad y comprenda el concepto de encuestas e identificar sus fases. Preguntas 1. ¿Cuál la diferencia entre Estadística y Estadísticas? 2. ¿Qué se entiende por Estadística como ciencia? 3. ¿Cuál la diferencia entre Estadística Descriptiva y Estadística Inferencial? 4. Indique 5 aplicaciones de la Estadística en el campo empresarial. 5. ¿Cuál la diferencia entre Población y Muestra? 6. Indique 5 ejemplos de población desde el punto de vista estadístico. 7. De tres ejemplos de población finita y tres ejemplos de población infinita. 8. ¿En qué consiste un Censo? 9. ¿Cuál es la diferencia entre variable y dato? Indique con un ejemplo. 10. ¿Cuáles son los tipos de variables que estudia la estadística? 11. Indique la subdivisión de las variables cualitativas y cuantitativas. 12. Indique la clasificación de la estadística en relación con el tiempo. 13. Indique la diferencia entre el redondeo de datos numéricos y los dígitos significativos. 14. ¿Qué programas o paquetes informáticos se utilizan en Estadística para procesar una voluminosa información? 15. ¿Cuáles son las fuentes de obtención de información desde el punto de vista estadístico? 16. ¿Cuáles son los métodos de recolección de la información a través de la Fuente más importante? 17. ¿Qué se entiende por gráfico desde el punto de vista estadístico? 18. ¿Cuáles son las principales características de un gráfico estadístico? 19. ¿En que se basa la construcción de un gráfico cuáles son sus principales limitaciones? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 12 20. Indique 4 recomendaciones para construir un gráfico. 21. ¿Cuáles son los principales gráficos utilizados para presentar informes ilustrados de carácter general? 22. Cuáles son los gráficos específicos que se utilizan para graficar información estadística de carácter cualitativo y cuantitativo? 23. A partir de que gráfico se hace el análisis de asimetría y kurtosis? 24. ¿Cuál es la clasificación de las curvas de frecuencia desde el punto de vista de la asimetría o sesgo? 25. Cuál es la clasificación de las curvas de frecuencia desde el punto de vista de la kurtosis? Fundamenta tus respuestas con bibliografía de biblioteca CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 13 INTRODUCCIÓN A LA ESTADÍSTICA Ventas 12 000 14 000 15 000 Hubs 10 15 18 Switch 2 5 8 Está ciencia tiene que ver con la recopilación, presentación, análisis y uso de datos para resolver problemas, cualquier persona tanto en su carrera como en la vida cotidiana recibe información a través de periódicos, de la televisión y de otros medios. A menudo es necesario obtener alguna conclusión a partir de la información obtenida en los datos, puesto que los ingenieros obtienen y analizan datos de manera rutinaria, el conocimiento de la estadística tiene gran importancia en este campo. De manera específica, el conocimiento de la estadística y la probabilidad puede constituirse en una herramienta poderosa para ayudar a los ingenieros a diseñar nuevos productos y sistemas, a perfeccionar los existentes y a diseñar, desarrollar y mejorar procesos de producción, de redes, sistemas de información, etc. Este texto busca dotar a los ingenieros de herramientas estadísticas básicas que les permitan practicar con éxito esos aspectos profesionales. CLASIFICACIÓN DE LA ESTADÍSTICA ESTADISTICA ESTADISTICA DESCRIPTIVA PROBABILISTICA Esta basada en hechos anteriores. Recolecta y organiza los datos Analiza la información para la toma de decisiones. La usamos para describir el pasado. También para resumir la informacciòn La usamos para pronosticar el futuro. También para generalizar En todo estudio estadístico aparecen los siguientes conceptos básicos: POBLACIÓN Conjunto de los elementos que son objeto de estudio. Si ésta es muy grande, se considera solo una parte de ella denominada muestra. INDIVIDUO Cada uno de los elementos de la poblacion VARIABLE ESTADISTICA Propiedad o característica de la población que estudiamos. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 14 A continuación veremos cuál es la población, los individuos y las variables estadísticas de diferentes estudios estadísticos: Estudio Estadístico Medio transporte que utilizan más frecuentemente los habitantes de una ciudad Número de cafés servidos en la Av. Monseñor Tiempo promedio diario que dedican los habitantes para leer un periódico. Población Habitantes de la ciudad. Av. Monseñor Habitantes de la ciudad. Unidad Estadística Variable Estadística Cada uno de los habitantes. Medio de transporte utilizado. Cada uno de los cafés de la Av. Monseñor. Número servidos. Cada uno de los habitantes. Tiempo medio dedicado a la lectura de la prensa. de PASOS PARA REALIZAR UNA INVESTIGACIÓN ESTADÍSTICA DESCRIPTIVA PRIMER PASO FORMULARSE LA PREGUNTA Que resultado quiero obtener a través de esta INVESTIGACION SEGUNDO PASO Identificar tipo de variable (cualitativa o cuantitativa) TERCER PASO Definir si el estudio de investigación estadística será realizado a través de una muestra o una población CUARTO PASO Seleccionar la/s herramienta/s válidas para el levantamiento de datos (encuestas, censos, informes contables, informes económicos, cuestionarios, test, prensa escrita, observación) QUINTO PASO Tabulación, clasificación de la información recolectada a través del cuadro de distribución de frecuencias. SEXTO PASO Realización de los gráficos correspondientes SEPTIMO PASO Interpretación de los gráficos, conclusiones Fuente : Ing. Luis Fernando Villarroel – Taller Estadistica Utepsa CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 15 cafés MUESTRA Sucede que al recolectar la información muchas veces se hace imposible o muy costoso económicamente obtener los datos de todos los elementos que componen una población, por lo que usualmente se recurre a tomar sólo una muestra de los datos. Por ejemplo, imagina que el diario El DEBER quisiera elaborar un estudio sobre las preferencias literarias y musicales de la juventud cruceña. Está claro que no se puede preguntar a todos los individuos pues la población es demasiado grande. Población Población Una población es aquella que está formada por la totalidad de las observaciones en las cuales se tiene cierto interés. Muestra Individuo Cada uno de los elementos de la población Muestra Una muestra es un subconjunto de observaciones seleccionadas de una población. Se podrá observar y concluir que es una tarea imposible y muy costosa preguntar a cada individuo sobre la preferencia literaria y musical. Es por eso que resulta conveniente escoger una pequeña parte de esta población (una muestra) que sea representativa del total de la población. TIPOS DE VARIABLES Existen dos tipos de variables: Variables cuantitativas (continuas y discretas) Variables cualitativas (ordinales y nominales) TABULACIÓN DE ENCUESTAS Cuando se tabulan encuestas, las características de una población o variables, se clasifican en uno de los tres niveles de medida siguientes: VARIABLES DE ESCALA Los valores de los datos son numéricos en una escala de intervalo o de razón. Las variables continuas son todas aquellas que se pueden medir, por ejemplo: ingresos, tiempo, peso, temperatura, notas de los alumnos, gastos de una empresa, etc. Las variables discretas son todas aquellas que se pueden contar, por ejemplo: Edad, personas, autos. VARIABLES ORDINALES Los valores de datos representan categorías con un cierto orden intrínseco, por ejemplo: Bajo, medio y alto. Las variables ordinales pueden ser valores numéricos que representan categorías diferentes (por ejemplo, 1= bajo, 2 = medio, 3 = alto) VARIABLES NOMINALES Los valores de datos representan categorías sin un orden intrínseco, por ejemplo: División de una compañía: administración, contabilidad, producción, ventas, etc. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 16 Las variables nominales pueden ser de valores numéricos que representan categorías diferentes (por ejemplo, 1 = Hombre, 2 = Mujer) DISEÑO DEL CUESTIONARIO Las encuestas utilizando la herramienta de los cuestionarios se realizan con el objeto de recabar información de algún tipo. A la hora de formular las preguntas es importante tener en cuenta lo siguiente: Las preguntas deben formularse de forma concreta y precisa. Evitar el uso de palabras abstractas o ambiguas. No deben hacerse preguntas que obliguen a consultar archivos o a realizar cálculos numéricos complicados Las preguntas han de ser preferentemente cerradas Existen en diferentes formatos, veamos algunos tipos de preguntas que se pueden formular: TIPOS DE PREGUNTAS SEGÚN… EJEMPLO Abierta: deja libertad al encuestado a ¿Qué tipo de programa televisivo prefiere?......... responder ¿Cuál es su grupo musical favorito?........ ELECCION SIMPLE O COMPARATIVAS MULTIPLE O DE ORDINALES Cerrada: el encuestado debe elegir la PONDERACION respuesta entre las que propone el Sus programas Califique del 1 al 6 La programación cuestionario televisivos favoritos sus preferencias televisiva le son: televisivas: parece: Debates Debates:…… Muy Musicales Musicales:….. Interesante Documentales Documentales:…… Interesante Películas Películas:………. Indiferente Deportes Deportes:…….. Poco Informativos Informativos:……. interesante Concursos Concursos:………. Nada Ninguno interesante Sexo: De identificación: permite Femenino determinar el sexo, la edad, Masculino profesión, nacionalidad ,etc. Nacionalidad: Boliviana Extranjera De información: permite determinar los conocimientos del entrevistado ¿Conoce los riesgos de la adicción al tabaco:?................. respecto al tema en concreto. ¿Sabe dónde se celebrará el próximo mundial de futbol? …….. De opinión: permite conocer la ¿Qué opina sobre la pena de muerte? ……………….. opinión del entrevistado acerca de un ¿Cree que hay demasiada violencia en la programación tema. televisiva?....................... CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 17 VARIABLE CUALITATIVA Una variable cualitativa es aquella que expresa una cualidad o un atributo físico de la población o muestra de estudio, características expresada en palabras Ejemplos: Estado civil Religión Nivel social Nivel de educación Calificación en la calidad de un producto Genero Ocupación profesión color de piel color de ojos Existen preguntas que claramente nos indican que son variables cualitativas, por ejemplo: ¿Qué…? ¿Cómo…? ¿Cuándo…? Opine… Cuando se organiza la información, para estudiar una variable cualitativa se siguen los mismos pasos que cualquier estudio estadístico: 1. 2. 3. 4. Elaborar una tabla o cuadro Elaborar un grafico Interpretar los resultados Analizar los resultados PARTES DE UN CUADRO O GRÁFICO: 1.- Numeración. 2.- Titulo. 3. El cuadro o gráfico correspondiente 4. Interpretación y análisis GRÁFICOS La aplicación de graficos para la representacion de un fenomeno estadistico, se le atribuye a WILLIAM PLAYFAIR , a fines del siglo XVIII. Un grafico es la representacion de un fenomeno estadistico por medio de figuras geometricas (puntos, lineas, rectangulos, paralelepipedos,etc) cuyas dimensiones son proporcionales a la magnitud de los datos representados. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 18 Su objeto principal es la representacion de datos de forma grafica, que permita de un solo golpe de vista visualizar como estan distribuidos los datos y evidenciar sus variaciones y caracteristicas. El grafico es un auxiliar del cuadro estadistico, es decir es su complemento.(Rufino Moya, E.Descriptiva) De acuerdo al tipo de variable corresponde su tipo de grafico, entre los mas usuales tenemos: Grafico de sectores Grafico de Diagrama de Barras pictogramas Veamos un problema ABP resuelto: CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 19 Paso # 2 Elaborar un gráfico CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 20 Paso # 3 Paso # 4 VARIABLE CUANTITATIVA DISTRIBUCIÓN DE FRECUENCIAS Al manejar gran cantidad de datos resulta útil resumir la información en un cuadro o tabla, para su posterior interpretación y análisis. Este cuadro recibe el nombre de “cuadro de distribución de frecuencias” Para elaborar este cuadro se siguen básicamente 8 pasos iniciales 1. 2. 3. 4. 5. 6. 7. 8. PASO: PASO: PASO: PASO: PASO: PASO: PASO: PASO: Ordenar los datos en forma ascendente. Determinar los valores mínimo y máximo Calcular el rango Calcular el número de intervalos Determinar la amplitud de clase Calcular el rango ideal y margen de desplazamiento Calcular el límite inferior inicial Finalmente calcular los demás limites inferiores Nota. Diversos autores recomiendan hacer la distribución de frecuencias a partir de n = 20 datos. Estos pasos se describirán con un ejemplo. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 21 PROBLEMA ABP RESUELTO AT&T multinacional norteamericana, diseña un componente electrónico para una nueva tarjeta de red. La empresa ha recopilado información acerca del tiempo de vida útil de este componente en años. Resuma la información en un cuadro de distribución de frecuencias. 7 12 15 4 12 5 18 5 11 5 4 4 15 7 10 5 4 7 9 6 11 5 9 15 5 10 17 3 17 7 11 9 12 7 12 9 1. Ordenamos los datos en forma ascendente. 3 4 4 4 4 5 7 7 7 7 7 9 11 11 12 12 12 12 2. Determinamos los valores mínimo y máximo 5 9 15 6 11 18 MIN 3 MAX 18 3. Calculamos el rango RANGO MAX MIN RANGO 18 3 15 # I 1 3.32 Log( n ) 4. Calculamos el número de intervalos # I 1 3.32 Log(30) 5.90 6 5. Determinamos la amplitud de clase C 15 C 2.5 3 6 RI 6 3 18 Condición: RI > RANGO (POR LO MENOS EN DOS UNIDADES) Margen de desplazamiento: Rideal R #I RI # I C 6. Calculamos el rango ideal MD RANGO 1 (abajo) MD 18 15 3 “ojo” Si la diferencia en el numerador es par Dividimos entre dos, pero si es impar solo Compartimos en la forma más equitativa en dos números entero 2 (arriba) Tomamos el número más pequeño. MD = 1 Condición: CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP MD < C 22 7. Calculamos el límite inferior de la primera clase Lo MIN MD Lo = Min – MD = 3 – 1 = 2 8. Calculamos los demás límites inferiores L1 = 2 + 3 = 5 L2 = 5 + 3 = 8 L3 = 8 + 3 = 11 L4 = 11 + 3 = 14 L5 = 14 + 3 = 17 CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS 1 2 3 4 5 6 7 8 9 Acum 10 Menor 11 que 12 Acum 13 Mayor 14 que # I INTERV Limites Li Ls FRONTERAS FREC. Absoluta fI Frec. Rel. % fr% Fi(-) Fr(-) Fr% (-) Fi(+) Fr(+) Fr% (+) 1 2 2 - 4 5 - 7 1.5 - 4.5 4.5 - 7.5 lIIII lllllllllI 5 10 Marcas De clase MC 3 6 Frec. Rel. fr Fs HOJA DE REC 0.167 0.333 16.7 33.3 5 15 0.167 0.50 16.7 50 30 25 1 0.833 100 83.3 3 4 5 6 8 11 14 17 - 7.5 10.5 13.5 16.5 - Illl Illllll Il Il 9 12 15 18 0.133 0.233 0.067 0.067 1 13.3 23.3 6.7 6.7 100% 19 26 28 30 0.633 0.867 0.933 1 63.3 86.7 93.3 100 15 11 4 2 0.50 0.367 0.133 0.067 50 36.7 13.3 6.7 Fi 10 13 16 19 10.5 13.5 16.5 19.5 4 7 2 2 n = 30 La primera columna # i Indica en cuantos grupos hemos dividido los datos. La segunda columna Límites Indica el valor inicial y el valor final de cada grupo o en otras palabras indica los límites de cada grupo de datos. La tercera columna Fronteras Representan los límites verdaderos o reales entre un grupo de datos y otro. Estos valores se calculan para prevenir la existencia de valores decimales en los datos. La cuarta columna MC Representa las marcas de clase, estas marcas de clase son el valor representativo de cada grupo de datos, y no son otra cosa que un promedio. La quinta columna fi Indica la frecuencia, que no es otra cosa que el número de elementos que tiene cada grupo de datos. Por ejemplo, el primer valor indica que solamente un dato del total se encuentra en la primera clase o grupo, entre 2-4. La sexta columna MC Representa la frecuencia acumulada, que representa el número de datos que existen por debajo de la correspondiente Frontera superior. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 23 La séptima columna fr % Indica la frecuencia relativa porcentual, que es en realidad el porcentaje del total de los datos de cada grupo de datos. Por ejemplo, el primer valor indica que 3% del total de los datos se encuentra en la primera clase, entre 2-4. Finalmente la última columna Fr (-)% Representa la frecuencia relativa acumulada porcentual, es la misma interpretación de la frecuencia acumulada sólo que en porcentaje. GRAFICOS REPRESENTATIVOS DE LAS DISTRIBUCIONES DE FRECUENCIAS Una forma visual y más rápida de analizar e interpretar datos es a través de gráficos. Existen muchos de ellos nosotros nos ocuparemos esencialmente de 3 de ellos: POLIGONO 10 9 9 8 8 7 FRECUENCIAS FRECUENCIAS HISTOGRAMA 10 6 5 4 3 7 6 5 4 3 2 2 1 1 0 0 0,5-3,5 3,5-6,5 6,5-9,5 9,5-12,5 12,5-15,5 15,5-18,5 -1 FRONTERAS 2 5 8 11 14 17 20 MARCAS DE CLASE OJIVA MENOR QUE FRECUENCIA ACUMULADA 32 Con ayuda de su Profesor y de la Ojiva responda: 28 24 A. Qué cantidad de Componentes tiene vida útil menor a 5 años? B. Qué porcentaje de componentes tiene vida útil mayor a 10 años? C. El porcentaje de componentes tiene vida útil entre 9 y 11 años? 20 16 12 8 4 0 0,5 3,5 6,5 9,5 12,5 15,5 18,5 FRONTERAS CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 24 Preguntas: 1. ¿Cuáles son las diferencias entre el Histograma y el Gráfico de barras Verticales? 2. Rellene los espacios en blanco. 1. La Sumatoria de las frecuencias Absolutas es igual al ____________. 2. La Sumatoria de las frecuencias relativas es igual a la _______________. 3. La Sumatoria de las frecuencias porcentuales es igual al _____________. 3. Rellene los espacios en blanco. a) b) c) d) e) f) La última Frecuencia Absoluta Acumulada Ascendente es igual al: _______________ La última Frecuencia Relativa Acumulada Ascendente es igual a la: _______________ La última Frecuencia Porcentual Acumulada Ascendente es igual al: _______________ La primera Frecuencia Absoluta Acumulada Descendente es igual al: _______________ La primera Frecuencia Relativa Acumulada Descendente es igual a la: _______________ La primera Frecuencia Porcentual Acumulada Descendente es igual al: _______________ g) Hay dos gráficos que pueden estar los dos en un mismo plano: Estos son: __________________ y ________________ CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 25 PRÁCTICO No1 1. Clasifique cada una de las siguientes afirmaciones en ESTADISTICA DESCRIPTIVA o ESTADISTICA INFERENCIAL a. Durante la gestion pasada el puntaje promedio del examen de admision de jovenes estudiantes fue de 71 pts en la Universidad Gabriel Rene Moreno b. Probablemente en la siguiente prueba de admision a un cargo para el area de ventas , llegaran aproximadamente 85 postulantes. c. La compania “R&M” predijo quien seria el ganador de una eleccion presidencial , despues de conocer los resultados de las votaciones de 25 mesas de sufragio de un total de 1500 mesas. 2. Indica cual es la poblacion y la variable estadistica de cada uno de los siguientes estudios estadisticos. Señala ademas que tipo es la variable estadistica. a) Preferencia deportiva de los estudiantes de tu materia b) Tiempo promedio invertido por los trabajadores UTEPSA en desplazarse desde su domicilo hasta su centro de trabajo. c) Numero de veces, en un año, que asisten al cine los habitantes de tu ciudad. Señala cuales de los estudios estadisticos mencionados seria necesario tomar una muestra. Justifica tu respuesta. 3. Se requiere elaborar un cuestionario que permita determinar como emplea la juventud cruceña su tiempo libre. Elabore: a) Preguntas abiertas b) Preguntas cerradas en base a la modalidad aprendida en clase. 4. Formar equipos de trabajo y planicar una encuesta para conocer el medio de transporte utilizado por los alumnos UTEPSA. Elaborar un cuestionario con preguntas cerradas de selección simple y/o multiple con variables: a) ordinales b) Nominales c) Cuantitativas Aplicación de lo aprendido Averigua el nombre de 2 empresas privadas que elaboren encuestas, Indica: a) Que tipo de investigacion efectúan. b) Indaga: La representatividad, coste y tiempo son factores que hay que considerar conjuntamente a la hora de decidir el tamaño de la muestra. ¿Porqué están involucrados? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 26 PRÁCTICO No2 Resuelve los siguientes problemas ABP para variable cualitativa: 1. Con el fin de conocer la forma de viajar de una población se ha preparado una encuesta para ver cuál es el medio de transporte preferido por dicha comunidad: OMNIBUS AVION TREN BARCO BARCO BARCO OMNIBUS AVION TREN TREN AVION AVION TREN TREN TREN AVION AVION OMNIBUS TREN AVION Se pide: a) Realizar el cuadro estadístico b) ¿Cuál es el medio de transporte más preferido por dicha comunidad? c) Construya un gráfico de Barras para la presentación de datos 2.Usted es Gerente de Recursos Humanos de la Cooperativa “AHORRA FELIZ”, muchas personas se han quejado del trato que le brinda el asesor de Crédito Facundo Torres, para verificar las quejas de los clientes, se ha decidido llamar telefónicamente a 12 clientes que el señor Torres atendió. Se les ha preguntado: ¿Qué le pareció el trato que recibió de nuestro asesor de créditos Facundo Torres? A continuación se muestran los resultados obtenidos: MALO NORMAL BUENO BUENO EXCELENTE MALO BUENO MALO BUENO EXCELENTE MALO BUENO Se pide: a) Realizar el cuadro estadístico b) ¿Cuál es el mayor porcentaje de calificación que los clientes dieron al asesor de créditos? c) Construya un gráfico de SECTORES para la interpretación de los datos 3. El siguiente cuadro muestra las entregas por mercado de las gaseosas que se venden en nuestra ciudad. La empresa investigadora “ Éxito S.A.” tiene algunas interrogantes. GASEOSAS COCA COLA PEPSI MENDOCINA TOTALES LOS POZOS 15 20 5 40 LA RAMADA 35 10 10 55 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP ABASTO 30 25 5 60 TOTALES 80 55 20 155 27 Se pide: a) Realizar el cuadro estadístico b) Realizar diagrama de barras por mercado individual c) Interpretación de los gráficos 4. En concepción se encuestaron a 20 personas y se les preguntó ¿Qué le pareció el sabor de la nueva marca de Sodas “Sodín”?, los resultados se muestran a continuación. No me gustó Excelente Regular No me gustó Regular Regular Regular Muy Buena Muy Buena Excelente Excelente No me gustó Normal Regular No me gustó Regular Excelente No me gustó No me gustó Regular ¿Si usted fuera el dueño de la empresa, lanzara su producto?, responda con base a análisis estadístico. 5. Nokia que produce y comercializa teléfonos celulares, necesita conocer el porcentaje mayor y menor de la variedad de colores, para sus planes de producción. A continuación el informe presentado por el departamento de ventas de las unidades vendidas del semestre pasado. Realizar cuadro estadístico, gráfico e interpreta. Blanco brillante Negro metálico Lima magnético Gris metálico Rojo fusión 130 104 325 455 256 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 28 PRÁCTICO No3 Resuelve los siguientes problemas ABP para variable cuantitativa: 1. Las calificaciones de matemáticas de 25 estudiantes del Centro de Nivelación “EMPRENDEDOR” se indican a continuación: 69 64 80 55 85 72 44 90 51 86 73 62 55 92 67 86 96 70 66 60 82 45 62 56 63 a) Elaborar el CDF. b) Graficar el histograma y el polígono de la frecuencia relativa porcentual. c) Interprete del intervalo 5, las columnas 5, 9 y 14. 2. Los siguientes datos representan el consumo diario de combustible, en barriles, de una empresa de servicios petroleros que trabaja para EBR: 15 12 30 41 20 24 22 15 31 40 12 22 16 20 32 35 15 28 18 25 40 36 32 21 16 15 19 29 34 22 A. Elabore una tabla de distribución de frecuencias del mismo ancho. B. Grafique el histograma, el polígono la ojiva menor. C. Con ayuda del histograma, indique entre que valores se tiene la mayor y la menor frecuencia de consumo. 3. Los jornales aproximados por semana en la industria metalmecánica, en dólares, son: 62 47 48 41 54 40 43 49 48 53 46 60 62 69 28 58 45 40 36 69 30 56 58 40 51 A. Elabore una tabla de distribución de frecuencias del mismo ancho. B. Grafique el histograma, el polígono la ojiva menor. C. Con ayuda del histograma, indique entre que valores están los mayores y menores salarios. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 29 4. A continuación se presenta la distribución de frecuencias de los salarios (en dólares) de un grupo de 50 obreros de la fábrica de aceite CRISOL LTDA., en el mes pasado SALARIOS No DE TRABAJADORES 114 - 119 1 120 - 125 4 126 - 131 8 132 - 137 13 138 - 143 10 144 - 149 11 150 - 155 3 A. Complete el cuadro de distribución de frecuencias. B. Con ayuda de la Ojiva menor, indique el porcentaje de obreros que ganan menos de 125 dólares. C. Con ayuda de la Ojiva menor, indique la cantidad de obreros que ganan más de 145 dólares. D. Con la ayuda de la ojiva menor, por debajo de que valor se encuentra el 60% de los salarios 5. Los siguientes datos muestran la cantidad de minutos que un grupo de clientes se demoraron para ser atendidos en las instalaciones del Banco Económico 1 . Realice un estudio que nos muestre un panorama general de lo que pasó ese día. 8 13 20 15 18 19 12 19 15 17 18 15 15 25 34 30 34 20 11 13 19 25 20 30 10 32 20 21 24 25 20 16 18 19 12 18 A. Elabore una tabla de distribución de frecuencias del mismo ancho. B. Grafique el histograma, el polígono la ojiva menor. C. Con ayuda del histograma, indique entre que valores están los mayores y menores resultados del tiempo en que demoraron en ser atendidos los clientes del Banco. 1 Estos datos no son reales, ni reflejan las condiciones de atención del Banco Económico, la única razón por la que se pone el nombre es para familiarizar al estudiante con el tema. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 30 6. Los siguientes datos muestran las edades de los integrantes del Club Social 21 de abril. Realice una tabla de Distribución de frecuencias y conteste las siguientes preguntas: a) ¿Qué porcentaje de los integrantes del Club son mayores de 46 años? b) ¿Qué porcentaje de los integrantes del Club son menores de 50 años? c) Construya el Histograma de Frecuencias Absolutas. d) Construya el Polígono de Frecuencias Relativas. e) Construya las ojivas menor y mayor que de frecuencias Absolutas. 35 65 47 45 45 32 43 48 48 42 40 40 42 40 32 32 40 60 39 34 50 50 40 37 65 52 42 38 32 53 41 50 35 45 41 34 37 48 42 62 7. Los siguientes datos muestran los ingresos de los obreros del Ingenio Guabirá, construya una tabla de distribución de frecuencias y los 12 gráficos del estudio cuantitativo. 100 300 321 290 178 150 280 200 265 186 123 235 254 245 185 164 300 345 265 195 130 340 320 235 120 210 321 365 203 150 200 190 300 300 203 321 254 200 254 240 159 236 250 170 230 8. Los siguientes datos muestran la cantidad de veces que un grupo de 32 encuestados en Pailón se refriaron el año pasado. 1 3 3 5 1 4 1 0 2 5 1 1 1 2 2 1 1 1 2 1 1 2 2 3 1 2 3 3 3 2 4 2 A. Elabore una tabla de distribución de frecuencias del mismo ancho. B. Grafique el histograma, el polígono la ojiva menor. C. Interprete los valores mayores y menores de las frecuencias absolutas. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 31 9. Los siguientes datos muestran las ventas de la empresa “Aqualoe” de los primeros tres meses (expresadas en dólares). Construya una tabla de distribución de frecuencias y los tres Histogramas y polígonos de frecuencias. 100 147 156 195 200 120 158 123 174 225 150 123 100 185 230 130 100 125 165 232 180 123 125 132 232 190 120 165 154 231 152 150 187 123 231 135 159 185 102 235 100 125 156 189 215 200 150 150 180 190 160 180 180 220 200 185 205 180 195 170 10. Los datos que se muestran a continuación son el número de autos que ocuparon los servicios de lavado de los cuatro lavaderos de Don Alberto el mes de marzo del 2018. Realice una tabla de distribución de frecuencias para cada sucursal y una tabla general de todos los lavaderos. 2 10 8 5 4 15 18 20 5 8 Norte 15 15 12 10 29 5 5 24 20 21 12 15 18 16 15 14 13 15 10 14 5 6 9 6 10 12 15 20 19 5 Sur 6 8 8 12 1 15 1 18 15 10 10 14 11 10 15 1 4 5 2 10 15 10 12 5 4 5 12 12 16 10 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP Este 10 5 15 10 12 4 16 5 18 6 20 4 5 1 4 2 7 10 9 15 10 10 15 11 5 4 7 4 7 8 Oeste 12 20 21 25 14 16 18 19 20 12 12 14 16 15 18 9 9 9 1 6 32 11. Los siguientes datos muestran los puntajes de calificación de la materia Contabilidad Básica de los 2 grupos de la Universidad (noviembre 2017) 78 85 56 98 100 54 65 85 80 90 Grupo A 100 95 51 80 40 75 45 70 85 60 80 54 75 80 65 64 65 100 64 72 55 65 60 59 80 75 65 64 80 95 Grupo B 100 95 94 96 91 40 51 65 54 81 64 54 76 85 94 65 46 51 70 75 56 64 54 100 Realice una tabla de Distribución de frecuencias para cada uno de los grupos y una tabla general de toda la materia. 12.Complete la siguiente tabla de Distribución de Frecuencias y construya las 6 ojivas. Tabla III - 1 “Edades de los profesores del Colegio Rio Nuevo” Front Front Lim Inf Lim Sup Inf Sup # Int Li Ls Fi Fs Xi fi fr fr% Fi(-) Fr(-) Fr%(-) Fi(+) Fr(+) Fr%(+) 1 30 15 5 36 100 15 15% 30 20 90 97 8 3 Fuente: Elaboración propia con los datos del Colegio. (Enero/2018) CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 33 Prácticos y/o Laboratorios 1. A partir del siguiente cuadro referido a alumnos matriculados en diferentes carreras en una universidad, realizar mediante el programa de Excel, el gráfico del diagrama de barras para ambas frecuencias. CUADRO I.1 ALUMNOS MATRICULADOS POR CARRERAS EN UNA UNIVERSIDAD CARRERA NUMERO DE ALUMNOS % Administración 800 15.69 Contaduría Pública 600 11.76 Derecho 1200 23.53 Economía 700 13.73 Ingeniería Industrial 1300 25.49 Psicología 500 9.80 TOTAL 5.100 100,00 Fuente: Elaboración propia 2. Realizar los gráficos de líneas en el programa de Excel para los ingresos y costos CUADRO I.2 NGRESO Y COSTO (Expresado en cientos de millones de $us) AÑOS INGRESOS COSTOS CIENTOS DE MILLONES EN CIENTOS DE MILLONES 2009 260 110 2010 380 200 2011 300 150 2012 620 420 2013 470 360 2014 720 510 2015 870 620 Fuente: Elaboración propia CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 34 Innovación y/o Emprendimiento INNOVACION: EXPRESIONES NUEVAS INCORPORADAS AL LENGUAJE PARA LA FORMACION PROFESIONAL Indicar el significado de las siguientes palabras y expresiones y entre paréntesis colocar su equivalente en el idioma inglés, además colocar las expresiones en orden alfabético. 1. Estadística 2. Estadística Descriptiva 3. Estadística Inferencial 4. Fuente Primaria 5. Fuente secundaria 6. Encuesta 7. Población Estadística 8. Población finita e infinita 9. Muestra 10. Parámetro 11. Estadístico de la muestra 12. Censo 13. Datos 14. Variables 15. Diagrama de frecuencia 16. Histograma de frecuencia 17. Curva de frecuencia 18. Redondeo de datos 19. Dígitos significativos 20. Tabulación 21. Sesgo 22. Curtosis 23. Distribuciones simétricas Ética Responsabilidad Social Formación Internacional Idioma Ingles Artículo extractado y adecuado de: Estadística para Administración, Varios Autores. 6ta. Edición. Editorial Pearson. 2014 ETICA: (Según el Diccionario) Referida a la moral en el comportamiento humano. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 35 LA ESTADISTICA DESCRIPTIVA: DESVENTAJAS Y ASPECTOS ETICOS En la materia se explica la forma en que un conjunto de datos numéricos puede describirse por medio de los estadísticos que proporcionan las medidas de tendencia central, de variación y de localización. En las empresas a menudo se incluyen estadísticos descriptivos como los que hemos estudiado, en los informes ejecutivos que se preparan en forma periódica. El volumen de información disponible en Internet, en los periódicos y en las revistas ha provocado gran escepticismo acerca de la objetividad de los datos. Cuando lea información que incluya estadísticos descriptivos, debe tener en mente el sarcasmo que suele atribuirse a Benjamín Disraeli, el famoso estadista británico del siglo XIX: “Existen tres clases de mentiras: las mentiras, las malditas mentiras y la estadística”. Por ejemplo, cuando examine estadísticos, debe comparar la media y la mediana. ¿Son similares o son diferentes? O bien, ¿solo se proporciona la media? Las respuestas a estas preguntas ayudarán a determinar si los datos están sesgados o son simétricos, y si la mediana podría ser una mejor medida de tendencia central que la media. Además, deberá determinar si también se incluyó la desviación estándar o el rango intercuartil para un conjunto de datos muy sesgado. Sin esta información, es imposible determinar la cantidad de variación que existe en los datos. Al decir que resultados debe incluir en un informe surgen consideraciones éticas. Es necesario documentar tanto los resultados buenos como los malos. Además, al hacer presentaciones orales y al presentar informes escritos, se deben reportar los resultados de una forma justa, objetiva y neutral. Cuando de forma intencional no se reportan los hallazgos que afectan de manera negativa a una postura en particular, se incurre en una conducta poco ética. Instrucciones: En una hoja de papel tamaño carta, en forma manuscrita escriba su opinión personal acerca del artículo precedente en un mínimo de 12 líneas o renglones y preséntela al docente en la fecha que el indique. Aplicación de lo aprendido En base al tema de investigación a desarrollar, una vez realizada su encuesta, aplique todos los temas aprendidos en esta unidad, utilizando un software (SPSS, Excel) e interpreta los resultados obtenidos. Exponer y presentar en el proyecto final de la materia. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 36 UNIDAD 2 MEDIDAS DE TENDENCIA CENTRAL Objetivos de aprendizaje: Identificar, calcular e interpretar las medidas de tendencia central más utilizados. Preguntas: 1.- ¿Que se entiende por Estadígrafo? 2.- ¿Que se entiende por Promedio? 3.- ¿Cuáles son los principales estadígrafos que se estudiaron en la unidad? 4.- ¿Cual la diferencia entre Media Poblacional y media Maestral? 5.- ¿Cómo se define la media ponderada? 6.- ¿Cuál es la diferencia entre media para datos no tabulados y datos tabulados? 7.- ¿Cuáles son las ventajas de la media aritmética? 8.- ¿Cuáles son las ventajas de la media aritmética? 9.- ¿Que se entiende por Mediana? 10.- ¿Cual la diferencia entre mediana para datos tabulados y datos no tabulados? 11.- ¿Cual la diferencia entre la media y la mediana? 12.- ¿En qué situaciones en que la media no es un estadígrafo representativo se debe utilizar la mediana para obtener un promedio válido? 13.- ¿Cuáles son las situaciones en las que la media no puede calcularse? 14.- ¿Se puede decir que la mediana es representativa de todos los datos? ¿Por qué? 15.- ¿Cuáles son las desventajas de la mediana? 16.- ¿Que se entiende por Moda? 17.- ¿Cuáles son las ventajas de la Moda? 18.- ¿Si el conjunto de datos es multimodal el valor modal es válido? ¿Por qué? 19.- ¿Desde el punto de vista matemático cuál de los tres estadígrafos es más manejable? 20.- Desde el punto de vista de la Disimetría ¿cuál es la relación que se establece entre la media, la mediana y la moda? 21.- Cual es la medida de tendencia central que NO debe utilizarse cuando se tiene una distribución notablemente sesgada? 22.- Qué se entiende por Media Geométrica? 23.- En que situaciones se utiliza la Media Geométrica? 24.- Cual es la otra denominación del segundo cuartil 25.- Que se entiende por primer Cuartil y tercer cuartil? 26.- Cual es la otra denominación del segundo cuartil? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 37 MEDIDAS DE TENDENCIA CENTRAL Del mismo modo que los gráficos pueden mejorar la presentación de los datos, las descripciones numéricas también tiene gran valor. Una característica importante de un conjunto de datos es su tendencia central, las medidas de tendencia central determinan que tan agrupados se encuentran los datos alrededor de un valor fijo. Entre estas tenemos: media (aritmética) media geométrica media cuadrática media armónica mediana moda fractiles (cuartiles, deciles y percentiles) Nosotros estudiaremos las siguientes medidas: MEDIA La medida más común de centro de un conjunto de datos es el promedio o media aritmética. Matemáticamente: Para datos agrupados x xi . fi Para datos no agrupados Calcular el promedio, como se hace normalmente. n Nota: La media aritmética se la utiliza para variables cuantitativas. MEDIANA Es otra medida de tendencia central, representa el punto o valor donde el conjunto de datos se divide en dos partes iguales. La palabra “mediana” es sinónimo de parte media. Matemáticamente: Para datos agrupados n Fi -1 Me Fi 2 C f Para datos no agrupados Ordenar los datos de menor a mayor y ubicar el valor o los valores, según corresponda, a la mitad de los datos. Nota: La mediana se la utiliza normalmente para variables ordinales, pero también se usa en variables cuantitativas. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 38 MODA Es la observación que se presenta con mayor frecuencia, o dicho de otro modo, es la observación que se repite más veces. Matemáticamente: Para datos agrupados Mo Fi 1 1 2 Para datos no agrupados Buscar dentro de los datos el número que se repite mayor cantidad de veces. C Nota: La moda se la utiliza normalmente para variables nominales, pero también se usa en variables cuantitativas FRACTILES Los fractiles son valores que dividen a un conjunto de datos en partes iguales. Por ejemplo los cuartiles dividen el conjunto de datos en 4 grupos de igual tamaño, los deciles en 10 grupos y los percentiles en 100 grupos. PROBLEMA ABP RESUELTO (Para datos agrupados) INDUSTRIAS FINO, analiza las ventas de un nuevo aceite de maíz, correspondientes al mes de Junio de 2017. Se ha recopilado información acerca de las ventas en miles de dólares de una sucursal. Resuma la información en un cuadro de distribución de frecuencias. 7 12 15 4 12 5 18 5 11 5 4 4 15 7 10 5 4 7 9 6 11 3 17 7 11 9 12 7 12 9 Determine la media aritmética, la mediana y la moda correspondientes a las ventas de aceite de maíz de INDUSTRIAS FINO: CUADRO DE DISTRIBUCION DE FRECUENCIAS Limites Fronteras MC = #I Xi Li Ls Fi Fs 1 2 4 1.5 4.5 3 2 5 7 4.5 7.5 6 3 8 10 7.5 10.5 9 4 11 13 10.5 13.5 12 5 14 16 13.5 16.5 15 6 17 19 16.5 19.5 18 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP fi Fi (-) fr% Fr% (-) 5 10 4 7 2 2 5 15 19 26 28 30 16.67 33.33 13.33 23.33 6.67 6.67 16.67 50.00 63.33 86.66 93.33 100 39 s s MEDIA Xi fi Xi.fi 3 6 9 12 15 18 15 60 36 84 30 36 5 10 4 7 2 2 x xi.fi n 261 8.70 miles de dólares 30 Interpretación: Las ventas diarias de aceite alcanzan un promedio de 8,700 dólares 261 MEDIANA Fi fi Fi(-) 1,5 4,5 7,5 10,5 13,5 16,5 5 10 4 7 2 2 5 15 19 26 28 30 n Fi - 1(ant.) 15 5 Me Fi 2 C 4.5 3 7.50 miles de dólares 10 f Interpretación: 50% de las ventas diarias de aceite están por debajo de los 7,500 dólares. MODA Fi fi 1,5 4,5 7,5 10,5 13,5 16,5 5 10 4 7 2 2 1 =10-5 =5 2 = 10-4 =6 Mo Fi Δ1 Δ Δ 1 2 C 4.5 5 3 5.86 miles de dólares 56 Interpretación: Lo más frecuente (lo más común) es que se venda diariamente 5,860 dólares CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 40 PRÁCTICO No4 Resuelve los siguientes problemas ABP de medidas de tendencia central 1. Usted tiene los datos de ventas de las últimas 6 semanas. ¿Cuál es el promedio de ventas semanales, mediana y moda? 1356 1456 1409 1567 1321 1564 2. Los siguientes datos muestran la cantidad de prendas compradas por una muestra aleatoria de 8 personas en el Mercado “7 calles” ubicada en el centro de la Ciudad de santa Cruz de la Sierra, Bolivia. Indique de las 8. ¿Cuál es el promedio que se gastó en compras, mediana y moda? 12 14 10 7 5 12 30 26 3. El Ministerio de Educación informó que durante los últimos años recibieron grados de licenciatura en diferentes carreras el siguiente número de personas: 5.033, 5652, 6407, 7201, 8719, 11.154 y 15.121. ¿Cuál es la media del número anual de personas que se graduaron? ¿Es una media muestral o una media poblacional? 4. En el siguiente cuadro se refiere a los tiempos de servicio para varios empleados que se retiran o jubilan: Empleado Tiempo servicios(años) M Arce 13 S. Jiménez 22 T.Teran 27 B. Sorel 24 L. Arce 19 a) ¿Cuál es la media aritmética de los tiempos de servicio? b) ¿Cuál es la mediana de dichos tiempos? 5. En una muestra de 15 estudiantes de primaria sobre el monto de su gasto se observan los siguientes montos equivalentes en dólares americanos en orden ascendente de magnitud son las siguientes: 0,10; 0,10; 0,25; 0,25; 0,25; 0,35; 0,40; 0,53; 0,90; 1,25; 1,35; 2,45; 2,71; 3,09; 4,10. Determine: a) La media, la mediana y la moda. b) El segundo cuartil c) el segundo decil. d) el punto percentil 40 de este monto de gastos CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 41 6. En una muestra de paquetes que salen de una oficina de courrier se encuentra que los pesos dados hasta la onza más cercana son: 21, 18, 30, 12, 14, 17, 28, 10, 16, 25 onzas. Determine: a) el tercer cuartil, b) el tercer decil c) el punto percentil 70. 7. La fundación INFOCAL, por concepto de cursos de capacitación, genera mensualmente los siguientes ingresos, en miles de bolivianos: 5 12 18 11 4 20 12 3 16 15 15 12 19 2 25 12 6 3 9 10 A. Elabore una tabla de distribución de frecuencias del mismo ancho. B. Determine la media aritmética, la mediana y la moda de estas observaciones. C. Calcular los fractiles e interprete. 8.Las ventas semanales de monitores Samsung de la empresa LOGIC COMPUTERS, el distribuidor más grande de Santa Cruz, de los últimos 6 meses se detallan a continuación: 100 60 66 85 80 72 55 83 70 55 70 72 52 69 63 82 75 110 91 90 A. Elabore una tabla de distribución de frecuencias del mismo ancho. B. Determine la media aritmética, la moda y la mediana de estas observaciones. C. Grafique estas observaciones en un histograma y polígono de frecuencias relativas porcentuales. 9.Complete la siguiente tabla de distribución de frecuencias determine: la media, la mediana moda y los fractiles e interprete. #I Intervalos 1 2 3 4 5 6 11 15 19 23 27 31 14 18 34 Fronteras Xi 10,50 14,50 12,50 14,50 18,50 16,50 18,50 22,50 26,50 30,50 30,50 34,50 32,50 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP fi Fi(-) fr% Fr%(-) 1 2 0 12 1 1 20 20 5,00 10,00 0,00 60,00 20,00 5,00 5,00 15,00 15,00 75,00 95,00 100,00 42 10. HOTEL CORTEZ, está tratando de obtener un crédito. El banco dará el crédito si se demuestra que el 50% de los ingresos del hotel están por arriba de los 400 dólares diarios. A continuación, se detallan los ingresos del hotel de los últimos 20 días: 485 490 610 485 495 410 450 390 495 400 610 680 450 510 420 500 495 480 590 510 A. Resuma la información en un cuadro de distribución de frecuencias B. Demuestre cuantitativamente si el hotel recibirá o no el crédito del banco. 11. La distribución de acciones de una sociedad es: Acciones Accionistas 0-50 23 50-100 72 100-150 62 150-200 48 200-250 19 250-300 8 300-350 14 350-400 7 400-500 7 Calcular: a) El número medio de acciones que posee un accionista. b) Número de acciones que más frecuentemente posee un accionista. c) Número de acciones que debe poseer un accionista para que la mitad de los restantes accionistas tengan menos acciones que él. d) Calcule los fractiles e interprete 12.En la empresa de telecomunicaciones VIVA existe un reclamo por parte de las mujeres mencionando la hipótesis que ellas ganaban menos que los hombres, usted como analista estadístico debe explicar si esto es cierto ó falso. Sueldos (dólares) 100 200 200 300 300 400 400 500 500 600 600 700 700 800 hombres 10 12 20 13 5 4 1 65 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP Mujeres 5 3 12 15 12 15 3 65 43 Casos de Estudio y ABP RELACION ENTRE LA MEDIANA, LA MEDIA Y LA MODA Ejercicio 1: Utilizando el siguiente cuadro de distribución, hallar: la media, la moda y la mediana. SALARIOS SEMANALES PARA TRABAJADORES NO CALIFICADOS ________________________________________________________ Salario Semanal xi fi xi fi Fi(-) 140 159 …….. 7 ………. …….. 160 179 ……… 20 ……… …….. 180 199 ……… 33 ………. …….. 200 219 ……… 25 ………. ……. 220 239 ……… 11 ………. …….. 240 259 ……… 4 ………. ………. Totales 100 ……… Ejercicio 2: Una firma de contadores públicos se anota el tiempo necesario para hacer una auditoría de 50 balances contables, como se indica en la siguiente tabla. Calcule a) la media, b) la mediana c) la moda d) comente la forma de la distribución para los tiempos de auditoria presentados. Tiempo de Auditoria xi Número de xi. fi Fi(-) (en minutos) registros (fi) 10 19 14,5 3 …….. …… 20 29 24,5 5 …….. ……. 30 39 34,5 10 ……. …… 40 49 44,5 12 …….. ……. 50 59 54,5 20 …….. ……. TOTALES 50 ………. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 44 Investigación Utilizando la bibliografía complementaria y los enlaces en Internet investigue lo siguiente: 1) ¿Cuándo un conjunto de datos contiene valores extremos se recomienda no utilizar la media y en su lugar se recomienda utilizar la mediana o la moda, que otra medida se puede utilizar en lugar de estas y cuál sería el procedimiento? 2) Obtenga los siguientes promedios de fuente secundaria confiable, realizando la interpretación o indicando su significado dentro de su contexto: Tasa de crecimiento promedio del PIB en los últimos 10 años Edad promedio de los bolivianos estimado al 2017 Consumo per-cápita de leche en Bolivia Esperanza de vida de los bolivianos en la actualidad Consumo per-cápita de huevos en Bolivia PIB per-cápita en Bolivia al 2016 Innovación y/o Emprendimiento GLOSARIO. Indicar el significado de las palabras nuevas incorporadas en la presente unidad, indicando además su equivalente en el idioma inglés, además de detallar en forma alfabética. 1. Media Aritmética 2. Estadígrafo de tendencia central 3. Promedio 4. Media Geométrica 5. Media Armónica 6. Mediana 7. Moda 8. Media Cuadrática 9. Quartiles 10. Deciles 11. Percentiles CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 45 Unidad 3 Tema: Medidas de Dispersión Objetivo de aprendizaje: Identificar, calcular e interpretar las medidas de dispersión más aplicadas. Preguntas 1.- Cual es el objeto principal para el estudio de la dispersión? 2.- Cuales son las principales medidas de dispersión? 3.- En que consiste la Amplitud total? 4.- Define lo que se entiende por Desviación media Absoluta. 5.- Defina lo que se entiende por Varianza? 6.- Que otra denominación recibe la varianza? 7.- Qué se entiende por Desviación Estándar? 8.- Escriba la fórmula de la Varianza Poblacional y la fórmula de la Varianza Muestral. 9.- Indique la formulación del Teorema de Chevyshev 10.- En que consiste la Regla empírica a partir del Teorem de Chevyshev? 11.- Cómo se define el Coeficiente de Variación? MEDIDAS DE DISPERSIÓN Las medidas de tendencia central no necesariamente proporcionan información suficiente para describir datos de manera adecuada. Es así que surgen las medias de dispersión que indican cuan dispersos o alejados están los datos con relación a un valor fijo. Las medidas de dispersión son importantes cuando se comparan grupos de datos provenientes de distintas fuentes. Entre las medias de dispersión más usuales tenemos a: RANGO Esta es una medidas de dispersión que solo toma en cuenta el valor mínimo y el valor máximo de un conjunto de datos para dar una idea de la variabilidad del conjunto. Matemáticamente: RANGO MAX MIN para datos agrupados y no agrupados CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 46 DESVIACION MEDIA Medida de dispersión que determina la dispersión tomando valores absolutos, para su cálculo utiliza a todo el conjunto de datos. Matemáticamente: DM xi x .fi para datos agrupados, DM n xi x n para datos no agrupados RANGO SEMI-INTERCUARTIL Medida de dispersión calculada en función a los cuartiles. Matemáticamente: RSI Q 3 Q1 2 Para datos agrupados y no agrupados Nota. Otra forma de interpretar las medidas de dispersión es decir que representan la homogeneidad de los datos, mientras más pequeña es la dispersión los datos están más juntos y viceversa. DESVIACION TIPICA O ESTÁNDAR Otra medida de dispersión, la más usada por que utiliza a todos los datos para su cálculo. Matemáticamente: s s 2 xi x . fi O s n xi x n 2 O s 2 xi x .fi n 1 xi x n 1 para datos agrupados Nota. A. Si n 30 se usa la formula con el termino n-1. B. 2 para datos no agrupados SI n ≥ 30 se usa la formula con el termino n. VARIANZA Matemáticamente: Varianza s 2 Para datos agrupados y no agrupados COEFICIENTE DE VARIACION Permite calcular en porcentaje la dispersión, es una medida de dispersión relativa. Matemáticamente: CV s x 100 Para datos agrupados y no agrupados CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 47 PROBLEMA ABP ANTERIOR (Para datos agrupados) Determine la desviación media, el rango semi-intercuartil, la desviación estándar y la varianza correspondientes a las ventas de aceite de maíz de INDUSTRIAS FINO: DESVIACION MEDIA | Xi fi xi.fi 3 6 9 12 15 18 5 10 4 7 2 2 15 60 36 84 30 36 28.5 27.0 1.2 23.1 12.6 18.6 261 111 xi x fi x Xi.fi n DM fi Fi(-) 1,5 4,5 7,5 10,5 13,5 16,5 5 10 4 7 2 2 5 15 19 26 28 30 xi x .fi n 111 3.70 miles de dólares 30 1.n Fi -1 7.5 5 4 Q Fi C 4.5 3 5.25 1 10 f 3.n Fi -1 22.5 19 Q Fi 4 C 10.5 3 12 3 RSI 7 f Q3 Q1 2 12 5.25 3.38 miles de dólares 2 DESVIACION ESTANDAR xi fi xi.fi xi x fi 3 6 9 12 15 18 5 10 4 7 2 2 15 60 36 84 30 36 162.45 72.9 0.36 76.23 79.38 172.98 261 564.3 261 8.70 30 RANGO SEMI-INTERCUARTIL Fi VARIANZA 2 x xi.fi n s 261 8.70 30 2 xi x .fi n 564.3 4.34 miles de dólares 30 2 2 Varianza s 4.34 18.84 miles de dólares CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 48 PROBLEMA APE RESUELTO (Para datos no agrupados) Burger King – Santa Cruz analiza los tiempos de servicio, desea determinar el cuál de la dos sucursales, el CRISTO o la BLACUTT, los tiempos de servicio están mejor controlados, esto debido a quejas de los clientes. Para este efecto, se hace un pequeño estudio y se determinan los siguientes tiempos, en minutos: SUC. EL CRISTO x xi 11.43 minutos SUC. EL CRISTO 12 15 14 15 9 8 7 SUC. BLACUTT 12 15 10 6 7 5 13 Importante: Para datos no agrupados resulta más rápido calcular la media y la desviación a través del uso de las funciones de una calculadora científica. Consulte a su docente como realizar esto. n xi x n -1 s CV s 2 3.41minutos 100 x 3.41 100 29.83 % 11.43 SUC. PLAZUELA BLACUTT x xi 9.71 minutos s CV n xi x n -1 s x 2 3.82 minutos 100 Nota: Observe que para hacer la comparación entre dos grupos de datos se determina el CV. 3.82 100 39.30 % 9.71 Como conclusión diremos que como el coeficiente de variación de la sucursal EL CRISTO es el más pequeño los tiempos de servicio están mejor controlados o son más homogéneos en esta sucursal. Note que la variación se produce por la existencia de valores bajos y altos y que esta no se puede evitar, pero si controlar. Por ejemplo, en el caso de las sucursales habrá que ver que hace que los empleados no tengan el mismo tiempo de atención para los clientes, ya sea por desgano, pedidos voluminosos, gran afluencia de gente, etc. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 49 DIAGRAMA BOX PLOT (DIAGRAMA DE CAJA) Este es un diagrama muy usado para observar la dispersión de los datos. Para construir este diagrama se siguen los siguientes pasos: Se ordenan los datos. Se determina el valor máximo y el valor mínimo. Se encuentran los cuartiles (Q1, Q2 y Q3) Se realiza una escala (vertical u horizontal). Se grafican los valores. PROBLEMA ABP RESUELTO INDUSTRIAS FINO, analiza las ventas de un nuevo aceite de maíz, correspondientes al mes de Junio de 2017. Se ha recopilado información acerca de las ventas en miles de dólares de una sucursal. Grafique el BOX PLOT 3 7 11 4 7 11 4 7 12 4 7 12 4 7 12 5 9 12 5 9 15 5 9 15 5 10 17 6 11 18 MIN = 3 MAX = 18 1.n Fi -1 7.5 5 Q Fi 4 C 4.5 3 5.25 1 fi 10 2.n Fi -1 15 5 Q Fi 4 C 4.5 3 7.50 2 fi Nota: Observe que los cuartiles han sido calculados anteriormente 10 3.n Fi -1 22.5 19 Q Fi 4 C 4.5 3 12 3 fi 7 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 50 24 20 16 12 8 ventas diarias 4 0 0 4 8 12 16 20 24 ventas diarias TEOREMA DE TCHEBYSHEV En todo conjunto de datos que represente una distribución simétrica se cumple que, dentro de: x 1s existe un 68.27% de los datos x 2s existe un 95.45% de los datos x 3s existe un 99.73% de los datos Nota: Toda distribución simétrica recibe el nombre de distribución normal. Para verificar este teorema utilizaremos las siguientes fórmulas de cálculo: (x 1s) FiA (x 1s) FiB 100 (x 1s)% f A f A f INTERNAS fB c c n (x 2s) FiA (x 2s) FiB 100 (x 2s)% f A f A f INTERNAS fB c c n (x 3s) FiA (x 3s) FiB 100 (x 3s)% f A f A f INTERNAS fB c c n CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 51 PRÁCTICO No 5 Resuelve los siguientes problemas ABP de medidas de dispersión 1. Dos obreros del mismo trabajo muestran los siguientes resultados en un periodo determinado en minutos. Medidas Tiempo promedio para el desarrollo de su trabajo Desviación típica A 42 8 Obreros B 35 6 Calcular: a) ¿Cuál es el más regular en el desarrollo de su trabajo? b) ¿Cuál es el más rápido en terminar el trabajo? 2. Los pesos de una muestra de cajas listas para embarcarse a Francia son: (en kilogramos): 103, 97, 101, 106 y 103. A) Cual es la desviación media? B) Cómo se la interpreta? 3. Los pesos de un grupo de cajas que se van a enviar a un determinado país son en kilogramos: 95, 103, 105, 110, 104, 105, 112 y 90 a) calcule la desviación media, b) Interprete el resultado obtenido. C) Compare la dispersión de los pesos de los envíos que van a Francia con la dispersión del presente ejercicio. 4.Diez expertos clasificaron una galleta con trozos de chocolate de nuevo desarrollo en una escala de 1 a 50. Sus Calificaciones fueron: 34, 35, 41, 28, 26, 29, 32, 36, 28, y 40, a) Cual es la amplitud de las calificaciones?, ¿b) Cual es su media aritmética?, c) Cuál es su desviación media? Interprete su resultado, d) Un segundo grupo de expertos calificó el mismo producto. La amplitud total fue 8, la media 33,9 y la desviación media 1,9. Compare la dispersión en estas calificaciones con la del primer grupo de expertos. 5.- Las edades de los pacientes en el pabellón de aislados en el hospital de la ciudad son: 38, 26, 13, 41 y 22 años. ¿Cuál es la varianza de esa población? Cuál se desviación estándar?. Interprete el último resultado. 6.- Una población está formada por los pesos de todos los integrantes de un equipo de basket y son: (en libras) 204, 215, 207, 212, 214, y 208. ¿Cuál es la varianza poblacional? ¿Cual es la desviación estándar poblacional? 7.- Los pesos contenidos de varios frascos pequeños de aspirina son: (en gramos): 4, 2, 5, 4, 5, 2 y 6. Cuál es la varianza muestral y la desviación estándar muestral?, ¿la desviación estándar muestral está en las mismas unidades de medición que en el problema original? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 52 8. Industria PIL, realiza diariamente un control de la calidad de temperatura en ºC con que llega la leche a la planta procesadora, las mediciones de las últimas tres horas, ya tabuladas, se muestran a continuación: Intervalos de temperatura 05 – 09 10 – 14 15 – 19 20 – 24 25 – 29 30 - 34 Frecuencia 4 12 25 32 11 12 A. Complete la tabla de distribución de frecuencias. B. Determine la desviación típica, la varianza y el coeficiente de variación. 9. BANCO BISA, ha sacado al mercado un nuevo tipo de préstamo a una tasa de interés accesible. La cantidad de dinero prestada, en miles de dólares, así como la cantidad de clientes que han hecho los préstamos se detallan a continuación: Monto de los préstamos 01 – 30 31 – 60 61 – 90 91 - 120 Nº de clientes 95 114 10 1 A. Complete la tabla de distribución de frecuencias. B. Determine la desviación típica, la varianza y el coeficiente de variación. 10. En dos empresas petroleras se realizó un estudio del número de accidentes que se dan por no usar ropa y accesorios de seguridad. Se quiere saber en cuál de ellas está mejor controlada la seguridad y por qué. BOLINTER PETBOL 8 12 7 5 6 12 5 6 9 9 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 9 6 6 4 4 5 7 3 5 4 53 11. El gerente de marketing de TIENDAS LEVI`S – SANTA CRUZ, analiza las ventas en dos de sus sucursales. Indíquele Ud. en cuál de ellas las ventas son más homogéneas y permiten hacer una planificación a futuro con objeto de ampliar la tienda. (Los datos representan las ventas en cientos de dólares mensuales). SUCURSAL1 SUCURSAL2 42 42 40 53 46 52 45 37 39 51 39 46 38 44 44 53 51 52 12. A continuación presentamos los datos de una muestra de la tasa de producción diaria de escobas de una empresa en el TORNO: 17, 21, 18, 27, 17, 21, 20, 22, 18, 23 El gerente de producción de la empresa siente que una desviación estándar de más de 4 escobas diarias indica variaciones de tasas de producción inaceptables. ¿Deberá preocuparse el gerente por las tasas de producción de la empresa? 13. El número de cheques cobrados diariamente en una sucursal del BANCO NACIONAL DE BOLIVIA durante el mes anterior tuvo la siguiente distribución de frecuencias: CLASE 0 – 199 200 – 399 400 – 599 600 – 799 800 - 999 fi 10 13 17 42 18 El director de operaciones del banco, sabe que una desviación media en el cobro de cheques mayor a 200 ocasiona problemas de personal y organización en la sucursal. ¿Deberá preocuparse por la cantidad de empleados que va ha ocupar el siguiente mes? 14. FERROTODO analiza el desempeño de 3 de sus vendedores, se ha calificado la coherencia en torno a los objetivos de venta establecidos. Las calificaciones mostradas son las de los últimos 5 meses: LINDA KATHY ANA 88 76 104 68 88 88 89 90 118 92 86 88 103 79 123 Cuál de las vendedoras ha sido más coherente. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 54 15. Un encargado de compras ha obtenido muestras de lámparas incandescentes de 2 proveedores. Envía estas muestras a un laboratorio donde se realizan pruebas respecto a la vida útil, con los siguientes resultados: Duración de la vida útil (En horas) 700 – 899 900 – 1099 1100 – 1299 1300 - 1499 Muestra de: Proveedor A Proveedor B 10 3 16 42 26 12 8 3 A. Las lámparas de qué proveedor tienen mayor promedio de duración. B. Las lámparas de qué proveedor tienen mayor uniformidad, respecto a su vida útil. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 55 UNIDAD 4: Medidas de forma Objetivo del aprendizaje: Identificar, calcular e interpretar las medidas de forma Preguntas 1.- En qué consisten las medidas de asimetría? 2.- Cuando existe asimetría positiva? 3.- Cuando existe asimetría negativa? 4.- Cuando la distribución es simétrica? 5.- Como se llama el autor que desarrolló la medida para evaluar el sesgo? 6.- Cual es la fórmula del coeficiente de asimetría(C.A.)? 7.- Qué estadígrafos de tendencia central se utiliza para las medidas de forma? 8.- Cual es la fórmula que se utiliza para medir el grado de asimetría? 9.- Cual es el otro nombre que recibe la curtosis? 10.- Cual es la fórmula para medir la curtosis? MEDIDAS DE FORMA Las curvas que representan los puntos de datos de un conjunto de datos pueden ser simétricas o sesgadas (asimétricas). Las curvas simétricas tienen una forma tal que una línea que pase por el punto más alto dividirá el área de esta en dos partes iguales. Las curvas sesgadas son aquellas que representan distribuciones de frecuencias que están concentradas el extremo inferior o en el superior de la escala de medición. La medida más simple de asimetría se basa en la distancia que pueda existir entre la media aritmética y la mediana. Por tanto, se puede definir un coeficiente de asimetría como sigue: AS _ 3( x - Me) s AS = (+) Cas Nota: Si bien esta fórmula en la práctica tiene un uso limitado, nosotros la utilizaremos de manera didáctica. La medición de la asimetría requiere técnicas más avanzada que las aquí presentadas. _ ( x - Moda) s AS = 0 AS = (-) Si AS es +, entonces la curva esta sesgada a la derecha. Si AS es , entonces la curva esta sesgada a la izquierda. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 56 EJEMPLOS DE ASIMETRIA El número de días que se encuentra almacenada la fruta en un depósito. El tiempo de atraso en el pago de un crédito a una institución bancaria. La nota de los alumnos en un examen difícil. KURTOSIS O APUNTAMIENTO Cuando medimos la KURTOSIS estamos midiendo su grado de agudeza. En la figura del ejemplo las curvas A, B y C difieren entre sí solamente en que tiene un pico más grande que la otra. Tiene la misma posición central y la misma dispersión, y ambas son simétricas. Los estadísticos dicen que tiene un grado distinto de KURTOSIS. Nota: Si K = (-), entonces la curva es PLATICURTICA Si K = 0 entonces la curva es MESOCURTICA Si K = (+), entonces la curva es LEPTOCURTICA El coeficiente de KURTOSIS, más simple, lo denominaremos K, y se determina a través de: K RSI P P 90 10 0.263 EJEMPLO Determine la asimetría y la kurtosis correspondientes a las ventas de aceite de maíz de INDUSTRIAS FINO: AS _ 3( x - Me) s 3(8.70 7.50) 0.83 4.34 = Como este coeficiente es positivo, la distribución está sesgada a la derecha Para determinar la kurtosis debemos calcular Q1, Q3, P10 y P90 Fi f fa 1.5 4.5 7.5 10.5 13.5 16.5 5 10 4 7 2 2 5 15 19 26 28 30 1.n fa 4 Q Fi 1 f C 4.5 7.5 5 3 5.25 10 3.n fa 22.5 19 4 Q Fi C 10.5 3 12 3 7 f CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 57 10.n F i -1 30 P Fi 100 C 1.5 3 3.3 10 5 fi RSI 90.n P 90 Fi 100 F i -1 C 13,5 fi 27 - 26 3 15 2 Q3 Q1 12 5.25 3.78 2 2 K RSI P P 90 10 0.263 3.78 0,263 0,060 la distribución es Leptocurti ca. 15 3.3 PRÁCTICO No 6 Resuelve los siguientes problemas ABP de medidas de forma 1. Un encargado de compras ha obtenido muestras de lámparas incandescentes de 2 proveedores. Envía estas muestras a un laboratorio donde se realizan pruebas respecto a la vida útil, con los siguientes resultados: Duración de la vida útil (En horas) 700 - 899 900-1099 1100-1299 1300-1499 Muestras de: Proveedor Proveedor A B 10 3 16 42 26 12 8 3 A. Indique el coeficiente de asimetría para cada proveedor. B. Indique el coeficiente de Kurtosis para cada proveedor. 2. Los siguientes datos representan el consumo diario de combustible, en barriles, de una empresa de servicios petroleros que trabaja para EBR: 15 12 30 41 20 24 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 22 15 31 40 12 22 16 20 32 35 15 28 18 25 40 36 32 21 16 15 19 29 34 22 58 A. Elabore un Box Plot. B. Determine el coeficiente de asimetría. C. Determine la kurtosis. D. Verifique si se cumple el teorema de TCHEBYSHEV PARA x 2s 3. De la siguiente tabla, calcular la asimetría y kurtosis por los métodos conocidos y realizar gráfico. PESO (Kg) fi 44 – 53 2 54 – 63 3 64 – 73 4 74 – 83 4 84 – 93 6 94 - 103 14 4. La puntuación que han obtenido 50 personas que se presentaron para ocupar un puesto en la plantilla de una empresa, ha sido la siguiente: Puntuación Nº personas 14-17 3 18-19 6 22-25 11 26-29 15 30-33 8 34-37 7 A. Puntuación media y puntuación más frecuente B. Coeficiente de asimetría de Pearson y significado C. ¿Qué tipo de Kurtosis presenta la distribución? 5. Se hizo una encuesta a un grupo de estudiantes sobre sus edades. Obteniendo los siguientes resultados. Calcular Asimetria y Kurtosis EDADES 26 – 37 38 – 49 50 – 61 62 – 73 74 – 85 86 - 97 fi 3 4 5 5 3 2 6.Las duraciones de estancia en el piso de cancerología de un hospital se organizaron en una distribución de frecuencias. La duración media fue de 28 días, la mediana 25 días, y la duración modal 23 días. Se calculó una desviación estándar de 4,2 días. a) Es la distribución simétrica o asimétrica con sesgo positivo o sesgo negativo? b) Cuál es el coeficiente de asimetría? Interprételo. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 59 7. Una muestra de operadores de captura de datos muy experimentados reveló que su velocidad media al teclear es de 87 palabras por minuto, con una mediana de 73. La desviación estándar es 16,9 palabras por minuto. ¿Cuál es el coeficiente de asimetría? Interprételo. 8.Una muestra de casa que se ofrecen en la zona del Urubó en venta por una inmobiliaria, reveló que el precio medio solicitado es $us 75.900. la mediana $us70.100, y la moda $us 67.200. La desviación estándar de la distribución es $us 5900,-. a) La distribución de precios es simétrica o asimétrica con sesgo negativo o sesgo positivo? b) Cual es el coeficiente de asimetría? Interprételo. Aplicación de lo aprendido En el trabajo de investigación aplicar todas las medidas estadísticas aprendidas en la unidad, utilizando un software e interpretar los resultados obtenidos. Exponer y presentar en el proyecto final de la materia. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 60 Unidad 5 REGRESIÓN Y CORRELACIÓN LINEAL Objetivo de aprendizaje: Que el estudiante Identifique los diferentes métodos de ajuste, Aplique el método de mínimos cuadrado, así también sea capaza de determinar pronósticos en base a datos históricos e Interpretar el grado de correlación entre dos variables y de analizar los resultados mediante el coeficiente de correlación y sus aplicaciones A. B. C. D. Preguntas ¿Cuáles son los diferentes métodos de ajuste? ¿Cómo se determinan los pronósticos en base a datos históricos? ¿Cómo se Interpreta el grado de correlación entre dos variables? ¿Dónde se puede aplicar la ecuación de regresión lineal? Fundamente su investigación con Bibliografía de la Biblioteca AJUSTE DE CURVAS (REGRESION) En la práctica encontramos a menudo que existen relaciones entre dos o más variables, por ejemplo, el precio de un automóvil depende del ingreso familiar, la demanda de helados está en función a la temperatura ambiente, etc. Suele ser deseable expresar tales relaciones en forma matemática determinando una ecuación que conecte las variables, este proceso de encontrar la ecuación se conoce con el nombre de regresión. METODO DE MINIMOS CUADRADOS Este es un método que minimiza los errores de aproximación a una curva dada, este método proporciona diversas ecuaciones de aproximación como ser: AJUSTE Lineal Exponencial Logarítmico Potencial ECUACIÓN Y A BX Y Ae BX Y Ln( A) B ln( X ) Nota El análisis de regresión puede usarse para construir un modelo que permita predecir y determinar la relación entre variables. Y AX B CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 61 Nosotros nos ocuparemos del ajuste lineal, lo que trata es de hallar los coeficientes de la siguiente ecuación de la línea recta: Para ello ocuparemos las siguientes ecuaciones, llamadas ecuaciones normales: Y X X XY A N X ( X ) 2 2 2 B N XY X Y N X 2 ( X ) 2 Las cuales salen de resolver el siguiente sistema de ecuaciones: Y AN B X XY A X B X 2 5.1. CORRELACION La correlación trata del grado o fuerza de interconexión (asociación) entre las variables, tratando de explicar con qué precisión se describe o se explica la relación entre variables en una ecuación o dicho de otra madera que tan precisa es la ecuación de regresión que estamos usando. Cuando están en juego sólo 2 variables estamos hablando de correlación simple. Hay dos coeficientes que nos interesan: Coeficiente de correlación Coeficiente de determinación r r2 (-1 ≤ r ≤ 1) ( 0 ≤ r2 ≤ 1) El Coeficiente de regresión lineal (coeficiente de Pearson) es una cantidad que permite determinar el grado de correlación entre dos variables, matemáticamente: Nota El coeficiente r2 es el coeficiente que se interpreta, como: Se dice que si: 0 ≤ r2 ≤ 0.4 0.4 < r2 ≤ 0.8 0.8 < r2 ≤ 1.0 no existe correlación la correlación es débil la correlación es fuerte “El % de la variación total de la variable dependiente que se explica debido a la variación de la variable independiente.” ERROR ESTANDAR DE ESTIMACION El error estándar de estimación determina el error promedio que se comete al realizar un pronóstico de Y a partir de X. Esta medida es también útil para cuál de varias curvas de estimación tiene mejor ajuste. Nota Esta fórmula sólo es para regresión lineal. USO DE LA REGRESION Y ANALISIS DE CORRELACION Lea detenidamente las páginas 695 y 696 del libro: “ESTADISTICA PARA ADMINISTRADORES” DE LEVIN & RUBIN CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 62 MESES JUL AGO SEP OCT NOV DIC ENE FEB MAR ABR MAY JUN JUL PROBLEMA ABP RESUELTO No1 CASA GRANDE – SANTA CRUZ, distribuidor exclusivo de camisas Polo de Ralph Lauren, analizó las ventas de su tienda central. Quiere determinar el crecimiento o no de las ventas de los últimos 13 meses. Se presenta la siguiente tabla: VENTAS (docenas) 12 18 18 20 24 22 28 28 31 31 32 35 34 A. Encuentre el diagrama de dispersión B. En el supuesto de una relación lineal utilice el método de los mínimos cuadrados para calcular los coeficientes de regresión A y B. C. Interprete el significado de la pendiente B, este problema. D. Prediga las ventas para enero de 2004. SOLUCION A. El diagrama se dibuja abajo. Rellenamos la tabla que se muestra en el lado izquierdo X 1 2 3 4 5 6 7 8 9 10 11 12 13 91 Y 12 18 18 20 24 22 28 28 31 31 32 35 34 333 X2 1 4 9 16 25 36 49 64 81 100 121 144 169 819 Y2 144 324 324 400 576 484 784 784 961 961 1024 1225 1156 9147 DIAGRAMA DE DISPERSION VENTAS (DOCENAS) 40 XY 12 36 54 80 120 132 196 224 279 310 352 420 442 2657 36 32 28 24 20 16 12 Y = 13,077 + 1,791X 8 4 R2 = 0,946 TIEMPO (MESES) 0 0 1 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 2 3 4 5 6 7 8 9 10 11 12 13 14 15 63 B. Utilizando las fórmulas determinamos los coeficientes: Y X X XY A N X ( X ) 2 2 B 2 A = 13.077 Entonces: Y = A + BX N XY X Y N X 2 ( X ) 2 B=1.791 Y = 13.077 + 1.791X C. Interpretación de B =1.791 por cada mes que aumente el tiempo, la demanda aumentará en 1,791 2 docenas. D. En enero de 2004, X = 13 + 6 = 19 Y = 13.077 + 1.791(19) ≈ 47 docenas PROBLEMA ABP RESUELTO No2 El gerente de personal de la empresa del BANCO UNION S.A. considera que puede haber una relación entre el ausentismo y la edad, y querría usar la edad de un empleado para predecir el número de días de ausencia durante un año calendario. Se selecciona una muestra aleatoria de 10 empleados, con los resultados en la siguiente tabla: Edad (años) Días de ausencia 27 61 37 23 46 58 29 36 64 40 15 6 10 18 9 7 14 11 5 8 A. Encuentre el diagrama de dispersión B. En el supuesto de una relación lineal utilice el método de los mínimos cuadrados para calcular los coeficientes de regresión A y B. C. ¿Cuántos días predecirá usted que va a estar ausente un empleado de 40 años de edad? D. Determine e interprete el coeficiente de determinación. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 64 SOLUCION A. Diagrama de dispersión AUSENCIA (DIAS) 20 18 16 14 12 10 8 6 Y =21,587 - 0,268X 4 R2 = 0,869 2 EDAD (AÑOS) 0 15 20 25 30 35 40 45 50 55 60 65 70 B. Ecuación de regresión Y X X XY N X ( X ) 2 A 2 B 2 A = 21.587 Entonces: Y = A + BX N XY X Y N X 2 ( X ) 2 B = -0.268 Y = 21.587 – 0.268X C. PRONOSTICO Y =? X = 40 años Y = 21.587 – 0.268(40) ≈ 11 días D. COEFICIENTE DE DETERMINACION R N XY X Y 2 2 2 2 (N X X )(N Y Y ) = 0.932 R2 = ( 0.932)2 = 0,869 87% de la variación total de la ausencia de los empleados se debe a la variación de la edad de los mismos. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 65 PRÁCTICO No 7 Resuelve los siguientes problemas ABP 1. El gerente de una cadena de heladerías SAVORY quiere estudiar el efecto de la temperatura ambiente sobre las ventas de la temporada de calor. Se selecciona una muestra aleatoria de 10 dias y los resultados se dan en la siguiente tabla: Temperatura 17 21 23 24 27 28 29 31 32 33 (0C) Ventas por heladería (en cientos de 15 17 18 20 24 22 27 29 31 31 dólares) A. B. C. D. E. Encuentre un diagrama de dispersión En el supuesto de una relación lineal, encontrar los coeficientes de la regresión A y B. Interprete el significado de la pendiente B en este problema. Prediga las ventas por heladería, por día, cuando la temperatura es de 36 °C. Calcule el coeficiente de determinación r2 e interprete su significado en este problema 2. Una economista que trabaja en el rubro de automóviles desea medir la relación del precio de compra de los automóviles nuevos en función al ingreso familiar. Se selecciona una muestra aleatoria de 9 personas que compraron autos nuevos con los resultados de la siguiente tabla: Ingreso Familiar 10. 14. 16. 20. 24. 11. 32. (miles de 9.4 2 4 3 0 3 6 8 dólares) Precio de compra 3.6 4.1 3.9 5.2 5.1 3.9 7.8 3.4 (miles de dólares) 26. 7 9.1 A. Encuentre la curva de ajuste lineal. B. Calcule el coeficiente de correlación r entre el ingreso familiar y el precio de compra. C. ¿Hay relación lineal entre las variables?. Demuestre su respuesta. 3. Una organización de estudio de consumidores desea determinar la relación entre el precio de una pila para radio de transmisores en función al número de horas de duración de la pila. Se compró una muestra de 11 pilas con los resultados dados en la siguiente tabla: Precio (dólares) Duración (horas) 24 32 49 49 39 69 69 89 5.4 4.8 6.3 7.2 6.3 7.4 6.8 10.2 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 119 79 35 13.1 9.2 6.0 66 A. Encuentre la curva de ajuste lineal. B. Calcule el coeficiente de correlación r. C. ¿Hay relación lineal entre las variables?. Demuestre su respuesta. 4. En un estudio técnico económico se dispone de la siguiente información histórica de ventas de BATERIAS TOYO, en miles de unidades, de fabricación Boliviana: TOYO AÑO VENTAS 2008 12 2009 14 2010 15 2011 13 2012 16 2013 19 2014 18 2015 20 2016 22 Se desea efectuar la proyección de las ventas para los próximos tres años. 5. Una economista que trabaja en el rubro de automóviles desea medir la relación del precio de compra de los automóviles nuevos en función al ingreso familiar. Se selecciona una muestra aleatoria de 9 personas que compraron autos nuevos con los resultados de la siguiente tabla: Ingreso familiar (miles de dólares) 10.2 14.4 16.3 20.0 24.3 11.6 32.8 9.4 26.7 Precio de compra (miles de dólares) 3.6 4.1 3.9 5.2 5.1 3.9 7.8 3.4 9.1 6, Realizar la proyección de la oferta de Leche (Lt.), para los próximos 5 años de acuerdo a los siguientes datos. Datos Históricos de la oferta de Leche “Pil “ (en miles) Año 2010 2011 2012 2013 2014 2015 Oferta (Lts.) 150 180 220 235 255 265 7.Encuentre la proyección de abastecimiento de frutilla de los valles cruceños para los próximos cinco años a partir de la siguiente información. Año Producción de Frutilla (kilos) 2011 875 2012 905 2013 947 2014 972 2015 1007 8. Se sabe que la producción de naranja en la zona norte del departamento de Santa cruz, en los últimos dos años fue de: Año Producción de Naranja (kilos) 2014 975 2015 1005 Determinar la proyección para los siguientes 5 años siguientes CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 67 2017 24 9. Una organización de estudio de consumidores desea determinar la relación entre el precio de una pila para radio de transmisores en función al número de horas de duración de la pila. Se compró una muestra de 11 pilas con los resultados dados en la siguiente tabla: Precio (dólar) 24 32 49 39 69 69 89 119 79 35 Duración (horas)5.4 4.8 6.3 7.2 6.3 7.4 6.8 13.1 9.2 6.0 a) Encuentre la curva de ajuste lineal b) Calcule el coeficiente de correlación r. c) Cuando la vida útil es de 4 horas; 7 horas; 10 horas cuanto será su precio. Aplicación de lo aprendido En una empresa del medio identifica un problema para resolver aplicando el método aprendido en la unidad, utilizando un software, encuentra la solución óptima e interpreta los resultados obtenidos. Exponer y presentar en el proyecto final de la materia. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 68 UNIDAD 6 Índices Objetivo del aprendizaje: Identificar e interpretar los índices y su utilización Preguntas 1.- ¿Qué se entiende por Índice? 2.- ¿Que se entiende por número índice? 3.- ¿Quién y cuándo utilizó por primera vez el cálculo de los índices? 4.- ¿Cual es el índice más utilizado actualmente? 5.- Indique si las siguientes afirmaciones son falsas o verdaderas: a) Poder de compra, poder adquisitivo, e ingreso real son conceptos equivalentes. b) La relación de intercambio es desfavorable para los países en vías de desarrollo por que los precios de sus importaciones son mayores que los precios de sus exportaciones. c)Si los índices de precios de Laspeyres y Paasche coinciden en valor numérico, para cierto período, quiere decir que la estructura de ponderaciones es exactamente igual a la del período base. d) Los índices de precios de Laspeyres no pueden tomar valores negativos. e) El índice de valor debe ser siempre mayor que el índice de precios. f) En un período caracterizado por una completa estabilidad de precios, los índices de Laspeyres y Paasche para precios coinciden necesariamente en valor numérico. g) El índice de precios de Laspeyres es el que más se presta para el cálculo de variaciones en el costo de vida, principalmente por que toma como ponderaciones las cantidades de un período base considerado como normal. h) Los índices de base variable, tienen la desventaja de que no puede establecerse comparaciones entre ellos. i) Si un obrero en 2017 tiene un sueldo superior en 30% al de 2016 y por otra parte, el índice de precios al consumidor para 2016 es de 70, quiere decir que la situación del obrero en cuanto a poder de compra no ha variado. j) En épocas de inflación un índice de cantidad constituye una mejor medida de la producción real que un índice correspondiente de valor. 6.- ¿Cuáles son los índices de precio más conocidos? 7.- ¿Qué se entiende por período base? 8.- ¿Cuáles son los rasgos más importantes en la construcción de un número índice? 9.- ¿Cuál es la subdivisión de los números índice según su composición? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 69 10.- ¿Cómo se obtiene un índice simple? 11.- ¿Cómo se obtiene un índice variable? 12.- ¿Cuáles son los índices ponderados de precios? 13.- ¿Cómo se interpreta el índice de precios de Laspeyres? 14.- ¿Que se determina el índice de precios de Paasche? 15.- ¿Cómo se obtiene el Índice de Fisher? 16.- ¿Cómo se obtiene el índice de Keynes? 17.- ¿Cuál es la ponderación de un índice de cantidad? 18.- ¿Cuáles son las aplicaciones principales de los números índice? 19.- ¿Cuál es la diferencia entre salario nominal y real? 20.- ¿Cómo se obtiene la tasa de cambio o tipo de cambio? 21.- ¿Qué es deflactar y como se realiza? Practico No 8 1.- Tomando en cuenta el siguiente cuadro se pide calcular: índice de precios der Laspeyres, Índice de Precios de Paasche y el índice de Valor e indique en un cuadro adicional las diferencias entre uno y otro índice: Año 0 Año 1 Año 2 Artículos P Q P Q P Q A 10 4 12 5 20 3 B 4 3 4 3 5 3 C 8 10 8 12 7 15 D 20 2 30 2 40 3 2.- Para los artículos A, B, C y D se tiene los siguientes precios y cantidades en los años que se indican: Artículos A B C D Años p q p q p q p q 2012 10 12 4 15 1 10 30 10 2013 12 12 4 15 1 15 30 15 2014 15 20 5 10 2 20 50 20 2016 20 20 5 10 2 30 50 20 2017 30 30 6 15 2 50 60 20 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 70 Calcule para todo el período: a) Un índice de precios de Laspeyres con base en 2012 b) Un índice de cantidad de Paasche con base 2012 c) Un índice de Valor 3.- El índice de base variable de los precios de los productos agropecuarios muestra el siguiente comportamiento: Años Índice 2010 ……….. 2011 104 2012 102 2013 108 2014 120 2015 150 2016 130 Calcule el índice tomando 2013 como base fija 4.- Con los siguientes datos sobre producción de cemento (miles de toneladas métricas). 2016 Meses Producción cemento (miles de Ton. Métricas) Enero 185 Febrero 178 Marzo 220 Abril 179 Mayo 199 Junio 175 Julio 216 Agosto 207 Septiembre 199 Octubre 208 Noviembre 218 Diciembre 213 a) Calcular los índices simples tomando como base el mes de enero. b) Calcular los índices simples, tomando como base el mes de mayo. c) Calcular los índices simples con base variable. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 71 5.- Con la siguiente información, se pide calcular los índices para 2016 con base en 20113, aplicando las fórmulas: 2013 2016 ARTICULO UNIDAD Precio ($) Cantidad Precio($) Cantidad A Kgrs 2.600 10 3.800 8 B Kgrs 6.000 5 10.000 7 C Lts 1.000 2 4.000 5 D Doc. 6.000 1 15.000 2 E Kgrs. 3.000 2 2.000 1 a) Laspeyres, Paasche y Fisher para el índice de predcios. b) Keynes Marshall, Sidgwick y Walsh para cantidades c) Laspeyres y Paasche de cantidad 6.- El índice nacional de costos de la construcción de vivienda para el período 2011-2016 es el siguiente: Años 2011 2012 2013 2014 2015 2016 Índice 2011=100 161,52 205,68 235,34 283,15 371,28 495,82 Si el valor promedio de una vivienda de 2 pisos con tres dormitorios, sala comedor, cocina, y patio de ropas es de $us113.000.000 para 2011, de acuerdo al incremento del índice, ¿Cuál será el valor en 2016? Investigación 1.- Investigue en que consiste el I.P.C. (Índice de Precios al Consumidor) y de cuantos artículos (bienes y servicios) está compuesto en Bolivia. 2.- En que consiste la Indexación y que otras denominaciones recibe? 3.- En que consiste el Índice de Productividad? 4.- En que consiste el Índice Bursátil mundial del Dow Jones? 5.- En que consiste la Tasa de Desempleo? ¿Cuáles son los principales indicadores de desempleo? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 72 Unidad 6 ELEMENTOS DE PROBABILIDAD Objetivos de aprendizaje: Que el estudiante analice la información estadística utilizando la teoría de probabilidades e interprete las definiciones básicas de los elementos de probabilidad. Además, Identifique el tipo de evento definido en el mismo espacio muestral y sea capaza de reconocer la importancia de la aplicación del Teorema de Bayes y desarrollar habilidades para resolver problemas de probabilidades. a) b) c) d) e) f) g) h) Investigación: Orígenes de la Estadística Inferencial Aplicaciones de la estadística Inferencial En un ejemplo real explique la aplicación de la Estadística Inferencial ¿A que se denomina inferencia estadística? ¿A que se denomina inducción estadística? Que es probabilidad Definición de Evento; Espacio muestral; Experimento. ¿Cuáles son las leyes de la Probabilidad? i) ¿Entre que valores numéricos fluctúa la probabilidad? j) Indique tres ejemplos cuando la probabilidad es igual a 0 y tres ejemplos cundo la probabilidad es igual a 1. k) ¿Cuál es la expresión analítica en la que se expresa la probabilidad? l) ¿A que es igual la probabilidad de que ocurra un evento y que no ocurra? m) ¿Cuáles son los dos enfoques de la probabilidad? n) ¿Cuál es la subdivisión de la probabilidad objetiva? o) ¿En qué consiste la probabilidad subjetiva? De 4 ejemplos de esta probabilidad. p) ¿Cuál es la fórmula del enfoque clásico de la probabilidad? q) ¿Cuál es la fórmula del enfoque relativo de la probabilidad? r) ¿Cuáles son las dos clases de reglas de la probabilidad? s) ¿Cuáles son las reglas de adición? t) ¿Cuáles son las reglas de multiplicación? u) ¿Quién y en qué año planteó el Teorema de Bayes? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 73 v) ¿Cuáles son las principales aplicaciones del Teorema de Bayes? w) ¿Cuáles la fórmula del Teorema de Bayes? x) ¿Con que regla de probabilidad esta ´vinculado el teorema de Bayes? Fundamenta tus respuestas con bibliografía de biblioteca DEFINICIÓN DE PROBABILIDAD En general la probabilidad es la posibilidad de que algo pase. Las probabilidades se pueden expresar de tres maneras como: Fracciones ¾, ½, ¼, … Decimales 0.75, 0.50, 0.25, … Porcentajes 75%, 50%, 25%, … Las probabilidades están siempre entre cero y uno. Tener una probabilidad de cero significa que algo nunca va suceder; una probabilidad de uno indica que algo va suceder siempre. CONCEPTOPS BÁSICOS DEFINICIÓN DE EVENTO En teoría de la probabilidad, un evento es uno o más de los posibles resultados de hacer un experimento. En otras palabras, un evento es todo lo que puede suceder. DEFINICIÓN DE EXPERIMENTO ( Ex ) Un experimento es aquella actividad que origina un evento. DEFINICIÓN DE ESPACIO MUESTRAL ( S ) Es el conjunto de todos los posibles resultados o eventos de un experimento. EVENTOS MUTUAMENTE EXCLUYENTES ( ME ) Se dice que dos eventos son mutuamente excluyentes, si uno y solo uno de ellos puede tener lugar en un mismo tiempo. EVENTOS NO MUTUAMENTE EXCLUYENTES ( NME ) Se dice que dos eventos no son mutuamente excluyentes si pueden ocurrir juntos o la vez. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 74 Ejemplo Si se lanza un dado una vez. Determinar el espacio muestral. Ex = “Lanzar un dado una vez” ( Experimento ). S = { 1, 2, 3, 4, 5, 6 } ( Espacio Muestral ). Si se tienen los siguientes pares de eventos indicar si son Mutuamente excluyentes o no. A = Que el resultado al lanzar el dado sea un 3. B = Que salga un número par. C = Que salga un número impar. D = Que salga un número mayor a 5. A y B ……………….. A y C ……………….. A y D ……………….. B y C ……………… B y D …………… .. C y D ……………… CLASIFICACION DE LA PROBABILIDAD DE ACUERDO A SU ORIGEN Existen tres maneras básicas de clasificar la probabilidad: PROBABILIDAD DE TIPO CLASICA Matemáticamente: Probabilidad de un evento una parte total PROBABILIDAD DE TIPO DE FRECUENCIA RELATIVA Cuando las probabilidades se hallan a través de la observación de un evento durante un gran número de veces, esto origina normalmente los cuadros de distribución de frecuencias. Este método se basa en observaciones pasadas. PROBABILIDAD DE TIPO SUBJETIVA Es aquella que está basada en opiniones o creencias de las personas. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 75 REGLAS DE PROBABILIDAD EVENTOS MUTUAMENTE EXCLUYENTES O INDEPENDIENTES Se dice que dos eventos A y B son mutuamente excluyentes si uno y sólo uno de ellos puede suceder a la vez. Matemáticamente, la probabilidad que al menos uno de ellos suceda se calcula con: P( AoB) P( A ) P( B) EVENTOS NO MUTUAMENTE EXCLUYENTES O DEPENDIENTES Se dice que dos eventos A y B son mutuamente excluyentes si ambos pueden suceder a la vez. Matemáticamente, la probabilidad que al menos uno de ellos suceda se calcula con: P(AoB) P(A) P(B) P(AB) DESCRIPCION DE LOS TIPOS DE PROBABILIDAD PROBABILIDAD SIMPLE Es la posibilidad de que ocurra un solo evento, se simboliza por una sola letra mayúscula. Ejemplo: P(A) PROBABILIDAD CONJUNTA Es la posibilidad de que ocurran dos eventos al mismo tiempo, se simboliza por dos letras que corresponden a los eventos. Ejemplo: P ( A B ) PROBABILIDAD CONDICIONAL Es la posibilidad de que ocurra un evento sabiendo que otro evento ya ocurrió. Se simboliza por dos letras que corresponden a los eventos A que es el que queremos calcular en este caso y B el evento que ya ocurrió. Ejemplo: P(A / B) EVENTOS DEPENDIENTES Se dice que dos eventos A y B son dependientes cuando el resultado de uno de ellos afecta el posterior resultado de otro experimento. Probabilidad Condicional P(A/B) P(AB) P(B) Probabilidad Conjunta P(AB) P(B).P(A / B) Probabilidad marginal P( A) P( AB) P( AC ) P( AD) ........ CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 76 EVENTOS INDEPENDIENTES Se dice que dos eventos A y B son independientes cuando el resultado de uno de ellos no afecta el posterior resultado de otro experimento. Probabilidad Marginal P(A) = P(A) Probabilidad Conjunta P ( A B ) P ( A) P ( B ) Probabilidad Condicional P(A / B) = P(A) TEOREMA DE BAYES La formula básica de la probabilidad condicional se conoce como TEOREMA DE BAYES: P(AB) P( A ) B P(B) El Teorema de Bayes ofrece un método estadístico para evaluar nueva información y revisar nuestras anteriores estimaciones. Se puede generalizar la fórmula anterior cuando se presentan varias condicionales. La fórmula general es: P(R ).P(A) A P(A ) R R P( ).P(A) P(R ).P(B) . . . . . A B EJEMPLO De darse la capitalización de las empresas papeleras el próximo año, la probabilidad de que el papel de imprenta aumente de precio es de 90%. Pero si la capitalización no se realiza, la probabilidad de un aumento es de 40%. En general, estimamos que hay una posibilidad de 60% de que la se realice la capitalización el próximo año. a) Elabore un árbol de probabilidades de esta situación que implica eventos independientes, empleando C y C´ Para la capitalización y no capitalización y A y A´ para el aumento y no aumento en el precio del papel. b) Supongamos que, en efecto, el precio del papel aumenta en el curso del año próximo. ¿Cuál es la probabilidad de que se realice la capitalización de las papeleras? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 77 Respuestas: a) 0.90 0.60 C A 0.10 A´ 0.40 A 0.40 C´ 0.60 A´ b) El teorema de Bayes se expresa así: P(C/A) = P( A / C ) P(C ) 0.90 * 0.60 P( A / C ) P(C ) P( A / C´)P(C´) 0.90 * 0.60 0.40 * 0.40 Entonces la respuesta es: 0.77 ó 77% PROBABILIDADES Ejemplo: Según el enfoque de probabilidad clásica cuál es la probabilidad de que usted gane un sorteo que tiene 100 números y compró 3 cupones. 3 𝑃(𝑔𝑎𝑛𝑒 𝑒𝑙 𝑠𝑜𝑟𝑡𝑒𝑜) = 100 = 0,03 = 3% Usted tiene un 3% de probabilidades de ganar el sorteo. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 78 Calculo de la probabilidad de la Adición para eventos independientes Ejemplo: Se tiene una baraja de cartas (52 cartas sin jokers), ¿Cuál es la probabilidad de sacar una Reina ó un As? Sea A = sacar una reina y sea B = sacar un as, entonces: P(A ∪ B) = P(A) + P(B) P(A) = 4 52 ; P(A ∪ B) = P(B) = 4 52 4 4 8 + = 52 52 52 Calculo de la probabilidad de la Adición para eventos dependientes Ejemplo: Se lanzan un dado. Usted gana $ 3000 pesos si el resultado es par ó divisible por tres ¿Cuál es la probabilidad de ganar? Lo que primero hacemos es definir los sucesos: Sea A = resultado par: A = {2, 4, 6} Sea B = resultado divisible por 3: B = {3, 6} . Ambos sucesos tienen intersección? (A ∩ B) = {3} P(A ∪ B) = P(A) + P(B) − P(A ∩ B) 3 2 1 4 P(A ∪ B) = + − = 6 6 6 6 Cálculo de una probabilidad Condicional. Se tiene un grupo de 10 estudiantes, 4 son hombres y 6 damas, de los 4 hombres 1 estudia economía y de las mujeres 3. Si se toma una persona al azar y es economista. a) ¿Cuál es la probabilidad que sea mujer? P (A/B) = 𝑃 (𝐴∩𝐵) 𝑃 (𝐵) En nuestro caso sería: P (mujer/economista) = 𝑃 (𝑚𝑢𝑗𝑒𝑟∩𝑒𝑐𝑜𝑛𝑜𝑚𝑖𝑠𝑡𝑎) 𝑃 (𝑒𝑐𝑜𝑛𝑜𝑚𝑖𝑠𝑡𝑎) 3 = 4 = 0,75 ---- 75% CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 79 Calculo de la probabilidad de la Multiplicación para eventos independientes Ejemplo: La cafetería de la Universidad tiene un 20% de probabilidad de vender pizza y un 30% de probabilidad de vender refresco de piña. ¿Cuál es la probabilidad que un cliente venga y pida un pollo y un refresco de piña? Como notamos no tienen relación el pollo y la piña, bien la persona puede pedir una hamburguesa y una soda. Este ejercicio se resuelve muy fácil. El Evento A es la compra de la Pizza. El Evento B es la compra del Refresco de Piña. La probabilidad de dos eventos independientes: P (A ∩ B) = P(A) * P(B) P(A ∩ B) = (0,2 x 0,3) = 0,06 ------ 6% Se tiene un 6% de probabilidad que la persona compre una pizza y un refresco de piña. Calculo de la probabilidad de la Multiplicación para eventos dependientes Ejemplo: El gerente de crédito de la Cooperativa Jesús Nazareno recolecta datos de 100 de sus clientes. De los 60 hombres, 40 tienen tarjetas. De las 40 mujeres, 30 tienen tarjetas. Diez de los hombres tiene saldos vencidos, mi entras que 15 de las mujeres tienen saldos vencidos. El gerente quiere determinar la probabilidad que un cliente seleccionado al azar sea. a) Una mujer con tarjeta. La probabilidad de dos eventos dependientes: P (A ∩ B) = P(A) x P (B/A) En nuestro caso: P (Mujer ∩ Tarjeta) = P (Mujer) x P (Tarjeta dado que es mujer) P (Tarjeta dado que es mujer) = (𝑇𝑎𝑟𝑔𝑒𝑡𝑎 ∩ 𝑀𝑢𝑗𝑒𝑟) 𝑃(𝑀𝑢𝑗𝑒𝑟) = 30 40 = 0,75 P (Mujer ∩ Tarjeta) = 0,4 x 0,75 = 0,3------30% Tenemos un 30% de probabilidades de seleccionar una persona al azar y sea una mujer con tarjeta. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 80 Una mujer con saldo. P (Mujer ∩ Saldo) = P (Mujer) x P (Saldo dado que es mujer) P (Saldo dado que es mujer) = (𝑆𝑎𝑙𝑑𝑜 ∩ 𝑀𝑢𝑗𝑒𝑟) 𝑃(𝑀𝑢𝑗𝑒𝑟) = 15 40 = 0,375 P (Mujer ∩ Saldo) = 0,4 x 0,375 = 0,15------15% Tenemos un 15% de probabilidades de seleccionar un encuestado al azar y sea una Mujer con saldo. Ejemplo 2: Usted es gerente comercial de la nueva soda “Guaraná Conti” teniendo en cuenta que el producto no ha entrado al mercado local usted realizó una degustación masiva en ciertos sectores estratégicos de la Ciudad preguntando ¿Qué le parecía el sabor de esta nueva soda? Los resultados se muestran en la siguiente tabla de contingencia. Sector Centro Urubó Urbarí Equipetrol Plan 3000 Polanco Banzer Regular 20 30 25 0 15 15 30 Buena 40 60 80 20 20 30 45 Excelente 100 120 80 50 40 100 80 Total 160 210 185 70 75 145 155 Total 135 295 570 1000 Si se selecciona un encuestado al azar ¿Cuál es la probabilidad? a) ¿Qué opine que el sabor es Excelente? 570 P(J) = 1000 = 0,57→ 57% El 57% opinan que el sabor es excelente b) ¿Qué sea de Equipetrol? 70 P(D) = 1000 = 0,07→ 7% El 7% de los degustadores son de equipetrol c) ¿Qué sea de Urbarí y crea que el sabor de la soda es bueno? 80 𝑃(𝐶 ∩ 𝐼) = 1000 = 0,08→8% El 8% de los degustadores son de Urbari y creen que el sabor de la soda es bueno. d) ¿Qué sea de la Banzer y piense que el sabor es Regular? 30 𝑃(𝐺 ∩ 𝐻) = 1000 = 0,03→ 3% CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 81 El 3% de los degustadores son de la Banzer y piensan que el sabor es regular. e) ¿Qué sea del centro ó del Plan 3000? 160 75 235 P(A ∪ E) = P(A) + P(E) = 1000 + 1000 = 1000 = 0,235→23,5% El 23,5% de los degustadores son del centro o del plan 3000. f) ¿Qué sea de Polanco ó del Urubó? 145 210 355 P(F ∪ B) = P(F) + P(B) = 1000 + 1000 = 1000 = 0,355→35,5% El 35,5% de los degustadores son de polanco o del urubo. g) ¿Qué sea de la Banzer ó tenga una opinión Buena del Sabor? P(G ∪ I) = P(G) + P(F) − P(G ∩ I) P(G ∪ I) = 155 295 45 + − 1000 1000 1000 = 405 1000 = 0,4050→40,5% El 40,5% de los degustadores son de la Banzer y piensan que el sabor es bueno. h) ¿Qué tenga una opinión excelente ó sea de Equipetrol? 𝑃(𝐽 ∪ 𝐷) = 𝑃(𝐽) + 𝑃(𝐷) − 𝑃(𝐽 ∩ 𝐷) 𝑃(𝐽 ∪ 𝐷) = 570 70 50 + − 1000 1000 1000 = 590 1000 = 0,59→ 59% El 59% de los degustadores tienen una opinión excelente o son de Equipetrol. i) ¿Qué sea del centro dado que dice que el sabor es Regular? 𝐴 𝑃 (𝐻) = 𝑃(𝐴∩𝐻) 𝑃(𝐻) 20 = 135 = 0,1481→14,84% El 14,81% son del centro dado que dicen que el sabor es regular. j) ¿Qué diga que el sabor es regular dado que es del Centro de la Ciudad? H P (A) = P(H∩A) P(A) 20 = 160 = 0,125→12,5% El 12,5% de los degustadores dicen que el sabor es regular dado que son del centro de la ciudad. Teorema de Bayes: Ejemplo: La planta de cerveza Real está en Warnes, cuenta con 5 máquinas para producirla, la primera produce 1000 latas por hora y solo 50 salen con desperfectos, la segunda produce 1500 latas solo el 2% salen en muy mal estado, la tercera produce el doble que la primera y 200 salen en condiciones no muy buenas, mientras que la cuarta produce lo mismo que la segunda y el mismo porcentaje defectuoso que la primera. La quinta es una maquina nueva y de tecnología de punta, esta produce 1000 latas por hora y todas salen en buen estado. La primera trabaja 5 horas al día, la segunda 3, la tercera 10, y la cuarta y la quinta 8. Ayer llego un cliente protestando porque tomo una lata con desperfectos. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 82 Maquina 1 Maquina 2 Maquina 3 Maquina 4 Maquina 5 Producción √ x Hrs.*día 1000 1500 2000 1500 1000 0,95 0,98 0,90 0,95 1 0,05 0,02 0,10 0,05 0 5 3 10 8 8 Producción Total 5000 4500 20000 12000 8000 Ʃ49500 Proporción 0,1010 0,0909 0,4040 0,2424 0,1616 Ʃ1 Árbol de Probabilidades 0,1010 maq 1 0,95 √ 0,05 0,98 x √ 0,02 0,90 x √ 0,10 0,95 x √ 0,05 1 x √ 0 x Ʃ=1 0,0909 maq 2 Ʃ=1 Ʃ=1 0,4040 maq 3 Ʃ=1 0,2424 maq 4 Ʃ=1 0,1616 maq 5 Ʃ=1 a) ¿Cuál es la probabilidad que haya sido producida por la segunda maquina? (0,02)(0,9090) (0,02)(0,0909)+(0,05)(0,1010)+(0,10)(0,4040)+(0,05)(0,2424) 0,001818 = 0,059388 = 0,0306 →3,06% Existe un 3,06% de probabilidad que la lata defectuosa la haya producido la maquina 2. b) Pedro tiene en la mano una lata en buen estado ¿Cuál es la probabilidad que haya sido producida por la tercera o la quinta maquina? (0,90)(0,4040) 0,3636 = 0,940512 → 38,65% (0,90)(0,4040)+(0,95)(0,1010)+(0,98)(0,0909)+(0,95)(0,2424)+(1)(0,1616) (1)(0,1616) 0,1616 = 0,940512 (1)(0,1616)+(0,95)(0,1010)+(0,98)(0,0909)+(0,90)(0,4040)+(0,95)(0,2424)+(1)(0,1616) →17,18% Se tiene un 55,83% de probabilidad que la lata en buen estado haya sido producida por la tercera o la quinta máquina CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 83 PRÁCTICO No 7 Resuelve los siguientes problemas ABP 1. Si se saca una carta de una baraja de 52 cartas. Cuáles de las siguientes parejas de eventos son mutuamente excluyentes y cuáles no. A = Que sea una carta roja. B = Que sea una carta de corazón. C = Que sea un número par. D = Que sea un 3 de espadas. S= A y B ………….. B y C …………. A y C ………….. B y D …………. A y D ………….. C y D …………. 2. Si se lanzan dos dados a la vez y se quiere analizar la suma de los dos resultados. Determinar si los siguientes eventos son mutuamente excluyentes o no. A = La suma de los dos resultados sea un número par. B = La suma es un número cinco. C = Un cinco en uno de los dados. D = La suma sea mayor que 7. Espacio Muestral (S) A y B ………….. B y C …………. A y C ………….. B y D …………. A y D ………….. C y D …………. 3. Si se lanza una moneda tres veces, y se quiere analizar el número de caras que se pueden obtener. Determinar si los siguientes eventos son mutuamente excluyentes o no. A = Que salgan 3 caras B = Que no salga ninguna cara. C = Que salgan tres sellos. D = Que salgan 2 o mas caras. A y B ………….. B y C …………. A y C ………….. B y D …………. A y D ………….. C y D ………… CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 84 4. Se sacan dos cartas con restitución una baraja de 52 cartas, ¿Cuál es la probabilidad de que ambas sean corazones? 5. El mes pasado en la Universidad UTEPSA se aplicó una encuesta para conocer a profundidad. ¿Cuántas personas utilizaban facebook y con qué objetivo lo hacían?, los resultados fueron escalofriantes. De los 380 encuestados, 370 tenían una cuenta, 300 admitieron que lo usan todos los días, y 230 admiten estar conectados más de 2 horas diarias, 103 alumnos ingresan por el mero hecho de solo estar informado de la vida de otros y 68 comentan que lo utilizan con fines académicos. De todos los que ingresan solo para socializar el 40% es de sexo masculino y de los que están más de 2 horas diarias el 74% son mujeres. También se realizó una encuesta en la UDABOL. En dicha institución se entrevistaron a 360 estudiantes y 302 de ellos admitió tener una cuenta en el facebook, lo curioso es que el 90% de los que tienen cuenta admiten entrar todos los días y de estos el 80% más de 2 horas. Teniendo en cuenta esta información conteste las siguientes preguntas. a) Del total de los encuestados. ¿Qué porcentaje utiliza facebook.com? b) Del total de usuarios del facebook. ¿Qué porcentaje lo utiliza todos los días? c) Del total de usuarios diarios de UTEPSA. ¿Qué porcentaje permanece conectado más de 2 horas? d) Del total de usuarios del facebook de UTEPSA. ¿Qué porcentaje ingresan con fines académicos? e) ¿Qué cantidad de hombres representan el 40% de los usuarios que ingresan al facebook solo para socializar en la UTEPSA? f) ¿Qué cantidad de mujeres representa el 74% de las personas que se conectan más de 2 horas por día en UTEPSA? g) ¿Qué Universidad tiene más porcentaje de estudiantes que utilizan el facebook? h) ¿Qué Universidad tiene más porcentaje de estudiantes que ingresan al facebook todos los días? i) De todos los encuestados en ambas universidades. ¿Qué cantidad de estudiantes representa el porcentaje de estudiantes que están conectados más de 2 horas por día? 6. La Universidad Tecnológica Privada de Santa Cruz (UTEPSA) cuenta con una población de 10.000 estudiantes, cada uno con sueños y metas diferentes, pero con una misma misión, aprender a formar un negocio propio. Usted como analista de información de la Universidad necesita conocer las proporciones por sexo de las Facultades y el departamento de Sistemas le muestra el siguiente cuadro. Teniendo en cuenta la información que en este se encuentra y que usted se encontró un estudiante en la calle. Responda las siguientes preguntas. Facultades. Facultad. Ciencias Empresariales. Facultad. Ciencias Tecnológicas. Facultad. Ciencias Jurídicas. Facultad. Relaciones Internacionales. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP Hombres 1500 2500 500 500 Mujeres 2500 1000 1000 500 85 Preguntas: a) ¿Cuál es la probabilidad que este estudiante sea mujer? b) ¿Cuál es la probabilidad que este estudiante sea de la Facultad de Ciencias Tecnológicas? c) ¿Cuál es la probabilidad que sea hombre y de la Facultad de Relaciones Internacionales? d) ¿Cuál es la probabilidad que sea mujer y estudie en la Facultad de Tecnología? e) Bajo el supuesto que el estudiante fue hombre. ¿Cuál es la probabilidad que estudie en la facultad de Ciencias Empresariales? f) Bajo el supuesto que el estudiante pertenece a la Facultad de Tecnología. ¿Cuál es la probabilidad que sea Mujer? g) ¿Cuál es la probabilidad que sea mujer ó de la Facultad de Relaciones Internacionales? h) ¿Cuál es la probabilidad que sea Hombre ó de la Facultad de Tecnología? i) ¿Cuál es la probabilidad que sea de la Facultad de Ciencias Empresariales ó Tecnológicas? j) ¿Cuál es la probabilidad que sea de cualquier Facultad menos la de Ciencias Jurídicas? 7. Usted es gerente comercial de la nueva soda “Guaraná Conti” teniendo en cuenta que el producto no ha entrado al mercado local usted realizó una degustación masiva en ciertos sectores estratégicos de la Ciudad preguntando ¿Qué le parecía el sabor de esta nueva soda? Los resultados se muestran en la siguiente tabla de contingencia. Sector Regular Buena Excelente Centro 20 40 100 Urubó 30 60 120 Urbarí 25 75 83 Equipetrol 10 23 50 Plan 3000 15 25 40 Polanco 35 35 110 Banzer 36 45 80 Si se selecciona un encuestado al azar ¿Cuál es la probabilidad? A. ¿Qué opine que el sabor es Excelente? B. ¿Qué sea de Equipetrol? C. ¿Qué sea de Urbarí y crea que el sabor de la soda es bueno? D. ¿Qué sea de la Banzer y piense que el sabor es Regular? E. ¿Qué sea del centro ó del Plan 3000? F. ¿Qué sea de Polanco ó del Urubó? G. ¿Qué sea de la Banzer ó tenga una opinión Buena del Sabor? H. ¿Qué tenga una opinión excelente ó sea de Equipetrol? I. ¿Qué sea del centro dado que dice que el sabor es Regular? J. ¿Qué diga que el sabor es regular dado que es del Centro de la Ciudad? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 86 8. Usted es el nuevo gerente Comercial del taller mecánico “Páez”, al mismo asisten muchos clientes con autos de tres clases. Nissan, Toyota y Ford. A cada uno de los clientes que vino el mes pasado se le hizo una encuesta preguntándole por la calidad del servicio del taller. Los resultados se muestran a continuación en una tabla de contingencia. Pésima Regular Buena Excelente Toyota 18 30 35 23 Nissan 32 15 25 17 Ford 25 10 20 60 a) b) c) d) e) ¿Qué porcentaje de los clientes vino con un auto Ford? ¿Qué porcentaje de los clientes opina que la atención es Regular y vino en Nissan? ¿Qué porcentaje de los clientes vino en Nissan ó Toyota? ¿Qué porcentaje de los clientes vino en Ford ó el servicio le pareció excelente? ¿A qué porcentaje de los clientes que vinieron en Toyota y la atención les pareció excelente? f) ¿Qué porcentaje de cliente trajeron vehículos Nissan y Ford? g) ¿A qué porcentaje de los clientes la atención le pareció Regular? h) Teniendo el criterio de Excelente. ¿Cuál es la marca de auto que más satisfecha salió del taller? i) ¿Qué porcentaje de los clientes vinieron con Ford dado que la atención les pareció pésima? 9. Usted es el gerente Comercial de la empresa de Investigación de Mercados “Mercadeando”, su último cliente “VIVA” tiene algunas preguntas acerca del estudio que se hizo de su marca. Insatisfecho Indiferente Satisfecho Norte 50 120 200 Sur 150 85 60 este 60 115 70 Oeste 40 30 20 Preguntas: a) b) c) d) e) ¿Qué porcentaje de los encuestados son del Sur de la Ciudad? ¿Qué porcentaje de los encuestados son del este ó el oeste? ¿Qué porcentaje de los encuestados son del Norte y están insatisfechos? ¿Qué porcentaje de los encuestados están insatisfechos ó son del sur? ¿Qué porcentaje de los encuestados creen tiene una opinión por lo menos indiferente? f) ¿Qué porcentaje de los encuestados son del Norte dado que están satisfechos? g) ¿Qué porcentaje de los encuestados están insatisfechos y son del este? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 87 10. Usted es el Gerente Comercial del Café 24, local de distracción del centro de la Ciudad, el mismo es frecuentado por cruceños, pero está enfocado en ser el lugar de pasada por excelencia de los extranjeros y visitantes de otros departamentos. Usted está preocupado por la atención que reciben los clientes y decide hacer una encuesta a las diversas personas que asisten al boliche preguntándole. ¿Qué le ha parecido la atención? Los resultados se muestran a continuación. Cruceños Pésima Regular Buena Muy buena Excelente 20 12 8 15 15 Turistas Nacionales 3 13 24 12 13 Turistas Extranjeros. 23 0 14 12 16 a) b) c) d) e) ¿Qué porcentaje de los encuestados son Cruceños? ¿Qué porcentaje del total de encuestados son Extranjeros y la atención les pareció Buena? ¿Qué porcentaje de los Cruceños la atención le pareció excelente? ¿Qué porcentaje de los encuestados son Turistas (nacionales y extranjeros) ¿Qué porcentaje de los encuestados son Turistas Nacionales ó la atención le pareció Muy Buena? f) ¿Qué porcentaje de los encuestados son Turistas Nacionales dado que la atención les pareció Regular? g) ¿A qué porcentaje de los encuestados el trato le pareció Bueno? 11. Usted es el gerente comercial de la empresa distribuidora de Bebidas “Bodegas El buen gusto”, uno de los tantos productos con que cuenta la empresa es la Soda que se importa de Brasil. Para penetrar el mercado usted debe hacer degustación en diversos puntos de la Ciudad y recoger opiniones. Los siguientes datos muestran las opiniones del sabor de los encuestados. Opinión Regular Buena Excelente Zona Norte 20 30 10 Zona Sur 15 45 30 Zona Este 20 25 50 Zona Oeste 10 15 30 a) Si usted debe comenzar por la zona que más aceptación tuvo el producto. ¿Por qué zona comenzaría la distribución? b) ¿Qué porcentaje de los encuestados son de la zona Sur y la soda le parece Buena? c) ¿Qué porcentaje de los encuestados son de la zona Este ó la soda le pareció Excelente? d) ¿Qué porcentaje de los encuestados el producto le pareció por le menos buena? e) ¿Cuál es la probabilidad que un encuestado sea de la zona oeste dado que tiene una opinión Regular? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 88 PRÁCTICO No8 Problemas ABP propuestos del Teorema de bayes 1.La materia de Investigación de Mercados la dictan 4 profesores, Ana, Evelio, Carlos y Juan, de los 15 grupos que se van a abrir Ana tiene asignado 2, Evelio 3, Carlos 4 y Juan 6 , los comentarios la han llegado que con Ana el 80% aprueba, con Evelio un 75%, con Carlos un 60% y con Juan un 90%. Responda las siguientes preguntas: a) ¿Cuál es la probabilidad que un estudiante haya cursado con Evelio sabiendo que reprobó? b) ¿Cuál es la probabilidad de que un estudiante halla pasado con Juan si se sabe que reprobó? c) ¿Cuál es la probabilidad de que un estudiante halla pasado con Juan si se sabe que aprobó? 2. Usted es propietario de la imprenta “Sirena”, por carnavales la producción de volantes ha aumentado muchísimo, las dos máquinas que tiene son muy buenas pero cada 1000 impresiones la primera saca 40 con fallas y la segunda de cada 2000 impresiones la pasa lo mismo. Un cliente vino ayer a quejarse que sus volantes estaban mal hechos, ¿Cuál es la probabilidad que lo haya impreso la segunda máquina? 3. Una constructora está considerando la posibilidad de construir un condominio en la zona de la carretera a Porongo. Si el consejo municipal aprueba la construcción del nuevo puente a Porongo, hay posibilidad de 0.90 de que la compañía construya el condominio en tanto, que, si no es aprobada la construcción del nuevo puente al Piray, la probabilidad es de solo 0.20 que construya el condominio. Basándose en la información disponible, el gerente de la constructora estima que hay probabilidad de 0.60 que la construcción del puente sea aprobada, por parte del Consejo Municipal. a) ¿Cuál es la probabilidad de que la compañía al aprobarse la construcción del puente, construya el condominio? b) ¿Cuál es la probabilidad de que la compañía no construya el condominio dado que se aprueba la construcción del puente? 4. La fábrica de tasas del oriente boliviano tiene 3 máquinas, la primera produce 230 unidades por día y una décima parte son defectuosos, la segunda produce el doble que la primera y 3 unidades más que la primera máquina y tienen algún tipo de desperfecto, la tercera máquina produce 290 unidades por día y el 99% de los mismos salen en buen estado. Se toma una tasa al azar y está en buen estado. a) ¿Cuál es la probabilidad que haya sido producido por la segunda máquina? b) ¿Cuál es la probabilidad que haya sido producido por la tercera maquina dado que salió con algún defecto? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 89 5. Una compañía petrolera, debe decidir, si taladra o no un lugar determinado que tiene bajo contrato. Por investigaciones geológicas practicadas, se sabe que existe una probabilidad de 0.45 que una formación tipo I se extiende debajo del lugar prefijado para taladrar, y de 0.30 de probabilidad que existe una formación de tipo II para taladrar, finalmente se tiene una probabilidad de 0.25 para que sea una formación de tipo III, para realizar la taladrada. Estudios anteriores indican que el petróleo se encuentra en un 30% de las veces en las formaciones tipo I, un 40% en las de tipo II y aseguran que en un 80% no se encuentra petróleo en las formaciones de tipo III. a) ¿Determinar la probabilidad que, si no se encontró petróleo, la perforación fue hecha en la formación del tipo I? b) ¿Cuál es la probabilidad que la perforación haya sido realizada por la formación tipo III dado que si encontraron petróleo? 6. La fábrica de vasos “La Estrella” tiene 3 líneas de producción, la primera produce 150 unidades por día y una décima parte son defectuosos, la segunda produce el doble que la primera y 18 de ellos tienen algún tipo de desperfecto, la tercera línea de producción produce 300 unidades por día y el 18% de los mismos salen rotos. Se toma un vaso al azar y está en buen estado. ¿Cuál es la probabilidad que haya sido producido en la tercera línea de producción? 7. La fábrica de tasas del oriente boliviano tiene 4 máquinas, la primera produce 120 unidades por día y una décima parte son defectuosos, la segunda produce el doble que la primera y 15 de ellos tienen algún tipo de desperfecto, la tercera máquina produce 310 unidades por día y el 20% de los mismos salen rotas y la cuarta maquina produce lo mismo que la segunda, pero con un 5% de defectuosos. Se toma una tasa al azar y está en buen estado. ¿Cuál es la probabilidad que haya sido producido por la cuarta máquina? 8. Los datos de producción de la Guaraná Conti la empresa se los mandó de Brasil, en sí son cinco las máquinas que producen dicha soda. La primera produce 1000 cajas por día y 50 salen en mal estado, la segunda produce el doble que la primera y la misma proporción de desperfectos que la cuarta. La tercera produce la mitad que la quinta y el 2% sale en mal estado, la cuarta produce el triple que la primera y la misma proporción de desperfectos que la tercera, mientras que la quinta produce el cuádruple que la primera y ninguna en mal estado. El lote que la fábrica envió a Bolivia fue la producción total del mes pasado. La máquina uno trabajó los 30 días, la dos y los tres 25 días, los cuatro 20 días y los cinco 22 días. Preguntas: a) Si un cliente se quejó porque una caja estaba en mal estado ¿Cuál es la probabilidad que haya sido producida por la cuarta máquina? b) Si una caja está en buen estado. ¿Cuál es la probabilidad que haya sido producida por la tercera máquina? Aplicación de lo aprendido En base al proyecto de descriptiva identifica un problema para resolver aplicando el método aprendido en la unidad, utilizando un software, encuentra la solución óptima e interpreta los resultados obtenidos. Exponer y presentar en el proyecto final de la materia. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 90 Unidad 8 VARIABLES ALEATORIAS Y FUNCION DE PROBABILIDAD Objetivos de aprendizaje: Que el estudiante identificar, calcule e interprete variables y distribuciones continua y uniforme medidas de forma. Investigación 1. ¿Qué es una variable aleatoria: discretas y continua? 2. ¿Cuándo se dice que una función de distribución continúa? 3. ¿Qué es una distribución uniforme? Fundamenta tus respuestas con bibliografía VARIABLES ALEATORIAS Las variables aleatorias se denotan con una letra mayúscula, tal como X, y con una letra minúscula, como x, el valor posible de X En c/u de los ejemplos, determine la variable aleatoria y cuáles son posibles valores que toma. Se analiza una muestra de 5 celulares, se quiere observar cuántos poseen una avería interna en las pilas. Una empresa posee un sistema de comunicación por voz de 30 líneas, se estudia el número de líneas ocupadas en cualquier momento. Hay que contar él número de defectos que se pueden encontrar en la superficie de una bobina grande de acero galvanizado. VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS. Si la variable aleatoria sólo puede tomar un valor de un conjunto limitado de valores, entonces es una variable aleatoria discreta. En el otro extremo, sí se puede tomar cualquier valor dentro de un intervalo dado, entonces se trata de una variable aleatoria continua. Otra forma de describir las variables aleatorias es: Una variable aleatoria es discreta si se puede CONTAR los valores que ella toma. Una variable aleatoria es continua si se pueden MEDIR los valores que ella toma. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 91 DISTRIBUCIÓN DE PROBABILIDAD Una distribución de probabilidad, de una variable aleatoria X, es una descripción del conjunto de valores posibles de X, junto con la probabilidad asociada a c/u de estos valores. Nota. Existen dos tipos de estas distribuciones o funciones de probabilidad: Función de probabilidad, cuando se habla de variables discretas Función de densidad de probabilidad, cuando se trata de variables continúas. Comúnmente las distribuciones de probabilidad son conocidas como funciones Función de densidad de probabilidad Matemáticamente, es la función Matemáticamente, es aquella P(X=x) que va desde el conjunto función de una variable aleatoria posible de los valores de la variable continua X que cumple las discreta X al intervalo[0,1] siguientes condiciones: Función de probabilidad Propiedades: Propiedades: 1. P(X = x) ≥ 0 1. ---------- 2. P(X = x) =1 2. f(x)dx 1 b b 3. P(a X b) P(X x ) 3. a P(a X b) f(x)dx a a 4. P(X a ) P(X x ) 4. ---------- 0 DISTRIBUCIÓN DE PROBABILIDAD Una distribución de probabilidad, de una variable aleatoria X, es una descripción del conjunto de valores posibles de X, junto con la probabilidad asociada a c/u de estos valores. Existen dos tipos de estas distribuciones o funciones de probabilidad: Nota. Comúnmente las distribuciones de probabilidad son conocidas como funciones Función de probabilidad, cuando se habla de variables discretas Función de densidad de probabilidad, cuando se trata de variables continúas. VALOR ESPERADO El valor esperado de una variable aleatoria es el equivalente a la media o promedio aritmético, que se utiliza para identificar el valor central de la variable aleatoria. Matemáticamente, se define: μ X E(x) x.P(x) , para variables discretas μ X E(x) x.f(x)dx , para variables continuas CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 92 EJEMPLO El Hub de la figura posee desperfectos en sus puertos, el número de puertos que fallan y sus respectivas probabilidades se muestran en el cuadro de abajo. Determine el valor esperado del número de puertos que fallan. x 2 4 8 12 16 P(x) 0,45 0,20 0,15 0,10 0,10 SOLUCIÓN Como la variable es discreta, aplicamos la fórmula: E(x) x.P(x) E(x) 2 0.45 4 0.20 8 0.15 12 0.10 16 0.10 E(x) 5.7 puertos que fallan en promedio. APLICACIONES A LA TOMA DE DECISIONES EJEMPLO 1 Una empresa vende equipos y accesorios de telecomunicaciones MOTOROLA, la demanda mensual de estos accesorios se distribuye de la siguiente manera: x 10 12 14 18 P(x) 0.40 0.20 0.35 0.05 Si cada accesorio 50 dólares y se vende a un 40% más por cuestiones de impuestos, determine cuántos de estos accesorios se deberán tener en stock mensualmente para minimizar las pérdidas esperadas. SOLUCIÓN DATOS: Costo = 50 $u$/unid Precio = 50 + 50*0.40 = 70 $u$/unid Por sobrar = Costo = 50 Por faltar = Precio – Costo = 70 – 50 = 20 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 93 Se arma la siguiente matriz (VER FIGURA 1): P(x) 10 12 14 18 10 12 14 18 10 0.40 10 0.40 0 100 200 400 12 0.20 12 0.20 40 0 100 300 14 0.35 14 0.35 80 40 0 200 18 0.05 18 0.05 160 120 80 0 FIGURA 1 P(x) FIGURA 2 Hablaremos en forma matricial para referirnos a cada celda, nos preguntamos si sobran o faltan, y calculamos los costos (VER FIGURA 2): No sobra ni falta: Faltan 2: Faltan 4: Faltan 8: A11 = 0 A21 = 2x20= 40 A31 = 4x20= 80 A41 = 8x20=160 Sobran 2: No sobra ni falta: Faltan 2: Faltan 6: A12 = 2x50=100 A22 = 0 A32 = 2x20= 40 A42 = 6x20=120 Sobran 4: Sobran 2: No sobra ni falta: Faltan 4: A13 = 4x50=200 A23 = 2x50=100 A33 = 0 A34 = 4x20= 80 Sobran 8: Sobran 6: Sobran 4: No sobra ni faltan: A14 = 8x50=400 A42 = 6x50=300 A43 = 4x50=200 A44 = 0 Para encontrar las pérdidas esperadas se realiza la operación xP(x): E(10) = 0.40x0 + 0.20x40 + 0.35x80 + 0.05x160 = 44 E(12) = 0.40x100 + 0.20x100 + 0.35x40 + 0.05x120 = 60 E(14) = 0.40x200 + 0.20x100 + 0.35x0 + 0.05x80 =104 E(18) = 0.40x400 + 0.20x300 + 0.35x200 + 0.05x0 = 290 Escogemos el menor de estos costos esperados, el cual corresponde con la decisión de tener 10 accesorios mensualmente en stock, debido a que este valor ocasionará la menor pérdida esperada en el futuro. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 94 EJEMPLO 2 El número de motos de cuatro ruedas solicitadas en renta en una caseta de alquiler de motos en las orillas del río Piraí durante un periodo de 50 días se identifica en la tabla siguiente: Demanda( X) Número de días 3 6 4 10 5 15 6 9 7 6 8 4 a) Construir la función de probabilidad. b) Determinar el valor esperado. c) Graficar la función de probabilidad. Se elabora un cuadro calculando la probabilidad de demanda diaria y luego el valor esperado: FUNCIÓN DE PROBABILIDAD Demanda (X) Probabilidad P(X) Valor Esperado[X*P(X)] 3 0.12 0,36 4 0.20 0,80 5 0.30 1,50 6 0.18 1,08 7 0.12 0,84 8 0.08 0,64 1.00 E(X) = 5,22 b) El valor esperado es 5,22 motos. c) Graficar P 0.3 0,25 0,20 0,15 0,10 0,05 0 3 4 5 6 7 8 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP X 95 PRÁCTICO No 9 PROBLEMAS ABP PROPUESTOS 1.- Construya una distribución de probabilidad basada en la siguiente distribución de frecuencia Movilidades atendidas en la estación de servicios “VELOZ” Número de días del estudio 102 105 108 111 114 117 10 20 45 15 20 15 a) Construir la función de probabilidad y graficarla. b) Determinar el valor esperado. c) Determinar: i) P(X = 105); ii) P(X ≥ 103); iii) P(X < 106); iv) P (105 ≤ X < 118); v) P (104 < X < 114) 2.- Basándose en la siguiente gráfica de una distribución de probabilidad, construya una tabla que corresponda a la gráfica y determine el valor esperado. 0.25 0.2 0.15 0.1 0.05 0 1 2 3 4 5 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 6 7 8 9 10 96 Unidad 9 DISTRIBUCIONES DE PROBABILIDAD Objetivos de aprendizaje: Que el estudiante Identifique los diferentes métodos de distribución, binominal, de pasión, normal y sus métodos de ejecución aplicaciones junto con la metodología t-Student. PRÁCTICO No10 Resuelve los siguientes Problemas ABP propuestos de distribuciones de probabilidades: Distribución Binomial 1. En una universidad el 50% de los estudiantes están inscritos en carreras del área empresarial, el 20% en carreras de Ingeniería, el 20% en derecho y el 10% en carreras de humanidades. Si se toma una muestra de 8 alumnos, cual es la probabilidad: a) b) c) d) Que hayan más de 4 alumnos del área de empresariales. Que exactamente 3 alumnos sean de derecho Que como máximo 3 alumnos sean de Ingeniería Que a lo sumo 5 sean del área de humanidades 2. Un examen consta de siete preguntas, cada pregunta es de solución múltiple con cuatro opciones de las cuales solo una es correcta. Un estudiante que desconoce la materia intenta resolver el examen respondiendo las preguntas al azar: a) Si necesita responder como mínimo 5 preguntas correctas para aprobar el examen. ¿Cuál es la probabilidad que apruebe? b) Cuál es la probabilidad de que conteste al menos 3 preguntas correctas? c) Cuál es la probabilidad de que conteste como máximo 4 preguntas correctas, y repruebe el examen? 3.- Suponga que un avión tiene seis motores. Cada motor trabaja de forma independiente, y la probabilidad de falla de cada motor es de 3 %. Determinar cuál es la probabilidad de que en un vuelo cualquiera: a) No ocurra ninguna falla. b) Fallen como máximo 2 motores. c) Si un avión necesita como mínimo tres motores funcionando para mantenerse en vuelo, cual es la probabilidad de que el avión se caiga. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 97 4. Supongamos que un avión tiene cuatros motores. Cada motor trabaja de forma independiente y la probabilidad de falla de cada motor es de 0.15. Determinar cuál, es la probabilidad de que en un vuelo cualquiera: a) No ocurra ninguna falla en ninguno de los motores? b) Cuál es la probabilidad que ocurran fallas mínimo en un motor? c) Cuál es la probabilidad que fallen máximo 2 motores 5. La probabilidad de acertar en el blanco es 0.3, si se dispara 6 veces. a) Cual es la probabilidad de que se acierte exactamente en cinco ocasiones? b) Cual es la probabilidad que le acierto más de 3 ocasiones c) Cual es la probabilidad que le acierte menor a 2 ocasiones 6. La probabilidad de tener un accidente de tráfico es de 0,2 cada vez que se viaja, si se realizan 300 viajes, ¿cuál es la probabilidad de tener 3 accidentes? 7. La probabilidad de que un niño nazca pelirrojo es de 0,1. ¿Cuál es la probabilidad de que entre 800 recién nacidos haya 5 pelirrojos? 8. Se sabe que el 30% de los habitantes de una ciudad depende del asma. Determinar la probabilidad de que en una muestra aleatoria de 4 personas. a) Ninguna padezca de agua. b) más de 2 sufran de asma. Distribución Poisson 9. En un banco llegan un promedio de 60 personas para hacer alguna operación en las cajas de atención al público. Cuál es la probabilidad de que en 15 minutos: a) Lleguen 20 personas. b) El número de clientes que llegan sea como mínimo 12. c) El número de clientes este entre 13 y 18. 10. El número de casos admitidos de emergencia en cierto hospital durante 1 hora es una variable aleatoria con una distribución de poisson con un promedio de 3 personas. Determinar la probabilidad de que en cierta hora: a) Ningún caso de emergencia es admitido. b) Más de 4 casos de emergencia son admitidos. c) Por lo menos 2 casos sean admitidos. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 98 11. Al cajero que se encuentra frente al Mercado de la Mutualista del BNB entran 10 personas por hora. a) Cuál es la probabilidad que en la próxima hora entren a la tienda 6 personas? b) Cuál es la probabilidad de que entren Menos de 3 personas usen la caja durante una hora aleatoriamente seleccionada? c) Cuál es la probabilidad que no ingrese ninguna persona? 12. Al cajero del Banco BCP, que se encuentra en el Mercado de la Mutualista entran en promedio 7 personas por hora. ¿Cuál es la probabilidad que en la próxima hora entren al cajero máximo 5 personas? 13. La probabilidad de que haya un accidente sobre el tercer anillo interno a la salida de la UTEPSA es de 0,3 por cada día. a) ¿Cuál es la probabilidad de tener 1 accidentes en un día cualquiera? b) ¿Cuál es la probabilidad de que ocurran menos de 2 accidentes? c) Calcular la probabilidad de que no ocurra ningún accidente? d) Cual es la probabilidad que ocurran más de 2 accidentes al día? 14. Supongamos que un libro de 585 páginas contiene 41 errores de ortografía distribuidos aleatoriamente. Cuál es la probabilidad que en diez páginas seleccionadas al azar: a) Ninguna página tenga errores. b) Hayas 23 páginas con errores. c) Como máximo 3 paginas tengas errores. Distribución Normal 15. Usted es el Gerente Comercial en Santa Cruz de la Sierra de Laboratorios Inti. Un estudio previo a su gestión mostró que el consumo promedio de mentisan de los habitantes del departamento era de Bs. 100 anual con una desviación de 11 Bs. Teniendo en cuenta estos datos, responda las siguientes preguntas. a)¿Qué porcentaje de todos los que compran mentisan compran de 70 a 110 Bs? b)¿Qué porcentaje de todos los que compran mentisan compran Más de 130 Bs? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 99 16. Dado la variable aleatoria X tiene una distribución normal con media de 6.4 y desviación tipica de 2.3, encontrar: a) P(4< X <5) = b) P(X> 2) = c) P(X≤ 2) = 17. Las esturas de 1000 estudiantes están distribuidas normalmente con una medida de 174 centímetros y una desviación estándar de 6.9 centímetros ¿qué porcentaje de estudiantes: a) Miden menos de 160cm. b) Entre 171 y 182cm. c) Mayor o igual a 188cm. 18. Un súper mercado almacena 30kg de queso fundido cada semana. Si la demanda semanal de queso fundido esta normalmente distribuida con una medida de 24 kg una desviación estándar de 5 kg. Determinar la probabilidad de queso en un semana cualquiera. 19. Los gastos mensuales de comida de familias de cuatro miembros promedian $us 420 con una desviación estándar de $us 80. Suponiendo que los gastos mensuales de comida se distribuyen normalmente. a) b) c) d) ¿Qué porcentaje de estos gastos son inferiores a $us 360? ¿Qué porcentaje de estos gastos están entre $us 260 y $us 360? ¿Qué porcentaje de estos gastos están entre $us 260 y $us 460? ¿Qué porcentaje de estos gastos son superiores a $us 360? 20. La media de los pesos de 500 estudiantes de un colegio es 70 Kg y la desviación típica 3 Kg. Suponiendo que los pesos se distribuyen normalmente, hallar cuantos estudiantes pesan: a) Entre 60 Kg y 75 Kg b) Más de 90 Kg c) Menos de 64 Kg 21. Se supone que los resultados de un examen siguen una distribución normal con una media 78 y desviación típica 36. Se pide: a) ¿Cuál es la probabilidad de que una persona que se presenta el examen obtenga una calificación superior a 72? b) Si se sabe que la calificación de un estudiante es mayor que 72. ¿Cuál es la probabilidad de que su calificación sea, de hecho, superior a 84? CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 100 Distribución t-Student Obtención de las puntuaciones con una probabilidad asociada: Supongamos que la variable t se distribuye según el modelo t10, y queremos hallar: a) El valor para el que la probabilidad acumulada es 0,95. b) El valor para el que la probabilidad de observar valores mayores es igual a 0,10. c) P [ t1 t t2 ] = 0, 975 Obtención de probabilidades asociadas a determinados valores: Supongamos que la variable t se distribuye según el modelo t con 25 grados de libertad, y queremos obtener las probabilidades de que esta variable adopte: a) Valores como mucho iguales a 1,316. b) Valores como mínimo iguales a 2,060 c) Valores comprendidos entre 1.316 y 2.060 3.- Para una distribución t-student encuentre: a) P ( t < t ) = 0.90 cuando r = 5 b) P ( -1.812 t 2.228 ) = cuando r = 10 c) P ( - t < t < t ) = 0.90 cuando r = 14 d) P ( t > t ) = 0.01 cuando r = 10 e) P ( t > 2.228 ) = cuando r = 10 f) P ( t > 1.318 ) = cuando r = 24 g) P ( t < 2.365 ) = cuando r = 7 h) P ( t > - 2.567) = cuando r = 17 i) P ( k < t < 2.807 ) = 0.095 cuando r = 23 4. Una compañía manufacturera asegura que las baterías utilizadas en sus juegos electrónicos duran un promedio de 30 Horas. Para conservar este promedio se prueban 16 baterías. Si el valor calculado de t cae entre - t y t superior a 0.025, la compañía está satisfecha con su afirmación. ¿Qué conclusión sacaría la empresa de una muestra que tiene una media de X = 27.5 Horas y una desviación estándar S=5 horas? Suponga que la distribución de la duración de las baterías es aproximadamente normal. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 101 DISTRIBUCIÓN BINOMIAL Es cualquier experimento formado por una serie de n ensayos repetidos tales que: 1. los ensayos son independientes. 2. cada ensayo tiene dos resultados posible, denominados “éxito” y “fracaso” 3. la probabilidad de éxito de cada ensayo, denotada por p, permanece constante. Las probabilidades se calculan a través de la siguiente formula: P(X r / n, p ) n! x!n x ! x nx p q La variable puede tomar los valores x = 0, 1, 2,…n PROPIEDADES μ X E(x) np X2 V(x) npq PROBLEMA ABP RESUELTO Después de una auditoria externa en una empresa financiera se determinó que el 30% de sus créditos están en mora. Si el auditor interno toma una muestra aleatoria de cinco de esas cuentas, determine la probabilidad de que exactamente dos créditos estén en mora. Utilizando la formula binomial tenemos: P(X = r/ n,p) = n! p r q nr r!(n r )! Donde: n=5 p=0,3 p+q =1 q = 0,7 P(X = 2/n = 5, p = 0,3) = 5! (0.30) 2 (0.7) 3 0.3087 2!(5 2)! Entonces la probabilidad es 0.3087 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 102 DISTRIBUCIÓN DE POISSON Dado un intervalo de números reales, suponga que el conteo de ocurrencias es aleatorio en dicho intervalo. Si este puede dividirse en subintervalos suficientemente pequeños tales que: 1. la probabilidad de ocurrencia más de una ocurrencia en dicho subintervalo es cero. 2. la probabilidad de ocurrencia en un subintervalo es la misma para todos los subintervalos, y es proporcional a la longitud de éstos. 3. el conteo de ocurrencias en cada subintervalo es independiente del de los demás subintervalos. P(X x) e -λ x λ x! PROPIEDADES μ X E(x) λ X2 V(x) λ PROBLEMA ABP RESUELTO Un promedio de cinco personas por hora realizan transacciones en una ventanilla de servicios especiales de un banco comercial. Suponiendo que el arribo de esas personas tiene una distribución independiente y es igualmente probable a lo largo del periodo de interés ¿Cuál es la probabilidad de que exactamente diez personas deseen realizar transacciones en la ventanilla de servicios especiales durante una hora en particular? P(X x) e -λ x λ x! P(X 10) e -5 10 5 P(X = 10) = 0,0181 10 ! Donde: e = Base del logaritmo neperiano (2, 7182) λ = promedio x = valor buscado CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 103 DISTRIBUCIÓN NORMAL Es sin duda la distribución más utilizada para modelar experimentos aleatorios. La distribución normal es una distribución continua que se ajusta a las distribuciones reales observada en muchos fenómenos como ser: Las mediciones de velocidad de transmisión de datos. Las mediciones de corriente eléctrica Las mediciones de temperatura En general todo lo que se puede medir. Tiene las siguientes propiedades: La curva o distribución de los datos es unimodal. La media de la población cae dentro del grafico y coincide con el centro de la grafica. Los dos extremos de la distribución normal se extienden indefinidamente y nunca tocan el eje horizontal (desde luego, esto es imposible de mostrar de manera grafica) Para definir una distribución normal se necesitan solamente dos parámetros la media y la desviación estándar. La distribución es simétrica con respecto a la línea vertical que pasa por la media µ FIG. GRAFICA DE LA DISTRIBUCION NORMAL No es necesario ni posible tener una tabla distinta para cada distribución normal posible, en lugar de ellos se utiliza una distribución normal estándar para encontrar las probabilidades. Para ello se utiliza la siguiente transformación: z x -μ σ PROPIEDADES E(x) μ V(x) CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 2 104 PROBLEMA ABP RESUELTO En una clínica de niños en la sección de emergencia, se tiene registrada la edad de cada uno de los niños que ha sido atendido durante el año pasado. Tomando estos datos se encuentra que la edad media corresponde a 10 años, con una desviación típica de 3 años. Si se escoge un niño al azar, para analizar su expediente médico, ¿Cuál es la probabilidad de que: a) b) c) d) e) f) El niño sea mayor a 13 años. El niño sea menor a 5 años. El niño este entre 6 y 15 años. El niño este entre 11 y 14 años. El niño tenga como máximo 12 años. El niño sea por lo menos de 8 años. SOLUCION DATOS Distribución normal µ = 10 años = 3 años a) P(x 13) = ? x = 13 La tabla de probabilidades sólo calcula menor o igual “”. Hay que sacar el complemento: P(x 13) = 1 – P(x 13) . . . . . . . . . Ahora estandarizamos para poder entrar en tablas: z µ = 10 x -μ σ 13 10 1.00 3 Entrando a tablas con Z = 1.00 tenemos: Z 0.0 0.1 0.1 0.1 0.1 0.00 0.01 0.02 0.03 0.04 0.05 1.0 0.8413 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 105 Reemplazando en la ecuación P(x 13) = 1 – P(x 13) = 1 – 0.8413 = 0.1587 b) P(x ≤ 5) = ? x=5 Como se tiene menor o igual “”. No hay necesidad de sacar el complemento: Ahora estandarizamos para poder entrar en tablas: z µ = 10 x -μ σ 5 10 1.67 3 Entrando a tablas con Z = -1.67 tenemos: Z 0.0 0 0.0 1 0.0 2 0.0 3 0.0 4 0.0 5 0.0 6 0.07 -3.5 -3.4 -3.3 -3.2 -3.1 0.04 75 -1.6 Finalmente P(x 5) = 0.0475 c) P(6 ≤ x ≤ 15) = ? x=6 x = 15 Hay que realizar la siguiente transformación P(6 ≤ x ≤ 15) = P( x ≤ 15) - P( x ≤ 6) . . . . . Ahora estandarizamos para poder entrar en tablas: z x -μ σ 15 10 3 1.67 z x -μ σ 6 10 1.33 3 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 106 Entrando a tablas con Z = 1.67 y después con Z = -1.33 tenemos: Para Z = 1.67, la probabilidad es: 0.9525 Para Z = -1.33, la probabilidad es: 0.0918 Reemplazando en la ecuación P(6 ≤ x ≤ 15) = P( x ≤ 15) - P( x ≤ 6) = 0.9525 – 0.0918 = 0.8607 d) P(11 ≤ x ≤ 14) = ? x = 11 x = 14 Hay que realizar la siguiente transformación P(11 ≤ x ≤ 14) = P( x ≤ 14) - P( x ≤ 11) . . . . . Ahora estandarizamos para poder entrar en tablas: z x -μ σ 14 10 z 1.33 3 x -μ σ 11 10 0.33 3 Entrando a tablas con Z = 1.67 y después con Z = -1.33 tenemos: Para Z = 1.33, la probabilidad es: 0.9082 Para Z = 0.33, la probabilidad es: 0.6293 Reemplazando en la ecuación P(11 ≤ x ≤ 14) = P(x ≤ 14) - P(x ≤ 11) = 0.9082 – 0.6293 = 0.2789 e) P(x ≤ 12) = ? x = 12 Como se tiene menor o igual “”. No hay necesidad de sacar el complemento: Ahora estandarizamos para poder entrar en tablas: z x -μ σ 12 10 0.67 3 Entrando a tablas con Z = 0.67 La probabilidad es 0.7486 Finalmente P(x ≤ 12) = 0.7486 f) P(x ≥ 8) = ? x=8 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 107 Hay necesidad de sacar el complemento: P(x ≥ 8) = 1 - P(x 8) . . . . . Ahora estandarizamos para poder entrar en tablas: x -μ z σ 8 10 0.67 3 Entrando tablas con Z = -0.67 La probabilidad es 0.2514 Reemplazando en P(x ≥ 8) = 1 - P(x 8) = 1 -0.2514 = 0.7486 DISTRIBUCIÓN t-Student Si a) Sean Z1 , Z2 .......Zr La t- student se aplica cuando el tamaño de la muestra es pequeño y cuando la desviación estándar se desconoce. b) y formamos la variable T según la siguiente fórmula T x-u S2 /n Entonces, la variable aleatoria T se ajusta al modelo t con r grados de libertad ( r = n-1) T ------> tr f(x) PROPIEDADES: 1) Simétrica respecto al valor 0. 2) En este valor 0 coinciden media, mediana y moda. 3) Puede adoptar valores positivos y negativos. 4) Asintótica respecto al eje de abscisas. 5) La distribución t se aproxima a la normal a medida que los grados de libertad tienden a infinito. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 108 Unidad 10 ESTIMACIÓN Objetivos de aprendizaje: Que el estudiante analice la información mediante estimación puntual y dominar los intervalos de confianza utilizados para la toma de decisiones y desarrollar habilidades para resolver problemas de probabilidades. Estimación por Intervalos de Confianza. Usted se habrá preguntado. ¿Por qué se llama Estadística Inferencial?, ¿Qué es inferir?, ¿De qué se tratará la Unidad?, bueno, esta es una de las partes más lindas y apasionantes de la Estadística Inferencial, los intervalos de confianza como su nombre lo dice son aproximaciones reales que otorgamos a la población según los valores seleccionados en la muestra. Es importante dividir este estudio en dos, primero en el caso de las muestras grandes. (Mayores de 30) y por segundo las muestras pequeñas (menores que 30) todo esto vamos a explicarlo muy fácilmente en este capítulo de nuestra guía. Como tal Inferencial viene de inferir, generalizar, ejemplo, si se realizó una encuesta a 300 estudiantes de la Universidad con la intención de conocer la aceptación del nuevo método de inscripciones por internet, en el estudio se mostró que el 40% estaba satisfecho con el método y un 60% no, por lo tanto inferimos que toda la universidad piensa lo mismo. Este proceso que hemos hecho tan fácilmente tiene su grado de complejidad que vamos a desmenuzar en esta parte de la guía. Pautas para que un intervalo de confianza funcione. 1.- Para que tenga validez el intervalo de confianza la encuesta debe estar hecha por muestreo. 2.- Los intervalos como su nombre lo dice son infinitos valores entre un rango no un valor específico. Intervalo de confianza para hallar una media poblacional (u), cuando conocemos la varianza poblacional y tenemos una muestra mayor a 30 datos. La única forma de hallar “u” media poblacional, es trabajando un censo, como no podemos trabajar con censos en la mayoría de las ocasiones por su elevado costo tomamos una muestra, los resultados de la muestra debemos inferirlos a la población mediante un intervalo de confianza. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 109 Ejemplo: Se tomó una encuesta de 100 personas en Santa Cruz para estimar la demanda de pantalones jeans, los datos mostraron un promedio de gasto anual en estas prendas de 150 dólares. Estudios anteriores mostraron una varianza poblacional de 81 dólares. Estime con los datos de esta muestra los valores de la población con un 95% de confiabilidad. Fórmula: 𝐼𝐶 = 𝑥̅ ± 𝑍∝/2 𝜎 𝑓𝑐 √𝑛 La Desviación estándar del promedio puede calcularse de esta forma. Solución: Como podemos ver en los datos del problema nos dan la Varianza, que hallándole la raíz podemos tener la desviación estándar, también tenemos el tamaño de la muestra, solo nos faltaría el valor del estadígrafo “Z”, que ya aprendimos a buscarlos en el capítulo de Distribuciones de probabilidad. Como podemos ver nos piden un 95% de confiabilidad, por lo tanto buscamos en la tabla el valor de “Z” con un 95% de confiabilidad y tenemos que es 1.96, luego sustituimos y lo demás es una simple operación matemática. 𝑢 = 150 ± 1.96 √81 .1 √100 = 150 ± 1.96 9 .1 10 = 150 ± 1.96 (0.9). 1 = 𝟏. 𝟕𝟔𝟒 Ahora podemos hacer el intervalo de confianza. [150 − 1.764 ≥ 𝑢 ≥ 150 + 1.764] [148.23 ≥ 𝑢 ≥ 151.764] Interpretación: Estamos seguros que en el 95% de todas las posibles muestras que se pudieron haber obtenido en la población, los valores de la media oscilan entre 148.23 y 151.76 dólares. 4.1 Intervalo de confianza para hallar una media poblacional (u), cuando “NO” conocemos la varianza poblacional y tenemos una muestra mayor a 30 datos. En caso de que no conociéramos el valor de la varianza poblacional, tomamos la de la muestra. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 110 Ejemplo: Usted es el jefe de personal de la fábrica de caramelos “Dulcete” que tiene sus instalaciones a las afueras de la Ciudad de Santa Cruz, en este momento la empresa tiene un buen posicionamiento en el mercado cruceño, datos de nuestros socios de negocio indican que dos empresas del mismo rubro de la Argentina van a incursionar en el mercado local, hace falta investigar el mercado de los caramelos en Santa Cruz completa, teniendo en cuenta que los niños de 3 a 11 años son el 95% de nuestros clientes se los va a tomar como población objetivo. Se visitan 100 colegios y se hace una encuesta a 15.000 estudiantes mostrando un promedio de gasto de 40 bolivianos por mes. Con un valor máximo de compra de 85 bolivianos y un mínimo de 5 bolivianos. Calcular el intervalo de confianza que muestra los datos de toda la población de niños de Santa Cruz con un 90% de confianza. Solución: Como podemos ver tenemos el valor del Rango, que sería (85 – 5), en este caso 80 bolivianos, la teoría estadística muestra que el Rango dividido entre 4 es la Desviación Estándar. En este caso 80/4= 20. El valor de “Z” para un 90% de confianza es 1.65 20 𝑢 = 40 ± 1.65 = 40 ± 0.2694 √15.000 [40 − 0.2694 ≥ 𝑢 ≥ 40 + 0.2694] [39.7306 ≥ 𝑢 ≥ 40.2694] Interpretación: Estamos seguros que en el 90% de todas las posibles muestras que se pudieron haber obtenido en la población, los valores de la media oscilan entre 39.7306 y 40.2694 dólares. Intervalo de confianza en muestras pequeñas. (Distribución “t”) Anteriormente trabajamos con muestras grande (≥30); pero hay casos en que no se puede trabajar con este tipo de muestras, ejemplo. Si usted es el encargado de probar la seguridad de los autos Toyota y para realizar su prueba tiene que chocar un auto contra un muro, le garantizo que no va a chocar 30 autos o más. En estos casos que tenemos muestras pequeñas trabajamos con la distribución “t” de student. Fórmula: 𝐼𝐶 = 𝑥̅ ± 𝑡∝/2 𝑆 √𝑛 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 𝑓𝑐 111 Ejemplo: El promedio de ventas que debe tener la sucursal de “Ford” en Argentina es de 100.000 al mes para dólares por mes para cubrir sus costos de producción y mantenimiento de la empresa. Usted ha sido contratado como asesor e investigador de mercado y tiene que sugerirle al gerente general ¿Qué hacer con la situación de la empresa?, ya que con menos de 100.000 dólares al mes no puede seguir operando. Los datos de los últimos 7 meses muestran un ingreso promedio de 90.675 dólares y una desviación estándar de 5.000 dólares. Con un 99% de confiabilidad ¿Qué consejo profesional le diría al gerente general? El valor de “t” para un 99% de confianza es 3.7007 , y los grados de libertad son 7-1=6 𝑢 = 90.675 ± 3.7007 5.000 √7 = 90.675 ± 6.993,66 [90.675 − 6.993.66 ≥ 𝑢 ≥ 90.675 + 6.993.66] [83.681.34 ≥ 𝑢 ≥ 97.668,66] Interpretación: En este caso, podemos aconsejarle al gerente que cierre la empresa por que los resultados muestran que con un 99% de confiabilidad las ventas están entre 83.681 y 97.668 dólares que no cubren el costo de producción. Intervalo de Confianza para hallar una proporción poblacional. En el caso de las proporciones a diferencia de las medias siempre vamos a utilizar “Z”, no importa que sean muestras grandes ó pequeñas. Fórmula: 𝑝𝑞 Que es lo mismo que decir. √ 𝑛 𝐼𝐶 = 𝑝̅ ± 𝑍∝/2 √ 𝑝. 𝑞 𝑓𝑐 𝑛 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 112 Ejemplo: Usted es el jefe de campaña del candidato “Augusto Hernández” para las elecciones municipales, en la encuesta que usted tomó a 1.000 ciudadanos con su grupo de trabajo, el candidato tenía el 40% de los votos, teniendo en cuenta un 95% de confiabilidad y teniendo en cuenta que para ganar la elección se requiere el 36.85% de los votos, ¿Qué le diría al candidato? Como vemos p= 0.4, q= 0.6, n= 1000 y “Z” para un 95% de confianza es 1.96. 𝑝𝑞 0.4∗0.6 𝜋 = 𝑝 + Z√ 𝑛 . 1 = 0.4 ± 1.96√ 1.000 . 1= 0.4 ± 1.96 (0.01549) [0.4 − 0.03 ≥ 𝜋 ≥ 0.4 + 0.03] [0.37 ≥ 𝜋 ≥ 0.43] Interpretación: Puede decirle al candidato que está tranquilo que estamos seguros que en un 95% de todas las posibles muestras que se pudieron haber tomado, el candidato aparece como ganador. ¡¡Felicidades!!. PRACTICO No 11 Intervalos de Confianza para hallar (u) cuando σ es conocida. 1.- Cien latas de de 16 onzas de la salsa de tomates Jakes Mom tienen un promedio de 15.2 onzas. La desviación estándar poblacional en peso es de 0.96 onzas. ¿A un nivel de confianza del 95% las latas están llenas con un promedio de 16 onzas? 2.- Una muestra de 500 personas muestran un promedio de consumo de 80 Bs en refrescos (Soda) mensual. Teniendo en cuenta que se conoce por datos anteriores que la desviación estándar poblacional es de 135 bolivianos. Determine el intervalo de confianza para el 95% y el 90% que muestre donde estaría la media poblacional. 3.- Un investigador que se dedica a la creación de un nuevo producto alimenticio tiene preocupación acerca de la continuidad de sus actividades debido a que las reglas para financiamiento de su investigación predican que si tiene una tasa de 78 errores en promedio por mes dejarían de enviarle fondos. Una muestra de 235 de sus productos muestra un error promedio de 70. Se sabe que la desviación Varianza poblacional es de 196 errores. Según un intervalo de confianza que consejo profesional usted le puede dar al investigador. 4. Una máquina está ajustada de tal manera que la cantidad de líquido despachada se distribuye aproximadamente normal con una desviación igual a 0.15 decilitros. Encuentre un intervalo de confianza del 95% para la media de todos los refrescos que sirve esta máquina si una muestra aleatoria de 36 refrescos tiene un contenido promedio de 2.25 decilitros. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 113 5. Un fabricante produce focos que tienen un promedio de vida con distribución aproximadamente normal y una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una vida promedio de 780 horas, encuentre un intervalo de confianza del 95% para la media poblacional de todos los focos que produce esta empresa? Intervalos de Confianza para hallar (u) cuando σ es desconocida. (Cuando σ es desconocida se utiliza la desviación estándar de la muestra que se debe tomar de una prueba piloto ó dividiendo el Rango entre seis) 1. Un teatro del cine local desea desarrollar un intervalo para estimar las cajas promedio de pipocas que se venden por sala de cine. Si los registros llevados por 70 salas revelan un promedio de 54.98 cajas y una desviación estándar de 12.7. Calcule e interprete el intervalo de confianza para del 92% de la media poblacional. 2. El Banco Ganadero otorgará un crédito de 105.000 dólares a la universidad que presente estudiantes con una nota promedio superior a 83.5 puntos paras mejorar la infraestructura. Por cuestiones ajenas a nuestra voluntad el señor que traía los datos fue atracado y solo se pudieron tener algunas calificaciones de cada universidad que se presentan a continuación. UPSA UTEPSA UDABOL Franz Domingo Sabio Tamayo Promedio 82.5 87 85 78 82 (muestral) Desviación 12.36 15.12 16.35 20.23 26.25 Estándar (S) Tamaño de la 105 100 125 85 67 Muestra Estime con un 95% de confianza ¿Cuáles son las universidades que recibirán el crédito de Banco Ganadero? Intervalos de Confianza para hallar “u” (Con muestras pequeñas) En este caso estudiamos la “t” de student. 1. La empresa (A) fue culpada por infiltrar los comprobantes que registra para los contratos de construcción con el gobierno federal. El contrato estableció que un cierto grupo de trabajo debería promediar 1.150 dólares. Por motivos de tiempo los directivos de la empresa de solo 12 agencias del gobierno fueron llamados a dar testimonio ante la corte respecto a los comprobantes de la empresa. Si se descubrió que a partir del testimonio de una media de 1.275 dólares y una desviación estándar de 235 dólares. ¿Un intervalo de confianza del 95% apoyaría el caso legal de la empresa? 2. Se toma una muestra aleatoria de 12 agujas de tejer en un estudio de la dureza Rockwell de la cabeza de las agujas. Se realizan las mediciones de la dureza para cada una de las 12 piezas, de lo CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 114 que se obtiene un valor promedio de 48,5 con una desviación estándar de 1,5. Suponiendo que las mediciones están normalmente distribuidas, determine el intervalo de confianza del 90% para la dureza Rockwell promedio. 3.- Una maquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de piezas cuyos diámetros son 1,01; 0,97; 1,03; 1,04; 0,99; 0,98; 0,99; 1,01; 1,03 centímetros. Encuentre un intervalo de confianza del 99% para el diámetro promedio de piezas de esta máquina, si supone una distribución normal. 4. Una muestra aleatoria de 8 cigarrillos de una marca determinada tiene un contenido promedio de nicotina de 2.6 miligramos y una desviación estándar de 0.9 miligramos. Determinar un intervalo del 99% de confianza para el contenido promedio real de nicotina de esta marca de cigarrillos en particular, asumiendo que la distribución de los contenidos de nicotina es aproximadamente normales. 5. Intervalos de Confianza para la proporción poblacional. Pi (¶) Es la proporción Poblacional. Cuando se va a estimar proporciones poblacionales siempre se trabaja con (Z). 1. Cierto candidato a las próximas elecciones municipales quiere elaborar un plan de gobierno que beneficie a los integrantes de la tercera edad. Es obvio que le interesa obtener mucha aprobación de esta parte de la población. Sus asesores de campaña le aconsejan que si más de menos del 30% de los votantes de esta edad no simpatizan de él no vale la pena enfocarse en este segmento de la población. Se realizó una encuesta de opinión a 300 personas que mostró que el 28.75% de los votantes entre 65 y 75 años simpatizan con el candidato. Con un 95% de confianza que le pudiera decir usted a este equipo de campaña. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 115 Unidad 11 ESTIMACIÓN Objetivos de aprendizaje: Que el estudiante sea capaza de reconocer los diferentes tipos de muestreos probabilísticas, los diferentes tipos de muestreos no probabilísticas. Calcule el tamaño de la muestra para población finita e infinita y Resuelva problemas de aplicación a la economía. PRACTICO No 12 Problemas ABP propuestos del cálculo del tamaño de la muestra: 1. Determinar el tamaño de la cantidad de estudiantes que se va a encuestar si se tiene una desviación de 20 y un nivel de confianza de 90% y un error de 3, para conocer el nivel de excelencia educativa de la UTEPSA si se conoce que el total de estudiantes inscritos es de 10000 estudiantes. 2. Se desea estimar la calificación promedio de aprobación de los estudiantes del módulo anterior, de la UTEPSA, para ello se realizó una prueba piloto donde se encuesto 40 personas de las cuales 25 aseguraron haber aprobado la materia que le había tocado el anterior modulo. a) Con los siguientes criterios determinar el tamaño de la muestra que se debe tomar para realizar dicho estudio, con un nivel de confianza del 95% y un error del 7%. b) Cuanto seria esta muestra si conocemos que la población de la UTEPSA es aproximadamente de 9000 estudiantes. 3. Se desea estimar el ingreso promedio de las familias en santa cruz, para ello se definen los siguientes criterios un nivel de confianza del 90% y una desviación estándar de 1200 Sus. Con un error máximo tolerable de 200 Sus. a) Cuál será el tamaño de la muestra que se debe tomar para realizar dicho estudio. b) Considerando una población total de 480000 familias cuanto seria la muestra a tomar para realizar dicho estudio. 4. Se desea estimar la proporción de estudiantes de la UTEPSA con un nivel de aprendizaje de excelencia, para ello se define los siguientes criterios un nivel de confianza del 95% una probabilidad de estudiantes que aprueban con excelencia de 10% y un error de 6% determinar el tamaño de la muestra que se deberá tomar para realizar dicho estudio considerando que la UTEPSA tiene una población de 10000 Estudiantes. 5. Un experto en eficiencia desea determinar el tiempo promedio que toma el hacer 3 perforaciones en una cierta pieza metálica. ¿Qué tan grande se requiere que sea la muestra si se necesita una confianza del 95% de que su media muestral estará dentro de 15 segundos del promedio real? Asuma que, por estudios previos se sabe que = 40 segundos. CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 116 6. Una firma constructora desea estimar la resistencia media de las barras de acero utilizadas en la construcción de edificios de departamentos. Que tamaño muestral se requiere para garantizar que haya un riesgo de solo 0,001 de sobrepasar un error de 5 Kg. o más en la estimación? La desviación típica de la resistencia de este tipo de barras se estima en 25 Kg. Aplicación de lo aprendido En base al proyecto de descriptiva identifica un problema para resolver aplicando lo aprendido en la unidad, encuentra la solución óptima e interpreta los resultados obtenidos. Exponer y presentar en el proyecto final de la materia. MUESTREO En la unidad uno se definió lo que se denomina POBLACIÓN y lo que se llama MUESTRA, ahora vamos a determinar las razones por las cuales se realiza el muestreo: Probar todo el producto es innecesario y destructivo. El tiempo es un factor importante, no se dispone en abundancia de él. ESTADISTICAS Y PARAMETROS Matemáticamente, podemos describir muestras y poblaciones al emplear mediciones como la media, la mediana, la moda, la desviación estándar, la varianza, que introdujimos en la unidad 1. Cuando estos términos describen las características de una muestra se denominan ESTADISTICOS y cuando estos términos describen una población se llaman PARAMETROS. NOMENCLATURA POBLACION N, µ, MUESTRA n, x, s CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 117 DISTRIBUCIONES DE MUESTREO Si aplicamos lo aprendido y tomamos varias muestras de una población, los estadísticos que calcularíamos no necesariamente serían iguales y lo más probable es que variarían de una muestra a otra. POBLACION N, µ, MUESTRA1 MUESTRA2 MUESTRAi n1, x1, s1 n2, x2, s2 ni, xi, si Es posible analizar los estadísticos de las muestras y así obtener lo que se denomina una distribución de muestreo. Si se analizan las medias de las muestras se tiene una distribución de muestreo de medias. Si se analizan proporciones se tiene una distribución de muestreo de proporciones. Se pueden obtener otras distribuciones de muestreo. MUESTREO DE MEDIAS Ver cuadro de abajo MUESTREO DE PROPORCIONES Ver cuadro TIPO DE POBLACION INFINITA POBLACION FINITA PROBLEMA DESCONOCIDA CONOCIDA Distribución muestral de medias x - z σ z n es conocida x - n medias x - s Distribución muestral de proporciones t n es desconocida z x - de libertas Nn N -1 σ n son n -1 ^ ^ p - P Los grados t Nn N -1 σ Distribución muestral de OBS. z P (1 - P) n CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP p - P P (1 - P) n Nn N -1 ^ p x n 118 METODOS PARA RECOLECTAR UNA MUESTRA Existen dos tipos de muestreo: Muestreo no probabilístico Muestreo probabilístico o aleatorio Este tipo de muestreo se puede realizar de 4 formas: Muestreo aleatorio simple Muestreo sistemático Muestreo estratificado Muestreo de racimo CÁLCULO DE UNA MUESTRA n z 2 / 2 2 E2 para variables cuantitativas y población infinita n z 2 / 2 pq E2 para variables cualitativas y población infinita Donde: = Tamaño de la muestra Z= se obtiene a partir del Nivel de confianza ( en Tablas) p= Éxito q= Fracaso Parámetros de cálculo Normales 1) Nivel de Confianza “Z” Se lo busca en tablas, en función a lo que se quiere obtener. Ej.: Nivel de confianza 95% = 0.95 Para llevar a la tabla se divide entre 2 1 0.95 0.975 Este valor se busca en Tabla en forma inversa y => Z=1.96 2 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 119 EJEMPLO Un sindicato de 1000 afiliados debe renovar su directorio. Determinar el tamaño de la muestra para estimar la proporción que apoyara al candidato A, con una confianza del 90%. Se realiza una prueba piloto con 20 afiliados elegidos aleatoriamente y se encuentra en esta muestra que 8 apoyaran al candidato A. suponer un error del 5% De la prueba piloto: p 8 20 p=0.4 y q= 0.6 E= 5 % ; 0.05 1 0.9 ; 0.1 0.1 0.05 2 De tabla: 0.4495 1.64 0.4500 z=1.645 0.4505 1.65 n n z 2 / 2 pq E2 1.6452 * 0.4 * 0.6 259.78 0.052 260 (se redondea al entero superior) VI. Aplicabilidad de la Guía La presente Guía MAAP se desarrolló en función del (los) documento(s): Detalle Programa(s) Analítico(s) BMA-301 ESTADISTICA EMPRESARIAL P2E1 CODIGO: PO-PRE-102-1 - VER: 3 - VIGENTE: 19-05-2016 UTEPSA – Guía MAAP 120