FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS RED NACIONAL UNIVERSITARIA FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS CARRERA DE ADMINISTRACION DE EMPRESAS TERCER SEMESTRE SYLLABUS DE LA ASIGNATURA ESTADÍSTICA I Autor: Ing. Esther Guisela Veizaga G. Gestión Académica I/2007 U N I V E R S I D A D D E A Q U I N O B O L I V I A 1 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS VISION DE LA UNIVERSIDAD Ser la Universidad líder en calidad educativa. MISION DE LA UNIVERSIDAD Desarrollar la Educación Superior Universitaria con calidad y competitividad al servicio de la sociedad. Estimado (a) alumno (a): La Universidad de Aquino Bolivia te brinda a través del syllabus , la oportunidad de contar con una compilación de materiales que te serán de mucha utilidad en el desarrollo de la asignatura . Consérvalo y aplícalo según las instrucciones del docente . U N I V E R S I D A D D E A Q U I N O B O L I V I A 2 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS SYLLABUS Asignatura: ESTADISTICA I Código: MAT-04 Requisito: MAT-03 Carga Horaria: Créditos: 80 horas 8 I. OBJETIVOS GENERALES DE LA ASIGNATURA. El principal objetivo de esta materia es proporcionar al estudiante las herramientas técnicas necesarias para desarrollar investigaciones en los campos de las ciencias económicas, administrativas y sociales. Al final del curso el estudiante será capaz de: Comprender la utilidad de la estadística Reconocer los diversos tipos de datos Valorar la importancia de las muestras Distinguir los diferentes tipos de variables Levantar y clasificar la información Utilizar los estadígrafos de tendencia central Manejar los estadígrafos de dispersión Aplicar los números índices a datos reales Realizar análisis de regresión y correlación II. PROGRAMA ANALITICO DE LA ASIGNATURA. UNIDAD I TEMA 1. INTRODUCCION A LA ESTADISTICA 1.1. INTRODUCCIÓN 1.2. RAMAS DE LA ESTADÍSTICA 1.3. FUENTES DE INFORMACIÓN 1.4. FINALIDAD DE LA ESTADÍSTICA 1.5. CONCEPTOS Y VARIABLES 1.6. PREPARACIÓN DE INVESTIGACIONES ESTADÍSTICA 1.7. DISTRIBUCIÓN DE FRECUENCIAS TEMA 2. RECOLECCION Y REPRESENTACION DE LA INFORMACION 2.1. RECOLECCIÓN Y ORGANIZACIÓN DE DATOS 2.1.1 CRITICA Y CODIFICACIÓN 2.1.2 TABULACIÓN O PROCESAMIENTO U N I V E R S I D A D D E A Q U I N O B O L I V I A 3 FACULTAD DE CIENCIAS 2.1.3 ANALISIS E INTERPRETACIÓN 2.1.4 PUBLICACIÓN ECONÓMICAS Y FINANCIERAS TEMA 3. AGRUPACION DE DATOS 3.1. DATOS AGRUPADOS 3.2. ATOS AGRUPADOS 3.3. DISTRIBUCIONES DE FRECUENCIAS 3.4. REPRESENTACIONES GRÁFICAS UNIDAD II TEMA 4. ESTADÍGRAFOS DE POSICIÓN CENTRAL. 4.1. INTRODUCCIÓN 4.2. MEDIA ARITMÉTICA Y SUS PROPIEDADES. 4.3. LA MEDIANA. 4.4. LA MODA Y VALOR MODAL. 4.5. OTRAS MEDIDAS DE TENDENCIA CENTRAL 4.6. RELACIONES ENTRE LAS MEDIDAS DE TENDENCIA CENTRAL. TEMA 5. ESTADÍGRAFOS DE POSICIÓN NO CENTRAL. 5.1. CUARTILES 5.2. DECILES 5.3. PERCENTILES. TEMA 6. ESTADÍGRAFOS DE DISPERSIÓN. 6.1. INTRODUCCIÓN 6.2. VARIANZA. 6.3. DESVIACIÓN MEDIA. 6.4. DESVIO ESTÁNDAR 6.5. DESVIACIÓN RELATIVA. UNIDAD III TEMA 7. DISTRIBUCIONES BIDIMENSIONALES. 7.1. INTRODUCCIÓN. 7.2. TABLAS ESTADÍSTICAS BIDIMENSIONALES. 7.3. FRECUENCIAS ABSOLUTAS Y RELATIVAS BIDIMENSIONALES. 7.4. DISTRIBUCIONES MARGINALES. 7.5. DISTRIBUCIONES CONDICIONALES. TEMA 8. REGRESIÓN Y PREDICCIÓN. 8.1. DIAGRAMA DE DISPERSIÓN. 8.2. CORRELACIÓN LINEAL. U N I V E R S I D A D D E A Q U I N O B O L I V I A 4 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS 8.3. REGRESIÓN LINEAL SIMPLE. 8.4. MÉTODO DE LOS MÍNIMOS CUADRADOS. 8.5. ANÁLISIS DE RESULTADOS. 8.6. PREDICCIÓN. 8.7. PROBLEMAS DE REGRESIÓN LINEAL III. ACTIVIDADES PROPUESTAS PARA LAS BRIGADAS UDABOL Las Brigadas están destinadas a incidir de manera significativa en la formación profesional integral de nuestros estudiantes y revelan las enormes potencialidades que presenta esta modalidad de la educación superior no solamente para que conozcan a fondo la realidad del país y se formen de manera integral, sino, además, para que incorporen a su preparación académica los problemas de la vida real a los que resulta imperativo encontrar soluciones desde el campo profesional en el que cada uno se desempeñará. El trabajo de las Brigadas permite que nuestros estudiantes se conviertan a mediano plazo en verdaderos investigadores, capaces de elaborar y acometer proyectos de desarrollo comunitario a la vez que se acostumbren a trabajar en equipos interdisciplinarios o multidisciplinarios como corresponde al desarrollo alcanzado por la ciencia y la tecnología en los tiempos actuales. La ejecución de diferentes programas de interacción social y la elaboración e implementación de proyectos de desarrollo comunitario derivados de dichos programas confiere a los estudiantes, quienes son, sin dudas, los más beneficiados con esta iniciativa, la posibilidad de: - Desarrollar sus prácticas pre-profesionales en condiciones reales y tutorados por sus docentes con procesos académicos de enseñanza y aprendizaje de verdadera “aula abierta”- - Trabajar en equipos, habituándose a ser parte integral de un todo que funciona como unidad, desarrollando un lenguaje común, criterios y opiniones comunes y planteándose metas y objetivos comunes para dar soluciones en común a los problemas. - Realizar investigaciones multidisciplinarias en un momento histórico en que la ciencia atraviesa una etapa de diferenciación y en que los avances tecnológicos conllevan la aparición de nuevas y más delimitadas especialidades. - Desarrollar una mentalidad, crítica y solidaria, con plena conciencia de nuestra realidad nacional. U N I V E R S I D A D D E A Q U I N O B O L I V I A 5 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS ACTIVIDADES A REALIZAR VINCULADAS CON LOS CONTENIDOS DE LA MATERIA TAREAS PROPUESTAS Diseño y levantamiento de la información sobre el envío de remesas del exterior. Tabulación y procesamiento de la información sobre el flujo de remesas Ajustes del contenido metodológico y verificación de la información . Manuales de procesamiento de la información Calculo de estadígrafos dispersión, distribuciones predicciones TEMA(S) CON LOS QUE SE RELACIONA Tema I: 1.1 – 1.2 – 1.3 – 1.4 – 1.5 Tema II: 2.1 – 2.2 – 2.3 – 2.4 Tema III: 3.1 – 3.2 – 3.3 – 3.4 – 3.5 – 3.6 Tema I Tema II Tema III Todas la Unidades. LUGAR DE ACCIÓN FECHA PREVISTA Entidades financieras y hogares particulares de 28/03/07 la ciudad santa cruz. Laboratorio S.P.S.S. 18/04/07 I.N.E. 16/05/07 I.N.E. 06/06/07 de Tema IV y Tema V Tema VI I.N.E. Trabajo grupal Laboratorio 20/06/07 IV. EVALUACIÓN DE LA ASIGNATURA PROCESUAL O FORMATIVA Durante el semestre los alumnos realizarán preguntas escritas, orales, revisiones bibliográficas y otras actividades de aula; cada una de las participaciones en los trabajos de brigadas realizados en las áreas urbanas y rurales serán evaluadas, independientemente de la cantidad, entre 0 y 50 puntos. DE RESULTADOS DE LOS PROCESOS DE APRENDIZAJE O SUMATIVA (examen parcial y final) Se realizarán 2 controles parciales teórico-prácticos y un examen final V. BIBLIOGRAFIA BIBLIOGRAFIA BASICA. Moya, Rufino ,”Probabilidad e inferencia estadística” Sig. Top. 519.5 M87 Canavos, George ,”Probabilidad y estadistica: aplicaciones y métodos” Sig. Top. 519.5 C16 Bernan, G. “Problemas y ejercicios de análisis matemático” Sig. Top. 515 B45s BIBLIOGRAFIA COMPLEMENTARIA. KAZMIER, J, “Estadística aplicada a la Administración y Economía”, Editorial McGraw Hill, México, 1996. SPIEGEL, M. R., “Estadística”, Editorial McGraw Hill, Segunda Edición, 1990. U N I V E R S I D A D D E A Q U I N O B O L I V I A 6 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS VI. CONTROL DE EVALUACIONES 1° evaluación parcial Fecha Nota 2° evaluación parcial Fecha Nota Examen final Fecha Nota APUNTES U N I V E R S I D A D D E A Q U I N O B O L I V I A 7 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS VII. PLAN CALENDARIO SEMANA ACTIVIDADES ACADÉMICAS 22 al 27 de Enero Avance de materia 1ra. 2da. 3ra. U N 29de Enero al 3 de Febrero avance materia Avance de materia 5 al 10 de Febrero Avance de materia OBSERVACIONES TEMA 1 TEMA 1 TEMA 2 4ta. 12 al 17 de Febrero Avance de materia TEMA 2 5ta. 21 al 24 de Febrero Avance de materia TEMA 3 6ta. 26 de Febrero al 3 de Marzo Avance materia TEMA 3 7ma. 5 al 10 de Marzo Avance de materia TEMA 4 8va. 12 al 17 de Marzo Avance de materia Primera Evaluación 9na. 18 al 23 de Septiembre Avance de materia Primera Evaluación 10ma. 26 al 31 de Marzo Avance de materia TEMA 4 11ra. 2 al 7 de Abril Avance de materia TEMA 5 12da. 9 al 14 de Abril Avance de materia TEMA 5 13ra. 16 al 21 de Abril Avance de materia TEMA 6 14ta. 23 al 28 de Abril Avance de materia Segunda Evaluación 15ta. 30 de Abril al 5 de Mayo Avance de materia Segunda Evaluación 16ta. 7 al 12 de Mayo Avance de materia TEMA 7 17ta. 14 al 19 de Mayo Avance de materia TEMA 7 18va. 21 al 26 de Mayo Avance de materia TEMA 8 19na. 28 de Mayo al 2de Junio Avance de materia TEMA 8 20na. 4 al 9 de Junio Avance de materia Evaluación Final Presentación de Notas 21na. 11 al 16 de Junio Avance de materia Evaluación Final Presentación de Notas 22na. 18 al 23 de Junio Avance de materia Cierre de Gestión 2da. Instancia Presentación de Notas I D A D A Q B O I V E R S D E U I N O Presentación de Notas Presentación de Notas L I V I A 8 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS VIII. WORK PAPER´S PROGRAMA DE CONTROL DE CALIDAD WORK PAPER # 1 UNIDAD O TEMA: INTRODUCCION A LA ESTADISTICA TITULO: INTRODUCCION A LA ESTADISTICA FECHA DE ENTREGA: Marzo 2007 PERIODO DE EVALUACION: PRIMER PARCIAL TEMA 1. INTRODUCCION A LA ESTADISTICA 1.1 INTRODUCCION Estadística: es la ciencia que trata de la recolección, organización, análisis y descripción numérica de la información. Tambien estudia el comportamiento de los fenómenos de grupo, deduce y evalúa conclusiones 1.2 RAMAS DE LA ESTADISTICA La estadística para su estudio se divide en dos ramas: a) Deductiva o Descriptiva: Es la rama de la estadística que trata con la organización, el resumen y la presentación de los datos; la finalidad es colocar en evidencia aspectos característicos que sirven para efectuar comparaciones sin llegar a conclusiones de tipo mas general b) Inductiva o Inferencial: Se sirve de los resultados de la estadística descriptiva, para usar técnicas por medio de las cuales se llegan a conclusiones sobre una población estadística basada en una muestra. La Estadística Descriptiva Analítica es un conjunto sistemático de procedimientos para observar y describir numéricamente el fenómeno y descubrir las leyes que regulan la aparición, transformación y desaparición del mismo. 1.3 FUENTES DE INFORMACION Fuentes Primarias: Son datos obtenidos por encuesta directa mediante el uso de cuestionarios, o como resultados de la observación directa. Son datos publicados por quien recoge directamente de la fuente de información primaria. Fuentes Secundarias: Los datos se obtienen de publicaciones, las cuales pueden ser reproducidas totales o parciales U N I V E R S I D A D D E A Q U I N O B O L I V I A 9 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS Series Temporales: Son las obtenidas y ordenadas en forma cronológica, siendo resultado de investigaciones y observaciones periódicas Internas: Se forman de los registros internos de una empresa Externas : Son registros originados fuera de la empresa 1.4 FINALIDAD DE LA ESTADISTICA Conocer la realidad de una observación o fenómeno Determinar lo típico o normal de esa observación Determinar los cambios que presenta el fenómeno Relacionar dos o mas fenómenos Determinar las causas que originan el fenómeno Hacer estimativas sobre el comportamiento futuro del fenómeno Obtener conclusiones de un grupo menor (muestra) para hacerlas extensivas a un grupo mayor (población) 1.5 Determinar el grado de validez y confiabilidad de las predicciones o conclusiones CONCEPTOS Y VARIABLES: Población: Recuento de todos los elementos que presentan una característica común y acerca de los cuales intentamos establecer conclusiones. Marco: Se denomina a la lista, mapa o cualquier otro material aceptable, que contenga todas las unidades perfectamente identificadas y actualizadas de la cual se selecciona la muestra Investigación Total Toma en cuenta la totalidad de los elementos o unidades que conforman la población objeto de estudio Muestra: Es una colección de algunos de los elementos que componen una población. Parámetro: Describen numéricamente la característica de una población Tamaño muestral: Es le número de elementos u observaciones que tomamos. Se denota por n ó N. Dato: Cada uno de los individuos, cosas, entes abstractos que integran una población o universo determinado. Dicho de otra forma, cada valor observado de la variable. U N I V E R S I D A D D E A Q U I N O B O L I V I A 10 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS Estadigrafo: Es la descripción numérica de una característica correspondiente a los elementos de la muestra Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales). Las variables también se pueden clasificar en: Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase). Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase). Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas: Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Continuas: pueden tomar cualquier valor real dentro de un intervalo X = (X1, X2 , X3 , ...... 1.6 , XK-2 , XK-1, XK ) PREPARACION DE INVESTIGACIONES ESTADISTICAS El proceso de investigación estadística presenta 6 fases: 1. Planeamiento y Preparación: Contempla los siguientes aspectos: Objeto de la investigación Finalidad Fuente de información Procedimientos Material El costo y su financiación a) Contenido del formulario encuesta: Encabezamiento Cuerpo Observaciones Instrucciones U N I V E R S I D A D D E A Q U I N O B O L I V I A 11 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS Fecha de envío a la entidad que recoge los datos Firma del investigador o agente b) Redacción del formulario: Debe estar limitado a las preguntas esenciales para los fines de la investigación y que puedan obtenerse de la fuente informativa Debe prescindir de preguntas indiscretas que levante suspicacia y temores o que moleste al investigado Debe ser claro, comprensible admitir una sola interpretación Las preguntas deben ser cerradas Evitar juicios personales 2. Recolección 3. Critica y codificación 4. Procesamiento 5. Analisis e interpretación 6. Publicación 1.7 DISTRIBUCIONES DE FRECUENCIA a) Frecuencia absoluta: Llamaremos así al número de repeticiones que presenta una observación. Se representa por n i. b) Frecuencia relativa: Es la frecuencia absoluta dividida por el número total de datos, se suele expresar en tanto por uno, siendo su valor -iésimo fi ni n La suma de todas las frecuencias relativas, siempre debe ser igual a la unidad. c) Frecuencia absoluta acumulada: Es la suma de los distintos valores de la frecuencia absoluta tomando como referencia un individuo dado. La última frecuencia absoluta acumulada es igual al nº de casos: N1 = n1 N2 = n1+ n2 Nn = n1 + n2 + . . . . . . + nn-1 + nn=n d) Frecuencia relativa acumulada: Es el resultado de dividir cada frecuencia absoluta acumulada por el número total de datos, se la suele representar con la notación: Fi U N I V E R S I D A D D E A Q U I N O B O L I V I A 12 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS CUESTIONARIO 1. Desarrolle 3 definiciones de diferentes autores sobre el concepto de estadística 2. Cuales son las ramas de la estadística 3. Mediante ejemplos explicar la diferencia entre la estadística descriptiva y la estadística inductiva 4. Porque es útil la estadística en su carrera de estudio 5. Dar 3 ejemplos de fenómenos que no son considerados dentro del campo de la estadística 6. Desarrolle la finalidad general y especifica de una situación problema 7. Plantee las variables y parámetros que se consideran en el ejemplo anterior (6) PROGRAMA DE CONTROL DE CALIDAD WORK PAPER # 2 UNIDAD O TEMA: RECOLECCION Y REPRESENTACION DE LA INFORMACION TITULO: RECOLECCION Y REPRESENTACION DE LA INFORMACION FECHA DE ENTREGA: Marzo 2007 PERIODO DE EVALUACION: PRIMER PARCIAL TEMA 2. RECOLECCION Y REPRESENTACION DE LA INFORMACION 2.1 RECOLECCIÓN Y ORGANIZACIÓN DE DATOS Consiste en el conjunto de operaciones de observación y anotación o registro de los hechos en los formularios destinados para este efecto. Comprende las siguientes etapas: Distribución del material o instrumento de recolección Recolección propiamente dicha Control del numero de formularios recolectados Control sobre la calidad de las informaciones recogidas 2.1.1 CRITICA Y CODIFICACIÓN El objeto es clasificar el material primario que procede de la misma investigación, en tres grupos: material bueno, material incorrecto pero corregible y material incorregible o desechable 2.1.2 TABULACIÓN O PROCESAMIENTO Puede ser manual o mecánica y su elección dependerá de : La cantidad de formularios que se van a utilizar El numero de preguntas que tenga el formulario Del tiempo y los recursos ya sean financieros o equipos disponibles U N I V E R S I D A D D E A Q U I N O B O L I V I A 13 FACULTAD DE CIENCIAS 2.1.3 ECONÓMICAS Y FINANCIERAS ANÁLISIS E INTERPRETACIÓN Encierra dos aspectos: a) Análisis y evaluación estadística de los resultados b) Análisis y evaluación técnica de acuerdo con la naturaleza de la investigación 2.1.4 PUBLICACIÓN Un informe deberá contener: a) Indice b) Planteamiento del problema c) Objetivo de la investigación d) Hipótesis que se quieren probar e) Breve exposición de la metodología adoptada f) Se podrá incluir copia del formulario de encuesta g) Descripción de los resultados en forma de gráficos acompañados de su análisis h) Conclusiones y recomendaciones CUESTIONARIO 1. Que tipos de gráficos conoce 2. Como se organizan los datos 3. En una industria el informe de contabilidad muestra que la producción fue de $62.600.000 y los gastos así: de administración $11.160.000, de materiales y energéticos $15.650.000, salarios y prestaciones $18.780.000. Elabore con los datos un diagrama circular, un diagrama de barras y un histograma U N I V E R S I D A D D E A Q U I N O B O L I V I A 14 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS PROGRAMA DE CONTROL DE CALIDAD WORK PAPER # 3 UNIDAD O TEMA: AGRUPACION DE DATOS TITULO: RECOLECCION Y REPRESENTACION DE LA INFORMACION FECHA DE ENTREGA: Abril 2007 PERIODO DE EVALUACION: PRIMER PARCIAL TEMA 3. AGRUPACION DE DATOS Hay muchas maneras de clasificar los datos , podemos simplemente reunirlos y conservarlos en orden. Si las observaciones se miden en números, también podemos listar los puntos de datos por orden ascendente de valor numérico; pero si los datos son trabajadores calificados ( carpinteros, albañiles o electricistas) que se necesitan en sitios de construcción, si son diferentes tipos de automóviles fabricados por todas las empresas automotrices, o si son los diversos colores de abrigos fabricados por determinada compañía, necesitaremos organizarlos de modo diferente: tendremos que presentar los puntos graficados de datos por orden alfabético o por algún otro principio organizador, una forma útil de hacerlo consiste en dividir los datos en categorías o clases similares y luego contar el número de observaciones que caen dentro de cada categoría; conexión a la colección de datos la pondremos como: 3.1 DATOS NO AGRUPADOS: Son datos no agrupados cuando se consideran y analizan todos los valores observados tal como se obtuvieron. Es conveniente y mas sencillo trabajar a estos datos como no agrupados cuando la muestra no es muy grande. De preferencia que sea una cantidad menor de 30 datos. También resulta conveniente trabajarlos así cuando se quiere que el peso de cada observación se ve reflejado en el resumen de los datos. Ventajas: Resulta más fácil y rápido trabajar con los datos no agrupados. Desventajas: Solo se puede aplicar en pequeñas cantidades de datos, ya que en grandes cantidades resultaría un tanto tedioso y por lo mismo existiría más probabilidad de equivocarse. U N I V E R S I D A D D E A Q U I N O B O L I V I A 15 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS 3.2 DATOS AGRUPADOS: Son datos que están organizados (formando grupos). Podemos formar más o menos grupos, dependiendo de que tan exacto queramos trabajar, a cada grupo le llamamos clase. Rara vez se emplean menos de seis clases o más de quince. Ventajas: • Facilidad y rapidez al manejo de datos. • Se notan rápidamente el valor mayor y el valor menor de los datos • Se puede dividir fácilmente los datos en secciones. • Se puede observar si algún valor aparece mas de una vez en el ordenamiento. • Se observa la distancia entre los valores sucesivos de los datos. 3.3 DISTRIBUCION DE FRECUENCIAS Frecuencia absoluta: Llamaremos así al número de repeticiones que presenta una observación. Se representa por n i. Frecuencia relativa: Es la frecuencia absoluta dividida por el número total de datos, se suele expresar en tanto por uno, siendo su valor -iésimo fi ni n La suma de todas las frecuencias relativas, siempre debe ser igual a la unidad. Frecuencia absoluta acumulada: Es la suma de los distintos valores de la frecuencia absoluta tomando como referencia un individuo dado. La última frecuencia absoluta acumulada es igual al nº de casos: N1 = n1 N2 = n1+ n2 Nn = n1 + n2 + . . . . . . + nn-1 + nn=n Frecuencia relativa acumulada: Es el resultado de dividir cada frecuencia absoluta acumulada por el número total de datos, se la suele representar con la notación: Fi De igual forma, también se puede definir a partir de la frecuencia relativa, como suma de los distintos valores de la frecuencia relativa, tomando como referencia un individuo dado. La última frecuencia relativa acumulada es igual a la unidad. ELABORACION DE UNA TABLA DE FRECUENCIAS: U N I V E R S I D A D D E A Q U I N O B O L I V I A 16 FACULTAD DE CIENCIAS Horas de estudio 8-12 13-17 18-22 23-27 28-32 33-37 TOTAL ECONÓMICAS Y FINANCIERAS Frecuencia, f Frecuencia relativa F 1 12 10 5 1 1 30 1/30=.0333 12/30=.400 10/30=.333 5/30=.1667 1/30=.0333 1/30=.0333 30/30=1 Frecuencia acumulada 1 13 23 28 29 30 3.4 REPRESENTACIONES GRÁFICAS Para apreciar a golpe de vista la magnitud o posición de las variables, se suelen efectuar una representación gráfica, los sistemas de gráficos más usuales son: a) DIAGRAMA DE SECTORES (TORTAS): El área de cada sector es proporcional a la frecuencia que se quiera representar, sea absoluta o relativa. x5 x1 x4 x2 x3 Este diagrama se utiliza para cualquier tipo de variable b) DIAGRAMA DE BARRAS: Se utiliza para frecuencias absolutas o relativas, acumuladas o no, de una variable discreta. en el eje de abscisas, situaremos los diferentes valores de la variable. en el eje de ordenadas la frecuencia. levantaremos barras o columnas separadas de altura correspondiente a la frecuencia adecuada. 8 6 ni 4 2 0 x1 x2 x3 x4 x5 variable U N I V E R S I D A D D E A Q U I N O B O L I V I A 17 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS c) HISTOGRAMA: Igual que el anterior en cuanto al tipo de frecuencias que se pueden utilizar. La diferencia : es para variables continuas. si la amplitud del intervalo es la misma, elevaremos columnas unidas, a altura la frecuencia correspondiente. Si la amplitud del intervalo es diferente, el área del rectángulo columna será proporcional a la frecuencia representada. d) DIAGRAMA DE ESCALERA: Se utiliza para frecuencias acumuladas. 25 20 15 10 5 0 x1 x2 x3 x4 x5 e) POLÍGONO DE FRECUENCIAS: Es la recta que une los extremos de las variables de una distribución, un ejemplo clásico es el de la evolución de la temperatura de un paciente En el primer caso: variable discreta utilizaremos sin no piden nada concreto, el diagrama de barras cuando se refiera a la representación gráfica de la frecuencia absoluta (ni) 8 6 4 2 0 x1 U N I V E R S I D A D D E x2 x3 x4 A Q U I N O x5 B O L I V I A 18 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS En cambio cuando nos estemos refiriendo a la frecuencia absoluta acumulada optaremos por el diagrama de escalera 25 20 15 10 5 0 x1 x2 x3 x4 x5 En el caso de la variable continua, optaremos por el histograma para las frecuencias absolutas y por el polígono de frecuencias en el caso de la frecuencia acumulada. CUESTIONARIO 1. Que tipos de gráficos conoce 2. Como se organizan los datos 3. En una cierta ciudad se ha tomado una muestra representativa del total de familias que en ella viven y se ha anotado el número de hijos de cada una. Los valores de esta variable son los siguientes: 0 1 0 4 2 2 1 2 3 2 3 2 1 3 4 2 2 3 2 1 a) Explique que tipo de datos son estos. b) Construya una tabla de frecuencias correspondiente a este ejercicio. c) Grafique tres tipos de gráficas U N I V E R S I D A D D E A Q U I N O B O L I V I A 19 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS PROGRAMA DE CONTROL DE CALIDAD WORK PAPER # 4 UNIDAD O TEMA: ESTADIGRAFOS DE POSICION CENTRAL TITULO: ESTADIGRAFOS DE POSICION CENTRAL FECHA DE ENTREGA: Abril 2007 PERIODO DE EVALUACION: SEGUNDO PARCIAL TEMA 4. ESTADÍGRAFOS DE POSICIÓN CENTRAL. 4.1 INTRODUCCIÓN Las medidas de tendencia central son valores promedio que reflejan la tendencia de los datos a concentrarse en torno a un valor central o de posición representativa del conjunto de datos ordenados. Las tres medidas de tendencia central que más comúnmente se emplean son: la media, la mediana y la moda. 4.2 MEDIA ARITMÉTICA Y SUS PROPIEDADES. a) MEDIA ARITMÉTICA SIMPLE: Es la suma de todos los valores de dicha variable dividido por el numero de valores X1 + X2 + ....Xn X= n b) MEDIA ARITMÉTICA PONDERADA Es la suma ponderada de todas las modalidades de la variable por sus respectivas frecuencias relativas Ejemplo: Si el examen final de un curso cuenta tres veces más que una evaluación parcial, y un estudiante tiene calificación 85 en el examen final y 70 y 90 en los dos parciales, la calificación media es: U N I V E R S I D A D D E A Q U I N O B O L I V I A 20 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS PROPIEDADES: La suma algebraica de las desviaciones de un conjunto de números respecto de su media aritmética es cero. La suma de los cuadrados de las desviaciones de un conjunto es mínima cuando dichas desviaciones se toman respecto a la media aritmética La media aritmética de una constante por una variable es igual al producto de la constante por la media aritmética de la variable La media aritmética de una constante mas una variable es igual a la constante mas la media aritmética de la variable 4.3 LA MEDIANA. Es aquel valor de la variable estadística que divide en dos efectivos iguales a los datos supuestos ordenados por valor creciente. Deja el 50% de las observaciones a la izquierda y el otro 50% a la derecha. Me = xi / Fi = 0’5 4.3.1 CASO NO AGRUPADO EN INTERVALOS. a) CON n IMPAR: Ejemplo: 2, 6, 3, 10, 7,4,11,8,10 2, 3, 4, 6, 7, 8, 10, 10, 11 n=9 Me = x(5) = x(10/2) b) CON n PAR: Ejemplo: 6, 2, 10, 7, 4, 11,8,10 n=8 2, 4, 6, 7, 8, 10, 10, 11 Me = 7’5 4.3.2 CASO TABLA DE FRECUENCIAS AGRUPADA. Ej: Edad ni Ni Fi 3 8 8 0’11 4 10 18 0’26 7 9 27 0’39 U N I V E R S I D A D D E A Q U I N O B O L I V I A 21 FACULTAD DE CIENCIAS 9 8 35 0’5 15 20 55 0’79 25 10 65 0’93 40 5 70 1 ECONÓMICAS Y FINANCIERAS La Me pertenece a Me Î (ei-1, ei] º intervalo mediano. 4.4 LA MODA Y VALOR MODAL. La moda de una variable estadística es el valor/es que tiene/n asociada la frecuencia máxima, puede no existir e incluso no ser única en caso de existir Determinar la moda del siguiente conjunto de datos: a) 1, 2, 3, 3, 4 , 5, 6, 7, 7, 3, 1, 9, 3 La moda de este conjunto de datos es igual a 3 y si considera unimodal MODA PARA DATOS AGRUPADOS Para determinar la moda de datos agrupados en clases de igual tamaño su cálculo se puede realizar de la siguiente forma: Donde: U N I V E R S I D A D D E A Q U I N O B O L I V I A 22 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS En ocasiones la expresión para el cálculo de la moda suele presentarse de la siguiente forma Ejemplo: Determinar a partir de la tabla presentada, en el ejemplo de la media, cual es la moda: TABLA DE FRECUENCIAS REPORTADAS POR LA CLÍNICA Clases (Datos en años) Punto medio de cada clase Frecuencias de cada clase 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70 70 – 80 15 25 35 45 55 65 75 8 20 14 8 2 2 1 55 enfermos atendidos Identificamos que: U N I V E R S I D A D D E A Q U I N O B O L I V I A 23 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS Sustituyendo tenemos: 4.5 OTRAS MEDIDAS DE TENDENCIA CENTRAL. 4.5.1 MEDIA GEOMETRICA: La media geométrica de dos números X1, X2, es igual a la raíz cuadrada de su producto n Mo = V x1x2 Ventajas: Se define rígidamente por una formula matemática Se utiliza cuando se quiere dar importancia a valores pequeños de la variable Es sensible a cualquier cambio en los valores de distribución Su valor no es muy influenciable por los datos extremos Es indispensable cuando se requiere sacar el promedio de una serie de valores que estan en progresión geométrica o aproximadamente geométrica Su resultado puede ser usado en trabajos estadísticos posteriores Desventajas: Complicación de su calculo Si cualquier dato de la serie original es 0, el promedio geométrico toma el valor de 0 4.5.2 MEDIA ARMONICA: Es otro estadigrafo de posición y su símbolo M_1 o Mn Dada una serie de datos X1, X2 X3.........Xn, el inverso de la armónica de la variable X es igual a la media aritmética del inverso de los valores de la variable n M_1 = 1 X1 Ventajas: Se usa preferencialmente para calcular la velocidad media De gran utilidad cuando la variable esta dada en forma de tasa U N I V E R S I D A D D E A Q U I N O B O L I V I A 24 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS Con las relaciones formadas por una constante y una variable, si queremos tomar un promedio de tales relaciones, se debe decidir si es mejor guardar constante en el promedio, el factor que es constante en la relación o el factor que es variable en ella Desventajas: Que un valor de la variable sea 0 El promedio armónico esta rígidamente definido por una formula matemática, su valor depende de cada uno de los datos de la distribución y el resultado no puede ser usado en cálculos posteriores. CUESTIONARIO 1. Defina los estadígrafos de posición central 2. Cual es la relación entre media , mediana y moda 3. Como determina la media cuadratica 4. Se sabe que la media aritmética de dos números es igual a 5 y la media geométrica de los mismos es igual a 4 ¿cuál es la media armónica? 5. Buscar la media, la mediana y la moda de los siguientes números: 25 15 28 29 25 26 21 26 <Use las fórmulas> 6. Buscar la media, la mediana y la moda de los siguientes números: 15 16 19 15 14 16 20 15 17 < No use las fórmulas 7. Se sabe que dos obreros gastan en la ejecución de un trabajo 50 y 40 minutos respectivamente ¿cuál es el tiempo requerido para hacerlo en conjunto? 8. Un grupo de 400 empleados, que tiene una compañía se dividen en operarios y técnicos con un saldo promedio de 260.950 $. Los salarios promedios para cada uno de los grupos son de 257.300 $ y 263.400 $ respectivamente Cuantos operarios y cuantos técnicos tiene la compañía Si el gerente establece una bonificación de 20.000 $ para los operarios y del 15% para los técnicos ¿cuál será el salario promedio para los 400 empleados de la compañía? 9. Se realiza una estadística en dos centros de enseñanza, uno público y otro privado, referente a la nota global del bachillerato de cada uno de los alumnos que van a acudir a los exámenes de selectividad. Las distribuciones de frecuencias son las siguientes: CENTRO PRIVADO Nota global de cada alumno U N I V E R S I D A D Frecuencias D E A Q U I N O B O L I V I A 25 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS 5.5 6.5 7.5 8.5 9.5 10 15 20 30 15 CENTRO PUBLICO Nota global de cada alumno 5 .6 6.7 7.9 9.10 Frecuencia 250 150 100 20 Se pide: a) A la vista de la tabla, te sugiere algún comentario de especial importancia. ¿Cuál es el motivo de que los datos se presente en dos tablas de diferente tipo ? b) Estudiar las diferentes medidas de tendencia central (promedios) en las dos distribuciones. En cada distribución ¿cuál te parece más representativo? ¿por qué? c) Hallar el porcentaje de alumnos que en cada centro tiene una nota global superior al 7. d) Hallar los Cuartiles primero y tercero de las dos distribuciones. e) Estudiar la representatividad de las medias obtenidas en las distribuciones por separado. ¿En cuál de las dos es más representativa? f) Dos alumnos pertenecientes el primero al centro privado y el segundo, al centro público, solicitan una beca para continuar sus estudios en la universidad mejicana de Acapulco. el primero tiene una nota global de un 8.5 y el otro de un 7. Si sólo se concede una beca ¿quién sería el candidato a obtenerla aplicando el criterio estadístico de la variable tipificada? U N I V E R S I D A D D E A Q U I N O B O L I V I A 26 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS PROGRAMA DE CONTROL DE CALIDAD WORK PAPER # 5 UNIDAD O TEMA: ESTADIGRAFOS DE POSICION NO CENTRAL TITULO: ESTADIGRAFOS DE POSICION NO CENTRAL FECHA DE ENTREGA: Mayo 2007 PERIODO DE EVALUACION: SEGUNDO PARCIAL TEMA 5. ESTADIGRAFOS DE POSICION NO CENTRAL. 5.1 INTRODUCCION Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: 5.2 CUARTILES Son 4 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados Primer cuartil (Q1): Aquel valor de una serie que supera al 25% de los datos y es superado por el 75% restante. Formula de Q1 para series de Datos Agrupados en Clase. Donde: posición de Q1, la cual se localiza en la primera frecuencia acumulada que la contenga, siendo la clase de Q1, la correspondiente a tal frecuencia acumulada. Li, faa, fi, Ic : idéntico a los conceptos vistos para Mediana pero referidos a la medida de la posición correspondiente. Segundo cuartil (Q2): Coincide, es idéntico o similar al valor de la Mediana (Q 2 = Md). Es decir, supera y es superado por el 50% de los valores de una Serie. Tercer cuartil (Q3): Aquel valor, termino o dato que supera al 75% y es superado por el 25% de los datos restantes de la Serie. 5.3 DECILES U N I V E R S I D A D D E A Q U I N O B O L I V I A 27 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS Son 10 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10 partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es superado por el 90% restante) 5.4 PERCENTILES Son 100 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados Primer Percentil (P1), Percentil 50 (P50) y Percentil 99 (P99). El primer percentil supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante. Formulas de P1, P50, P99 para series de Datos Agrupados en Clase. Cuestionario 1. Con los siguientes datos calcular el primer cuartil, tercer cuartil, sexto decil y percentilo 80 a) Variable discreta: Yj 2 4 6 8 10 12 14 b) nj 3 6 15 8 2 6 10 50 Nj 3 9 24 32 34 40 50 ---- Variable continua: U N I V E R S I D A D D E A Q U I N O B O L I V I A 28 FACULTAD DE CIENCIAS Yj-1 - Yj 3.1 – 8 8.1 – 13 13.1 – 18 18.1 – 23 23.1 – 28 28.1 – 33 ECONÓMICAS Y FINANCIERAS nj 14 15 8 6 7 10 60 Nj 14 29 37 43 50 60 -- PROGRAMA DE CONTROL DE CALIDAD WORK PAPER # 6 UNIDAD O TEMA: ESTADIGRAFOS DE DISPERSION TITULO: ESTADIGRAFOS DE DISPERSION FECHA DE ENTREGA: Mayo 2007 PERIODO DE EVALUACION: SEGUNDO PARCIAL TEMA 6. ESTADIGRAFOS DE DISPERSION. 6.1 INTRODUCCION Las medidas de dispersión indican si los valores están relativamente cercanos uno del otro o si se encuentran dispersos. Las medidas de dispersión más comunes son: rango (amplitud), desviación media, varianza, desviación estándar y coeficiente de variación. Todas estas medidas el rango toman la media como punto de referencia. En cada caso un valor cero indica que no hay dispersión y mientras mayor sea el valor de estas medidas es mayor la dispersión de los datos. 6.2 VARIANZA. Es el promedio del cuadrado de las desviaciones de los datos con respecto a la media. Es la media aritmética de los cuadrados de las desviaciones. Se denota por S2. Este valor cuantifica el grado de dispersión o separación de los valores de la distribución con respecto a la media aritmética. A mayor dispersión mayor valor de la varianza, a menor dispersión menor valor de la varianza. La fórmula para calcular la varianza es U N I V E R S I D A D D E A Q U I N O B O L I V I A 29 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS PROPIEDADES DE LA VARIANZA. 1) La varianza es siempre un valor positivo S2 > 0 2) Si a una variable se le suma o resta una constante, la varianza permanece igual. 3) Si una variable se le multiplica por una constante, la varianza cambia multiplicándose por la constante al cuadrado. 4) La varianza de una constante mas una variable es igual a la varianza de la variable 5) Para el calculo de la varianza de una muestra, cuando se esta trabajando con submuestras se aplica la siguiente formula: X1n1 + X2n2 X= n1 + n2 6.3 DESVIACIÓN MEDIA. Es la media de los valores absolutos de las desviaciones, y la denotaremos por d m. 6.4 DESVIACIÓN ESTANDAR Se designa como la varianza por la letra S y se define como la raíz de la varianza. S = + V s2 La desviación estándar es mas usada que la varianza. Una de sus utilidades es medir la concentración de los datos respecto a la media aritmética. 6.5 DESVIACIÓN RELATIVA. Las medidas de dispersión que se han estudiado anteriormente son medidas absolutas y se expresan en las mismas unidades con las que se mide la variable. Si se necesita comparar dos o más grupos de datos medidos con diferentes unidades, por lo general, no es posible la comparación utilizando la dispersión absoluta. Por ejemplo, una serie de precios en dólares con una serie de precios en pesos. Para estos casos se usa la dispersión relativa: Dispersión relativa = dispersión absoluta Media U N I V E R S I D A D D E A Q U I N O B O L I V I A 30 FACULTAD DE CIENCIAS 6.6 ECONÓMICAS Y FINANCIERAS COEFICIENTE DE VARIACIÓN Compara la variabilidad de dos series de datos para determinar la variación respecto a una base, sirve para determinar la confibilidad de la información S CV = d = * 100 Xm Donde: CV= coeficiente de variación S = varianza Xm = media 6.7 ASIMETRÍA DE PEARSON Es un coeficiente que sirve para ver como deben estrecharse los datos de una serie con otra Xm – Mo AP = S2 Donde: AP: asimetría de Pearson Xm : media Mo: moda S2: varianza CUESTIONARIO 1. Explique cada uno de los estadígrafos de dispersión 2. De una distribución unidimensional se sabe que la media aritmética es igual a 3.04 y que la media cuadrática e igual a 4.26. calcular la varianza y desvio estándar 3. Que es desviación media 4. Que es desviación relativa 5. Si en una distribución se tiene que la varianza calculada es de 4 horas ¿cuál es la varianza de esa misma distribución en minutos? 6. En un inventario realizado en la bodega de un almacén se encontraron 200 artículos que fueron importados a diferentes precios (en dólares) Xi fi 20,5 20 32,0 30 48,6 50 50,0 60 60,4 40 200 U N I V E R S I D A D D E A Q U I N O B O L I V I A 31 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS a) Calcular la desviación estándar. b) Calcular le desviación media. c) Calcular desviación relativa. 7. Para la media y la varianza de un conjunto se han hallado los valores 4 y 25 ¿calcular el coeficiente de variación? 8. Dado el conjunto: N ( 3, 4, 5, 5, 5 , 7, 7, 8, 8, 8, 8, 9, 10, 11 ) Calcular para datos agrupados (intervalos ) varianza, desvio estándar, coeficiente de variación y asimetría de pearson PROGRAMA DE CONTROL DE CALIDAD WORK PAPER # 7 UNIDAD O TEMA: DISTRIBUCIONES BIDIMENSIONALES TITULO: DISTRIBUCIONES BIDIMENSIONALES FECHA DE ENTREGA: Junio 2007 PERIODO DE EVALUACION: EVALUACIÓN FINAL TEMA 7 DISTRIBUCIONES BIDIMENSIONALES 7.1 INTRODUCCIÓN. En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una población. En el caso de dos (o más) variables estudiadas conjuntamente se habla de variable bidimensional (multidimensional ); si se trata de dos caracteres cualitativos, de par de atributos. Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempo dos variables de cada elemento de la población: por ejemplo: peso y altura de un grupo de estudiantes; superficie y precio de las viviendas de una ciudad; potencia y velocidad de una gama de coches deportivos. Para representar los datos obtenidos se utiliza una tabla de correlación 7.2 DISTRIBUCION DE FRECUENCIAS Una distribución de frecuencias es una herramienta estadística muy útil para organizar un grupo de observaciones. Distribución de frecuencias: Es una serie de datos agrupados en categorías, en las cuales se muestra el número de observaciones que contiene cada categoría. U N I V E R S I D A D D E A Q U I N O B O L I V I A 32 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS 7.3 DISTRIBUCIONES MARGINALES. Para distinguir las frecuencias de cada variable al estudiarlas aisladamente llamaremos frecuencias marginales a las de cada variable por separado. De esta forma tendríamos dos distribuciones unidimensionales a partir de las conjuntas. a) FRECUENCIA ABSOLUTA MARGINAL: Para la X (xi.) sería el número de veces que se repite el valor x i sin tener en cuenta los valores de Y, la representamos por ni. . Para la Y (y.j) sería el número de veces que se repite el valor yj sin tener en cuenta los valores de X, la representamos por n.j . b) FRECUENCIAS RELATIVAS MARGINALES: A partir de las anteriores, y del mismo modo se construirían estas frecuencias. fi. y f.j. La distribución de frecuencias marginales pueden colocarse en una tabla separadamente como lo hacíamos en el tema anterior. Pero si deseamos tener toda la información en una misma tabla lo que se suele hacer es colocar: En la última columna de la tabla conjunta, las frecuencias marginales de X es decir, n i., añadiendo tantas columnas como otros tipos de frecuencias marginales se deseen añadir. 7.4 DISTRIBUCIONES CONDICIONALES. A partir de la distribución de frecuencias conjuntas podemos definir otro tipo de distribuciones unidimensionales, tanto para X como para Y. Estas distribuciones se obtendrán al fijar el valor de la otra variable y reciben en nombre de distribuciones condicionadas. a) FRECUENCIA ABSOLUTA CONDICIONADA PARA X=xi dado que Y=yj es el número de veces que se repite el valor xi teniendo en cuenta solo aquellos valores en que Y=yj ;así es: ni(j) = nij b) i=1,...,k. FRECUENCIA ABSOLUTA CONDICIONADA PARA Y=yj dado que X=xi es el número de veces que se repite el valor yj teniendo en cuenta solo aquellos valores en que X=x i ; así es: n(i)j = nij j=1,...,h U N I V E R S I D A D D E A Q U I N O B O L I V I A 33 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS En las distribuciones condicionadas no se suelen utilizar las distribuciones absolutas, puesto que, estas dependen del número de datos y el número de datos será diferente para cada distribución, pues dependerá de la frecuencia del valor que fijamos de la otra variable. Son mucho más útiles las frecuencias condicionadas que se definen: FRECUENCIA RELATIVA CONDICIONADA PARA X dado que Y=yj es fi(j) = nij/n.j FRECUENCIA RELATIVA CONDICIONADA PARA Y dado que X=xi es f(i)j = nij/ni. 7.5 REPRESENTACION GRAFICA Al igual que en el caso univariante, la forma de la distribución conjunta se aprecia a primera vista y se retiene más fácilmente en la memoria con una adecuada representación gráfica. DIAGRAMA DE DISPERSIÓN O NUBE DE PUNTOS Se obtiene representando cada par observado (x i,yj) como un punto en el plano cartesiano. Se utiliza con los datos sin agrupar y sobre todo para variables continuas. Si los datos están agrupados tomaríamos las marcas de clase. Es el más útil porque nos permite ver visualmente la relación entre las dos variables CUESTIONARIO 1. Sea el conjunto: Peso 50 80 75 50 60 80 55 50 60 Edad 25 38 30 22 25 30 20 25 30 Sexo M H H M H M M M H Calcular: Las frecuencias absolutas, relativas por cada una de las variables , interpretar 2. Investigue la producción de soya en los últimos 10 años en el departamento de santa cruz y a partir de ellos determine las frecuencias y su interpretación U N I V E R S I D A D D E A Q U I N O B O L I V I A 34 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS PROGRAMA DE CONTROL DE CALIDAD WORK PAPER # 8 UNIDAD O TEMA: REGRESION Y PREDICCION TITULO: REGRESION Y PREDICCION FECHA DE ENTREGA: Junio 2007 PERIODO DE EVALUACION: EVALUACIÓN FINAL TEMA 8. REGRESION Y PREDICCION 8.1 DIAGRAMA DE DISPERSIÓN. La primera forma de describir una distribución bivariante es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión Un diagrama de dispersión es una representación gráfica de la relación entre dos variables, muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causa - efecto es la clave de la resolución eficaz de un problema, que las relaciones de causa - efecto casi siempre muestran variaciones, y que es más fácil ver la relación en un diagrama de dispersión que en una simple tabla de números 8.2 CORRELACIÓN LINEAL. Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión. Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con respecto a la recta. U N I V E R S I D A D D E A Q U I N O B O L I V I A 35 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya que la recta que hemos dibujado está próxima a los puntos de la nube. Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir 8.3 REGRESIÓN LINEAL SIMPLE. La regresión lineal simple es entonces una técnica sencilla y accesible para valorar la relación entre dos variables cuantitativas Tiene como objeto estudiar cómo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal, es decir, su representación gráfica es una línea recta. Cuando la relación lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresión lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, según lo establecido, se tendrá: Función Lineal: Y = a + bx Parábola de segundo grado: Y = ax2 + bx + c Función potencial: Y = cxb Función exponencial: Y = cbx 8.4 METODO DE LOS MINIMOS CUADRADOS Se conoce como regresión lineal, correlación de Pearson o método de mínimos cuadrados, al procedimiento de encontrar la ecuación de la recta "que mejor se ajuste a un conjunto de puntos". El método de mínimos cuadrados nos permite encontrar el grado de correlación lineal entre un conjunto de pares de valores numéricos El procedimiento consiste entonces en minimizar los residuos al cuadrado Ci² U N I V E R S I D A D D E A Q U I N O B O L I V I A 36 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS Re emplazando nos queda La obtención de los valores de a y b que minimizan esta función es un problema que se puede resolver recurriendo a la derivación parcial de la función en términos de a y b: llamemos G a la función que se va a minimizar: Los valores a y b también se pueden obtener de la siguiente forma: partiendo de las ecuaciones normales tenemos Entonces: U N I V E R S I D A D D E A Q U I N O B O L I V I A 37 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS 8.5 PREDICCIÓN. Cuando se verifican las hipótesis sobre las que se asienta el modelo, la recta de regresión puede ser utilizada para predecir el valor medio de la variable Y para cada valor concreto de X. Calculando la esperanza matemática en ambos lados de la ecuación (1) se obtendrá de modo que la línea de regresión proporciona un estimador del valor medio de Y para cada valor de X. Como tal estimador, debemos considerar la incertidumbre asociada a esta recta, que puede ser reflejada mediante regiones de confianza que contienen a la recta. La ecuación Y= a +bx se puede usar para predecir o estimar la respuesta media Esperaríamos que el error de predicción fuese mas alto en el caso de un solo valor predicho en el caso donde se predice una media. Esto, entonces, afectara el ancho de nuestros intervalos para valores que se predicen Cuestionario: 1. Dada la difícil situación por la que atraviesa actualmente la empresa QUEMALAPATA en la que hemos empezado a trabajar, se propone la reducción de determinados gastos. Para ello se estudia la relación que existe entre dos variables como son: los gastos en publicidad (variable X) y los beneficios (variable Y). De ambas variables disponemos de los siguientes datos: Año Gastos en publicidad Beneficios U N I V E R S 1993 70 33 I D A D 1994 75 45 D E 1995 80 50 A Q U I N O 1996 90 65 B O 1997 104 67 L I V I A 38 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS Se pide: ¿Se puede considerar que ambas variables guardan algún tipo de relación? ¿Cuál sería la variable dependiente y cuál la independiente? Realizando un gráfico adecuado. ¿Se puede suponer que la relación que las liga es de tipo lineal? Construye las dos rectas de regresión mínimo cuadrática asociada con las variables. Si la empresa para el próximo año realizará un esfuerzo para poder invertir 11.500.000 Bs en publicidad. ¿Cuáles resultarían ser sus beneficios? ¿Con qué fiabilidad realizaría usted la predicción? ¿Cuáles resultarían ser sus beneficios si la predicción se efectúa considerando tan solo como variable explicativa el tiempo? ¿Cuál sería la fiabilidad de esta otra predicción? Comente los resultados. 3. Hallar la proyección para la producción de soya de un agricultor por periodo de tiempo: Año 2000 2001 2002 2003 2004 Producción 300 310 320 325 335 Proyectar para el año 2006, 2007 y 2008 Graficar Interpretar 4. Las precipitaciones (lluvias en mm) en el departamento santa cruz son la siguientes: Año 2000 2001 2002 2003 2004 precipitación 150 220 120 230 410 Proyectar para el año 2006, 2007 y 2008 Graficar Interpretar U N I V E R S I D A D D E A Q U I N O B O L I V I A 39 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS IX. DIF´S PROGRAMA DE CONTROL DE CALIDAD DIF’s # 1 UNIDAD O TEMA: UNIDAD I TITULO: OBTENCION DE DATOS FECHA DE ENTREGA: MARZO 2007 Como se ha puesto de manifiesto, gran parte del trabajo de un estadístico profesional se hace con muestras. Estas son necesarias porque las poblaciones son casi siempre demasiado grandes para estudiarlas en su totalidad. Exigiría demasiado tiempo y dinero estudiar la población entera, y tenemos que seleccionar una muestra de la misma, calcular el estadístico de esa muestra y utilizarlo para estimar el parámetro correspondiente de la población. La obtención de la información se puede realizar por diversos medios. Una forma es a través de una encuesta a un grupo de individuos, donde a cada uno se le hacen las mismas preguntas. Otra forma es a través de experimentos donde la respuesta a la variable es el resultado del experimento. Puede también recolectarse los datos en forma directa, es decir, la información se extrae de alguna base de datos seleccionando una muestra de ellos. En cualquiera de estos casos contamos con una selección de información llamada muestra y que se procede a analizar. Existen diferentes técnicas para realizar el muestreo y que dependerán cada caso, cual usar. Algunas de ellas son: Muestreo aleatorios simple: Todos los elementos de la población tiene igual posibilidad de ser escogido y se eligen al azar. Muestreo sistemático: Los elementos se seleccionan a un intervalo uniforme en una lista ordenada. Una preocupación del muestreo sistemático es la existencia de factores cíclicos en el listado que pudieran dar lugar a un error. Muestreo estratificado: Los elementos de la población son primeramente clasificados en grupos o estratos según una característica importante. Luego, de cada estrato se extrae una muestra aleatoria simple U N I V E R S I D A D D E A Q U I N O B O L I V I A 40 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS Muestreo por conglomerado: Los elementos de la población están subdivididos en grupos y se extraen aleatoriamente algunos de estos grupos completos CUESTIONARIO 1. Que métodos se utilizan para la obtención de datos 2. Cuales son las técnicas para realizar un muestreo 3. Defina los diferentes tipos de muestreos 4. Investigue sobre los tipos de error en el muestreo 5. Investigue sobre muestreo según otros autores 6. Que técnica elegiría usted para realizar un muestreo y por que PROGRAMA DE CONTROL DE CALIDAD DIF’s # 2 UNIDAD O TEMA: UNIDAD I TITULO: OBTENCIÓN DE DATOS FECHA DE ENTREGA: ABRIL 2007 1. Elabore un cuestionario para un estudio de investigación 2. Como aplicaría el cuestionario 3. Procese la información obtenida 4. Represente gráficamente las variables 5. Interprete los resultados 6. Elabore un esquema de presentación de la información obtenida en forma impresa y magnética U N I V E R S I D A D D E A Q U I N O B O L I V I A 41 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS X. VISITA TÉCNICA. PROGRAMA DE CONTROL DE CALIDAD VISITA TECNICA No. 1 UNIDAD O TEMA : LUGAR : FECHA PREVISTA : RECURSOS NECESARIOS OBJETIVOS DE LA ACTIVIDAD FORMAS DE EVALUACION (Si procede) U N I V E R S I D A D D E A Q U I N O B O L I V I A 42 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS PROGRAMA DE CONTROL DE CALIDAD VISITA TECNICA No. 2 UNIDAD O TEMA : LUGAR : FECHA PREVISTA : RECURSOS NECESARIOS OBJETIVOS DE LA ACTIVIDAD FORMAS DE EVALUACION (Si procede) U N I V E R S I D A D D E A Q U I N O B O L I V I A 43 FACULTAD DE CIENCIAS ECONÓMICAS Y FINANCIERAS PROGRAMA DE CONTROL DE CALIDAD VISITA TECNICA No. 3 UNIDAD O TEMA : LUGAR : FECHA PREVISTA : RECURSOS NECESARIOS OBJETIVOS DE LA ACTIVIDAD FORMAS DE EVALUACION (Si procede) U N I V E R S I D A D D E A Q U I N O B O L I V I A 44