INSTITUTO SUPERIOR TECNOLÓGICO “DAVID AUSUBEL” SEMIPRESENCIAL TECNOLOGÍA EN: CONTABILIDAD Y AUDITORIA E INFORMÁTICA ESTADÍSTICA GUIA DIDÁCTICA AUTOR DEL MÓDULO M.Sc. Ing. VICENTE VINICIO NICOLALDE MORETA 3 er. NIVEL QUITO - ECUADOR 1 PRESENTACIÓN En el proceso formativo de los Tecnólogos, tanto en Informática, como en Administración de Empresas, con especialidad en Contabilidad y Auditoría, es necesario el conocimiento teórico práctico de la Disciplina de Estadística, debido a que el proceso administrativo inicia y termina con el análisis de información, la misma que debe ser recopilada, ordenada, analizada y presentada en forma sistemática para tomar decisiones. Es muy importante que el nuevo Tecnólogo en estas ramas del conocimiento a nivel superior llegue a dominar la base conceptual sobre Estadística, mediante la aplicación en la resolución de ejercicios y problemas de manejo de datos, convirtiéndole en una valiosa herramienta dentro de la planificación, organización y control, pues esta disciplina le permitirá definir las desviaciones que pueden generarse dentro de los procesos y determinar con certeza los correctivos, mediante una acertada toma de decisiones. "Sólo una cosa convierte en imposible un sueño: el miedo a fracasar" (Paulo Coelho). “Lo que tenemos que aprender a hacer, lo aprendemos haciéndolo”. (Aristóteles) "No esperes por el momento preciso. Empieza ahora. Hazlo ahora. Si esperas por el momento adecuado, nunca dejarás de esperar" (Jasmine Gillman) 2 ÍNDICE TEMA PAG. OBJETIVOS ESPECÍFICOS COMPETENCIAS ESPECÍFICAS INTRODUCCIÓN EPÍTOME CONTENIDOS COMPETENCIA GENERAL 6 6 7 8 9 11 CAPITULO I COMPETENCIA ESPECÍFICA 12 ORIENTACIONES DE ESTUDIO 1- LA ESTADÍSTICA 1.1- DEFINICIÓN 1.2- RESEÑA HISTÓRICA 1.3- CLASES DE ESTADÍSTICA 1.4- POBLACIÓN Y MUESTREO; ESTADÍSTICA INDUCTIVA Y DESCRIPTIVA 1.5- FUENTES DE INFORMACIÓN 1.6- ELEMENTOS MATEMÁTICOS IMPORTANTES EN LA ESTADÍSTICA. EVALUACIÓN DEL APRENDIZAJE 12 CAPITULO II COMPETENCIA ESPECÍFICA 18 ORIENTACIONES DE ESTUDIO 2- DISTRIBUCION DE FRECUENCIAS 2.1- LA FILA DE DATOS 2.2- ORDENACIONES 2.3- DISTRIBUCIÓN DE FRECUENCIAS EVALUACIÓN DEL APRENDIZAJE 18 18 18 18 18 27 CAPITULO III COMPETENCIA ESPECÍFICA 29 ORIENTACIONES DE ESTUDIO 3- REPRESENTACION GRAFICA 3.1- FINALIDAD DE LA REPRESENTACIÓN GRÁFICA 3.2- GRAFICOS EN EL SISTEMA CARTESIANO 3.3- GRAFICO CIRCULAR 3.4- GRAFICOS DE BARRAS 3.5- GRAFICA DE TABLA DE FRECUENCIAS 3.6- DIAGRAMA DE BARRAS O HISTOGRAMA 29 29 29 29 30 31 32 33 12 12 12 13 13 14 17 3 3.7- DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS 3.8- DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS Y OJIVAS 3.9- TIPOS DE CURVAS DE FRECUENCIAS EVALUACIÓN DEL APRENDIZAJE 33 33 35 37 CAPITULO IV COMPETENCIA ESPECÍFICA 39 ORIENTACIONES DE ESTUDIO 4- PROMEDIOS O MEDIDAS DE TENDENCIA CENTRAL 4.1- DEFINICIÓN Y CLASES DE PROMEDIOS 4.2- LA MEDIA ARITMÉTICA 4.3- ANÁLISIS CON VARIABLE DISCRETA 4.4- MEDIA ARITMÉTICA PONDERADA 4.5- ANÁLISIS CON VARIABLE CONTÍNUA 4.6- PROPIEDADES EVALUACIÓN DEL APRENDIZAJE 39 39 39 40 40 41 41 43 46 CAPITULO V COMPETENCIA ESPECÍFICA 47 ORIENTACIONES DE ESTUDIO 5- OTRAS MEDIDAS DE TENDENCIA CENTRAL 5.1- LA MEDIANA 5.2- CUARTILES 5.3- DECILES 5.4- PERCENTILES 5.5- LA MODA EVALUACIÓN DEL APRENDIZAJE 47 47 47 50 51 51 52 53 CAPITULO VI COMPETENCIA ESPECÍFICA 55 ORIENTACIONES DE ESTUDIO 6- ESTADÍGRAFOS DE POSICIÓN 6.1- LA MEDIA ARMÓNICA 6.2- LA MEDIA GEOMÉTRICA 6.3- LA MEDIA CUADRÁTICA EVALUACIÓN DEL APRENDIZAJE 55 55 55 56 57 59 CAPITULO VII COMPETENCIA ESPECÍFICA 61 ORIENTACIONES DE ESTUDIO 7- ESTADÍGRAFOS DE DISPERSIÓN 7.1- LA DISPERSIÓN Y SU MEDIDA 7.2- DESVIACIÓN MEDIA 7.3- DESVIACIÓN ESTÁNDAR 61 61 61 64 64 4 7.4- LA VARIANZA 7.5- EL COEFICIENTE DE VARIACIÓN EVALUACIÓN DEL APRENDIZAJE 68 68 72 CAPITULO VIII COMPETENCIA ESPECÍFICA 74 ORIENTACIONES DE ESTUDIO 8- ANÁLISIS DE VARIABLES TIPO UNO 8.1- LA COVARIACIÓN 8.2- ANÁLISIS GRÁFICO DE LA COVARIACIÓN 8.3- LA REGRESIÓN 8.4- CORRELACIÓN ENTRE DOS VARIABLES EVALUACIÓN DEL APRENDIZAJE 74 74 74 75 77 80 83 CAPÍTULO IX COMPETENCIA ESPECÍFICA 85 ORIENTACIONES DE ESTUDIO 9- CLASIFICACIÓN DE LOS ÍNDICES 9.1- ÍNDICE SIMPLE DE PRECIOS 9.2- ÍNDICE SIMPLE DE CANTIDAD 9.3- PRINCIPALES ÍNDICES UTILIZADOS EN LA ADMINISTRACIÓN Y LA ECONOMÍA EVALUACIÓN DEL APRENDIZAJE 85 85 85 86 BIBLIOGRAFÍA 91 87 89 5 OBJETIVOS ESPECÍFICOS Dominar la base conceptual referente a estadística, fuentes de información y elementos matemáticos. Dominar la base conceptual y analítica sobre la distribución de frecuencias; la representación gráfica, tipos de curvas de frecuencias; las medidas de tendencia central; estadígrafos de posición; estadígrafos de dispersión; el análisis de variables tipo uno; aplicar y resolver ejercicios. Dominar la base conceptual y analítica sobre los Índices de precios y cantidad y aplicar en forma práctica. COMPETENCIAS ESPECÍFICAS Domina la base conceptual referente a estadística, fuentes de información y elementos matemáticos. Domina la base conceptual y analítica sobre la distribución de frecuencias; la representación gráfica, tipos de curvas de frecuencias; las medidas de tendencia central; estadígrafos de posición; estadígrafos de dispersión; el análisis de variables tipo uno; aplica y resuelve ejercicios. Domina la base conceptual y analítica sobre los Índices de precios y cantidad y su aplicación práctica. 6 INTRODUCCIÓN La estadística es una técnica auxiliar de las ciencias administrativas, esta permite determinar y medir matemáticamente las variables que intervienen dentro de las actividades administrativas y sus aplicaciones informáticas. Se convierte en una herramienta fundamental dentro de la planificación y la organización, pues la estadística permite definir las desviaciones que pueden generarse dentro de los procesos y determinar con certeza los correctivos que se pueden tomar, a fin de evitar mayores problemas o eliminarlos. Esta técnica está presente en los estudios de mercado de las empresas, en los informes contables, informes económicos, en el desarrollo de nuevos proyectos, informes empresariales, en definitiva en toda actividad de carácter administrativo. Es importante que los tecnólogos conozcan y apliquen los conceptos básicos de Estadística, tales como la distribución de frecuencias, su representación gráfica, las medidas de tendencia central, de dispersión, el análisis de variables tipo uno y los Índices de precios y cantidad. 7 EPÍTOME CONCEPTOS, ELEMENTOS MATEMÁTICOS DISTRIBUCIÓN DE FRECUENCIAS REPRESENTACIÓN GRÁFICA MEDIDAS DE TENDENCIA CENTRAL ESTADÍSTICA ESTADÍGRAFOS DE POSICIÓN ESTADÍGRAFOS DE DISPERSIÓN ANÁLISIS DE VARIABLES TIPO UNO ÍNDICES: DE PRECIOS Y CANTIDAD 8 CONTENIDO CAPITULO I 1- LA ESTADÍSTICA 1.1. DEFINICIÓN 1.2. RESEÑA HISTÓRICA 1.3. CLASES DE ESTADÍSTICA 1.4. POBLACIÓN Y MUESTREO; ESTADÍSTICA INDUCTIVA Y DESCRIPTIVA 1.5. FUENTES DE INFORMACIÓN 1.5.1. El Censo 1.5.2. La Muestra 1.5.3. La Encuesta 1.6. ELEMENTOS MATEMÁTICOS IMPORTANTES EN LA ESTADÍSTICA. 1.6.1. Variables 1.6.2. El redondeo de datos 1.6.3. La notación científica 1.6.4. El operador sumatorio ∑ CAPITULO II 2- DISTRIBUCION DE FRECUENCIAS 2.1- LA FILA DE DATOS 2.2- ORDENACIONES 2.3- DISTRIBUCIÓN DE FRECUENCIAS 2.3.1- Ejemplo con Variable Discreta. 2.3.1.1- Datos originales 2.3.1.2- Frecuencia absoluta Ni. 2.3.1.3- Frecuencia absoluta acumulada descendente N’i. 2.3.1.4- Frecuencia relativa simple hi 2.3.1.5- Frecuencia relativa acumulada ascendente Hi 2.3.1.6- Frecuencia relativa acumulada descendente H’i 2.3.2- Ejemplo con variable continua 2.3.2.1- Frecuencia absoluta simple ni 2.3.2.2- Frecuencia absoluta Ni 2.3.2.3- Frecuencia absoluta acumulada descendente N’i 2.3.2.4- Frecuencia relativa simple hi 2.3.2.5- Frecuencia relativa acumulada ascendente Hi 2.3.2.6- Frecuencia relativa acumulada descendente H’i 9 CAPITULO III 3- REPRESENTACION GRAFICA 3.1- FINALIDAD DE LA REPRESENTACIÓN GRÁFICA 3.2- GRAFICOS EN EL SISTEMA CARTESIANO 3.3- GRAFICO CIRCULAR 3.4- GRAFICOS DE BARRAS 3.5- GRAFICA DE TABLA DE FRECUENCIAS 3.6- DIAGRAMA DE BARRAS O HISTOGRAMA 3.7- DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS 3.8- DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS Y OJIVAS 3.9- TIPOS DE CURVAS DE FRECUENCIAS CAPITULO IV 4- PROMEDIOS O MEDIDAS DE TENDENCIA CENTRAL 4.1- DEFINICIÓN Y CLASES DE PROMEDIOS 4.2- LA MEDIA ARITMÉTICA 4.3- ANÁLISIS DE LA MEDIA ARITMÉTICA CON VARIABLE DISCRETA 4.4- MEDIA ARITMÉTICA PONDERADA 4.5- ANÁLISIS DE LA MEDIA ARITMÉTICA CON VARIABLE CONTINUA 4.6- PROPIEDADES DE LA MEDIA ARITMÉTICA CAPITULO V 5- OTRAS MEDIDAS DE TENDENCIA CENTRAL 5.1- LA MEDIANA 5.1.1- Cálculo para datos originales 5.1.2- Cálculo para datos agrupados 5.2- CUARTILES 5.3- DECILES 5.4- PERCENTILES 5.5- LA MODA 5.5.1- Moda por observación 5.5.2- Moda bimodal 5.5.3- Moda en datos agrupados CAPITULO VI 6- ESTADÍGRAFOS DE POSICIÓN 6.1- LA MEDIA ARMÓNICA 6.3- LA MEDIA GEOMÉTRICA 6.4- LA MEDIA CUADRÁTICA 10 CAPITULO VII 7- ESTADÍGRAFOS DE DISPERSIÓN 7.1- LA DISPERSIÓN Y SU MEDIDA 7.2- DESVIACIÓN MEDIA 7.3- DESVIACIÓN ESTÁNDAR 7.4- LA VARIANZA 7.5- EL COEFICIENTE DE VARIACIÓN CAPITULO VIII 8- ANÁLISIS DE VARIABLES TIPO UNO 8.1- LA COVARIACIÓN 8.2- ANÁLISIS GRÁFICO DE LA COVARIACIÓN 8.3- LA REGRESIÓN 8.4- LA REGRESIÓN LINEAL 8.5- CORRELACIÓN ENTRE DOS VARIABLES CAPÍTULO IX 9- CLASIFICACIÓN DE LOS ÍNDICES 9.1- ÍNDICE SIMPLE DE PRECIOS 9.2- ÍNDICE SIMPLE DE CANTIDAD 9.3- PRINCIPALES ÍNDICES UTILIZADOS EN LA ADMINISTRACIÓN Y LA ECONOMÍA 9.3.1- Índice de precios al consumidor 9.3.2- Usos del IPC COMPETENCIA GENERAL.- los estudiantes dominan los procesos cognitivos y analíticos de la Estadística, sus conceptos, Distribución de frecuencias, Representación gráfica, Medidas de tendencia central, de dispersión e Índices y su aplicación. 11 CAPITULO I COMPETENCIA ESPECÍFICA Domina la base conceptual referente a estadística, fuentes de información y elementos matemáticos. ORIENTACIONES DE ESTUDIO Por tratarse de una Unidad introductoria técnica, se recomienda a los y las estudiantes que se familiaricen con los conceptos básicos de Estadística, su clasificación, sus usos y aplicaciones; además deben llegar a conocer y dominar el manejo de algunos elementos matemáticos, los más utilizados en esta asignatura. Al conocer estos elementos y conceptos podrán poner en práctica con ejercicios, ejemplos, y resolución de problemas. Se utilizará la metodología de enseñanza aprendizaje de aprender haciendo. Es importante desarrollar la lectura adicional para completar los conocimientos impartidos en clases. 1- LA ESTADÍSTICA 1.1- DEFINICIÓN La estadística es una parte del conocimiento científico. La estadística estudia los métodos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en dichos análisis. La estadística sirve para describir y entender los fenómenos económicos, sociales, políticos, incluso fenómenos naturales que acontecen en el desarrollo del mundo. Así la estadística se encamina a recolectar información, tabular la información, clasificar la información y graficar la misma. 1.2- RESEÑA HISTÓRICA La palabra estadística nació en el imperio Romano, la utilizaban los reyes para elaborar encuestas y sondeos del número de habitantes en las ciudades para poder cobrar los impuestos. Se la utilizó en este sentido por el Estado hasta la revolución industrial, actualmente todas las actividades humanas, consciente o inconscientemente utilizan la estadística. 1.3- CLASES DE ESTADÍSTICA 12 a) Por las observaciones b) Por la materia de Estudio c) Por el número de caracteres d) Por las observaciones 1.4- POBLACIÓN DESCRIPTIVA Y MUESTREO; - Primarias - Derivadas Demográficas, de transportes, sanitarias, agropecuarias, económicas, educativas, de comercio exterior, de precios, de accidentes de trabajo, etc. - De variables - De atributos - Mixtas - Distribuciones de Frecuencias - Estadísticas Geográficas - Estadísticas Sectoriales - Estadísticas Temporales ESTADÍSTICA INDUCTIVA Y Cuando se recogen datos relativos a las características de un grupo de individuos u objetos, sean alturas, pesos, de los estudiantes de un colegio, o universidad o pernos defectuosos producidos en una fábrica, suele ser imposible o nada práctico observar todo el grupo, por ser este muy grande, llegando a ser casi imposible su verificación de uno en uno. En vez de examinar el grupo entero llamado universo o población, se opta por tomar una parte del universo el cual toma el nombre de muestra. Una población puede ser finita o infinita. Por ejemplo una población finita puede ser todos los estudiantes matriculados en la Universidad Central del Ecuador en un año determinado. Mientras que una población infinita puede ser los posibles resultados de cara o cruz al lanzar sucesivamente una moneda al aire. Si una muestra es representativa de una población, de ella se pueden extraer importantes conclusiones que serán aplicadas a la muestra mediante el análisis de la muestra. La fase de la estadística que trata con las condiciones bajo las cuales tal diferencia es válida se llama estadística inductiva o inferencia estadística. Ya que dicha inferencia no es del todo exacta, el leguaje de las probabilidades aparecerá al establecer nuestras conclusiones. La parte de la estadística que solo se dedica a describir y analizar un grupo de datos, sin extraer conclusiones sobre un grupo mayor se llama estadística descriptiva o deductiva. 1.5- FUENTES DE INFORMACIÓN Las fuentes de información son las formas de dónde y cómo podemos obtener datos ya sean cualitativos y cuantitativos. Las principales fuentes de información para una investigación estadística son: - El censo - La muestra 13 - La encuesta 1.5.1- EL CENSO Es la enumeración total de todos y cada uno de los elementos del universo, población o masa estadística. 1.5.2- LA MUESTRA Es una enumeración parcial de algunos de los elementos del universo, población o masa estadística, la cual es previamente seleccionada y contiene las características más comunes del universo y que lo representa; la cual es sometida a ciertos criterios para ser definida. 1.5.3- LA ENCUESTA Es la forma más directa de obtener información estadística o datos, es utilizada por el censo o por la muestra. La encuesta puede ser verbal o escrita, pero en los dos casos debe estar previamente elaborada con los objetivos de la investigación. 1.6- ELEMENTOS MATEMÁTICOS IMPORTANTES EN LA ESTADÍSTICA. 1.6.1- VARIABLES Una se la representa con un símbolo, tal como X, Y, H, A o B, que puede tomar un conjunto prefijado de valores, llamado Dominio de esa variable. Si la variable puede tomar un solo valor, se llama constante. Una variable que puede tomar cualquier valor entre dos valores dados se dice que es una variable continua; en caso contrario diremos que la variable es discreta. Por ejemplo el número huevos H que puede poner una gallina en una semana puede ser 5, 6, 7, …. Pero no puede poner 5,7 o 6,34, por lo tanto es una variable discreta. Entonces diremos: variables discretas son aquellas que presentan un valor bien determinado entre las cuales no cabe ningún otro valor, es decir son aquellas que pueden tomar un valor, o un número limitado de valores dentro de un rango o intervalo los cuales pueden ser expresados solo en números enteros y no en decimales o fracciones. En cambio la altura de una persona puede ser 1.65 cm., o 1.78 cm., dependiendo de la precisión de la medida, es una variable continua. Entonces diremos que se denomina variable continua a toda medida que expresa un número, es decir, son aquellas que pueden tomar un número ilimitado de valores, dentro de un rango o intervalo que puede ser expresado de cualquier forma, ya sea en valores enteros o decimales. 14 1.6.2- EL REDONDEO DE DATOS El resultado de redondear un número como 64.6 en unidades es 65 pues este es más próximo que 64. Analógicamente si queremos redondear 4.2689 en centésimas o sea con 2 decimales nos da 4.27, pero si queremos redondear 3.4325 en centésimas nos da 3.43 pues es el más próximo en lugar de 3.44 . Para determinar el redondeo se debe tomar como referencia el valor de 5, dando que si un el valor que le preside por ejemplo en 4.2689 su tercer valor es 8 ≥ 5 entonces el segundo valor sube de 6 a 7; en el ejemplo 3.4325 como el tercer valor es 2≤5 entonces el segundo número se mantiene en 3. 1.6.3- LA NOTACIÓN CIENTÍFICA Al escribir números, especialmente los que poseen muchos ceros antes o después de punto decimal, interesa emplear la notación científica mediante potencias de 10. Ejemplo. 10¹=10, 10²=10x10=100 5 10 =10x10x10x10x10=100,000 8 10 =10x10x10x10x10x10x10x10=100,000,000 10º=1 -1 10 =0.1 o sea .1 -2 10 =0.01 o sea .01 -5 10 =0.00001 o sea .00001 Entonces 864,000,000=8.64x10 8 0.00003416=3.416x10 -5 8 Nótese que al multiplicar un número por 10 , por ejemplo, el punto decimal se -6 mueve 8 posiciones a la derecha, y la multiplicar por 10 se mueve seis posiciones a la izquierda. A menudo escribimos 0.1253 en vez de .1253 para recalcar el hecho de que no se ha omitido accidentalmente un entero no nulo delante del punto decimal. Sin embargo, ese cero puede omitirse cuando no exista riesgo de confusión, por ejemplo, en tablas. 1.6.4- EL OPERADOR SUMATORIO ∑ Es un símbolo convencional matemático que indica que tenemos que sumar, desde que la variable toma el valor de 1 hasta que la variable toma el valor de n. n Xi X 1 X 2 X 3 ......... Xn i 1 15 1.6.4.1- PROPIEDADES DEL OPERADOR SUMATORIO 1.-La sumatoria de una constante es ∑K ∑k=k+k+k+k+k+………+k n veces ∑k = n veces la misma constante ∑k = nk 2.-Sumatoria de una constante con una variable. ∑kXi=Kx1+kx2+kx3+…………..+kxn ∑kXi=k(x1+x2+x3+…………xn) ∑kXi=k∑Xi Esto es igual a la constante por la sumatoria de la parte variable. 3.-La sumatoria de una suma de variables ∑(Xi+Yi+Zi) = x1+y1+z1+x2+y2+z2+…………………+xn+yn+zn (x1+x2+…….+xn)+(y1+y2+………..yn)+(z1+z2+………zn) ∑Xi+∑Yi+∑Zi La sumatoria de variables siempre será igual a la sumatoria de cada una de las variables PARA RECORDAR: La estadística estudia los métodos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en dichos análisis. Una población puede ser finita o infinita. La fase de la estadística que trata con las condiciones bajo las cuales tal diferencia es valida se llama estadística inductiva o inferencia estadística. La parte de la estadística que solo se dedica a describir y analizar un grupo de dado, sin extraer conclusiones sobre un grupo mayor se llama estadística descriptiva o deductiva. Las fuentes de información son las formas de donde y como podemos obtener datos ya sean cualitativos y cuantitativos. La variable puede tomar un solo valor, se llama constante. Una variable que puede tomar cualquier valor entre dos valores dados se dice que es una variable continua; en caso contrario diremos que la variable es discreta. El operador sumatorio ∑ es un símbolo convencional matemático que indica que tenemos que sumar, desde que la variable toma el valor de 1 hasta que la n Xi X 1 X 2 X 3 ......... Xn i 1 16 variable toma el valor de n. EVALUACIÓN DEL APRENDIZAJE: 1- De 2 ejemplos de población o universo 2- De 2 ejemplos de muestra 3- Realice un ejemplo de una encuesta para obtener información de ingresos y gastos de una familia 4- De 5 ejemplo de variables discretas 5- De 5 ejemplos de variables continuas 6- Realice un cuadro sinóptico de cómo se clasifica la estadística Realice los siguientes ejercicios: 1- Redondeo a) 2.35616 con dos decimales b) 4.5621 con dos decimales c) 15’536,351 en millones cerrados d) 24.564 en enteros(sin decimales) e) 54.799988 con 3 decimales 2- Notación científica. Expresar los siguientes números sin usar la potencia de 10 4 a) 132.5x10 b) -5 418.72x10 c) -7 280x10 d) 5 0.0001850x10 e) 6 730x10 3- Realice la sumatoria de: Ingresos mensuales de los obreros de la empresa EUROTEL en 1998 345, 462, 689, 345, 645, 278, 356 y 435 17 CAPITULO II COMPETENCIA ESPECÍFICA Domina la base conceptual y analítica sobre la distribución de frecuencias; aplica y resuelve ejercicios. ORIENTACIONES DE ESTUDIO Por tratarse de una Unidad técnica, se recomienda a los y las estudiantes que se familiaricen con los conceptos de la distribución de frecuencias, sus usos y aplicaciones; además deben llegar a conocer y dominar el manejo de frecuencias absolutas y relativas. Al conocer estos elementos y conceptos podrán poner en práctica con ejercicios, ejemplos, y resolución de problemas. Se utilizará la metodología de enseñanza aprendizaje de aprender haciendo. Es importante desarrollar la lectura adicional para completar los conocimientos impartidos en clases. 2- DISTRIBUCION DE FRECUENCIAS 2.1- LA FILA DE DATOS Una fila de datos son datos recogidos los cuales no han sido organizados numéricamente, por ejemplo la altura de 100 estudiantes por letra alfabética. 2.2- ORDENACIONES Una ordenación es un conjunto de datos numéricos en orden creciente o decreciente. La diferencia entre el mayor y el menor se llama rango de ese conjunto de datos. Así si la mayor altura de entre los 100 estudiantes era de 160 cm., y la menor 150 cm., el rango es 160 – 150 = 10 cm. 2.3- DISTRIBUCIÓN DE FRECUENCIAS 2.3.1- EJEMPLO CON VARIABLE DISCRETA. Número de miembros por familia de los estudiantes del tercer curso. Donde: n = número total de observaciones, o tamaño de la muestra n = 10 2.3.1.1- DATOS ORIGINALES Son Aquellos que se toman directamente del campo de investigación y generalmente se representan con xi. 18 xi1 xi2 xi3 xi4 xi5 5 4 5 6 7 xi6 xi7 xi8 xi9 xi10 2 13 6 6 5 Partiendo de los datos originales se ordenan estos 2 4 5 5 5 6 6 6 7 13 Los datos agrupados son los mismos datos originales que se los clasifica en orden y se los presenta en forma ascendente o descendente, en la tabla de frecuencias. m: numero de filas, intervalos o líneas de la tabla de frecuencias. yi: valor distinto de la variable xi ni: número de veces que se repite el valor de una variable m 1 2 3 4 5 6 yi 2 4 5 6 7 13 TOTAL ni 1 1 3 3 1 1 10 ∑ni = n = 10 ∑hi = 1 Interpretación de ni Ejemplo en la fila m3 tenemos: ni3: Significa que 3 estudiantes tienen 5 miembros en su familia Ejemplo en la fila m6 tenemos ni6: Significa que 1 estudiante tiene 13 miembros en su familia 2.3.1.2- LA FRECUENCIA ABSOLUTA Ni. Esta nos indica el número de observaciones con valores a lo mucho o valores a lo máximo que puede tomar la variable El número de observaciones menores o igual a la variable, entonces: 19 Ni1 = ni1 Ni2 = ni1+ni2 Ni3 = ni1+ni2+ni3 Así tenemos: Ni3 = 1+1+3 Ni3 = 5 m 1 2 3 4 5 6 TOTA L yi 2 4 5 6 7 13 ni 1 1 3 3 1 1 Ni 1 2 5 8 9 10 Interpretación de Ni: Ni3: Cinco estudiantes tienen a lo máximo 5 miembros en su familia Ni6: Diez estudiantes tienen a lo máximo 13 miembros en su familia. 2.3.1.3- LA FRECUENCIA ABSOLUTA ACUMULADA DESCENDENTE N’i. Nos indica el número de observaciones con valores por lo menos o como mínimo igual a la variable. O nos indica el número de observaciones mayores o iguales a la variable. N’i1 = ni1+ni2+ni3+ni4+ni5+ni6 N’i2 = ni1+ni2+ni3+ni4+ni5 Ni’3 = ni1+ni2+ni3+ni4 Así tenemos: Ni’3 = 1+1+3+3 Ni’3 = 8 m 1 2 3 4 5 6 Yi 2 4 5 6 7 13 ni 1 1 3 3 1 1 Ni 1 2 5 8 9 10 N'i 10 9 8 5 2 1 Interpretación de N’i: N’i3: 8 estudiantes tienen como mínimo 5 miembros en su familia N’i5: 2 estudiantes tienen como mínimo 7 miembros en su familia 20 2.3.1.4- FRECUENCIA RELATIVA SIMPLE hi La Frecuencia relativa simple nos indica la proporción o porcentaje de observaciones con valores iguales a la variable. Su fórmula de cálculo es: hi ni n Ejemplo: hi1 = 1/10 = 0.10 hi3 = 3/10 = 0.30 M 1 2 3 4 5 6 yi 2 4 5 6 7 13 ni 1 1 3 3 1 1 Ni 1 2 5 8 9 10 N'i 10 9 8 5 2 1 TOTAL hi 0.1 0.1 0.3 0.3 0.1 0.1 1 Interpretación: hi4: El 30% de los estudiantes del tercer curso, tienen 6 miembros en su familia hi2: el 10% de los estudiantes del tercer curso, tienen 4 miembros en su familia. 2.3.1.5- FRECUENCIA RELATIVA ACUMULADA ASCENDENTE Hi Nos indica la proporción de observaciones que con valores a lo mucho o iguales a la variable; o también a lo máximo o igual a la variable. Su fórmula es: Hi M 1 2 3 4 5 6 yi 2 4 5 6 7 13 ni 1 1 3 3 1 1 Ni n Ni 1 2 5 8 9 10 TOTAL N'i 10 9 8 5 2 1 hi 0.1 0.1 0.3 0.3 0.1 0.1 1 Hi 0.1 0.2 0.5 0.8 0.9 1 Ejemplos: Hi6 = 10/10 = 1 Hi3 = 5/10 = 0.50 Interpretación: 21 Para su interpretación los resultados obtenidos se deben multiplicar por 100, así tenemos: Hi6: el 100% de los estudiantes del tercer curso, tendrán a lo mucho 13 miembros en su familia. Hi3: el 50% de los estudiantes del tercer curso, tendrán a lo mucho 5 miembros en su familia. 2.3.1.6- FRECUENCIA RELATIVA ACUMULADA DESCENDENTE H’i Nos indica la proporción de observaciones con valores por lo menos o como mínimo iguales a la variable; o nos indica el porcentaje de observaciones con valores mayores o iguales a la variable. Su fórmula es: Ejemplos: H'i N'i n H’i3 = 8/10 = 0.80 H’i5 = 2/10 = 0.20 M 1 2 3 4 5 6 yi 2 4 5 6 7 13 ni 1 1 3 3 1 1 TOTAL Ni 1 2 5 8 9 10 N'i 10 9 8 5 2 1 hi 0.1 0.1 0.3 0.3 0.1 0.1 1 Hi 0.1 0.2 0.5 0.8 0.9 1 H'i 1 0.9 0.8 0.5 0.2 0.1 Interpretación: Para interpretar los resultados obtenidos se deben multiplicar por cien, así tenemos: H’i3: El 80% de los estudiantes del tercer curso tienen por lo menos 5 miembros en su familia. H’i5: El 20% de los estudiantes del tercer curso tienen por lo menos 7 miembros en su familia. 2.3.1.7- EJERCICIO DEMOSTRATIVO De 20 encuestas realizadas en el mercado Iñaquito a las vendedoras de este lugar sobre el número de hijos que poseen se obtuvieron los siguientes datos: Xi = 4, 4, 2, 2, 5, 10, 3, 1, 2, 3, 4, 3, 4, 1, 2, 3, 2, 1, 9, 10. Se pide: Obtener las frecuencias absolutas y relativas ascendentes y descendentes e interpretar los datos obtenidos de las filas 2 y 5. Desarrollo Xi: 22 1 1 1 2 2 2 2 2 3 3 m 1 3 3 4 4 4 4 5 9 10 10 Yi ni 1 3 2 5 Ni 3 8 N'i 20 18 hi Hi 0.15 0.15 0.25 0.40 H'i 1.00 0.90 3 4 5 12 16 17 17 16 12 0.20 0.60 0.20 0.80 0.05 0.85 0.85 0.80 0.60 5 6 9 1 18 7 10 2 20 TOTAL 20 8 3 0.05 0.90 0.10 1.00 1 0.40 0.15 2 3 4 4 4 1 Interpretación de la variable ni: ni2: Cinco vendedoras del mercado Iñaquito tienen 2 hijos ni5: Una vendedora del mercado Iñaquito tiene 5 hijos Interpretación de la frecuencia absoluta Ni: Ni2: Ocho vendedoras del mercado Iñaquito tiene como máximo 2 hijos Ni5: Diecisiete vendedoras del mercado Iñaquito tienen como máximo 5 hijos Interpretación de la frecuencia acumulativa descendente N’i N’i2: Dieciocho vendedoras del mercado Iñaquito tiene como mínimo 2 hijos N’i5: Doce vendedoras del mercado Iñaquito tienen como mínimo 5 hijos Interpretación de la frecuencia relativa simple hi: hi2: El 25% de las vendedoras del mercado Iñaquito tienen 2 hijos hi5: El 5% de la vendedora del mercado Iñaquito tiene 5 hijos Interpretación de la frecuencia relativa acumulada ascendente Hi: Hi2: El 40% de las vendedoras del mercado Iñaquito tiene a lo mucho 2 hijos Hi5: El 85% de las vendedoras del mercado Iñaquito tienen a lo mucho 5 hijos Interpretación de la frecuencia relativa acumulada descendente H’i H’i2: El 90% de las vendedoras del mercado Iñaquito tiene como mínimo 2 hijos H’i5: El 60% de las vendedoras del mercado Iñaquito tienen como mínimo 5 hijos 2.3.2- EJEMPLO DE VARIABLE CONTINUA Se realizó la medición de la estatura de 20 estudiantes del aula de cuarto curso especialización contabilidad obteniendo los siguientes datos en metros: Xi: 23 1.56 1.68 1.50 1.76 1.68 1.72 1.80 1.78 1.53 1.88 1.54 1.53 1.80 1.80 1.60 1.66 1.65 1.70 1.52 1.80 1.56 1.60 1.65 1.66 1.68 1.68 1.70 1.72 1.76 1.78 1.80 1.80 1.80 1.80 1.80 n = 20 Ordenar 1.50 1.52 1.53 1.53 1.54 Límite máximo: Es el máximo valor observado de la variable Límite mínimo: es el mínimo valor observado de la variable Lím. máximo: 1.80 Lím. mínimo: 1.50 Rango de amplitud: se obtiene de la diferencia entre le límite máximo menos el límite mínimo y lo representamos con la letra r r = lím. max. – lím. Mín r = 1.80 – 1.50 r = 0.30 Para establecer el número de intervalos que darán origen al número de filas realizamos: r = 0.30 0.30 es divisible para 2, 3, , 6, 10, 15; mientras trabajemos con un mayor número de filas menor será el margen de dispersión datos y error en los cálculos. m=5 m 1 2 3 4 5 yi'-1 -- yi' 1.50 -- 1.56 1.56 -- 1.62 1.62 -- 1.68 1.68 -- 1.74 1.74 -- 1.80 yi 1.53 1.59 1.65 1.71 1.77 ni 6 2 4 2 6 20 Ni 6 8 12 14 20 N'i 20 14 12 8 6 Hi 0.3 0.1 0.2 0.1 0.3 1 Generalidades: yi'-1 = Límite inferior de cada intervalo. yi’ = Límite superior de cada intervalo 24 C = Campo de amplitud o intervalo de clase C r m yi '1yi ' yi 2 0.30/5 = 0.06 yi = Punto medio o marca de clase (1.50+1.56)/2 = 1.53 Donde: yi '1xiyi ' yi '1xiyi 2.3.2.1- FRECUENCIA ABSOLUTA SIMPLE ni Es el número de observaciones con valores comprendidos entre el límite superior e inferior de cada intervalo. Su interpretación es similar al caso de la variable discreta, por ejemplo: ni1: Significa que 6 estudiantes tienen una estatura comprendida entre 1.50 a 1.56 m. ni3: Significa que 4 estudiantes tienen una estatura comprendida entre 1.62 a 1.68 m. 2.3.2.2- FRECUENCIA ABSOLUTA Ni Es un número de valores a lo mucho o igual al límite superior de cada intervalo, o número de observaciones menores o iguales al límite superior de cada intervalo Ni5: Veinte estudiantes a lo mucho tiene una estatura de 1.80 m. Ni2: Ocho estudiantes tienen a lo mucho una estatura de 1.62 m. 2.3.2.3- FRECUENCIA ABSOLUTA ACUMULADA DESCENDENTE N’i Nos indica el número de observaciones con valores por lo menos igual al límite inferior de cada intervalo. O el número de observaciones con valores mayores o iguales al límite inferior de cada intervalo. Su interpretación es similar a la variable discreta, así tenemos: N’i2: Catorce estudiantes tienen por lo menos una estatura de 1.56 m. N’i4: Ocho estudiantes tienen por lo menos una estatura de 1.68 m. 25 2.3.2.4- FRECUENCIA RELATIVA SIMPLE hi Nos indica la proporción o porcentaje de observaciones comprendidos entre le hi ni n límite inferior y superior de cada intervalo. m 1 2 3 4 5 yi'-1 -- yi' 1.50 -- 1.56 1.56 -- 1.62 1.62 -- 1.68 1.68 -- 1.74 1.74 -- 1.80 yi 1.53 1.59 1.65 1.71 1.77 ni 6 2 4 2 6 20 Ni 6 8 12 14 20 N'i 20 14 12 8 6 hi 0.3 0.1 0.2 0.1 0.3 1 Hi 0.3 0.4 0.6 0.7 1 H'i 1 0.7 0.6 0.4 0.3 Su interpretación es similar a la variable discreta, por ejemplo: hi3: El 20% de los estudiantes poseen una estatura entre 1.62 y 1.68 m. de altura 2.3.2.5- FRECUENCIA RELATIVA ACUMULADA ASCENDENTE Hi Indica la proporción de observaciones con valores a lo mucho o iguales al límite superior de cada intervalo. O el porcentaje de observaciones, con valores menores o iguales al límite superior de cada intervalo. Para su interpretación es necesario que los valores obtenidos de la formula se multipliquen por 100. Hi4: El 70% de estudiantes a lo máximo o a lo mucho miden 1.74 m. Hi2: el 40% de estudiantes a lo máximo o a lo mucho miden 1.62 m. 2.3.2.6- FRECUENCIA RELATIVA ACUMULADA DESCENDENTE H’i Indica la proporción de observaciones con valores a lo menos o iguales al límite inferior de cada intervalo, o nos indica que el porcentaje de las observaciones con valores mayores o iguales al límite inferior de cada intervalo. Y se interpreta: Para su interpretación es necesario que los valores obtenidos de la formula se multipliquen por 100. H'i N'i n H’i1 = El 100% de los estudiantes miden por lo menos 1,50 m. de estatura. H’i4 = El 40% de los estudiantes miden por lo menos 1,68 m. de estatura 26 PARA RECORDAR: Una fila de datos son valores recogidos los cuales no han sido organizados numéricamente, por ejemplo la altura de 100 estudiantes por letra alfabética. Una ordenación es un conjunto de datos numéricos en orden creciente o decreciente. Son Aquellos que se toman directamente del campo de investigación y generalmente se representan con xi. La frecuencia absoluta Ni nos indica el número de observaciones con valores a lo mucho o valores a lo máximo que puede tomar la variable La frecuencia absoluta acumulada descendente N’i indica el número de observaciones con valores por lo menos o como mínimo igual a la variable. La Frecuencia relativa simple nos indica la proporción o porcentaje de observaciones con valores iguales a la variable. ni hi n La frecuencia relativa acumulada ascendente Hi, indica la proporción de observaciones que con valore a lo mucho o iguales a la variable; o también a lo máximo o igual a la variable. Hi Ni n La frecuencia relativa acumulada descendente H’i indica la proporción de observaciones con valores por lo menos o como mínimo iguales a la variable. H'i N'i n EVALUACIÓN DEL APRENDIZAJE: a- Qué nos indica la frecuencia absoluta Ni? b- Qué nos indica la frecuencia relativa simple hi? c- Qué nos indica la frecuencia relativa acumulada descendente H’i? Realice los siguientes ejercicios d- En el siguiente cuadro se expone de a cuerdo a una muestra, el número de pelotas de tenis que producen en un día 20 obreros de una fabrica. Realice la tabla de frecuencias e interprete todas. 320 330 350 325 350 330 310 320 325 310 315 325 350 315 325 350 330 310 360 320 27 e- La tabla adjunta muestra los diámetros de 60 bolas de cojinete manufacturadas por una fábrica. Construir una distribución de frecuencias con intervalos de clase apropiados e interpretar 3 de cada frecuencia. 1.738 1.735 1.736 1.739 1.728 1.733 1.738 1.735 1.736 1.735 1.729 1.731 1.735 1.735 1.738 1.730 1.739 1.727 1.744 1.735 1.743 1.726 1.724 1.745 1.725 1.732 1.727 1.734 1.732 1.729 1.740 1.737 1.733 1.736 1.733 1.730 1.735 1.732 1.737 1.734 1.736 1.728 1.742 1.742 1.734 1.739 1.735 1.736 1.731 1.730 1.741 1.737 1.736 1.740 1.732 1.734 1.732 1.741 1.746 1.740 28 CAPITULO III COMPETENCIA ESPECÍFICA Domina la base conceptual y analítica sobre la representación gráfica, distribución de frecuencias relativas, tipos de curvas de frecuencias; aplica y resuelve ejercicios. ORIENTACIONES DE ESTUDIO Por tratarse de una Unidad técnica, se recomienda a los y las estudiantes que se familiaricen con los conceptos de la representación gráfica, distribución de frecuencias relativas y tipos de curvas de frecuencias, sus usos y aplicaciones. Al conocer estos elementos y conceptos podrán poner en práctica con ejercicios, ejemplos, y resolución de problemas. Se utilizará la metodología de enseñanza aprendizaje de aprender haciendo. Es importante desarrollar la lectura adicional para completar los conocimientos impartidos en clases. 3- REPRESENTACIÓN GRÁFICA 3.1- FINALIDAD DE LA REPRESENTACIÓN GRÁFICA La representación gráfica de los datos contenidos en un cuadro estadístico, tiene como finalidad ofrecer una visión de conjunto del fenómeno sometido a investigación, el cual es más rápidamente perceptible que la observación directa de los datos numéricos. Así la representación gráfica es unos medios eficaz para el análisis de las estadísticas ya que las magnitudes y las regularidades se aprecian y recuerdan con más facilidad cuando se examinan gráficamente. Sin embargo la representación gráfica no es más que un medio auxilia, de la investigación estadística, pues está es fundamentalmente numérica. La representación gráfica puede hacerse utilizando un sistema geométrico de representación, en cuyo caso tiene las propiedades de rigurosidad y precisión, o bien puede utilizarse símbolos alusivos al tema de estudio, como por ejemplo árboles, casas, automóviles, figuras humanas, etc. Mediante este último sistema de representación, no persigue una rigurosa exactitud, sino lograr efectos impresionistas en las personas de poca preparación en el campo de la estadística. 3.2- GRÁFICOS EN EL SISTEMA CARTESIANO Como es conocido el Sistema Cartesiano esta formado por un par de ejes, uno vertical y otro horizontal que se cortan en un ángulo recto. El eje horizontal 29 toma el nombre de las abscisas, y le vertical de eje de las ordenas; el punto de intersección es el origen Ambos ejes están graduados de acuerdo a una escala que pueden ser diferente para los dos ejes. Aquí se pueden trazar los conocidos gráficos de siluetas. BALANZA COMERCIAL SALDO 2000 1500 SALDO Balanza Comercial AÑO SALDO 1990 1500 1991 800 1992 -215 1993 530 1994 -156 1995 -256 1996 -562 1997 -324 1998 315 1999 -50 1000 500 0 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 -500 -1000 AÑO 3.3- GRÁFICO CIRCULAR Como su nombre lo indica constituye en representar los datos de una investigación estadística en el interior de un círculo o pastel. POBLACIÓN ECONÓMICAMENTE ACTIVA Situación Población Grados Empleados 20% 73 Subempleados 35% 128 Desocupados 45% 164 TOTAL 100% 365 30 Población Económicamente Activa 20% 45% 35% Empleados Subempleados Desocupados 3.4- GRÁFICOS DE BARRAS Se dibuja en un par de ejes cartesianos; en el de las abscisas se toman los valores distintos de la variable y en el de la ordenada, las frecuencias. Cada valor de la variable, con su correspondiente frecuencia, constituye una pareja de números, a la que corresponde en el plano un punto. Habrá pues, tantos puntos como valores distintos que tome la variable. Para dar mayor visibilidad al gráfico, es costumbre materializar las ordenadas de cada punto mediante una línea gruesa o Barra. De aquí que esta representación se llame gráfico o diagrama de barras. INDICE DE DELINCUENCIA Guayaquil 11% Quito 8% Ambato 5% Cuenca 3% IN D IC E D E D E LIN C UE N C IA 12% 10% 8% 6% C I U D A D ES 4% 2% 0% Guayaquil Quit o Ambat o Cuenca 31 3.5- GRÁFICA DE TABLA DE FRECUENCIAS De una muestra tomada en la provincia de los ríos, sobre la producción de arroz en quintales por hectáreas, durante el mes de diciembre de 1991 se obtuvieron los siguientes datos: Yi: 115.5 100.0 50.0 58.0 Lím.Máx Lím.Mín r = 350-50 r = 300 m=4 C = r/m C = 75 126.0 138.0 153.0 191.0 245.0 287.0 293.0 306.0 342.0 278.0 215.0 165.0 300 2 3 44 5 6 10 12 60 350 50 ==> ==> 300/4 M yi'-1 -- yi' yi ni Ni N'i hi Hi H'i 1 50 – 125 87.5 6 6 20 0.30 0.30 1.00 2 125 – 200 162.5 5 11 14 0.25 0.55 0.70 3 200 – 275 237.5 3 14 9 0.15 0.70 0.45 4 275 – 350 312.5 6 20 6 0.30 1.00 0.30 TOTAL 20 1.00 32 3.6- DIAGRAMA DE BARRAS O HISTOGRAMA Los histogramas y los polígonos de frecuencias son dos representaciones gráficas de las distribuciones de frecuencias. Un histograma o histograma de frecuencias, consiste en un conjunto de rectángulos con: a) Base en el eje X horizontal, centros en la marca de clase y longitudes iguales a los tamaños de los intervalos de clase. b) Área proporcional a las frecuencias de clase. Si los intervalos de clase tienen todos la misma anchura, las alturas de los rectángulos son proporcionales a las frecuencias de clase. En caso contrario, deben ajustarse las alturas. Un polígono de frecuencias es un gráfico de trozos de la frecuencia de clase con relación a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectángulos del histograma. 3.7- DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS La frecuencia relativa de una clase es su frecuencia dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje. La suma de frecuencias relativas sabemos que suman 1 o 100. La representación gráfica de distribución de frecuencias relativas se puede obtener del histograma o polígono de frecuencias sin más que cambiar la escala vertical de frecuencias a frecuencias relativas o histograma de porcentajes, y polígonos de frecuencias relativas o polígono de porcentajes, respectivamente. 3.8- DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS Y OJIVAS La frecuencia total de todos los valores menores que la frontera de clase superior de un intervalo de clase dado se llama frecuencia acumulada hasta ese intervalo de clase inclusive. 33 Una tabla que presente tales frecuencias acumuladas se llama una distribución de frecuencias acumuladas, tabla de frecuencias acumuladas o brevemente una distribución acumulada. Un gráfico que recoja las frecuencias acumuladas por debajo de cualquiera de las fronteras de clase superior respecto a dicha frontera se llama polígono de frecuencias acumuladas u ojiva. yi'-1 -yi' 50 – 125 125 – 200 200 – 275 275 – 350 Hi 0.30 0.55 Ni 50 -- 125 125 -- 200 200 -- 275 275 -- 350 25 20 0.70 15 1.00 10 5 qq 0 50 -- 125 125 -- 200 200 -- 275 275 -- 350 HI 1.20 1.00 0.80 0.60 0.40 0.20 0.00 qq 34 Estas son las ojivas ascendentes y descendentes. H'i 50 -- 125 125 -- 200 200 -- 275 275 -- 350 1.20 1.00 0.80 0.60 0.40 0.20 qq 0.00 N'i 50 -- 125 125 -- 200 200 -- 275 275 -- 350 25 20 15 10 5 qq 0 3.9- TIPOS DE CURVAS DE FRECUENCIAS Las curvas de frecuencias que aparecen, en la práctica adoptan formas características como son: 1- Las curvas de frecuencias simétricas o en forma de campana, se caracterizan porque las observaciones equidistantes del máximo central tienen la misma frecuencia. Ejemplo importante es la curva normal. 2- En las curvas de frecuencia poco asimétricas, o sesgadas, la cola de la curva a un lado del máximo central es más larga que al otro lado. Si la cola mayor está a la derecha, la curva se dice asimétrica a la derecha o 35 asimétrica positiva. En caso contrario, se dice asimétrica a la izquierda o asimétrica negativa. 3- En una curva en forma de J o de J invertida, hay un máximo y un extremo 4- Una curva de frecuencia en forma de U tiene máximo en ambos extremos. 5- Una curva de frecuencia bimodal tiene dos máximos. 6- Una curva de frecuencia multimodal tiene más de dos máximos. 36 PARA RECORDAR: La representación gráfica es un medio eficaz para el análisis de las estadísticas. La representación gráfica puede hacerse utilizando un sistema geométrico de representación, en cuyo caso tiene las propiedades de rigurosidad y precisión, o bien puede utilizarse símbolos alusivos al tema de estudio, como por ejemplo árboles, casas, automóviles, figuras humanas, etc. El Sistema Cartesiano esta formado por un par de ejes, uno vertical y otro horizontal que se cortan en un ángulo recto. El gráfico circular como su nombre lo indica constituye en representar los datos de una investigación estadística en el interior de un círculo o pastel. El gráfico de barras se dibuja en un par de ejes cartesianos; en el de las abscisas se toman los valores distintos de la variable y en el de la ordenada, las frecuencias. Los histogramas y los polígonos de frecuencias son dos representaciones gráficas de las distribuciones de frecuencias. Un polígono de frecuencias es un gráfico de trozos de la frecuencia de clase con relación a la marca de clase. La frecuencia relativa de una clase es su frecuencia dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje. Un gráfico que recoja las frecuencias acumuladas por debajo de cualquiera de las fronteras de clase superior respecto a dicha frontera se llama polígono de frecuencias acumuladas u ojiva. EVALUACIÓN DEL APRENDIZAJE: Realice los siguientes ejercicios a- Realice el gráfico de barras en función de los siguientes datos: Pies Perforados por Petroproducción en 1998 Cuyabeno Cononaco Shushufindi Sacha Lago Agrio Sacha II 8.000 10.820 9.445 10.028 10.140 9.980 b- Realice el gráfico de pastel o circular en base a los siguientes datos Materia Prima Total Procesada en el País en diciembre de 1998 en barriles 37 Refinería Esmeraldas Refinería la Libertad Refinería Amazonas Refinería Lago 2’692.956 1’040.714 628.335 4’362.005 c- En la siguiente tabla se muestra la distribución de cargas máximas en toneladas cortas (1 tonelada corta = 2000 Lb), que soportan los cables producidos por cierta fabrica. Realice la distribución de frecuencias acumuladas y ojivas ascendentes y descendentes. Carga Máxima (Toneladas Cortas) Número de Cables Y’i-1 ------------- Y’i ni 9.5 10.5 7 10.5 11.5 5 11.5 12.5 12 12.5 13.5 17 13.5 14.5 14 14.5 16.5 6 16.5 17.5 3 17.5 18.5 4 68 38 CAPITULO IV COMPETENCIA ESPECÍFICA Domina la base conceptual y analítica sobre las medidas de tendencia central; aplica y resuelve ejercicios. ORIENTACIONES DE ESTUDIO Por tratarse de una Unidad técnica, se recomienda a los y las estudiantes que se familiaricen con los conceptos y aplicaciones prácticas de las medidas de tendencia central. Al conocer estos conceptos podrán poner en práctica con ejercicios, ejemplos, y resolución de problemas. Se utilizará la metodología de enseñanza aprendizaje de aprender haciendo. Es importante desarrollar la lectura adicional para completar los conocimientos impartidos en clases. 4- PROMEDIOS O MEDIDAS DE TENDENCIA CENTRAL 4.1- DEFINICIÓN Y CLASES DE PROMEDIOS Al obtener una población de tamaño N, la distribución de frecuencias de una variable, lo que se persigue es reducir o condensar en pocas cifras el conjunto de observaciones relativas a dicha variable. Pero con extremada frecuencia, el proceso de reducción hay que continuarlo hasta su grado máximo, o sea, hasta sustituir todos los valores observados por uno solo, que se llama promedio. Cuando se actúa así se logra por una parte una visión más clara del “nivel” que alcanza la variable y por otra, mayor facilidad al hacer comparaciones. Por ejemplo, la estatura media del soldado ecuatoriano y la estatura media de los oficiales del ejército y la marina. La noción del promedio lleva implícita la idea de variación, ya que no tiene sentido promediar un carácter invariable. Pero el número singular –promedioque a de sustituir al número de observaciones de la población a de cumplir la condición de ser representativo de dicho conjunto, para lo cual a de reflejar la tendencia de las observaciones. De aquí que los promedios también se los denomina Medidas de Tendencia Central. El carácter representativo del promedio exige que su valor esté comprendido, al menos, entre los valores extremos observados de la variable. Las principales son: - Media Aritmética - Mediana - Moda - Media Geométrica - Media Armónica 39 4.2- LA MEDIA ARITMÉTICA Es en número que se obtiene al dividir la suma de todas las observaciones para el número de ellas. La media aritmética es un valor de la variable, posiblemente no observable, que viene dado en la misma unidad de medida que la variable. La media aritmética es un estadígrafo de tendencia central que nos proporciona un promedio con respecto al total de los datos de una investigación estadística, su símbolo es __ __ ó: yMyi x La X o Ā se utiliza para datos originales y la siguiente para datos agrupados Y oĒ 4.2.1- ANÁLISIS DE LA MEDIA ARITMÉTICA CON VARIABLE DISCRETA La media aritmética, o simplemente media, de un conjunto de N números X1, N x ..... X x x x x x N N N __ 1 2 1 Nj 3 j Así por ejemplo, la media aritmética de los números 8, 3, 5, 12 y 10 es: Ā = (8+3+5+12+10)/5 ) = 38/5 = 7.6 Ahora bien, si los números X1, X2, ….., Xk ocurren k1, k2, ….., k veces, respectivamente (o sea con frecuencia f1, f2, ….., fk ), la media aritmética es: k j x 1 2 .... k X X x x x X 1 2 .... k N j 1 2 k j 1 k j j 1 Donde N = es la frecuencia total o sea, el número total de casos. 40 Por ejemplo, si 5, 8, 6 y 2 ocurren con frecuencia 3, 2, 4, y 1 respectivamente, su media aritmética es: Ā = [(3)(5) + (2)(8) + (4)(6) + (1)(2)] / [3 + 2 +4 +1] Ā = (15 + 16 + 24 + 2) / 10 = 5.7 Ejercicio: Los presentes datos son una muestra de las edades que poseen 10 estudiantes del Colegio CENTEBAD: X1: 24 X2: 18 X3: 16 X4: 22 X5: 19 X6: 18 X7: 22 X8: 17 X9: 22 X10: 20 Xi X N Ā= (24+18+16+22+19+18+22+17+22+20)/10 = 198/10 = 19.8 La edad promedio de los estudiantes del Colegio CENTEBAD es de 19.8 años. 4.2.2- MEDIA ARITMÉTICA PONDERADA A veces asociamos con los números X1, X2, …., Xk ciertos factores peso W1, W2, ….., Wk, dependientes de la relevancia asignada a cada número. En tal caso, ... WX w x w x w x 1 1 2 2 k k X ... W w w w 1 2 k Se llama la media aritmética ponderada con peso w1, w2, …., wk. Por ejemplo si el examen final de un curso cuenta 3 veces más que una evaluación parcial, y un estudiante tiene calificación 85 en el examen final y 70 y 90 en los dos parciales, la calificación media es: Ā = [(1)(10)+(1)(90)+(3)(85)]/(1+1+3)=415/5)=83 4.2.3- ANÁLISIS DE LA MEDIA ARITMÉTICA CON VARIABLE CONTINUA Cuando los datos se presentan en una distribución de frecuencias, todos los valores que caen dentro de un intervalo de clase dado se consideran iguales a la marca de clase, o punto medio, del intervalo. Las formulas antes enunciadas son válidas para tales datos agrupados si interpretamos Xj como la marca de clase, nj como su correspondiente frecuencia de clase, A como cualquier marca de clase conjeturada y dj = Xj - A como la desviación de Xj respecto de A. 41 Si todos los intervalos de clase tienen idéntica anchura c, las desviaciones dj = k ju j u j 1 xA c N A N Xj – A pueden expresarse como cuj, donde uj puede ser 0, ± 1, ±2, ±3, …., se obtiene la formula: Que es equivalente a la ecuación X = A + cū. Esto se conoce como método de compilación para calcular la media. Es un método muy breve y debe usarse siempre para datos agrupados con intervalos de clase de anchuras iguales. Nótese que en método de compilación los valores de la variable u de acuerdo con X = A + cu. Ejercicio. El nivel de ingresos mensual curso de estadística es: Xi: 320 180 150 350 300 en dólares de las familias de los estudiantes del 200 200 200 300 350 250 300 800 110 450 380 450 200 250 300 a) Media Aritmética de datos originales: Ā = (∑xi)/N = 6040/20 = 302 El ingreso promedio mensual de las familias de los estudiantes del curso de estadística es de 302 dólares. b) Media Aritmética de datos agrupados Lím. máx.: 800 Lím. mín.: 110 320 180 150 350 300 200 200 200 300 350 250 300 800 110 450 380 450 200 250 300 42 Lim, Máx.: Lim, Mín.: r= C = r/m 800 110 690 C = 690/4 m 1 2 3 4 TOTAL Divisb. ==> 2 3 4 5 10 m=4 172.5 yi'-1 -- yi' 110 282.5 282.5 455 455 627.5 627.5 800 yi 196.25 368.75 541.25 713.75 ni 9 10 0 1 20 Yi.ni 1766.25 3687.5 0 713.75 6167.5 yi .ni y n ==> 6167.5/20 = 308.375 El ingreso promedio mensual de las familias de los estudiantes del curso de Estadística clasificados en 4 grupos es de $ 308.375 dólares al mes. Cabe mencionar que mientras mayor sea el número de intervalos el resultado de los datos agrupados se va acercarse al resultado de los datos originales. En la variable continua no siempre la media aritmética de datos originales coincide con la media aritmética de datos agrupados, porque al trasladar los datos originales a la tabla de frecuencias se pierde alguna información de acuerdo a los intervalos que se hayan escogido. 4.2.4- PROPIEDADES DE LA MEDIA ARITMÉTICA 1) La media aritmética es el centro de gravedad de los datos y lo expresamos con: ∑(Xi - Ā) = 0 ∑(Xi-Ā)=Zi ∑Zi.ni = 0 Por ejemplo en el ejercicio del ingreso de las familias los datos eran: 43 320 180 150 350 300 200 200 200 300 350 250 300 800 110 450 380 450 200 250 300 Y la media aritmética es 302, las desviaciones son entonces: Ā Xi 320 180 150 350 300 380 450 200 250 300 200 200 200 300 350 250 300 800 110 450 6040 302 302 302 302 302 302 302 302 302 302 302 302 302 302 302 302 302 302 302 302 (Xi – Ā) 18 -122 -152 48 -2 78 148 -102 -52 -2 -102 -102 -102 -2 48 -52 -2 498 -192 148 0 La suma de las desviaciones con respecto a la media aritmética es nula, o cero. 2) La media aritmética de los valores de una variable, no varían sino todas las frecuencias de su distribución se multiplican o dividen por un mismo número. Esta propiedad sirve para calcular la media aritmética con las frecuencias relativas simple o con porcentajes. El resultado es el mismo: En el ejemplo del ingreso de las familias en datos agrupados la media aritmética es de 308.375 dólares. M 1 2 3 4 yi'-1 -- yi' 110 282.5 282.5 455 455 627.5 627.5 800 yi 196.25 368.75 541.25 713.75 ni hi 9 10 0 1 20 0.45 0.50 0.00 0.05 1 yi.hi 88.3125 184.375 0 35.6875 308.375 PARA RECORDAR: 44 La noción del promedio lleva implícita la idea de variación, ya que no tiene sentido promediar un carácter invariable. Pero el número singular –promedioque a de sustituir al número de observaciones de la población a de cumplir la condición de ser representativo de dicho conjunto, para lo cual a de reflejar la tendencia de las observaciones. La media aritmética es un estadígrafo de tendencia central que nos proporciona un promedio con respecto al total de los datos de una investigación estadística, su símbolo es x __ ó: y M yi La media aritmética, o simplemente media, de un conjunto de N números X1, N x j ..... X 1 x x x 2x 3 N j x N N N __ 1 Ahora bien, si los números X1, X2, ….., Xk ocurren f1, f2, ….., fk veces, respectivamente (o sea con frecuencia f1, f2, ….., fk ), la media aritmética es: k j x j 1 2 .... k X X x x x 1 1 2 k j X k N 1 2 .... k j j 1 La ecuación de la media aritmética ponderada es: ... WX w x w x w x 1 1 2 2 k k X ... W w w w 1 2 k EVALUACIÓN DEL APRENDIZAJE: Realice los siguientes ejercicios: a- Calcular la media aritmética de los ingresos mensuales de los ecuatorianos del área artesanal de la provincia de Imbabura. 136, 98, 110, 142, 122, 117, 93, 90, 125, 129, 149, 132, 134, 140, 105 b- El examen final de grado de sexto curso vale 4 veces más que un aporte y un examen trimestral vale 2 veces más que un aporte, un estudiante obtiene la nota de 75 en el examen final, 68 en los exámenes trimestrales y 95 en los aportes. Cuál es la calificación media? c- La siguiente tabla muestra la distribución de los diámetros de los remaches salidos en una fábrica. Calcular el diámetro medio. 45 Diámetro (m.m) Y’i-1 --------- Y’i 247 250 253 256 259 262 265 268 271 274 277 280 250 253 256 259 262 265 268 271 274 277 280 282 Frecuencia s ni 2 6 8 15 42 68 49 25 18 12 4 1 46 CAPITULO V COMPETENCIA ESPECÍFICA Domina la base conceptual y analítica sobre los estadígrafos de posición; aplica y resuelve ejercicios. ORIENTACIONES DE ESTUDIO Por tratarse de una Unidad técnica, se recomienda a los y las estudiantes que se familiaricen con los conceptos de los estadígrafos de posición, sus usos y aplicaciones; además deben llegar a conocer y dominar el manejo de los estadígrafos de posición, el cálculo de datos originales y datos agrupados. Al conocer estos elementos y conceptos podrán poner en práctica con ejercicios, ejemplos, y resolución de problemas. Se utilizará la metodología de enseñanza aprendizaje de aprender haciendo. Es importante desarrollar la lectura adicional para completar los conocimientos impartidos en clases. 5- ESTADÍGRAFOS DE POSICIÓN 5.1- LA MEDIANA Si todos los valores de la variable se ordenan en sentido creciente o decreciente, la mediana es el valor que ocupa el lugar central, o sea, el que deja a un lado y al otro el mismo número de observaciones. La mediana es un conjunto de números ordenados en magnitud es o el valor central o la media de los dos valores centrales. La mediana es un estadígrafo de tendencia central que nos marca una posición tal que nos asegura que supera no más del 50% de los datos de una investigación estadística y a la vez es superado por no más del 50% de las observaciones. Me es el símbolo de la mediana 5.1.1- CÁLCULO PARA DATOS ORIGINALES Primer Caso: cuando el número de datos n es impar; por ejemplo, notas obtenidas por los estudiantes del aula 5° contabilidad. 47 6, 7, 8, 10, 10, 10, 10, 8, 7, 8, 6, 8 a- Ordenar los datos en forma ascendente 1 2 3 4 5 6 7 8 9 10, 6 7 7 8 8 8 8 10 10 10, 10 11 b- Ubicamos el número de orden que le corresponde a la mediana aplicando la formula: n + 1 2 (11+1) / 2 Me = 12/2 en n Me = 8 Me=6 en n entonces la mediana es 8; El 50% de los estudiantes del aula 5° obtendrán una nota de 6 a 8, en el primer quimestre y el 50% restante de estudiantes obtendrán una nota de 8 a 10 puntos. Segundo Caso: Cuando el número de datos n es par En el mismo ejemplo anterior: 8, 10, 10, 10, 8, 5, 8, 9, 5, 10, 8, 7, 5, 7, 10, 9 a- Ordenamos en forma ascendente 1 2 3 4 5 6 7 5 5 5 7 7 8 8 8 9 10 8 8 9 9 11 12 13 14 10 10 10 10 10 15 16 b- Ubicamos mediante la fórmula: n + 1 2 (16+1) / 2 Me = 17/2 en n Me=8,5 en n; tomamos los valores intercalados que son 8 y 8 y dividimos para 2 Me = 8 + 8 = 8 2 El 50% de los estudiantes del aula 5° contabilidad obtendrán una nota de 5 a 8 en el primer quimestre, mientras que el 50% restante obtendrán notas de 8 a 10 5.1.2- CÁLCULO PARA DATOS AGRUPADOS En este tipo de distribución no puede observarse exactamente la mediana porque se desconocen las observaciones singulares de la variable. Pero una aproximación se puede obtener mediante la siguiente fórmula: n j 1 2N Me C y 'i1 nj 48 Donde: Me= Mediana Y’i-1= frontera inferior de la clase de la mediana C= Anchura del intervalo de clase de la mediana n= número de datos, o frontera total Nj= Frecuencia simple acumulada Nj > n/2 nj= Observaciones hasta Nj Nj-1 = Frecuencia simple acumulada anterior a Nj Ejemplo de acuerdo al ejercicio anterior: En base a las siguientes datos que corresponden a los salarios semanales de un grupo de trabajo medidas en dólares (sector industrial textil) de la ciudad de Quito. Calcular e interpretar la media aritmética y comprobar las propiedades de la misma, si suponemos que existe un decreto ejecutivo por el cual se sube todos los salarios semanales en un dólar a nivel general, y adicionalmente por efectos de negociación de contratos colectivos al sector industrial textil se duplican sus salarios semanales, con el objeto de aumentar la productividad para competir en el mercado andino, los datos que se obtuvieron son: M 1 2 3 4 5 Yi'-1 -- yi' 4 10 10 16 16 22 22 28 28 34 Yi 7 13 19 25 31 Ni 25 20 15 10 10 80 Ni 25 45 60 70 80 N'i 80 55 35 20 10 Hi 0.313 0.250 0.188 0.125 0.125 1 Zi -9 -3 3 9 15 Zi.ni -225 -60 45 90 150 Ui -2 -1 0 1 2 Ui.ni -50 -20 / 10 20 -40 Yi.ni 175 260 285 250 310 Yi.hi 2.1875 3.2500 3.5625 3.1250 3.8750 Z'i -12 -6 0 6 12 1280 n j 1 2N Me C y 'i1 nj Nj > 80/2 Nj > 40 45 > 40 Me = 10 + 6x 40-25 20 Me = 10 + 6x 15 20 Me = 10 + 6x0,75 Me = 10+4.5 Me = 14,5 El 50% de los trabajadores del sector textil de quito tienen un salario por hora de 4 a 14.5 dólares y el 50% restante ganan de 14.5 a 34 dólares. 49 Z'i.ni -300 -120 420 60 120 Ā = Ot – K Ā = 19-3 Ā = 16 El salario promedio de los trabajadores del sector industrial textil de Quito es de 16 dólares. Como una aplicación de la mediana aparecen los cuartiles, deciles y los percentiles Estos estadígrafos de orden dividen a los datos de una investigación estadística en tantas partes iguales de acuerdo al objetivo de percilavos. 5.2- LOS CUARTILES Aquellos dividen a los datos de la investigación en 4 partes iguales conteniendo cada parte el 25% de los datos. Su fórmula es: mn j 1 4 N Qm C y 'i1 nj Ejemplo: calcular el cuartil 3, Q3 Nj>3n/4 Nj>3.80/4 Nj>60 3 n N j 1 4 Q 3 C y 'i1 nj Q3 = 22 +6. 60 - 60 10 Q3 = 22 +6. 0 10 Q3 = 22 El 75% de los trabajadores textiles de Quito, ganan de 4 a 22 dólares mientras que el 25% restante ganan de 22 a 34 dólares. 50 5.3- LOS DECILES Son estadígrafos de orden que dividen a los datos de la investigación estadística en 10 partes iguales, las cuales contienen el 10% de los datos. Su fórmula es: mn N j 1 10 Dm C y 'i1 nj Ejemplo: cálculo del decil 6, D6 Nj > 6n/10 Nj >6.80/10 Nj > 48 60 > 48 6 n N j 1 10 D 6 C y 'i1 nj D6 = 16 + 6. 48-45 15 D6 = 16 + 1,2 D6 = 17.2 El 60% de los trabajadores textiles ganan de 4 a 17.2 dólares mensuales y el 40% restante ganan de 17.2 dólares a 34 dólares mensuales. 5.4- LOS PERCENTILES Aquí los valores se dividen en 100 partes iguales, por lo que se los llama también Centiles y se denotan por P1, P2, P3, ….., P99. El quinto decil y el cincuentavo percentil coinciden en la mediana. El 25° y el 75° percentiles coinciden con el primer y tercer cuartil. Su formula es: mn N j 1 100 Pm C y 'i 1 nj 51 Calcular el percentil 35 Nj > (35n)/100 Nj > (35.80)/100 Nj > 2800/100 Nj > 28 45 > 28 P35= 10+6x 28-25 20 P35=10+6x3/20 P35=10+0.9 P35=10.9 El 35% de los trabajadores de la industria textil ganan entre 4 y 10.9 dólares mientras que el 65% ganan entre 10.9 y 34 dólares. 5.5- LA MODA Es un estadígrafo de tendencia central o de posición que nos indica el valor más observado en una investigación estadística. 5.5.1- MODA POR OBSERVACIÓN Ejemplo: Notas de los alumnos de cuarto contabilidad. 9, 5, 7, 8, 8, 8, 7, 8, 8, 8 Por simple observación la moda es 8. La mayoría de los estudiantes obtendrán una nota de 8 sobre 10 es estadística en el primer Quimestre. 5.5.2- MODA BIMODAL Ejemplo: Notas de los alumnos de cuarto contabilidad. 7, 9, 5, 7, 8, 8, 8, 7, 8, 8, 8, 7, 7, 7 La mayoría de los estudiantes sacarán notas de 7 y 8 en estadística. 5.5.3- MODA EN DATOS AGRUPADOS No puede observarse con exactitud, por desconocerse los valores realmente observados de la variable. Con la siguiente formula podemos obtener un valor más o menos aproximado. Pero no deben ser utilizados cuando los intervalos tienen la misma amplitud. En este caso la línea i del cuadro es aquella la mayor frecuencia; ni-1 y ni+1 i 1 Mo C . n Y 'i1 i n i 1n 1 son las frecuencias anteriores y posteriores Y’i-1; el límite inferior del intervalo correspondiente a la línea i y C la amplitud que es igual a todos los intervalos. 52 Ejemplo. El salario por hora de 160 obreros clasificados y tabulados son: Y'i-1 – Y’i 4 8 12 16 20 24 28 32 ni 3 12 40 47 32 13 9 4 160 8 12 16 20 24 28 35 36 Ni 3 15 15 102 134 147 156 160 Como se puede apreciar la mayor frecuencia es 47, luego: Que indica que la mayoría de los trabajadores perciben un salario de 17.78 dólares 32 Mo 16 4 . 17 . 78 40 32 La moda es un estadígrafo de tendencia central o de posición que nos indica el valor más observado en una La fórmula para calcular moda en datos agrupados es: i 1 Mo C . n Y 'i1 i n i 1n 1 EVALUACIÓN DEL APRENDIZAJE: 1- Realice los siguientes ejercicios: a- Calcule la mediana de: 16, 18, 17, 11, 18, 11, 10, 18, 17, 19, 11, 14, 13, 11, 17 b- Calcule la mediana de: 235, 239, 237, 233, 231, 239, 235, 237, 239, 240, 239, 236 c- De la siguiente tabla muestra una distribución de frecuencias de las notas obtenidas en una prueba de matemáticas, hallas los cuartiles de la distribución e interpretar sus significados: 53 Grado Y’i-1 ---- Y’i 30 40 50 60 70 80 90 Número de estudiantes 40 50 60 70 80 90 100 3 6 11 21 43 32 9 125 d- Hallar los deciles e interpretar cada una de ellos, en base a la siguiente tabla, que representa los números de errores milimétricos en los tornillos de ⅜ producidos por diferentes máquinas. Errores milimétricos Y’i-1 ------ Y’i 0.207 0.214 0.214 0.221 0.221 0.228 0.228 0.235 0.235 0.242 0.242 0.249 0.249 0.256 Observaciones 5 4 16 14 11 8 7 e- Encontrar la moda e interpretar, de las siguientes medidas de pantalones que se venden en un centro comercial. 34, 32, 28, 34, 36, 40, 38, 32, 34, 36, 34, 32, 38, 34, 32, 38, 28, 34, 32, 34 54 CAPITULO VI COMPETENCIA ESPECÍFICA Domina la base conceptual y analítica sobre otros estadígrafos de posición; aplica y resuelve ejercicios. ORIENTACIONES DE ESTUDIO Por tratarse de una Unidad técnica, se recomienda a los y las estudiantes que se familiaricen con los conceptos de otros estadígrafos de posición, tales como la Media Armónica, la Media Geométrica y la Media Cuadrática. Al conocer estos conceptos podrán poner en práctica con ejercicios, ejemplos, y resolución de problemas. Se utilizará la metodología de enseñanza aprendizaje de aprender haciendo. Es importante desarrollar la lectura adicional para completar los conocimientos impartidos en clases. 6- OTROS ESTADÍGRAFOS DE POSICIÓN 6.1- LA MEDIA ARMÓNICA La media armónica que la representamos con la H, de un conjunto de números X1, X2, X3, ….., Xn es el reciproco de la media Aritmética Ā de los recíprocos de esos números: 1 n H n 1 1 1 X nj1 X j En la práctica es más fácil recordar que: 1 1 1 H X n n X Por ejemplo la media armónica de los números 2, 4 y 8 es: 3 3 H 3 .43 111 7 2 48 8 Otro ejemplo puede ser: Durante 4 años sucesivos, una familia compró el gas para su calefacción a $0.80, $0.90, $1.05, $1.25 por cilindro respectivamente. Hallar el costo medio del gas en ese período? 4 H 0 . 975 1 1 1 1 0 . 80 . 9 1 . 05 1 . 25 55 Que al comparar con la media aritmética en el supuesto caso que la familia gasta cada año la misma cantidad de dinero en gas, digamos unos $ 1000 entonces: Costo medio = Costo total = $ 4000 = 0.975 Cantidad total adquirida 1250+1111+925+800 6.2- MEDIA GEOMÉTRICA Se define a la media geométrica, de una distribución de datos como la raíz enésima del producto de los n valores de la distribución. La media geométrica G de un conjunto N números positivos X1, X2, X3, …, Xn es la raíz N-ésima del producto de esos números: n G .... x x 1 2x 3 x n Esta se utiliza para datos originales, mientras que para datos agrupados podemos usar: n n n k 1 2 n G . .... X k 1X 2 X El cálculo de la G se hace recurriendo al empleo de logaritmos y no es aplicable cuando la variable toma valores negativos. Hallar la media geométrica de los números 3, 5, 6, 6, 7, 10 y 12. 7 7 G ( 3 )( 5 )( 6 )( 6 )( 7 )( 10 )( 12 ) 453 , 600 Log G= 1/7 .Log 453,600 = 1/7 . (5.6567) = 0,8081 y G=6,43 (a la centésima). Alternativamente, puede usarse una calculadora. Otro método podría ser: Log G=1/7(log 3+log 5+log 6+log 6+log 7+log 10+log 12) Log G=1/7(0.4771+0.6990+0.7782+0.7782+0.8451+1.000+1.0792) Log G=0.8081 G=6.43 Para datos agrupados su cálculo se haría de la siguiente forma de acuerdo al ejercicio anterior 56 M Yi'-1 -- Yi Ni Ni N'i Hi yi' 1 4 10 7 25 25 80 0.3 13 2 10 16 13 20 45 55 0.2 50 3 16 22 19 15 60 35 0.1 88 4 22 28 25 10 70 20 0.1 25 5 28 34 31 10 80 10 0.1 25 80 1 n n n k 1 2 n G . .... X k 1X 2 X 252015 1010 80. G . . . ( 19 ) ( 25 ) ( 31 ) 7 13 80 G 1 . 3410686 64 e 1 1 . 900496 88 e 22 1 . 5181 87 e 19 9 . 536 63 e 13 8 . 19 0 e 1 80 G 3 . 0243990003 86 e 91 G= 13.91579391835 Otra forma seria Log G=1/80.(log1.341068619664e+24 + log1.900496377488e+22 + log1.518112702987e+19 + log9.536743164063e+13 + log8.196282869808e+14 Log G=1.143507988573 G=13.91579391835 6.3- MEDIA CUADRÁTICA A veces la variable toma valores positivos y negativos como ocurre por ejemplo, en los errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo; en el caso de los errores por ejemplo, se puede desear un error medio prescindiendo del signo. Este problema se resuelve, entre otros procedimientos, mediante la llamada media cuadrática que la representa remos por C. Consiste en elevar al cuadrado todas las observaciones para que desaparezcan los signos 57 negativos, luego obtener su media aritmética y extraer finalmente la raíz cuadrada y regresamos a la unidad de medida original. La formula de la media cuadrática para el caso de datos originales es: 2 2 .... X X X 1X n i C n n 2 2 2 Y la formula de la media cuadrática para el caso de datos agrupados es: 2 .... n n n X X n X 1 2 k 1 2 X k i i C n n 2 2 2 Por ejemplo la media cuadrática del conjunto 1, 3, 4, 5 y 7 es: C= 3 5 7 1 4 20 4 . 47 2 2 2 2 2 5 O por ejemplo en el caso de nuestro ejercicio de datos agrupados tenemos: m 1 2 3 4 5 Yi'-1 -- yi' 4 10 10 16 16 22 22 28 28 34 Yi 7 13 19 25 31 ni 25 20 15 10 10 80 Ni 25 45 60 70 80 N'i 80 55 35 20 10 Hi 0.313 0.25 0.188 0.125 0.125 1 Yi2 49 169 361 625 961 2165 Yi2.ni 1225 3380 5415 6250 9610 25880 2 25880 ni Yi C 323 . 5 17 . 986 n 80 58 PARA RECORDAR: LA MEDIA ARMÓNICA es el conjunto de números X1, X2, X3, ….., Xn es el reciproco de la media Aritmética Ā de los recíprocos de esos números, su 1 n H n 1 1 1 fórmula es: X nj1 X j LA MEDIA GEOMÉTRICA Se define a la media geométrica, de una distribución de datos como la raíz enésima del producto de los n valores de la distribución. Sus formulas son: n Para datos originales G xxx.... x Para datos agrupados 1 2 3 n n n n k 1 2 n G . .... X X X k 1 2 MEDIA CUADRÁTICA Consiste en elevar al cuadrado todas las observaciones para que desaparezcan los signos negativos, luego obtener su media aritmética y extraer finalmente la raíz cuadrada y regresamos a la unidad de medida original. Y la formula de la media cuadrática para el caso de datos agrupados es: .... X X X X C 2 2 2 1 2 n n 2 i n O por ejemplo en el caso de nuestro ejercicio de datos agrupados tenemos: .... n n n X X X n X C 2 2 2 1 1 2 2 kk n 2 ii n EVALUACIÓN DEL APRENDIZAJE: 1- Calcular la media armónica de la velocidad alcanzada en un circuito de carreras por 3 automóviles cuya velocidad respectiva es: V1 = 150 Km/h. V2 = 175 Km/h. V3 = 185 Km/h. 2- Calcular la media armónica de la variación de potencia de 6 motores P1 = 10 HP 59 P2 = 15 HP P3 = 14 HP P4 = 11 HP P5 = 17 HP P6 = 21 HP 3- Hallar la media geométrica ponderada de una distribución de datos obtenida al anotar el número de veces que un dado ha encontrado una de las 6 posiciones posibles en 30 lanzamientos. Valores Posibles 1 2 3 4 5 6 N° Efectivo s 4 5 6 3 7 5 4- Los pesos de una muestra de paquetes de que se cargan en un avión de carga pesados en Kilos son 10, 16, 25, 18, 13, 21, 9, 22, 19, 12. Determine la media geométrica, la mediana y la moda. 5- La siguiente tabla indica una muestra del número de pedidos de cajas de tabaco por los establecimientos comerciales de la ciudad de Quito. Calcule la media aritmética, la moda y la media geométrica Cajas Pedido s 2-7 10 7-12 5 12-17 9 17-22 5 22-27 3 6- De una nuestra de consumidores de tabaco se obtuvieron los siguientes datos de consumo diario por unidades. Calcule la Moda e interprete y la media cuadrática. Cajas 5-11 11-17 17-23 23-29 17-22 22-27 Pedido s 15 11 9 8 4 6 7- Calcule la media cuadrática de 5, 2, 6, 9, 7, 4 60 CAPITULO VII COMPETENCIA ESPECÍFICA Domina la base conceptual y analítica sobre los estadígrafos de dispersión; aplica y resuelve ejercicios. ORIENTACIONES DE ESTUDIO Por tratarse de una Unidad técnica, se recomienda a los y las estudiantes que se familiaricen con los conceptos de los estadígrafos de dispersión, sus usos y aplicaciones. Al conocer estos conceptos podrán poner en práctica con ejercicios, ejemplos, y resolución de problemas. Se utilizará la metodología de enseñanza aprendizaje de aprender haciendo. Es importante desarrollar la lectura adicional para completar los conocimientos impartidos en clases. 7- ESTADÍGRAFOS DE DISPERSIÓN. 7.1- LA DISPERSIÓN Y SU MEDIDA Un promedio resume todos los valores observados en uno solo que los representa; su utilidad depende por tanto, de su representatividad del conjunto de observaciones. Si los valores observados de la variable están muy concentrados alrededor del promedio, este es muy representativo; pero si estos valores están muy dispersos con relación al promedio, será muy poco representativo. En consecuencia, el significado de un promedio gana mucho si viene acompañado de una media de la concentración o dispersión de las observaciones en torno a él. Las palabras “concentración” y “dispersión” se refieren a los aspectos contrarios del mismo fenómeno. El problema lo plantearemos con el siguiente ejemplo: supongamos dos familias de dos personas cada una; el consumo diario de calorías de las personas de la primera familia es de 1500 y 4500 y el de las personas de la segunda familia es de 2900 y 3100. El consumo medio de calorías de ambas familias diariamente es 3000, cabe concluir entonces que las dos tienen el mismo nivel calórico. Esto es verdad, además, en la segunda familia el promedio Ā en este caso, es más representativo que en la primera. Pero esta última conclusión puede sacarse porque se dispone de las observaciones primarias porque éstas son pocas y puede deducirse con facilidad la característica de dispersión. Otro ejemplo puede ser el siguiente chiste: “Si yo me como dos pollos y tu no te comes ninguno, la estadística demuestra que cada uno hemos comido un 61 pollo”. Aquí se ha prescindido de la idea de dispersión y se razona exclusivamente con el promedio, porque estos solamente dan un valor central de la variable y prescinden de la magnitud de su variabilidad o dispersión. Puede observase que se ha hablado de la dispersión como algo ligado a un promedio, como una medida para conocer su representatividad. Sin embargo, la dispersión existe con independencia de los promedios. Los caracteres –atributos o variables- no suelen permanecer constantes, estables al pasar de un elemento de población a otro. No todas las personas tienen la misma estatura, ni los mismos ingresos, ni el mismo lugar de nacimiento, etc. Si no existiera esta variabilidad, la estadística se reduciría a muy poca cosa, esta variabilidad es su esencia ya que esta técnica persigue conocer las regularidades existentes en dicha variabilidad. La existencia de la variabilidad en los valores de una variable es la que origina las distribuciones de frecuencias, cuyas representaciones gráficas suelen expresar más perceptiblemente que los números, la concentración o dispersión de las observaciones. Un gráfico bien leído proporciona una idea bastante completa de la dispersión, pero para ser bien leído no hay olvidar lo dicho a propósito de las escalas, porque una misma distribución puede tener una representación gráfica muy concentrada o muy dispersa, aparentemente, si se utilizan escalas diferentes. Un ejemplo lo tenemos en los siguientes gráficos: OBREROS CLASIFICADOS POR SUS SALARIOS Paga por hora No. de obreros Variable Frecuencia 4-8 3 8 – 12 12 12 - 16 40 16 - 20 47 20 - 24 32 24 - 28 13 28 - 32 9 32 - 36 4 TOTAL 160 62 60 40 20 0 4-8 20 - 24 8 - 12 24 - 28 12 - 16 28 - 32 16 - 20 32 - 36 En este primer gráfico se tiene la sensación de que los datos están muy dispersos mientras que en el siguiente que los datos están muy concentrados; no obstante como se puede observar comparando las escalas, corresponden a una misma distribución. 60 55 50 45 40 35 30 25 20 15 10 5 0 4-8 8 - 12 12 - 16 24 - 28 28 - 32 32 - 36 16 - 20 20 - 24 Cundo se quiere saber la dispersión de una variable, lo que se intenta es obtener una medida y un número, que indique el mayor o menor grado de dispersión. Las medidas más conocidas son la desviación estándar y recorrido que vienen expresadas en la misma unidad que la variable; también es frecuente el uso del coeficiente de variación, que viene expresado como porcentaje. La más usada es la primera medida. 63 7.2- DESVIACIÓN MEDIA La desviación o desviación promedio, de un conjunto de n números X1, X2, …., Xn es abreviada por MD y se define como: n X x X X j 1 j MD X X n n Donde X o Ā es la media aritmética de los números y │Xj - X │ ex el valor absoluto de la desviación de Xj respecto de X . ( El valor absoluto de un número es el número sin signo y se denota con dos barras verticales; así │-4 │= 4, │ +3 │=3, │6 │= 6 y │ -0.56 │= 0.56 Por ejemplo; hallar la desviación media del conjunto 2, 3, 6, 8, 11 Primero extremos la media aritmética: X =(2+3+6+8+11)/5 = 6 y posterior mente la desviación media: DM = │ 2-6 │+│ 3-6 │+│ 6-6 │+│ 8-6 │+│ 11-6 │ = │ -4 │+│ -3 │+│ 0 │+│ 2 │+│ 5 │ 5 5 DM = (4+3+0+2+5)/5 = 2.8 7.3- DESVIACIÓN ESTÁNDAR La medida numérica de la dispersión la podemos obtener a partir de las diferencias de cada valor de la variable con respecto a su media aritmética o con respecto a otro promedio. Simbólicamente estas diferencias se llaman desviaciones y se expresan así: xi - X Como hay n observaciones, habrá n desviaciones como la anterior. Pues bien si los valores de la variable están muy concentrados alrededor de X , entonces las desviaciones xi - X serán pequeñas, y si están muy dispersos, las desviaciones serán grandes. Luego, un promedio de tales desviaciones da un solo número que es expresivo del grado de concentración o dispersión de las observaciones; si hay concentración, el promedio será un número pequeño, y si hay dispersión, el promedio será un número grande. Hay que elegir un promedio para aplicarlo a las n desviaciones; este podría ser la media aritmética, pero en este caso no es aplicable. Para obtener la media aritmética de n números – ahora son las n desviaciones Xi - X -, hay que sumarlos y dividirlos por n, pero la suma de las desviaciones 64 con respecto a la media aritmética, como ya dijimos, es siempre igual a cero, porque se compensan las desviaciones positivas con las negativas. Por tanto la desviación media de todas las desviaciones Xi- X no puede ser una medida de la dispersión porque siempre es igual a cero. El promedio ideal, sin duda, es la media cuadrática, que hay que aplicar ahora, no a los valores X, sino a las desviaciones Xi - X . Esta media cuadrática se denomina desviación estándar y es representada por la letra S. Su fórmula es: ( Xi X ) S 2 N Hay que recordar que la raíz cuadrada de un número es otro número que puede tomarse como signo positivo o negativo, en este caso se usa el signo positivo. S varía desde cero en adelante. Cuando S= 0; todos los valores de Xi son iguales. A medida que S es mayor, la dispersión también es mayor. La desviación estándar es una medida de dispersión de los valores de la variable con respecto a la media aritmética. Para datos originales podemos aplicar directamente la formula anterior, pero es mejor utilizar la siguiente fórmula: 2 Xi Xi S N 2 N Por ejemplo: La edad de 5 personas que conforman una familia son: 8, 26, 23, 19, 44. años Xi Xi2 8 64 19 361 23 529 26 676 44 1936 120 3566 65 2 3566 120 S 137 . 2 11 . 71 5 5 La desviación estándar viene dada por la misma unidad de medida que la variable. Para datos agrupados se utiliza otra formula donde aparecen los valores distintos de la variable. Por tanto cada Xi y cada X12, se multiplican por las frecuencias correspondientes, que es la que indica el número de veces que se repite ese valor distinto: 2 . ni Xi . ni Xi S N 2 N Por ejemplo: Hallar la desviación estándar de la muestra de producción de zapatos de 50 personas que trabajan en una pequeña fábrica artesanal, cuyas frecuencias se expresan en el siguiente cuadro: Xi 1 2 3 4 Total ni Xi.ni Xi2 Xi2 . ni 16 16 1 16 20 40 4 80 9 27 9 81 5 20 16 80 50 103 30 257 Pares de zapatos 2 257 103 0 S 0 . 95 .8964 50 50 Para datos agrupados y en intervalos, como para la media aritmética, no pude obtenerse exactamente la desviación estándar por no conocerse los valores de la variable realmente observados; una aproximación se obtiene transformando cada intervalo por una marca de clase correspondiente y se calcula como en el caso anterior. Por ejemplo, el salario por hora de 160 obreros se clasifica de la siguiente forma: 66 m Yi-1 1 4 2 8 3 12 4 16 5 20 6 24 7 28 8 32 Yi' ni Yi Yi.ni Yi2 8 3 6 18 36 12 12 10 120 100 16 40 14 560 196 20 47 18 846 324 24 32 22 704 484 28 13 26 338 676 32 9 30 270 900 36 4 34 136 1156 160 2992 3872 Yi2.ni 108 1200 7840 15228 15488 8788 8100 4624 61376 2 61376 2992 33 S 5 . 83 .91 160 160 dólares 7.3.1- PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR Si la variable se distribuye normalmente, entonces el intervalo construido sumado y restado a la media aritmética 1.96 veces a la desviación estándar contiene el 95% de las observaciones. Simbólicamente este intervalo se expresa así: X - 1.96S; X + 1.96S Así mismo, si el intervalo se construye sumando y restando a la media aritmética 2.58 veces, la desviación estándar dentro de dicho intervalo está el 99% de las observaciones. Simbólicamente el intervalo será: X - 2.58S; X + 2.59S Esto se aplica para las distribuciones normales, pero también sirve para las campaniformes simétricas y moderadamente asimétricas, en este caso es mejor aplicar a los intervalos, los enteros convirtiendo 1.96 en 2 y 2.58 en 3, así tenemos: X ± 2S X ± 3S Cualquiera de los intervalos, es a su vez, otra medida de dispersión, dada ahora, por su intervalo y no por su valor singular. Si ese intervalo es muy pequeño, las observaciones están muy concentradas; si es muy grande es que están muy dispersas. 67 La fundamental utilidad de estos intervalos radica en que se aplican a las estimaciones estadísticas hechas por muestreo. 7.4- LA VARIANZA La varianza es el conjunto de datos se define como el cuadrado de la desviación típica o estándar y viene dada en consecuencia por S 2 cuando se habla de poblaciones y de σ2 cuando se trata de muestras, en las ecuaciones antes indicadas, por tanto es una medida de dispersión. Por no tener la raíz cuadrada facilita las deducciones y las operaciones algebraicas, pero en cambio la unidad en que viene expresada es el cuadrado de la unidad de la variable. La varianza es siempre positiva y mayor o igual a la desviación típica. 2 .ni .niXi S Xi N N 2 2 (XiX) 2 2 S N m Yi-1 Yi' ni Yi Yi.ni 1 4 8 3 6 18 2 8 12 12 10 120 3 12 16 40 14 560 4 16 20 47 18 846 5 20 24 32 22 704 6 7 8 24 28 13 26 338 28 32 9 30 270 32 36 4 34 136 16 0 299 2 Yi2 Yi2.ni 36 108 100 1200 196 7840 324 1522 8 484 1548 8 676 8788 900 8100 115 4624 6 387 6137 2 6 S 2 Xi 2 .ni N Xi .ni N S 2 61376 160 S 2 61376 160 S S 2 383 . 6 349 . 69 2 33 . 91 2992 160 2 2 18 .7 2 7.5- COEFICIENTE DE VARIACION Frecuentemente, se presenta el problema de comparar las dispersiones de dos o más distribuciones. Por ejemplo, si se desea saber si la variabilidad de la temperatura de un lugar es mayor o menor que de otro; si los salarios varían más en un grupo de obreros que en otro, etc. 68 En todos estos casos de comparación de dispersiones, se puede efectuar utilizando la desviación estándar. Si las variables comparadas tienen sus medias aritméticas iguales o aproximadamente similares y si dichas variables vienen expresadas en la misma unidad de medida. Si estas circunstancias no ocurren, que suele ser lo habitual la comparación debe hacerse mediante el coeficiente de variación cuya fórmula es: V = (S/ X ).100 Que no es sino la desviación estándar expresada como porcentaje de la media aritmética. V no se expresa en unidades de la variable. Ejemplo: de los siguientes cuadros a- Edad de cinco personas Años 8 26 23 19 44 b- familias distribuidas por sus personas activas Personas activas Variable 1 2 3 4 Total No. de familias Frecuencia 16 20 9 5 50 c- Obreros clasificados por su salario Paga por Hora Variable 4–8 8 – 12 12 - 16 16 – 20 20 – 24 24 – 28 28 – 32 32 – 36 Total No. de Obreros Frecuencia 3 12 40 47 32 13 9 4 160 69 Cuyos resultados son: Cuadro a b c X 24 2.06 18.70 S Unidad 11.71 Años 0.95 Personas 5.83 Dólares Tomando la desviación estándar, para comparar la dispersión de las tres distribuciones, no se llega a ninguna conclusión correcta. Lo que al calcular el coeficiente de dispersión se tiene: Va= (11.71/24)x100 = 48.79 Vb= (0.95/2.06)x100 = 46.17 Vc= (5.83/18.70)x100 = 31.18 Puede decirse entonces, que la distribución del cuadro c tiene la menor dispersión porque su coeficiente de variación es menor. Este coeficiente de variación depende de S y de X . Si X = 0; el coeficiente de variación es infinito V no tiene sentido cuando X = 0 o aproximado a cero PARA RECORDAR: Si los valores observados de la variable están muy concentrados alrededor del promedio, este es muy representativo; pero si estos valores están muy dispersos con relación al promedio, será muy poco representativo. La dispersión existe con independencia de los promedios. La existencia de la variabilidad en los valores de una variable es la que origina las distribuciones de frecuencias, cuyas representaciones gráficas suelen expresar más perceptiblemente que los números, la concentración o dispersión de las observaciones. n La fórmula para la desviación media es: X x X X j 1 j MD X X n n DESVIACIÓN ESTANDAR La medida numérica de la dispersión la podemos obtener a partir de las diferencias de cada valor de la variable con respecto a su media aritmética o con respecto a otro promedio. La desviación media de todas las desviaciones Xi- X no puede ser una medida de la dispersión porque siempre es igual a cero. 70 Sus formulas son: S ( Xi X ) 2 Xi Xi S N 2 2 y N N Cuando S= 0; todos los valores de Xi son iguales. A medida que S es mayor, la dispersión también es mayor. La desviación estándar es una medida de dispersión de los valores de la variable con respecto a la media aritmética. La desviación estándar viene dada por la misma unidad de medida que la variable. LA VARIANZA es el conjunto de datos que se define como el cuadrado de la desviación típica, sus formulas son: 2 Xi.niXi.ni S N N 2 2 2 2 S (XiX) N COEFICIENTE DE VARIACION Frecuentemente, se presenta el problema de comparar las dispersiones de dos o más distribuciones. Si las variables comparadas tienen sus medias aritméticas iguales o aproximadamente similares y si dichas variables vienen expresadas en la misma unidad de medida. V no se expresa en unidades de la variable. Este coeficiente de variación depende de S y de X . Su formula es: V = (S/ X ).100 71 EVALUACIÓN DEL APRENDIZAJE: 1- Hallar la desviación media de 4, 6, 9, 3, 7. 16, 22, 5, 11, 17, 14 2- La siguiente tabla nos indica las medidas de las longitudes de los cordones de zapatos arrojadas por una muestra de 70 pares. Hallar la desviación media. Longitud en centímetros 20-23 23-26 26-29 29-32 32-35 35-38 38-41 41-44 No de observaciones 12 9 6 11 15 7 6 4 3- Hallar la desviación media de los errores en milímetros arrojados en las dimensiones de clavos producidos por una máquina. La muestra corresponde a 30 observaciones. n: 1.2 1.3 0.9 1.11 1.23 1.96 1.5 1.7 0.92 0.56 1.42 1.73 1.6 1.45 1.8 0.93 1.29 0.77 1.9 1.5 1.37 1.27 0.92 1.82 1.5 1.25 1.21 1.76 0.17 0.64 4- Determinar la variación estándar de los tabacos consumidos por unidades en un día por 8 fumadores: 16, 14, 15, 5, 23, 9, 11, 20 5- El siguiente cuadro indica el nivel de salarios mensuales que perciben 40 trabajadores de la Constructora Andrade y Pérez Cía. Determinar la media aritmética y la desviación estándar. Sueldos en Dólares 197-210 210-223 223-236 236-249 249-262 262-275 275-288 288-301 N° de trabajadores 16 12 19 22 31 35 10 8 72 6- De una muestra de 30 observaciones sobre el consumo de energía eléctrica en Kw/h., por las plantas industriales dedicadas a la producción de muebles se obtuvieron los siguientes datos: 81.3 66.5 98.4 22.5 39.2 51.5 25.3 72.5 87.8 51.7 21.6 78.9 37.5 64.8 76.1 21.6 26.5 62.9 67.4 36.8 49.2 27.7 61.7 91.8 42.1 57.6 44.2 54.1 29.7 53.8 Hallar la desviación estándar 7- Determinar la varianza del consumo de gasolina por litros diarios de 8 camiones de transporte de una compañía: 11, 18, 19, 13, 15, 29, 21, 27 8- De una muestra de 40 observaciones sobre el desgaste de brocas de perforación en milímetros por una planta de perforación de pozos petroleros se obtuvieron los siguientes datos: 71.5 46.5 61.6 51.5 67.5 48.7 36.5 25.3 78.4 72.6 42.9 78.5 47.5 46.2 67.4 87.8 29.2 65.2 36.8 51.6 31.6 44.1 57.6 49.2 71.9 58.1 42.2 37.7 57.5 42.9 54.1 51.7 64.2 61.6 29.7 91.8 71.1 53.8 53.8 52.1 Hallar la varianza 9- La primera tabla indica el consumo de carne en libras por 10 familias compuestas de 5 miembros y la segunda tabla indica el número de personas que trabajan en una muestra de 15 familias Tabla 1 1.5 1.8 2 3.5 1 1.4 2.5 2.2 2.8 3 2 1 4 5 1 Tabla 2 4 3 1 2 2 2 3 2 4 3 Determinar los coeficientes de variación y realizar la comparación entre ellos. 73 CAPITULO VIII COMPETENCIA ESPECÍFICA Domina la base conceptual y analítica sobre el análisis de variables tipo uno; aplica y resuelve ejercicios. ORIENTACIONES DE ESTUDIO Por tratarse de una Unidad técnica, se recomienda a los y las estudiantes que se familiaricen con los conceptos y elementos del análisis de Variables tipo uno, sus usos y aplicaciones. Al conocer estos elementos y conceptos podrán poner en práctica con ejercicios, ejemplos, y resolución de problemas. Se utilizará la metodología de enseñanza aprendizaje de aprender haciendo. Es importante desarrollar la lectura adicional para completar los conocimientos impartidos en clases 8- ANÁLISIS DE VARIABLES TIPO UNO 8.1- LA COVARIACIÓN Muchos de los fenómenos o problemas a investigar presentan dos y más variables las cuales precisan ser determinadas para ver cómo influyen entre sí. Para comenzar el estudio nos referiremos a 2 variables X y Y. Muchas variables se mueven con sincronización o variación conjunta más o menos intensa, a esta forma de comportarse la variable se la llama covariación. La covariación puede presentarse de las siguientes formas: a- Dependencia causal o unilateral, que es cuando una variable X influye en otra variable Y, pero no influye Y en X. Un ejemplo puede ser el que la altitud influye en el rendimiento de los jugadores de fútbol; pero el rendimiento de los jugadores no influye en la altitud. En este tipo de dependencia la variable X se denomina independiente, explicativa o variable causa y Y se denomina variable dependiente, explicada o variable efecto. En el ejemplo anterior la altitud seria la variable independiente y el rendimiento de los jugadores la variable dependiente. b- Interdependencia, donde la influencia de X y Y es reciproca y se producen en las dos direcciones. Esta relación se la conoce como bilateral o interdependencia. 74 Un ejemplo es la demanda de un bien en el mercado y el precio del mismo en el mercado; si el precio es menor o mayor la demanda sube o baja y si la demanda es baja se reducen los precios y si la demanda sube se incrementan los precios. c- Dependencia indirecta, donde 2 variables X y Y pueden mostrar una covariación por medio de una tercera variable Z que influye en ellas. Si Z es la tercera variable, esta influye aumentando o reduciendo a X y Y, variando X y Y en el mismo sentido pero no hay dependencia o interdependencia entre X y Y. Por ejemplo en el siguiente cuadro se presenta la tasa de natalidad y el consumo de proteínas animales, la dependencia es indirecta con la tercera variable que es el nivel de vida, medible por el nivel del ingreso por habitante. NATALIDAD Y CONSUMO DE PROTEÍNAS Países Tasa de Consumo diario natalidad de proteínas Ecuador 30.9 53.6 Argentina 20.3 105.7 Bolivia 34.4 57.5 EE.UU. 17.0 61.4 Cuba 17.4 77.4 d- Concordancia, que indica que si X y Y son variables independientes, pueda que en sus variaciones haya alguna concordancia, Así por ejemplo en la elección de Mis Ecuador se compara el puntaje asignado por dos jueces a las 5 finalistas del concurso Concursantes A B C D E Juez 1 4 2 3 5 4 Juez 2 3 1 3 4 2 Es interesante si existe o no concordancia entre en las decisiones de los jueces dadas por separado. e- Covariación casual, se produce cuando hay una variación sincronizada entre dos variables de la que pueda deducirse una asociación o dependencia entre ellas; esta covariación puede ser accidental o casual. 8.2- ANÁLISIS GRÁFICO DE COVARIACIÓN En el siguiente cuadro se indica el nivel de consumo e ingresos de las familias de las ciudades de Quito, Guayaquil, Cuenca, Ambato y Loja. Como es conocido el nivel de consumo depende del ingreso, donde el Consumo es Y y el Ingreso X dando: 75 CONSUMO CONSUMO E INGRESO 120 110 100 90 80 70 60 50 40 30 20 10 0 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 INGRESO CIUDADES Quito Guayaquil Cuenca Ambato Loja INGRESO CONSUMO 136 96 154 110 99 77 115 88 96 84 Luego entre X y Y hay dependencia causal unilateral. Como es conocida la variable dependiente Y en el eje de las ordenadas y la variable independiente X en el eje de las abscisas. El diagrama que se obtuvo se conoce como diagrama de dispersión o nube de puntos. Este diagrama es un indicador de la dependencia entre las dos variables, de la observación se deduce que conforme aumenta el ingreso aumenta el consumo, luego hay cierta dependencia. Es muy importante el método gráfico de análisis de covariación, el cual no solo sirve para descubrir la relación entre 2 variables, si no también para ver sus características; además, es fácil y eficaz por lo que se lo utiliza frecuentemente. 76 A- En el gráfico a la nube expresa clara relación lineal o forma de línea recta, la relación es positiva o directa o que cada variable aumenta; y los puntos están concentrados. B- En el gráfico b hay relación lineal, inversa o negativa con gran dispersión. C- No hay relación, porque las variaciones de X no reflejan variaciones sistemáticas en Y, y a lo contrario. D- En el gráfico b la relación no es lineal, es una relación curvilínea o no lineal. A más del análisis del método gráfico, la covariación de 2 variables puede ser estudiada mediante las técnicas llamadas Regresión y Correlación. 8.3- LA REGRESIÓN Cuando se establece la dependencia de una variable como Y, respecto de otra independiente como X, entonces la relación toma el nombre de regresión. Un ejemplo es el caso de el nivel de ventas de un bien depende de su precio en el mercado, o el peso de los pollos de una granja dependen del volumen de alimentos suministrados. La variable dependiente suele variar en forma directa o inversa en relación a la variable independiente. La regresión tiende a ser lineal, pues utiliza herramientas matemáticas. 8.3.1- LA REGRESIÓN LINEAL Cuando existe una tendencia de los valores históricos a formar una línea recta se puede aplicar una ecuación matemática para determinar su regresión. Y = a + bX Mediante esta ecuación se buscaran encontrar los valores que pueden asumir las variables y los parámetros a y b, donde a es el coeficiente de posición y b el coeficiente de regresión. El método más utilizado para resolver este tipo de problemas es el de los mínimos cuadrados que parte de la ecuación lineal, así tenemos: Y = a+bX de donde aplicando el operador sumatorio tenemos: ∑Y = ∑a+∑bX ∑Y = na + b∑X que es la primera ecuación del sistema de ecuaciones 77 y para la segunda ecuación tenemos: Y = a+bX De donde tomamos la variable X y la multiplicamos por los elementos de la ecuación X(Y = a + bX) XY = aX + bX2 Aplicando el operador sumatorio tenemos: ∑XY = ∑aX + ∑bX2 ∑XY = a∑X + b∑X2 que es la segunda ecuación del sistema de ecuaciones ∑Y = na + b∑X ∑XY = a∑X + b∑X2 Ejemplo: Tomado en el supuesto caso de que el PIB de Ecuador depende del volumen de producción de petróleo, tenemos: n AÑO 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 PRODUCCIÓN PETROLERA Y EL PIB X Y X.Y PROD.MILL PIB EN ONES MILLONES DE DE S/. DE BARRILES 1975 102 176195 17971890 104 181531 18879224 109 190638 20779542 117 197436 23100012 125 201447 25180875 138 210150 29000700 141 215074 30325434 140 219335 30706900 142 226749 32198358 137 227678 31191886 1255 2046233 259334821 X2 10404 10816 11881 13689 15625 19044 19881 19600 20164 18769 159873 2046233 = 10a + 1255b 259334821 = 1255a + 159873b Multiplicando por -125.5 en la primera ecuación tenemos 78 2046233 = 10a + 1255b (-125.5) 259334821 = 1255a + 159873b ( 1 ) 2046233 10 1255 259334821 1255 159873 -256802241.5 -1255 259334821 1255 2532579.5 0 -125.5 1 -157502.5 159873 2370.5 2532579.5 = 2370.5b b = 2532579.5 2370.5 b= 1068.3735 Para a será: 2046233 2046233 = 10a = 10a + 1255b + 1255 ( 1068.3735) 2046233= 2046233= 10a 10a + + 1255 (1068.37355) 1340808.805 Despejando a será: 705424.1949 = 10a a= 705424.19 10 a= 70542.419 Quedando la ecuación Y = 70542.419 + 1068.3735X Esta ecuación nos permitirá realizar proyecciones del PIB si creciere la producción petrolera. Así por ejemplo, si deseamos saber cuál sería el PIB si la producción petrolera subiese a 170 (millones de barriles) reemplazamos en la fórmula. 79 Y= 70542.419 + 1068.3735(170) Y= 70542.419 + 181623.495 Y= 252165.914 Es decir, con una producción de 170 millones de barriles de petróleo el PIB se ubicaría en aproximadamente 252165.914 millones de sucres deflacionados a 1975. 8.4- CORRELACIÓN ENTRE DOS VARIABLES Se denomina correlación al grado de relación o interdependencia que existen entre dos variables. De este modo se dice que dos variable están muy relacionadas y se puede expresar mediante formulas matemáticas. Por ejemplo, cuando se considera como dos variables el radio r de una serie de circunferencias y longitudes, L, de la circunferencia correspondiente, se observa una correlación total entre ambas variables que pueden expresarse mediante la formula: L = 2∏r Por el contrario, variables como el peso de los individuos y el consumo diario de tabaco por individuo, no parecen a simple vista estar correlacionados. Se dice entonces que no hay correlación entre las dos variables. Cuando se estudia la correlación entre dos variables se habla de una relación lineal la cual se presenta mediante una línea recta. Cuando se estudia en cambio la relación entre 3 o más variables se habla de correlación múltiple y su representación gráfica puede ser un círculo, parábola, etc. 80 En el caso de la correlación lineal como indicamos intervienen tan solo dos variables X y Y, siendo una independiente y otra dependiente, la medida del grado de relación o correlación r entre las variables está determinada por la formula: N XY X . Y r 2 2 2 2 N . N X Y X Y La ventaja del coeficiente de correlación es que se trata de un coeficiente adimensional, por lo que no depende de las unidades en que estén expresadas las dos variables correlacionadas, siendo únicamente función de las dos variables en cuestión. El coeficiente de correlación tiende a ubicarse en el intervalo de –1 ≤ 0 ≤ 1, cuando r este más próximo a –1 ó +1 mayor correlación habrá, inversamente proporcional en el primer caso y directamente proporcional en el segundo caso. Mientras si por el contrario r tiende aproximarse a cero 0 menor será la correlación existente o no existirá ninguna. Ejemplo: La siguiente tabla nos indica el tiempo de entrega en base a la distancia existente por camión. Embarq ue Muestre ado 1 2 3 4 5 6 7 8 9 10 TOTAL ES Distancia T. Entrega Días Y Millas X 725.00 215.00 1020.00 550.00 480.00 922.00 1230.00 324.00 670.00 1271.00 7407.00 3.50 1.50 4.00 2.00 1.00 3.00 4.50 1.50 3.50 6.00 30.50 X.Y 2537.50 322.50 4080.00 1100.00 480.00 2766.00 5535.00 486.00 2345.00 7626.00 27278.00 X2 Y2 525625.00 12.25 46225.00 2.25 1040400.00 16.00 302500.00 4.00 230400.00 1.00 850084.00 9.00 1512900.00 20.25 104976.00 2.25 448900.00 12.25 1615441.00 36.00 6677451.00 115.25 N XY X . Y r 2 2 2 2 N . N X Y X Y 81 r= 0.91089865 Este nos indica que existe un 91.09% de dependencia del tiempo de entrega en relación a la distancia de ubicación de los camiones. Es decir, interpretando nos quedaría: El tiempo de entrega de cargas por parte de los camiones depende en un 91.09 % de la distancia en que se encuentren los camiones, mientras que el 8.91% depende de otros factores. PARA RECORDAR: La Covariación: Se refieren a la relación entre 2 variables X y Y, ó más. Muchas variables se mueven con sincronización o variación conjunta más o menos intensa, a esta forma de comportarse la variable se la llama covariación. En este tipo de dependencia la variable X se denomina independiente, explicativa o variable causa y Y se denomina variable dependiente, explicada o variable efecto. A más del análisis del método gráfico, la covariación de 2 variables puede ser estudiada mediante las técnicas llamadas Regresión y Correlación. La variable dependiente suele variar en forma directa o inversa en relación a la variable independiente. La regresión tiende ha ser lineal, pues utiliza herramientas matemáticas. El método más utilizado para resolver este tipo de problemas es el de los mínimos cuadrados que parte de la ecuación lineal, así tenemos: Y = a+bX ∑Y = na + b∑X que es la primera ecuación del sistema de ecuaciones 2 ∑XY = a∑X + b∑X que es la segunda ecuación del sistema de ecuaciones CORRELACION ENTRE DOS VARIABLES Se denomina correlación al grado de relación o interdependencia que existen entre dos variables. Se dice entonces que no hay correlación entre las dos variables. Cuando se estudia la correlación entre dos variables se habla de una relación lineal la cual se presenta mediante una línea recta. Cuando se estudia en cambio la relación entre 3 o más variables se habla de correlación múltiple y su representación gráfica puede ser un circulo, parábola, 82 etc. La medida del grado de relación o correlación r entre las variables esta determinada por la formula: N XY X . Y r 2 2 2 2 N . N X X YY La ventaja del coeficiente de correlación es que se trata de un coeficiente adimensional, por lo que no depende de las unidades en que estén expresadas las dos variables correlacionadas, siendo únicamente función de las dos variables en cuestión. El coeficiente de correlación tiende a ubicarse en el intervalo de –1 ≤ 0 ≤ 1, cuando r este más próximo a –1 ó +1 mayor correlación habrá, inversamente proporcional en el primer caso y directamente proporcional en el segundo caso. EVALUACIÓN DEL APRENDIZAJE: 1- En el siguiente cuadro se presentan los años de uso de 10 camiones y volumen de gases tóxicos que emiten sus motores. Años de uso 4 7 2 16 5 9 8 14 3 12 Volumen de gas Tóxico 25 60 18 83 47 72 64 81 22 80 Determinar el coeficiente de correlación e interpretar, calcular la ecuación lineal a través del método de los mínimos cuadrados Y calcular cual sería el volumen de gases tóxicos para un camión con 18 años de uso. 2- El siguiente cuadro nos indica el nivel crecimiento de ventas en función de los gastos de publicidad, por parte de una empresa de servicios de seguros. 83 Ventas de Seguros Generales 25.000 27.000 31.000 46.000 25.000 26.000 18.000 49.000 33.000 22.000 Gastos en publicidad 5.000 6.300 9.600 12.000 4.000 5.500 7.500 10.000 9.000 6.000 Determinar el coeficiente de correlación y calcular la ecuación lineal para estimar cual sería el nivel de ventas con una inversión en publicidad de 15.000,oo dólares. 84 CAPITULO IX COMPETENCIA ESPECÍFICA Domina la base conceptual y analítica sobre los Índices de precios y cantidad y su aplicación práctica. ORIENTACIONES DE ESTUDIO Por tratarse de una Unidad técnica, se recomienda a los y las estudiantes que se familiaricen con los conceptos de los Índices de precios y cantidad, sus usos y aplicaciones. Al conocer estos elementos y conceptos podrán poner en práctica con ejercicios, ejemplos, y resolución de problemas. Se utilizará la metodología de enseñanza aprendizaje de aprender haciendo. Es importante desarrollar la lectura adicional para completar los conocimientos impartidos en clases 9- CLASIFICACIÓN DE LOS ÍNDICES 9.1- ÍNDICE SIMPLE DE PRECIOS Son de gran utilidad los números índices cuando se emplean para resumir en una sola serie las fluctuaciones de una o un conjunto de variables que se relacionan entre sí. Por ejemplo se puede estar interesado en conocer las fluctuaciones del precio de la naranja, en cuyo caso puede aplicarse la técnica que se expondrán en esta sección de “números índices” a la correspondiente serie de precios. Pero en si el interés recae no en conocer la marcha del precio de la naranja, sino como varían los precios de los cítricos, o los precios de los productos agrícolas, o a todos los precios al por mayor, o al por menor, mediante una sola serie que representa ala conjunto de mercaderías. A los índices de una sola variable se los conoce como índices simples o elementales, pero cuando se trabaja con varias variables se los llama índices compuestos o complejos. Veamos un ejemplo de cómo extraes índices simples. En el siguiente cuadro se indican los precios del café, cacao y arroz en el mercado de cuenca. Año 1997 1998 1999 2000 2001 Cacao 3,78 4,59 6,50 4,55 3,80 Café 3,05 3,25 3,85 5,82 4,25 Arroz 1,39 1,80 1,89 1,52 1,50 La obtención de índices simples es una operación fácil. Las tres series del siguiente cuadro permiten conocer la evolución relativa a los precios y realizar comparaciones: 85 Año 1997 1998 1999 2000 2001 Cacao 100.00 121.43 171.96 120.37 100.53 Café 100.00 106.56 126.23 190.82 139.34 Arroz 100.00 129.50 135.97 109.35 107.91 Para ello se toma se toma como base el precio Po de 1997, convirtiendo se los siguientes en P1, P2, P3, P4. La interpretación de estos índices dirá por ejemplo, para el precio del cacao en P3: El precio del cacao para el 2000 creció en un 20,37% con respecto al precio de 1997. Si los precios representados por P, la serie de precios se escribirán así: P0 * 100 P0 P3 * 100 P0 P1 * 100 P0 P4 * 100 P0 P2 * 100 P0 En general para el precio correspondiente al tiempo t, el índice simple será Pt P0 Donde se ha suprimido el factor 100, porque cuando se expresan lo índices es costumbre indicar en porcentajes, por lo que se puede suprimir dicho factor de las formulas. Nótese que el cociente Pt/P0 es la expresión simbólica del índice elemental o simple del precio en el tiempo t con respecto al tiempo 0. 9.2- ÍNDICE SIMPLE DE CANTIDAD La misma figura se adoptará para otra variable, así si queremos obtener el las variaciones relativas de la cantidad producida de un bien q su formula será: qt q0 86 Que expresa el índice de variación de la cantidad en el tiempo t, con respecto a la cantidad del tiempo 0. Años 1994 1995 1996 1997 1998 Cantidades Total Índice de Cantidad Banano Camarón Flores Banano Camarón Flores 36.00 40.20 41.90 118.10 1.00 1.00 1.00 50.30 39.90 8.70 98.90 1.40 0.99 0.21 43.20 28.20 55.60 127.00 1.20 0.70 1.33 38.20 55.60 38.50 132.30 1.06 1.38 0.92 40.20 38.80 50.50 129.50 1.12 0.97 1.21 Ahora procedamos a calcular una sola serie de índices de precios, donde se trata de reducir o concentrar las tres series de los dos cuadros anteriores, en una sola serie; lo cual se consigue mediante un promedio como la medía aritmética. 9.3- PRINCIPALES ÍNDICES UTILIZADOS EN LA ADMINISTRACIÓN Y LA ECONOMÍA Existen índices muy importantes que son considerados como indicadores de la situación económica y financiera de un país los cuales indican períodos de inflación, deflación, estancamiento o desarrollo económico. Los principales son: 1- Índices de precios al consumidor IPC 2- Índices de precios al por mayor IPM 3- Índices de producción industrial IPI 4- Índice promedio industrial IPmI De estos el más importante es el Índice de Precios al Consumidor. 9.3.1- ÍNDICE DE PRECIOS AL CONSUMIDOR Llamado también índice de Costo de Vida y es un número que nos indica en forma aproximada los cambios relativos de los precios de los bienes y servicios de la canasta familiar básica de las familias de ingresos medios y bajos de las principales ciudades del país, tanto de la costa como de la sierra con más de 10.000 habitantes. La institución responsable de llevar la investigación de este índice es el Instituto Nacional de Estadísticas y Censos INEC, la cual considera una canasta familiar de unos 400 bienes y servicios la cual se descompone en 4 grandes grupos: abcd- Alimentos Indumentaria o vestido Vivienda Misceláneos 87 Las ciudades que se toman como muestras de investigación son: a- Costa: 1- Babahoyo 2- Esmeraldas 3- Guayaquil 4- Machala 5- Portoviejo b- Sierra: 1- Ambato 2- Cuenca 3- Latacunga 4- Quito 5- Loja 6- Riobamba Para calcular este índice el INEC utiliza la fórmula de Laspeyres, con la investigación empírica realizada el INEC publica mensual, trimestral, semestral y anualmente el IPC con el apoyo del Banco Central del Ecuador. 9.3.2- USOS DEL IPC El IPC sirve de base en el cálculo de varios indicadores como son: 1- Sirve para determinar el Poder Adquisitivo de la moneda nacional 1 PA 100 IPC 2- Sirve para determinar el salario real SR de los trabajadores: Salario Nominal o Moneta SR 100 IPC SR PA Salario Nominal 3- Sirve para deflacionar series cronológicas Serie Nominal oMonetario Serie Re al 100 IPC Serie Re al PA Serie Nominal 88 Fecha Jul-86 Ene-87 Dic-87 Ene-88 Jul-88 Sep-88 May-89 Dic-89 Dic-90 May-91 Feb-92 IPC PA 478.30 548.50 713.80 736.90 982.80 1116.20 1670.60 1998.80 3057.30 3707.80 4916.30 0.20900 0.18200 0.14000 0.13500 0.10170 0.08950 0.05980 0.05003 0.03340 0.02697 0.02034 SALARIO SALARIO NOMINAL REAL 10000.00 2090.33 13000.00 2187.78 14500.00 2030.00 14500.00 1967.67 19000.00 1932.30 19000.00 1700.50 22000.00 1315.60 27000.00 1350.85 32000.00 1046.65 44000.00 1186.68 44000.00 894.96 VENTAS 100000.00 110000.00 150000.00 150000.00 160000.00 175000.00 200000.00 230000.00 300000.00 320000.00 350000.00 SERIE REAL DE VENTAS 20900.00 20053.00 21000.00 20357.00 16272.00 15662.50 11820.00 11506.90 10020.00 8630.40 7119.00 1 100 JULIO 86 IPC 1 PA 100 0 ,209 JULIO 86 478 .3 PA Por cada sucre gastado por una familia en 1986 en bienes y servicios apenas 21 centavos tienen poder adquisitivo. PA JULIO PA JULIO 1 100 87 IPC 1 = 100= 0,182 87 548.5 = Por cada sucre gastado por una familia en 1987 en bienes y servicios apenas 18 centavos tienen poder adquisitivo. SR = Salario Nominal PA 86 = 10000 0.209= 2090.33 86 JULIO R JULIO Un trabajador que percibía en 1986 la cantidad de 10000 sucres en realidad percibe apenas 2090.33 sucres De esta forma se van obteniendo los demás índices para los siguientes años. EVALUACIÓN DEL APRENDIZAJE: 1- La siguiente tabla muestra los precios medios al por mayor de los huevos en EE.UU. durante 1978 y 1985. Hallar la relación de precios: a- Para 1984 con 1978 como base 89 b- Para todos los años con 1978 como base Años 1978 1979 1980 1981 1982 1983 1984 1985 Precio medio Centavos por docena 60.3 66.2 62.8 69.0 66.8 72.7 78.6 63.4 2- El siguiente cuadro recoge las relaciones de precios de un artículo con 1977 – 1979 = 100. Determinar las relaciones de precios con: a- 1980 = 100 b- 1983-1984 = 100 años 1980 1981 1982 1983 1984 1985 Gastos en publicidad 127 134 118 125 137 141 90 BIBLIOGRAFÍA http://www.monografias.com/trabajos15/estadistica/estadistica.shtml#MEDICIO N http://www.aulafacil.com/CursoEstadistica/Lecc-3-est.htm Carpeta Estadística. Aprenda Fácil. Grupo Patria Cultural. http://www.gestiopolis.com/recursos/experto/catsexp/pagans/eco/44/distrinorma l.htm http://server2.southlink.com.ar/vap/MEDIDAS.htm http://pdf.rincondelvago.com/metodo-de-minimos-cuadrados-ordinarios.html http://guajiros.udea.edu.co/descriptivaa/articulos/curso%20de%20EstadIstica% 20Basica.pdf 91