República de Panamá Ministerio de Educación DIRECCIÓN NACIONAL DE EDUCACIÓN MEDIA PROFESIONAL Y TÉCNICA Tel.: 958-5804 Instituto Profesional y Técnico de Veraguas Nombre del Alumno o la Alumna: _____________________________Grupo:10º ______ Sección: Bachiller Industrial Segundo Ciclo Industrial Especialidad: _____________________ UNIDAD DE APRENDIZAJE Nº 12 La Estadística 12.0 ÁREA: Estadística 12.1 OBJETIVOS Formular y resolver problemas relacionados con interpretación y organización de datos. Representar gráficamente diferentes problemas relacionados con su entorno e interpretar los resultados. Distinguir en los problemas de aplicación las diferentes medidas de tendencia central. Identificar cada uno de los términos estadísticos. 12.2 INTRODUCCIÓN La palabra Estadística procede del vocablo Estado, pues era función principal de los Gobiernos de los Estados establecer registros de población, nacimientos, defunciones, impuestos, cosechas, etc. La necesidad de poseer datos cifrados sobre la población y sus condiciones materiales de existencia han debido hacerse sentir desde que se establecieron sociedades humanas organizadas La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica. La Estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas con tal análisis. 12.3 ORIGENES DE LA ESTADÍSTICA Es difícil conocer los orígenes de la Estadística, ya que desde los comienzos de la civilización humana han existido formas sencillas de Estadística, pues existe evidencia de que ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas. La razón de esto, es se estaba formando recién la sociedad y era algo inherente la necesidad de saber cosas elementales como: cuántos habitantes tiene la tribu, con cuantos bienes se cuenta, etc. La Estadística improviso, no sino surgió de mediante un proceso largo de desarrollo y evolución, desde hechos de simple recolección de datos hasta la diversidad y rigurosa interpretación de los datos que se dan hoy en día. Su origen se remonta a los comienzos de la historia y esto se sabe tanto a través de crónicas, datos escritos y restos arqueológicos. En la Isla de Cerdeña, donde existen monumentos prehistóricos pertenecientes a los Nuragas (quienes fueron los primeros habitantes de la Isla); que constan de bloques de basalto superpuestos sin mortero y en cuyas paredes se encontraban grabados toscos signos que han sido interpretados con mucha verosimilidad como muescas que servían para llevar cuenta del ganado y la caza. Hacia el año 3000 a.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. En los antiguos monumentos egipcios se encontraron interesantes documentos en que se demostraban la sabia organización administración pueblo; ellos llevaban cuenta de los movimientos de y este poblacionales y continuamente hacían censos. Fue Sargón II, Rey de Asiria, quien fundó una biblioteca en Nínive. En esta biblioteca no se guardaban poemas u obras literarias; sino simplemente era una recopilación de hechos históricos, religiosos, importantes datos estadísticos sobre producción, cuentas; así como también datos de medicina, astronomía, etc. En la Biblia observamos en uno de los libros del Pentateuco, bajo el nombre de Números, el censo que realizó Moisés después de la salida de Egipto. Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 2 “Haz un censo general de toda la asamblea de los hijos de Israel, por familias y por linajes, describiendo por cabezas los nombres de todos los varones aptos para el servicio de armas en Israel…” Igual tipos de datos se expresan, en varios libros que conforman la Biblia. Otra de las civilizaciones en trabajar la Estadística fueron los chinos, quienes efectuaron censos hace más de cuarenta siglos. En China, el escritor Confucio, en unos de sus obras clásicas “ShuKing” escrito hacia el año 550 a. C., nos narra cómo el Rey Yao en el año 2238 (del año chino) mandó hacer una estadística agrícola, industrial y comercial. Los griegos, también tuvieron importantes observaciones estadísticas en lo que se refiere a la distribución de terreno, el servicio militar, etc. Hecho, existe evidencia de esto, ya que los griegos Sócrates, Herodoto y Aristóteles, a través de sus escritos incentivaron la Estadística por su importancia para el Estado. Los griegos efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). Las investigaciones históricas revelan que en Grecia se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera. Los romanos, maestros de la organización política, fueron quienes mejor supieron emplear los recursos de la Estadística. El Imperio Romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su control. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar: los nacimientos, defunciones y matrimonios, hacían recuentos periódicos del ganado y las riquezas contenidas en las tierras conquistadas. Durante los años siguientes a la caída del Imperio Romano se realizaron muy pocas contribuciones a la Estadística con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y Carlomagno en 762 D.C. En la Edad Media, los métodos estadísticos permanecieron casi olvidados, a pesar de los esfuerzos de Carlomagno, en Francia y de Guillermo el Conquistador, en Inglaterra, quienes trataron de revivir la técnica romana. En 1200 a 1527 D.C. los Incas del Perú establecieron un procedimiento muy particular para registrar los nacimientos, las defunciones y otros sucesos cuya responsabilidad incumbía a las autoridades públicas. Esta cultura de América, tiene el mérito de haber sido la primera que Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 3 registró sucesos vitales. Ya que sabían por ejemplo exactamente la cantidad, la edad y el sexo de los habitantes en las diferentes provincias. Los Incas no tenían caracteres escritos, utilizaban entrelazados cintas de colores y nudos para registrar los hechos “quipus”. Este sistema quedo interrumpido por la llegada de los españoles en 1531. La Iglesia, viendo la importancia de la Estadística es que después del Concilio de Trento estableció la obligación de la inscripción de nacimientos, matrimonios y defunciones. El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar en 1691 y fue realizado por Gaspar Neumann, un profesor alemán que vivió en Breslau, que se propuso eliminar la antigua creencia popular de que en los años terminados en siete moría más personas que en los restantes, y para lograr su investigación, buscó pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de partidas de defunción pudo demostrar que en tales años no fallecían más personas que en los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de seguros. Leonardo de Vinci, Nicolás Copérnico, Galileo Galilei, William Harvey, Sir Francis Bacon y René Descartes, hicieron grandes operaciones al Método Científico, de tal forma que cuando se crearon los estados Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de aplicarse a los datos económicos. Por el año 1540, el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales, comprensiva de datos sobre organización política, instrucciones sociales, comercio y poderío militar. Durante el siglo XVII se aportó indicaciones más concretas de métodos de observación y análisis cuantitativo y se amplió los campos de la Inferencia y la Teoría Estadística. Jacques Quételect fue quien aplicó la Estadística a las Ciencias Sociales. Fue el primero en realizar la aplicación práctica de todo el método estadístico. En el periodo del 1800 al 1820 se desarrollaron dos conceptos Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 4 matemáticos fundamentales para la Teoría Estadística: la teoría de los errores de observación, aportada por Laplace y Gauss; y la teoría de los mínimos cuadrados desarrollada por Laplace, Gauss y Legendre. En nuestros días la Estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. 12.4 DEFINICIÓN DE ESTADÍSTICA Es una rama de la Matemática que conjunta herramientas para recolectar, organizar, presentar y analizar datos numéricos u observacionales. Según Esperanza Moret, la Estadística es el conjunto de teorías y métodos que han sido desarrollados para tratar la recopilación, organización y análisis de datos o hechos numéricos, con el fin de sacar conclusiones. 12.5 TERMINOLOGÍA ESTADÍSTICA La Estadística es una ciencia que tiene como finalidad facilitar la solución de problemas en los cuales necesitamos conocer algunas características sobre el comportamiento de algún suceso o evento. Características que nos permiten conocer o mejorar el conocimiento de ese suceso. Además nos permiten inferir el comportamiento de sucesos iguales o similares sin que estos ocurran. 12.5.1 DATOS ESTADÍSTICOS: son conjuntos de números que son recolectados por observación, referidos a una misma característica, que guardan entre sí relaciones significativas, por lo tanto pueden ser comparadas, analizadas e interpretadas sus relaciones. Se pueden clasificar en: cualitativos, cuantitativos, cronológicos y geográficos. Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad. Por ejemplo: si deseamos clasificar los estudiantes que cursan la Materia de Matemática 10° del IPTV por su condición, observamos que pueden existir aprobados, reprobados, retirados. Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos. Por ejemplo: se clasifican los estudiantes de décimo grado del IPTV de acuerdo a sus notas, observamos que los valores (notas del 1,0 al 5,0) representan diferentes magnitudes. Datos cronológicos: cuando los valores de los datos varían en diferentes instantes o períodos de tiempo, los datos son reconocidos como cronológicos. Por ejemplo: al registrar los promedios de notas de los estudiantes de décimo grado del IPTV en los diferentes trimestres. Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 5 Datos geográficos: cuando los datos están referidos a una localidad geográfica se dicen que son datos geográficos. Por ejemplo: el número de estudiantes los estudiantes de décimo grado del IPTV en los distintos distritos de la Provincia de Veraguas. 12.5.2 POBLACIÓN: es el conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos la edad, o el peso. 12.5.3 MUESTRA: es un subconjunto de la población seleccionado de acuerdo con un criterio, y que sea representativo de la población. Por ejemplo, elegir 30 personas por cada barriada de la Ciudad de Santiago, para saber sus edades, y este será representativo para la ciudad. 12.5.4 INDIVIDUO: es cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los estudiantes de décimo grado del IPTV, cada estudiante es un individuo; si estudiamos la edad de cada habitante, cada habitante es un individuo. 12.5.5 VARIABLE: fenómeno que puede tomar diversos valores. Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales). 12.5.6 ESTADÍSTICA DESCRIPTIVA: tienen por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observación de todos los elementos de una población (observación exhaustiva) sino también a la descripción de los elementos de una muestra (observación parcial). La Estadística Descriptiva proporciona herramientas, como tablas, diagramas, medidas de tendencia, con las cuales se pueden analizar el comportamiento de datos recopilados. 12.5.7 TOMA DE DATOS: es la obtención de una colección de datos que no han sido ordenados numéricamente. Por ejemplos: el peso de los estudiantes, o la preferencia de los refrescos, etc. 12.5.8 ORDENACIÓN DE DATOS: es el arreglo de los datos en forma ordenada es una colocación de los datos numéricos tomados en orden creciente (ascendente) o en orden decreciente (descendente). Ejemplo 1: se ofrece los pesos (en kg) de los estudiantes de un grupo de 20 estudiantes de Décimo Grado de Autotrónica del IPTV (10° S): Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 6 TABLA N°1 PESOS EN KG DE LOS ESTUDIANTES DEL 10° S DEL IPTV 54 55 55 55 56 57 57 58 58 59 60 60 62 63 65 65 65 65 67 68 12.5.9 RANGO DE LOS DATOS O RECORRIDO: es la diferencia entre mayor valor y el menor. Por ejemplo, según la Tabla N°1, el mayor valor es 68 y el menor 54, luego el rango es: Rango 68 54 14 Rango 14 12.5.10 FRECUENCIA: es la representación de la cantidad de respuestas, o número de veces en que se repite un dato, de un hecho o situación investigada. La frecuencia puede ser absoluta, relativa, acumulada y porcentual. Frecuencia Absoluta: es el número de veces que se repite un determinado valor o resultado dentro de todos los valores observados. Por ejemplo en la Tabla N°1, se puede observar ¿Cuál es el menor peso?, 54kg. ¿Cuál es el mayor peso?, 68kg ¿Cuál es el peso más común?, 65kg, ya que 4 estudiantes tienen ese peso. TABLA N°2 LA FRECUENCIA ABSOLUTA DE LOS ESTUDIANTES DEL 10° S DEL IPTV 54 / 60 // 55 /// 62 / 56 / 63 / 57 // 65 //// 58 // 67 / 59 / 68 / TABLA N°3 NÚMERO DE ESTUDIANTES QUE TIENEN EL MISMO PESO 10° S DEL IPTV PESO (kg) 54 FRECUENCIA (f) 1 PESO (kg) 60 FRECUENCIA (f) 2 55 2 62 1 56 1 63 1 57 2 65 4 58 2 67 1 59 1 68 1 Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 7 Frecuencia Acumulada: es la suma de las frecuencias absolutas, entre los diferentes valores. TABLA N°4 LA FRECUENCIA ACUMULADA DE LOS ESTUDIANTES DEL 10° S DEL IPTV PESO FRECUENCIA (kg) ABSOLUTA 54 1 FRECUENCIA ACUMULADA 1 PESO (kg) 60 FRECUENCIA ABSOLUTA 2 FRECUENCIA ACUMULADA 11 55 2 3 62 1 13 56 1 4 63 1 14 57 2 6 65 4 18 58 2 8 67 1 19 59 1 9 68 1 20 Frecuencia Relativa: es el cociente que se obtiene entre la frecuencia absoluta y el número total de datos o muestra investigada. FR Frecuencia Absoluta Número de Observacio nes Frecuencia Porcentual: es el cociente que se obtiene entre la frecuencia absoluta y el número total de datos o muestra investigada FP FR * 100 Frecuencia Absoluta 100 Número de Observacio nes TABLA N°5 LA FRECUENCIA RELATIVA DE LOS ESTUDIANTES DEL 10° S DEL IPTV PESO FRECUENCIA (kg) ABSOLUTA FRECUENCIA RELATIVA PESO FRECUENCIA (kg) ABSOLUTA FRECUENCIA RELATIVA 54 1 1 20 100 0,05 100 5 60 2 2 20 100 0,10 100 10 55 2 2 20 100 0,10 100 10 62 1 1 20 100 0,05 100 5 56 1 1 20 100 0,05 100 5 63 1 1 20 100 0,05 100 5 57 2 2 20 100 0,10 100 10 65 4 4 20 100 0,0 100 20 58 2 2 20 100 0,10 100 10 67 1 1 20 100 0,05 100 5 59 1 1 20 100 0,05 100 5 68 1 1 20 100 0,05 100 5 12.5.11 DISTRIBUCIÓN DE FRECUENCIAS: muestra el número de veces que ocurre cada observación. Ejemplo 2: se elaboró una encuesta al 10° S del IPTV y ésta informó que las mascotas más comunes que tienen los estudiantes son perros, gatos, peces, conejos y pericos. Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 8 TABLA N°6 MASCOTAS PREFERIDAS DE LOS ALUMNOS DEL 10° S DEL IPTV Perro Gato Perro Conejo Perico Conejo Gato Perro Conejo Gato Perico Gato Perro Perro Conejo Perico Perro Perro Perico Gato A continuación se muestra la distribución de frecuencias absolutas, relativas y porcentuales de las mascotas más comunes de los estudiantes del 10° S del IPTV: TABLA N°7 LAS FRECUENCIAS DE LOS ESTUDIANTES DEL 10° S DEL IPTV MASCOTA FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA FRECUENCIA PORCENTUAL Perro 7 0,35 35% Perico 4 0,20 20% Conejo 4 0,20 20% Gato 5 0,25 25% 12.6 LAS MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central: son valores numéricos que localizan el centro de los datos. La tendencia central se refiere al punto medio de una distribución. Las medidas de tendencia central se conocen como medidas de posición. 12.6.1 LA MEDIA ARITMÉTICA DE UN CONJUNTO DE DATOS: es el resultado que se obtiene al dividir la suma de esos datos entre el número total de ellos. La media aritmética también se le conoce como de media o promedio, y se representa con el símbolo X . Es la medida de posición central más utilizada. Media Suma de Datos Número Total de Datos X x1 x 2 x 3 ... x n n fx n La media es el punto en una distribución de medidas, alrededor del cual las desviaciones sumadas son iguales a cero. Es el valor promedio de una muestra o población. La media es muy sensible a mediciones extremas que no estén balanceadas en ambos lados. Se pueden calcular diversos tipos de media, siendo las más utilizadas: la media aritmética y la media geométrica. Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 9 Ejemplos 3: 1) El grupo de 10° X del IPTV, realizó cinco pruebas parciales de Matemática, si uno de los estudiantes obtuvo las siguientes notas: aritmética o promedio es: M 2,0; 3,5; 4,5; 5,0; 4,7 , entonces la media 2,0 3,5 4,5 5,0 4,7 19,7 3,94 5 5 2) En una semana, en la Ciudad de Santiago, se han registrado las siguientes temperaturas: Lunes 23°C Viernes 27°C Martes 18°C Sábado 30°C Miércoles 25°C Domingo 24°C Jueves 21°C La media aritmética o promedio es: M 23 18 25 21 27 30 24 168 24 7 7 12.6.2 LA MEDIANA: es aquel valor que está en la mitad (posición central) de todos los datos ordenados. La mediana divide el conjunto de datos en dos partes iguales; es decir, por debajo de ella están la mitad de los datos y por encima, la otra mitad. Ya que es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Se representa con el símbolo Me . Si el número de datos es impar, la mediana coincide con el valor central. Si el número de datos es par, la mediana es el promedio o media aritmética de los valores centrales. Ejemplos 4: 1) En el grupo de 10° A del IPTV, siete estudiantes realizaron la tercera prueba parcial de Matemática, y los resultaron fueron los siguientes: 4,0; 3,5; 2,0; 4,5; 5,0; 3,7; 3,8 . Los resultados ordenados son: 2,0; 3,5; 3,7; 3,8; 4,0; 4,5; 5,0 Mediana Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 10 La mediana es Me 3,8 ya que antes y después de esta nota, tenemos acumulados la mitad de las demás notas. 2) Los resultados ordenados de la calificación de diez estudiantes del 10°B del IPTV, en la cuarta prueba parcial de Matemática, fueron los siguientes: 2,7; 3,0; 3,5; 3,7 4,0; 4,1 4,3; 4,5; 5,0; 5,0 Valores Centrales La mediana es el promedio de los valores centrales 4,0 y 4,1 es decir: Me 4,0 4,1 8,1 4,05 2 2 La Mediana es de la siguiente forma, si los datos están agrupados: n 2 fi Mediana Me LRI c f mediana Donde: LRI es la frontera inferior de la clase de la mediana. n es el número de datos (frecuencia total). f f i es suma de frecuencia de las clases inferiores a la de la mediana mediana es la frecuencia de la clase de la mediana c es la anchura del intervalo de la clase de la mediana 12.6.3 LA MODA DE UN CONJUNTO DE DATOS: es aquel valor, en la observación, que más se repite, es decir, el valor más común, el que aparece con más frecuencia. La moda puede no existir cuando los números se repiten el mismo número de veces. Se representa con el símbolo Mo . La moda de los datos agrupados se aproxima por el punto medio de la clase que contiene la frecuencia de clase mayor. Cuando dos valores ocurren una gran cantidad de veces, la distribución se llama bimodal. Ejemplos 5: 1) Las edades de un grupo de diez estudiantes de décimo grado del 10° Y IPTV son: 14, 16, 15, 16, 15, 16, 15, 17, 14, 18 . Si ordenamos el conjunto de los datos, tenemos: 14, 14, 15, 15, 15, 16, 16, 16, 17, 18 Las modas en este conjunto de datos son: 15 y 16 , pues ambas aparecen 3 veces. Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 11 2) Los resultados obtenidos en la calificación del segundo trimestre del 10° U fueron: 4,0; 3,0; 3,0; 2,5; 3,2 , se observa que 3,0 se repite dos veces, por lo tanto, la moda es: Mo 3,0 12.7 CONSTRUCCION DE TABLAS ESTADÍSTICAS 12.7.1 DISTRIBUCIÓN AGRUPADA DE FRECUENCIAS: es la distribución de frecuencias en la que los valores de la variable se han agrupado en clases. Esto se debe principalmente a la disposición de gran número de datos. Las razones por las que se elaboran este tipo de agrupación de datos son por economía, practicidad, y baja frecuencia de algunos puntajes. 12.7.2 AGRUPACIÓN DE DATOS: para elaborar las tablas estadísticas, se debe seguir un procedimiento preciso: 1. Estos son algunos métodos para obtener datos: Censo: se entiende por censo aquella numeración que se efectúa a todos y cada uno de los caracteres componentes de una población. Encuesta: se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. El diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo snnnnnnnnnobre el comportamiento de las personas, lo mejor, más directo y simple es preguntárselo directamente a ellas. 2. Toma de datos: es la obtención de una colección de datos por medio de encuestas, preguntas, sondeos etc., que no han sido ordenados numéricamente y que dicha información se extrae al azar, es decir, de tal forma que cada miembro de la población tenga la misma oportunidad de ser elegida o seleccionada. 3. Ordenación de datos: es una colocación de los datos numéricos tomados en orden creciente a decreciente de magnitud. La diferencia entre el mayor y el menor de los números se llama rango o recorrido de datos. Rango Mayor valor Menor valor 4. Cálculo de tamaño de clase (Intervalo de clase): pequeña sección de la escala, según se agrupan las puntuaciones de una distribución de frecuencia. Para calcular el tamaño de clase es necesario calcular primeramente el número de clases utilizando la Regla de Sturges y después se obtiene el tamaño de clase dividiendo el rango entre el número de clases. Número de Clases 1 3,322 log N (La Regla de Sturges) Tamaño de Clases Rango Número de Clases 5. Límites de clase (Límite del intervalo): son los valores extremos que tiene el intervalo de clase: inferior y superior, entre los cuales van a estar los valores de los datos agrupados en Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 12 ese intervalo de clase, representan el tamaño de cada clase. El límite inferior (L.I.) de la primera clase toma el valor del dato menor de la colección de datos, para obtener el límite inferior de la clase siguiente, se suma al límite inferior de la clase anterior, el tamaño de clase. 6. Límites reales de clase: se obtienen sumando al límite superior (L.S.) de la clase el L.I. de la clase contigua superior y dividiendo entre dos. 7. Marca de clase: Es el punto medio de la clase y se obtiene sumando el límite inferior y límite superior de la clase y dividiendo entre 2. La marca de clase también se llama punto medio de la clase. 12.8 REPRESENTACIÓN GRÁFICA DE DATOS La Gráfica: es un elemento que muestra datos sobre alguna cosa. Es una representación de la relación entre variables. Las gráficas a partir de los años sesentas empezaron a evolucionar, empezando como puntos perforados que daban la sensación de una gráfica, pero eran difíciles, difíciles de leer, por lo que en los años ochenta ya se pudieron crear gráficas desde la computadora. El uso de gráficas en encuestas es esencial debido a que la gráfica es utilizada para hacer dibujitos o diagramas y así representar el porcentaje o número de votos de alguna encuesta. Muchos tipos de gráficos aparecen en numerosas aplicaciones, según la naturaleza de los datos involucrados y el propósito del gráfico. Entre ellos podemos mencionar los gráficos de columnas, de barras, las circulares, los histogramas, etc. Los gráficos tienen por objeto ilustrar, mediante el uso de figuras, los resultados de una investigación estadística. 12.8.1 TIPOS DE GRÁFICAS Según su relación con el tiempo (cronológico) podemos distinguir dos tipos de gráficas: las estáticas y las dinámicas. Las gráficas estáticas: son aquellas que muestran una situación en un instante determinado de tiempo; reflejan el estado o relación de una o más variables en un mismo momento. Por ejemplos: la composición de ventas por sector para un determinado período, el resultado de las elecciones; y en general, la composición de cualquier conjunto en un instante determinado. Para este tipo de muestra se puede utilizar cualquier diagrama, aunque son preferibles las gráficas circulares o las de barras apiladas. Las gráficas dinámicas: muestran el desarrollo de una variable a través de un período o lapso de tiempo. Estas gráficas tienen una escala temporal en uno de sus ejes (generalmente el eje horizontal). Puede ser en horas, minutos, años, meses, etc. según la necesidad de la ilustración. Por ejemplos: las ventas de una empresa, pero detalladas mes Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 13 a mes para un ejercicio comercial; la evolución de la producción de la fábrica a lo largo del mes, la evolución de un proceso químico, etc. Para este tipo de ilustración se suelen utilizarse los diagramas de barras, de puntos o lineales. 12.8.1.1 GRÁFICAS LINEALES: es un estilo de gráfica en la que se utiliza una línea para representar los datos que se quieran mostrar. Es un tipo de gráfico muy utilizado, dado la sencillez de su construcción, la versatilidad de sus aplicaciones y por la facilidad de interpretación. Es especialmente conveniente para los gráficos dinámicos, y en especial cuando se necesitan mostrar más de una serie de datos en los que deben ser todos visibles y claramente relacionados para cada serie. La gráfica puede responder a una función lineal, exponencial, etc. Tal el caso de la función de la recta: y mx b , aplicable a múltiples situaciones de la vida real. 12.8.1.2 GRÁFICAS DE BARRAS: es un tipo de gráfica en donde los datos son representados en barras verticales u horizontales. ocurrencia de las observaciones. Es una forma de gráfica para indicar la frecuencia de Para construirla se constituye el eje Y por las frecuencias absolutas y el eje X por los límites inferior y superior de cada clase, dejando un espacio entre barra y barra; generalmente verticales. 12.8.1.3 GRÁFICAS DE CÓNICAS: es un tipo de gráfica en la que los datos se representados en conos, por lo que la gente piensa en estalactitas, estalagmitas o dientes de tiburón tamaño jumbo. La gráfica se ve cortada en algún pedazo cuando el dato es de algún número inferior, y se Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 14 ve con punta cuando el dato es mucho más grande. Esta gráfica se divide en 2 partes: base y punta. La base representa el inicio y la punta no siempre es representada, por lo que hay conos con una sola parte. 12.8.1.4 GRÁFICAS DE ANILLOS O ANULARES: es un estilo de gráfica en la que los datos representados, lógicamente, se parecen a un anillo, solo que dividido en partes, cada uno peleando por la mayor parte y representando un colorcito distinto. Esta gráfica resulta muy conveniente para mostrar las composiciones porcentuales, aunque la lectura de sus datos, en la representación no sea muy precisa. 12.8.1.5 GRÁFICA CIRCULAR O GRÁFICA DE PASTEL: aquella gráfica, que según su proporción, ocupan cierto territorio circular por más pequeño que sea. Como en las gráficas de anillo, se pelean por ver quien tiene el trozo más grande. Es una de las más utilizadas. Para la gente obesa este tipo de gráficas ocasiona antojo a pastel, por lo que es recomendable que no se les deje al alcance de ellos. Los inversionistas usan frecuentemente las gráficas de pastel, aunque no sepan como dividirlas. Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 15 12.8.1.6 HISTOGRAMA: forma gráfica de barras que emplea variables con escala de intervalos o de proporciones. Para realizarla, se toma en cuenta para el eje X, los Límites reales, y para el eje Y, las frecuencias absolutas. 12.8.1.7 POLÍGONO DE FRECUENCIAS: forma gráfica que representa una distribución de frecuencias en la forma de una línea continua que traza un histograma. Para su elaboración, se consideran las marcas de clase en el eje X y las frecuencias absolutas en el eje Y. 12.9 EJEMPLOS RESUELTOS DE ESTADÍSTICA DESCRIPTIVA 12.9.1 EJEMPLO DE TABLAS ESTADÍSTICAS: Ejemplo 6: supongamos que se realizó una investigación sobre “Los autobuses en la Terminal de Santiago”. 1) Toma de datos: Los siguientes datos corresponden a la cantidad de asientos vacíos que reportaron 50 autobuses en la Terminal de Santiago en un domingo. 12 11 10 1 8 7 5 6 4 1 8 6 6 2 4 4 6 11 4 5 10 4 12 8 3 2 2 1 10 12 4 4 6 2 12 1 4 8 9 7 Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 16 7 6 8 4 6 9 3 7 7 5 4 4 4 4 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 8 8 8 8 8 9 9 10 10 10 11 11 12 12 12 12 2) Ordenación de datos 1 1 1 1 2 2 2 2 3 3 4 4 4 4 4 3) Rango Rango Mayor valor Menor valor Rango 12 1 Rango 11 3) Tamaño de clase Número de Clases 1 3,322 log N 6 Tamaño de Clases Rango 11 1,8 2 Número de Clases 6 TABLA N°8 LA MEDIA Y LAS FRECUENCIAS: ABSOLUTA, RELATIVA Y PORCENTUAL Intervalo Clase Frecuencia Absoluta Frecuencia Relativa Frecuencia Porcentual X f x 8 0,16 16 % 1,95 15,60 4,95 11 0,22 22 % 3,95 43,45 4,95 6,95 10 0,20 20 % 5,95 59,50 8,9 6,95 8,95 10 0,20 20 % 7,95 79,50 9 10,9 8,95 10,95 5 0,10 10 % 9,95 49,75 11 12,9 10,95 12,95 6 0,12 12 % 11,95 71,70 50 1 100 % 41,70 319,50 LRI LRS LI LS 1 1 2,9 0,95 2,95 2 3 4,9 2,95 3 5 6,9 4 7 5 6 f Total 12.9.2 EJEMPLOS DEL CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL Ejemplo 7: Hallar la media y mediana, en la tabla estadística anterior: Mediana Media X f x n 319,50 X 6,39 50 n 2 fi Me LRI c f mediana 25 8 17 Me 2,95 2 2,95 2 2,95 3,10 6,05 11 11 Ejemplo 8: Hallar la media aritmética, la mediana y la moda; de una estudiante del 10° P, si tiene las siguientes notas en el tercer trimestre, en Matemática: 2,0; 3,5; 3,5; 1,0; 2,5; 1,5 Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 17 X 2,0 3,5 3,5 1,0 2,5 1,5 14 2,33 6 6 Haciendo una ordenación de las notas, se tiene que: 1,0; 1,5; 2,0; 2,5; 3,5; 3,5 1,0; 1,5 2,0; 2,5 3,5; 3,5 Valores Centrales La mediana (promedio de los valores centrales 2,0 y 2,5 ) es: Me 2,0 2,5 4,5 2,25 2 2 La nota que más se repite es 3,5 , por lo tanto la moda es: Mo 3,5 Ejemplo 9: Hallar la media aritmética de la siguiente tabla de frecuencia que trata sobre el largo de 63 árboles de mango: TABLA N°9 LA DISTRIBUCIÓN DE FRECUENCIA DE 63 ÁRBOLES DE MANGO LARGO (en m) FRECUENCIA ABSOLUTA LARGO POR FRECUENCIA ABSOLUTA x f f x 5 10 5 X 10 = 50 6 15 6 X 15 = 90 7 20 7 X 20 = 140 8 12 8 X 12 = 96 9 6 9 X 6 = 54 n 63 f x 430 Calculando la media aritmética, será: X fx n X 430 6,825 63 Observación: Se debe recordar que la frecuencia absoluta indica cuántas veces se repite cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si la frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces). Ejemplo 10: Hallar la media aritmética, la mediana y la moda de un conjunto de datos ordenados en forma decreciente, de mayor a menor, así: 21; 19; 18; 15; 13; 11; 10; 9; 5; 3 La media aritmética o promedio es: X 21; 19; 18; 15; 13 11 Valores Centrales 21 19 18 15 13 11 10 9 5 3 124 12,4 10 10 10; 9; 5; 3 La mediana es: Me 13 11 24 12 2 2 En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda. Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 18 Ejemplo 11: Encuentre la media aritmética, la moda y la mediana si en una prueba de Geometría, los estudiantes del 10º J y el 10º K obtuvieron las siguientes calificaciones: Calificaciones Frecuencias 1,0 2,0 3,0 4,0 5,0 1 4 15 8 2 El promedio o media aritmética del grupo es igual a la sumas de todas las calificaciones entre el número total de frecuencias: M X 1 1 2 4 3 15 4 8 5 2 1 4 15 8 2 1 8 45 32 10 96 3,2 1 4 15 8 2 30 La calificación que obtuvieron la mayoría de los estudiantes de ambos grupos, fue 3,0 por lo tanto la moda es: Mo 3,0 La calificación, que se encuentra exactamente a la mitad de los datos agrupados, será el valor de la mediana, en este caso, como la cantidad de datos es par, entonces la mediana es la suma de los dos valores del centro entre dos, así: 1 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 5 5 Me 33 3,0 2 Ejemplo 12: Encuentre la media aritmética, la moda y la mediana, del siguiente conjunto de datos: 15, 17, 17, 17, 18, 21, 21, 26, 28 El promedio o media aritmética es: X 115 317 118 221 126 128 15 51 18 42 26 28 180 20 1 4 15 8 2 9 9 El dato que más se repite es el 17, por lo tanto la moda es: Mo 17 La mediana, en este caso, como la cantidad de datos es impar, y el valor central es 18, entonces la mediana es: Me 18 12.9.3 EJEMPLOS DE DISTRIBUCIONES DE FRECUENCIAS Y GRÁFICAS Ejemplo 13: Distribución de frecuencias con datos sin agrupar Colectivo: 20 familias. N 20 Variable X : ingresos anuales expresados en miles de Balboas. Valores observados: 18, 20, 22, 19, 18, 20, 18, 19, Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 19 21, 20, 20, 21, 18, 20, 21, 19, 20, 21, 18, 20 TABLA N°10 DISTRIBUCIÓN DE FRECUENCIAS Frecuencias xi Ingresos X1 X2 X3 X4 X5 X 18 19 20 21 22 Absoluta ni 5 3 7 4 1 N 20 Absoluta Acumulada Ni 5 5+3=8 5 + 3 + 7 = 15 5 + 3 + 7 + 4 = 19 5 + 3 + 7 + 4+ 1 = 20 Relativa fi ni N 0,25 0,15 0,35 0,20 0,05 1 Relativa Acumulada Fi Ni N 0,25 0,40 0,75 0,95 1,00 REPRESENTACIÓN GRÁFICA DE LA DISTRIBUCIÓN DE FRECUENCIAS: Ejemplo 14: Distribución de frecuencias con datos agrupados en intervalos Colectivo: 60 cilindros fabricados por una máquina. N 60 Variable X : longitud en centímetros. Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 20 Valores observados: 239, 254, 255, 248, 246, 249, 242, 250, 249, 244, 253, 248, 250, 258, 252, 251, 250, 253, 247, 243, 245, 251, 247, 250, 248, 250, 259, 249, 249, 250, 251, 253, 241, 251, 249, 252, 250, 247, 251, 259, 250, 246, 252, 238, 251, 238, 236, 259, 249, 257, 249, 247, 251, 246, 245, 243, 250, 249, 242, 238 TABLA N°11 FRECUENCIAS CON DATOS AGRUPADOS EN INTERVALOS Frecuencias Intervalos Marcas de clase Frecuencias Relativas Absolutas Li 1 Li ci 235-240 240-245 245-250 250-255 255-260 237,50 242,50 247,50 252,50 257,50 ni Ni fi Fi 5 8 27 15 5 5 13 40 55 60 0,08 0,13 0,45 0,25 0,08 1 0,08 0,22 0,67 0,92 1 N 60 REPRESENTACIÓN GRÁFICA DE LA DISTRIBUCIÓN DE FRECUENCIAS: Ejemplo 15: Distribución de frecuencias con datos agrupados en intervalos Colectivo: 1000 empresas de un sector. N 1000 Variable X : ventas mensuales en miles de Balboas. Valores observados: se han agrupado en intervalos. Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 21 Intervalos Li 1 Li 0-50 50-100 100-200 200-400 400-800 hi TABLA N°12 DISTRIBUCIÓN FRECUENCIAS Frecuencias Amplitud Marcas de Absolutas Relativas Intervalo clase ci ni Ni 25 75 150 300 600 100 250 400 200 50 100 350 750 950 1000 N 1000 fi ni N 0,10 0,25 0,40 0,20 0,05 1 Fi Ni N 0,10 0,35 0,75 0,95 1 I Li Li 1 50 50 100 200 400 Alturas hi ni Ii 2 5 4 1 0,125 ni (La altura o densidad de frecuencias es igual a la frecuencia entre la amplitud intervalo). Ii REPRESENTACIÓN GRÁFICA 12.9.4 EJEMPLO DE INTERPRETACIÓN GRÁFICA Dada la siguiente gráfica de barra, que se refiere a los puntajes obtenidos por los estudiantes de un grupo de décimo en un taller de Matemáticas: Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 22 Realizando una interpretación del gráfico de barras podemos deducir que: 5 alumnos obtienen puntaje de 62 5 alumnos obtienen puntaje de 67 8 alumnos obtienen puntaje de 72 12 alumnos obtienen puntaje de 77 16 alumnos obtienen puntaje de 82 4 alumnos obtienen puntaje de 87 Eso, hace un total de 50 alumnos. Sabemos que la mediana se obtiene así: Me 50 1 51 25,5 lo cual significa que la 2 2 mediana se ubica en la posición intermedia entre los alumnos 25 y 26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro: ALUMNOS PUNTAJE ALUMNOS PUNTAJE ALUMNOS PUNTAJE 1 62 18 72 35 82 2 62 19 77 36 82 3 62 20 77 37 82 4 62 21 77 38 82 5 62 22 77 39 82 6 67 23 77 40 82 7 67 24 77 41 82 Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 23 8 67 25 77 42 82 9 67 26 77 43 82 10 67 27 77 44 82 11 72 28 77 45 82 12 72 29 77 46 82 13 72 30 77 47 87 14 72 31 82 48 87 15 72 32 82 49 87 16 72 33 82 50 87 17 72 34 82 El alumno 25 obtuvo puntaje de 77 El alumno 26 obtuvo puntaje de 77 Entonces, como el total de alumnos es par, debemos promediar esos puntajes: Me 77 77 144 77 2 2 La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde 77 hacia abajo y 25 alumnos obtuvieron puntaje de 77 hacia arriba. Material de Estadística. Elaborado por la Profesora: Xenia Batista (profa.xenia@hotmail.com) I. P. T. Veraguas, 2014 24