UNIDAD II METODOS DE ORGANIZACIÓN Y PRESENTACIÓN DE LA INFORMACION Una vez obtenidos los datos, surge el problema de interpretar correctamente los mismos, por tanto se requiere disponer de métodos que permitan organizar y presentar las observaciones de tal forma que los aspectos más sobresalientes de las mismas sean fáciles de percibir. Los métodos a usar deberán tener características que nos permitan alcanzar los objetivos mencionados, entre dichas características tenemos: a) Que proporcionen la máxima información respecto a los datos, en forma rápida y fácil de visualizar. b) Que sean sencillos en su operación. c) Que permitan presentar los datos de manera estética, es decir limpios y de manera que llamen la atención del observador. Los métodos que se utilizan para describir conjuntos de datos son los tabulares y los gráficos. Cuando los datos estadísticos se presentan en forma de tablas o tabulares los datos se arreglan en un cuadro de doble entrada llamado así porque en el cruce de filas y columnas se da entrada a la información. Un diagrama estadístico o grafica es un medio plástico para presentar datos estadísticos. METODO TABULAR Es común que una gran cantidad de reportes, ya sean científicos, de negocios, administración privada o publica, así como en revistas, periódicos y en los medios de comunicación, los datos se presenten por medio de Tablas o tabulares. La presentación tabular es una disposición sistemática de la información arreglada en filas y columnas con propósitos comparativos. TIPOS DE TABULARES Las tablas estadísticas pueden ser de dos tipos, de acuerdo con los propósitos para los cuales sirven las tablas: Tablas para propósitos generales y Tablas para propósitos especiales. Las tablas generales, también llamadas de referencia, proporcionan información para uso general, sirviendo como deposito de la información, contienen cifras absolutas, deben incluir cifras sin redondear y su presentación debe facilitar su entendimiento. Las tablas publicadas por las distintas agencias gubernamentales son casi siempre de tipo general. Este tipo de tablas se colocan usualmente en el apéndice de los trabajos de investigación para facilitar su referencia. Las tablas generales se usan para construir las tablas especiales o derivadas. Las tablas especiales también llamadas de resumen, de texto o analíticas, presentan los datos de manera que se realcen relaciones específicas, proporcionando información para una exposición particular, puede utilizar cifras redondeadas y para facilitar su interpretación el material seleccionado deberá presentarse en un espacio reducido. Este tipo de tablas es muy común en las empresas. PARTES PRINCIPALES DE UNA TABLA O TABULAR Las partes que constituyen una tabla estadística pueden variar, pero en general puede incluir 7 partes principales y estas son: titulo, encabezados, columna matriz o conceptos, cuerpo, nota de encabezado, nota de pie y fuente de los datos. Las cuatro primeras son básicas y deben incluirse en todas las tablas. Las tres partes restantes son adicionales, pero siempre que sean aplicables deben estar presentes en la tabla. Todas las partes deben ser presentadas en forma clara y simple, pero completa con objeto de gastar la menor cantidad de tiempo y obtener la mayor información de la presentación de la tabla. 1. TITUL0.- Es una descripción del contenido de la tabla, e indica la naturaleza de los datos, localidad a la que corresponden y el periodo de tiempo incluido. Se sitúa encima de la tabla y es usual que se utilice en la letra de mayor tamaño. 2. ENCABEZADO.- Es el titulo de la parte superior de una columna. Algunas tablas tienen más de dos encabezados y algunas llegan a tener encabezados y subencabezados. 3. COLUMNA MATRIZ.- Es la sección de la tabla que contiene los encabezamientos de las líneas, debe tenerse cuidado al agrupar los elementos de la matriz de que esto facilite la interpretación de los datos. Las descripciones en hileras de la tabla son llamadas conceptos, los cuales se colocan al lado izquierdo de la tabla y usualmente representan las clasificaciones de las cifras incluidas en el cuerpo de la tabla. La naturaleza de las clasificaciones es indicada por los encabezados de la columna. De ser necesario cada concepto puede ser dividido en subconceptos. 4. CUERPO.- Son los datos estadísticos en si, los cuales son arreglados de acuerdo con las clasificaciones de los encabezados y conceptos, por tanto podemos decir que una presentación efectiva de los datos de un tabular depende de los arreglos de las columnas e hileras. 5. NOTA DE ENCABEZADO.- Son usadas para explicar ciertos puntos relacionados con la tabla completa que no han sido incluidos en el titulo, ni en los encabezados, ni en los conceptos. Se colocan arriba de los encabezados y abajo del titulo. 6. NOTA DE PIE.- Son usualmente colocadas debajo de la tabla y encima de la fuente. Se referencia por símbolos o por letras del alfabeto, nunca por un número porque este pudiera tomarse como parte de los datos. Son usadas para clarificar algunas partes incluidas en la tabla que no son explicadas en otras partes. 7. FUENTE.- La fuente se sitúa debajo de las notas de pie. Si los datos fueron recopilados y presentados por la misma persona es costumbre no establecer la fuente en la tabla. Sin embargo si los datos fueron tomados de otras fuentes publicadas, la fuente debe ser declarada para darle consistencia a la información y asignarle el crédito a quien corresponda por la información. 8. CONSTRUCCION DEL TABULAR. En una tabla las líneas deben situarse de la siguiente forma: a) Se sitúan líneas horizontales debajo de la cabecera y del cuerpo de la tabla. b) Las columnas se separan mediante líneas, las cuales no son muy necesarias pero si son útiles. c) La Matriz y la cabecera se separan de las cifras por líneas dobles o más gruesas, especialmente si las tablas no son impresas. d) Los totales se separan del resto de las cifras mediante una línea. Para poner en relieve ciertos aspectos de la tabla se pueden usar líneas dobles o más gruesas, caracteres de cursiva, contrastes tipográficos, etcétera. PARTES DE UN TABULAR Tabla 1.- Indicadores de desarrollo y Bienestar de algunos países de Asia en 1995. PAÍS AFGANISTAN A. SAUDITA ARMENIA AZERBAIYAN BANGLADESH CAMBOYA CHINA CHIPRE EMIRATOS A. FILIPINAS GEORGIA INDIA INDONESIA IRAN IRAQ ISRAEL JAPON KUWAIT LIBANO MALASIA MONGOLIA NEPAL PAKISTAN R. DE COREA RUSIA SINGAPUR SIRIA TAIWAN TURQUIA VIETNAM INGRESO PER ESPERANZA DE CÁPITA VIDA AL NACER (DÓLARES EUA) (AÑOS) 220 7510 780 740 220 200 470 9820 22020 770 850 310 670 2200 1940 13220 28190 16160 1400 2790 900 170 420 6790 2510 15730 1160 8790 1980 220 43 69 70 71 55 50 69 77 72 65 72 61 60 65 65 76 79 75 66 71 64 54 59 71 69 75 67 71 67 67 ÍNDICE DE MORTALIDAD INFANTIL (POR CADA 1000 HAB.) ALFABETIZACIÓN (% POB.> 15 AÑOS) 164 28 21 82 91 117 31 10 20 40 19 79 66 65 80 9 5 14 40 14 60 99 95 13 20 5 36 5 54 37 29.4 62.4 95.3 N.D. * 34.8 48.0 77.7 94.5 73.0 88.7 N.D. * 48.2 77.6 65.2 59.7 91.8 100.0 73.0 80.1 78.4 97.9 37.7 25.6 96.3 99.0 90.7 79.9 92.8 80.7 87.6 *N. D. No determinado Fuente: Los Recursos mundiales en el periodo 1994-1995, Departamento de prensa, Universidad de Oxford, Estados Unidos de América. El ejemplo más importante del uso del método tabular en la presentación de conjuntos de datos es la tabla de frecuencias o distribución de frecuencias. DISTRIBUCIÓN DE FRECUENCIAS. Una vez efectuadas las mediciones de una característica de interés sobre los elementos que componen una muestra o una población, los valores resultantes se hallan formando un conjunto desordenado, lo cual dificulta su análisis y por tanto la información no es suficiente para llegar a conclusiones respecto al conjunto. Para organizar adecuadamente la información se deben seguir los pasos siguientes: A) ORDENACIÓN. Es necesario organizar los datos para así obtener un arreglo ordenado de los valores, es decir un listado de los valores en orden ascendente o descendente. Ejemplo: Los datos siguientes corresponden a la variable estatura de una muestra seleccionada al azar de 72 alumnos varones que cursaron el 3er. Grado en la Escuela Preparatoria 1 UAN en el ciclo escolar 2002-2003. Realice la ordenación ascendente y descendente de los datos. 1.62 1.51 1.68 1.69 1.62 1.75 1.89 1.80 1.76 1.55 1.67 1.55 1.60 1.68 1.70 1.78 1.75 1.85 1.50 1.67 1.69 1.50 1.70 1.72 1.80 1.86 1.75 1.65 1.60 1.70 1.60 1.70 1.70 1.75 1.75 1.80 1.70 1.73 1.70 1.60 1.72 1.72 1.78 1.78 1.78 1.68 1.73 1.65 1.75 1.68 1.70 1.84 1.75 1.85 1.70 1.72 1.75 1.70 1.72 1.70 1.76 1.81 1.78 1.70 1.74 1.70 1.73 1.70 1.71 1.87 1.85 1.75 1.75 1.75 1.75 1.75 1.75 1.75 1.75 1.75 1.75 1.76 1.76 1.78 1.78 1.78 1.78 1.78 1.80 1.80 1.80 1.81 1.84 1.85 1.85 1.85 1.86 1.87 1.89 a).- Ordenación ascendente 1.50 1.50 1.51 1.55 1.55 1.60 1.60 1.60 1.60 1.62 1.62 1.65 1.65 1.67 1.67 1.68 1.68 1.68 1.68 1.69 1.69 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.71 1.72 1.72 1.72 1.72 1.72 1.73 1.73 1.73 1.74 b).- Ordenación descendente 1.89 1.87 1.86 1.85 1.85 1.85 1.84 1.81 1.80 1.80 1.80 1.78 1.78 1.78 1.78 1.78 1.76 1.76 1.75 1.75 1.75 1.75 1.75 1.75 1.75 1.75 1.75 1.74 1.73 1.73 1.73 1.72 1.72 1.72 1.72 1.72 1.71 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.70 1.69 1.69 1.68 1.68 1.68 1.68 1.67 1.67 1.65 1.65 1.62 1.62 1.60 1.60 1.60 1.60 1.55 1.55 1.51 1.50 1.50 B) DIAGRAMA DE TRONCO Y HOJA. Ordenar un conjunto numeroso de datos ya sea en forma ascendente o descendente puede ser una tarea difícil, además de que la lista de números sigue siendo una vasta pieza de información, por tanto es útil contar con una forma de manejar estos valores a partir de una técnica que nos permita organizar los datos, llamada diagrama de tronco y hoja, para su construcción siga los siguientes pasos: 1º Divida cada dato en dos partes, tallo y hoja. 2º Haga un listado de los tallos en una columna, trace una línea vertical a su derecha. 3º Para cada dato escriba la hoja en la misma fila al tallo que corresponda. 4º Realice la ordenación de las hojas de menor a mayor. Ejemplo: Considere las calificaciones obtenidas en una prueba de biología aplicada a 20 estudiantes como a continuación se detalla: 50 55 57 61 62 63 64 65 67 68 68 72 74 74 77 78 82 84 89 93 5 6 7 8 9 Con este paso disponemos las posiciones del tronco, luego se marcan las hojas por elementos de datos individuales en orden consecutivo. El diagrama de tronco y hojas final lucirá así: 5 6 7 8 9 0 1 2 2 3 5 2 4 4 7 3 4 5 7 8 8 4 7 8 9 El grafico de tronco y hojas contiene la misma información que el listado original pero de forma mucho mas compacta, destacando los aspectos importantes de los datos, como por ejemplo en este conjunto nos revela que la mayoría de los datos pertenece al orden de los 60. Si bien el arreglo ordenado hace que las observaciones adquieran mas significado, puede lograrse una mayor síntesis agrupando los datos en un grupo de intervalos contiguos evitando que se traslapen de modo que cada valor pueda colocarse en uno solo de los intervalos que en forma genérica se les llama intervalos de clase o simplemente clases. C) DESCRIPCIÓN NUMÉRICA. Una distribución de frecuencias es el resultado de agrupar los datos en grupos o clases de la misma magnitud o en clases con límites determinados con anterioridad, señalando el numero de valores que toma la variable que pertenecen a cada clase, lo cual se denomina frecuencia de clase. El primer punto a considerar es la determinación de cuantos intervalos deben incluirse, siendo esto un asunto delicado no conviene incluir pocos intervalos debido a que hay perdida de información, asimismo si se utilizan demasiados intervalos no se logran los objetivos de la síntesis. Para determinar el número de intervalos a considerar se tiene el recurso de la Regla de Sturges, aplicando el modelo matemático: K = 1 + 3.3 (log10 n) donde K representa el numero de intervalos de clase y n el numero de valores en el conjunto a consideración. El resultado dado por la Regla de Sturges debe de considerarse únicamente como una guía y proceder según sea conveniente, a beneficio de una presentación clara, aumentando o disminuyendo el número de clases. Si por alguna causa se tiene problemas para calcular logaritmos de base 10 se puede emplear la ecuación de cambio de base: log a x = ln x / ln a Aplicando esta formula tenemos: log10 75 = ln75/ ln10 = 4.3175/ 2.3026 =1.8751 Considerando los datos del ejemplo antes citado tenemos. K = 1 + 3.3 ( log10 75) = 1 + 3.3 ( 1.8751) = 1 + 6.1878 = 7.2 Con base en lo anterior K = 7, pero quizás otras consideraciones nos llevarían a utilizar 8 o quizás 6 intervalos de clase. Otro método usual para la determinación del número de clases lo es el tabular de tamaño de la muestra: TAMAÑO DE LA NUMERO DE MUESTRA INTERVALOS De 10 a 20 5 De 20 a 45 6 De 45 a 90 7 De 90 a 180 8 De 180 a 360 9 De 360 a 720 10 Mas de 720 De 10 a 20 Si retomamos el ejemplo anterior veremos que en base al tamaño de la muestra (75) el numero de intervalos recomendado es 7. Una vez determinado el número de intervalos de clase, debe calcularse la amplitud que tendrán dichos intervalos, debiéndose cuidar que sea la misma amplitud para todos los intervalos, para lo cual calculamos primeramente la amplitud o rango el cual es la diferencia entre las observaciones extremas, es decir la mayor y la menor del conjunto: R = XN – Xn Para el conjunto en cuestión R = 1.89 – 1.50 = 0.39, donde XN es el dato mayor del conjunto y Xn el dato menor del mismo. La amplitud de intervalo entre clases (W) se determina dividiendo el Rango entre K es decir el número determinado de clases. Por tanto: W = R / K = 0.39 / 7 = 0.055 Es evidente que conviene usar una amplitud de 0.06 para el intervalo de clase. Podemos ahora construir los intervalos; dado que el valor más pequeño es 1.50 y el mas grande 1.89, deben empezarse los intervalos por 1.49 con objeto de disminuir el error experimental y terminar en un valor tal que incluya al 1.89, lo cual nos arroja los siguientes intervalos: 1.49-1.54 1.55-1.60 1.61-1.66 1.67-1.72 1.73-1.78 1.79-1.84 1.85-1.90 Puede observarse que resultan los 7 intervalos recomendados, que el intervalo de las clases es 0.06 y que la ultima clase incluye al dato 1.89 Para determinar el numero de valores o datos que caen dentro de cada intervalo o sea la frecuencia absoluta (fi), se utiliza una tabla de conteo observando los valores uno a uno y colocando una pequeña marca a un lado del intervalo al cual corresponda. CLASES 1.49-1.54 1.55-1.60 1.61-1.66 1.67-1.72 1.73-1.78 1.79-1.84 1.85-1.90 TABLA DE CONTEO 111 111111 1111 1111111111111111111111111111 11111111111111111111 11111 111111 TOTAL fi 3 6 4 28 20 5 6 72 Según el tabular observamos que cada clase esta limitada o determinada por dos números llamados limites aparentes de clase. Por ejemplo la clase 1.49 -1.54 tiene como limite aparente inferior él número 1.49 y como limite aparente superior el 1.54 La longitud de cada intervalo es el número de valores posibles que los datos pueden tener para pertenecer a la clase. Si aumenta la longitud del intervalo o ancho de la clase disminuye por consecuencia el número de clases y viceversa. La distribución que acabamos de realizar es llamada distribución de frecuencias absolutas. En ocasiones es útil conocer la proporción más que el número de valores que caen dentro de un intervalo de clase. Esta información se obtiene dividiendo la frecuencia absoluta de cada clase entre el numero total de datos, generándose una distribución de frecuencia relativa. CLASES 1.49-1.54 1.55-1.60 1.61-1.66 1.67-1.72 1.73-1.78 1.79-1.84 1.85-1.90 fi 3 6 4 28 20 5 6 Σ 72 FRECUENCIA RELATIVA 3/72 = 0.042 = 4.2% 6/72 = 0.084 = 8.4% 4/72 = 0.055 = 5.5% 28/72 = 0.389 = 38.9% 20/72 = 0.277 = 27.7% 5/72 = 0.069 = 6.9% 6/72 = 0.084 = 8.4% Σ72/72 Σ1.000 Σ 100.0% Si deseamos conocer la frecuencia de valores que caen dentro de 2 o más intervalos de clase, estos se pueden obtener sumando las frecuencias que caen dentro de los intervalos de clase de interés. Con lo anterior se genera la distribución de frecuencias acumuladas ya sean absolutas o relativas. CLASES 1.49-1.54 1.55-1.60 1.61-1.66 1.67-1.72 1.73-1.78 1.79-1.84 1.85-1.90 Σ fi 3 6 4 28 20 5 6 72 fai 3 9 13 41 61 66 72 frel 3/72 = 0.042 = 4.2% 6/72 = 0.084 = 8.4% 4/72 = 0.055 = 5.5% 28/72 = 0.389 = 38.9% 20/72 = 0.277 = 27.7% 5/72 = 0.069 = 6.9% 6/72 = 0.084 = 8.4% Σ72/72 Σ1.000 Σ 100.0% farel 4.2 % 12.6 % 18.1 % 57.0 % 84.7 % 91.6 % 100.0 % CONSTRUCCION DE UNA TABLA DE FRECUENCIAS PARA DATOS SIN AGRUPAR Ejemplo: Veinticinco empleados de la cadena de Moteles Candida estudiaron un curso de primeros auxilios, al termino del mismo se les practico un Evaluación de lo aprendido contando con 20 puntos en total y los resultados fueron los siguientes: 17, 17, 16, 16, 17, 19, 12, 19, 17, 16, 14, 15, 18, 18, 14, 20, 15, 15, 17, 18, 17, 16, 16, 13, 17. Con la información proporcionada realice la Distribución de frecuencias absolutas, relativas y acumuladas. Xi 12 13 14 15 16 17 18 19 20 fi 1 1 2 3 5 7 3 2 1 Σ 25 Frecuencia relativa 1/25 = 0.04 = 4% 1/25 = 0.04 = 4% 2/25 = 0.08 = 8% 3/25 = 0.12 = 12% 5/25 = 0.20 = 20% 7/25 = 0.28 = 28% 3/25 = 0.12 = 12% 2/25 = 0.08 = 8% 1/25 = 0.04 = 4% Σ 1.00 =100% fai 1 2 4 7 12 19 22 24 25 farel 1/25 = 0.04 = 4% 2/25 = 0.08 = 8% 4/25 = 0.16 = 16% 7/25 = 0.28 = 28% 12/25 = 0.48 = 48% 19/25 = 0.76 = 76% 22/25 = 0.88 = 88% 24/25 = 0.96 = 96% 25/25 = 1.00 = 100% CONSTRUCCION DE UN TABULAR CON DATOS AGRUPADOS EN CLASES Ejemplo: Estatura en centímetros de una muestra de 80 alumnos que cursaron el 2º Grado en la Escuela Preparatoria UNIVER, plantel Tepic, en el ciclo escolar 2006-2007. Realice la distribución de frecuencias. 162 151 168 169 162 175 189 180 176 155 167 155 160 168 170 178 175 185 150 167 169 150 170 172 180 186 175 165 160 170 160 170 170 175 175 180 170 173 170 160 172 172 178 178 178 168 173 165 175 168 170 184 175 185 170 172 175 170 172 170 176 181 178 170 174 170 173 170 171 187 185 175 190 193 190 194 196 191 191 193 175 175 175 175 175 175 175 175 175 176 176 178 178 178 178 178 180 180 180 181 184 185 185 185 186 187 189 190 190 191 191 193 193 194 196 Primer paso ORDENACION 150 150 151 155 155 160 160 160 160 162 162 165 165 167 167 168 168 168 168 169 169 170 170 170 170 170 170 170 170 170 170 170 170 170 170 171 172 172 172 172 172 173 173 173 174 Segundo paso DIAGRAMA DE TRONCO Y HOJA 1 5 0, 0, 1, 5, 5 1 6 0, 0, 0, 0, 2, 2, 5, 5, 7, 7, 8, 8, 8, 8, 9, 9 1 7 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 8, 8, 8, 8, 8 1 8 0, 0, 0, 1, 4, 5, 5, 5, 6, 7, 9 1 9 0, 0, 1, 1, 3, 3, 4, 6 Tercer paso DESCRIPCION NUMERICA R = XN – Xn = 196 – 150 = 46 Log10 80 = ln 80 / ln 10 = 4.38202/2.3026 = 1.90307 K = 1 + 3.3 (log10 n) = 1 + 3.3 (1.90307) = 7.28 ≈ 7 W = R / K = 46 / 7 = 6.5 ≈ 7 CLASES 149-155 156-162 163-169 170-176 177-183 184-190 191-197 fi 5 6 10 35 9 9 6 Σ 80 fai 5 11 21 56 65 74 80 5/80 = 6/80 = 10/80 = 35/80 = 9/80 = 9/80 = 6/80 = Σ80/80 frel 0.0625 ≈ 0.06 = 6% 0.0750 ≈ 0.08 = 8% 0.1250 ≈ 0.12 = 12% 0.4375 ≈ 0.44 = 44% 0.1125 ≈ 0.11 = 11% 0.1125 ≈ 0.11 = 11% 0.0750 ≈ 0.08 = 8% Σ1.000 Σ 100.0% farel 6% 14% 26% 70% 81% 92% 100.0 % METODO GRAFICO Otra método usado para presentar la información son las de graficas, que son una expresión plástica donde es posible resumir una gran cantidad de información, la ventaja de su uso es la facilidad de su análisis e interpretación, permitiendo una mejor visualización de una distribución determinada o de la tendencia manifiesta de un fenómeno. Una gran variedad de graficas han sido usadas en estudios estadísticos para presentar datos o mostrar las relaciones entre varios grupos de datos. De hecho, casi todos los tipos de información cuantitativa pueden ser representados por graficas. Una persona que entiende como construir buenas graficas presenta información cuantitativa mas rápidamente que si tuviera que arreglar las cifras en forma tabular o describir la misma información con palabras. Es frecuente la expresión “Una buena grafica vale mas que mil palabras”. Las graficas son dibujadas de acuerdo con el sistema de coordenadas rectangulares, las cuales se basan en dos líneas rectas mutuamente perpendiculares de referencia en un plano. La línea horizontal es llamada eje de las X o la absisa, mientras que la línea vertical es referida como eje de las Y o la ordenada. Las dos líneas dividen el plano en cuatro partes llamadas cuadrantes y el punto de intersección de las dos líneas se conoce como origen. CLASIFICACION DE GRAFICOS Existen tres grandes grupos de graficas que en forma común se usan para presentar información: a).- Graficas de áreas. b).- Graficas de líneas. c).- Pictogramas. GRAFICAS DE AREAS Utilizan figuras geométricas para representar por algunos de sus elementos, las variaciones de un fenómeno cuantitativo en relación con las variaciones de otro fenómeno. Un diagrama puede ser simple o múltiple, simple cuando representa un solo fenómeno y múltiple cuando representa a varios. En general, deben emplearse figuras geométricas de fácil interpretación, ya que el objeto principal de los diagramas es mostrar a primera vista las variaciones del fenómeno, cosa que seria imposible siendo la figura complicada. Ejemplos de graficas de áreas son el grafico de barras, el histograma, los diagramas de sectores circulares y los cartogramas o mapas. GRAFICAS DE LINEAS Es bastante útil para llevar a efecto la comparación de los datos de dos o más distribuciones. Consiste en unir por medio de segmentos de recta, los puntos de coordenadas determinados por los datos de dos variables que se corresponden o de variables que dependen del tiempo. Ejemplo de este tipo de grafico es el polígono de frecuencias. PICTOGRAMAS Es uno de los gráficos que mas atrae la atención razón por la cual se recurre a el con frecuencia. Consiste en representar por medio de figuras determinadas magnitudes, siendo su principal desventaja el que no permite comparaciones satisfactorias. GRAFICAS MÁS USUALES GRAFICA DE BARRAS Grafico de barras horizontales f CLASES e d c b a 0 5 10 FRECUENCIA ABSOLUTA 15 Se emplean por lo general para representar grupos de datos estadísticos, ya sean cronológicos, geográficos, o cualitativos, que pertenecen a cada categoría como áreas rectangulares de tamaño proporcional, usando la base de cada rectángulo para representar la variable, y la altura para representar a escala la intensidad que adquiere el fenómeno en cada uno de los casos. Pueden utilizarse este tipo de graficas para representar valores absolutos o relativos. Para elaborar este grafico se utilizan clases con limites aparentes, por lo cual las barras no deben ir contiguas, sino con un espacio entre ellas. Se pueden presentar las barras o celdas de dos formas diferentes: verticales u horizontales. Grafico de barras verticales 14 12 10 8 fi 6 4 2 0 a b c d e f CLASES HISTOGRAMA 30 25 1.485 – 1.545 1.545 – 1.605 1.605 – 1.665 1.665 – 1.725 1.725 – 1.785 1.785 – 1.845 1.845 – 1.905 20 15 10 5 0 fi Es un grafico que representa una distribución de frecuencias, con límites verdaderos de clase, su diferencia del grafico de estriba en que las barras o rectángulos van contiguos uno de otro, eliminando los espacios entre celdas. Cuando construimos una distribución de frecuencias a partir de los datos, los límites aparentes de clase reflejan por lo general el grado de precisión de los datos en bruto. Se sabe que algunos de los valores que caen dentro del segundo intervalo de clase si se midieran con precisión quizás serian poco menores que el límite aparente inferior y algunos serian un poco mayores que el límite aparente superior. Considerando la continuidad fundamental de la variable y suponiendo que los datos se redondearon hasta el número más próximo es conveniente pensar que los límites reales de clase son los límites verdaderos de este segundo intervalo, por tanto debemos calcular los límites verdaderos para cada uno de los intervalos de clase. Los límites reales inferiores de clase se determinan sumando al límite aparente inferior de cada clase, el límite aparente superior de la clase anterior y el resultado lo dividimos entre 2. Los límites reales superiores de clase se determinan sumando al límite aparente superior de cada clase, el límite aparente inferior de la clase siguiente y el resultado se divide entre 2. Ejemplo: Si continuamos con el ejemplo de estatura, de los alumnos de la Preparatoria No. 1. CLASES 1.49 – 1.54 1.55 – 1.60 1.61 – 1.66 1.67 – 1.72 1.73 – 1.78 1.79 – 1.84 1.85 – 1.90 fi 3 6 4 28 20 5 6 Σ 72 a).- Determinación de los limites reales superiores. 1ª) 1.54 + 1.55 entre 2 = 1.545 2ª) 1.60 + 1.61 entre 2 = 1.605 3ª) 1.66 + 1.67 entre 2 = 1.665 4ª) 1.72 + 1.73 entre 2 = 1.725 5ª) 1.78 + 1.79 entre 2 = 1.785 6ª) 1.84 + 1.85 entre 2 = 1.845 7ª) 1.845 + 0.06 = 1.905 Para calcular el límite real superior de la 7ª clase tenemos el problema que no existe 8ª clase, entonces optamos por aplicar lógica matemática; Podemos observar que la diferencia entre límites reales contiguos es igual a 0.06 o sea el intervalo de clase. Por tanto al limite real superior de la 6ª clase (1.845) le sumamos el intervalo y tenemos 1.845 + 0.06 = 1.905 valor del limite real superior de la 7ª clase. b).- Determinación de limites reales inferiores. 1ª) 1.545 – 0.06 = 1.485 2ª) 1.55 + 1.54 entre 2 = 1.545 3ª) 1.61 + 1.60 entre 2 = 1.605 4ª) 1.67 + 1.66 entre 2 = 1.665 5ª) 1.73 + 1.72 entre 2 = 1.725 6ª) 1.79 + 1.78 entre 2 = 1.785 7ª) 1.85 + 1.84 entre 2 = 1.845 Podemos observar que la diferencia entre limites reales inferiores sigue siendo 0.06, por tanto el primer limite real lo determinamos restándole al limite real inferior de la 2ª clase el intervalo y así 1.545 – 0.06 = 1.485. Nuestro tabular e Histograma con límites reales quedan de la siguiente manera: CLASES 1.485 – 1.545 1.545 – 1.605 1.605 – 1.665 1.665 – 1.725 1.725 – 1.785 1.785 – 1.845 1.845 – 1.905 fi 3 6 4 28 20 5 6 GRAFICO DE PASTEL También llamado gráfico de sectores circulares o de pay, estos muestran la cantidad de datos que pertenecen a cada categoría como una parte proporcional de un círculo. Se construye a partir de distribuciones de frecuencia donde las cuales las clases no se relacionan de manera cuantitativa. Para realizar un grafico de pastel se deben seguir los pasos siguientes: 1).- Calcule la frecuencia relativa de cada clase, su representación decimal, se obtiene dividiendo la frecuencia absoluta de clase entre el numero total de datos. CLASES 118 – 127 128 – 137 138 – 147 148 – 157 158 – 167 168 – 177 TOTAL fi 3 6 14 9 5 3 40 Frel 3/40 = 0.075 6/40 = 0.150 14/40 = 0.350 9/40 = 0.225 5/40 = 0.125 3/40 = 0.075 1.000 2).- Multiplique los resultados obtenidos por 360º, para determinar los grados que debe tener cada subsector. a) b) c) d) e) f) 0.075 X 360º = 27º 0.150 X 360º = 54º 0.350 X 360º = 126º 0.225 X 360º = 81º 0.125 X 360º = 45º 0.075 X 360º = 27º 3.- En un circulo marque los sectores con los angulos iguales a los obtenidos en el paso 2, trazamos un radio superior y empezamos a contar los grados del primer sector en el sentido en que giran las manecillas del reloj, continuamos así hasta insertar todos los subsectores angulares. De esta manera obtenemos el grafico de pastel, tarta, pay o de sectores circulares. Grafico de pay o pastel 118 – 127 128 – 137 138 – 147 148 – 157 158 – 167 168 – 177 POLIGONO DE FRECUENCIAS El polígono de frecuencias es un grafico de puntos y líneas que se realiza buscando la intersección de las marcas de clase y la frecuencia de la clase que se trate. Una vez ubicados los puntos se unen estos a través de segmentos de recta. Ejemplo: Con los datos del siguiente tabular determinemos los puntos medios de clase, para lo cual sumamos los dos limites ya sean reales o aparentes que conforman cada clase y los promediamos es decir los dividimos entre 2, así tendremos los valores de las marcas de clase. CLASES 118 – 127 128 – 137 138 – 147 148 – 157 158 – 167 168 – 177 TOTAL fi 3 6 14 9 5 3 40 Frecuencia relativa 3/40 = 0.075 6/40 = 0.150 14/40 = 0.350 9/40 = 0.225 5/40 = 0.125 3/40 = 0.075 1.000 Marcas de clase ( mi ) 118+127/ 2 = 122.5 128+137/ 2 = 132.5 138+147/ 2 = 142.5 148+157/ 2 = 152.5 158+167/ 2 = 162.5 168+177/ 2 = 172.5 POLIGONO DE FRECUENCIAS 15 14 10 fi 9 5 6 5 3 3 0 122.5 132.5 142.5 152.5 162.5 172.5 Marcas de clase El polígono de frecuencias de una cantidad grande de datos puede estar formado por muchos pequeños segmentos que aproximan al conjunto a una curva, las cuales son llamadas curvas de frecuencias, absolutas o relativas según sea el caso. Es razonable pensar que las curvas provengan de la suavización de los polígonos de frecuencias de la muestra, donde la aproximación será más exacta conforme se aumente el tamaño de la muestra, por tal razón una curva de frecuencias se conoce también como polígono de frecuencias suavizado. Las curvas de frecuencia presentan determinadas formas características que sirven para distinguirlas entre si, y estas pueden ser: a) Simétricas se caracterizan por el hecho de que las observaciones equidistan del máximo central tienen la misma frecuencia. b) Sesgadas se caracterizan porque la cola de la curva que se encuentra de un lado del máximo central es mayor que al otro lado. Si la cola mayor se presenta a la derecha de la curva se dice que esta sesgada a la derecha o que tiene un sesgo positivo, mientras que si ocurre que la curva sea sesgada a la izquierda se dice que tiene un sesgo negativo. c) En forma de J o J invertida son aquellas que el máximo se presenta en un extremo. d) En forma de U son aquellas que tienen el máximo valor en los dos extremos. e) Bimodal son las que tienen dos máximos, y la multimodal tiene más de 2 máximos. CURTOSIS O APUNTAMIENTO La curtosis es una medida del apuntamiento de un polígono de frecuencias y sólo se aplica a distribuciones unimodales (distribuciones que tienen un único “pico”). Generalmente el grado de curtosis de una distribución se compara con un modelo de distribución que estudiaremos más adelante que es la llamada distribución normal. Así, las distribuciones que tienen el mismo grado de apuntamiento que la normal se llaman mesocúrticas. Las distribuciones que tienen mayor grado de apuntamiento que la normal se llaman leptocúrticas y las que lo tienen menor platicúrticas. Los índices empleados habitualmente para calcular la curtosis son demasiado complicados, comparados con su utilización, por lo que en estas notas no haremos referencia a ellos. Figura: Ejemplos de distribuciones con distintos tipos de curtosis. La A es leptocúrtica, la B mesocúrtica y la C platicúrtica. POLÍGONO DE FRECUENCIA ACUMULADA U OJIVA La gráfica de la frecuencia acumulada es muy útil porque en ella podemos determinar cuántas observaciones hay por arriba o por debajo de algún valor que nos interese. La gráfica que se obtiene de la frecuencia acumulada también se conoce con el nombre de ojiva. Para trazar dicha gráfica se procede como en los gráficos anteriores, es decir, en el eje horizontal se trazan los intervalos de clase y marcas de clase y en el vertical las frecuencias acumuladas. Ejemplo: Sea el conjunto de datos siguiente, grafique la ojiva correspondiente. CLASES 118 – 127 128 – 137 138 – 147 148 – 157 158 – 167 168 – 177 TOTAL fi 3 6 14 9 5 3 40 fai 3 9 23 32 37 40 45 40 35 30 25 20 15 10 5 0 122.5 132.5 142.5 152.5 162.5 172.5