(Revisado agosto 2015_LBW/RS) CLAVE-Laboratorio 3: Resumen gráfico de la información II 1. Utilizando los datos de prueba Atriplex, prepare el siguiente gráfico de barras que presenta el porcentaje de germinación en semilla de diferentes tamaños, con color de episperma en barras adyacentes. (ayuda: utilice las opciones de “medidas de confianza, ninguna” y “particiones en el mismo gráfico”). Arregle la escala de eje Y, las rotulaciones, tipografía, anchos y colores de las barras, etc., a su gusto. % Germinación 100 75 50 25 0 chicas medianas grandes Tamaño de Semilla episperma claro epispera oscuro episperma rojizo Episperma en “Particiones” para hacer barras adyacentes AGRO 5005 – CLAVE Lab 3 Page 1 (Revisado agosto 2015_LBW/RS) Seleccione las opciones de “ninguna” medida de confianza y “Particiones en el mismo gráfico” (para que las barras adyacentes aparezcan en el mismo gráfico) Ajuste la escala y la rotulación del eje Y; Edita la etiqueta del eje Y (% Germinación en vez de PG) , y con la flecha posicionada encima del gráfico, haga un “click” derecho, y seleccione la opción de “mostrar leyenda” y “mostrar grilla”. 2. Usando los datos de Atriplex, prepare un gráfico de puntos para graficar PS (peso de semillas) en el eje vertical y color (episperma) en el eje horizontal. Arregle la escala de eje Y, las rotulaciones, tipografía, colores, etc., a su gusto. VEASE la parte 3 AGRO 5005 – CLAVE Lab 3 Page 2 (Revisado agosto 2015_LBW/RS) 3. En el ejercicio 2, se puede usar la opción en InfoStat de “conectores” para conectar las medias de peso de semilla de los diferentes colores de episperma (Para hacer eso, abrimos “Series”, y seleccionamos los tres colores de episperma. Oprima el botón derecho del ratón y seleccionar la opción de “conectores>visibles”. ¿Recomendaría Ud. esta opción? ¿Por qué o porque no? Los puntos representan el peso promedio de cada color de semilla. Este gráfico es muy similar a un gráfico de barras (la posición de un punto es equivalente a la altura de la barra correspondiente). De hecho, el uso de un gráfico de barras probablemente sería preferible al uso de un gráfico de puntos. No se recomienda el uso de conectores para unir las medias porque episperma (color) es una variable nominal con categorías discretas (no una variable cuantitativa (continua) u ordinal (con categorías discretas pero con un orden natural)). En el gráfico abajo, la línea continua puede sugerir al lector que el PS “disminuye” con cambio de color, cuando en realidad simplamente hay diferencias en PS entre los colores (no hay una “tendencia” de aumentar o disminuir) Efecto de Color de Episperma sobre Peso de Semilla Peso de Semilla (g) 0.0038 0.0036 0.0034 0.0032 0.0030 claro rojizo oscuro Episperma El ejemplo abajo muestra LA MISMA INFORMACIÓN del gráfico anterior, pero con el orden de las categorías de eje X cambiado (se puede modificar el orden en la ventanilla de eje X, seleccionando una categoría y con ctrl+flecha moviendo la categoría a la posición deseada) Efecto de Color de Episperma sobre Peso de Semilla Peso de Semilla (g) 0.0038 0.0036 0.0034 0.0032 0.0030 claro oscuro rojizo Episperma AGRO 5005 – CLAVE Lab 3 Page 3 (Revisado agosto 2015_LBW/RS) En otras palabras, no hay un orden “natural” entre “oscuro, claro o rojizo” – color de episperma en una variable nominal. Al contrario, si las categorías fuesen “pequeño, intermedio y grande”, la variable (tamaño) sería ordinal (tiene un orden “natural”) 4. Usando los datos de café, construya una tabla de frecuencias para la variable altura (en metros) usando InfoStat (menú Estadísticas>Tablas de Frecuencias). Escoja “número de clases personalizado”, con valor mínimo de .905, máximo de 5.105 y 7 clases (verificar que esto les da un ancho de clase de 0.6, como deseamos). Ahora prepare un histograma de frecuencias absolutas a mano (usando la tabla de frecuencias como base) y en Infostat (menú Gráficos>Histograma, use las mismas clases que usó para la tabla de frecuencias: comience con 0.905 m (como extremo inferior de la primera clase) y use un ancho de clase de 0.6 m. Tanto para tablas de frecuencias como para histogramas, en InfoStat se puede indicar qué tipo de tabla/gráfica se desea (con límites de clase o marca de clase en el eje X; frecuencia absoluta, frecuencia relativa, frecuencia absoluta acumulada o frecuencia relativa acumulada en el eje Y). Practica el cálculo a mano de valores como límites de clase, marca de clase, frecuencias absolutas, etc. OJO: Como los datos originales de altura se miden con 2 lugares decimales, los límites de clase tienen que tener 3 lugares decimales. Para que la salida aparezca con los tres lugares decimales, utilice el icono que aumenta el número de decimales. Tabla de Frecuencias: Variable altura altura altura altura altura altura altura Clase 1 2 3 4 5 6 7 [ ( ( ( ( ( ( LI 0.905 1.505 2.105 2.705 3.305 3.905 4.505 AGRO 5005 – CLAVE Lab 3 LS 1.505 2.105 2.705 3.305 3.905 4.505 5.105 ] ] ] ] ] ] ] MC FA 1.205 1 1.805 1 2.405 14 3.005 14 3.605 7 4.205 2 4.805 1 FR FAA 0.025 1 0.025 2 0.350 16 0.350 30 0.175 37 0.050 39 0.025 40 FRA 0.025 0.050 0.400 0.750 0.925 0.975 1.000 Page 4 (Revisado agosto 2015_LBW/RS) 5. Usando los datos del archivo salinidad, construya un histograma y una ojiva para biomasa. Use la ojiva para contestar las siguientes preguntas: (a) ¿Qué porcentaje de las observaciones tienen biomasa menor de 1000? Aprox. 51% -- Se puede contestar esta pregunta más fácilmente utilizando la opción de “línea de corte” en InfoStat (ver gráfico abajo). (b) ¿Qué porcentaje de las observaciones tienen biomasa mayor de 2000? 100% - 89% = 11% (c) 60% de las observaciones tienen biomasa menor de aprox. 1150 (se puede utilizar la opción de una línea de corte en 0.60 en el eje Y) (d) 35% de las observaciones tienen biomasa mayor de aprox 1220 . AGRO 5005 – CLAVE Lab 3 Page 5 (Revisado agosto 2015_LBW/RS) Utilice la opción “línea de corte” para dibujar una línea vertical para biomasa de 1000 y 2000 Aproximadamente el 51% de las observaciones tienen biomasa menor de 1000 g (el valor de Y [en %] donde la línea vertical de biomasa=1000 cruce el polígono) Aproximadamente un 11% de las observaciones tienen biomasa superior a 2000 g (en este caso, 0.89 es el valor de Y donde la línea vertical de biomasa=2000 cruce el polígono; 1.00-0.89 = 0.11) 6. Use los datos de ajo blanco. Construya un histograma de frecuencias relativas y un polígono de frecuencias acumuladas para la variable perímetro. Aproximadamente, ¿qué porcentaje de las observaciones tienen perímetros mayores de 20? AGRO 5005 – CLAVE Lab 3 Page 6 (Revisado agosto 2015_LBW/RS) 0.28 0.24 frecuencia relativa 0.20 0.16 0.12 0.08 0.04 0.00 7.005 9.305 11.605 13.905 16.205 18.505 20.805 23.105 25.405 27.705 30.005 perim Frecuencias acumuladas para el perímetro de ajo 1.00 0.90 0.80 frec. rel. acumulada 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00 6 9 12 15 18 21 24 27 30 perim Aproximadamente el 22% de las observaciones tienen un perímetro mayor de 20 (78% menor de 20) 7. En las próximas gráficas, indique el nombre de cada gráfica, mencione cuáles gráficas están correctas y cuáles podrían inducir a interpretaciones erróneas o falaces. Justifique brevemente. AGRO 5005 – CLAVE Lab 3 Page 7 (Revisado agosto 2015_LBW/RS) Gráfico de sectores. En este gráfico, la maquinilla no representa los porcentajes expresados abajo y por lo tanto es una mala interpretación de la información que se quiere expresar Gráfico de barras. En este gráfico el tamaño de las manos no guardan proporción entre si y por lo tanto no representa claramente la información. En un gráfico de barras el ancho de las barras debe ser el mismo independiente de los porcientos establecidos. En este ejemplo, el ancho de las manos (“barras”) aumenta a medida que el porcentaje aumenta. Gráfico de barras. El gráfico tiene tres dimensiones cuando debería tener solamente dos dimensiones. (un gráfico de tres dimensiones debería tener una variable que corresponde al eje Z). Gráfico de barras. Los personajes no guardan proporción con los porcentajes ilustrados en números. El más grande es casi el doble en tamaño, cuando en realidad hay una diferencia entre ellos de 4%. El gráfico tiene diferentes anchos de “barras” AGRO 5005 – CLAVE Lab 3 Page 8 (Revisado agosto 2015_LBW/RS) Gráfico de barras. Los porcentajes y las estructuras presentadas no guardan relación entre sí: 82% - 4 estructuras, 12% = 2 estructuras, y 2% = 1 estructura. Las personas dentro de las estructuras son diferentes en cada una, prestándose para más confusión. Gráfico de barras. Aunque el blanco representa bien el nivel de certidumbre o precisión de las revistas, los porcentajes no están bien representados y no guardan proporción entre ellos. La gráfica tiene muchas cosas (encima del blanco, un hombre parado mirando, sombras, humo…) que distraen el verdadero mensaje. Gráfico de barras. El gráfico tiene tres dimensiones cuando debería tener solamente dos dimensiones. (un gráfico de tres dimensiones debería tener una variable que corresponde a la tercera dimensión - eje Z). Gráfico con barras apiladas. En esto caso, cada barra individual corresponde a un gráfico de sectores (con un total de 100%). El gráfico está bien construido. AGRO 5005 – CLAVE Lab 3 Page 9 (Revisado agosto 2015_LBW/RS) Gráfico de barras apiladas. Al contrario del caso anterior, la altura de una barra particular representa un total para el año indicado, y los colores dentro de una barra son los subtotales. El gráfico está bien construido. Gráfico series de tiempo. Se puede mejorar el gráfico indicando la unidad en el eje Y (número de estudiantes) y clarificando las rotulaciones en el eje X. Matricula Graduada UPRM - 2008 a 2012 1150 matricula 1100 1050 1000 950 900 08-09 II 08-09 I 09-10 II 09-10 I 10-11 II 10-11 I 11-12 II 11-12 I semestre AGRO 5005 – CLAVE Lab 3 Page 10