CLAVE-Laboratorio 3: Resumen gráfico de la información II

Anuncio
(Revisado agosto 2015_LBW/RS)
CLAVE-Laboratorio 3: Resumen gráfico de la información II
1. Utilizando los datos de prueba Atriplex, prepare el siguiente gráfico de barras que presenta
el porcentaje de germinación en semilla de diferentes tamaños, con color de episperma en
barras adyacentes. (ayuda: utilice las opciones de “medidas de confianza, ninguna” y
“particiones en el mismo gráfico”). Arregle la escala de eje Y, las rotulaciones, tipografía,
anchos y colores de las barras, etc., a su gusto.
% Germinación
100
75
50
25
0
chicas
medianas
grandes
Tamaño de Semilla
episperma claro
epispera oscuro
episperma rojizo
Episperma en “Particiones” para
hacer barras adyacentes
AGRO 5005 – CLAVE Lab 3
Page 1
(Revisado agosto 2015_LBW/RS)
Seleccione las opciones de “ninguna” medida de confianza y “Particiones en el mismo
gráfico” (para que las barras adyacentes aparezcan en el mismo gráfico)
Ajuste la escala y la rotulación del eje Y; Edita la etiqueta del eje Y (% Germinación en vez
de PG) , y con la flecha posicionada encima del gráfico, haga un “click” derecho, y
seleccione la opción de “mostrar leyenda” y “mostrar grilla”.
2. Usando los datos de Atriplex, prepare un gráfico de puntos para graficar PS (peso de
semillas) en el eje vertical y color (episperma) en el eje horizontal. Arregle la escala de eje Y,
las rotulaciones, tipografía, colores, etc., a su gusto.
VEASE la parte 3
AGRO 5005 – CLAVE Lab 3
Page 2
(Revisado agosto 2015_LBW/RS)
3. En el ejercicio 2, se puede usar la opción en InfoStat de “conectores” para conectar las
medias de peso de semilla de los diferentes colores de episperma (Para hacer eso, abrimos
“Series”, y seleccionamos los tres colores de episperma. Oprima el botón derecho del ratón y
seleccionar la opción de “conectores>visibles”. ¿Recomendaría Ud. esta opción? ¿Por qué o
porque no?
Los puntos representan el peso promedio de cada color de semilla. Este gráfico es muy
similar a un gráfico de barras (la posición de un punto es equivalente a la altura de la
barra correspondiente). De hecho, el uso de un gráfico de barras probablemente sería
preferible al uso de un gráfico de puntos.
No se recomienda el uso de conectores para unir las medias porque episperma (color) es
una variable nominal con categorías discretas (no una variable cuantitativa (continua) u
ordinal (con categorías discretas pero con un orden natural)). En el gráfico abajo, la línea
continua puede sugerir al lector que el PS “disminuye” con cambio de color, cuando en
realidad simplamente hay diferencias en PS entre los colores (no hay una “tendencia” de
aumentar o disminuir)
Efecto de Color de Episperma sobre Peso de Semilla
Peso de Semilla (g)
0.0038
0.0036
0.0034
0.0032
0.0030
claro
rojizo
oscuro
Episperma
El ejemplo abajo muestra LA MISMA INFORMACIÓN del gráfico anterior, pero con el
orden de las categorías de eje X cambiado (se puede modificar el orden en la ventanilla de
eje X, seleccionando una categoría y con ctrl+flecha moviendo la categoría a la posición
deseada)
Efecto de Color de Episperma sobre Peso de Semilla
Peso de Semilla (g)
0.0038
0.0036
0.0034
0.0032
0.0030
claro
oscuro
rojizo
Episperma
AGRO 5005 – CLAVE Lab 3
Page 3
(Revisado agosto 2015_LBW/RS)
En otras palabras, no hay un orden “natural” entre “oscuro, claro o rojizo” – color de
episperma en una variable nominal. Al contrario, si las categorías fuesen “pequeño,
intermedio y grande”, la variable (tamaño) sería ordinal (tiene un orden “natural”)
4. Usando los datos de café, construya una tabla de frecuencias para la variable altura (en
metros) usando InfoStat (menú Estadísticas>Tablas de Frecuencias). Escoja “número de
clases personalizado”, con valor mínimo de .905, máximo de 5.105 y 7 clases (verificar que
esto les da un ancho de clase de 0.6, como deseamos). Ahora prepare un histograma de
frecuencias absolutas a mano (usando la tabla de frecuencias como base) y en Infostat (menú
Gráficos>Histograma, use las mismas clases que usó para la tabla de frecuencias: comience
con 0.905 m (como extremo inferior de la primera clase) y use un ancho de clase de 0.6 m.
Tanto para tablas de frecuencias como para histogramas, en InfoStat se puede indicar qué
tipo de tabla/gráfica se desea (con límites de clase o marca de clase en el eje X; frecuencia
absoluta, frecuencia relativa, frecuencia absoluta acumulada o frecuencia relativa acumulada
en el eje Y). Practica el cálculo a mano de valores como límites de clase, marca de clase,
frecuencias absolutas, etc.
OJO: Como los datos originales de altura se miden con 2 lugares decimales, los límites
de clase tienen que tener 3 lugares decimales. Para que la salida aparezca con los tres
lugares decimales, utilice el icono que aumenta el número de decimales.
Tabla de Frecuencias:
Variable
altura
altura
altura
altura
altura
altura
altura
Clase
1
2
3
4
5
6
7
[
(
(
(
(
(
(
LI
0.905
1.505
2.105
2.705
3.305
3.905
4.505
AGRO 5005 – CLAVE Lab 3
LS
1.505
2.105
2.705
3.305
3.905
4.505
5.105
]
]
]
]
]
]
]
MC
FA
1.205 1
1.805 1
2.405 14
3.005 14
3.605 7
4.205 2
4.805 1
FR
FAA
0.025
1
0.025
2
0.350 16
0.350 30
0.175 37
0.050 39
0.025 40
FRA
0.025
0.050
0.400
0.750
0.925
0.975
1.000
Page 4
(Revisado agosto 2015_LBW/RS)
5. Usando los datos del archivo salinidad, construya un histograma y una ojiva para biomasa.
Use la ojiva para contestar las siguientes preguntas:
(a) ¿Qué porcentaje de las observaciones tienen biomasa menor de 1000?
Aprox. 51% -- Se puede contestar esta pregunta más fácilmente utilizando la opción
de “línea de corte” en InfoStat (ver gráfico abajo).
(b) ¿Qué porcentaje de las observaciones tienen biomasa mayor de 2000?
100% - 89% = 11%
(c) 60% de las observaciones tienen biomasa menor de aprox. 1150 (se puede utilizar la
opción de una línea de corte en 0.60 en el eje Y)
(d) 35% de las observaciones tienen biomasa mayor de aprox 1220 .
AGRO 5005 – CLAVE Lab 3
Page 5
(Revisado agosto 2015_LBW/RS)
Utilice la opción “línea de corte” para dibujar una línea vertical para biomasa de 1000 y
2000
 Aproximadamente el 51% de las observaciones tienen biomasa menor de 1000 g (el
valor de Y [en %] donde la línea vertical de biomasa=1000 cruce el polígono)
 Aproximadamente un 11% de las observaciones tienen biomasa superior a 2000 g
(en este caso, 0.89 es el valor de Y donde la línea vertical de biomasa=2000 cruce el
polígono; 1.00-0.89 = 0.11)
6. Use los datos de ajo blanco. Construya un histograma de frecuencias relativas y un polígono
de frecuencias acumuladas para la variable perímetro. Aproximadamente, ¿qué porcentaje de
las observaciones tienen perímetros mayores de 20?
AGRO 5005 – CLAVE Lab 3
Page 6
(Revisado agosto 2015_LBW/RS)
0.28
0.24
frecuencia relativa
0.20
0.16
0.12
0.08
0.04
0.00
7.005
9.305
11.605 13.905 16.205 18.505 20.805 23.105 25.405 27.705 30.005
perim
Frecuencias acumuladas para el perímetro de ajo
1.00
0.90
0.80
frec. rel. acumulada
0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.00
6
9
12
15
18
21
24
27
30
perim
Aproximadamente el 22% de las observaciones tienen un perímetro mayor de 20 (78%
menor de 20)
7. En las próximas gráficas, indique el nombre de cada gráfica, mencione cuáles gráficas están
correctas y cuáles podrían inducir a interpretaciones erróneas o falaces. Justifique
brevemente.
AGRO 5005 – CLAVE Lab 3
Page 7
(Revisado agosto 2015_LBW/RS)
Gráfico de sectores. En este gráfico, la
maquinilla no representa los porcentajes
expresados abajo y por lo tanto es una
mala interpretación de la información
que se quiere expresar
Gráfico de barras. En este gráfico el
tamaño de las manos no guardan
proporción entre si y por lo tanto no
representa claramente la información. En
un gráfico de barras el ancho de las
barras debe ser el mismo independiente
de los porcientos establecidos. En este
ejemplo, el ancho de las manos
(“barras”) aumenta a medida que el
porcentaje aumenta.
Gráfico de barras. El gráfico tiene tres
dimensiones cuando debería tener
solamente dos dimensiones. (un gráfico
de tres dimensiones debería tener una
variable que corresponde al eje Z).
Gráfico de barras. Los personajes no
guardan proporción con los porcentajes
ilustrados en números. El más grande es
casi el doble en tamaño, cuando en
realidad hay una diferencia entre ellos de
4%. El gráfico tiene diferentes anchos de
“barras”
AGRO 5005 – CLAVE Lab 3
Page 8
(Revisado agosto 2015_LBW/RS)
Gráfico de barras. Los porcentajes y las
estructuras presentadas no guardan
relación entre sí: 82% - 4 estructuras, 12%
= 2 estructuras, y 2% = 1 estructura. Las
personas dentro de las estructuras son
diferentes en cada una, prestándose para
más confusión.
Gráfico de barras. Aunque el blanco
representa bien el nivel de certidumbre o
precisión de las revistas, los porcentajes
no están bien representados y no
guardan proporción entre ellos. La gráfica
tiene muchas cosas (encima del blanco,
un hombre parado mirando, sombras,
humo…) que distraen el verdadero
mensaje.
Gráfico de barras. El gráfico tiene tres
dimensiones cuando debería tener
solamente dos dimensiones. (un gráfico
de tres dimensiones debería tener una
variable que corresponde a la tercera
dimensión - eje Z).
Gráfico con barras apiladas. En esto caso,
cada barra individual corresponde a un
gráfico de sectores (con un total de
100%). El gráfico está bien construido.
AGRO 5005 – CLAVE Lab 3
Page 9
(Revisado agosto 2015_LBW/RS)
Gráfico de barras apiladas. Al contrario
del caso anterior, la altura de una barra
particular representa un total para el año
indicado, y los colores dentro de una
barra son los subtotales. El gráfico está
bien construido.
Gráfico series de tiempo. Se puede
mejorar el gráfico indicando la unidad en
el eje Y (número de estudiantes) y
clarificando las rotulaciones en el eje X.
Matricula Graduada UPRM - 2008 a 2012
1150
matricula
1100
1050
1000
950
900
08-09 II
08-09 I
09-10 II
09-10 I
10-11 II
10-11 I
11-12 II
11-12 I
semestre
AGRO 5005 – CLAVE Lab 3
Page 10
Descargar