diagrama de caja y bigotes

Anuncio
Diagrama de Caja y Bigotes
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que describe varias
características importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado
horizontal o verticalmente.
Construcción:
Comparar distribuciones
Diagrama de Caja a través de Excel
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran elrecorrido intercuartílico. Este
rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los
cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las lineas que
sobresalen de la caja se llaman bigotes. Estos bigotes tienen tienen un límite de prolongación, de modo que cualquier dato o caso
que no se encuentre dentro de este rango es marcado e identificado individualmente
EJEMPLO DISTRIBUCIÓN DE EDADES
Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de un colectivo de 20 personas.
36
25
37
24
39
20
36
45
31
31
39
24
29
23
41
40
33
24
34
40
ORDENAR LOS DATOS
Para calcular los parámetros estadístico, lo primero es ordenar la distribución
20
23
24
24
24
25
29
31
31
33
34
36
36
37
39
39
40
40
41
45
CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer
cuartil es la media aritmética de dicho valor y el siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que ocupa el lugar central en un
conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor y el siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro caso, como 3N / 4 = 15, resulta
Q2=(39 + 39) / 2 = 39
DIBUJAR LA CAJA Y LOS BIGOTES
El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)
La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).
INFORMACIÓN DEL DIAGRAMA
Podemos obtener abundante información de una distribución a partir de estas representaciones. Veamos alguna:
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas entre el 25% y el 50% de
la población está más dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de los más jóvenes están más concentrados
que el 25% de los mayores.
El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido en 14,5 años.
Seguro que tú podrás obtener más información (¡Utiliza la mediana!)
Comparar distribuciones
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o más conjuntos de datos.
Comparación distribución de edades
Comparación entrenamientos de un corredor
Comparación clasificación liga
COMPARACIÓN DISTRIBUCIÓN DE EDADES
Análogamente a lo realizado con los diagramas de tallo y hojas, comparamos, mediante estos diagramas, esta distribución con la
del otro ejemplo de distribución de edades.
35
38
32
28
30
29
27
19
48
40
39
24
24
34
26
41
29
48
28
22
A partir de dicha comparación puede obtenerse bastante información de ambas distribuciones.
COMPARACIÓN ENTRENAMIENTOS DE UN CORREDOR
Un corredor entrena para una determinada carrera y se toman los tiempos que necesita para recorrer los 200 m, durante 10 días
consecutivos (cada día se toman varios tiempos y se calculan mediana, cuartiles, valores mínimo y máximo)
Observamos que el desplazamiento de las gráficas de caja hacia la izquierda indica que el entrenamiento ha dado resultado, ya que
se tardan menos segundos en recorrer la misma distancia, siendo la diferencia entre el máximo y el mínimo menor, como así
también la diferencia intercuartílica.
COMPARACIÓN CLASIFICACIÓN LIGA
Las puntuación de los equipos de la liga de futbol BBVA de las temporadas 10/110 y 11/12 se pueden comparar con un diagrama
caja y bigotes, como aparece aquí,
Comparación de tres ligas europeas de futbol de la temporada 11/12
Problemas
Los siguientes datos representan la estatura en metros de un grupo de jóvenes, en este caso vendría
muy bien hacer una gráfica caja brazos en forma vertical.
Iniciamos con estos datos que ponemos de ejemplo:
1.90, 1.66, 1.62, 1.95, 1.53, 1.70, 1.80, 1.55, 1.62, 1.75, 1.57, 1.63, 1,62, 1.70, 1.62.
Resuelve lo que se te pide:
1.- La altura en centímetros de los alumnos de tercer grado en cierta escuela es:
168, 170, 171, 171, 172, 172, 172, 172, 174, 174,
174, 174, 174, 175, 175, 175, 175, 175, 176, 176,
176, 176, 176, 177, 177, 177, 177, 177, 177, 177,
178, 178, 178, 178, 178, 179, 179, 180,180, 180
a) ¿ Cuántos alumnos tiene el grupo ? ____________
b) ¿ Cuál es la mediana del grupo ? ______________
c) ¿ Qué valor corresponde al límite superior ? ________
d) ¿ Qué valor corresponde al límite inferior ? ________
e) ¿ Cuál es el dato más alto que corresponde al primer cuartil ? _____________
f) ¿ Cuál es el dato más bajo que corresponde al cuarto cuartil ? _____________
g) ¿ Los brazos de la gráfica tienen la misma longitud ? __________
h) ¿ La mediana se localiza al centro de la caja ? ________________
i) ¿ Cuál es la media ? ______________
j) ¿ Cuál es la moda ? _______________
2.- El número de aciertos en un examen de ingreso a una escuela de nivel medio superior fueron:
Teniendo en cuenta esta gráfica contesta lo que se te pide:
a) ¿ Qué número de aciertos obtuvo el estudiante con menor calificación ? ____________________
b) ¿ Qué número de aciertos obtuvo el estudiante con mayor calificación ? _____________________
c) ¿ Cuáles son los límites mínimo y máximo del primer cuartil ?_______________________
d) ¿ Cuáles son los límites mínimo y máximo del tercer cuartil ?___________________
e) ¿ Cuál es la mediana ? ___________________________
3.- Los alumnos deben realizar un experimento de química, para lo cual deben medir 25m de ácido.
Para trabajar más cómodamente, el maestro divide al grupo en dos, el grupo A y el grupo B. Cada
alumno midió con la pipeta y obtuvo cierta cantidad. En la siguiente tabla se anotaron las medidas
obtenidas por los alumnos.
Volumen 21 22 23 24 25 26 27 28
Grupo A 1 2 3 5 5 1 4 3
Grupo B 3 4 1 5 5 3 3 0
a) Calcula el promedio de las medidas obtenidas por los alumnos de cada grupo.
Grupo A :________________
Grupo B :________________
Grupo A Mínimo = _____Q1 = ______ Mediana =________ Q3 =______ Máximo =_____
Grupo B Mínimo = _____Q1 = ______ Mediana =________ Q3 =______ Máximo =_____
Construye una caja brazos para los siguientes datos y contesta lo que se te pide:
24, 22, 26, 23, 27, 26, 28, 18, 25, 24, 12, 20
a) ¿ Cuál es la mediana ? ______________
b) ¿ Qué valor corresponde al límite superior ? ________
c) ¿ Qué valor corresponde al límite inferior ? _______
La siguiente gráfica muestra los minutos que tarda en hacer efecto un medicamento en una
población. Organizados en equipos, analícenla y contesten las preguntas.
a) ¿ A los cuántos minutos empezó a hacer efecto el medicamento en las personas más sensibles ?
___
b) ¿ Cuál es el tiempo máximo en que el medicamento empezó a hacer efecto ? ______________
c) ¿ Qué parte de la población reaccionó entre 20 y 75 minutos al efecto de la medicina ? __________
d) ¿ En qué cuartil se localiza la mediana ?____________
Observa la siguiente gráfica y contesta.
a) ¿ A qué hace referencia la gráfica ? _____________
b) ¿ Qué porcentaje de alumnos del grupo obtuvo más de 9 puntos ? _______________
c) ¿ Cuál es la mediana del grupo ? ________________
d) ¿ Qué porcentaje de hombres obtuvo menos de 6 puntos ? _________________
e) ¿ Qué porcentaje de mujeres obtuvo 7 o más puntos ? _________________
f) ¿ Qué mediana obtuvieron los hombres ? __________________
g) ¿ Qué mediana obtuvieron las mujeres ? ________________
h) ¿Qué porcentaje de mujeres obtuvo entre 9 y 10 puntos ? ___
Con los datos de la estatura (en centímetros) de alumnos del grupo de primer grado se construyó la
siguiente gráfica de caja-brazos. Observa y contesta las siguientes preguntas.
Ya ordenados los datos de menor a mayor quedan de la siguiente forma:
140, 142, 143, 145, 145, 145, 150, 150, 150, 152, 152, 152, 152, 152, 154, 154, 154, 154, 155, 155,
155, 155, 155, 155, 158, 158, 158, 158, 158, 158, 158, 158, 160, 160, 160, 160, 160, 164, 165, 168
a) ¿ Cuál es el valor del límite inferior ? ________________
b) ¿ Cuál es el valor del límite superior ? ________________
c) ¿ Cuál es el valor de la mediana ? _________________
d) ¿ Hasta qué valor llega 25% de los datos ? _________________
e) ¿ Hasta qué valor llega 75% de los datos ? ____________________
Si cada brazo representa 25% de los datos, ¿ qué porcentaje le corresponde a la caja ?_______
- Televidentes
El número de horas frente al televisor por casa y los horarios de mayor audiencia son dos factores
que afectan el ingreso por anuncios de las televisoras. Una muestra aleatoria de 32 casas en un área
particular produjeron las siguientes estimaciones de horas frente al televisor por casa:
3.0 6.0 7.5 10.0 7.0 6.5 8.0 4.0
5.5 1.0 5.0 9.0 2.5 10.0 3.5 3.0
7.5 5.0 10.0 8.0 3.5 9.0 2.0 6.5
3.5 5.0 6.5 8.0 4.0 4.0 8.0 5.0
a) Ordena los datos de menor a mayor.
b) ¿ Cuál es el valor del límite inferior ?_________________
c) ¿Cuál es el valor del límite superior ? _________________
d) ¿ Cuál es el valor de la mediana ? __________________
e) Q1 = ______ Q3 =______
f) ¿ Cuál es la moda ? ______________
g) ¿ Cual es la media ?_________________
h) Traza una gráfica de caja brazos
- En el periódico “El chisme caliente” se realiza la entrega matutina a domicilio sin costo extra, en un
área de 3 km de radio, el dueño del periódico quiere tener la información de los tiempos de entrega
de dos empleados, con el propósito de darle un estímulo económico por su desempeño a alguno de
los dos, ya que entregan en zonas semejantes. Ellos distribuyen la cantidad de 28 ejemplares
durante la mañana, se obtuvieron los siguientes tiempos (en minutos) de entrega del empleado
Francisco López:
11, 11, 12, 12, 13, 14, 15, 15, 16, 16, 17, 17, 17, 17, 18, 18, 19, 19, 20, 20, 21, 21, 22, 23, 23, 24, 25, 26
a) Construye una gráfica caja-brazos con los datos anteriores y llena la tabla con los cinco valores
que se piden.
Resultados de la aplicación de una prueba de 20 preguntas
Puntajes grupo A
14 7 12 15 4 7 15 12 12 13
13 18 18 4 17 11 11 4 12 5
14 14 17 13 12 4 15 7 16 19
9 12 19 14 14 15 18 15 13 19
Puntajes grupo B
4 12 18 7 16 10 15 17 7 8
17 15 13 14 8 16 16 17 13 12
3 4 11 17 12 4 17 17 4 6
14 14 4 18 18 15 16 13 15 12
Puntajes grupo C
17 15 14 12 15 15 12 14 11 14
16 11 11 12 8 12 5 19 16 19
19 15 5 20 17 15 15 18 15 14
20 13 13 15 12 4 11 12 17 4
Puntajes grupo D
12 4 5 13 11 17 14 4 6 16
9 15 16 12 5 8 4 12 18 18
17 18 15 16 12 12 11 4 5 13
19 11 6 14 18 14 12 16 12 13
INSTRUCCCIONES: Tracen Las cajas-brazos correspondientes y determinen las diferencias entre
grupos
Descargar