que la mediana y el 50% de los valores son mayores o iguales que

Anuncio
112
Capítulo 3
Estadísticos para describir, explorar y comparar datos
que la mediana y el 50% de los valores son mayores o iguales que la mediana. Así
como la mediana divide los datos en dos partes iguales, los tres cuartiles, denotados por Q1, Q2 y Q3, dividen los valores ordenados en cuatro partes iguales. (Los
valores están ordenados cuando están acomodados en orden). He aquí las descripciones de los tres cuartiles:
Q1 (primer cuartil):
Separa el 25% inferior de los valores ordenados del 75%
superior. (Para ser más precisos, al menos el 25% de los
valores ordenados son menores o iguales que Q1, y al menos el 75% de los valores son mayores o iguales que Q1).
Q2 (segundo cuartil): Igual a la mediana; separa el 50% inferior de los valores
ordenados del 50% superior.
Separa el 75% inferior de los valores ordenados del 25%
Q3 (tercer cuartil):
superior. (Para ser más precisos, al menos el 75% de los
valores ordenados son menores o iguales que Q3, y al menos el 25% de los valores son mayores o iguales que Q3).
Describiremos un procedimiento para el cálculo de cuartiles después de analizar los percentiles. No existe un acuerdo universal respecto de un procedimiento
único para el cálculo de cuartiles; por esa razón, con frecuencia los distintos programas de cómputo producen resultados diferentes. Por ejemplo, si usted utiliza el
conjunto de datos 1, 3, 6, 10, 15, 21, 28 y 36, obtendrá los siguientes resultados:
STATDISK
Minitab
SPSS
Excel
SAS
TI-83>84 Plus
Q1
Q2
Q3
4.5
3.75
3.75
5.25
4.5
4.5
12.5
12.5
12.5
12.5
12.5
12.5
24.5
26.25
26.25
22.75
24.5
24.5
Si usted utiliza una calculadora o un programa de cómputo para resolver
ejercicios que comprenden cuartiles, es posible que obtenga resultados que difieran ligeramente de las respuestas que vienen al final del libro.
Así como existen tres cuartiles que separan un conjunto de datos en cuatro
partes, también existen 99 percentiles, que se denotan P1, P2, c, P99, los cuales
separan los datos en 100 grupos, con aproximadamente el 1% de los valores en cada grupo. (Los cuartiles y percentiles son ejemplos de cuantiles o fractiles, que separan los datos en grupos con aproximadamente el mismo número de valores).
El proceso para calcular el percentil que corresponde a un valor x específico
es bastante sencillo, tal como se indica en la siguiente expresión:
Percentil del valor x 5
número de valores menores que x
? 100
número total de valores
(el resultado se redondea al entero más cercano)
EJEMPLO Edades de las mejores actrices La tabla 3-4 lista las 76
edades ordenadas de las mejores actrices ganadoras del Óscar que se incluyen
en la tabla 2-1. (La tabla 2-1 aparece en el problema del capítulo 2). Calcule el
percentil correspondiente a una edad de 30 años.
3-4
Tabla 3-4
Medidas de posición relativa
Edades ordenadas de las 76 mejores actrices
LA ESTADÍSTICA
EN LAS NOTICIAS
21
22
24
24
25
25
25
25
26
26
26
26
27
27
27
27
28
28
28
28
29
29
29
29
29
29
30
30
31
31
31
32
32
33
33
33
33
33
34
34
34
35
35
35
35
35
35
35
36
37
37
38
38
38
38
39
39
40
41
41
41
41
41
42
42
43
45
46
49
50
54
60
61
63
74
80
SOLUCIÓN En la tabla 3-4 observamos que existen 26 edades menores que
30; por lo tanto,
percentil de 30 5
26
? 100 5 34
76
INTERPRETACIÓN La edad de 30 años es el percentil 34.
El ejemplo anterior muestra cómo convertir un valor muestral dado a su percentil correspondiente. Existen diversos métodos para el procedimiento inverso
de convertir un percentil en el valor correspondiente del conjunto de datos. El
procedimiento que utilizamos se resume en la figura 3-6, que emplea la siguiente
notación.
Notación
n
k
número total de valores en el conjunto de datos
percentil utilizado (ejemplo: para el percentil 25, k 5 25)
L
localizador que da la posición de un valor (ejemplo: para el valor en el lugar
12 en la lista ordenada, L 5 12)
Pk
percentil k-ésimo (ejemplo: P25 es el percentil 25)
EJEMPLO Edades de las mejores actrices Remítase a las edades ordenadas de las mejores actrices en la tabla 3-4 y utilice la figura 3-6 para calcular el
valor del percentil 20, P20.
Al consultar la figura 3-6, observamos que los datos muestrales
ya están ordenados, de manera que podemos proceder a calcular el valor del
localizador L. En este cálculo utilizamos k 5 20 porque estamos tratando de
calcular el valor del percentil 20. Usamos n 5 76 porque tenemos 76 valores
de datos.
SOLUCIÓN
L5
113
20
k
?n5
? 76 5 15.2
100
100
continúa
El crecimiento
de la estadística
El reportero Richard Rothstein
escribió en el New York Times
que el estudio del álgebra, la trigonometría y la geometría en
preparatoria “dejan muy poco
espacio para el estudio de la estadística y la probabilidad. No
obstante, los estudiantes necesitan fundamentos sobre el análisis de datos”. El reportero indicó
que el cálculo tiene un papel relevante en los estudios universitarios, a pesar de que “sólo pocos trabajos, principalmente en
el campo técnico, realmente lo
utilizan”. Rothstein citó un estudio realizado por el profesor
Clifford Konold, de la Universidad de Massachusetts, en el cual
se contó el número de presentaciones de datos en el New York
Times. En los ejemplares del Times de 1972, el doctor Konold
encontró cuatro gráficas o tablas
en cada una de 10 ediciones de
entre semana (sin incluir las secciones de deportes y negocios),
pero en 1982 había 8 y en 1992
había 44; “al año siguiente él (el
doctor Konold) encontró más de
100”. El crecimiento de la estadística como disciplina se ha visto fomentado, en parte, por un
mayor uso de este tipo de presentaciones de datos en los medios de comunicación masiva.
114
Capítulo 3
Estadísticos para describir, explorar y comparar datos
Inicio
Start
Ordenar los datos.
(Acomodar los datos
en orden, del menor
al mayor).
Calcular
L 5 k n donde
100
n 5 número de valores
k 5 percentil en cuestión
( (
¿L es
un número
entero?
Sí
No
El valor del k-ésimo percentil está
la mitad entre el L-ésimo valor y
el siguiente valor en el conjunto
ordenado de datos. Obtenga Pk
sumando el L-ésimo valor y el
siguiente valor, y luego dividiendo
el total entre 2.
Modifique L
redondeando al
siguiente entero más
grande.
No
El valor de Pk es el
L-ésimo valor, contando
a partir del más bajo.
Figura 3-6 Conversión del k-ésimo percentil al valor del dato correspondiente
NDespués, nos preguntamos si L es un número entero. La respuesta es no, por
lo que procedemos al siguiente recuadro inferior, donde modificamos L redondeando su valor al entero más alto, de 15.2 a 16. (En este libro generalmente
redondeamos de la forma acostumbrada, pero éste es uno de los dos casos en
que redondeamos hacia arriba en vez de redondear hacia el entero más cercano). Por último, el recuadro inferior muestra que el valor de P20 es el decimosexto valor, contando del más bajo al más alto. En la tabla 3-4 el valor 16º es
27. Es decir, P20 5 27 años de edad.
EJEMPLO Edades de las mejores actrices Remítase a las edades de
las mejores actrices en la tabla 3-4. Utilice la figura 3-6 para calcular el valor
de Q3, que es el tercer cuartil.
3-4
Medidas de posición relativa
115
SOLUCIÓN Primero señalamos que Q3 es igual a P75, de manera que procedemos con el objetivo de calcular el valor del percentil 75. Si nos remitimos a
la figura 3-6, observamos que los datos de la muestra ya están ordenados, así
que procedemos a calcular el valor del localizador L. Para este cálculo utilizamos k 5 75, ya que estamos tratando de obtener el valor del percentil 75, y
usamos n 5 76 porque son 76 valores de datos.
L5
75
k
?n5
? 76 5 57
100
100
Luego, nos preguntamos si L es un número entero y respondemos que sí, de manera que vamos al siguiente recuadro a la derecha. Ahora podemos ver que el
valor del percentil k-ésimo (75º) se encuentra a la mitad entre el valor L-ésimo
(57º) y el siguiente valor del conjunto original de datos. Es decir, el valor del
percentil 75 se encuentra a la mitad entre el quincuagésimo séptimo valor (57º)
y el quincuagésimo octavo valor (58º). El valor 57º es 39 años y el valor 58º es
40 años; por lo tanto, el valor a la mitad de ellos es 39.5 años. Concluimos que
el percentil 75 es P75 5 39.5 años. El valor del tercer cuartil Q3 también es de
39.5 años.
El ejemplo anterior demuestra que al calcular un valor cuartilar (como Q3), es
posible utilizar el valor del percentil equivalente (como P75) en su lugar. Al margen se indican las relaciones equivalentes entre cuartiles y percentiles.
En secciones anteriores de este capítulo, describimos diversos estadísticos, incluyendo media, mediana, moda, rango y desviación estándar. Algunos otros estadísticos
se definen con el uso de cuartiles y percentiles, como los siguientes:
rango intercuartilar (o RIC) 5 Q3 2 Q1
rango semiintercuartilar 5
Q3 2 Q1
2
cuartil medio 5
Q3 1 Q1
2
rango de percentiles 10-90 5 P90 2 P10
Después de completar esta sección, usted podrá convertir un valor en su puntuación z (o puntuación estándar) correspondiente, de forma que sea posible compararlo con otros valores que provienen de diferentes conjuntos de datos. También
podrá convertir un valor en su valor percentilar correspondiente, de manera que
pueda compararlo con otros valores en algún conjunto de datos. También sabrá
convertir un percentil en su valor de dato correspondiente. Finalmente, comprenderá el significado de los cuartiles y podrá relacionarlos con sus valores percentiles
correspondientes (como en Q3 5 P75).
Q 1 5 P25
Q 2 5 P50
Q 3 5 P75
Descargar