Subido por Genesis Rubi Arellano Bravo

PPT ESTADISTICA GENERAL SEM-04 2021-2

Anuncio
Medidas de posición no central:
percentiles, deciles y cuartiles
Sesión N°04
LOGRO DE LA SESIÓN:
Al finalizar la sesión, el estudiante
calcula e interpreta medidas de
tendencia no central para datos
agrupados
y
no
agrupados
haciendo uso de procedimientos
adecuados de forma correcta.
MEDIDAS DE TENDENCIA NO CENTRAL
SECCIÓN DE REFERENCIA
REFLEXIÓN DESDE LA EXPERIENCIA
MEDIDAS DE POSICIÓN
Si la talla de una niña es inferior
al percentil 30 para su edad,
significa que el 70% de las niñas
de la misma edad miden más, a
la niña también se le denomina
“pequeña para su edad”.
MEDIDAS DE TENDENCIA NO CENTRAL
El colesterol se distribuye simétricamente en la población. Supongamos
que
se
consideran
patológicos
los
valores
extremos.
El 90% de los individuos son normales ¿Entre qué valores se encuentran
los individuos normales?
10
5
0
frecuencia
15
20
Percentiles 5 y 95
180
200
220
Colesterol en 100 personas
240
260
MEDIDAS DE TENDENCIA NO CENTRAL
Las medidas de tendencia central son en realidad, un caso particular de un
tipo de medidas más amplias, llamadas “de posición “
Estas medidas de posición, tienen la propiedad de ubicarse entre los
dos extremos de variación de los datos, pero ya no necesariamente
hacia el centro del intervalo como las de tendencia central.
Entre otros indicadores, se suelen utilizar una serie de valores
que dividen la muestra en tramos iguales: Cuartiles; Deciles y
Percentiles.
Se utilizan principalmente para indicar la posición relativa
de un dato dentro del conjunto de datos previamente
ordenados.
MEDIDAS DE TENDENCIA NO CENTRAL
SECCIÓN DE REFERENCIA
DATOS NO
AGRUPADOS
Para obtener sus
valores depende
como
se
presentan
los
datos.
117
353
161
123
Sin Intervalos
DATOS
AGRUPADOS
Con Intervalos
116
376
138
194
MEDIDAS DE TENDENCIA NO CENTRAL
CUARTILES: QK
Son valores de la variable que dividen a la distribución de datos
en cuatro partes iguales, en donde cada parte incluye el 25% de
los datos.
Vmax.
Vmin.
25%
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los cuartiles para datos no agrupados
1.- Ordenar los datos, de preferencia de menor a mayor: X1 X2 X3 X4 ….Xn
𝒌∗(𝒏+𝟏)
𝟒
2.- Obtener la posición correspondiente del cuartil.
, 𝐤: 𝟏, 𝟐, 𝟑
3.- Calculo de los cuartiles
E: parte entera de
𝐐𝐤 = ?
𝑘∗(𝑛+1)
4
𝐐𝐤 = XE + d*(X(E+1) – XE)
𝒌 ∗ (𝒏 + 𝟏)
𝟒
𝐤: 𝟏, 𝟐, 𝟑
d: parte decimal de
𝑘∗(𝑛+1)
4
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los cuartiles para datos no agrupados
EJEMPLO:
Se han recopilado los minutos que un calmante hace efecto a un grupo de 7
personas.
Xi : 14,15,16,18,7,8,15
Calcule los cuartiles: 𝑄1 , 𝑄2 , 𝑄3
X1 X2 X3 X4 X5 X6 X7
Xi : 7, 8, 14, 15, 15, 16, 18
E= 2
𝐐𝟏 = ?
𝟏∗(𝟕+𝟏)
𝟒
𝐐𝟏 = X2 + 0*(X(2+1) – X2) = X2
= 2.0
𝐐𝟏 = X2 = 8 minutos
D=0
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los cuartiles para datos agrupados por frecuencias
Paso 1: Calcular las frecuencias absolutas acumuladas: 𝐹𝑖
Paso 2: Calcular la posición del Qk :
𝐤∗𝐧
𝟒
Paso 3: El cuartil 𝑄𝑘 = Xi es el valor de la variable; cuya 𝑭𝒊 >
𝐤
𝟒
El cuartil 𝑄𝑘 = Xi +(X(i+1) – Xi)* ; cuya
n: número de datos.
𝐤∗𝐧
𝑭𝒊 =
𝟒
𝐤∗𝐧
𝟒
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los cuartiles para datos agrupados sin intervalos
Los datos de la tabla muestran información sobre la variable X que representa el número
de años de consumo de estupefacientes en una muestra de pacientes del Hospital
Nacional del Centro. Completar los datos que faltan en la siguiente tabla estadística:
𝐐𝟏 = ?
Años de
consumo de
estupefacientes:
Xi
1
2
3
Q1
4
Q2
5
6
Q3
7
8
Total
Paso 1: Calcular las frecuencias absolutas acumulada.
fi
Fi
Paso 2: Calcular la posición del 𝐐𝟏 :
𝑭𝟑 ≥12.5
4
4
8
7
5
10
7
5
50
4
8
16
23
28
38
45
50
𝟏∗𝟓𝟎
𝟒
= 12.5
𝐐𝟐 = ?
Paso 1: Calcular las frecuencias absolutas acumulada.
Paso 2: Calcular la posición del 𝐐𝟐 :
𝑭𝟓 ≥ 25
𝟐∗𝟓𝟎
𝟒
= 25
𝐐𝟑 = ?
Paso 1: Calcular las frecuencias absolutas acumulada.
𝟑∗𝟓𝟎
Paso 2: Calcular la posición del 𝐐𝟑 :
= 37.5
𝑭𝟔 ≥ 37.5
CUARTIL
VALOR
Q1
Q2
Q3
3 años
5 años
6 años
𝟒
INTERPRETACIÓN
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los cuartiles para datos agrupados con intervalos
Los cuartiles se calculan utilizando la siguiente fórmula:
𝑘∗𝑛
− 𝐹(𝑖−1)
𝑄𝑘 = 𝐿𝑖 + 𝐶 ∗ 4
𝑓𝑖
K = 1,2,3
Donde:
: Cuartil k ésimo
: Intervalo de clase que contiene el QK
𝒌𝒏
: Posición del QK
𝟒
Li
: Limite real inferior de la clase que contiene el QK .
A
: Amplitud de la clase que contiene QK .
𝑭(𝒊−𝟏) : Frecuencia absoluta acumulada anterior a la clase que contiene el QK .
𝒇𝒊
: Frecuencia absoluta simple de la clase que contiene el QK
QK
.i
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los cuartiles para datos agrupados con intervalos
EJEMPLO:
La siguiente distribución corresponde a los sueldos quincenales de los
trabajadores de una clínica privada.
SUELDOS
NUMERO DE
TRABAJADORES
fi
Fi
[400 - 420>
[420 - 440>
[440 - 460>
[460 - 480>
[480 - 500>
[500 - 520>
[520 - 540>
80
120
125
99
88
78
10
80
200
325
424
512
590
600
TOTAL
600
¿Cuál es el sueldo que supera el 25% de los
trabajadores?
¿Cuál es el sueldo que supera el 75% de los
trabajadores?
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los cuartiles para datos agrupados con intervalos
¿Cuál es el sueldo que supera el 25% de los trabajadores?
Q1 = ?
1∗𝑛
− 𝐹(𝑖−1)
𝑄1 = 𝐿𝑖 + 𝐶 ∗ 4
𝑓𝑖
Paso 1: Calcular las frecuencias absolutas acumulada Fi
SUELDOS
NUMERO DE
TRABAJADORES
fi
Fi
[400 - 420>
80
80
L2 = [420 - 440>
𝒇𝟐 = 120
200
[440 - 460>
125
325
[460 - 480>
99
424
[480 - 500>
88
512
[500 - 520>
78
590
[520 - 540>
10
600
TOTAL
600
Paso 2: Calcular la posición del 𝐐𝟏:
= F1
= F2
A = 440 – 420 = 20
𝟏∗𝟔𝟎𝟎
𝟒
= 150
Paso 3: Identificar el intervalo de clase que contiene el 𝐐𝟏 :
Como F2
>
𝟏∗𝟔𝟎𝟎
𝟒
i
= 150, entonces, i = 2.
Paso 4: Reemplazando i = 2 en la formula:
1∗𝑛
− 𝐹(2−1)
𝑄1 = 𝐿2 + 𝐶 4
𝑓2
1∗𝑛
− 𝐹1
𝑄1 = 𝐿2 + 𝐶 4
𝑓2
Paso 5: Reemplazando los datos en la formula:
𝑄1 = 420 + 20 ∗
150−80
120
= 432 soles
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los cuartiles para datos agrupados con intervalos
Q3 = ?
¿Cuál es el sueldo que supera el 75% de los trabajadores?
3∗𝑛
− 𝐹(𝑖−1)
𝑄3 = 𝐿𝑖 + 𝐶 ∗ 4
𝑓𝑖
Paso 1: Calcular las frecuencias absolutas acumulada Fi
SUELDOS
NUMERO DE
TRABAJADORES
fi
Fi
Paso 2: Calcular la posición del 𝐐𝟑:
[400 - 420>
80
80
Paso 3: Identificar el intervalo de clase que contiene el 𝐐𝟑 :
Como F5
[420 - 440>
120
200
[440 - 460>
125
325
[460 - 480>
99
424
= F4
L5 = [480 - 500>
𝒇𝟓 = 88
512
= F5
[500 - 520>
78
590
[520 - 540>
10
600
TOTAL
600
>
𝟑∗𝟔𝟎𝟎
𝟒
𝟑∗𝟔𝟎𝟎
𝟒
= 450
i
= 450, entonces, i = 5.
Paso 4: Reemplazando i = 5 en la formula:
C = 500 – 480 = 20
3∗𝑛
− 𝐹(5−1)
𝑄3 = 𝐿5 + 𝐶 4
𝑓5
3∗𝑛
− 𝐹4
4
𝑄3 = 𝐿5 + 𝐶
𝑓5
Paso 5: Reemplazando los datos en la formula:
𝑄1 = 480 + 20 ∗
450−424
88
= 486 soles
MEDIDAS DE TENDENCIA NO CENTRAL
DECILES: DK
Son valores de la variable que dividen a la distribución de datos en
diez partes iguales, en donde cada parte incluye el 10% de los
datos.
V. min._10%_._10%_.10%_._10%_._10%_._10%_._10%_._10%_._10%_._10%_ V. máx.
D1
D2
D3
D4
D5
Q2
Me
D6
D7
D8
D9
Primer decil : D1 , el 10% de los datos esta por debajo del D1
Segundo decil: D2 , el 20% de los datos esta por debajo del D2
Tercer Decil : D3 , el 30% de los datos esta por debajo del D3
…….
Quinto Decil : D5 , el 50% de los datos esta por debajo del D5
…….
Noveno Decil : D9 , el 90% de los datos esta por debajo del D9
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los deciles para datos no agrupados
1.- Ordenar los datos, de preferencia de menor a mayor: X1 X2 X3 X4 ….Xn
𝒌(𝒏+𝟏)
𝟏𝟎
2.- Obtener la posición correspondiente del decil.
, 𝐤: 𝟏, 𝟐, 𝟑, … , 𝟗
3.- Cálculo de los deciles
E: parte entera de
𝐃𝐤 = ?
𝑘(𝑛+1)
10
𝐃𝐤 = XE + d*(X(E+1) – XE)
𝒌(𝒏 + 𝟏)
𝟏𝟎
𝐤: 𝟏, 𝟐, 𝟑, …, 9
d: parte decimal de
𝑘(𝑛+1)
10
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los deciles para datos no agrupados
EJEMPLO:
Se han recopilado los minutos que un calmante hace efecto a un grupo de
10 personas.
Xi : 14,15,16,18,7,8,15, 7, 20, 11
Calcule los cuartiles: 𝐷1 , 𝐷7
X1 X2 X3 X4
Xi : 7, 7, 8, 11,
X5 X6 X7 X8 X9
14, 15, 15, 16, 18,
X10
20
E= 1
𝐃𝟏 = ?
𝟏∗(𝟏𝟎+𝟏)
𝟏𝟎
D1 = X1 + 0.1*(X(1+1) – X1)
D1 = X1 + 0.1*(X(2) – X1)
𝐃𝟏 = 7 + 0.1*(7 – 7) = 7 minutos
= 1.1
D = 0.1
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los deciles para datos no agrupados
EJEMPLO:
Se han recopilado los minutos que un calmante hace efecto a un grupo de
10 personas.
Xi : 14,15,16,18,7,8,15, 7, 20, 11
Calcule los cuartiles: 𝐷1 , 𝐷7
X1 X2 X3 X4
Xi : 7, 7, 8, 11,
X5 X6 X7 X8 X9
14, 15, 15, 16, 18,
X10
20
E= 7
𝐃𝟕 = ?
𝟕∗(𝟏𝟎+𝟏)
𝟏𝟎
D7 = X7 + 0.7*(X(7+1) – X7)
D7 = X7 + 0.7*(X8 – X7)
𝐃𝟕 = 15 + 0.7*(16 – 15) = 15.7 minutos
= 7.7
D = 0.7
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los deciles para datos agrupados sin intervalos
Paso 1: Calcular las frecuencias absolutas acumuladas: 𝐹𝑖
Paso 2: Calcular la posición del Dk :
𝐤∗𝐧
𝟏𝟎
Paso 3: .- El decil 𝐷𝑘 = 𝐗𝐢 es el valor de la variable; cuya 𝑭𝒊 >
.- El decil 𝐷𝑘 = Xi +(X(i+1) – Xi)*
n: número de datos.
𝐤
𝟏𝟎
; cuya
𝐤∗𝐧
𝑭𝒊 =
𝟏𝟎
𝐤∗𝐧
𝟏𝟎
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los deciles para datos agrupados sin intervalos
Los datos de la tabla muestran información sobre la variable X que representa el número
de años de consumo de estupefacientes en una muestra de pacientes del Hospital
Nacional del Centro. Completar los datos que faltan en la siguiente tabla estadística:
Años de
consumo de
estupefacientes:
Xi
1
D1
2
3
4
5
D7
6
7
8
Total
fi
Fi
𝐃𝟏 = ?
Paso 1: Calcular las frecuencias absolutas acumulada.
4
4
8
7
5
10
7
5
50
4
8
16
23
28
38
45
50
Paso 2: Calcular la posición del 𝐃𝟏 :
𝑭𝟐 > 5
𝟏∗𝟓𝟎
𝟏𝟎
=5
𝐃𝟕 = ?
Paso 1: Calcular las frecuencias absolutas acumulada.
Paso 2: Calcular la posición del D𝟕 :
𝑭𝟔 > 35
DECIL
D1
D7
VALOR
2 años
6 años
𝟕∗𝟓𝟎
𝟏𝟎
= 35
INTERPRETACIÓN
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los deciles para datos agrupados con intervalos
Los deciles se calculan utilizando la siguiente fórmula:
𝑘∗𝑛
− 𝐹(𝑖−1)
𝐷𝑘 = 𝐿𝑖 + 𝐶 ∗ 10
𝑓𝑖
K = 1,2,3, … ,9
Donde:
: Decil k ésimo
: Intervalo de clase que contiene el DK
𝒌∗𝒏
: Posición del DK
𝟏𝟎
Li
: Limite real inferior de la clase que contiene el DK .
C
: Amplitud de la clase que contiene DK .
𝑭(𝒊−𝟏) : Frecuencia absoluta acumulada anterior a la clase que contiene el DK .
𝒇𝒊
: Frecuencia absoluta simple de la clase que contiene el DK
DK
.i
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los deciles para datos agrupados con intervalos
EJEMPLO:
La siguiente distribución corresponde a los sueldos quincenales de los
trabajadores de una clínica privada.
SUELDOS
NUMERO DE
TRABAJADORES
fi
Fi
[400 - 420>
[420 - 440>
[440 - 460>
[460 - 480>
[480 - 500>
[500 - 520>
[520 - 540>
80
120
125
99
88
78
10
80
200
325
424
512
590
600
TOTAL
600
¿Cuál es el sueldo que supera el 30% de los
trabajadores?
¿Cuál es el sueldo que supera el 80% de los
trabajadores?
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los cuartiles para datos agrupados con intervalos
¿Cuál es el sueldo que supera el 30% de los trabajadores?
D3 = ?
3∗𝑛
− 𝐹(𝑖−1)
𝐷3 = 𝐿𝑖 + 𝐶 10
𝑓𝑖
Paso 1: Calcular las frecuencias absolutas acumulada Fi
SUELDOS
NUMERO DE
TRABAJADORES
fi
Fi
[400 - 420>
80
80
L2 = [420 - 440>
𝒇𝟐 = 120
200
[440 - 460>
125
325
[460 - 480>
99
424
[480 - 500>
88
512
[500 - 520>
78
590
[520 - 540>
10
600
TOTAL
600
Paso 2: Calcular la posición del D𝟑:
= F1
= F2
C = 440 – 420 = 20
𝟑∗𝟔𝟎𝟎
𝟏𝟎
= 180
Paso 3: Identificar el intervalo de clase que contiene el D𝟑 :
Como F2
≥
𝟑∗𝟔𝟎𝟎
𝟏𝟎
i
= 180, entonces, i = 2.
Paso 4: Reemplazando i = 2 en la formula:
3∗𝑛
− 𝐹(2−1)
𝐷3 = 𝐿2 + 𝐶 10
𝑓2
3∗𝑛
− 𝐹1
𝐷3 = 𝐿2 + 𝐶 10
𝑓2
Paso 5: Reemplazando los datos en la formula:
𝑄1 = 420 + 20 ∗
180−80
120
= 437 soles
MEDIDAS DE TENDENCIA NO CENTRAL
PERCENTILES: PK
Son valores de la variable que dividen a la distribución de datos en cien
partes iguales, en donde cada parte incluye el 1% de los datos.
V. mín._ 1%_._ 1%_. …._ ._ ……
P1
P2 …. P25
Q1
_._ 1%_._
P51
…..... P50
Q2
Me
……
….....
._ …
P75 ......
Q3
._1%_ V. máx.
P99
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los percentiles para datos no agrupados
1.- Ordenar los datos, de preferencia de menor a mayor: X1 X2 X3 X4 ….Xn
𝒌∗(𝒏+𝟏)
𝟏𝟎𝟎
2.- Obtener la posición correspondiente del decil.
, 𝐤: 𝟏, 𝟐, 𝟑, … , 𝟗𝟗
3.- Calculo de los deciles
E: parte entera de
𝐏𝐤 = ?
𝑘(𝑛+1)
100
𝐏𝐤 = XE + d*(X(E+1) – XE)
𝒌 ∗ (𝒏 + 𝟏)
𝟏𝟎𝟎
𝐤: 𝟏, 𝟐, 𝟑, …, 99
d: parte decimal de
𝑘(𝑛+1)
100
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los percentiles para datos no agrupados
EJEMPLO:
Se han recopilado los minutos que un calmante hace efecto a un grupo de
10 personas.
Xi : 14,15,16,18,7,8,15, 7, 20, 11
Calcule los cuartiles: 𝑃10 , 𝑃69
X1 X2 X3 X4
Xi : 7, 7, 8, 11,
X5 X6 X7 X8 X9
14, 15, 15, 16, 18,
X10
20
E= 1
𝐏𝟏𝟎 = ?
𝟏𝟎∗(𝟏𝟎+𝟏)
𝟏𝟎𝟎
P10 = X1 + 0.1*(X(1+1) – X1)
P10 = X1 + 0.1*(X(2) – X1)
𝐏𝟏𝟎 = 7 + 0.1*(7 – 7) = 7 minutos
= 1.1
D = 0.1
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los percentiles para datos agrupados sin intervalos
Paso 1: Calcular las frecuencias absolutas acumuladas: 𝐹𝑖
Paso 2: Calcular la posición del Pk :
𝐤∗𝐧
𝟏𝟎𝟎
Paso 3: .- El percentil 𝑃𝑘 = 𝐗𝐢 es el valor de la variable; cuya 𝑭𝒊 >
.- El percentil 𝑃𝑘 = Xi +(X(i+1) – Xi)*
n: número de datos.
𝐤
𝟏𝟎𝟎
; cuya
𝐤∗𝐧
𝑭𝒊 =
𝟏𝟎𝟎
𝐤∗𝐧
𝟏𝟎𝟎
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los percentiles para datos agrupados sin intervalos
Los datos de la tabla muestran información sobre la variable X que representa el número
de años de consumo de estupefacientes en una muestra de pacientes del Hospital
Nacional del Centro. Completar los datos que faltan en la siguiente tabla estadística:
Años de
consumo de
estupefacientes:
Xi
1
2
3
P19
4
5
P69
6
7
8
Total
fi
Fi
𝐏𝟏𝟗 = ?
Paso 1: Calcular las frecuencias absolutas acumulada.
4
4
8
7
5
10
7
5
50
4
8
16
23
28
38
45
50
Paso 2: Calcular la posición del 𝐏𝟏𝟗 :
𝑭𝟑 ≥ 9.5
𝟏𝟗∗𝟓𝟎
𝟏𝟎𝟎
= 9.5
𝐏𝟔𝟗 = ?
Paso 1: Calcular las frecuencias absolutas acumulada.
Paso 2: Calcular la posición del P𝟕 :
𝑭𝟔 ≥ 34.5
DECIL
P19
P69
VALOR
3 años
6 años
𝟔𝟗∗𝟓𝟎
𝟏𝟎𝟎
= 34.5
INTERPRETACIÓN
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los percentiles para datos agrupados con intervalos
Los percentiles se calculan utilizando la siguiente fórmula:
𝑘∗𝑛
− 𝐹(𝑖−1)
𝑃𝑘 = 𝐿𝑖 + 𝐶 ∗ 100
𝑓𝑖
K = 1,2,3, … ,99
Donde:
: Percentil k ésimo
: Intervalo de clase que contiene el PK
𝒌∗𝒏
: Posición del PK
𝟏𝟎𝟎
Li
: Limite real inferior de la clase que contiene el PK .
C
: Amplitud de la clase que contiene PK .
𝑭(𝒊−𝟏) : Frecuencia absoluta acumulada anterior a la clase que contiene el PK .
𝒇𝒊
: Frecuencia absoluta simple de la clase que contiene el PK
PK
.i
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los percentiles para datos agrupados con intervalos
EJEMPLO:
La siguiente distribución corresponde a los sueldos quincenales de los
trabajadores de una clínica privada.
SUELDOS
NUMERO DE
TRABAJADORES
fi
Fi
[400 - 420>
[420 - 440>
[440 - 460>
[460 - 480>
[480 - 500>
[500 - 520>
[520 - 540>
80
120
125
99
88
78
10
80
200
325
424
512
590
600
TOTAL
600
¿Cuál es el sueldo que supera el 43% de los
trabajadores?
¿Cuál es el sueldo que supera el 89% de los
trabajadores?
MEDIDAS DE TENDENCIA NO CENTRAL
Cálculo de los cuartiles para datos agrupados con intervalos
P89 = ?
¿Cuál es el sueldo que supera el 89% de los trabajadores?
𝑃89
89 ∗ 𝑛
− 𝐹(𝑖−1)
= 𝐿𝑖 + 𝐶 100
𝑓𝑖
Paso 1: Calcular las frecuencias absolutas acumulada Fi
SUELDOS
NUMERO DE
TRABAJADORES
fi
Fi
Paso 2: Calcular la posición del P𝟖𝟗:
[400 - 420>
80
80
Paso 3: Identificar el intervalo de clase que contiene el D𝟖𝟗 :
Como F6
[420 - 440>
120
200
[440 - 460>
125
325
[460 - 480>
99
424
[480 - 500>
88
512
= F5
L6 = [500 - 520>
𝒇𝟔 = 78
590
= F6
[520 - 540>
10
600
TOTAL
600
>
𝟖𝟗∗𝟔𝟎𝟎
𝟏𝟎𝟎
𝟖𝟗∗𝟔𝟎𝟎
𝟏𝟎𝟎
= 534
i
= 534, entonces, i = 6.
Paso 4: Reemplazando i = 6 en la formula:
C = 520 – 500 = 20
𝑃89
89 ∗ 𝑛
− 𝐹(6−1)
= 𝐿6 + 𝐶 100
𝑓6
𝑃89
89 ∗ 𝑛
− 𝐹5
= 𝐿6 + 𝐶 100
𝑓6
Paso 5: Reemplazando los datos en la formula:
𝑄1 = 500 + 20 ∗
534−512
78
= 506 soles
MEDIDAS DE TENDENCIA NO CENTRAL
CASOS PARTICULARES DE CUANTILES
PERCENTIL
DECIL
P10
P20
P25
P30
P40
P50
P60
P70
P75
P80
P90
D1
D2
CUARTIL
Q1
D3
D4
D5
D6
D7
Q2
Q3
D8
D9
Me
DIAGRAMA DE CAJAS (BOX PLOT)
Es un grafico representativo que permite visualizar tanto la dispersión como la
forma (simetría de los datos) de una variable y detectar valores atípicos
(outliers). Asimismo, es especialmente útil para comparar diferentes
distribuciones de manera simultanea.
DIAGRAMA DE CAJAS (BOX PLOT)
¿QUÉ INDICA EL BOX PLOT?
Mientras más larga la caja y
los bigotes, más dispersa es
la distribución de datos.
La distancia entre las cinco
medidas descritas en el
boxplot (sin incluir la media
aritmética) puede variar.
DIAGRAMA DE CAJAS (BOX PLOT)
¿QUE INDICA EL BOX PLOT?
Al igual que el histograma
y el gráfico de Tallos y
Hojas permite tener una
idea
visual
de
la
distribución de los datos
(simetría y variabilidad)
CASO 1.- La línea que representa
la mediana indica la simetría. Si
está relativamente en el centro de
la caja la distribución es simétrica.
CASO 2.- Si por el contrario se
acerca al tercer cuartil, la
distribución pudiera ser sesgada a
la izquierda (asimétrica negativa).
CASO 3.- Si por el contrario se
acerca al primer, la distribución
pudiera ser sesgada a la derecha
(asimétrica positiva).
DIAGRAMA DE CAJAS (BOX PLOT)
¿QUÉ INDICA EL BOX PLOT?
La
mediana
puede
inclusive coincidir con los
cuartiles o con los límites
de los bigotes. Esto
sucede
cuando
se
concentran muchos datos
en un mismo punto.
DIAGRAMA DE CAJAS (BOX PLOT)
¿QUE INDICA EL BOX PLOT?
Identifica con claridad y de
forma
individual,
observaciones que se alejan
de manera poco usual del
resto de los datos. A estas
observaciones
se
les
conoce
como
valores
atípicos. outliers (valores
extremos).
DIAGRAMA DE CAJAS (BOX PLOT)
Grafique el diagrama de BOX PLOT
de las edades de 100 trabajadores
DIAGRAMA DE CAJAS (BOX PLOT)
Grafique el diagrama de BOX PLOT
de las edades de 100 trabajadores
Tabla I. Distribución de
frecuencias de la edad en
100 pacientes.
Edad
Q1 =
Q2 =
Q3 =
Min. = 18 Máx. = 42
Q1 = 23;
Mediana = Q2 = 26;
Q3 = 31
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
41
42
Nº de
pacientes
1
3
4
7
5
8
10
8
9
6
6
4
3
4
5
3
2
3
1
2
3
1
1
1
Fi
1
4
8
15
20
28
38
46
55
61
67
71
74
78
83
86
88
91
92
94
97
98
99
100
DIAGRAMA DE CAJAS (BOX PLOT)
Grafique el diagrama de BOX PLOT
de las edades de 100 trabajadores
Máx.
Los valores para obtener el diagrama:
Min. = 18 Máx. = 42 Mediana = 26
Q1 = 23 ; Q3 = 31 ; RIC = Q3 - Q1 = 31 – 23 = 8
Calculando los extremos de los bigotes:
Extremo inferior = (Q1 – 1,5RIC) = 23 - 1,5(8) = 11
Extremo superior=(Q3 + 1,5RIC)= 31 + 1,5(8) = 43
Q3
RIC
Q2 = Me
Q1
Como los valores máximo y mínimo se encuentran
entre estos extremos, los bigotes se graficarán
hasta 18 y 42, no existiendo ningún valor atípico
(outlier)
Mín.
APLIQUEMOS LO APRENDIDO
La siguiente tabla muestra el tiempo (en minutos) que
demora 60 médicos de consulta externa en un centro
hospitalario de Trujillo (La Libertad).
Tiempo (minutos)
Numero de médicos
8- 13
10
14- 17
30
18- 21
12
22– 25
8
¿Qué medida de resumen se utilizará para determinar que un medico se
ubique en el 25% de los mas rápidos?
a. Calcular la media.
b. Calcular la mediana.
c. Determinar el cuartil 3.
d. Determinar el cuartil 1.
e. Faltan datos.
APLIQUEMOS LO APRENDIDO
Con respecto al Gráfico de Cajas
responda las siguientes preguntas:
¿Qué grupo tiene mayor mediana?.......................
¿Qué grupo presenta mayor dispersión?.............
¿Qué grupo es más simétrico?..............................
¿Qué grupo presenta valores discordantes?.........
APLIQUEMOS LO APRENDIDO
El siguiente grafico de box plot muestra los tiempos de espera de
tres restaurantes de comidas rápidas en cuarentena.
INTERES:
.- Identificar el restaurante con mayor rango de
espera ..........................................................
.- Identificar el restaurante que minimiza el tiempo
de espera...........................................................
.- Si se establece un tiempo de espera de 8 minutos,
¿Qué restaurante ofrece mejor servicio? ¿Por
qué? ……………………….………………………….
…………………………………………………...
SECCIÓN DE REFERENCIA
APLIQUEMOS LO APRENDIDO
Una asociación recaba información sobre sueldos anuales iniciales de los recién egresados
de universidades de acuerdo con su especialidad. El salario anual inicial de los
administradores de empresas es S/. 39580. A continuación se presentan muestras de los
sueldos anuales iniciales de especialistas en marketing y en contabilidad (los datos están en
miles):
Egresados de marketing:
34.2; 45.0; 39.5; 28.4; 37.7; 35.8; 30.6; 35.2; 34.2; 42.4
Egresados de contabilidad: 33.5; 57.1; 49.7; 40.2; 44.2; 45.2; 47.8; 38.0; 53.9; 41.1;
41.7; 40.8; 55.5; 43.5; 49.1; 49.9
Realice una descripción comparativa usando las medidas de posición de tendencia no
central y el diagrama de box plot.
SECCIÓN DE REFERENCIA
INTEGREMOS LO APRENDIDO
 ¿Qué es un decil?
 ¿Qué es un percentil?
 ¿Qué es un rango intercuartílico?
Actividad Asincrónica (virtual)
Resolver el cuestionario
virtual de la semana 4
SECCIÓN DE REFERENCIA
REFERENCIAS BIBLIOGRÁFICAS
Anderson, D. (2008). Estadística para administración y economía. México, D. F.: Cengage Learning. 10ª edición. Disponible en Biblioteca:
https://grupoeducad-my.sharepoint.com/:b:/g/personal/malvarez_cientifica_edu_pe/EfmckGutuRVEmTlp_PFA2sgBe6-Gdu3J7-Ct0rYCLZSK8Q
Johnson, R. (2004). Estadística elemental: lo esencial. México, D. F.: International Thomson. Disponible en Biblioteca: 519.5 / J67 / 2004.
Martínez, C. (2012). Estadística y muestreo. Bogotá: Ecoe Ediciones. Disponible en Biblioteca: 519.52 / M26 / 2012.
Palacios C., Severo. (2010). Estadística experimental. Aplicada a ciencia e ingeniería. 1ª. Edición. Concytec. Disponible en Biblioteca:
https://grupoeducad-my.sharepoint.com/:b:/g/personal/ehinostrozar_cientifica_edu_pe/EejSxiCIZo5Mmz284ZjriEB5JkTJwJPoZ7JkAqOVg8X9A?e=ZTN4Ey
Salazar, C. Del Castillo, S. (2018). Fundamentos básicos de estadística. 1ª edición. Disponible en Biblioteca: https://grupoeducadmy.sharepoint.com/:b:/g/personal/malvarez_cientifica_edu_pe/EX7CejlZbBZKukecWJpvRaIBy06W6cs1qX2fG0CxlWcwSQ
Triola, M. (2018).
Estadística. México, D. F.: Pearson Educación. 12ª edición.
Disponible en Biblioteca: https://grupoeducadmy.sharepoint.com/:b:/g/personal/malvarez_cientifica_edu_pe/EWWDv2kMz_NOsnHN6OaNyVYBOCVZIFLGBFaQqmrXUGmg3Q
Walpole, R.; Myers, R.; Myers, S; Ye, K. (2012) Probabilidad y estadística para ingeniería y ciencias. 9ª edición. Disponible en Biblioteca:
https://grupoeducadmy.sharepoint.com/:b:/g/personal/ehinostrozar_cientifica_edu_pe/ESqzEQPTJSNCiWzRQ3xtcxsBhDRarSKofShxY9d5uLyyVQ?e=CyCmyl
Descargar