TEMA 6. Distribuciones

Anuncio
TEMA 6. Distribuciones
Alicia Nieto Reyes
BIOESTADÍSTICA
Alicia Nieto Reyes (BIOESTADÍSTICA)
TEMA 6. Distribuciones
1 / 16
Probabilidad= Distribución= Distribución de Probabilidad
Cuando queremos conocer la probabilidad asociada a una variable
(aleatoria) se habla de la distribución de la variable
Las variables las denotamos por letras como: X , Y , Z ...
Distribución de variables
continuas
Normal: N(µ, σ)
t de Student: tn
ji-cuadrado: χ2n
...
discretas
Binomial: B(n, p)
Poisson: Poi(λ)
...
X ∼ N(µ, σ) significa que la variable X sigue una distribución Normal de
media µ y varianza σ 2
Alicia Nieto Reyes (BIOESTADÍSTICA)
TEMA 6. Distribuciones
2 / 16
Normal o Gaussiana
Ejemplo 1: Queremos estudiar la variable altura, X , de la población: niños
de 17 años
Histograma de una muestra de tamaño 250
40
30
0
10
20
Frecuencia
50
60
Alturas de niños de 17 años. Tamaño muestra 250
160
170
180
190
200
Altura en cm
Alicia Nieto Reyes (BIOESTADÍSTICA)
TEMA 6. Distribuciones
3 / 16
Normal o Gaussiana
Población: niños de 17 años
Variable: Altura, X
Histograma de una muestra de tamaño 100.000 (la muestra anterior de
tamaño 250 está incluida)
6000
4000
0
2000
Frecuencia
8000
10000
Alturas de niños de 17 años. Tamaño muestra 100000
150
160
170
180
190
200
210
Altura en cm
Alicia Nieto Reyes (BIOESTADÍSTICA)
TEMA 6. Distribuciones
4 / 16
Normal o Gaussiana
0.03
0.00
0.01
0.02
Densidad
0.04
0.05
Si el tamaño de la muestra se acerca al de la población, el contorno del
histograma pasarı́a a ser esta curva
Pero, hemos ajustado el eje de ordenadas para que el area bajo la curva
Alturas de niños de 17 años: N(175, 7,41)
sea 1
150
160
170
180
190
200
Altura en cm
Alicia Nieto Reyes (BIOESTADÍSTICA)
TEMA 6. Distribuciones
5 / 16
Normal o Gaussiana
Alturas de niños de 17 años. Tamaño muestra 100000
8000
6000
Frecuencia
0
0
10
2000
4000
40
30
20
Frecuencia
50
60
10000
Alturas de niños de 17 años. Tamaño muestra 250
160
170
180
190
200
150
Altura en cm
160
170
180
P n (X <= 160) =
7
= 0, 028 con n = 250
250
P n (X <= 160) =
2.177
= 0, 02177 con n = 100.000
100.000
Alicia Nieto Reyes (BIOESTADÍSTICA)
190
200
210
Altura en cm
TEMA 6. Distribuciones
6 / 16
Normal o Gaussiana
0.05
Alturas de niños de 17 años: N(175, 7,41)
0.03
0.00
0.01
0.02
Densidad
0.04
P(X
≤ 160) =
X − 175
160 − 175
P
≤
=
7.41
7.41
P(Y ≤ −2.02) =
1 − P(Y ≤ 2.02) =
1 − 0, 9783 =
0, 0217
150
160
170
180
190
200
Altura en cm
Resultado
Sea X una variable aleatoria que sigue una distribución N(µ, σ). Entonces
X −µ
sigue una distribución N(0, 1).
la variable aleatoria Y =
σ
Alicia Nieto Reyes (BIOESTADÍSTICA)
TEMA 6. Distribuciones
7 / 16
ÁREAS BAJO LA DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR, N(0, 1)
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
…
3,8
3,9
4,0
0
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
…
0,9999
1,0000
1,0000
0,01
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7291
…
0,9999
1,0000
1,0000
0,02
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
…
0,9999
1,0000
1,0000
Alicia Nieto Reyes (BIOESTADÍSTICA)
0,03
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
…
0,9999
1,0000
1,0000
0,04
0,5160
0,5557
0,5948
0,6331
0,6700
0,7054
0,7389
…
0,9999
1,0000
1,0000
0,05
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
…
0,9999
1,0000
1,0000
TEMA 6. Distribuciones
0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
…
0,9999
1,0000
1,0000
0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
…
0,9999
1,0000
1,0000
0,08
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
…
0,9999
1,0000
1,0000
0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
…
0,9999
1,0000
1,0000
8 / 16
t de Student
tn : t de Student con n grados de libertad
t100
0.3
0.0
0.0
0.1
0.2
Densidad
0.2
0.1
Densidad
0.3
0.4
t5
−6
−4
−2
0
2
4
6
−3
−2
−1
0
1
2
3
Se calcula con una tabla del tipo de la Normal ó, al igual que esta, con un
programa informático adecuado
Alicia Nieto Reyes (BIOESTADÍSTICA)
TEMA 6. Distribuciones
9 / 16
Tabla t-Student
Grados de
libertad
0.25
1
1.0000
2
0.8165
3
0.7649
4
0.7407
5
0.7267
6
0.7176
7
0.7111
8
0.7064
9
0.7027
10
0.6998
11
0.6974
12
0.6955
13
0.6938
14
0.6924
15
0.6912
16
0.6901
17
0.6892
18
0.6884
19
0.6876
Alicia Nieto Reyes (BIOESTAD
ÍSTICA)
20
0.6870
t0
0.1
3.0777
1.8856
1.6377
1.5332
1.4759
1.4398
1.4149
1.3968
1.3830
1.3722
1.3634
1.3562
1.3502
1.3450
1.3406
1.3368
1.3334
1.3304
1.3277
TEMA 6.
1.3253
0.05
6.3137
2.9200
2.3534
2.1318
2.0150
1.9432
1.8946
1.8595
1.8331
1.8125
1.7959
1.7823
1.7709
1.7613
1.7531
1.7459
1.7396
1.7341
1.7291
Distribuciones
1.7247
0.025
12.7062
4.3027
3.1824
2.7765
2.5706
2.4469
2.3646
2.3060
2.2622
2.2281
2.2010
2.1788
2.1604
2.1448
2.1315
2.1199
2.1098
2.1009
2.0930
2.0860
0.01
31.8210
6.9645
4.5407
3.7469
3.3649
3.1427
2.9979
2.8965
2.8214
2.7638
2.7181
2.6810
2.6503
2.6245
2.6025
2.5835
2.5669
2.5524
2.5395
2.5280
0.005
63.6559
9.9250
5.8408
4.6041
4.0321
3.7074
3.4995
3.3554
3.2498
3.1693
3.1058
3.0545
3.0123
2.9768
2.9467
2.9208
2.8982
2.8784
2.8609
2.8453
10 / 16
ji-cuadrado
χ2n : ji-cuadrado con n grados de libertad
χ210
0.06
0.02
0.04
Densidad
0.3
0.2
0.0
0.00
0.1
Densidad
0.4
0.08
0.5
0.10
χ22
0
5
10
15
5
10
15
20
25
30
µ=n
σ = 2n
El tipo de gráfica con n = 1, 2 es diferente a con n ≥ 3
Alicia Nieto Reyes (BIOESTADÍSTICA)
TEMA 6. Distribuciones
11 / 16
Tabla de distribución ji-cuadrado
Alicia Nieto Reyes (BIOESTADÍSTICA)
TEMA 6. Distribuciones
12 / 16
Distribución de una Variable Aleatoria Discreta
Binomial: B(n, p)
Se lee Binomial de parámetros n y p
Si X ∼ B(n, p) entonces P(X = k) =
n
k
p k (1 − p)n−k
Mide el número k de exitos en una secuencia de n ensayos con una
porbabilidad p de exito
Ejemplo: La probabilidad de que 5, k, cantabros/as fumen de entre
20, n, elegidos al azar, sabiendo que el 42% de la población Cantabra
es fumadora, es 20
P(X = 5) =
0, 425 (1 − 0, 42)20−5
5
=
20!
0, 425 (0, 58)15 = 0, 057
5!(20 − 5)!
donde X ∼ B(20, 0, 42)
Alicia Nieto Reyes (BIOESTADÍSTICA)
TEMA 6. Distribuciones
13 / 16
Binomial
B(20, 0,42)
B(40, 0,5)
0.10
●
●
●
●
●
●
●
●
●
0.02
●
●
●
0.04
●
●
●
0.08
Probabilidad
0.10
●
Probabilidad
●
0.06
0.15
●
0.05
●
0.12
●
●
●
●
●
●
●
●
2
4
6
8
10
12
14
●
0.00
0.00
●
16
Número de Exitos
Alicia Nieto Reyes (BIOESTADÍSTICA)
●
10
●
●
●
●
15
20
25
●
●
30
Número de Exitos
TEMA 6. Distribuciones
14 / 16
Distribución de una Variable Aleatoria Discreta
Poisson: Poi(λ)
Se lee Poisson de parámetro λ
e −λ λk
k!
Expresa la probabilidad de un número k de eventos ocurriendo en un
tiempo fijo si estos eventos ocurren con una frecuencia media
conocida, λ, y son independientes del tiempo discurrido desde el
último evento
Ejemplo: La probabilidad de que 5, k, jeringuillas de una tirada de
400 esten defectuosas sabiendo que el 2% lo estan es
Si X ∼ Poi(λ) entonces P(X = k) =
P(X = 5) =
e −8 85
= 0, 0916
5!
donde X ∼ Poi(8)
Nota que λ es el valor esperado de jeringuillas defectuosas: 2% de 400
Alicia Nieto Reyes (BIOESTADÍSTICA)
TEMA 6. Distribuciones
15 / 16
Poisson
0.10
●
●
●
0.25
0.12
●
●
Poi(2)
●
0.20
0.14
Poi(8)
●
●
●
0.02
●
●
●
●
●
●
●
●
5
10
●
●
●
15
●
0
Número de Eventos
Alicia Nieto Reyes (BIOESTADÍSTICA)
●
0.00
0.00
●
0.05
0.04
●
0.15
Probabilidad
●
0.10
0.08
●
0.06
Probabilidad
●
2
4
6
●
8
Número de Eventos
TEMA 6. Distribuciones
16 / 16
Descargar