TEMA 6. Distribuciones Alicia Nieto Reyes BIOESTADÍSTICA Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 6. Distribuciones 1 / 16 Probabilidad= Distribución= Distribución de Probabilidad Cuando queremos conocer la probabilidad asociada a una variable (aleatoria) se habla de la distribución de la variable Las variables las denotamos por letras como: X , Y , Z ... Distribución de variables continuas Normal: N(µ, σ) t de Student: tn ji-cuadrado: χ2n ... discretas Binomial: B(n, p) Poisson: Poi(λ) ... X ∼ N(µ, σ) significa que la variable X sigue una distribución Normal de media µ y varianza σ 2 Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 6. Distribuciones 2 / 16 Normal o Gaussiana Ejemplo 1: Queremos estudiar la variable altura, X , de la población: niños de 17 años Histograma de una muestra de tamaño 250 40 30 0 10 20 Frecuencia 50 60 Alturas de niños de 17 años. Tamaño muestra 250 160 170 180 190 200 Altura en cm Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 6. Distribuciones 3 / 16 Normal o Gaussiana Población: niños de 17 años Variable: Altura, X Histograma de una muestra de tamaño 100.000 (la muestra anterior de tamaño 250 está incluida) 6000 4000 0 2000 Frecuencia 8000 10000 Alturas de niños de 17 años. Tamaño muestra 100000 150 160 170 180 190 200 210 Altura en cm Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 6. Distribuciones 4 / 16 Normal o Gaussiana 0.03 0.00 0.01 0.02 Densidad 0.04 0.05 Si el tamaño de la muestra se acerca al de la población, el contorno del histograma pasarı́a a ser esta curva Pero, hemos ajustado el eje de ordenadas para que el area bajo la curva Alturas de niños de 17 años: N(175, 7,41) sea 1 150 160 170 180 190 200 Altura en cm Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 6. Distribuciones 5 / 16 Normal o Gaussiana Alturas de niños de 17 años. Tamaño muestra 100000 8000 6000 Frecuencia 0 0 10 2000 4000 40 30 20 Frecuencia 50 60 10000 Alturas de niños de 17 años. Tamaño muestra 250 160 170 180 190 200 150 Altura en cm 160 170 180 P n (X <= 160) = 7 = 0, 028 con n = 250 250 P n (X <= 160) = 2.177 = 0, 02177 con n = 100.000 100.000 Alicia Nieto Reyes (BIOESTADÍSTICA) 190 200 210 Altura en cm TEMA 6. Distribuciones 6 / 16 Normal o Gaussiana 0.05 Alturas de niños de 17 años: N(175, 7,41) 0.03 0.00 0.01 0.02 Densidad 0.04 P(X ≤ 160) = X − 175 160 − 175 P ≤ = 7.41 7.41 P(Y ≤ −2.02) = 1 − P(Y ≤ 2.02) = 1 − 0, 9783 = 0, 0217 150 160 170 180 190 200 Altura en cm Resultado Sea X una variable aleatoria que sigue una distribución N(µ, σ). Entonces X −µ sigue una distribución N(0, 1). la variable aleatoria Y = σ Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 6. Distribuciones 7 / 16 ÁREAS BAJO LA DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR, N(0, 1) z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 … 3,8 3,9 4,0 0 0,5000 0,5398 0,5793 0,6179 0,6554 0,6915 0,7257 … 0,9999 1,0000 1,0000 0,01 0,5040 0,5438 0,5832 0,6217 0,6591 0,6950 0,7291 … 0,9999 1,0000 1,0000 0,02 0,5080 0,5478 0,5871 0,6255 0,6628 0,6985 0,7324 … 0,9999 1,0000 1,0000 Alicia Nieto Reyes (BIOESTADÍSTICA) 0,03 0,5120 0,5517 0,5910 0,6293 0,6664 0,7019 0,7357 … 0,9999 1,0000 1,0000 0,04 0,5160 0,5557 0,5948 0,6331 0,6700 0,7054 0,7389 … 0,9999 1,0000 1,0000 0,05 0,5199 0,5596 0,5987 0,6368 0,6736 0,7088 0,7422 … 0,9999 1,0000 1,0000 TEMA 6. Distribuciones 0,06 0,5239 0,5636 0,6026 0,6406 0,6772 0,7123 0,7454 … 0,9999 1,0000 1,0000 0,07 0,5279 0,5675 0,6064 0,6443 0,6808 0,7157 0,7486 … 0,9999 1,0000 1,0000 0,08 0,5319 0,5714 0,6103 0,6480 0,6844 0,7190 0,7517 … 0,9999 1,0000 1,0000 0,09 0,5359 0,5753 0,6141 0,6517 0,6879 0,7224 0,7549 … 0,9999 1,0000 1,0000 8 / 16 t de Student tn : t de Student con n grados de libertad t100 0.3 0.0 0.0 0.1 0.2 Densidad 0.2 0.1 Densidad 0.3 0.4 t5 −6 −4 −2 0 2 4 6 −3 −2 −1 0 1 2 3 Se calcula con una tabla del tipo de la Normal ó, al igual que esta, con un programa informático adecuado Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 6. Distribuciones 9 / 16 Tabla t-Student Grados de libertad 0.25 1 1.0000 2 0.8165 3 0.7649 4 0.7407 5 0.7267 6 0.7176 7 0.7111 8 0.7064 9 0.7027 10 0.6998 11 0.6974 12 0.6955 13 0.6938 14 0.6924 15 0.6912 16 0.6901 17 0.6892 18 0.6884 19 0.6876 Alicia Nieto Reyes (BIOESTAD ÍSTICA) 20 0.6870 t0 0.1 3.0777 1.8856 1.6377 1.5332 1.4759 1.4398 1.4149 1.3968 1.3830 1.3722 1.3634 1.3562 1.3502 1.3450 1.3406 1.3368 1.3334 1.3304 1.3277 TEMA 6. 1.3253 0.05 6.3137 2.9200 2.3534 2.1318 2.0150 1.9432 1.8946 1.8595 1.8331 1.8125 1.7959 1.7823 1.7709 1.7613 1.7531 1.7459 1.7396 1.7341 1.7291 Distribuciones 1.7247 0.025 12.7062 4.3027 3.1824 2.7765 2.5706 2.4469 2.3646 2.3060 2.2622 2.2281 2.2010 2.1788 2.1604 2.1448 2.1315 2.1199 2.1098 2.1009 2.0930 2.0860 0.01 31.8210 6.9645 4.5407 3.7469 3.3649 3.1427 2.9979 2.8965 2.8214 2.7638 2.7181 2.6810 2.6503 2.6245 2.6025 2.5835 2.5669 2.5524 2.5395 2.5280 0.005 63.6559 9.9250 5.8408 4.6041 4.0321 3.7074 3.4995 3.3554 3.2498 3.1693 3.1058 3.0545 3.0123 2.9768 2.9467 2.9208 2.8982 2.8784 2.8609 2.8453 10 / 16 ji-cuadrado χ2n : ji-cuadrado con n grados de libertad χ210 0.06 0.02 0.04 Densidad 0.3 0.2 0.0 0.00 0.1 Densidad 0.4 0.08 0.5 0.10 χ22 0 5 10 15 5 10 15 20 25 30 µ=n σ = 2n El tipo de gráfica con n = 1, 2 es diferente a con n ≥ 3 Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 6. Distribuciones 11 / 16 Tabla de distribución ji-cuadrado Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 6. Distribuciones 12 / 16 Distribución de una Variable Aleatoria Discreta Binomial: B(n, p) Se lee Binomial de parámetros n y p Si X ∼ B(n, p) entonces P(X = k) = n k p k (1 − p)n−k Mide el número k de exitos en una secuencia de n ensayos con una porbabilidad p de exito Ejemplo: La probabilidad de que 5, k, cantabros/as fumen de entre 20, n, elegidos al azar, sabiendo que el 42% de la población Cantabra es fumadora, es 20 P(X = 5) = 0, 425 (1 − 0, 42)20−5 5 = 20! 0, 425 (0, 58)15 = 0, 057 5!(20 − 5)! donde X ∼ B(20, 0, 42) Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 6. Distribuciones 13 / 16 Binomial B(20, 0,42) B(40, 0,5) 0.10 ● ● ● ● ● ● ● ● ● 0.02 ● ● ● 0.04 ● ● ● 0.08 Probabilidad 0.10 ● Probabilidad ● 0.06 0.15 ● 0.05 ● 0.12 ● ● ● ● ● ● ● ● 2 4 6 8 10 12 14 ● 0.00 0.00 ● 16 Número de Exitos Alicia Nieto Reyes (BIOESTADÍSTICA) ● 10 ● ● ● ● 15 20 25 ● ● 30 Número de Exitos TEMA 6. Distribuciones 14 / 16 Distribución de una Variable Aleatoria Discreta Poisson: Poi(λ) Se lee Poisson de parámetro λ e −λ λk k! Expresa la probabilidad de un número k de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una frecuencia media conocida, λ, y son independientes del tiempo discurrido desde el último evento Ejemplo: La probabilidad de que 5, k, jeringuillas de una tirada de 400 esten defectuosas sabiendo que el 2% lo estan es Si X ∼ Poi(λ) entonces P(X = k) = P(X = 5) = e −8 85 = 0, 0916 5! donde X ∼ Poi(8) Nota que λ es el valor esperado de jeringuillas defectuosas: 2% de 400 Alicia Nieto Reyes (BIOESTADÍSTICA) TEMA 6. Distribuciones 15 / 16 Poisson 0.10 ● ● ● 0.25 0.12 ● ● Poi(2) ● 0.20 0.14 Poi(8) ● ● ● 0.02 ● ● ● ● ● ● ● ● 5 10 ● ● ● 15 ● 0 Número de Eventos Alicia Nieto Reyes (BIOESTADÍSTICA) ● 0.00 0.00 ● 0.05 0.04 ● 0.15 Probabilidad ● 0.10 0.08 ● 0.06 Probabilidad ● 2 4 6 ● 8 Número de Eventos TEMA 6. Distribuciones 16 / 16