Análisis de Datos I Esquema del Tema 15 Tema 15: Modelos de distribución de probabilidad: Variables discretas 1. INTRODUCCIÓN 2. EL MODELO UNIFORME 3. EL MODELO BINOMIAL, B(N, π) Las tablas estadísticas Ejemplo 4. EL MODELO DE DISTRIBUCIÓN MULTINOMIAL __________________ Bibliografía: Tema 11 (pág. 289-296) y apéndice final con tablas Carmen Ximénez 1 Análisis de Datos I Esquema del Tema 15 1. INTRODUCCIÓN En la práctica, la función de probabilidad de la mayoría de las variables discretas se ajusta a un modelo teórico expresado mediante una fórmula concreta. 2. EL MODELO UNIFORME Todos los valores asumibles por la variable X son equiprobables (=tienen la misma probabilidad). Por tanto, puede asumirse una distribución uniforme. Gráficamente se representa mediante: ,25 ,20 f(x) ,15 Donde: f ( x) = ,10 ,05 0 1 2 3 4 1 . J 5 X 3. EL MODELO BINOMIAL, B(N, π) Consiste en la distribución del nº de aciertos en una serie de ensayos de Bernouilli. Para que la distribución de probabilidad de una variable X siga el modelo Binomial ha de cumplirse que … 1. La variable esté definida como variable dicotómica: en términos de Acierto (1) y error (0) 2. Se de una repetición de N ensayos independientes en la variable dicotómica en los que “la probabilidad de que el ensayo verifique la condición 1 (p.e., acierto) sea constante”, y se representa por π. 3. Se defina una variable X, como el nº de veces que se verifica la condición (los 1) en los N ensayos. Los valores de X (los xi) oscilan entre 0 y N: X = {0, 1, 2, …, N} Si se cumplen las anteriores condiciones, la variable X (nº aciertos) se ajusta al Modelo Binomial con parámetros N y π. Es decir: X ~ B (N, π) a) Función de probabilidad de una variable Binomial: ⎛N⎞ f ( x) = ⎜ ⎟ ⋅ π x ⋅ (1 − π ) N − x ⎝x ⎠ ⎛N ⎞ N! Donde: ⎜ ⎟ = x !⋅ ( N − x ) ! ⎝x ⎠ b) Valor esperado: E(X) = N · π c) Varianza: Carmen Ximénez σ2(X) = N · π (1 - π) 2 Análisis de Datos I Esquema del Tema 15 Tablas estadísticas No siempre es necesario aplicar la fórmula para obtener la función de probabilidad asociada a un valor de la variable. Existen tablas donde se puede consultar el valor de f (xi). La tabla de la Binomial (Tabla I del libro en págs. 403-408) tiene la siguiente estructura: N x 2 0 1 2 .. . π 0,01 … 980 020 0+ 17 Dado X ~ B (N; π), para buscar una f (xi): … 0,99 1ª columna: valor de N 2ª columna: posibles valores de X: 0, 1, …, N .. 3ª columna: valor de f(xi) bajo diferentes valores de π . (aparece en porcentajes, por brevedad. El signo + … f (xi) … significa que hay más de tres ceros) .. Ejemplo: . 0,50 P(X = 1) = f(1) = 0,02 bajo X ~ B (x; 2; 0,01) Nota: Cuando N > 17, f (xi) puede aproximarse mediante el modelo normal (lo veremos en el tema 20) EJEMPLO (resuelto) Un estudiante responde a un test de 3 preguntas con cinco opciones de respuesta (donde sólo 1 es correcta). Si ha respondido azar: 1) Elabore el modelo de distribución para la variable X (nº de aciertos al azar) X ~ B (N = 3, π = 0,20) ⎛N⎞ ⎛3⎞ 3! f ( x) = ⎜ ⎟ ⋅ π x ⋅ (1− π )N −x → f (0) = ⎜ ⎟ ⋅ 0, 20 0 ⋅ (0, 80) 3 = ⋅ 1 ⋅ 0, 512 = 0, 512 0!(3 − 0)! ⎝x ⎠ ⎝0⎠ ⎛3⎞ 3! f (1) = ⎜ ⎟ ⋅ 0, 201 ⋅ (0, 80) 2 = ⋅ 0, 20 ⋅ 0, 64 = 0, 384 1!(3 − 1)! ⎝1 ⎠ ⎛3⎞ 3! f (2) = ⎜ ⎟ ⋅ 0, 20 2 ⋅ (0, 80)1 = ⋅ 0, 04 ⋅ 0, 80 = 0, 096 2!(3 − 2)! ⎝2⎠ ⎛3⎞ 3! f (3) = ⎜ ⎟ ⋅ 0, 20 3 ⋅ (0, 80) 0 = ⋅ 0, 008 ⋅ 1 = 0, 008 3!(3 − 3)! ⎝3⎠ Xi f(xi) 0 0,512 1 0,384 2 0,096 3 0,008 2) ¿Cuál es la probabilidad de que acierte todas las preguntas? P(X = 3) = f(3) = 0,008 (coincide con el valor dado en las tablas de probabilidad) 3) Valor esperado: E(X) = N · π = (3) (0,20) = 0,60 Varianza: σ2(X) = N · π (1 - π) = (3) (0,20 · 0,80) = 0,48 4) ¿Cuál es la probabilidad de que acierte como máximo 2 preguntas? P(X ≤ 2) = F(2) = 0,512 + 0,384 + 0,096 = 0,992 5) ¿Cuál es la probabilidad de que acierte entre 1 y 2 preguntas (ambas inclusive)? P(1 ≤ X ≤ 2) = F(2) - F(0) = 0,992 - 0,512 = 0,480 6) ¿Cuál es la probabilidad de que acierte al menos 2 preguntas? P(X ≥ 2) = 1 - P(X ≤ 1) = 1 – 0,896 = 0,104 Carmen Ximénez 3 Análisis de Datos I Esquema del Tema 15 4. MODELO DE DISTRIBUCIÓN MULTINOMIAL Se realizan N ensayos independientes que dan lugar a k resultados: X = { X1, X2, … Xk } con probabilidades π1, π2, … πk, respectivamente (donde π1 + π2 + … + πk = 1). Este modelo se trata de una extensión de la Binomial útil para variables politómicas (variables discretas con más de 2 categorías). Función de probabilidad de una variable multinomial: f ( X 1 , X 2 ,..., X k ) = N! ⋅ π X1 ⋅ π X 2 ⋅ ... ⋅ π X k X 1 !⋅ X 2 !⋅ ... X k ! Ejemplo X: Actitud hacia la donación de órganos X1: En contra ....... con π1 = 0,15 X2: Indiferentes ... con π2 = 0,40 X3: A favor ........... con π3 = 0,45 Si se extrae una muestra aleatoria de 20 sujetos. ¿Cuál es la probabilidad de que 5 estén en contra, 10 sean indiferentes y 5 estén a favor? f ( X 1 = 5 , X 2 = 10 , X 3 = 5) = N! 20! ⋅ π X1 ⋅ π X 2 ⋅ π X1 = 0,15 5 ⋅ 0,40 10 ⋅ 0,45 5 = 0,41 X 1!X 2!X 3! 5! 10! 5! 5. EJERCICIOS Ejercicio 1 Supongamos que es igual de probable que nazcan niños que niñas. Si nos fijamos en los próximos 5 partos de una determinada clínica, determine: 1. La probabilidad de que todas sean niñas 2. La probabilidad de que las niñas sean minoría 3. El valor esperado y la varianza de la variable X: “número de niñas” Ejercicio 2 ¿Cuál es la probabilidad de que al tomar 6 sujetos al azar, los seis superen el Q3 en la variable creatividad? Ejercicio 3 El índice de audiencia de un determinado programa de TV es el 30%. Tomamos una muestra de 16 domicilios: 1. ¿En cuántos domicilios se espera que estén viendo el programa? 2. ¿Cuál es la probabilidad de que al menos en el 25% de domicilios estén viendo el programa? 3. Supongamos que la cadena suprime el programa si no lo ven al menos el 20% de los domicilios: (a) ¿Cuál es la probabilidad de que lo suprima? (b) ¿Cuál es la probabilidad de que lo suprima si el verdadero índice de audiencia es el 10%? Carmen Ximénez 4