Tema 15: Modelos de distribución de probabilidad: Variables discretas

Anuncio
Análisis de Datos I
Esquema del Tema 15
Tema 15: Modelos de distribución de
probabilidad: Variables discretas
1. INTRODUCCIÓN
2. EL MODELO UNIFORME
3. EL MODELO BINOMIAL, B(N, π)
Las tablas estadísticas
Ejemplo
4. EL MODELO DE DISTRIBUCIÓN MULTINOMIAL
__________________
Bibliografía: Tema 11 (pág. 289-296) y apéndice final con tablas
Carmen Ximénez
1
Análisis de Datos I
Esquema del Tema 15
1. INTRODUCCIÓN
En la práctica, la función de probabilidad de la mayoría de las variables discretas se ajusta
a un modelo teórico expresado mediante una fórmula concreta.
2. EL MODELO UNIFORME
Todos los valores asumibles por la variable X son equiprobables (=tienen la misma
probabilidad). Por tanto, puede asumirse una distribución uniforme.
Gráficamente se representa mediante:
,25
,20
f(x)
,15
Donde: f ( x) =
,10
,05
0
1
2
3
4
1
.
J
5
X
3. EL MODELO BINOMIAL, B(N, π)
Consiste en la distribución del nº de aciertos en una serie de ensayos de Bernouilli.
Para que la distribución de probabilidad de una variable X siga el modelo Binomial ha de
cumplirse que …
1. La variable esté definida como variable dicotómica: en términos de Acierto (1) y error (0)
2. Se de una repetición de N ensayos independientes en la variable dicotómica en los que “la
probabilidad de que el ensayo verifique la condición 1 (p.e., acierto) sea constante”, y se
representa por π.
3. Se defina una variable X, como el nº de veces que se verifica la condición (los 1) en los N
ensayos. Los valores de X (los xi) oscilan entre 0 y N: X = {0, 1, 2, …, N}
Si se cumplen las anteriores condiciones, la variable X (nº aciertos) se ajusta al Modelo
Binomial con parámetros N y π. Es decir: X ~ B (N, π)
a) Función de probabilidad de una variable Binomial:
⎛N⎞
f ( x) = ⎜ ⎟ ⋅ π x ⋅ (1 − π ) N − x
⎝x ⎠
⎛N ⎞
N!
Donde: ⎜ ⎟ =
x !⋅ ( N − x ) !
⎝x ⎠
b) Valor esperado: E(X) = N · π
c) Varianza:
Carmen Ximénez
σ2(X) = N · π (1 - π)
2
Análisis de Datos I
Esquema del Tema 15
Tablas estadísticas
No siempre es necesario aplicar la fórmula para obtener la función de probabilidad asociada
a un valor de la variable. Existen tablas donde se puede consultar el valor de f (xi). La tabla
de la Binomial (Tabla I del libro en págs. 403-408) tiene la siguiente estructura:
N
x
2
0
1
2
..
.
π
0,01 …
980
020
0+
17
Dado X ~ B (N; π), para buscar una f (xi):
… 0,99 1ª columna: valor de N
2ª columna: posibles valores de X: 0, 1, …, N
..
3ª columna: valor de f(xi) bajo diferentes valores de π
.
(aparece en porcentajes, por brevedad. El signo +
… f (xi) …
significa que hay más de tres ceros)
..
Ejemplo:
.
0,50
P(X = 1) = f(1) = 0,02 bajo X ~ B (x; 2; 0,01)
Nota: Cuando N > 17, f (xi) puede aproximarse mediante el modelo normal (lo veremos en el tema 20)
EJEMPLO (resuelto)
Un estudiante responde a un test de 3 preguntas con cinco opciones de respuesta (donde
sólo 1 es correcta). Si ha respondido azar:
1) Elabore el modelo de distribución para la variable X (nº de aciertos al azar)
X ~ B (N = 3, π = 0,20)
⎛N⎞
⎛3⎞
3!
f ( x) = ⎜ ⎟ ⋅ π x ⋅ (1− π )N −x → f (0) = ⎜ ⎟ ⋅ 0, 20 0 ⋅ (0, 80) 3 =
⋅ 1 ⋅ 0, 512 = 0, 512
0!(3 − 0)!
⎝x ⎠
⎝0⎠
⎛3⎞
3!
f (1) = ⎜ ⎟ ⋅ 0, 201 ⋅ (0, 80) 2 =
⋅ 0, 20 ⋅ 0, 64 = 0, 384
1!(3 − 1)!
⎝1 ⎠
⎛3⎞
3!
f (2) = ⎜ ⎟ ⋅ 0, 20 2 ⋅ (0, 80)1 =
⋅ 0, 04 ⋅ 0, 80 = 0, 096
2!(3 − 2)!
⎝2⎠
⎛3⎞
3!
f (3) = ⎜ ⎟ ⋅ 0, 20 3 ⋅ (0, 80) 0 =
⋅ 0, 008 ⋅ 1 = 0, 008
3!(3 − 3)!
⎝3⎠
Xi
f(xi)
0
0,512
1
0,384
2
0,096
3
0,008
2) ¿Cuál es la probabilidad de que acierte todas las preguntas?
P(X = 3) = f(3) = 0,008 (coincide con el valor dado en las tablas de probabilidad)
3) Valor esperado: E(X) = N · π = (3) (0,20) = 0,60
Varianza:
σ2(X) = N · π (1 - π) = (3) (0,20 · 0,80) = 0,48
4) ¿Cuál es la probabilidad de que acierte como máximo 2 preguntas?
P(X ≤ 2) = F(2) = 0,512 + 0,384 + 0,096 = 0,992
5) ¿Cuál es la probabilidad de que acierte entre 1 y 2 preguntas (ambas inclusive)?
P(1 ≤ X ≤ 2) = F(2) - F(0) = 0,992 - 0,512 = 0,480
6) ¿Cuál es la probabilidad de que acierte al menos 2 preguntas?
P(X ≥ 2) = 1 - P(X ≤ 1) = 1 – 0,896 = 0,104
Carmen Ximénez
3
Análisis de Datos I
Esquema del Tema 15
4. MODELO DE DISTRIBUCIÓN MULTINOMIAL
Se realizan N ensayos independientes que dan lugar a k resultados: X = { X1, X2, … Xk }
con probabilidades π1, π2, … πk, respectivamente (donde π1 + π2 + … + πk = 1).
Este modelo se trata de una extensión de la Binomial útil para variables politómicas
(variables discretas con más de 2 categorías).
Función de probabilidad de una variable multinomial:
f ( X 1 , X 2 ,..., X k ) =
N!
⋅ π X1 ⋅ π X 2 ⋅ ... ⋅ π X k
X 1 !⋅ X 2 !⋅ ... X k !
Ejemplo
X: Actitud hacia la donación de órganos
X1: En contra ....... con π1 = 0,15
X2: Indiferentes ... con π2 = 0,40
X3: A favor ........... con π3 = 0,45
Si se extrae una muestra aleatoria de 20 sujetos. ¿Cuál es la probabilidad de que 5 estén
en contra, 10 sean indiferentes y 5 estén a favor?
f ( X 1 = 5 , X 2 = 10 , X 3 = 5) =
N!
20!
⋅ π X1 ⋅ π X 2 ⋅ π X1 =
0,15 5 ⋅ 0,40 10 ⋅ 0,45 5 = 0,41
X 1!X 2!X 3!
5! 10! 5!
5. EJERCICIOS
Ejercicio 1
Supongamos que es igual de probable que nazcan niños que niñas. Si nos fijamos en los
próximos 5 partos de una determinada clínica, determine:
1. La probabilidad de que todas sean niñas
2. La probabilidad de que las niñas sean minoría
3. El valor esperado y la varianza de la variable X: “número de niñas”
Ejercicio 2
¿Cuál es la probabilidad de que al tomar 6 sujetos al azar, los seis superen el Q3 en la variable
creatividad?
Ejercicio 3
El índice de audiencia de un determinado programa de TV es el 30%. Tomamos una muestra
de 16 domicilios:
1. ¿En cuántos domicilios se espera que estén viendo el programa?
2. ¿Cuál es la probabilidad de que al menos en el 25% de domicilios estén viendo el
programa?
3. Supongamos que la cadena suprime el programa si no lo ven al menos el 20% de los
domicilios:
(a) ¿Cuál es la probabilidad de que lo suprima?
(b) ¿Cuál es la probabilidad de que lo suprima si el verdadero índice de audiencia es el 10%?
Carmen Ximénez
4
Descargar