Variables aleatorias y distribuciones de probabilidad Segunda Unidad MM-241 Bioestadı́stica UNAH 1 / 14 Variables aleatorias discretas Variable aleatoria Definición Una variable aleatoria es una regla(función) que asocia un número real a cada resultado del espacio muestral. Ejemplos: Nivel de colesterol, nivel de ácido úrico o número de ingresos en un servicio de urgencias. Notación: Las variables se denotan por letras mayúsculas usualmente X e Y. MM-241 Bioestadı́stica UNAH 2 / 14 Variables aleatorias discretas Cuando las variables son de tipo cualitativo como el sexo será necesario asignar valores numéricos a cada una de las posibilidades (Ejemplo: 1 Hombre, 2 Mujer). Una consecuencia inmediata derivada de este proceso de asignación de valores numéricos es que las variables aleatorias se clasifican únicamente en: variables aleatorias discretas y variables aleatorias continuas. MM-241 Bioestadı́stica UNAH 3 / 14 Variables aleatorias discretas Nuestro interés es el estudio de variables aleatorias discretas, a continuación se presentan algunos ejemplos Ejemplo La otitis media, una enfermedad del oı́do medio, es una de las razones más comunes para visitar a un médico en los primeros 2 años de vida que no sea una visita de rutina de rutina. Sea X la variable aleatoria que representa el número de episodios de otitis media en los primeros 2 años de vida. Entonces X es una variable aleatoria discreta, que toma los valores 0, 1, 2, y ası́ sucesivamente. Ejemplo (Hipertensión) Se han introducido muchas drogas nuevas en las últimas décadas para controlar la hipertensión, es decir, reducir la presión arterial alta a niveles normotensivos. Supongamos que un médico acepta usar un nuevo medicamento antihipertensivo en un base de prueba en los primeros cuatro hipertensos no tratados que encuentra en su práctica, antes de decidir si adoptar el medicamento para uso habitual. Sea X = el número de pacientes de cuatro que están bajo control. Entonces X es una variable aleatoria discreta, que toma los valores 0, 1, 2, 3, 4. Es necesario, poder determinar los valores reales que puede tomar la variable aleatoria, que dependerá del contexto de estudio. MM-241 Bioestadı́stica UNAH 4 / 14 Variables aleatorias discretas Distribución de probabilidad para una variable aleatoria discreta. Definición La distribución de probabilidad de una variable aleatoria discreta es una tabla, una gráfica, una fórmula u otro sistema utilizado para especificar todos los valores posibles de una variable aleatoria discreta junto con sus probabilidades respectivas. Ası́, la distribución de probabilidad para una variable aleatoria se puede definir de la siguiente manera: f (x) = P (X = x) donde, X: La variable aleatoria. x: Los posibles valores que puede tomar la variable aleatoria X. P (X = x): Es la probabilidad de que X tome el valor de x. MM-241 Bioestadı́stica UNAH 5 / 14 Variables aleatorias discretas Ejemplo 1 Propiedades: Ejemplo Una mujer portadora de hemofilia tiene 3 hijos. a ¿ Encuentre el espacio muestral para estudiar la posible hemofilia de estos? b Sea la variable aleatoria X: número de hijos que pueden padecer hemofilia , ¿ Encuentre la función de probabilidad para X? Solución: a) Observe que para cada hijo hay dos posibilidades: Primera: Pueden padecer hemofilia(S) Segunda: No pueden padecer hemofilia(N) MM-241 Bioestadı́stica UNAH 6 / 14 Variables aleatorias discretas Como el número de hijos es tres, entonces es posible construir un diagrama de árbol, para determinar el espacio muestral: 7S /N /N /S 8S 7S ' & 7N N ' /S /S N /S ' N MM-241 Bioestadı́stica UNAH 7 / 14 Variables aleatorias discretas Contando las ramas en la última etapa, tenemos que son ocho posibles resultados, ası́ el espacio muestral es: S = {SSS, SSN, SN S, SN N, N SN, N SS, N N S, N N N } b) X: número de hijos que pueden padecer hemofilia, observe que entonces: X(SSS) = 3 X(SSN ) = X(SN S) = X(N SS) = 2 X(SN N ) = X(N SN ) = X(N N S) = 1 X(N N N ) = 0 Por tanto, los valores posibles que puede tomar la variable X son: 0, 1, 2, 3. Luego, la función de probabilidad es: x f (x) = P (X = x) 0 1/8 1 3/8 2 3/8 3 1/8 Nota: Observe que la suma de las probabilidades de todos los posibles valores para X es 1. MM-241 Bioestadı́stica UNAH 8 / 14 Variables aleatorias discretas Ejemplo 3 Ejemplo La siguiente tabla muestra la distribución de probabilidad para la variable Y: número de personas por dı́a que solicitan un tratamiento innecesario en el servicio de urgencias de un pequeño hospital. y f (y) = P (Y = y) 0 0.01 1 0.1 2 0.3 3 0.4 4 0.1 5 c 1 Encontrar el valor de c para que f (y) sea una distribución de probabilidad. 2 Encontrar P (Y ≤ 2). 3 Encontrar P (Y > 3). MM-241 Bioestadı́stica UNAH 9 / 14 Variables aleatorias discretas Solución: 1 Aplicando la propiedad que la suma de las probabilidades es 1. Es decir, X P (Y = y) = 1 y Sea c = f (5), 0.91 + c = 1 Despejando para c se tiene que c = 0.09. 2 Se esta pidiendo la probabilidad de todos los valores de Y menores o iguales a 2, asi P (Y ≤ 2) 3 = P (Y = 0) + P (Y = 1) + P (Y = 2) = 0.01 + 0.1 + 0.3 = 0.41 Similarmente, P (Y > 3) = P (Y = 4) + P (Y = 5) = 0.1 + 0.09 = 0.19 MM-241 Bioestadı́stica UNAH 10 / 14 Variables aleatorias discretas Valor esperado y Varianza de una variable aleatoria discreta Definición Sea X una variable aleatoria discreta con función de probabilidad f (x) = P (X = x). La media o valor esperado de X es: X µ = E(X) = xP (X = x) x Propiedad del valor esperado: Sean dos números reales a y b entonces: E(aX + b) = aE(X) + b MM-241 Bioestadı́stica UNAH 11 / 14 Variables aleatorias discretas Definición Sea X una variable aleatoria discreta con función de probabilidad f (x) = P (X = x). La varianza de X es: X σ 2 = V (X) = (x − µ)2 P (X = x) x Una fórmula, mas simplificada para el cálculo de la varianza es: V (X) = E(X 2 ) − (E(X))2 donde, E(X 2 ) = X x2 P (X = x) x Propiedad de la varianza: Sean dos números reales a y b entonces: V (aX + b) = a2 V (X) MM-241 Bioestadı́stica UNAH 12 / 14 Variables aleatorias discretas Ejemplo La siguiente tabla muestra la distribución de probabilidad para la variable Y: número de personas por dı́a que solicitan un tratamiento innecesario en el servicio de urgencias de un pequeño hospital. y f (y) = P (Y = y) 0 0.01 1 0.1 1 Encuentre el valor esperado 2 Encuentre la varianza 2 0.3 3 0.4 4 0.1 5 0.09 MM-241 Bioestadı́stica UNAH 13 / 14 Variables aleatorias discretas Solución: 1 Aplicando la definición tenemos que: X E(Y ) = yP (Y = y) y 2 = 0(0.01) + 1(0.1) + 2(0.3) + 3(0.4) + 4(0.1) + 5(0.09) = 2.75 Aplicando la fórmula simplificada, como por el inciso anterior ya se tiene la esperanza, calculando E(X 2 ) se tiene: X 2 E(Y 2 ) = y P (Y = y) y 2 = 0 (0.01) + 12 (0.1) + 22 (0.3) + 32 (0.4) + 42 (0.1) + 52 (0.09) = 8.75 Por tanto, V (Y ) = E(Y 2 ) − (E(Y ))2 = 8.75 − (2.75)2 = 1.1875 MM-241 Bioestadı́stica UNAH 14 / 14