Probabilidad Variables Aleatorias 3. VARIABLES ALEATORIAS L as variables aleatorias se clasifican en discretas y continuas, dependiendo del número de valores que pueden asumir. Una variable aleatoria es discreta si sólo puede tomar una cantidad finita o infinita numerable de valores. Si por el contrario, la variable aleatoria puede tomar cualquier valor de un conjunto infinito no numerable, entonces la variable es continua. Desde luego, el análisis de una variable aleatoria discreta difiere del de una variable aleatoria continua. Esto se expresa a continuación. 3.1 VARIABLES ALEATORIAS DISCRETAS. FUNCIÓN DE PROBABILIDAD. El comportamiento aleatorio de una variable aleatoria discreta se analiza a través de una función de probabilidad. Definición: Sea X una variable aleatoria discreta, cuyo rango (conjunto de valores posibles) es el conjunto que denotamos por RX. Se define la función de probabilidad de X como: f X : R X → [0,1] tal que f X ( x) = P ( X = x) para todo valor x ∈ R X . Esto es, la función de probabilidad de X es una función que asigna a cada valor de x del rango de X, la probabilidad de que la variable aleatoria lo asuma en la siguiente realización del experimento. Ejemplo 3.1.1 Supongamos que la variable aleatoria X representa el número de automóviles que pasan por una caseta de peaje en un período de un día. El rango de la variable aleatoria es R X = {0,1,2,...} ; es decir, todos los enteros no negativos. Como el rango es un conjunto infinito numerable, la variable aleatoria X es discreta. La función de probabilidad de X es la función que determina para cada valor x, la probabilidad de que ese valor sea el observado; es decir, f X (0) = P ( X = 0) es la probabilidad de que en un día no pase ningún carro por la caseta mencionada M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 1 Probabilidad Variables Aleatorias f X (1) = P ( X = 1) es la probabilidad de que en un día pase exactamente un automóvil por la caseta de peaje, etcétera. 3.1.1 PROPIEDADES La función de probabilidad de una variable aleatoria discreta tiene las siguientes propiedades: 1) Sus valores están entre 0 y 1 0 ≤ f X ( x) ≤ 1 ∀x ∈ R X 2) La suma de los valores de f X(x) cuando se consideran todos los valores del rango, es igual a uno. ∑f ∀x∈R X X ( x) = 1 3) La probabilidad de que la variable aleatoria presente alguno de los valores que pertenecen a un conjunto, es la suma de las probabilidades de los valores particulares. P ( x0 ≤ x ≤ x1 ) = x1 ∑f x = x0 X ( x) Ejemplo 3.1.1.1 Considere el experimento que consiste en lanzar un dado y observar el número de puntos que tiene en su cara superior. La variable aleatoria X será el número de puntos en la cara superior del dado, después del lanzamiento. El rango de la variable aleatoria X es RX = {1,2,3,4,5,6}. La función de probabilidad de X se muestra en la siguiente tabla: x fX(x) 1 1/6 M.en I, Isabel Patricia Aguilar Juárez 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 UNAM-Facultad de Ingeniería 2 Probabilidad Variables Aleatorias Es decir, fX(1)=P(X=1) = P(el resultado del lanzamiento es 1) = 1/6 fX(2)=P(X=2) = P(el resultado del lanzamiento es 2) = 1/6 . La probabilidad de que el resultado esté entre 2 y 5 es: P(2≤X≤5) = = = = P(2 ≤ X ≤ 5) = P(X=2) + P(X=3) + P(X=4) + P(X=5) fX(2) + fX(3) + fX(4) + fX(5) 1/6 + 1/6 + 1/6 + 1/6 4/6 4 6 3.2 VARIABLES ALEATORIAS CONTINUAS. FUNCIÓN DE DENSIDAD DE PROBABILIDAD. Por la naturaleza de las variables aleatorias continuas, no es posible hacer su análisis a través de una función de probabilidad como en el caso discreto, pero en su lugar se utiliza otra función conocida como función de probabilidad o simplemente de densidad. Definición: Si X es una variable aleatoria continua cuyos valores posibles son todos los números que pertenecen al conjunto RX, se define la función de densidad de X como la función: f X : RX → ℜ que cumple con las siguientes condiciones: 1) La función fX(x) no toma valores negativos. f X ( x) ≥ 0 2) El área bajo la función es uno. ∫ RX ∀x ∈ R X f X ( x)dx = 1 3) La probabilidad de que la variable aleatoria presente un valor cualquiera dentro de un intervalo, es el área bajo la función y sobre el intervalo. x1 P( x0 ≤ X ≤ x1 ) = ∫ f X ( x)dx x0 M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 3 Probabilidad Variables Aleatorias Ejemplo 3.2.1 Si la variable aleatoria X tiene función de densidad 1 ⎧1 ⎪ x+ ;1 ≤ x ≤ 2 f X ( x) = ⎨ 3 2 ⎪⎩ 0 ; en otro caso se puede observar que, gráficamente, fX(x) tiene la forma: 2 2⎛ 1 1⎞ 1 ⎤ 4 1 1 ⎡1 El área bajo la curva es A = ∫ ⎜ x + ⎟dx = ⎢ x 2 + x ⎥ = + 1 − − = 1 1 2⎠ 2 ⎦1 6 6 2 ⎝3 ⎣6 A=1 Y la probabilidad de que X esté entre 1 y 1.5 es: 1.5 P (1 ≤ x ≤ 1.5) = ∫ 1 P (1 ≤ x ≤ 1.5) = 1.5 1⎞ 9 3 1 1 27 16 11 ⎛1 ⎡1 2 1 ⎤ + − − = − = ⎜ x + ⎟dx = ⎢ x + x ⎥ = 2⎠ 2 ⎦1 24 4 6 2 24 24 24 ⎝3 ⎣6 11 24 M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 4 Probabilidad Variables Aleatorias Es muy común que en un experimento nos interesemos por la probabilidad de que la variable aleatoria asuma, más que un valor particular, un valor cualquiera en un rango, o bien, por identificar aquellos puntos o intervalos en los que se acumula mayor probabilidad. Es por ésta razón que se define una función, la función de distribución (acumulativa) de una variable aleatoria. La función de distribución de una variable aleatoria refleja la forma en que se acumula la probabilidad a lo largo del rango de la variable aleatoria. 3.3 FUNCIÓN DE DISTRIBUCIÓN Definición: Si X es una variable aleatoria se define a la función de distribución de X como la función que se denota por FX(x) y que asigna a cada valor x0 ∈ RX , la probabilidad de que la variable aleatoria tome un valor menor o igual a dicha x0 . Esto es, FX( x0 ) = P (X ≤ x0) El cálculo de FX( x0 ) se realiza de la siguiente manera: ■ Si X es discreta, FX( x0 ) = ∑ f X (x) x ≤ x0 x0 ■ Si X es continua FX( x0 ) = ∫ f X (x) dx , en donde a es el valor más a pequeño que podría asumir la variable aleatoria X. 3.3.1 PROPIEDADES Esta función de distribución tiene las siguientes propiedades: M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 5 Probabilidad Variables Aleatorias 1. Dado que es una probabilidad, solamente puede tomar valores entre cero y uno, es decir, ∀ x ∈ RX 0 ≤ FX( x0 ) ≤ 1 2. Para el mayor valor del rango de X, la función de distribución toma el valor de uno, FX( ∞ ) = 1 3. Para el menor valor del rango de X, la función de distribución toma el valor de cero, FX( - ∞ ) = 0 4. La función FX( x ) es una función no decreciente, escalonada si la variable es discreta o creciente si X es continua. 5. Permite calcular fácilmente la probabilidad de que X esté en el intervalo semi abierto (a, b] como P (a < X ≤ b ) = FX( b ) - FX( a ) Ejemplo 3.3.1.1 Sea X una variable aleatoria con función de probabilidad la que se muestra en la tabla. Construya la función de distribución de X, y utilícela para calcular la probabilidad de que X sea mayor que –1 y menor o igual que1.5 x fX(x) -5 0.2 -1 0.01 1 0.3 1.5 0.29 3 0.2 Resolución: FX( -5 )= P (X ≤ -5) = P( X = -5) = 0.2 FX( -1 )= P (X ≤ -1)= P( X = -5)+ P(X = -1)= 0.2 + 0.01 = 0.21 FX( 1 )= P (X ≤ 1)= P( X = -5) + P(X = -1) + P(X =1)= 0.2 + 0.01 + 0.3 = 0.51 FX( 1.5 )=P(X ≤ 1.5)=P(X = -5)+P(X = -1)+P(X =1)+P(X=1.5) = 0.2 + 0.01+ 0.3 + 0.29 = 0.8 FX( 3 ) = P(X ≤ 1.5)=P(X = -5)+P(X = -1)+P(X =1)+P(X=1.5)+P(X=3) = 0.2 + 0.01+ 0.3 + 0.29 + 0.2 = 1 M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 6 Probabilidad Variables Aleatorias Para mayor facilidad se puede mostrar la función de distribución en una tabla, junto con la función de probabilidad, x fX(x) FX(x) -5 0.2 0.2 -1 0.01 0.21 1 0.3 0.51 1.5 0.29 0.8 3 0.2 1 Por lo tanto, P(-1 < X ≤ 1.5 ) = FX(1.5) - FX(-1) = 0.8 – 0.21 = 0.59 Hagamos un ejemplo más. Ejemplo 3.3.1.2 La comisión por ventas que una empresa ofrece a sus agentes crece dependiendo de los rangos de ventas individuales, la tasa de crecimiento es una variable aleatoria X que tiene función de densidad ; 0 ≤ x ≤1 ⎧ cx ⎪ 1 f X ( x ) = ⎨ cx + ; 1 < x ≤ 2 2 ⎪ 0 ; en otro caso. ⎩ en donde c es una constante. Calcule la probabilidad de que para un agente en particular el crecimiento en sus comisiones esté entre 0.5 y 1.2 . M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 7 Probabilidad Variables Aleatorias Resolución Lo primero que debemos hacer es determinar el valor de la constante c de manera que la función fX(x) planteada sea realmente una función de densidad. La primera condición que debe cumplir la función es ser positiva para todo valor de x. Para ello, en esta función, basta con que c> 0. La segunda condición que debe cumplir es integrar uno. Veamos: 1 1 = ∫ cx dx + 0 1 ∫1 2 ⎡ cx 2 ⎤ ⎡ cx 2 x ⎤ 1⎞ + ⎥ = 4c ⎜ cx + ⎟ dx = ⎢ ⎥ +⎢ 2⎠ 2 ⎦1 ⎝ ⎣ 2 ⎦0 ⎣ 2 2⎛ ⇒ c= 1 4 por lo tanto, la función de densidad de la variable aleatoria X es ⎧1 ; 0 ≤ x ≤1 ⎪4 x ⎪ ⎪ ⎪1 1 ⎪ x + ; 1< x ≤ 2 f X (x) = ⎨ 4 2 ⎪ ⎪0 ; en otro caso. ⎪ ⎪ ⎪ ⎩ La gráfica de la función de densidad es la siguiente, Construyamos ahora la función de distribución de X: Si x < 1 M.en I, Isabel Patricia Aguilar Juárez Si 1 < x < 2 UNAM-Facultad de Ingeniería 8 Probabilidad Variables Aleatorias Si x < 1, FX(x) = Si 1 < x < 2 , xy ∫0 4 dy = FX(x) = x2 8 x x⎛ y 1⎞ 1 ⎡ y2 y ⎤ x2 x 1 ∫0 4dy + ∫1 ⎜⎝ 4 + 2 ⎟⎠ dy = 8 + ⎢⎣ 8 + 2 ⎥⎦ = 8 + 2 + 8 1 1y Por lo tanto, ; x<0 ⎧ 0 ⎪ 2 ⎪ x ; 0 ≤ x ≤1 ⎪ 8 ⎪ ⎪ 2 x 1 ⎪ x + + ; 1< x ≤ 2 ⎪ f X (x) = ⎨ 8 2 8 ⎪ ⎪ 1 ; x > 2. ⎪ ⎪ ⎪ ⎪ ⎪⎩ P(0.5 < X < 1.2) = FX(1.2) - FX(0.5) = (1.2 )2 8 1.2 1 (0.5 ) + − = 0.87375 2 8 8 2 + 3.4 PARÁMETROS DE LAS DISTRIBUCIONES DE VARIABLES ALEATORIAS. Con el fin de lograr una mejor descripción de una variable aleatoria es necesario utilizar características numéricas, las características numéricas de una variable aleatoria se pueden clasificar en: - Medidas de tendencia central Medidas de dispersión Parámetros de forma M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 9 Probabilidad Variables Aleatorias 3.4.1 MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central son importantes ya que serán utilizadas como valores representativos de dicha variable. Dependiendo de la naturaleza del experimento será más recomendable alguna de ellas. Las tres medidas de tendencia central más importantes son: 1) MODA: Es aquel valor en el rango de la variable aleatoria para el cual la función de probabilidad o de densidad, según sea el caso, alcanza su máximo. 2) MEDIANA: La mediana es el valor ~ x de la variable aleatoria para el cual la función de distribución vale 0.5. Desde luego, es el valor en la rango de la variable aleatoria que divide el rango en dos conjuntos con igual probabilidad; esto es, ~ x es tal que: F X (~ x ) = 0.5 3) VALOR ESPERADO (MEDIA): El valor esperado de una variable aleatoria, también conocido como media o esperanza matemática, se puede interpretar como el valor que en promedio tomaría una variable aleatoria en un número grande de repeticiones del experimento, aunque también se puede interpretar como el valor que cabe esperar que tome la variable aleatoria en la siguiente realización del experimento. El valor esperado de una variable aleatoria se define como sigue: a. Si X es discreta E ( X ) = µ = ∑ xf X ( x) ∀x b. Si X es continua: E( X ) = µ = ∞ ∫ xf X ( x)dx −∞ Ejemplo 3.4.1.1 Calcule el valor esperado de la variable aleatoria X con función de densidad: M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 10 Probabilidad Variables Aleatorias ⎧ 12 2 ⎪ 49 x ⎪⎪ 12 f X ( x) = ⎨ x 3 ⎪ 49 ⎪ 0 ⎪⎩ ; 0 ≤ x ≤1 ; 1≤ x ≤ 2 ; en otro caso Resolución: ∞ 1 2 2 ⎡ 12 5 ⎤ ⎡ 12 4 ⎤ 12 3 12 E ( X ) = ∫ xf X( x)dx = ∫ x dx + ∫ x 4 dx = ⎢ x ⎥ +⎢ x ⎥ 49 49 ⎣ 4(49) ⎦ 0 ⎣ 5(49) ⎦ 1 0 1 −∞ 387 = 245 387 E( X ) = µ = 245 1 Veamos qué pasa en el caso discreto. Ejemplo 3.4.1.2 Si la variable aleatoria X tiene la distribución que se muestra en la tabla. Calcule la media, mediana y moda de X. x fX(x) -5 0.05 3 0.13 4 0.22 8 0.07 10 0.33 12 0.2 10 0.33 0.8 12 0.2 1.0 Resolución: Construyamos primero la función de distribución de X x fX(x) FX(x) -5 0.05 0.05 3 0.13 0.18 4 0.22 0.4 8 0.07 0.47 La media µ es: E ( X ) = µ = −5(0.05) + 3(0.13) + 4(0.22) + 8(0.07) + 10(0.33) + 12(0.2) E ( X ) = µ = 7.28 La mediana ~ x es el valor para el cual FX( ~ x )=0.5 Como FX(8)=0.47 < 0.5 M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 11 Probabilidad Variables Aleatorias y FX(10)=0.8 > 0.5 Entonces ~ x = 10 Para obtener la moda, observemos que el máximo valor de fX(x) es 0.33 y se alcanza cuando x=10, entonces: moda = m0 = 10 3.4.1.1 VALOR ESPERADO Definición: Si g(X) es una función de la variable aleatoria X, se define el valor esperado de g(X) como: ⎧∑ g ( x) f X ( x) si ⎪ ∀x E[ g ( X )] = ⎨ ∞ ⎪⎩∫− ∞ g ( x) f X ( x)dx si X es discreta X es continua Vale la pena mencionar que el valor esperado es un operador lineal; es decir, tiene las siguientes propiedades: 1) Si c es una constante, E(c)=c 2) Si c es una constante, E(cX)=cE(X) 3) Si g(X) es una función de X y h(X) es otra función de la misma variable aleatoria X, entonces: E[g(X)+h(X)]=E[g(X)]+E[h(X)] 3.4.2 MEDIDAS DE DISPERSIÓN Las medidas de dispersión se pueden utilizar como herramientas para medir la validez de la media µ como representativa de la variable aleatoria X, ya que muestran qué tanto cercanos están, en promedio, los valores de X, de µ. Las principales medidas de dispersión se tratan a continuación. M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 12 Probabilidad Variables Aleatorias 1) VARIANZA Definición Si X es una variable aleatoria, se define su varianza como: Var(X)= σ2 = E[(X-µ)2] Por tanto, si X es discreta: Var ( X ) = σ 2 = ∑ ( x − µ ) 2 f X ( x) ∀x Si X es continua: ∞ Var ( X ) = σ 2 = ∫ ( x − µ ) 2 f X ( x)dx −∞ Pues bien, si se desarrolla el cuadrado de la definición de σ2, se obtiene una forma muchas veces más sencilla de calcular a la varianza. Var ( X ) = σ 2 = E[( x − µ ) 2 ] = E ( X 2 ) − µ 2 en donde: ⎧∑ x 2 f X ( x) si ⎪ ∀x 2 E[ X ] = ⎨ ∞ ⎪∫−∞ x 2 f X ( x)dx si ⎩ X es discreta X es continua y µ2 es el cuadrado de E(X). La varianza de una variable aleatoria tiene las siguientes propiedades: 1) Si c es una constante, Var(c)=0 2) Si c es una constante Var(cX)=c2Var(X) Sin embargo, aunque la varianza es una medida de dispersión, es difícil interpretarla ya que sus unidades son cuadráticas, por ser el promedio de valores elevado al cuadrado. Ésta dificultad se puede sortear tomando la raíz cuadrada de la varianza. 2) DESVIACIÓN ESTÁNDAR Definición Si X es una variable aleatoria se define su desviación estándar como la raíz cuadrada de la varianza; es decir: M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 13 Probabilidad Variables Aleatorias σ = Var (x) 3) COEFICIENTE DE VARIACIÓN Definición Sea X una variable aleatoria. Se define su coeficiente de variación como: C.V .( X ) = σ µ Mide la variación promedio de la variable aleatoria alrededor de la media µ, como una proporción de la misma µ. Por lo tanto, es una medida adimensional. Ejemplo 3.4.2.1 ¿Cuál es la variabilidad que tiene el número X de hijos varones en una familia de 3 hijos?. Resolución: Sea V la variable aleatoria que representa el número de hijos varones en una familia de 3 hijos. RX = {0,1,.2,3} La función de probabilidad de x es: x 0 fX(x) 1/8 1 3/8 2 3/8 3 1/8 ⎛ 1⎞ ⎛ 3⎞ ⎛ 3⎞ ⎛ 1⎞ 3 E(X)=µ= ∑ xf X ( x) = 0⎜ ⎟ + 1⎜ ⎟ + 2⎜ ⎟ + 3⎜ ⎟ = ⎝8⎠ ⎝8⎠ ⎝8⎠ ⎝8⎠ 2 ∀x Entonces; M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 14 Probabilidad Variables Aleatorias ⎛ 3⎞ Var ( X ) = E ( x 2 ) − µ 2 = ∑ x 2 f X ( x) − ⎜ ⎟ ⎝ 2⎠ ∀x 2 2 3 ⎛1⎞ ⎛ 3⎞ ⎛ 3⎞ ⎛1⎞ ⎛ 3⎞ = (0) 2 ⎜ ⎟ + (1) 2 ⎜ ⎟ + (2) 2 ⎜ ⎟ + (3) 2 ⎜ ⎟ − ⎜ ⎟ = 4 ⎝8⎠ ⎝8⎠ ⎝8⎠ ⎝8⎠ ⎝ 2⎠ 3 =σ 2 = 4 Por lo tanto, la desviación estándar es σ = σ 2 = Var ( X ) = 3 ; es decir, la 4 dispersión alrededor de la media es, en promedio, 3 / 2 hijos. Esto es: C.V .( X ) = 3/2 3 = 3/ 2 3 ¿Qué otras características tiene la distribución de la variable aleatoria X? ¿Es simétrica? Veamos algunos parámetros de forma. 3.4.3 PARÁMETROS DE FORMA 1) COEFICIENTE DE SESGO El coeficiente de sesgo es una medida del grado de asimetría de la distribución de la variable aleatoria X. Definición. Sea X es una variable aleatoria. Se define su coeficiente de sesgo como: a( X ) = E[( x − µ ) 3 ] σ3 El coeficiente de sesgo se compara contra el cero para decidir acerca de la asimetría de la distribución. M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 15 Probabilidad Variables Aleatorias La distribución es simétrica ⎧= 0 ⇒ ⎪ a ( x) = ⎨> 0 ⇒ La distribución tiene sesgo positivo ⎪< 0 ⇒ La distribución tiene sesgo negativo ⎩ Distribución simétrica Distribución con sesgo positivo Distribución con sesgo negativo 2) COEFICIENTE DE CURTOSIS El coeficiente de curtosis de una variable aleatoria X es una medida del grado de apuntamiento de la distribución. Definición. Si X es una variable aleatoria, se define su coeficiente de curtosis como: E[( x − µ ) 4 ] k(X ) = 4 σ El coeficiente de curtosis se compara contra el número 3 que es el coeficiente de curtosis de una distribución normal estándar. Si k(X) es mayor que 3 significa que la distribución es más alta que la normal estándar. Esto es: M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 16 Probabilidad Variables Aleatorias ⎧= 3 ⇒ La distribución es mesocúrtica ⎪ k ( x) = ⎨> 3 ⇒ La distribución es leptocúrtica ⎪< 3 ⇒ La distribución es platicúrtica ⎩ Distribución mesocúrtica Distribución leptocúrtica Distribución platicúrtica M.en I, Isabel Patricia Aguilar Juárez UNAM-Facultad de Ingeniería 17