DISTRIBUCIONES DE PROBABILIDAD: UNIFORME y NORMAL DISTRIBUCIÓN UNIFORME Una de las distribuciones continuas mas simples es la distribución uniforme continua. Esta se caracteriza por una función de densidad que es “plana”, por lo cual la probabilidad es uniforme en un intervalo digamos [𝑎 , 𝑏]. El estudio de esta distribución es apropiado para comenzar el estudio de las distribuciones continuas. PRO DISTRIBUCIÓN UNIFORME La variable aleatoria uniforme se emplea para modelar el comportamiento de una variable aleatoria continua cuyos valores estén uniforme o exactamente distribuidos en un intervalo dado PRO Definición La función de densidad de la variable aleatoria uniforme continua 𝑋 en el intervalo [𝑎 , 𝑏] es 1 , para 𝑎 ≤ 𝑥 ≤ 𝑏, 𝑓 𝑥 = 𝑏−𝑎 0, d. o. f PRO OBS La función de densidad forma un rectángulo con base 𝑏 – 𝑎 y 1 altura constante . 𝑏−𝑎 La distribución uniforme a me nudo se conoce como distribución rectangular. El intervalo puede ser cerrado [𝑎, 𝑏] o también puede ser abierto (𝑎, 𝑏). PRO OBS La función de densidad de probabilidad f(x) sería “plana” como se muestra en la figura. PRO EJEMPLO Suponga que el tiempo máximo que se puede reservar una sala de conferencias grande de cierta empresa son cuatro horas. Con mucha frecuencia tienen conferencias extensas y breves. Si suponemos que la duración 𝑋 de una conferencia tiene una distribución uniforme en el intervalo [0, 4]. i. ¿Cuál es la función de densidad de probabilidad? ii. ¿Cuál es la probabilidad de que cualquier conferencia determinada dure al menos 3 horas? PRO SOL i. En este caso, el intervalo [𝑎, 𝑏] sería [0 , 4], es decir, 𝑎 = 0 y 𝑏 = 4. De esto, la función de densidad para 𝑋 es 1 , para 0 ≤ 𝑥 ≤ 4, 𝑓 𝑥 = 4 0, d. o. f ii. 4 𝑃 𝑋≥3 = 3 1 1 𝑑𝑥 = 𝑥 4 4 4 3 1 = 4 PRO EJEMPLO Suponga que el error 𝑋 introducido al redondear una observación a la pulgada más cercana tiene una distribución uniforme en el intervalo de -0.5 a 0.5. ¿Cuál es la probabilidad de que el error de redondeo sea menor a .2 en magnitud? PRO SOL En este caso, el intervalo [𝑎, 𝑏] sería [−0.5 , 0.5], es decir, 𝑎 = −0.5 y 𝑏 = 0.5. De esto, la función de densidad para 𝑋 es 1, para − 0.5 ≤ 𝑥 ≤ 0.5, 𝑓 𝑥 = 0, d. o. f Buscamos 𝑃(−0.2 < 𝑥 < 0.2), así, 0.2 𝑃 −0.2 < 𝑥 < 0.2 = 𝑑𝑥 = 𝑥 −0.2 PRO 0.2 −0.2 = 0.4 Teorema Sea 𝑋 una variable aleatoria uniformemente distribuida en el intervalo 𝑎, 𝑏 , entonces, la esperanza E(𝑋) y la varianza Var(𝑋) de 𝑋 son 𝑎+𝑏 E 𝑋 = 2 𝑏−𝑎 Var(𝑋) = 12 PRO 2 EJEMPLO Una distribución uniforme se define en el intervalo de 2 a 5. a) ¿Cuáles son los valores de a y b? b) ¿Cuál es la media de esta distribución uniforme? c) ¿Cuál es la desviación estándar? d) Demuestre que el área total es de 1.00. e) Calcule la probabilidad de un valor mayor que 2.6. f ) Calcule la probabilidad de un valor entre 2.9 y 3.7. PRO SOL a) a=2 y b=5 b) 𝑬 𝑿 = 𝒂+𝒃 𝟐 c) 𝐕𝐚𝐫 𝑿 = = 𝟐+𝟓 𝟐 𝒃−𝒂 𝟐 𝟏𝟐 = ⇒𝑬 𝑿 = 𝟓−𝟐 𝟐 𝟏𝟐 𝝈= = 𝟕 𝟐 𝟗 𝟏𝟐 ⇒ 𝐕𝐚𝐫 𝑿 = ⇒ 𝟑 𝟑 ⇒𝝈= 𝟒 𝟐 PRO 𝟑 𝟒 SOL d) 𝟓 𝟐 𝟏 𝟏 𝒅𝒙 = 𝒙 𝟑 𝟑 e) 𝟓 𝟐 𝟏 𝟏 = 𝟓−𝟐 = ∗𝟑=𝟏 𝟑 𝟑 𝟓 𝟏 𝟏 𝑷 𝑿 > 𝟐. 𝟔 = 𝒅𝒙 = 𝒙 𝟑 𝟐.𝟔 𝟑 𝟓 𝟐.𝟔 𝟏 = 𝟓 − 𝟐. 𝟔 = 𝟎. 𝟖 𝟑 f) 𝑷 𝟐. 𝟗 < 𝑿 < 𝟑. 𝟕 = 𝟑.𝟕 𝟏 𝒅𝒙 𝟐.𝟗 𝟑 = PRO 𝟏 𝟑.𝟕 𝒙 𝟐.𝟗 𝟑 = 𝟏 𝟑 𝟎. 𝟖 = 𝟎. 𝟐𝟔 EJERCICIO La UNAM proporciona servicio de transporte de autobús a los estudiantes mientras se encuentran en el recinto. Un autobús llega de lunes a viernes a la parada de CU cada 30 minutos, entre las 6 am y las 11 pm. Los estudiantes llegan a la parada en tiempos aleatorios. El tiempo que espera un estudiante tiene una distribución uniforme de 0 a 30 minutos. 1. Trace una gráfica de la distribución. 2. Demuestre que el área de esta distribución uniforme es de 1. 3. ¿Cuánto tiempo esperará el autobús “normalmente” un estudiante? Es decir, ¿cuál es la media del tiempo de espera? ¿Cuál es la desviación estándar de los tiempos de espera? 4. ¿Cuál es la probabilidad de que un estudiante espere más de 25 minutos? 5. ¿Cuál es la probabilidad de que un estudiante espere entre 10 y 20 minutos? PRO EJERCICIO Una distribución uniforme se define en el intervalo de 6 a 10. a) ¿Cuáles son los valores de a y de b? b) ¿Cuál es la media de esta distribución uniforme? c) ¿Cuál es la desviación estándar? d) Demuestre que el área total es de 1.00. e) Calcule la probabilidad de un valor mayor que 7. f ) Calcule la probabilidad de un valor entre 7 y 9. PRO EJERCICIO El precio de cierre de una acción común de The Coca-cola company Inc., está uniformemente distribuido entre 25 y 35 USD por acción. ¿Cuál es la probabilidad de que el precio de la acción sea: a) mayor a 29 USD? b) menor o igual a 30 USD? PRO EJERCICIO De acuerdo con el Insurance Institute of America, una familia de cuatro miembros gasta entre 40 y 380 USD anuales en toda clase de seguros. Suponga que el dinero que se gasta tiene una distribución uniforme entre estas cantidades. a) ¿Cuál es la media de la suma que se gasta en seguros? b) ¿Cuál es la desviación estándar de la suma que se gasta? c) Si elige una familia al azar, ¿cuál es la probabilidad de que gaste menos de 200 USD anuales en seguros? d) ¿Cuál es la probabilidad de que una familia gaste más de 300 USD anuales? PRO Distribución normal La distribución normal (también conocida como distribución de Gauss) es la distribución más utilizada en la estadística. Constituye un buen modelo para muchas, aunque no para todas las poblaciones continuas. La distribución normal es continua en vez de discreta. La media de una variable aleatoria normal puede tener cualquier valor en los números reales La varianza cualquier valor positivo. PRO Distribución normal La función de densidad de probabilidad de una variable aleatoria normal con media 𝝁 y varianza 𝝈𝟐 está dada por: 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 𝑥−𝜇 2 /2𝜎 2 , 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < ∞ Para indicar que la variable aleatoria 𝑋 sigue una distribución normal con media 𝜇 y varianza 𝜎 2 , se utiliza la notación 𝑋 ~ 𝑁(𝜇, 𝜎). PRO Distribución normal La siguiente figura presenta una gráfica de la función de densidad de probabilidad normal con media 𝜇 y varianza 𝜎 2 . Observe que esta es simétrica alrededor de 𝜇. PRO Distribución normal Tpoblación normal se caracteriza por Aproximadamente 68% de la población se encuentra en el intervalo 𝜇 ± 𝜎. Aproximadamente 95% de la población se encuentra en el intervalo 𝜇 ± 2𝜎. Aproximadamente 99.7% de la población se encuentra en el intervalo 𝜇 ± 3𝜎. PRO Distribución normal La probabilidad de que la variable aleatoria 𝑋 tome un valor entre 𝑥 = 𝑥1 y 𝑥 = 𝑥2 se calcula de la forma siguiente 𝑃[𝑥1 < 𝑋 < 𝑥2 ] = 1 𝜎 2𝜋 PRO 𝑥2 𝑒 𝑥1 − 𝑥−𝜇 2 /2𝜎 2 𝑑𝑥 Distribución normal La probabilidad anterior es representada por el área de la región sombreada. PRO Distribución normal Para resolver el problema de calcular las integrales de funciones de densidad normal, se utilizarán tablas. Sin embargo, seria imposible establecer tablas separadas para cada valor de μ y σ. En lugar de esto, transformaremos cualquier variable aleatoria normal 𝑋 a una variable aleatoria normal 𝑍 con media 0 y varianza 1. PRO Distribución normal Lo anterior se realizará mediante la transformación: 𝑋−𝜇 𝑍= 𝜎 Así, cada que 𝑋 tome un valor 𝑥, el valor correspondiente de 𝑍 es dado por 𝑧 = 𝑥–𝜇 . 𝜎 PRO Distribución normal Así, cada que X tome un valor x, el valor correspondiente de Z es dado por 𝑧 = 𝑥–𝜇 . 𝜎 Por lo tanto, si 𝑋 está entre los valores 𝑥 = 𝑥1 y 𝑥 = 𝑥2 , la variable aleatoria 𝑍 estará entre los valores 𝑧1 = PRO 𝑥1 – 𝜇 𝜎 y 𝑧2 = 𝑥2 – 𝜇 . 𝜎 Distribución normal En consecuencia, podemos escribir PRO Distribución normal Como todos los valores de 𝑋 que caen entre 𝑥1 y 𝑥2 , 𝑍 tienen valores correspondientes entre 𝑧1 y 𝑧2 , el área bajo la curva 𝑋 entre las ordenadas 𝑥 = 𝑥1 𝑦 𝑥 = 𝑥2 de la figura es igual al área bajo la curva 𝑍 entre las ordenadas transformadas 𝑧 = 𝑧1 𝑦 𝑧 = 𝑧2 . PRO Distribución normal Estándar Definición. La distribución normal estándar es una distribución normal con media 0 y varianza 1, su función de densidad es: 𝑓 𝑥 = 1 𝜎 2𝜋 𝑥2 𝑒− 2 , −∞ < 𝑥 < ∞ Con lo anterior (estandarizar) hemos reducido el numero requerido de tablas de áreas de curva normal a una, la de la distribución normal estándar. PRO Uso de tablas Las tablas normales estándar indica el área bajo la curva normal estándar que corresponde a P(Z < z) para valores de z que van de –3.6 a 3.6. PRO Uso de tablas: ejemplos Para ilustrar el uso de esta tabla calculemos la probabilidad de que Z sea menor que 1.74, es decir, P[Z<1.74]. PRO SOL Primero, localizamos un valor de z igual a 1.7 en la columna izquierda, después nos movemos a lo largo del renglón hasta la columna bajo 0.04, donde leemos 0.9591. Por lo tanto, 𝑃(𝑍 < 1.74) = 0.9591 PRO Uso de tablas: ejemplos Para calcular un valor 𝑧 que corresponda a una probabilidad dada se invierte el proceso. Determinar el valor de 𝑧 tal que 𝑃[𝑍 < 𝑧] = 0.2148. PRO SOL En este caso, buscamos dentro de las tablas el valor de la probabilidad 0.2148. En este caso, observamos que 𝑧 = −0.79. Por lo tanto, 𝑃(𝑍 < −0.79) = 0.2148 PRO EJEMPLOS Calcular: P(Z > 1.38) SOL. P Z > 1.38 = 1 − P Z ≤ 1.38 = 1 − P(Z < 1.38) = 1 − 0.9162 = 0.0838 PRO EJEMPLO Calcular: P(0.71 < Z < 1.28) SOL. P 0.71 < Z < 1.28 = F 1.28 − F 0.71 = P Z < 1.28 − P Z < 0.71 = 0.8997 − 0.7611 = .1386 ⇒ P 0.71 < Z < 1.28 = 0.1386 PRO EJEMPLO Sea Z una distribución normal estándar, calcule el valor de 𝑘 tal que 𝑃 (𝑍 > 𝑘) = 0.3015, SOL. 0.3015 = 𝑃 𝑍 > 𝑘 = 1 − 𝑃 𝑍 ≤ 𝑘 ⇒ 𝑃 𝑍 ≤ 𝑘 = 1 − 0.3015 𝑃 𝑍 ≤ 𝑘 = 0.6985 ⇒ 𝑘 = 0.52 PRO Sea Z una distribución normal estándar, calcule el valor de 𝑘 tal que EJEMPLO 𝑃 (𝑘 < 𝑍 < −0.18) = 0.4197. SOL. 𝑃 𝑘 < 𝑍 < −0.18 = 0.4197 ⇒ 𝑃 𝑍 < −0.18 − 𝑃(𝑍 < 𝑘) = 0.4197 𝑃 𝑍 < 𝑘 = 0.4281 − 0.4197 ⇒ 𝑃(𝑍 < 𝑘) = 0.0084 ⇒ 𝑘 = −2.39 PRO EJERCICIOS a. Determine el área debajo de la curva normal a la izquierda de 𝑧 = 0.47. b. Determine el área debajo de la curva normal y a la derecha de 𝑧 = 1.38. c. Determine el área debajo de la curva normal entre 𝑧 = 0.71 y 𝑧 = 1.28. d. En cada caso, determinar el valor de k, tal que se cumpla lo siguiente • 𝑃 𝑍 < 𝑘 = 0.75; • 𝑃 𝑍 ≥ 𝑘 = 0.25; • 𝑃(𝑍 < 𝑘) = 0.5. PRO EJERCICIO Considere una variable aleatoria normal estándar 𝑍 ∼ 𝑁(0,1). Use la tabla para llenar las probabilidades en la tabla siguiente (la tercera probabilidad ya está calculada). PRO EJEMPLOS Suponga que 𝑋 que tiene una distribución normal con μ = 50 y σ = 10, calcule la probabilidad de que 𝑋 tome un valor entre 45 y 62. SOL. En este caso, 𝑋 ∼ 𝑁 52, 102 , y nos interesa 𝑃(45 < 𝑋 < 62) PRO La probabilidad previa, se puede calcular de forma equivalente utilizando que: 45 − 50 𝑋 − 50 62 − 10 𝑃 45 < 𝑋 < 62 ⟺ 𝑃 < < 10 10 10 (NOTA: la expresión previa se obtuvo restando 50 en los tres lados de la desigualdad y dividiendo a cada lado entre 10, según las propiedades de orden, el sentido del signo no se altera) De acuerdo a la diapositiva 26, 𝑧1 = 45−50 10 = 𝑋 − 50 𝑍= ∼ 𝑁(0,1) 10 5 − 10 = −0.5; PRO 𝑧2 = 62−50 10 = 12 10 = 1.2 Así, 𝑃 45 < 𝑋 < 62 ⟺ 𝑃 −0.5 < 𝑍 < 1.2 ⇒ 𝑃 45 < 𝑋 < 62 = 𝑃 𝑍 < 1.2 − 𝑃 𝑍 > −0.5 = 𝑃 𝑍 < 1.2 − 1 − 𝑃 𝑍 ≤ −0.5 Utilizando las tablas, resulta que 𝑃 𝑍 < 1.2 = 0.8849 y 𝑃 𝑍 ≤ −0.5 = 0.3085 De lo anterior, tenemos que 𝑃 45 < 𝑋 < 62 = 0.8849 − 1 + .3085 = 0.1934 ⇒ 𝑃 45 < 𝑋 < 62 = 0.1934 PRO EJEMPLO Sea 𝑋 una variable aleatoria normal con μ = 300 y σ = 50, calcule la probabilidad de que 𝑋 tome un valor mayor que 362. Sol. Nuevamente, 𝑋 ∼ 𝑁(300,502 ). Buscamos 𝑃(𝑋 > 362) Utilizando el resultado de la diapositiva 26, la probabilidad anterior, es equivalente a 𝑋 − 300 362 − 300 𝑃(𝑋 > 362) ⇔ 𝑃 > 50 50 PRO 𝑋 − 300 362 − 300 𝑃(𝑋 > 362) ⇔ 𝑃 > 50 50 ⇔ 𝑃 𝑍 > 1.24 Donde, 𝑋 − 300 𝑍= 50 Así, utilizando propiedades de la probabilidad y las tablas, tenemos que: 𝑃 𝑋 > 362 ⇔ 𝑃 𝑍 > 1.24 = 1 − 𝑃(𝑍 ≤ 1.24) = 1 − 0.8925 ⇒ 𝑃 𝑋 > 362 = 1075 PRO EJEMPLOS Los ingresos semanales de los preventas de Coca-Cola se rigen por una distribución normal con una media de $1 000 y una desviación estándar de $100. ¿Cuál es el valor z del ingreso X de un supervisor que percibe $1 100 semanales? ¿Y de un supervisor que gana $900 semanales? SOL. Para el preventa que percibe 1100, tenemos que 1100 − 1000 𝑧= ⇒𝑧=1 100 Para el preventa que percibe 900, tenemos que 900 − 1000 𝑧= ⇒ 𝑧 = −1 100 PRO Discusión El valor 𝑧 = 1 indica que un ingreso semanal de $1 100 está a una desviación estándar por encima de la media, y un valor 𝑧 = – 1 muestra que un ingreso de $900 está a una desviación estándar por debajo de la media. Observe que ambos ingresos ($1 100 y $900) se encuentran a la misma distancia ($100) de la media. PRO EJERCICIOS PRO 1. Sea 𝑋 una distribución normal con μ = 40 y σ = 6, calcule el valor de 𝑥 tal que a. 45% del área a la izquierda, b. 14% del área a la derecha. 2. Los tiempos de vida de los focos tipo LED de cierta marca se distribuyen normalmente con media de 50 quincenas y desviación estándar de cinco quincenas. Determine la probabilidad de que se elija aleatoriamente un foco de estos que dure entre 42 y 52 QUINCENAS. PRO 3. El departamento de carnes en un supermercado local, prepara sus paquetes de 1kg de carne molida, para que haya una variedad de pesos, algunos ligeramente más y otros ligeramente menos de 1kg. Suponga que los pesos de estos paquetes de 1kg siguen una distribuidos normal con una media de 1kg y una desviación estándar de .15kg . a. ¿Qué proporción de los paquetes pesará más de un kilogramo? b. ¿Qué proporción de los paquetes pesará entre .95 y 1.05 kilogramos? c. ¿Cuál es la probabilidad de que un paquete de carne molida seleccionado al azar pese menos de .80 kilogramos? d. ¿Sería poco común hallar un paquete de carne molida que pese 1.45kg? PRO 4. Un experimentador publicado en Annals of Botany investigó si los diámetros de tallos del girasol dicotiledónea cambiaría, dependiendo de si la planta fue dejada para balancearse libremente en el viento o estaba artificialmente sostenida. Suponga que los diámetros de tallos no soportados en la base, de una especie particular de girasol, tienen una distribución normal con un diámetro promedio de 35 milímetros (mm) y una desviación estándar de 3 mm. a. ¿Cuál es la probabilidad de que una planta de girasol tenga un diámetro de base de más de 40 mm? b. Si dos plantas de girasol se seleccionan al azar, ¿cuál es la probabilidad de que ambas plantas tengan un diámetro de base de más de 40 mm? c. ¿Dentro de qué límites esperaría usted que se encuentren los diámetros de base, con probabilidad .95? PRO 5. Para un auto que corre a 30 millas por hora (mph), la distancia necesaria de frenado hasta detenerse por completo está normalmente distribuida con media de 50 pies y desviación estándar de 8 pies. Suponga que usted está viajando a 30 mph en una zona residencial y un auto se mueve en forma abrupta en el camino de usted, a una distancia de 60 pies. a. Si usted aplica los frenos, ¿cuál es la probabilidad de que frene hasta detenerse en no más de 40 pies o menos? ¿Y en no más de 50 pies o menos? b. Si la única forma de evitar una colisión es frenar hasta detenerse por completo, ¿cuál es la probabilidad de que evite la colisión? PRO 6. Suponga que los números de un tipo particular de bacterias, en muestras de 1 mililitro (ml) de agua potable, tienden a estar normalmente distribuidos en forma aproximada con media de 85 y desviación estándar de 9. ¿Cuál es la probabilidad de que una muestra determinada de 1 ml contenga más de 100 bacterias? 7. Una variable aleatoria normal 𝑋 tiene una media 𝜇 desconocida y desviación estándar 𝜎 = 2. Si la probabilidad que 𝑋 exceda a 7.5 es .8023, encuentre 𝜇. 8. Una variable aleatoria normal 𝑋 tiene media de 35 y desviación estándar 10. Encuentre un valor de x que tenga área .01 a su derecha PRO 9. De acuerdo con el Internal Revenue Service (IRS) el reembolso medio de impuestos en 2007 fue de $2 708. Suponga que la desviación estándar es de $650 y que las sumas devueltas tienen una distribución normal. a) ¿Qué porcentajes de reembolsos son superiores a $3 000? b) ¿Qué porcentajes de reembolsos son superiores a $3 000 e inferiores a $3 500? c) ¿Qué porcentajes de reembolsos son superiores a $2 500 e inferiores a $3 500? 10. El fabricante de una impresora láser informa que la cantidad media de páginas que imprime un cartucho antes de que deba ser reemplazado es de 12 200. La distribución de páginas impresas por cartucho se aproxima a la distribución de probabilidad normal, y la desviación estándar es de 820 páginas. El fabricante desea proporcionar lineamientos a los posibles clientes sobre el tiempo que deben esperar que les dure un cartucho. ¿Cuántas páginas debe indicar el fabricante por cartucho si desea tener 99% de certeza en todo momento? PRO