Distribuciones Continuas Existen diversos problemas en los cuales la modelación a través de distribuciones discretas es insuficiente. Principalmente porque las distribuciones de probabilidad continuas permiten resolver problemas para los cuales los valores que puede tomar la variable aleatoria están en intervalos y no en conjuntos discretos. También para algunos cálculos que implican distribuciones discretas existe la posibilidad de aproximarlos utilizando distribuciones continuas lo que suele facilitar los cálculos y el análisis. Adicionalmente, en el estudio de las variables aleatorias continuas se pueden usar algunas de las ventajas que ofrecen las herramientas del cálculo diferencial e integral. La distribución Normal En general las distribuciones de probabilidad son herramientas muy necesarias en el estudio de problemas probabilísticos y estadísticos. Entre las distribuciones de probabilidad continuas, la distribución normal, es la más utilizada y la más importante. Muchas mediciones dentro de poblaciones siguen distribuciones normales y en casos donde poblaciones no distribuyen normalmente, es común que ciertos promedios y ciertos valores acumulados se distribuyan en forma normal, esta última observación se conoce como el teorema del límite central. En términos muy simples, una población sigue una distribución normal respecto a alguna medición cuando el grueso de los valores de la población se distribuyen cerca de la media y existe cierta simetría en la forma en que se distribuyen los datos alrededor de la media. En términos matemáticos la definición es la siguiente: Se puede demostrar que la media de esta distribución es y la desviación es . En la siguiente aplicaciones usted puede explorar la forma de la gráficas de distribuciones normales. Se puede variar la media y la desviación estándar para analizar distintos casos. Además la distribución de probabilidad acumulada es decir, P[X integral: FX(x) = P[X x] = x] se calcula por la e dt Para efectos operacionales, las distribuciones normales son difíciles pues los cálculos que deben hacerse son complejos. Entre las normales, la distribución más importante es la que se llama normal estándar, una normal cuya media es 0 y cuya desviación estándar es 1. De hecho en estas mismas notas veremos que toda probabilidad que implique la distribución normal puede reducirse a una en que se utilice la normal estándar. Y en este caso el cálculo de la distribución de probabilidad acumulada es, (x) = P[X x] = e dt. La última expresión es una variante de una función que se conoce como la función error erf(x), [1], y solo hay formas numéricas de aproximar sus valores [3,2]. Los valores de la función (x) se pueden obtener en tablas que aparecen en libros de probabilidades o bien utilizando la herramienta provista en estas notas. Algunas Propiedades Importantes Como la función de distribución de probabilidad es simétrica, y además el área total acumulada, sobre toda la recta real es 1, entonces para cualquier x real se obtiene la siguiente propiedad: (x) + (5.1) (- x) = 1, Para finalizar este corto recorrido por la distribución normal invitamos al lector a seguir cuidadosamente las siguientes líneas. Si X sigue una distribución normal con parámetros aplicamos el cambio de variable P[X = y entonces si a la integral en x] = e dt, obtenemos P[X x] = e dt = ( ). Ejemplo 26 Las notas finales de un curso se distribuyen en forma normal con una media de 75 y una desviación estándar de 10. Si la nota de aprobación es de 70 que porcentaje de los estudiantes aprobarán el curso. Solución: Primero se debe notar que la afirmación de que las notas siguen una distribución normal debe entenderse en el sentido aproximado. El porcentaje solicitado puede obtenerse al encontrar el valor P[X 70]. Dadas las propiedades de las distribuciones de probabilidad se tiene que P[X 70] = 1 - P[X 70] = 1 - ( ) = 1 - 0.6915 = 0.3085. Ejemplo 27 La distribución de peso de ciertos bultos de papel para reciclaje es normal con media de 50 kilos y desviación estándar de 10 kilos. La persona que transporta los paquetes cobra 100 colones por bulto pero desea imponer un peso máximo después del cual cobrar un recargo. Cuál debería ser ese peso para que los bultos tengan una probabilidad inferior al 10% de pagar tal recargo. Solución Hay dos aspectos importantes que se deben notar; el primero de ellos es que si X es la variable aleatoria para el peso de cada paquete lo que se debe encontrar es un valor r tal que: P[X r] > 0.1, lo que se reduce a encontrar un r que cumpla con: P[X r] 0.9, El problema es inverso en el sentido de que no se busca una probabilidad, sino un valor que permita obtener cierta probabilidad. El segundo aspecto que debe tenerse en cuenta es que para poder utilizar las barras de cálculo de que se dispone en estas notas o las tablas, la distribución de normalizarse en el sentido de 18. La siguiente herramienta permite resolver el problema indicado, a saber si se tiene una probabilidad p encontrar el valor r tal que P[X r] = p. Uniendo ese par de observaciones se debe resolver: P[ ] 0.9. Utilizando en barra de asistencia la herramienta normal inversa se obtiene la ecuación: = 1.286, de donde r = 62.86. Las distribuciones Gamma Muchas veces, aún cuando una variable aleatoria no siga una distribución normal es posible que su comportamiento pueda ser modelado con distribuciones que siguen comportamientos similares a una normal pero de manera sesgada. Antes de poder estudiar este tipo de distribuciones se hace necesario definir una función sumamente importante en el estudio de diversos problemas en matemática. Por Ejemplo: Otra propiedad importante se obtiene de aplicar a dx y u = e-x, para obtener: ( +1) las partes dv=x Con un poco de paciencia y regla de L'Hopital se puede demostrar que el primer límite en la última expresión es 0 mientras que la segunda integral es ( ). Con esto la función gamma cumple con la propiedad de allí si n es entero (n) = (n - 1)!. ( + 1) = ( ) ( ) y También, usando algunos argumentos de cálculo en varias variables se puede calcular que ( )= . Aparte de un reducido número de argumentos el cálculo de valores de la función gamma debe hacerse utilizando métodos numéricos [3,1]. Para hacer estos cálculos se provee una herramienta, que ha sido programada acorde con [9]. El parámetro puede verse como un parámetro de forma pues su modificación altera la forma de la distribución mientras que de escala. funciona como un parámetro Invitamos al lector que revise la versión electrónica de estas notas a utilizar el graficador para distribuciones gamma y verificar algunas de las formas variando los parámetros. Si en una distribución gamma estándar. = 1 se dice que es una distribución gamma Para una variable aleatoria continua, X, con distribución de probabilidad gamma de parámetros y , aplicando un cambio de variable u = y / tiene que la función de distribución de probabilidad para X cumple: P([X (5.2) x]) = dy = du = se F(x / ; ) Esta última función se conoce como la función gamma incompleta. E[X] = Var[X] = Ejemplo 28 Suponga que el tiempo de reacción para iniciar el frenado ante una emergencia, en la población de cierta edad sigue una distribución Gamma con media de .5 segundo y varianza de .1 segundo cuadrado. Solución Dado que la esperanza es .5 y la varianza .1 se obtiene que = 5/2 y = 1/5 En ese caso, si quisiéramos calcular la probabilidad de que la respuesta de frenado en una situación de emergencia sea inferior a .72 segundos usando la expresión (5.2) se tiene que P[X 7.2] = F(.72/.2, 2.5) = F(3.6, 2.5) Ejemplo 29 Suponga que el tiempo utilizado por una persona preparando un tipo particular de informe sigue una distribución gamma con media de 20 minutos y varianza 80 minutos cuadrados. Aplicando el teorema(19) se obtiene que =5y =4 Para determinar la probabilidad de que una persona elegida al azar tarde menos de 24 minutos preparando el informe debe resolverse P[X 24] = F(24/4, 5) = F(6, 5) = 0.715 La distribución de probabilidad exponencial En realidad la distribución exponencial es un caso especial de la distribución gamma. Ya se ha abordado antes algunos aspectos relativos a la distribución exponencial. E[X] = Var[X] = La primera afirmación en este teorema ya ha sido demostrada en la sección 3.3 y la segunda parte se deja como ejercicio para el lector.