Trabajo No 1. Simulación Estadı́stica Febrero, sem 01/08 1. Problemas del Capı́tulo 4 1. Se lanza un dado de seis caras. Y luego se lanza tantas veces como haya mostrado el primer lanzamiento. Se suman los resultados de estos lanzamientos. Defina una variable aleatoria que modele este experimento. a) Defina un algoritmo para simularla, y prográmelo. Añada el programa. b) Estime la media y la varianza de esta variable con base en simulaciones de tamaños 100, 1000, 10000. c) Encuentre la esperanza y la varianza teóricos de esta variable. Compare con los valores simulados respectivos. d ) Añada el histograma del caso 10000. 2. (Problema No 10, pag. 59). La función de masa de probabilidad binomial negativa con parámetros (r,p) es (j − 1)! pj = pr (1 − p)j−r , j ≥ r (j − r)!(r − 1)! a) Por medio de la relación entre las variables binomial negativa y geométrica y los resultados vistos sobre la geométrica, obtenga un algoritmo de simulación de esta distribución. Prográmelo e incluya el programa. Muestre un histograma para una simulación de 1000 datos. b) Verifique la relación pj+1 = j(1 − p)pj /(j + 1 − r) y utilı́cela para dar otro algoritmo que genere variables aleatorias binomiales negativas. Prográmelo e incluya el programa. Muestre un histograma para una simulación de 1000 datos. 3. (Problema No 15, pag. 60). Suponga que la variable aleatoria X puede tomar cualquiera de los valores 1,2,...,10 con probabilidades respectivas 0.06, 0.06, 0.06, 0.06, 0.06, 0.15, 0.13, 0.14, 0.15, 0.13. Utilice el método de composición para dar un algoritmo que genere el valor de X. Prográmelo e incluya el programa. Incluya una tabla de frecuencias de los valores 1,2,...,10 para una simulación de 1000 datos. 4. (Problema No 16, pag. 60). Defina un algorimo para simular una variable X con función de densidad dada por: 1 j+1 1 1 P (X = j) = + 2j−1 3−j , j = 1, 2, . . . 2 2 Explique claramente el algoritmo. Incluya el programa e incluya un histograma para una simulación de 1000 datos. 5. Suponga una variable aleatoria X discreta con valores en {1, 2, . . .}, con tasas discretas de riesgo dadas por λn = 1 − e−an , n = 1, 2, . . ., donde a > 0 es un parámetro. a) Encuentre pn = P (X = n).( Nota: use la identidad Pn j=1 j = n(n + 1)/2 ). b) Escriba un programa en R ó Matlab para simulación de 1000 datos de la variable X por el método de tasas discretas de riesgo, asumiendo a = 2. c) Denote por γ2(a) la curtosis de X para un valor de a. Evalúe la curtosis aproximadamente mediante simulación para dos valores de a tales que a1 < a2 . Entonces, se cumple γ2(a1) < γ2(a2)?. Se cumple la desigualdad contraria?. Qué conclusión se puede dar?. 6. Problema No 12 del capı́tulo 4, pag. 59. Dé dos métodos para generar una variable aleatoria X discreta, tal que e−λ λi /i! P (X = i) = Pk , i = 0, 1, . . ., k −λ λj /j! j=0 e donde k > 1 es un entero dado. Obsérvese que esta distribución es una Poisson truncada en k. Además, puede cancelarse el factor e−λ en la expresión anterior para la densidad. 2. Problemas del Capı́tulo 5 1. (Problemas No 7, pag. 82). Suponga que es fácil generar variables aleatorias a partir de las distribuciones Fi , i = 1, 2, . . ., n. Cómo podrı́amos generar una variable aleatoria con Pn la distribución F (x) = j=1 pi Fi (x), donde pi , i = 1, 2, . . . , n son números no-negativos cuya suma es 1?. Describa el algoritmo. Aplı́quelo a un caso concreto de n distribuciones Exponenciales con parámetros diferentes. Escoja el n y los parámetros, reporte el programa y los resultados de 1000 simulaciones, con histograma. 2. Dé un método para generar una variable aleatoria X con función de distribución F (x) = R ∞ y −y 0 x e dy, 0 ≤ x ≤ 1. Sugerencia: Aplique el método de composición del ejercicio 7, pero en lugar de una suma use una integral. Concretamente, suponga que X|Y = y tiene función de distribución dada por P (X ≤ x|Y = y) = xy , 0 ≤ x ≤ 1, y Y ∼ Exp(1). Reporte el programa y los resultados de 1000 simulaciones, con el histograma. 3. Si Y |X ∼ Exp(2 + X) y X ∼ U (2, 4), encuentre: 2 a) E(Y ), V ar(Y ). b) Encuentre la densidad de Y . c) Dé un algoritmo para simular un valor de la variable Y . Con base en este algoritmo escriba un programa que simule 10000 valores de Y . d ) Reporte un histograma con 50 clases. e) Calcule la media y la varianza de Y con base en los datos simulados y compare con los resultados teóricos. Comente el resultado. 4. Genere 1000 datos de una mezcla, tal que la densidad de la misma es f (x) = pf1 (x) + (1 − p)f2(x), donde p ∈ (0, 1) es la proporción de datos que provienen de la densidad f1 (x) y 1 − p la proporción de los que provienen de f2 (x), y fi (x), i = 1, 2 son densidades N (0, σi2), i = 1, 2, con σ1 = 2, σ2 = 4. Para los dos casos p = 0.7 y 0.8 resolver lo siguiente: a) Calcule media, desviación estándar, asimetrı́a y curtosis. b) Grafique un diagrama de cajas para cada caso. c) Grafique un histograma con la densidad de una normal con la misma media y varianza de la mezcla. d ) Qué puede concluı́rse de los tres resultados anteriores?. 5. Este punto es sobre la distribución Birnbaum-Saunders. a) Investigar (por ejemplo, en www.en.wikipedia.org ) la definición y principales aplicaciones de la distribución Birnbaum-Saunders. b) Investigue los comandos para simular la distribución B-S en Matlab ó en R. Nota: en R existe una librerı́a especial para la distribución B-S. c) Genere 1000 datos de una distribución B-S escogiendo los parámetros de tal forma que la densidad sea unimodal. d ) Reporte el histograma y estadı́sticas básicas. 6. Suponga una variable X ∼ Gamma(a, b) con b > 0 y a > 0. a) Escriba un programa en R ó Matlab para simulación de 1000 datos de X, para a > 1, con base en el siguiente algoritmo. 1) Dado a, calcule k = bac, la parte entera de a y p = a − bac = a − k. Note que k = 1, 2, . . ., p ∈ (0, 1). 2) Genere k variables i.i.d. Exponenciales(1), Xj ∼ Exp(1), y forme la suma, S = Pk j=1 Xj . 3) Genere una variable Y ∼ Gamma(p, 1), con el algoritmo de Ahrens-Dieter. 3 4) Forme X = β(S + Y ). 5) Repita los pasos 1)-4) 1000 veces. b) Escoja un valor para los parámetros a > 1, b > 0. Confirme que el programa funciona correctamente calculando media, desviación estándar, asimetrı́a y curtosis estimados, con base en la muestra simulada y comparando el resultado con los correspondientes valores teóricos. 7. Suponga una variable aleatoria continua X con valores en [0, ∞), y con función de densidad de probabilidad dada por f (x) = ax ahe−ah(x−h) I(x < h) + I(x ≥ h), 1 + 12 ah2 1 + 12 ah2 (1) para a, h > 0. a) Escriba un programa en Matlab ó R para simulación de 1000 datos de X con base en el método de la transformada inversa, utilizando h = 3, a = 0.3. b) Calcule E(X k ), k = 1, 2, 3, los momentos teóricos ó poblacionales. c) Compare los resultados de los momentos teóricos con los obtenidos mediante la muestra simulada. 3. Presentación El examen es personal, aunque la elaboración puede ser colaborativa. Se asume que los resultados que se presenten como respuestas pueden ser sustentados y no son copias de otros trabajos. La comprobación de copia conlleva a la anulación del parcial. Presentar el informe en hojas tamaño carta, en formato Microsoft Word o en LaTex. La entrega es el dı́a miércoles 5 de marzo en la hora de clase. 4