Estadística Examen tipo del segundo parcial Semestre 2012-1 Instrucciones: 1) Se puede usar formulario y calculadora 2) El tiempo máximo para responder el examen es de tres horas y media 3) Se otorgará hasta un punto por la calidad conjunta de las respuestas 4) El examen tendrá la misma estructura y preguntas similares 5) Responder solo siete preguntas. Una de la primera parte y dos preguntas de la 20, 30 y 40 parte. 1. Muestra no aleatoria 1. Considere la variable aleatoria X~ (0,1) y defina la variable aleatoria Y = X2 – 1, demuestre que: Cov(X, Y)=0, pero las dos variables aleatorias no son independientes. 2. Explique el concepto de independencia condicional y su relación con la dependencia de Markov, con un ejemplo económico. 3. Sea la función de densidad conjunta de dos variables aleatorias X e Y: 𝑥\𝑦 X\y 0 1 0 1 2 0.2 0.10.2 0.1 0.20.2 a. Deduzca las distribuciones condicionadas: f(y│x), x=0,1 b. Deducir los siguientes momentos: E(X), E(Y), Var(X), Var(Y), Cov(X,Y), E(XY), Corr(X,Y), E(Y│X=0), E(Y│X=1) y Var(Y│X=0) 4. Dos V.A. discretas X ,Y tienen la siguiente función de probabilidad conjunta 0.2 0.1 0.1 𝑃𝑋|𝑌 (𝑥|𝑦) = 0.2 0.1 { 0.3 𝑠𝑖 𝑥 = 1, 𝑦 = 1 𝑠𝑖 𝑥 = 1, 𝑦 = 2 𝑠𝑖 𝑥 = 2, 𝑦 = 1 𝑠𝑖 𝑥 = 2, 𝑦 = 2 𝑠𝑖 𝑥 = 3, 𝑦 = 1 𝑠𝑖 𝑥 = 3, 𝑦 = 2 Determine: a. b. c. d. e. f. Las funciones de probabilidad marginales La función de probabilidad condicional de X dado Y, es decir, 𝑃𝑋|𝑌 (𝑥|𝑦) ¿son independientes X, Y? El valor esperado E(X|Y) y la Var(X|Y) La probabilidad P(X<2|Y=1) La probabilidad P(Y>1|X>1) 2. Estimación I: Propiedades de los estimadores 1. Para el modelo estadístico Bernoulli: i) Discutir si las siguientes funciones constituyen estimadores posibles de θ θ̂1 = X n , θ̂2 = 1/2(X2 − X1), θ̂3 = 1/3(X1 − X 2 + X n ), 1 1 θ̂n = n ∑ni=1 X i θ̂n+1 = n+1 ∑ni=1 X i 2. Considere el modelo estadístico normal a) Derive las distribuciones muéstrales de los estimadores siguientes: μ̂1 = X n, μ̂2 = 1/3(X1 + X 2 + X n ) 1 μ̂3 = (X1 − X n ),μ̂n = n ∑ni=1 X i b) Compare los estimadores en términos de las propiedades de insesgado, eficiencia total y consistencia. 3. Sea Y1 , Y2 ,…Yn una muestra aleatoria de una población cuya densidad está dada por : 𝑓(𝑥, 𝑦) = { 0 1 𝛼𝑦 𝛼−1 𝜃𝛼 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 𝑠𝑖 0 ≤ 𝑦 ≤ 𝜃 Donde 𝛼 > 0 es un valor fijo conocido, pero el valor 𝜃 se desconoce. Considere el estimador 𝜃̂= max (Y1, Y2,…Yn) del parámetro 𝜃. a) Demuestre que 𝜃̂ es un estimador sesgado de 𝜃 b) Determine un múltiplo de 𝜃̂ que lo convierta en un estimador insesgado de 𝜃 c) Encuentre el error cuadrático medio de 𝜃̂ 1 4. Sea 𝑆 2 = 𝑛−1 ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 a) Demuestre que 𝑆 2 es un estimador insesgado de 𝜎 2 b) Si suponemos una distribución normal para este estimador, calcule la varianza de 𝑆2 c) Calcule el error cuadrático medio de este estimador y compárelo con el del 1 estimador 𝑆𝑜2 = 𝑛 ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 5. Sea Y una variable aleatoria que se distribuye como una normal con media 0 y varianza 𝜎 2 𝑦2 a) Muestre que el estadístico 𝜎2 tiene una distribución 𝜒 2 b) Argumente porqué el estadístico anterior cumple ser una cantidad pivote c) Encuentre un intervalo de confianza de 95% para 𝜎 2 6. Sea X1, X2,…Xn una familia de variables aleatorias con función de distribución dada por: 3𝑦 2 𝜃3 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 𝑓(𝑦) = { 0 𝑠𝑖 0 ≤ 𝑦 ≤ 𝜃 a) Demuestre que Y(n)= max (Y1, Y2,…Yn) es un estimador suficiente para θ b) Demuestre que Y(n) tiene una función de densidad dada por 3𝑛𝑦 3𝑛−1 𝜃 3𝑛 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 𝑓(𝑛) (𝑦) = { 0 𝑠𝑖 0 ≤ 𝑦 ≤ 𝜃 c) Encuentre el estimador insesgado de varianza mínima para 𝜃 3. Estimación II: Métodos de estimación 1. Considerar el modelo estadístico normal simple Obtener los estimadores de máxima verosimilitud de (µ, σ2) y sus distribuciones muéstrales. a. Obtener los estimadores de mínimos cuadrados de (µ, σ2) y sus distribuciones normales b. Comparar los dos estimadores en términos de las propiedades óptimas, insesgado, eficacia completa y consistencia. 2. Considere el modelo estadístico normal simple con µ = 0, es decir, el modelo probabilístico es: φ= 𝑓(𝑥; 𝜃) = 𝜎 1 1 𝑒𝑥𝑝 {− 2𝜎2 𝑥 2 } , 𝜃 √2𝜋 ≔ 𝜎 2 > 0, 𝑥 ∈ 𝑅 Deducir el Estimador de Máxima Verosimilitud de θ y compararlo con el estimador: 𝑛 1 𝜎̃ = ∑ 𝑋𝑘 𝑛+2 2 𝑘=1 3. De acuerdo al modelo estadístico normal simple, encontrar los estimadores para (µ, σ2) con el método paramétrico de momentos.. 4. Los resultados de la prueba de conocimientos generales que disminuyeron al inicio, se han comenzado a elevar con el tiempo. Al inicio se contempló un promedio de 500 puntos, pero 1991 los promedios fueron de 422 puntos y 474 en las pruebas de habilidad verbal y matemáticas respectivamente. Una muestra aleatoria de 20 estudiantes de una preparatoria urbana grande dio como resultado lo siguiente: Media Desviación Estandar Capacidad Verbal Matemáticas 419 455 57 69 a) Encuentre un intervalo de confianza de 90% para la media de los resultados del examen verbal de los estudiantes de la escuela preparatoria. b) ¿El intervalo que encontró en el insiso anterior incluye el valor 422, el promedio de los exámenes de capacidad verbal de 1991? c) Construya un intervalo de confianza del 90% para la media real de los de los resultados del examen de matemáticas que presentaron los alumnos de la preparatoria. ¿Incluye este intervalo el valor 474, la media de los resultados de matemáticas de 1991? ¿Qué puede concluir con esto? 5. Sea Y1, Y2,…Yn una muestra aleatoria de una función de densidad dada por: 1 𝑟−1 −𝑦𝑟 /𝜃 𝑓(𝑦|𝜃) = { 𝜃 𝑟𝑦 𝑒 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 𝑠𝑖 𝑦 > 0, 𝜃 > 0 Donde 𝑟 es una constante positiva conocida a) Encuentre un estadístico suficiente para 𝜃 b) Encuentre el estimador de máxima verosimilitud de 𝜃 c) ¿Es el estimador anterior un estimador insesgado de mínima varianza? 6. Sea Y1, Y2,…Yn una muestra aleatoria de una función de densidad dada por: 1 𝛼−1 −𝑦/𝜃 𝑒 𝑓(𝑦|𝛼, 𝜃) = { Γ(𝛼)𝜃 𝛼 𝑦 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 𝑠𝑖 𝑦 > 0 Donde 𝛼 > 0 a) Encuentre el estimador de máxima verosimilitud de 𝜃̂ del parametro 𝜃 b) Encuentre el valor esperado y varianza de 𝜃 c) Demuestre que 𝜃 es un estimador consistente de 𝜃 d) Suponga que n=5 y que alpha es igual a 2. Utilice el estadístico suficiente minimal para construir un intervalo de confianza de 90 % para 𝜃 7. Suponga que se toman dos muestras independientes de tamaño n1 y n2 de dos poblaciones con distribución normal y varianzas 𝜎12 , 𝜎22 , respectivamente. Si 𝑆12 , 𝑆22 , denotan las varianzas muéstrales respectivas, entonces sabemos que (𝑛𝑖 −1)𝑠𝑖2 𝜎𝑖2 2 se distribuye como una 𝜒(𝑛 para i=1,2 𝑖−1 ) a) Utilice estas cantidades para construir una variable aleatoria que tenga una distribución F con (n1-1) grados de libertad y (n2-1) en el denominador. b) Utilice la cantidad anterior como cantidad pivote y deduzca una formula para 𝜎2 intervalo de confianza de 100(1 − 𝛼)% para 𝜎22 1 8. Pruebas de Hipótesis 1. En el contexto del modelo normal simple derivar pruebas para las siguientes hipótesis: a. b. c. d. H0: μ>µ0 H0: μ<µ0 H0: σ2>σ20 H0: σ2<σ20 H1: μ≤µ0 H1: μ≥µ0 H1: σ2≤ σ20 H1: σ2≥ σ20 2. De acuerdo al cuadro sobre la población ocupada en la industria manufacturera en México: Población Ocupada en la Ind. Manufacturera en México años 2008 2009 2010 Hombres 58,780 55,253 60,779 Mujeres 54,665 52,491 55,308 Total 113,445 107,744 116,087 Probar, en el marco de la Neyman-Pearson, las siguientes hipótesis con α = 0.01 (a) La conjetura de Arbuthnot para cada año separadamente: H0: θ=0.5 H1:θ<0.5 (b) La conjetura de Bernoulli para cada año separadamente: H0: θ=0.4857 H1:θ<0.4857 (c) Repetir (a) y (b) como pruebas de Fisher. 3. En el siguiente modelo estadístico de acuerdo un modeloprobabilístico normal, CPt = 1.2 + 0.8Yt – 0.2Rt + ut Donde el consumo privado (CP) es una función del ingreso (Y) y de la tasa de interés (R), y los errores estándar son 0.7 para la constante, 0.6 para Y, 0.2 para R y el valor del estadístico F calculado de 12.5 y el teórico de 7.6. Escribir las hipótesis de significancia individual para cada parámetro y la conjunta sin incluir la constante. Concluir con las hipótesis individuales y la conjunta. 4. La comisión de caza y pesca de Florida realizo un estudio para estimar las cantidades de químicos encontradas en los tejidos cerebrales de los pelícanos café. Se tomaron muestras aleatorias de pelícanos, n1 = 10 de ellos jóvenes y n2 = 15 polluelos, dando los resultados de la siguiente tabla: Jóvenes n1=10 y1=0.041 s1= 0.017 Polluelos n1=13 y1=0.026 s1= 0.006 Donde y1 y y2 representan los respectivos promedios de estas variables. Pruebe la hipótesis de que no diferencia en la cantidad de DDT encontrada en los pelícanos jóvenes que en los polluelos, contra la hipótesis alternativa de que la media de esta cantidad encontrada en los jóvenes es mayor que la encontrada en los polluelos (utilice un nivel de significancia de 𝛼= 0.05). ¿Qué podemos concluir con esta información?