INGENIERÍA INDUSTRIAL Departamento de Estadı́stica Asignatura: ESTADÍSTICA II Curso: 2007/2008 Relación número 5 de problemas 1. Se pretende estudiar si existe relación entre el peso de los recién nacidos y el tabaco consumido por la madre durante el embarazo. Para ello, empleando datos de 1656 recién nacidos, se estima por mı́nimos cuadrados el siguiente modelo: logYi = β0 + β1 Hi + β2 Ci + β3 Ei + β4 Ei2 + β5 Ni + ui donde: Yi es el peso del bebé al nacer en gramos Hi es una variable dicotómica que vale 1 si el recién nacido es niño y 0 si es niña Ci es el no de cigarros diarios fumados por la madre durante el embarazo Ei es la edad de la madre en años Ni es el no de veces que la madre acudió al médico durante el embarazo Los resultados obtenidos son: Indique, de las siguientes afirmaciones, la única correcta: a) Se estima que por cada cigarro adicional que fume la madre durante el embarazo, con todo los demás constante, el peso del recién nacido disminuye 0,296 gramos. b) Se estima que por cada cigarro adicional que fume la madre durante el embarazo, con todo los demás constante, el peso del recién nacido disminuye 0,00296 gramos. 1 c) Se estima que por cada cigarro adicional que fume la madre durante el embarazo, con todo los demás constante, el peso del recién nacido disminuye 0,296 %. d) Se estima que por cada cigarro adicional que fume la madre durante el embarazo, con todo los demás constante, el peso del recién nacido disminuye 0,00296 %. 2. Cuando en un modelo de regresión existe multicolinealidad perfecta entre las variables explicativas: a) No podemos estimar los parámetros por mı́nimos cuadrados ordinarios (MCO) porque no podemos obtener la matriz X. b) No podemos estimar los parámetros por mı́nimos cuadrados ordinarios (MCO) porque no podemos obtener (X ′ X)−1 . c) Podemos estimar los parámetros por mı́nimos cuadrados ordinarios (MCO) aunque el estimador será ineficiente. d) No podemos estimar los parámetros por mı́nimos cuadrados ordinarios (MCO) porque no tenemos las observaciones de la variable. 3. Considérese el siguiente modelo de regresión estimado: Señale cuál de las siguientes afirmaciones es correcta bajo un nivel de significación de α = 0,05 2 a) En los contrastes de significatividad individual y conjunta se rechaza la hipótesis nula b) Existen indicios de multicolinealidad c) El número total de observaciones es 21 d) La varianza residual es 392954 4. Para analizar la relación del precio de la vivienda con el tamaño y el número de habitaciones, se ha estimado, con una muestra de 200 viviendas, el siguiente modelo por mı́nimos cuadrados ordinarios: donde yi es el precio en miles de euros de la vivienda i, x1i es el tamaño en metros cuadrados de la vivienda i, x2i es el número de habitaciones de la vivienda i, y las cifras entre paréntesis son los errores estándar de los parámetros estimados. Indique cuál de las siguientes afirmaciones es cierta: a) Si el número de habitaciones de la vivienda se incrementa en 1 %, manteniéndose todo lo demás constante, el precio de la vivienda se incrementará en un 0, 1 % b) Si el tamaño de la vivienda se incrementa en 1 %, manteniéndose todo lo demás constante, el precio de la vivienda se incrementará en un 0, 9 % c) Dado el número de habitaciones, el efecto del tamaño de la vivienda sobre el precio es significativamente distinto de cero al 5 % (t197;0,025 ≈ z0,025 = 1,96) d) Si el número de habitaciones de la vivienda se incrementa en 1 unidad, manteniéndose todo lo demás constante, el precio de la vivienda se incrementará en un 0, 1 % 5. Considere el modelo de regresión yi = β0 + β1 x1i + β2 x2i + ui Con una muestra de tamaño 100, se ha obtenido una estimación nı́nimo cuadrática de β1 = 2. Entonces: a) La variable x1i es significativa al 5 % porque β1 > 1,96 b) Si x1i se incrementa en una unidad, el valor de y se incrementa en 2 unidades para cualquier valor que tome x2i c) Si x1i se incrementa en una unidad, el valor de y se incrementa en 2 unidades manteniéndose constante x2i d) El valor medio de y es igual a 2 tomando x1 = 0. 3 6. Sea el modelo de regresión lineal múltiple en el que se han incluido un total de 4 variables explicativas, cuya ecuación es: yi = β0 + β1 x1i + β2 x2i + β3 x3i + β4 x4i + ui i = 1, . . . , 10 Señala cuál de las siguientes serı́a la matriz de varianzas covarianzas estimada del T vector βb = βb0 , βb1 , βb2 , βb3 , βb4 y cuáles son sus dimensiones. 2 a) SbR (X ′ X)−1 que tendrá dimensión de 10 filas y 10 columnas 2 (X ′ X)−1 que tendrá dimensión de 4 filas y 5 columnas b) SbR c) σ 2 (X ′ X)−1 que tendrá dimensión de 4 filas y 5 columnas 2 d) SbR (X ′ X)−1 que tendrá dimensión de 5 filas y 5 columnas 7. En un modelo de regresión múltiple, el hecho de que el determinante de una matriz X ′ X sea practicamente cero indica que: a) El modelo está correctamente especificado b) Hay un problema de multicolinealidad c) Es necesaria una transformación sobre la variable respuesta d) El término constante β0 desaparece 8. Para estudiar la relación del salario de los individuos con sus años de estudio y sus años de experiencia laboral se ha estimado con una muestra de 3000 individuos el siguiente modelo: log yi = β0 + β1 x1i + β2 x2i + ui donde yi es el salario en euros del individuo i-ésimo, x1i son los años de estudios y x2i son los años de experiencia laboral. Los resultados obtenidos son: Indique cuál es la única respuesta correcta: a) Si los años de estudio aumentan en un año, con la experiencia constante, el salario aumenta 0,068 euros b) Si los años de estudio aumentan en un año, con la experiencia constante, el salario aumenta 0,068 por ciento 4 c) Si los años de estudio aumentan en un 1 por ciento, con la experiencia constante, el salario aumenta 0,068 por ciento d) Si los años de estudio aumentan en un año, con la experiencia constante, el salario aumenta 6,8 por ciento 9. Sea el modelo de regresión múltiple Y = Xβ + U , donde U ≈ Nn (0, σ 2 I). Sea βb = (X ′ X)−1 X ′ Y . Entre las siguientes afirmaciones: I) βb es el estimador mı́nimo cuadrático de β II) βb es el estimador máximo verosı́mil de β III) βb es un estimador insesgado de β son ciertas: a) (I) y (II) b) (II) y (III) c) sólo (III) d) Las tres 10. Sea el modelo de regresión múltiple Y = Xβ + U , donde la matriz X tiene una columna de unos y U ≈ Nn (0, σ 2 I). Sea e el vector de residuos. Entre las siguientes afirmaciones indicar cuál es FALSA: a) El vector e sigue exactamente una distribución Nn (0, σ 2 I) b) El vector e tiene n componentes c) La suma de las componentes del vector e es cero P 2 d) σ12 ei se distribuye como una χ2n−k−1 siendo k el número de variables explicativas del modelo 11. Sea el modelo de regresión múltiple Y = β0 + β1 X1 + β2 X2 + U . Se da el caso que X2 = 5 + 2X1 . ¿Cuál de las siguientes afirmaciones es cierta? a) βb1 es el doble de βb2 b) βb1 es la mitad de βb2 c) βb1 y βb2 son iguales d) No es posible estimar ni βb1 ni βb2 12. Ajustamos una regresión lineal simple a 200 datos y calculamos el intervalo de confianza para la pendiente de la regresión s 1 b b β ± zα/2 SR 2 nSbX ¿Cuál de las siguientes hipótesis básicas son necesarias para que el intervalo de confianza sea aproximadamente válido 5 I) Linealidad del efecto de la variable explicativa sobre la respuesta II) Homocedasticidad, es decir, que todas las perturbaciones tienen la misma varianza III) Normalidad de la distribución de las perturbaciones IV) Independencia de las perturbaciones Marcar la opción correcta: a) I y II b) I y III c) I, II y IV d) Todas 13. (Febrero 2007) En una regresión I) los residuos son siempre ortogonales II) la estimación de una observación está contenida en el subespacio generado por las variables X ′ s III) la media de los residuos es cero IV) las variables X ′ s siguen una distribución normal En estas condiciones, el número de afirmaciones ciertas es a) 1 b) 2 c) 3 d) 4 e) Ninguna 14. (Febrero 2007) Dado el modelo de regresión lineal múltiple para una muestra de 100 datos: y = −3 + 7x1 + 3x2 − x3 b 1 ) = 0,213,S(β b 2 ) = 1,213,S(β b 3 ) = 0,865, el número de variables significativas con S(β del modelo es a) 0 b) 1 c) 2 d) NDA 15. (Febrero 2007) Para un modelo de regresión lineal simple se obtuvo la siguiente tabla de residuos: 6 xi ei 1 3 3 a 5 -2 6 -3 7 b 8 4 9 -1 Calcúlense los parámetros a y b a) a + b = −1, 3a + 7b = 2 b) a + b = −1 c) a = 3, b = 7 d) NDA 16. (Febrero 2007) A partir de la recta de regresión de Y sobre X, ¿qué valor cabe esperar que tome la variable Y cuando la variable X es igual a su media? a) La media de Y b) La media de X c) Cero d) NDA 7