EXAMEN DE CC. SOCIALES APLICADAS A LA ESTADÍSTICA III Junio del 2004 CUESTIONES (tiempo: 60 minutos) 1. En Regresión Simple, un gráfico de residuos: a) Nos da una idea de sí los errores tienen varianza constante b) Detecta la no linealidad entre X e Y c) Nos muestran los puntos influyentes d) Todas las afirmaciones anteriores son ciertas 2. En un modelo de regresión lineal, y x u , para contrastar la hipótesis de que 2 , a un nivel de significación del 5%. a) Es suficiente considerar un intervalo de confianza de al 99% b) Es suficiente considerar la tabla del análisis de la varianza c) Es suficiente considerar un contraste cuya distribución es una t-student con (n-8) grados de libertad. d) Ninguna de las afirmaciones anteriores es cierta. 3. En Análisis de la Varianza, a veces usamos un segundo factor aunque no nos interese investigar su efecto. Con ello: a) Disminuimos el error b) Aumentamos la variabilidad explicada c) Cambia la variabilidad total. d) Se mantiene el valor del estadístico para contrastar la igualdad de factores. 4. En un modelo de regresión múltiple con los supuestos habituales, si incluimos nuevas variables como regresores (variables explicativas): a) La variabilidad explicada disminuye y la residual aumenta. b) La variabilidad total no permanece constante. c) El coeficiente de determinación, R2, disminuye. d) Si las nuevas variables explicativas son significativas, el coeficiente de determinación corregido, R 2 , aumentará. 5. Cuando realizamos un contraste de hipótesis para el análisis de la varianza de un factor, siendo la hipótesis nula a contrastar H 0 1 2 ...... k 0, donde i es la media del grupo i-ésimo, cuál de los siguientes supuestos NO es necesario: a) Las varianzas poblaciones son las mismas. b) Las distribuciones poblaciones son normales. c) El tamaño muestral total ha de ser grande d) Las muestras de las k poblaciones son independientes. 6. Consideremos el modelo de regresión simple yi xi ui i=1,2,…n. Si todos los puntos (xi,yi) están sobre una recta. ¿Cuál de las siguientes afirmaciones es cierta? a) R2 = 1 b) La suma de los cuadrados de los residuos es uno. c) El coeficiente de correlación lineal es cero. d) 1 (la pendiente de la recta de regresión) es uno. 7. En un Análisis de la varianza de un factor, con tres grupos (o niveles del factor) y 3 observaciones por grupo, obtenemos que las medias de la variable respuesta en cada grupo son 3, 4, 5, y que la VNE = 12 ¿Cuál de las siguientes afirmaciones es cierta? a) VE = 6 y F = 1,5 b) VE = 24 y F = 2 c) VE = 32 y F = 3 d) VE = 12 y F = 2. 8. El contraste de la F en regresión múltiple se utiliza para contrastar que: a) Las variables son normales b) Las variables X no están relacionadas linealmente con la variable dependiente Y. c) Los datos son independientes d) Las variables explicativas son significativas o no en el modelo. 9. En el modelo de regresión simple, si denotamos por Sxy, a la covarianza y por Sx Sy a las desviaciones típicas, el estimador para 1 se obtiene de : S xy a) Sy S xy b) S y2 c) d) S xy S x2 S xy SxS y 10. En una empresa disponemos del salario medio de los hombre y del salario medio de las mujeres para cada grupo de edad. Queremos detectar si existe discriminación salarial y si varía de unos grupos de edad a otros. Para ello con estos datos podemos realizar un análisis estadístico utilizando: a) Análisis de la varianza de un factor. b) Diseño en bloques aleatorizados. c) Regresión Simple. d) Regresión Múltiple. EXAMEN DE CC. SOCIALES APLICADAS A LA ESTADÍSTICA III Junio del 2004 PROBLEMAS (tiempo: 90 minutos) PROBLEMA Nº1 Se estudia la relación entre el tiempo de reparación de ordenadores personales y el número de piezas reparadas por un equipo de mantenimiento con los resultados siguientes: 1 3 4 6 7 9 10 Nº de Piezas 23 49 74 96 109 149 154 Tiempo (minutos) Se pide: a) Construir la recta de regresión para prever el tiempo de reparación en minutos. (1,5 puntos) b) Calcular e interpretar el coeficiente de correlación. (1 punto) c) Si queremos reparar dos piezas más de las previstas inicialmente, ¿Cuántos minutos más esperaríamos? ( 1 punto) d) Calcula un intervalo de confianza al 99% para la predicción del tiempo que tardaremos en reparar por término medio 8 piezas. (1,5 puntos) PROBLEMA Nº2 Se ha diseñado un experimento para estimar el tiempo necesario de filtración de un producto con tres métodos diferentes. A, B y C. Los resultados han sido: 8 10 12 13 9 4 Método A 9 10 10 4 7 8 Método B 12 11 12 9 10 6 Método C Se pide: a) Contrastar que los tres métodos son iguales, con una significación del 5%, construyendo una tabla de Análisis de la Varianza. (2 puntos) b) Hallar el valor del coeficiente de determinación y explicar su significado para este experimento. (1 punto) c) Construya un intervalo de confianza para la varianza (poblacional) con un nivel de significación igual a 0,05, supuesto que es la misma en los tres métodos. (1 punto) d) Se obtienen 12 datos con cada uno de los métodos en lugar de los 6 actuales, resultando las mismas medias y varianzas en cada grupo. ¿Cómo se vería afectada la variabilidad explicada? ¿Qué variaría en ella? Explíquelo brevemente. (1 punto)