Estadı́stica y sus aplicaciones en Ciencias Sociales Práctico 7 - Análisis de regresión simple 2016 Unidades de medida y forma funcional Dos aspectos importantes cuando resolvemos problemas prácticos son: 1. Efectos del cambio en las unidades de medida sobre los estadı́sticos MCO. - Si la variable dependiente se multiplica por la constante c (lo que significa que cada unidad de la muestra se multiplica por c), entonces los valores estimados de MCO del término constante y de las pendientes también se multiplican por c. - Por lo general, si una variable independiente se divide o se multiplica por una constante no nula c entonces el coeficiente MCO se multiplica o divide por c, respectivamente. - Generalmente, el cambiar sólo las unidades de medida de las variables independientes no afecta la estimación del término constante. 2. Incorporar no linealidades a la regresión. - Si aplicamos logaritmos a la variable dependiente, la estimación de los parámetros del modelo nos van a decir cuánto varı́a la variable dependiente en términos porcentuales cuando varı́a en uno la variable explicativa. - Esto hace que podamos mostrar que la variable dependiente no aumenta lo mismo sobre todo el recorrido de xj - log(y) = β1 + β2 x2 + β3 x3 + u. Si tenemos que ∆u = 0, entonces: %∆y ≈ (100 · β2 )∆x2 + (100 · β3 )∆x3 Modelo nivel-nivel nivel-log log-nivel log-log Variable dependiente y y log(y) log(y) Variable independiente xj log(xj ) xj log(xj ) 1 Interpretación de βj con j > 1 ∆y = βj ∆xj ∆y = (βj /100) %∆xj %∆y = (βj · 100)∆xj %∆y = βj %∆xj Ejercicio 1 Suponga que en su universidad se le pide que encuentre una relación entre horas semanales de estudio y horas semanales de trabajo. ¿Tendrı́a sentido considerar que en este problema se trata de inferir si estudio “causa” trabajo o trabajo “causa” estudio? Explique. Ejercicio 2 Consideremos una votación donde existen dos candidatos, A y B. Sea votosA el porcentaje de votos recibidos por el candidato A en una elección y gastosA el porcentaje total de gastos de campaña correspondiente al candidato A: Número de votos del candidato A Número total de votos (A+B) Gastos de campaña del candidato A gastosA = Total gastos de campaña (A+B) votosA = El siguiente modelo relaciona el número de votos con los gastos de campaña: votosA = β1 + β2 gastosA + u donde u es el error no observado. En base a los datos anteriores, se pide: 1. ¿Qué tipo de factores están en u? ¿Pueden estar correlacionados con los gastos en campaña? 2. ¿Podemos determinar el efecto ceteris paribus de los gastos en campaña sobre el porcentaje de votos obtenidos con un análisis de regresión simple? Ejercicio 3 El siguiente cuadro muestra los resultados de la prueba de aptitud para el acceso a la universidad en Estados Unidos (ACT American College Testing) y la nota media de la universidad (GP A, Grade Point Average) de ocho estudiantes universitarios. El GP A se basa en una escala de cuatro puntos y se ha redondeado a un decimal. En base a los datos Estudiante 1 2 3 4 5 6 7 8 GPA (Y ) 2.8 3.4 3.0 3.5 3.6 3.0 2.7 3.7 ACT (X) 21 24 26 27 29 25 25 30 presentados, se pide: 1. Estimar la relación entre GP A y ACT empleando MCO, es decir, obtener los valores estimados del término constante y de la pendiente en la ecuación: [ GP A = β0 + β1 ACT 2 2. Comentar la dirección de la relación. ¿El término constante se presta a una interpretación útil en este caso? Explicar la respuesta. ¿En cuánto se predice que aumente el GP A si el resultado de ACT aumenta en 5 puntos? 3. Calcular los valores ajustados y los residuos para cada observación y comprobar que los residuos suman (aproximadamente) cero. 4. Dar el valor predicho de GP A cuando ACT =20 5. ¿Qué proporción de la variación de GPA de estos ocho estudiantes se explica por ACT ? Ejercicio 4 Utilizando los datos de 1988 sobre las casas vendidas en Andover, Massachusetts, la siguiente ecuación relaciona el precio de las viviendas (precio) con la distancia a un incinerador de basura (dist): [ = 9,40 + 0,312 log(dist) log(price) donde n = 135 y R2 = 0,162 1. Interprete el coeficiente de log(dist). ¿Es el signo el que se puede esperar? 2. ¿Ofrece la regresión simple un estimador insesgado de la elasticidad ceteris paribus de price con respecto a dist? (Responder teniendo en cuenta la decisión de la ciudad sobre dónde situar un incinerador). 3. ¿Qué otros factores de una casa tienen una incidencia sobre su precio? ¿Pueden estar correlacionados con la distancia al incinerador? 3