Introduccion Multicolinealidad y Micronumerosidad Multicolinealidad Walter Sosa-Escudero May 10, 2009 Walter Sosa-Escudero Multicolinealidad Introduccion Multicolinealidad y Micronumerosidad Modelo lineal: 1 Linearity: Y = Xβ + u. 2 E(u) = 0 3 No Multicollinearity: ρ(X) = K. 4 No heteroskedasticity/ serial correlation: V (u) = σ 2 In . Gauss/Markov: β̂ = (X 0 X)−1 X 0 Y es el mejor estimador linearl insesgado. No significa que sea bueno. Es interesante explorar que cosas lo hacen peor: menos preciso (mas varianza) o mas sesgado. Walter Sosa-Escudero Multicolinealidad Introduccion Multicolinealidad y Micronumerosidad Multicolinealidad, Micronumerosidad e Imprecisiones Un supuesto clave es el de no-multicolinealidad, ρ(X) = K, que garantiza que (X 0 X) es invertible, de modo que el problema de minimos cuadrados tiene una solucion unica. Cualquier violacion de este supuesto, tal que ρ(X) < K implica multicolinealidad exacta y elimina la posibilidad de encontrar estimaciones unicas. La multicolinealidad alta es una nocion un tanto contradictoria, en donde ρ(X) = K, pero la correlacion entre las variables explicativas si bien no es perfecta, es ‘alta’. En este caso no se viola ningun supuesto clasico, el teorema de Gauss-Markov sigue valiendo. Walter Sosa-Escudero Multicolinealidad Introduccion Multicolinealidad y Micronumerosidad El siguiente resultado sugiere porque en la practica se le presta atencion a la cuestion de ‘multicolinealdad alta’. Resultado: V (β̂j ) = h σ2 (1 − Rj2 )Sjj i, en donde Rj2 es el R2 de regresar Xj en todas las restantes P variables explicativas, y Sjj = ni=1 (Xji − X̄j )2 Walter Sosa-Escudero Multicolinealidad Introduccion Multicolinealidad y Micronumerosidad Factores que afectan V (βˆj ) Volvamos al resultado anterior V (β̂j ) = σ2 1 σ2 = 2 2 n (1 − Rj )Sjj (1 − Rj )(Sjj /n) Mas adelante discutiremos que Sjj /n es una magnitud relativamente estable. Entonces, hay tres factores que contribuyen a una mayor varianza: 1 σ 2 , la varianza del termino de error. 2 n, la cantidad de observaciones. 3 Rj2 , la correlacion entre Xj y las otras variables. Es importnte ver que la multicolinealidad alta afecta a la varianza de la misma forma que el numero de observaciones (‘micronumerosidad’). Walter Sosa-Escudero Multicolinealidad Introduccion Multicolinealidad y Micronumerosidad Es interesante resaltar que bajo multicolinealidad alta, pueden haber situaciones en donde los estadisticos t de significatividad sean bajos aun cuando R2 y el estadistico F de significatividad global sea alto. Hemos discutido que la multicolinealidad alta induce alta varianza y es compatible con bajos t’s. Sin embargo, R2 puede ser alto ya que reflea como las variables explican Y conjuntamente. Chequear con cuidado el significado de los t’s y el de F !. Walter Sosa-Escudero Multicolinealidad Introduccion Multicolinealidad y Micronumerosidad Walter Sosa-Escudero Multicolinealidad Introduccion Multicolinealidad y Micronumerosidad Walter Sosa-Escudero Multicolinealidad Introduccion Multicolinealidad y Micronumerosidad Model a) Multicolinealidad Alta cor(x,y)=0.998983 Estimate Std. Error t value Pr(>|t|) (Intercept) 0.04171 0.04426 0.943 0.348 y 0.57840 0.83608 0.692 0.491 x 1.33508 0.83893 1.591 0.115 Residual standard error: 0.4415 on 97 degrees of freedom Multiple R-squared: 0.9635, Adjusted R-squared: 0.9628 F-statistic: 1282 on 2 and 97 DF, p-value: < 2.2e-16 Model b) Multicolinealidad baja cor(x,y1)= 0.4047114 Estimate Std. Error t value Pr(>|t|) (Intercept) -0.0009127 0.0465794 -0.02 0.984 y1 0.9773821 0.0220314 44.36 <2e-16 *** x 1.0398014 0.0436223 23.84 <2e-16 *** Residual standard error: 0.4655 on 97 degrees of freedom Multiple R-squared: 0.9766, Adjusted R-squared: 0.9762 F-statistic: 2028 on 2 and 97 DF, p-value: < 2.2e-16 Walter Sosa-Escudero Multicolinealidad