Regresión a través del origen En el algunas ocasiones tendremos que estimar regresiones como la presentada más abajo, en las cuales no existe el término del intercepto, las cuales son llamadas regresiones a través del origen. Yi = β2 X i + ui ( ) ei = Yi − βˆ2 X i , elevando al cuadrado y sumando para todo i ∑ ∑( ei 2 = Yi − βˆ2 X i ) 2 , planteando el problema de min y resolviendo ) ∑ ∑( d ∑e = 2∑ (Y − βˆ X ) ( − X ) = 0 ei 2 = min Yi − βˆ2 X i 2 2 i d βˆ2 i 2 ∑ (Y − βˆ X )( X ) = 0 ∑ (Y X − βˆ X ) = 0 i 2 i βˆ2 = i i i 2 i 2 ∑Y X ∑X i i 2 i Insesgamiento βˆ2 = ∑( β 2 X i + ui ) X i ∑X 2 i ∑ β X +∑ X u = ∑X ∑X u =β + ∑X 2 2 i i i 2 i 2 i i 2 i i i Tomando esperanza de β̂2 E βˆ2 = E β 2 + ∑ X u = β , por lo tanto es un estimador insesgado ∑ X i i 2 i 2 Entonces, ( ) ( ) var βˆ2 = E βˆ2 − E βˆ2 = E βˆ2 − β2 = E 2 ∑ ∑X = E β 2 + X i ui ∑ ∑ 2 X i ui X i2 2 i − β2 2 2 Desarrollando el término dentro del corcho, tomando en cuenta que Xi es no estocástica y las ui son homocedásticas y no correlacionadas, obtenemos: σ2 ˆ var β 2 = X i2 ( ) ∑ donde la estimación de σ es: 2 σˆ 2 ∑e = 2 i ( n − 1) Comparemos con los resultados del modelo con intercepto: Regresión sin intercepto ∑Y X ∑X σ var ( βˆ ) = ∑X ∑e σˆ = Estimador de β2 βˆ2 = Varianza β2 i Regresión con intercepto ∑y x ∑x σ var ( βˆ ) = ∑x ∑e σˆ = βˆ2 = i 2 i 2 2 Estimador de σ 2 2 i i 2 i 2 2 2 i 2 i 2 i 2 i 2 ( n − 1) ( n − 2) La diferencia consiste en que el modelo de regresión sin intercepto se utilizan sumatorias sencillas, mientras que el modelo con intercepto se utilizan sumas ajustadas por la media (en desvíos). Algunas características del modelo sin intercepto: 1. La sumatoria de los errores estimados es diferente de cero. 2. El R2 puede ser negativo La sumatoria de los errores estimados es diferente de cero ∑e ≠ 0 i ∑e ≠ 0 i En el modelo de regresión con intercepto, de la primera ecuación normal, concluimos que ei = 0 . En el caso del modelo sin intercepto, no sucede ∑ esto, sino que ∑ e ≠ 0 . Supongamos que ∑ e = 0 , entonces: i i ∑ Y = βˆ ∑ X + ∑ e ∑ Y = βˆ ∑ X ∑Y βˆ = ∑X i 2 i i 2 i i 2 i Y βˆ2 = X i Este estimador de β2 , es diferente al encontrado anteriormente, el cual se demostró que era insesgado. En el modelo a través del origen, no se cumple ∑ X e = 0 . (¿Por qué?) concluimos que ∑e = 0 ; i aunque si i i El R2 en el modelo de regresión a través del origen (R2 simple) En el modelo sin intercepto, no está garantizada que la SRC sea menor que el STC, por lo que el R2 puede ser negativo. En el caso del modelo de regresión a través del origen se puede calcular el llamado R2 simple: ∑( X Y ) R = ∑ X ∑Y 2 i 2 i 2 i 2 i Este R2 simple, no es directamente comparable con el R2 convencional. Debido a las características especiales del modelo sin intercepto es preciso ser cauteloso al utilizarlo. Esto debido a: • • Si el intercepto se incluye y resulta estadísticamente no significativo, en la práctica, es como si tuviéramos una regresión por el origen. Si el modelo tiene un intercepto, pero no lo incluimos, incurrimos en el sesgo de especificación, uno de los supuestos clásicos. Es preciso señalar, que si el intercepto está ausente, entonces es más preciso el estimador de la pendiente. Diferentes formas funcionales de los modelos de regresión Modelo doble logaritmico, log-log o log-lineal Yi = β1 X i β expu 2 i ln Yi = ln β1 + β 2 ln X i + ui d ln Y = β2 d ln X ∆Y Y = ∆Y X = β 2 ∆X ∆X Y X ∆ %Y β2 = ∆% X Donde β 2 es una elasticidad constante e indica el cambio % en la variable Y provocado ante un cambio % de la variable X. Modelo log-lin ln Yi = ln β1 + β 2 X i + ui d ln Y = β2 dX dY Y =β 2 dX ∆ %Y β2 = ∆X En este caso β 2 es una semielasticidad, e indica el cambio % en Y ante un cambio en unidades (absoluto) de la variable X. Modelo lin-log Yi = ln β1 + β 2 ln X i + ui dY = β2 d ln X dY = β2 dX X ∆Y β2 = ∆% X En este modelo β 2 busca explicar cambios absolutos en Y ante cambios % de X.