Ejercicio heterocedasticidad 2. 1 Ejercicio Heterocedasticidad_2 Tengamos los siguientes datos de los beneficios (Bi) y ventas (Vi) de 20 empresas: obs B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 V 13,2 15 22,2 15,2 16,1 18,5 15,5 15 20 15 21 16,2 18,5 17 17,5 22 18 23 17 17 61 78 158 110 85 150 140 70 122 70 140 91 105 115 115 160 165 170 130 90 Se pide: a) Estimar un modelo lineal para explicar los beneficios en función de las ventas. b) Detecte la presencia de heterocedasticidad con diferentes métodos. c) En el caso de existir heterocedasticidad, aplique el método de estimación MCP, suponiendo que la varianza de las perturbaciones presenta la siguiente relación: σ i2 = σ 2 Vi . Solución. a) Modelo estimado Modelo 1: MCO, usando las observaciones 1-20 Variable dependiente: B const V Coeficiente 10,2229 0,0638456 Media de la vble. dep. Suma de cuad. residuos Desv. Típica Estadístico t 1,35823 7,5267 0,0112223 5,6892 17,64500 51,40902 D.T. de la vble. dep. D.T. de la regresión Valor p <0,00001 0,00002 *** *** 2,751550 1,689987 Ejercicio heterocedasticidad 2. 2 R-cuadrado 0,642619 R-cuadrado corregido 0,622765 F(1, 18) 32,36647 Valor p (de F) 0,000021 Log-verosimilitud -37,81959 Criterio de Akaike 79,63917 Criterio de Schwarz 81,63063 Crit. de Hannan-Quinn 80,02792 El signo del coeficiente de, V, es el esperado. Así, por cada unidad que incrementan las ventas los beneficios incrementan en 0,0638. Además de ser esta variable significativa a un nivel del 95%, el modelo explica un 64% de las variaciones de los beneficios. b) Detección de la heterocedasticidad. b.1) Método gráfico. e2 con respecto a V (con ajuste mínimo-cuadrático) Residuos de la regresión (= B observada - ajustada) 14 2 12 1 10 0 e2 residuo 8 -1 6 4 -2 2 -3 0 -2 -4 60 80 100 120 V 140 160 60 80 100 120 140 160 V En estos gráficos se observa cómo a medida que las ventas incrementan, la dispersión de los residuos también incrementa, indicando la presencia de heterocedasticidad. b.2) Test de Glesjer Para hacer este test: 1. Obtenemos los residuos MCO en términos absolutos. 2. Realizamos las regresiones auxiliares y contrastamos la significación de V para cada regresión auxiliar. Ejercicio heterocedasticidad 2. Obs B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 V 13,2 15 22,2 15,2 16,1 18,5 15,5 15 20 15 21 16,2 18,5 17 17,5 22 18 23 17 17 abs_e= | ei 61 78 158 110 85 150 140 70 122 70 140 91 105 115 115 160 165 170 130 90 3 | 0,91753 0,202905 1,889445 2,045965 0,450176 1,29979 3,661333 0,30786 1,987888 0,30786 1,838667 0,167102 1,573263 0,565193 0,065193 1,561754 2,757474 1,923298 1,522877 1,030948 Modelo 1: MCO, usando las observaciones 1-20 Variable dependiente: abs_e const V Coeficiente -0,891826 0,0188873 Media de la vble. dep. Suma de cuad. residuos R-cuadrado F(1, 18) Log-verosimilitud Criterio de Schwarz Desv. Típica Estadístico t 0,578307 -1,5421 0,00477826 3,9528 1,303826 9,319916 0,464674 15,62434 -20,74298 47,47743 Valor p 0,14044 0,00093 D.T. de la vble. dep. D.T. de la regresión R-cuadrado corregido Valor p (de F) Criterio de Akaike Crit. de Hannan-Quinn *** 0,957238 0,719565 0,434933 0,000933 45,48597 45,87472 Modelo 2: MCO, usando las observaciones 1-20 Variable dependiente: abs_e const Vinv Coeficiente 3,1728 -197,755 Media de la vble. dep. Suma de cuad. residuos R-cuadrado F(1, 18) Log-verosimilitud Criterio de Schwarz Desv. Típica Estadístico t 0,547976 5,7900 55,1884 -3,5833 1,303826 10,16142 0,416338 12,83977 -21,60743 49,20633 Valor p 0,00002 0,00212 D.T. de la vble. dep. D.T. de la regresión R-cuadrado corregido Valor p (de F) Criterio de Akaike Crit. de Hannan-Quinn *** *** 0,957238 0,751348 0,383912 0,002125 47,21487 47,60362 Ejercicio heterocedasticidad 2. 4 Modelo 3: MCO, usando las observaciones 1-20 Variable dependiente: abs_e const Vsqrt Coeficiente -2,93457 0,397477 Media de la vble. dep. Suma de cuad. residuos R-cuadrado F(1, 18) Log-verosimilitud Criterio de Schwarz Desv. Típica Estadístico t 1,09025 -2,6917 0,101118 3,9308 1,303826 9,368093 0,461906 15,45142 -20,79454 47,58055 Valor p 0,01491 0,00098 D.T. de la vble. dep. D.T. de la regresión R-cuadrado corregido Valor p (de F) Criterio de Akaike Crit. de Hannan-Quinn ** *** 0,957238 0,721422 0,432012 0,000980 45,58909 45,97784 En las tres regresiones auxiliares, la variable explicativa es significativa. Sin embargo, observamos que el coeficiente de determinación más elevado corresponde a la primera de ellas (0,464674). Por tanto, podemos suponer que dicha variable provoca heterocedasticidad. b.3) Test de Goldfeld Quandt Para hacer este test: 1. Ordenamos crecientemente respecto de V. 2. Eliminados c=6 datos centrales. 3. Realizamos las regresiones auxiliares. 4. Obtenemos el estadístico de contraste, F. Modelo 1: MCO, usando las observaciones 1-7 Variable dependiente: B const V Coeficiente 7,5343 0,100477 Media de la vble. dep. Suma de cuad. residuos R-cuadrado F(1, 5) Log-verosimilitud Criterio de Schwarz Desv. Típica Estadístico t 1,34079 5,6193 0,0170653 5,8878 15,35714 1,134109 0,873948 34,66614 -3,562349 11,01652 Valor p 0,00247 0,00201 D.T. de la vble. dep. D.T. de la regresión R-cuadrado corregido Valor p (de F) Criterio de Akaike Crit. de Hannan-Quinn 1,224550 0,476258 0,848738 0,002009 11,12470 9,787616 Modelo 2: MCO, usando las observaciones 14-20 (n = 7) Variable dependiente: B const V Coeficiente 1,15735 0,121975 Desv. Típica Estadístico t 13,7885 0,0839 0,0889012 1,3720 *** *** Valor p 0,93636 0,22841 Ejercicio heterocedasticidad 2. Media de la vble. dep. Suma de cuad. residuos R-cuadrado F(1, 5) Log-verosimilitud Criterio de Schwarz GQ = 5 20,02857 32,93469 0,273515 1,882452 -15,35273 34,59727 D.T. de la vble. dep. D.T. de la regresión R-cuadrado corregido Valor p (de F) Criterio de Akaike Crit. de Hannan-Quinn 2,748766 2,566503 0,128218 0,228412 34,70545 33,36837 SCR 2 32,935 = = 29, 043 SCR1 1,134 F(5, 5) probabilidad en la cola derecha = 0,05 probabilidad complementaria = 0,95 Valor crítico = 5,05033 Puesto que el valor del estadístico GQ=29,043 es mayor que el valor de las tablas (5,05033) rechazamos la hipótesis nula de homocedasticidad. c) Estimación mediante MCP Creamos una nueva variable de ponderación: w i = Obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 B V 13,2 15 22,2 15,2 16,1 18,5 15,5 15 20 15 21 16,2 18,5 17 17,5 22 18 23 17 17 1 Vi w 61 78 158 110 85 150 140 70 122 70 140 91 105 115 115 160 165 170 130 90 0,1280369 0,1132277 0,07956 0,09535 0,1084652 0,08165 0,08452 0,1195229 0,09054 0,1195229 0,08452 0,1048285 0,09759 0,09325 0,09325 0,07906 0,07785 0,0767 0,08771 0,1054093 El modelo transformado lo obtenemos multiplicando por w el modelo original: Bw = w + βVw + uw donde Bw = B*w y Vw = V*w Ejercicio heterocedasticidad 2. 6 Modelo MCP: estimaciones MCO utilizando las 20 observaciones 1-20 Variable dependiente: Bw w Vw Coeficiente 10,2147 0,063917 Media de la vble. dep. Suma de cuad. residuos R-cuadrado F(2, 18) Log-verosimilitud Criterio de Schwarz Desv. Típica Estadístico t 1,11961 9,1234 0,0100951 6,3315 1,662511 0,383053 0,993125 1300,148 11,17436 -16,35726 Valor p <0,00001 <0,00001 D.T. de la vble. dep. D.T. de la regresión R-cuadrado corregido Valor p (de F) Criterio de Akaike Crit. de Hannan-Quinn *** *** 0,152248 0,145879 0,992743 3,43e-20 -18,34872 -17,95997 El programa Gretl permite también obtener directamente las EMCP indicando la variable de ponderación: w1=1/V El programa se encarga de realizar la raíz cuadrada a V. Modelo MCP: estimaciones MC.Ponderados utilizando las 20 observaciones 1-20 Variable dependiente: B Variable utilizada como ponderación: w1 Coeficiente Desv. Típica Estadístico t Valor p const 10,2147 1,11961 9,1234 <0,00001 *** V 0,063917 0,0100951 6,3315 <0,00001 *** Estadísticos basados en los datos ponderados: Suma de cuad. residuos 0,383053 D.T. de la regresión R-cuadrado 0,690125 R-cuadrado corregido F(1, 18) 40,08802 Valor p (de F) Log-verosimilitud 11,17436 Criterio de Akaike Criterio de Schwarz -16,35726 Crit. de Hannan-Quinn Estadísticos basados en los datos originales: Media de la vble. dep. 17,64500 D.T. de la vble. dep. Suma de cuad. residuos 51,40914 D.T. de la regresión 0,145879 0,672910 5,76e-06 -18,34872 -17,95997 2,751550 1,689989 Hay que destacar, que los resultados de la estimación son coincidentes, así como los criterios de Akaike y Schwarz. Sin embargo, el R-cuadrado, F y la SCR no lo son.