“ECONOMETRIA BASICA” TALLER REGRESION MULTIPLE DAVID STIVEN ALTURO ORTIZ JOSÉ JAVIER CERVERA TELLEZ ANDRES JARAMILLO DÌAZ VALENTINA PEREZ VILLA KAREN DAYANA RODRIGUEZ DOMINGUEZ Profesor: RUBÉN DARÍO PRADA Trabajo correspondiente a la tutoría número 5 INSTITUTO DE EDUCACIÓN A DISTANCIA ADMINISTRACIÓN FINANCIERA UNIVERSIDAD DEL TOLIMA IBAGUÉ – TOLIMA 2020 TALLER 5. ANALISIS DE REGRESION MULTIPLE La datos corresponden a la información de las cifras consolidadas del producto interno bruto de colombia desde el año 2000 hasta el año 2014 , explicado a partir de las variables independientes tasa de empleo y fuerza de trabajo. Esta información tiene como fuente el departamento administrativo nacional de estadística(DANE). ● Gráfico de dispersión matricial Se puede apreciar que los datos siguen una tendencia creciente y que están cercanos a la línea de regresión.Por ende se puede inferir a partir de la inspección visual de los datos, que son idóneos para realizar un modelo de regresión múltiple. Análisis de datos ● Correlaciones: Producto interno bruto Colombia Tasa de empleo Fuerza de trabajo Correlaciones Producto Tasa de empleo interno bruto Colombia Correlación de Pearson 1 ,939** ,000 Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N **. La correlación es significativa al nivel 0,01 (bilateral). Fuerza de trabajo ,989** ,000 60 ,939** ,000 60 1 60 ,923** ,000 60 ,989** ,000 60 ,923** ,000 e60 1 60 60 60 En el análisis de correlación se establece que la variables independientes tienen un alto grado de asociación con la variable explicada; en el caso de la variable tasa de empleo la asociación es fuerte y la variable fuerza de trabajo tiene asociación perfecta. Por otro lado el índice de correlación de las variables independientes supera con creces el valor de 0.01. Se concluye que las variables predictoras tienen gran relevancia en el comportamiento de la variable explicada lo que permite generar confianza en el modelo de regresión múltiple. ● ANOVA: Modelo ANOVAa gl Media cuadrática 2 57870785559,2 66 57 36767467,643 Suma de F cuadrados 115741571118, 1573,967 Regresión 531 2095745655,65 1 Residual 2 117837316774, 59 Total 183 a. Variable dependiente: Producto interno bruto Colombia b. Variables predictoras: (Constante), Fuerza de trabajo, Tasa de empleo Sig. ,000b P valor: 0 Hipótesis: Ho: B1=B2=0 :El modelo no es significativo con respecto a X1,X2 H1: B1≠B2≠0 :El modelo es significativo con respecto a X1,X2 ⬅ En el análisis de la ANOVA se obtuvo como resultado un Pvalor menor a 0.05, lo que per mite establecer que el modelo es significativo con respecto a X1 y X2. Esto es porque las variables predictoras describen el comportamiento de la variable dependiente,haciendo el modelo sea funcional y a su vez confirma la hipótesis alternativa. ● Resumen del modelo: Coeficiente de determinación:0,982 Este valor permite deducir que el 98,2% de los datos tienen proximidad o están en la línea de tendencia, teniendo un porcentaje muy mínimo de datos atípicos. Por lo cual las variables tasa de empleo y fuerza de trabajo permiten establecer la tendencia de la variable PIB. Coeficiente de correlaciòn: 0,991 Este coeficiente tiene un grado de asociación perfecto, lo que lleva a decir que los datos siguen una tendencia definida y permiten obtener inferencias a través del modelado de los mismos, para el caso puntual con el análisis de regresión múltiple. ● Tabla de coeficientes: Coeficientesa Modelo Coeficientes no estandarizados Error típ. B (Constante) 1 Tasa de empleo Fuerza de trabajo t Coeficientes tipificados Sig. Beta -169078,654 26622,819 2385,445 601,448 94,555 5,274 -6,351 ,000 ,182 3,966 ,000 ,821 17,930 ,000 Coeficientesa Modelo Límite inferior (Constante) 1 Correlaciones Intervalo de confianza de 99,0% para B Tasa de empleo Fuerza de trabajo Límite superior Orden cero Parcial Semiparcial -240025,018 -98132,290 782,665 3988,225 ,939 ,465 ,070 80,501 108,608 ,989 ,922 ,317 Coeficientesa Estadísticos de colinealidad Modelo Tolerancia FIV (Constante) 1 Tasa de empleo ,149 6,720 Fuerza de trabajo ,149 6,720 a. Variable dependiente: Producto interno bruto Colombia Observando los datos se concluye que no existe correlación entre las variables independientes ya que el valor de los estadísticos de colinealidad son superiores a 0,01. Supuesto de linealidad. ● Gráfico de tendencia: Se observa en el gráfico de dispersión que los datos siguen una tendencia lineal creciente, por lo cual se cumple con el supuesto de linealidad. ● Diagrama de dispersión residuales: Se observa que los puntos de los residuales están dispersos y por ende no cuentan con una tendencia, a consecuencia con este comportamiento no hay linealidad; con esto se comprueba el supuesto de linealidad. Supuesto de normalidad ● Histograma: Se puede observar que la tendencia de la gráfica o campana se comporta como una normal. ● Gráfico Q-Q Plot Este gráfico nos demuestra que existe normalidad dentro de los residuales, ya que los puntos del gráfica están cercanos a la línea. ● Pruebas de normalidad: Pruebas de normalidad Kolmogorov-Smirnova Estadístico gl Sig. ,079 60 ,200* Unstandardized Predicted Value Unstandardized Residual ,081 60 *. Este es un límite inferior de la significación verdadera. a. Corrección de la significación de Lilliefors ,200* Shapiro-Wilk Estadístico gl ,954 60 ,972 60 Sig. ,023 ,186 Para analizar este supuesto se utilizó la prueba de Kolmogorov - Smirnov, ya que la cantidad total de observaciones supera las 50, siendo 60 en total. Primer residual P Valor: 0,79 Segundo residual P Valor: 0,81 Hipótesis: Ho:Los residuales se distribuyen como una normal ⬅ H1: Los residuales no se distribuyen como una normal Se puede determinar que el P Valor de ambos residuales se encuentra por encima de 0,05, por este motivo se asume que los residuales se distribuyen como una normal y se confirma la hipótesis nula y rechaza la alternativa. Supuesto de independencia de los residuales ● Prueba de rachas: Prueba de rachas 3 Unstandardized Unstandardized Predicted Value Residual a b Valor de prueba 185477,99020 14570,15889b Casos < Valor de prueba 59 59 Casos >= Valor de prueba 1 1 Casos en total 60 60 Número de rachas 2 3 Z -5,385 ,186 Sig. asintót. (bilateral) ,000 ,853 a. Moda b. Hay modas múltiples. Se usará la moda con el valor de datos mayor. Se realizó la prueba de rachas ya que los datos se tomaron de forma aleatoria y no tienen una secuencia temporal, podemos observar que el estudio nos da los siguientes datos: Residual 1 P Valor prueba 3: 0,000 Residual 2 P Valor prueba 3: 0,853 Hipótesis: Ho: Nula, los residuos se distribuyen aleatoriamente H1: Alternativa, los residuos no se distribuyen aleatoriamente ⬅ Observamos que el P valor en la prueba 3 es superior a 0,05 en un residual y en restante fue menor a 0,05 siendo este el único valor obtenido y por lo cual existe suficiente evidencia estadística para determinar que se rechaza la hipótesis nula donde se afirma que los residuales se distribuyen aleatoriamente, por esta razón se toma la hipótesis alternativa en la que lo residuales no se distribuyen aleatoriamente. Supuesto de homocedasticidad ● Diagrama de dispersión: Se cumple el supuesto de homocedasticidad, ya que según las indicaciones dadas en el supuesto se entiende que los datos observados son constantes. Sin embargo como se puede observar se tienen 2 datos atípicos, que corresponden al 3,33% del total de los 60 datos observados por lo tanto aun teniendo estas dos diferencias se sigue cumpliendo el supuesto debido al alto porcentaje de los datos constantes. Supuesto de colinealidad ● Tabla de correlaciones: Correlación de Pearson Sig. (unilateral) N Correlaciones Producto Tasa de empleo interno bruto Colombia Producto interno bruto 1,000 ,939 Colombia Tasa de empleo ,939 1,000 Fuerza de trabajo ,989 ,923 Producto interno bruto . ,000 Colombia Tasa de empleo ,000 . Fuerza de trabajo ,000 ,000 Producto interno bruto 60 60 Colombia Tasa de empleo 60 60 Fuerza de trabajo 60 60 Fuerza de trabajo ,989 ,923 1,000 ,000 ,000 . 60 60 60 Coeficiente tasa de empleo con respecto a fuerza de trabajo: 0,939 Se pudo determinar que las variables independientes tasa de empleo y fuerza de trabajo no están relacionadas entre ellas, ya que el coeficiente de pearson está por encima de 0,01, comprobando el supuesto colinealidad. ● Tabla de coeficientes: e Coeficientesa Modelo Coeficientes no estandarizados Error típ. B (Constante) 1 Tasa de empleo Fuerza de trabajo -169078,654 26622,819 2385,445 601,448 94,555 5,274 t Coeficientes tipificados Sig. Beta -6,351 ,000 ,182 3,966 ,000 ,821 17,930 ,000 Coeficientesa Modelo Correlaciones Intervalo de confianza de 99,0% para B Límite inferior (Constante) Límite superior -240025,018 -98132,290 782,665 3988,225 Orden cero Parcial Semiparcial 1 Tasa de empleo ,939 ,465 ,070 Fuerza de trabajo 80,501 108,608 ,989 ,922 ,317 Coeficientesa Estadísticos de colinealidad Modelo Tolerancia FIV (Constante) 1 Tasa de empleo ,149 6,720 Fuerza de trabajo ,149 6,720 a. Variable dependiente: Producto interno bruto Colombia Se confirma que no existe correlación entre las variables independientes ya que el valor de los estadísticos de colinealidad son superiores a 0,01.