Subido por JOSE JAVIER CERVERA TELLEZ

Analisis gráficos regresión múltiple

Anuncio
“ECONOMETRIA BASICA”
TALLER REGRESION MULTIPLE
DAVID STIVEN ALTURO ORTIZ
JOSÉ JAVIER CERVERA TELLEZ
ANDRES JARAMILLO DÌAZ
VALENTINA PEREZ VILLA
KAREN DAYANA RODRIGUEZ DOMINGUEZ
Profesor: RUBÉN DARÍO PRADA
Trabajo correspondiente a la tutoría número 5
INSTITUTO DE EDUCACIÓN A DISTANCIA
ADMINISTRACIÓN FINANCIERA
UNIVERSIDAD DEL TOLIMA
IBAGUÉ – TOLIMA
2020
TALLER 5. ANALISIS DE REGRESION MULTIPLE
La datos corresponden a la información de las cifras consolidadas del producto interno
bruto de colombia desde el año 2000 hasta el año 2014 , explicado a partir de las
variables independientes tasa de empleo y fuerza de trabajo. Esta información tiene
como fuente el departamento administrativo nacional de estadística(DANE).
● Gráfico de dispersión matricial
Se puede apreciar que los datos siguen una tendencia creciente y que están cercanos
a la línea de regresión.Por ende se puede inferir a partir de la inspección visual de los
datos, que son idóneos para realizar un modelo de regresión múltiple.
Análisis de datos
● Correlaciones:
Producto interno bruto
Colombia
Tasa de empleo
Fuerza de trabajo
Correlaciones
Producto
Tasa de empleo
interno bruto
Colombia
Correlación de Pearson
1
,939**
,000
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
**. La correlación es significativa al nivel 0,01 (bilateral).
Fuerza de
trabajo
,989**
,000
60
,939**
,000
60
1
60
,923**
,000
60
,989**
,000
60
,923**
,000
e60
1
60
60
60
En el análisis de correlación se establece que la variables independientes tienen un alto
grado de asociación con la variable explicada; en el caso de la variable tasa de empleo
la asociación es fuerte y la variable fuerza de trabajo tiene asociación perfecta. Por otro
lado el índice de correlación de las variables independientes supera con creces el valor
de 0.01. Se concluye que las variables predictoras tienen gran relevancia en el
comportamiento de la variable explicada lo que permite generar confianza en el modelo
de regresión múltiple.
● ANOVA:
Modelo
ANOVAa
gl
Media
cuadrática
2 57870785559,2
66
57
36767467,643
Suma de
F
cuadrados
115741571118,
1573,967
Regresión
531
2095745655,65
1
Residual
2
117837316774,
59
Total
183
a. Variable dependiente: Producto interno bruto Colombia
b. Variables predictoras: (Constante), Fuerza de trabajo, Tasa de empleo
Sig.
,000b
P valor: 0
Hipótesis:
Ho: B1=B2=0 :El modelo no es significativo con respecto a X1,X2
H1: B1≠B2≠0 :El modelo es significativo con respecto a X1,X2 ⬅
En el análisis de la ANOVA se obtuvo como resultado un Pvalor menor a 0.05, lo que per
mite establecer que el modelo es significativo con respecto a X1 y X2. Esto es porque las
variables predictoras describen el comportamiento de la variable dependiente,haciendo
el modelo sea funcional y a su vez confirma la hipótesis alternativa.
● Resumen del modelo:
Coeficiente de determinación:0,982
Este valor permite deducir que el 98,2% de los datos tienen proximidad o están en la
línea de tendencia, teniendo un porcentaje muy mínimo de datos atípicos. Por lo cual las
variables tasa de empleo y fuerza de trabajo permiten establecer la tendencia de la
variable PIB.
Coeficiente de correlaciòn: 0,991
Este coeficiente tiene un grado de asociación perfecto, lo que lleva a decir que los datos
siguen una tendencia definida y permiten obtener inferencias a través del modelado de
los mismos, para el caso puntual con el análisis de regresión múltiple.
● Tabla de coeficientes:
Coeficientesa
Modelo
Coeficientes no estandarizados
Error típ.
B
(Constante)
1
Tasa de empleo
Fuerza de trabajo
t
Coeficientes
tipificados
Sig.
Beta
-169078,654
26622,819
2385,445
601,448
94,555
5,274
-6,351
,000
,182
3,966
,000
,821
17,930
,000
Coeficientesa
Modelo
Límite inferior
(Constante)
1
Correlaciones
Intervalo de confianza de 99,0%
para B
Tasa de empleo
Fuerza de trabajo
Límite superior
Orden cero
Parcial
Semiparcial
-240025,018
-98132,290
782,665
3988,225
,939
,465
,070
80,501
108,608
,989
,922
,317
Coeficientesa
Estadísticos de colinealidad
Modelo
Tolerancia
FIV
(Constante)
1
Tasa de empleo
,149
6,720
Fuerza de trabajo
,149
6,720
a. Variable dependiente: Producto interno bruto Colombia
Observando los datos se concluye que no existe correlación entre las variables
independientes ya que el valor de los estadísticos de colinealidad son superiores a
0,01.
Supuesto de linealidad.
● Gráfico de tendencia:
Se observa en el gráfico de dispersión que los datos siguen una tendencia lineal
creciente, por lo cual se cumple con el supuesto de linealidad.
● Diagrama de dispersión residuales:
Se observa que los puntos de los residuales están dispersos y por ende no cuentan con
una tendencia, a consecuencia con este comportamiento no hay linealidad; con esto se
comprueba el supuesto de linealidad.
Supuesto de normalidad
● Histograma:
Se puede observar que la tendencia de la gráfica o campana se comporta como una
normal.
● Gráfico Q-Q Plot
Este gráfico nos demuestra que existe normalidad dentro de los residuales, ya que los
puntos del gráfica están cercanos a la línea.
● Pruebas de normalidad:
Pruebas de normalidad
Kolmogorov-Smirnova
Estadístico
gl
Sig.
,079
60
,200*
Unstandardized Predicted
Value
Unstandardized Residual
,081
60
*. Este es un límite inferior de la significación verdadera.
a. Corrección de la significación de Lilliefors
,200*
Shapiro-Wilk
Estadístico
gl
,954
60
,972
60
Sig.
,023
,186
Para analizar este supuesto se utilizó la prueba de Kolmogorov - Smirnov, ya que la
cantidad total de observaciones supera las 50, siendo 60 en total.
Primer residual P Valor: 0,79
Segundo residual P Valor: 0,81
Hipótesis:
Ho:Los residuales se distribuyen como una normal ⬅
H1: Los residuales no se distribuyen como una normal
Se puede determinar que el P Valor de ambos residuales se encuentra por encima de
0,05, por este motivo se asume que los residuales se distribuyen como una normal y se
confirma la hipótesis nula y rechaza la alternativa.
Supuesto de independencia de los residuales
● Prueba de rachas:
Prueba de rachas 3
Unstandardized Unstandardized
Predicted Value
Residual
a
b
Valor de prueba
185477,99020
14570,15889b
Casos < Valor de prueba
59
59
Casos >= Valor de prueba
1
1
Casos en total
60
60
Número de rachas
2
3
Z
-5,385
,186
Sig. asintót. (bilateral)
,000
,853
a. Moda
b. Hay modas múltiples. Se usará la moda con el valor de datos
mayor.
Se realizó la prueba de rachas ya que los datos se tomaron de forma aleatoria y no
tienen una secuencia temporal, podemos observar que el estudio nos da los siguientes
datos:
Residual 1 P Valor prueba 3: 0,000
Residual 2 P Valor prueba 3: 0,853
Hipótesis:
Ho: Nula, los residuos se distribuyen aleatoriamente
H1: Alternativa, los residuos no se distribuyen aleatoriamente ⬅
Observamos que el P valor en la prueba 3 es superior a 0,05 en un residual y en restante
fue menor a 0,05 siendo este el único valor obtenido y por lo cual existe suficiente
evidencia estadística para determinar que se rechaza la hipótesis nula donde se afirma
que los residuales se distribuyen aleatoriamente, por esta razón se toma la hipótesis
alternativa en la que lo residuales no se distribuyen aleatoriamente.
Supuesto de homocedasticidad
● Diagrama de dispersión:
Se cumple el supuesto de homocedasticidad, ya que según las indicaciones dadas en el
supuesto se entiende que los datos observados son constantes. Sin embargo como se
puede observar se tienen 2 datos atípicos, que corresponden al 3,33% del total de los 60
datos observados por lo tanto aun teniendo estas dos diferencias se sigue cumpliendo el
supuesto debido al alto porcentaje de los datos constantes.
Supuesto de colinealidad
● Tabla de correlaciones:
Correlación de Pearson
Sig. (unilateral)
N
Correlaciones
Producto
Tasa de empleo
interno bruto
Colombia
Producto interno bruto
1,000
,939
Colombia
Tasa de empleo
,939
1,000
Fuerza de trabajo
,989
,923
Producto interno bruto
.
,000
Colombia
Tasa de empleo
,000
.
Fuerza de trabajo
,000
,000
Producto interno bruto
60
60
Colombia
Tasa de empleo
60
60
Fuerza de trabajo
60
60
Fuerza de
trabajo
,989
,923
1,000
,000
,000
.
60
60
60
Coeficiente tasa de empleo con respecto a fuerza de trabajo: 0,939
Se pudo determinar que las variables independientes tasa de empleo y fuerza de
trabajo no están relacionadas entre ellas, ya que el coeficiente de pearson está por
encima de 0,01, comprobando el supuesto colinealidad.
● Tabla de coeficientes:
e Coeficientesa
Modelo
Coeficientes no estandarizados
Error típ.
B
(Constante)
1
Tasa de empleo
Fuerza de trabajo
-169078,654
26622,819
2385,445
601,448
94,555
5,274
t
Coeficientes
tipificados
Sig.
Beta
-6,351
,000
,182
3,966
,000
,821
17,930
,000
Coeficientesa
Modelo
Correlaciones
Intervalo de confianza de 99,0%
para B
Límite inferior
(Constante)
Límite superior
-240025,018
-98132,290
782,665
3988,225
Orden cero
Parcial
Semiparcial
1
Tasa de empleo
,939
,465
,070
Fuerza de trabajo
80,501
108,608
,989
,922
,317
Coeficientesa
Estadísticos de colinealidad
Modelo
Tolerancia
FIV
(Constante)
1
Tasa de empleo
,149
6,720
Fuerza de trabajo
,149
6,720
a. Variable dependiente: Producto interno bruto Colombia
Se confirma que no existe correlación entre las variables independientes ya que el valor
de los estadísticos de colinealidad son superiores a 0,01.
Descargar