Análisis estadístico con stata

Anuncio
CURSO: ECONOMETRÍA Y
ANÁLISIS DE POLÍTICAS FISCALES
INSTRUCTOR: HORACIO CATALÁN ALONSO
Análisis Estadístico
con STATA
• Stata se considera un “paquete para análisis
estadístico”
• Trabaja con datos de sección cruzada, series de
tiempo y datos panel
• Se puede utilizar es sistemas operativos de
Windows, Macintosh, Unix y Linux
http://www.stata.com
• Stata/MP: The fastest version of Stata (for dual-core
and multicore/multiprocessor computers)
• Stata/SE: Stata for large datasets
• Stata/IC: Stata for moderate-sized datasets
• Small Stata: A version of Stata that handles small
datasets (for educational purchases only)
• Numerics by Stata: Stata for embedded and web
applications
Lista de
variables
Historial
de
instrucciones
Ventana de
Resultados
Editor de comandos
Características de
las variables
Comandos básicos
Syntax
[prefix :] command [varlist] [=exp] [if] [in] [weight]
[using filename]
[, options]
Cambio de directorio
cd c:\practica\stata_1\
Log files guarda los resultados de
Stata la extensión es .log
se puede cambiar a txt
File/Log/Begin..
Se debe iniciar abriendo este archivo
Seleccionar
Hacer una copia y pegar en Stata
Comandos básicos
Syntax
command [nombre var] [=operación] [if] [in] [, opciones]
• Crear un archivo con extensión “do”
• Permite editar y ejecutar las
instrucciones
Evolución del PIB 1965-2014
200
400
600
pib
800
1000
1200
(miles de millones de dólares USA de 2010)
1960
1980
2000
tiempo
Fuente: Con base en información de INEGI
2020
(Dólares por persona de 2010)
(tons eq petróleo por persona)
.8
1
1.21.4 1.61.8
Consumo de Energía 1965-2014
engp
pibp
10000
5000
6000
7000
8000
9000
PIB per cápita 1965-2014
1960
1980
2000
2020
1960
1980
tiempo
Fuente: Con base en información de INEGI
(tons CO2 eq por persona)
(barriles por cada 1000 dólares)
3.5
ieng
3
2.5
1980
2000
tiempo
Fuente: Con base en información de IEA
2020
1.2 1.3 1.4 1.5 1.6
Intensidad Energética 1965-2014
4
Emisiones CO2 1965-2014
2
co2p
2020
Fuente: Con base en información de SENER
1.5
1960
2000
tiempo
1960
1980
2000
tiempo
Fuente: Con base en información de IEA
2020
GRÁFICOS DE DISPERSIÓN: Permite
representar la evolución conjunta de ambas
variables
Dadas dos variables (Y, X) tomadas sobre el mismo
elemento de la población, el diagrama de dispersión es
simplemente un gráfico de dos dimensiones, donde en un
eje (la abscisa) se sitúa una variable, y en el otro eje (la
ordenada) se sitúa la otra variable
Si las variables están correlacionadas, el gráfico mostraría
algún nivel de correlación (tendencia) entre las dos
variables. Si no hay ninguna correlación, el gráfico
presentaría una figura sin forma, una nube de puntos
dispersos en el gráfico.
Variable X
Relación lineal positiva
Variable Y
Variable Y
Variable Y
Representación gráfica de una relación
Variable X
Sin relación
Variable X
Relación lineal negativa
Energía vs PIB
1
.5
2
1
3
1.5
4
2
5
Emisiones CO2 vs PIB
7000
8000
9000
10000
5000
6000
7000
pibp
8000
9000
pibp
95% CI
Fitted values
Fitted values
engp
95% CI
Fitted values
3
4
Emisiones CO2 vs ENG
2
6000
1
5000
.8
1
1.2
1.4
1.6
engp
95% CI
Fitted values
Fitted values
co2p
1.8
Fitted values
co2p
10000
1970-1979
1980-1989
4
1965-1969
3
3.2
1.5
1.2
.86
1.3
1.1
1.5
0
1
2
2.3
1990-1999
2000-2014
4
3.7
1.5
1.8
1.4
1.4
0
1
2
3
3.3
mean of engp
mean of ieng
Graphs by periodo
mean of co2p
1.5
-5
0
5
10
15
Tasas de crecimeinto
1960
1980
2000
tiempo
dpib
dco2
deng
2020
Modelo de Regresión Lineal
CO2p = 𝛼 + 𝛽𝑃𝐼𝐵𝑝
El modelo establece que un cambio en una unidad de del
PIB per cápita produce u ocasiona un cambio en las
emisiones per cápita de CO2, medido por el parámetro 𝛽
Este modelo podría ser adecuado si la línea recta pasará
por todos los puntos del diagrama de dispersión
Debido a que los valores observados de la línea recta del
modelo se define un erro
Yi    X i
𝑢𝑖
La diferencia entre el valor observado de la variable y la
recta estimada se denomina error
CO2p = 𝛼 + 𝛽𝑃𝐼𝐵𝑝
CO2p = −0.655 + 0.000479𝑃𝐼𝐵𝑝
TABLA DE ANALISIS DE LA VARIANZA (ANOVA)
𝑁
𝑅𝑒𝑔𝑆𝑆 = ෍ 𝑌෠𝑖 − 𝑌ത
2
𝑖=1
Regression Sum of Squares
Variabilidad explicada por el modelo
𝑁
𝑅𝑆𝑆 = ෍ 𝑌𝑖 − 𝑌෠𝑖
𝑁
𝑇𝑆𝑆 = ෍ 𝑌෠𝑖 − 𝑌ത
2 Total Sum of Squares
Variabilidad Total
𝑖=1
𝑖=1
Residual Sum of Squares
Variabilidad NO EXPLICADA
MS (Mean Square)
𝑇𝑆𝑆 = 𝑅𝑒𝑔𝑆𝑆 + 𝑅𝑆𝑆
2
N
R
2
 1
 uˆ
i 1
N
2
i
 Y  Y 
i 1
2
i
𝛽
𝑠𝑒(𝛽)
𝛽መ
𝑡=
𝑠𝑒(𝛽)
𝛽±𝑡
0.975,𝑁−𝑘
𝑠𝑒(𝛽)
𝛼
𝑠𝑒(𝛼)
𝑡=
𝛼ො
𝑠𝑒(𝛼)
𝛼±𝑡
0.975,𝑁−𝑘
𝑠𝑒(𝛼)
N
N
 CO2 YP  CO2 YP
i
̂ 
i
i
i 1
i 1
N
 N

 YPi 2  YP YPi 


i 1
 i 1



La curva ambiental de Kuznets, representada por una U invertida,
es una de las hipótesis básicas para explicar la relación entre nivel
de ingreso per cápita y el medio ambiente
Las causas económicas que originan este comportamiento son
múltiples
Tres efectos principales: de escala, de composición y tecnológico
𝐶𝑂2𝑡 = 𝛽0 + 𝛽1 𝑌𝑃𝑡 + 𝛽2 𝑌𝑃𝑡2 + 𝛽3 𝑌𝑃𝑡3 + ෍
𝑘
𝑗=1
𝛾𝑗 𝑋𝑗,𝑡 + 𝑢𝑡
4
3.5
3
2.5
2
1.5
5000
6000
7000
8000
pibp
Fitted values
co2p
9000
10000
CURSO: ECONOMETRÍA Y
ANÁLISIS DE POLÍTICAS FISCALES
INSTRUCTOR: HORACIO CATALÁN ALONSO
Descargar