CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES INSTRUCTOR: HORACIO CATALÁN ALONSO Análisis Estadístico con STATA • Stata se considera un “paquete para análisis estadístico” • Trabaja con datos de sección cruzada, series de tiempo y datos panel • Se puede utilizar es sistemas operativos de Windows, Macintosh, Unix y Linux http://www.stata.com • Stata/MP: The fastest version of Stata (for dual-core and multicore/multiprocessor computers) • Stata/SE: Stata for large datasets • Stata/IC: Stata for moderate-sized datasets • Small Stata: A version of Stata that handles small datasets (for educational purchases only) • Numerics by Stata: Stata for embedded and web applications Lista de variables Historial de instrucciones Ventana de Resultados Editor de comandos Características de las variables Comandos básicos Syntax [prefix :] command [varlist] [=exp] [if] [in] [weight] [using filename] [, options] Cambio de directorio cd c:\practica\stata_1\ Log files guarda los resultados de Stata la extensión es .log se puede cambiar a txt File/Log/Begin.. Se debe iniciar abriendo este archivo Seleccionar Hacer una copia y pegar en Stata Comandos básicos Syntax command [nombre var] [=operación] [if] [in] [, opciones] • Crear un archivo con extensión “do” • Permite editar y ejecutar las instrucciones Evolución del PIB 1965-2014 200 400 600 pib 800 1000 1200 (miles de millones de dólares USA de 2010) 1960 1980 2000 tiempo Fuente: Con base en información de INEGI 2020 (Dólares por persona de 2010) (tons eq petróleo por persona) .8 1 1.21.4 1.61.8 Consumo de Energía 1965-2014 engp pibp 10000 5000 6000 7000 8000 9000 PIB per cápita 1965-2014 1960 1980 2000 2020 1960 1980 tiempo Fuente: Con base en información de INEGI (tons CO2 eq por persona) (barriles por cada 1000 dólares) 3.5 ieng 3 2.5 1980 2000 tiempo Fuente: Con base en información de IEA 2020 1.2 1.3 1.4 1.5 1.6 Intensidad Energética 1965-2014 4 Emisiones CO2 1965-2014 2 co2p 2020 Fuente: Con base en información de SENER 1.5 1960 2000 tiempo 1960 1980 2000 tiempo Fuente: Con base en información de IEA 2020 GRÁFICOS DE DISPERSIÓN: Permite representar la evolución conjunta de ambas variables Dadas dos variables (Y, X) tomadas sobre el mismo elemento de la población, el diagrama de dispersión es simplemente un gráfico de dos dimensiones, donde en un eje (la abscisa) se sitúa una variable, y en el otro eje (la ordenada) se sitúa la otra variable Si las variables están correlacionadas, el gráfico mostraría algún nivel de correlación (tendencia) entre las dos variables. Si no hay ninguna correlación, el gráfico presentaría una figura sin forma, una nube de puntos dispersos en el gráfico. Variable X Relación lineal positiva Variable Y Variable Y Variable Y Representación gráfica de una relación Variable X Sin relación Variable X Relación lineal negativa Energía vs PIB 1 .5 2 1 3 1.5 4 2 5 Emisiones CO2 vs PIB 7000 8000 9000 10000 5000 6000 7000 pibp 8000 9000 pibp 95% CI Fitted values Fitted values engp 95% CI Fitted values 3 4 Emisiones CO2 vs ENG 2 6000 1 5000 .8 1 1.2 1.4 1.6 engp 95% CI Fitted values Fitted values co2p 1.8 Fitted values co2p 10000 1970-1979 1980-1989 4 1965-1969 3 3.2 1.5 1.2 .86 1.3 1.1 1.5 0 1 2 2.3 1990-1999 2000-2014 4 3.7 1.5 1.8 1.4 1.4 0 1 2 3 3.3 mean of engp mean of ieng Graphs by periodo mean of co2p 1.5 -5 0 5 10 15 Tasas de crecimeinto 1960 1980 2000 tiempo dpib dco2 deng 2020 Modelo de Regresión Lineal CO2p = 𝛼 + 𝛽𝑃𝐼𝐵𝑝 El modelo establece que un cambio en una unidad de del PIB per cápita produce u ocasiona un cambio en las emisiones per cápita de CO2, medido por el parámetro 𝛽 Este modelo podría ser adecuado si la línea recta pasará por todos los puntos del diagrama de dispersión Debido a que los valores observados de la línea recta del modelo se define un erro Yi X i 𝑢𝑖 La diferencia entre el valor observado de la variable y la recta estimada se denomina error CO2p = 𝛼 + 𝛽𝑃𝐼𝐵𝑝 CO2p = −0.655 + 0.000479𝑃𝐼𝐵𝑝 TABLA DE ANALISIS DE LA VARIANZA (ANOVA) 𝑁 𝑅𝑒𝑔𝑆𝑆 = 𝑌𝑖 − 𝑌ത 2 𝑖=1 Regression Sum of Squares Variabilidad explicada por el modelo 𝑁 𝑅𝑆𝑆 = 𝑌𝑖 − 𝑌𝑖 𝑁 𝑇𝑆𝑆 = 𝑌𝑖 − 𝑌ത 2 Total Sum of Squares Variabilidad Total 𝑖=1 𝑖=1 Residual Sum of Squares Variabilidad NO EXPLICADA MS (Mean Square) 𝑇𝑆𝑆 = 𝑅𝑒𝑔𝑆𝑆 + 𝑅𝑆𝑆 2 N R 2 1 uˆ i 1 N 2 i Y Y i 1 2 i 𝛽 𝑠𝑒(𝛽) 𝛽መ 𝑡= 𝑠𝑒(𝛽) 𝛽±𝑡 0.975,𝑁−𝑘 𝑠𝑒(𝛽) 𝛼 𝑠𝑒(𝛼) 𝑡= 𝛼ො 𝑠𝑒(𝛼) 𝛼±𝑡 0.975,𝑁−𝑘 𝑠𝑒(𝛼) N N CO2 YP CO2 YP i ̂ i i i 1 i 1 N N YPi 2 YP YPi i 1 i 1 La curva ambiental de Kuznets, representada por una U invertida, es una de las hipótesis básicas para explicar la relación entre nivel de ingreso per cápita y el medio ambiente Las causas económicas que originan este comportamiento son múltiples Tres efectos principales: de escala, de composición y tecnológico 𝐶𝑂2𝑡 = 𝛽0 + 𝛽1 𝑌𝑃𝑡 + 𝛽2 𝑌𝑃𝑡2 + 𝛽3 𝑌𝑃𝑡3 + 𝑘 𝑗=1 𝛾𝑗 𝑋𝑗,𝑡 + 𝑢𝑡 4 3.5 3 2.5 2 1.5 5000 6000 7000 8000 pibp Fitted values co2p 9000 10000 CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES INSTRUCTOR: HORACIO CATALÁN ALONSO