UNIVERSIDAD NACIONAL DEL CALLAO FACULTAD DE CIENCIAS ECONÓMICAS ESCUELA PROFESIONAL DE ECONOMÍA Introducción a Stata 12 Tarea # 2 I. Fusionando bases de datos La segunda tarea consiste en utilizar la base de datos sumaria de la Encuesta Nacional de Hogares (ENAHO) que realiza el INEI. Al respecto, lo primero es fusionar la base de datos sumaria 2010.dta con la base de datos depart.dta con la idea de obtener una serie de resultados por departamento y para Lima Metropolitana y Callao. La base de datos depart.dta contiene los códigos de departamento, provincia y distrito además de la variable ubigeo, que es la variable a partir de la cual se debe realizar la fusión de las bases de datos. En esta parte de la tarea se pide: a) Fusionar ambas bases de datos teniendo en cuenta la base de datos sumaria 2010.dta como base “master” (utilice el comando merge) b) Elimine las observaciones para las cuales no se llevó a cabo la fusión de los datos (no olvide que cuando fusionamos bases de datos se genera una variable merge, utilice esta variable para llevar a cabo este paso.) c) Ordene las variables que se han agregado al final de la base de datos de tal forma que se ubiquen antes de la variable ubigeo (use el comando order ) d) Note que la variable depart, que contiene el nombre de los departamentos, está en formato “string”. Tranforme esta variable a un formato numérico a través del comando encode y genere una nueva variable llamada depart1. I. Ordenando la base de datos para obtener resultados departamentales y por Lima Metropolitana y Callao La base de datos original permite obtener resultados por dominio geográfico y por departamentos. Sin embargo no se distingue Lima Metropolitana y Callao del resto de las provincias de Lima. Para obtener resultados a nivel de Lima Metropolitana y Callao se deben seguir los siguientes pasos: 1 a) Genere una variable denominada depart n que sea igual a depart1 y asignele la etiqueta “Departamentos con Lima Metropolitana y Callao” (use los comandos gen y label variable). b) Reemplace los valores de la variable depart n con el número 26 si pertenecen a Lima Metropolitana o al Callao (use el comando replace y los condicionales teniendo en cuenta los códigos de departamento y códigos de provincia). c) Asigne las etiquetas de la variable depart1 a la nueva variable depart n (use el comando label copy) y agregue una etiqueta “LIMA METROPOLITANA y CALLAO” a las obervaciones que pertencen a Lima Metropolitana y Callao (use el comandos label define con la opción add ). Adicionalmente, modifique la etiqueta para el resto de provincias de Lima con la etiqueta “LIMA PROVINCIAS” (use el comando label define con la opción modify y finalmente el comando label value para asignar las etiquetas con las modificaciones realizadas). c) Realice tabulados para las variables depart1 y depart n para verificar que llevo a cabo de manera adecuada esta sección. III. Manos a la obra Una vez que hemos llevado a cabo las operaciones que nos permiten tener resultados por departamentos y a nivel de Lima separar los resultados por Lima Metropolitana y Callao, procederemos a crear una serie de tabulados, tablas y gráficos. En esta sección deberá realizar las siguientes acciones (reporte todos los resultados haciendo uso de los factores de expansión, al respecto, utilice la opción de ponderador de frecuencias. Para ello deberá generar una nueva variable que contenga el factor (denominelo factor f) redondeado a partir del factor de expansión correspondiente al censo de año 2007): a) Cree un tabulado que permita observar los niveles de pobreza por dominio geográfico (sólo reporte los porcentajes). b) Cree un tabulado que permita observar los niveles de pobreza por departamento (use la variable depart n). c) Cree una variable denominada “area” que tenga el valor de 1 si el hogar pertenece a un área urbana y 2 si el hogar pertenece a un área rural y obtenga un tabulado que permita observar los niveles de pobreza por área urbana y rural (Para crear la variable “area” deberá hacer uso de la variable “estrato”, que clasifica a los hogares de acuerdo con las definiciones del INEI. No olvide agregar etiquetas a los valores para la variable generada). d) Cree un tabulado de los niveles de pobreza por área urbana y rural para el los departamentos de Huancaveliva, Ica y Lima Metropolitana y Callao. e) Genere una tabla que permita observar por departamento el número promedio de miembros del hogar y el número promedio de perceptores de ingreso por hogar. f) Genera una tabla que permita observar por departamentos los valores promedio de las lı́neas de pobreza alimentaria y de las lı́neas de pobreza total. 2 g) Genera una tabla que permita observar por área urbana y rural los valores promedio de las lı́neas de pobreza alimentaria y de las lı́neas de pobreza total. h) Genera una tabla que permita observar por departamento los niveles promedio y la desviación estándar de los ingresos monetarios netos mensuales asi como de los gastos monetarios mensuales por hogar (las variables originales están en términos anuales, genere las variables en términos mensuales previamente). h) Finalmente, replique el siguiente gráfico. En este gráfico se pueden observar los niveles promedio por mes de los ingresos y gastos monetarios por hogar dependiendo de si pertenecen al área urbana o rural (use el comando graph bar, y las opciones de tı́tulo, subtı́tulo, titulos en los ejes, utilice el esquema Stata Journal y modifique las leyendas para que aparezcan como en el gráfico. No olvide reportar sus resultados usando los factores de expansión). IV. Precisiones sobre la entrega de la tarea La tarea deberá ser enviada por correo electrónico a la cuenta ruizerix@gmail.com. La fecha lı́mite es el 23 de febrero. Deberán enviar un archivo en word (con las tablas y gráficos) y un do-file con las siguientes especificaciones: T2 Nombre Apellido.docx T2 Nombre Apellido.do 3