I. Fusionando bases de datos I. Ordenando la

Anuncio
UNIVERSIDAD NACIONAL DEL CALLAO
FACULTAD DE CIENCIAS ECONÓMICAS
ESCUELA PROFESIONAL DE ECONOMÍA
Introducción a Stata 12
Tarea # 2
I. Fusionando bases de datos
La segunda tarea consiste en utilizar la base de datos sumaria de la Encuesta Nacional de Hogares
(ENAHO) que realiza el INEI. Al respecto, lo primero es fusionar la base de datos sumaria 2010.dta con
la base de datos depart.dta con la idea de obtener una serie de resultados por departamento y para Lima
Metropolitana y Callao. La base de datos depart.dta contiene los códigos de departamento, provincia y
distrito además de la variable ubigeo, que es la variable a partir de la cual se debe realizar la fusión de
las bases de datos.
En esta parte de la tarea se pide:
a) Fusionar ambas bases de datos teniendo en cuenta la base de datos sumaria 2010.dta como base
“master” (utilice el comando merge)
b) Elimine las observaciones para las cuales no se llevó a cabo la fusión de los datos (no olvide que
cuando fusionamos bases de datos se genera una variable merge, utilice esta variable para llevar a
cabo este paso.)
c) Ordene las variables que se han agregado al final de la base de datos de tal forma que se ubiquen
antes de la variable ubigeo (use el comando order )
d) Note que la variable depart, que contiene el nombre de los departamentos, está en formato “string”.
Tranforme esta variable a un formato numérico a través del comando encode y genere una nueva
variable llamada depart1.
I. Ordenando la base de datos para obtener resultados departamentales y por Lima Metropolitana y Callao
La base de datos original permite obtener resultados por dominio geográfico y por departamentos. Sin
embargo no se distingue Lima Metropolitana y Callao del resto de las provincias de Lima. Para obtener
resultados a nivel de Lima Metropolitana y Callao se deben seguir los siguientes pasos:
1
a) Genere una variable denominada depart n que sea igual a depart1 y asignele la etiqueta “Departamentos con Lima Metropolitana y Callao” (use los comandos gen y label variable).
b) Reemplace los valores de la variable depart n con el número 26 si pertenecen a Lima Metropolitana o
al Callao (use el comando replace y los condicionales teniendo en cuenta los códigos de departamento
y códigos de provincia).
c) Asigne las etiquetas de la variable depart1 a la nueva variable depart n (use el comando label copy)
y agregue una etiqueta “LIMA METROPOLITANA y CALLAO” a las obervaciones que pertencen
a Lima Metropolitana y Callao (use el comandos label define con la opción add ). Adicionalmente,
modifique la etiqueta para el resto de provincias de Lima con la etiqueta “LIMA PROVINCIAS”
(use el comando label define con la opción modify y finalmente el comando label value para asignar
las etiquetas con las modificaciones realizadas).
c) Realice tabulados para las variables depart1 y depart n para verificar que llevo a cabo de manera
adecuada esta sección.
III. Manos a la obra
Una vez que hemos llevado a cabo las operaciones que nos permiten tener resultados por departamentos
y a nivel de Lima separar los resultados por Lima Metropolitana y Callao, procederemos a crear una
serie de tabulados, tablas y gráficos. En esta sección deberá realizar las siguientes acciones (reporte todos
los resultados haciendo uso de los factores de expansión, al respecto, utilice la opción de ponderador de
frecuencias. Para ello deberá generar una nueva variable que contenga el factor (denominelo factor f)
redondeado a partir del factor de expansión correspondiente al censo de año 2007):
a) Cree un tabulado que permita observar los niveles de pobreza por dominio geográfico (sólo reporte
los porcentajes).
b) Cree un tabulado que permita observar los niveles de pobreza por departamento (use la variable
depart n).
c) Cree una variable denominada “area” que tenga el valor de 1 si el hogar pertenece a un área urbana
y 2 si el hogar pertenece a un área rural y obtenga un tabulado que permita observar los niveles
de pobreza por área urbana y rural (Para crear la variable “area” deberá hacer uso de la variable
“estrato”, que clasifica a los hogares de acuerdo con las definiciones del INEI. No olvide agregar
etiquetas a los valores para la variable generada).
d) Cree un tabulado de los niveles de pobreza por área urbana y rural para el los departamentos de
Huancaveliva, Ica y Lima Metropolitana y Callao.
e) Genere una tabla que permita observar por departamento el número promedio de miembros del
hogar y el número promedio de perceptores de ingreso por hogar.
f) Genera una tabla que permita observar por departamentos los valores promedio de las lı́neas de
pobreza alimentaria y de las lı́neas de pobreza total.
2
g) Genera una tabla que permita observar por área urbana y rural los valores promedio de las lı́neas
de pobreza alimentaria y de las lı́neas de pobreza total.
h) Genera una tabla que permita observar por departamento los niveles promedio y la desviación
estándar de los ingresos monetarios netos mensuales asi como de los gastos monetarios mensuales por
hogar (las variables originales están en términos anuales, genere las variables en términos mensuales
previamente).
h) Finalmente, replique el siguiente gráfico.
En este gráfico se pueden observar los niveles promedio por mes de los ingresos y gastos
monetarios por hogar dependiendo de si pertenecen al área urbana o rural (use el comando
graph bar, y las opciones de tı́tulo, subtı́tulo, titulos en los ejes, utilice el esquema Stata
Journal y modifique las leyendas para que aparezcan como en el gráfico. No olvide reportar
sus resultados usando los factores de expansión).
IV. Precisiones sobre la entrega de la tarea
La tarea deberá ser enviada por correo electrónico a la cuenta [email protected]. La fecha lı́mite es el
23 de febrero. Deberán enviar un archivo en word (con las tablas y gráficos) y un do-file con las siguientes
especificaciones:
T2 Nombre Apellido.docx
T2 Nombre Apellido.do
3
Descargar