323451956.Filminas Clase Práctica_Tema 1

Anuncio
Universidad Nacional de Salta
Facultad de Ciencias Económicas, Jurídicas y Sociales
Licenciatura en economía
Economía Laboral
Aplicación empírica
Tema 1: Introducción al curso.
Indicadores del mercado laboral
Aplicación empírica
2012
Encuesta Permanente de Hogares (EPH)
La Encuesta Permanente de Hogares (EPH) es un programa nacional
de producción sistemática y permanente de información llevado a
cabo el Instituto Nacional de Estadística y Censos (INDEC) que
permite conocer las características sociodemográficas y
socioeconómicas de la población.
La EPH se realiza en centros urbanos de más de 100.000 habitantes.
La EPH pasó de un relevamiento puntual a uno continuo:
Modalidad puntual (EPHP): desde 1974 hasta el 2003. Se realizaba dos veces al
año con una periodicidad semestral: en los meses de mayo y octubre. El ámbito
geográfico de cobertura siguió un plan de incorporación progresiva llegando a
cubrir 28 aglomerados urbanos que representan el 70% de la población urbana del
país.
Modalidad continua (EPHC): el relevamiento se realiza a lo largo de todo el año. Se
publica cada trimestre y cada semestre. La EPHC trimestral cubre 31 aglomerados
urbanos. Actualmente, el tamaño muestral es de 25.000 hogares por trimestre.
Cuestionarios
o La EPH puntual tenía dos cuestionarios:
• uno para la vivienda y el hogar
• otro individual para cada una de las personas sin límite de
edad.
o La EPH continua consta de tres cuestionarios:
• uno de vivienda;
• otro de hogar;
• uno para cada una de las personas de 10 y más años que
conforman el hogar.
Información
La encuesta releva información sobre:
• características demográficas básicas.
• características ocupacionales y de migraciones.
• características habitacionales, educacionales y
de ingresos.
Ver diccionario de la EPH
Diseño de la muestra
Los hogares que son encuestados son seleccionados de forma
aleatoria en dos etapas de selección:
En la primer etapa, dentro de cada aglomerado, se selecciona
una cantidad de radios censales o subdivisiones de los mismos
(áreas). Cada radio censal está constituido por un conjunto de
aproximadamente 300 viviendas.
En la segunda etapa se listan todas las viviendas particulares
de las áreas seleccionadas (radios censales), para efectuar a
partir de ese listado una selección aleatoria de viviendas. Los
hogares que habitan esas viviendas son los hogares a
encuestar.
Esquema de rotación
La EPH renueva periódicamente el conjunto
de hogares a encuestar. La forma en que se
produce esta renovación se denomina
esquema de rotación.
En la EPHP aproximadamente el 75 % de las
viviendas encuestadas en la onda anterior
permanece en la muestra en la onda
siguiente.
En la EPHC el esquema de rotación se lo ha llamado 22-2, dado que su funcionamiento es el siguiente:
Las viviendas de un área ingresan a la
muestra para ser encuestadas en dos trimestres
consecutivos.
Se retiran por dos trimestres consecutivos.
Vuelven a la muestra para ser encuestadas en
dos trimestres consecutivos.
En el caso del esquema 2-2-2, un hogar puede ser
seguido a lo largo de un año y medio.
Ponderación de la muestra
Como en toda encuesta por muestreo, las estimaciones que
surgen de la EPH están afectadas por :
• errores debidos al muestreo (consecuencia de haber
encuestado sólo a una fracción de la población)
• errores no debidos al muestreo: no respuesta, respuestas
incoherentes, etc.
Los ponderadores ajustan las estimaciones de la población de
cada aglomerado relevado por la EPH para que coincidan con las
proyecciones de población realizadas por la Dirección de
Estadísticas Poblacionales del INDEC. De esta forma las
estimaciones a partir de los datos de la muestra permiten hacer
inferencia de la población total que representan.
INTRODUCCIÓN A STATA
*Estas filminas se elaboraron a partir de los apuntes de clase del curso “Seminario de Stata” dictado por Luciano Di Gresia
en la Maestría en Economía, Facultad de Ciencias Económicas, Universidad Nacional de La Plata.
Stata
• STATA es un sistema que permite la gestión de
base de datos y la realización de cálculos
estadísticos y econométricos.
• Ventaja de STATA: se basa en un lenguaje de
programación que respeta una sintaxis.
Comandos (Sintaxis)
• Los comandos conforman un lenguaje de
comunicación con el programa, por lo que
existe una determinada sintaxis que debe ser
respetada.
• La sintaxis de comandos tiene la siguiente
estructura general:
comando [varlist] [if] [in] [weight] [, opciones]
La sintaxis
comando [varlist] [if] [in] [weight] [, opciones]
paso a paso
Sintaxis: comando [varlist]
El comando summarize permite obtener una descripción estadística
de todas las variables que componen el data set:
summarize
El anterior comando puede usarse para obtener la descripción
estadística de:
•
sólo una variable
summarize edad
• ó de más variables
summarize edad edu w
Todas estas maneras de indicar variables se denominan en
la sintaxis como varlist.
Sintaxis: comando [varlist] [if]
La aplicación de este comando restringe
observaciones que cumplen con ciertas
restricciones de alguna/s variable/s mediante la
utilización del “si condicional” (if en inglés).
Para construir una sentencia condicional existen
los siguientes componentes:
– Operadores de comparación:
• == (igual);
• != (no igual);
• >, <, >=, <= (los usuales mayor, menor, etc)
– Operadores lógicos:
• & (y)
• | (o)
• ! (no)
– Operador jerárquico: el paréntesis que determina el
orden de aplicación de las sentencias condicionales.
Algunos ejemplos de sentencias condicionales utilizando
los operadores anteriores
sum edad if varon==1
sum edad if w!=0
sum ocu if varon==1 | (edad>25 & edad< 60)
Sintaxis: comando [varlist] [in]
Permite aplicar el comando a un rango de observaciones, de
acuerdo al orden del data set.
Por ejemplo:
sum edad in 1/10
• Aplica el comando a las 10 primeras observaciones del data set.
sum edad in 5/12
• Aplica el comando a las observaciones entre la 5ta y la 12da.
sum edad in -10/-1
• Aplica el comando a las últimas 10 observaciones.
Sintaxis: comando [varlist] [weight] [if] [, opciones]
[weight]: indica la variable que pondera las observaciones
de la muestra. Por ejemplo,
sum edad [w=pondera] if varon==1
Sintaxis: comando [varlist] [weight] [if] [, opciones]
[,
opciones]: algunos comandos
adicionales. Por ejemplo,
aceptan
opciones
sum edad [w=pondera] if varon==1, detail
tab edad [w=pondera], missing
La sintaxis
comando [varlist] [=exp] [if] [in] [weight]
[, opciones]
Sintaxis: comando [varlist] [= exp]
• Se utiliza generalmente con
comandos: generate y replace.
sólo
dos
• El comando generate permite crear una nueva
variable en el data set. Por ejemplo:
generate edad=.
También puede crearse una variable nueva con
valores surgidos de una operación algebraica.
Por ejemplo:
generate edad2= edad*edad
Este comando crea una nueva variable igual a la original
multiplicada por ella misma.
• El otro comando que usa [=exp] es replace que
permite reemplazar valores de una variable ya
creada. Por ejemplo:
generate varon=.
replace varon=1 if ch04==1 & varon==.
Este comando reemplazó por un uno aquellas observaciones que
tenían valores nulos o missing, siempre que cumpla con la
condición exigida.
Otros comandos básicos
Comando tabulate: permite tabular cantidades de
observaciones según distintos valores de una o dos
variables. Por ejemplo: tabulate varon ó tabulate varon
ch04.
• Comando table: permite obtener una tabla con distintas
estadísticas. Por ejemplo: table varon, c(mean w).
• Comando tabstat: permite obtener la descripción estadística
de variables. Por ejemplo: tabstat w, statistics(mean sum
count max min range sd variance cv p10 median)
• Comandos “destructivos”: eliminan variables u observaciones
de variables. Por ejemplo: clear ó drop if edad<15 .
La sintáxis
[by varlist:] comando [varlist]
[=exp] [if] [in] [weight] [, opciones]
Sintaxis: [by varlist:]
• Permite aplicar el comando por grupos de
observaciones definidos por los distintos valores de
la variable indicada en varlist.
• Es requisito ordenar el data set por la variable que se
va a usar. Por ejemplo:
sort w
by w: sum edad
-
En este caso se obtuvo la descripción estadística para los ocupados con
salarios bajos a altos.
Archivos “DO” y “LOG”
• La forma más eficiente de trabajar con STATA es a partir de
archivos de texto que contienen toda la secuencia de
comandos que componen un proyecto. Esto se denomina
archivo “DO”.
• Los resultados obtenidos pueden ser almacenados en otro
archivo de texto llamado archivo “LOG”.
Archivo “DO”
(secuencia de
comando)
Archivo “DTA”
(dataset)
Archivo “LOG”
( registro de
resultado)
¿Cómo creamos un archivo DO?
• Tenemos dos alternativas:
1. Utilizar el editor de textos que tiene incluido Stata.
2. Utilizar un editor de textos externos:
– Editplus: es un editor de tipo shareware
(www.editplus.com)
– Textpad: es un editor pago (www.textpad.com)
– Crimson: es un editor de tipo freware que puede
encontrarse en www.crimsoneditor.com
El data set
Un data set en Stata puede ser de tres tipos:
- Datos de corte transversal: la unidad de información
es un objeto (un individuo, un país, una provincia, una
empresa, etc.)
- Series de tiempo: la unidad de información es un
momento en el tiempo (un año en particular, o un mes,
un día, etc.)
- Datos de panel: combina las dimensiones anteriores.
Es decir, la unidad de información es un objeto en un
momento del tiempo (un país en un determinado
período).
28
Unión de data sets
Stata permite unir data sets de dos maneras
distintas:
• Con el comando append se agregan nuevas
observaciones a un data set existente.
• Con el comando merge se agregan nuevas
variables a un data set existente.
29
El archivo “LOG”
El archivo log que está en memoria del Stata y que
almacenó los resultados obtenidos puede ser
abierto como archivo de texto. Por ejemplo,
mediante el block de notas.
30
Descargar