Universidad Nacional de Salta Facultad de Ciencias Económicas, Jurídicas y Sociales Licenciatura en economía Economía Laboral Aplicación empírica Tema 1: Introducción al curso. Indicadores del mercado laboral Aplicación empírica 2012 Encuesta Permanente de Hogares (EPH) La Encuesta Permanente de Hogares (EPH) es un programa nacional de producción sistemática y permanente de información llevado a cabo el Instituto Nacional de Estadística y Censos (INDEC) que permite conocer las características sociodemográficas y socioeconómicas de la población. La EPH se realiza en centros urbanos de más de 100.000 habitantes. La EPH pasó de un relevamiento puntual a uno continuo: Modalidad puntual (EPHP): desde 1974 hasta el 2003. Se realizaba dos veces al año con una periodicidad semestral: en los meses de mayo y octubre. El ámbito geográfico de cobertura siguió un plan de incorporación progresiva llegando a cubrir 28 aglomerados urbanos que representan el 70% de la población urbana del país. Modalidad continua (EPHC): el relevamiento se realiza a lo largo de todo el año. Se publica cada trimestre y cada semestre. La EPHC trimestral cubre 31 aglomerados urbanos. Actualmente, el tamaño muestral es de 25.000 hogares por trimestre. Cuestionarios o La EPH puntual tenía dos cuestionarios: • uno para la vivienda y el hogar • otro individual para cada una de las personas sin límite de edad. o La EPH continua consta de tres cuestionarios: • uno de vivienda; • otro de hogar; • uno para cada una de las personas de 10 y más años que conforman el hogar. Información La encuesta releva información sobre: • características demográficas básicas. • características ocupacionales y de migraciones. • características habitacionales, educacionales y de ingresos. Ver diccionario de la EPH Diseño de la muestra Los hogares que son encuestados son seleccionados de forma aleatoria en dos etapas de selección: En la primer etapa, dentro de cada aglomerado, se selecciona una cantidad de radios censales o subdivisiones de los mismos (áreas). Cada radio censal está constituido por un conjunto de aproximadamente 300 viviendas. En la segunda etapa se listan todas las viviendas particulares de las áreas seleccionadas (radios censales), para efectuar a partir de ese listado una selección aleatoria de viviendas. Los hogares que habitan esas viviendas son los hogares a encuestar. Esquema de rotación La EPH renueva periódicamente el conjunto de hogares a encuestar. La forma en que se produce esta renovación se denomina esquema de rotación. En la EPHP aproximadamente el 75 % de las viviendas encuestadas en la onda anterior permanece en la muestra en la onda siguiente. En la EPHC el esquema de rotación se lo ha llamado 22-2, dado que su funcionamiento es el siguiente: Las viviendas de un área ingresan a la muestra para ser encuestadas en dos trimestres consecutivos. Se retiran por dos trimestres consecutivos. Vuelven a la muestra para ser encuestadas en dos trimestres consecutivos. En el caso del esquema 2-2-2, un hogar puede ser seguido a lo largo de un año y medio. Ponderación de la muestra Como en toda encuesta por muestreo, las estimaciones que surgen de la EPH están afectadas por : • errores debidos al muestreo (consecuencia de haber encuestado sólo a una fracción de la población) • errores no debidos al muestreo: no respuesta, respuestas incoherentes, etc. Los ponderadores ajustan las estimaciones de la población de cada aglomerado relevado por la EPH para que coincidan con las proyecciones de población realizadas por la Dirección de Estadísticas Poblacionales del INDEC. De esta forma las estimaciones a partir de los datos de la muestra permiten hacer inferencia de la población total que representan. INTRODUCCIÓN A STATA *Estas filminas se elaboraron a partir de los apuntes de clase del curso “Seminario de Stata” dictado por Luciano Di Gresia en la Maestría en Economía, Facultad de Ciencias Económicas, Universidad Nacional de La Plata. Stata • STATA es un sistema que permite la gestión de base de datos y la realización de cálculos estadísticos y econométricos. • Ventaja de STATA: se basa en un lenguaje de programación que respeta una sintaxis. Comandos (Sintaxis) • Los comandos conforman un lenguaje de comunicación con el programa, por lo que existe una determinada sintaxis que debe ser respetada. • La sintaxis de comandos tiene la siguiente estructura general: comando [varlist] [if] [in] [weight] [, opciones] La sintaxis comando [varlist] [if] [in] [weight] [, opciones] paso a paso Sintaxis: comando [varlist] El comando summarize permite obtener una descripción estadística de todas las variables que componen el data set: summarize El anterior comando puede usarse para obtener la descripción estadística de: • sólo una variable summarize edad • ó de más variables summarize edad edu w Todas estas maneras de indicar variables se denominan en la sintaxis como varlist. Sintaxis: comando [varlist] [if] La aplicación de este comando restringe observaciones que cumplen con ciertas restricciones de alguna/s variable/s mediante la utilización del “si condicional” (if en inglés). Para construir una sentencia condicional existen los siguientes componentes: – Operadores de comparación: • == (igual); • != (no igual); • >, <, >=, <= (los usuales mayor, menor, etc) – Operadores lógicos: • & (y) • | (o) • ! (no) – Operador jerárquico: el paréntesis que determina el orden de aplicación de las sentencias condicionales. Algunos ejemplos de sentencias condicionales utilizando los operadores anteriores sum edad if varon==1 sum edad if w!=0 sum ocu if varon==1 | (edad>25 & edad< 60) Sintaxis: comando [varlist] [in] Permite aplicar el comando a un rango de observaciones, de acuerdo al orden del data set. Por ejemplo: sum edad in 1/10 • Aplica el comando a las 10 primeras observaciones del data set. sum edad in 5/12 • Aplica el comando a las observaciones entre la 5ta y la 12da. sum edad in -10/-1 • Aplica el comando a las últimas 10 observaciones. Sintaxis: comando [varlist] [weight] [if] [, opciones] [weight]: indica la variable que pondera las observaciones de la muestra. Por ejemplo, sum edad [w=pondera] if varon==1 Sintaxis: comando [varlist] [weight] [if] [, opciones] [, opciones]: algunos comandos adicionales. Por ejemplo, aceptan opciones sum edad [w=pondera] if varon==1, detail tab edad [w=pondera], missing La sintaxis comando [varlist] [=exp] [if] [in] [weight] [, opciones] Sintaxis: comando [varlist] [= exp] • Se utiliza generalmente con comandos: generate y replace. sólo dos • El comando generate permite crear una nueva variable en el data set. Por ejemplo: generate edad=. También puede crearse una variable nueva con valores surgidos de una operación algebraica. Por ejemplo: generate edad2= edad*edad Este comando crea una nueva variable igual a la original multiplicada por ella misma. • El otro comando que usa [=exp] es replace que permite reemplazar valores de una variable ya creada. Por ejemplo: generate varon=. replace varon=1 if ch04==1 & varon==. Este comando reemplazó por un uno aquellas observaciones que tenían valores nulos o missing, siempre que cumpla con la condición exigida. Otros comandos básicos Comando tabulate: permite tabular cantidades de observaciones según distintos valores de una o dos variables. Por ejemplo: tabulate varon ó tabulate varon ch04. • Comando table: permite obtener una tabla con distintas estadísticas. Por ejemplo: table varon, c(mean w). • Comando tabstat: permite obtener la descripción estadística de variables. Por ejemplo: tabstat w, statistics(mean sum count max min range sd variance cv p10 median) • Comandos “destructivos”: eliminan variables u observaciones de variables. Por ejemplo: clear ó drop if edad<15 . La sintáxis [by varlist:] comando [varlist] [=exp] [if] [in] [weight] [, opciones] Sintaxis: [by varlist:] • Permite aplicar el comando por grupos de observaciones definidos por los distintos valores de la variable indicada en varlist. • Es requisito ordenar el data set por la variable que se va a usar. Por ejemplo: sort w by w: sum edad - En este caso se obtuvo la descripción estadística para los ocupados con salarios bajos a altos. Archivos “DO” y “LOG” • La forma más eficiente de trabajar con STATA es a partir de archivos de texto que contienen toda la secuencia de comandos que componen un proyecto. Esto se denomina archivo “DO”. • Los resultados obtenidos pueden ser almacenados en otro archivo de texto llamado archivo “LOG”. Archivo “DO” (secuencia de comando) Archivo “DTA” (dataset) Archivo “LOG” ( registro de resultado) ¿Cómo creamos un archivo DO? • Tenemos dos alternativas: 1. Utilizar el editor de textos que tiene incluido Stata. 2. Utilizar un editor de textos externos: – Editplus: es un editor de tipo shareware (www.editplus.com) – Textpad: es un editor pago (www.textpad.com) – Crimson: es un editor de tipo freware que puede encontrarse en www.crimsoneditor.com El data set Un data set en Stata puede ser de tres tipos: - Datos de corte transversal: la unidad de información es un objeto (un individuo, un país, una provincia, una empresa, etc.) - Series de tiempo: la unidad de información es un momento en el tiempo (un año en particular, o un mes, un día, etc.) - Datos de panel: combina las dimensiones anteriores. Es decir, la unidad de información es un objeto en un momento del tiempo (un país en un determinado período). 28 Unión de data sets Stata permite unir data sets de dos maneras distintas: • Con el comando append se agregan nuevas observaciones a un data set existente. • Con el comando merge se agregan nuevas variables a un data set existente. 29 El archivo “LOG” El archivo log que está en memoria del Stata y que almacenó los resultados obtenidos puede ser abierto como archivo de texto. Por ejemplo, mediante el block de notas. 30