Prácticas de econometría (1) Cómputo y valoración de estadísticos descriptivos Departamento de Economía Aplicada II 1. Variables objeto de estudio Se suministran 6 series de datos, extraídas del Censo de Población de Estados de Unidos del Año 2000, con la siguiente denominación: AGE, SEX, INCWAGE, WKSWORK, UHRSWORK, EDUCREC. A continuación, se describen las características de las muestras suministradas para cada una de estas variables. AGE (edad). Comprende 6892 observaciones de la edad de las personas censadas, extraídas aleatoriamente a partir de la muestra (pública) del 1% del censo, que registra aproximadamente 2819000 personas. La submuestra está catalogada como “muy pequeña” (tiny) por la fuente. Nombre del archivo que contiene los datos: AGESEX.xls SEX (sexo). Comprende 6892 observaciones del sexo de las personas censadas, pertenecientes a la misma submuestra. Rango: SEX= 0, si la persona es varón; SEX= 1, si la persona es mujer. Nombre del archivo que contiene los datos: AGESEX.xls INCWAGE (ingresos por sueldos y salarios). Comprende 3267 observaciones de los ingresos anuales (año 1999) por sueldos y salarios, antes de impuestos, de las personas registradas en la submuestra con edades comprendidas entre 16 y 65 años. Las cantidades se expresan en dólares corrientes. Nombre del archivo que contiene los datos: WORKEDU.xls WKSWORK (semanas de trabajo en el último año). Comprende 3267 observaciones del “número de semanas de trabajo” en el último año (1999) de las personas con ingresos salariales registradas en la submuestra con edades comprendidas entre 16 y 65 años. Nombre del archivo que contiene los datos: WORKEDU.xls UHRSWORK (horas de trabajo por semana). Comprende 3267 observaciones del “número usual de horas de trabajo por semana” de las personas con ingresos salariales registradas en la submuestra con edades comprendidas entre 16 y 65 años. Nombre del archivo que contiene los datos: WORKEDU.xls EDUCREC (educación recibida, recodificada). Comprende 3267 observaciones sobre el grado de formación de las personas con ingresos salariales registradas en la submuestra con edades comprendidas entre 16 y 65 años. Rango: EDUCREC= 0, si la persona ha cursado hasta 8 años de estudios (Elementary School); EDUCREC= 1, si la persona ha cursado 9 ó 10 años de estudios (High School); EDUCREC= 2, 3, si la persona ha cursado, respectivamente, 11, 12 años de estudios (High School); EDUCREC= 4, si la persona ha cursado 1, 2 ó 3 años de estudios universitarios o equivalente (college); EDUCREC= 5, si la persona ha cursado 4 ó mas años de college. Nombre del archivo que contiene los datos: WORKEDU.xls. FUENTE: Steven Ruggles, Matthew Sobek, Trent Alexander, Catherine A. Fitch, Ronald Goeken, Patricia Kelly Hall, Miriam King, and Chad Ronnander. Integrated Public Use Microdata Series: Version 3.0 [Machine-readable database]. Minneapolis, MN: Minnesota Population Center [producer and distributor], 2004. IPUMS site: http://usa.ipums.org/usa/ 2. Cómputo de estadísticos descriptivos 2.1 Cree un archivo de trabajo adecuado para el cómputo de las variables AGE y SEX contenidas en el archivo AGESEX.xls. Guarde el archivo de trabajo creado (con el nombre AGESEX.wf1) en su lápiz óptico o disquette. Ponga nombre a la hoja dentro del archivo de trabajo (use AS20). Cree un objeto-serie para la primera variable (use el nombre AGE) y otro objeto-serie para la segunda variable (use el nombre SEX). Edite la serie AGE, abra la hoja de cálculo AGESEX.xls y copie manualmente los 20 primeros datos en la serie editada. Edite la serie SEX y, con los comandos copiar/pegar del sistema operativo, introduzca las 20 primeras observaciones de la variable SEX en la serie editada. Guarde el archivo de trabajo. 2.2 Cree una nueva hoja dentro del archivo de trabajo AGESEX.wf1, con las mismas características que la primera, y póngale nombre (use AS6892). Tras cerrar el archivo AGESEX.xls, importe la totalidad de la muestra disponible para las variables AGE y SEX. Etiquete ambas series con un descriptor adecuado. Finalmente, vuelva a guardar el archivo de trabajo. 2.3 En la hoja AS6892, compute los siguientes estadísticos para la serie AGE: media, mediana, variancia, desviación estándar y coeficiente de variación. Indique en todos los casos la fórmula aplicada, el valor numérico obtenido y el significado del estadístico en términos de la variable AGE. Elabore una tabla clasificando las observaciones muestrales por sexos, y otra tabla clasificando las observaciones muestrales por grupos de edad y sexos. Congele ambas tablas; póngales nombre y etiqueta. Tabule la serie AGE en 10 subgrupos; congele la tabla, y póngale nombre y etiqueta. (Guarde el archivo de trabajo). 2.4 Cree un nuevo archivo de trabajo, adecuado para el cómputo de las variables INCWAGE, WKSWORK, UHRSWORK y EDUCREC, contenidas en el archivo WORKEDU.xls [este archivo contiene también las variables AGEREC (es decir, la variable AGE, recodificada en intervalos de 5 años) y SEX para la submuestra de personas con ingresos salariales y con edades comprendidas entre 16 y 65 años]. Guarde el archivo de trabajo con el nombre WORKEDU.wf1. Importe todas las series de datos contenidas en la hoja de cálculo WORKEDU.xls (incluyendo las variables SEX y AGEREC). Etiquete los objetos-serie creados. Elabore una tabla clasificatoria para INCWAGE en función de sexo y edad; congélela, nómbrela y etiquétela. (Guarde el archivo de trabajo). 2.5 Genere un nuevo objeto-serie para los ingresos salariales por semana (con el nombre WKWAGE) y otro para los ingresos salariales por hora (con el nombre UHRWAGE), a partir de las series INCWAGE, WKSWORK y UHRSWORK; etiquételos. Elabore, congele, nombre y etiquete el histograma de las nuevas series WKWAGE y UHRWAGE. Compute los coeficientes de asimetría y de curtosis de las series generadas (formulación, valor obtenido e interpretación). Compute el coeficiente de asimetría de Pearson de la variable UHRWAGE, creando un objeto-escalar con nombre CAP_UHRWAGE, y etiquételo adecuadamente. Valore si la distribución de frecuencias de las variables WKWAGE y UHRWAGE se asemeja a la normal (Guarde el archivo de trabajo). 2.6 Cree un objeto-grupo a partir de la series EDUCREC, WKWAGE y UHRWAGE. Compute las covariancias y coeficientes de correlación. Cambie la unidad de medida de la serie UHRWAGE de dólares/hora a euros/hora, usando el tipo de cambio 1€ = 1.25$, generando una nueva serie con el nombre UHRWAGE_EURO; cree una etiqueta adecuada para esta serie. Vuelva a calcular la covariancia y la correlación entre EDUCREC y UHRWAGE_EURO. Valore la repercusión del cambio en las unidades de medida. (Guarde el archivo de trabajo). 2.7 Elabore un comentario razonado (máximo 2 folios) sobre las características de la población censada en USA en el año 2000, utilizando los resultados muestrales contenidos en sus archivos de trabajo AGESEX.wf1 y WORKEDU.wf1.