UNIVERSIDAD NACIONAL DE CÓRDOBA Título de Tesis: Evaluación de Curvas de Engel No Paramétricas y Semiparamétricas. Aplicación al Consumo de Alimentos en la Región Pampeana Para optar al grado de: MAGISTER EN ESTADÍSTICA APLICADA Autor: Lic. Rodrigo García Arancibia Año 2012 COMISIÓN ASESORA DE TESIS Directora: Ph.D. Edith Depetris Guiguet Universidad Nacional del Litoral Miembros: Dra. Margarita Díaz Universidad Nacional de Córdoba Ph.D. Gustavo Rossini Universidad Nacional del Litoral Fecha de Defensa y Aprobación de Tesis: 1 de Octubre de 2012 ii Agradecimientos En primer lugar quisiera agradecer a mi directora, la Dra. Edith Depetris Guiguet, por toda su ayuda y apoyo desde que comencé mi carrera académica en la Facultad de Ciencias Económicas de la UNL. Sin su confianza y atención, este trabajo no hubiera sido posible. Agradezco la disposición y paciencia del Dr. Gustavo Rossini, mi actual director del doctorado, quien siempre atendió mis múltiples consultas desde el comienzo de la maestría. Quiero expresar mi gratitud a la Universidad Nacional del Litoral, quien financió mis estudios durante los dos años de cursado, en el marco de Becas de Maestría para Docentes de la UNL. A todo el cuerpo docente de la maestría les quiero agradecer por la excelente relación alumno-profesor que pudimos mantener. En especial, a la Dra. Margarita Díaz y al Dr. José Luis Arrufat por sus valiosos comentarios y observaciones en relación el trabajo de tesis. Agradezco a mis padres, Ernesto y Mabel, por apoyarme siempre en mis estudios y en mi carrera. A mis hermanos, Ernestito, María Laura y Natalia, quienes, a pesar de la distancia, están siempre en las buenas y en las malas. A Rolo y Chiqui (suegros) por su cariño y buena onda. Por último, quiero expresarles mi enorme gratitud y dedicarles este trabajo a mi esposa Natalia y a mi hijito Cosme, quienes me brindan su apoyo y amor todos días. iii Resumen En esta tesis se aborda el problema de estimación de curvas de Engel (CE) no paramétricas y semiparamétricas poniendo énfasis tanto en la cuestión metodológicaestadística como en la económica. Se aplica al caso específico del consumo de alimentos de la región pampeana argentina. El objetivo es evaluar la aplicabilidad de diferentes métodos no paramétricos en especificaciones en las cuales el gasto total entra en el modelo de forma no paramétrica. Para ello se comparan diferentes métodos no paramétricos, en lo que hace a sus errores de predicción y estimación, a la bondad de ajuste y a los resultados económicos obtenidos por las elasticidades-gasto derivadas de cada estimación. Se consideran tres estimadores basados en núcleos, el Nadaraya-Watson, los polinomios locales lineales y los cuadráticos, y, adicionalmente, los suavizados spline, todos ellos pertenecientes a la clase de suavizados lineales. Para tales estimadores se construyen intervalos de confianza wild-bootstrap para tener en cuenta la heterocedasticidad de los datos. La elección de los parámetros de suavizado se elige siguiendo el criterio de convalidación cruzada generalizada, con ventajas sobre otras alternativas presentadas. Para comparar el poder predictivo y de estimación, se proponen cuatro medidas empíricas, las que son evaluadas por medio de un ejercicio de simulación. El ejercicio prueba que los estadísticos Cp y AICc son más consistentes. Para tener una medida de bondad de ajuste comparable con el R-cuadrado de los modelos lineales clásicos, se computa una versión no paramétrica del mismo. Los resultados muestran que los suavizados spline, en primer lugar, seguido de los polinomios locales (lineales en unos casos y cuadráticos en otros), muestran la mejor performance en términos de tales medidas. Por el contrario el Nadaraya-Watson revela los mayores errores empíricos, con una alta variabilidad en los extremos. A partir de las estimaciones no paramétricas se obtienen sus derivadas primeras y con ello las elasticidades-gasto, con sus respectivos errores estándar bootstrap, las que son evaluadas en términos económicos. De los resultados se tiene que el suavizado spline da estimaciones más consistentes con lo esperado en términos económicos. Al comparar las elasticidades promedios y evaluadas en la media, la diferencia entre estimadores es mínima. Frente a alternativas paramétricas se realizan dos tipos de test de especificación, aplicables a todos los suavizados lineales propuestos, cuando éstos entran en la hipótesis alternativa del test. Como hipótesis nula se proponen tres variantes de la denominada Working-Leser: lineal, cuadrática y cúbica. Los resultados muestran que para el caso de la CE del total de alimentos y bebidas, se rechazan las tres especificaciones. Sin embargo, para subconjuntos de alimentos específicos, la cúbica, en unos casos, y la cuadrática en otros, no son rechazadas. Para estudiar el efecto de las características demográficas de los hogares sobre las CE, se estima el efecto sustitución de las características (ESC) dado por la diferencia de CE para hogares de distintas características. De este análisis no solo se puede comprobar qué características tienen un efecto significativo sobre los gastos en consumo y en qué dirección, sino que adicionalmente revela las posibles interacciones de las características con el poder adquisitivo de los hogares. De aquí se estiman CE paramétricas incorporando los efectos interacción derivados de las curvas ESC, analizando luego su importancia. 1 Por último se estudian CE semiparamétricas especificadas por medio de modelos parcialmente lineales, donde las características socioeconómicas y demográficas entran en forma paramétrica, mientras que el gasto total lo hace de manera no paramétrica. Para su estimación se aplica el método de dobles residuos de Robinson, comparando los resultados de los suavizados spline con los de los polinomios locales, aplicados en todas las regresiones no paramétricas intervinientes en el método. Los resultados son muy similares, arrojando menores errores las estimaciones con suavizados spline. Dada la posible endogeneidad del gasto total, la misma es testeada y corregida utilizando una variable auxiliar construida a partir del ingreso total y del régimen de tenencia de la vivienda. En algunos casos, la endogeneidad es rechazada, mientras que en otros no. Para estos últimos casos, la corrección de la elasticidad-gasto muestra mayor diferencia. Al utilizar el ingreso total como instrumento, se estiman las elasticidades-ingreso, las que resultan ser menores que las elasticidades-gasto. Este hecho es coherente con las decisiones sobre el destino del ingreso al consumo y al ahorro, previo a la elección del destino del gasto. Palabras Clave: Suavizados Lineales – Elasticidades – Gasto de Hogares - Demanda 2 Evaluation of Nonparametric and Semiparametric Engel Curves Summary This thesis addresses the problem of nonparametric and semiparametric Engel curves (EC) estimation, considering statistical, methodological and economic issues. It is applied to the specific case of food consumption in the Argentinean Pampas Region. The objective is to evaluate the applicability of nonparametric methods in different specifications in which total expenditure enters in the model non-parametrically. For this purpose, we compare different nonparametric methods with respect to their prediction and estimation errors, goodness of fit and the economic results of expenditure-elasticities obtained from each estimator. We consider three estimators based on kernels, the Nadaraya-Watson, local linear and quadratic polynomials, and additionally, the smoothing spline, all belonging to the class of linear smoothers. In all cases wild- bootstrap confidence intervals to account heteroskedasticity data are constructed. The smoothing parameters are chosen according to the generalized cross validation criterion, with advantages over other alternatives presented. To compare the estimation and prediction power, we suggest four empirical measures which are evaluated using Monte Carlo simulations. This exercise proves that the statistical Cp and the AICc are more consistent. To get a measure of goodness of fit comparable to the R-square of classical linear models, we compute a nonparametric version of it. The results show that the smoothing spline, first, followed by local polynomials (linear in some cases and quadratic in others) show the best performance in terms of such measures. By contrast, the Nadaraya-Watson estimator reveals greater empirical errors, with a high variability in tails. From nonparametric estimates we obtained its first derivatives and expenditure elasticities, with their bootstrap standard errors, which are evaluated in economic terms. From the results, the smoothing splines are more consistent with the results predicted by economic theory. By comparing the average elasticity, and evaluated in the average, the difference between estimators is minimal. Given parametric alternatives, we use two types of test specification applicable to all selected linear smoothers, which enter as the alternative hypothesis of the test. As null hypothesis we propose three variants of the so-called Working-Leser: linear, quadratic and cubic. The results show that in the case of Engel curves for food and beverages, the three specifications are rejected. However, for specific subsets of foods, the cubic, in some cases, and quadratic in the others, the null is not rejected. To study the effect of demographic characteristics of households on the EC, the characteristics substitution effect (ESC) given by the difference of EC for households with different characteristics is estimated. This analysis not only identifies what characteristic has a significant effect on consumer spending and in what direction, but also reveals the possible interactions of the characteristic with the income of households. From this analysis, parametric specifications of EC are estimated, adding interaction effects derived from ESC, testing their statistical significance. 3 Finally we study semiparametric EC specified by partially linear models, where the socioeconomic and demographic characteristics enter parametrically, while the total expenditure does it in non-parametric form. For its estimation we applied the ‘double residual’ method of Robinson, comparing the results of smoothing spline with local polynomials. The results are very similar, yielding smaller errors with smoothing spline estimates. Given the possible endogeneity of total expenditure, it is tested and corrected using an auxiliary variable constructed from the total income and housing tenure. In some cases, endogeneity is rejected, while not in others. For the latter cases, the correction shows greater difference in expenditure elasticity. By using the total income as an instrumental variable, we estimate the income elasticities, which turn out to be smaller than the expenditure elasticities. This fact is coherent with the decisions about income allocation in consumption and savings, previously to the spending choice. Key Words: Linear Smoothers – Elasticities – Household Expenditure - Demand 4 Tabla de Contenidos Agradecimientos ........................................................................................................................ iii Resumen ........................................................................................................................................1 Summary .......................................................................................................................................3 Lista de Tablas ..............................................................................................................................7 Lista de Figuras ............................................................................................................................9 CAPÍTULO 1. INTRODUCCIÓN .....................................................................................................12 1.1 Problema de Investigación........................................................................................12 1.2 Objetivos ......................................................................................................................15 1.3 Organización de la Tesis ...........................................................................................18 PARTE I MARCO TEÓRICO Y METODOLÓGICO ........................................................................20 CAPÍTULO 2. SOBRE LAS CURVAS DE ENGEL .............................................................................21 2.1 Introducción ................................................................................................................21 2.2 La Ley de Engel por Ernst Engel..............................................................................23 2.3 La Curva de Engel desde la Teoría del Consumidor ............................................25 2.3 Especificaciones Tempranas .....................................................................................29 2.4 De Nuevo al ‘Espíritu’ No Paramétrico ..................................................................32 CAPÍTULO 3. METODOLOGÍA ......................................................................................................34 3.1 Introducción ................................................................................................................34 3.2 Metodologías de Estimación No Paramétricas ......................................................35 3.3 Inferencia en las Regresiones No Paramétricas .....................................................47 3.4 Performance Comparativa ........................................................................................53 3.5 Derivadas y Elasticidades No Paramétricas ...........................................................56 3.6 Efecto de las Características Demográficas de los Hogares .................................60 3.7 Especificaciones Semiparamétricas .........................................................................63 CAPÍTULO 4. DATOS, VARIABLES Y PROCEDIMIENTOS .............................................................70 4.1 Introducción ................................................................................................................70 4.2 Datos ............................................................................................................................70 4.3 Descripción de las Variables .....................................................................................72 4.4 Procedimientos y Software .......................................................................................80 PARTE II RESULTADOS ...............................................................................................................83 CAPÍTULO 5. ANÁLISIS COMPARATIVO DE REGRESIONES NO PARAMÉTRICAS DE CURVAS DE ENGEL ..........................................................................................................................................84 5.1 Introducción ................................................................................................................84 5 5.2 Elección del Suavizado ..............................................................................................86 5.3 Curvas de Engel Estimadas ......................................................................................90 5.4 Evaluación Estadística ...............................................................................................99 5.5 Derivadas y Elasticidades .........................................................................................103 5.6 Contraste con Especificaciones Paramétricas.......................................................110 5.7 Síntesis y Conclusiones ...........................................................................................117 CAPÍTULO 6. EFECTOS DE LAS CARACTERÍSTICAS DE LOS HOGARES .....................................119 6.1 Introducción ..............................................................................................................119 6.2 Tipos de Hogares .....................................................................................................121 6.3 Presencia de Menores y Adultos Mayores ...........................................................130 6.4 Características del Jefe de Hogar ...........................................................................135 6.5 Incorporación de las Interacciones .......................................................................142 6.6 Síntesis y Conclusiones ..........................................................................................151 CAPÍTULO 7. CURVAS DE ENGEL SEMIPARAMÉTRICAS ...........................................................154 7.1 Introducción ..............................................................................................................154 7.2 Resultados de los Modelos Parcialmente Lineales ..............................................156 7.3 Elasticidades-Gasto ..................................................................................................166 7.4 Endogeneidad por Simultaneidad .........................................................................170 7.5 Elasticidades-Gasto Corregidas y Elasticidades-Ingreso ...................................172 7.6 Síntesis y Conclusiones ...........................................................................................174 CAPÍTULO 8. CONCLUSIONES ...................................................................................................177 ANEXO 1. MEDIDAS DE PERFORMANCE DE ESTIMACIONES NO PARAMÉTRICAS DE CE. UNA SIMULACIÓN DE MONTE CARLO ..............................................................................................188 ANEXO 2. RESULTADOS DE LAS ESPECIFICACIONES PARAMÉTRICAS......................................................198 REFERENCIAS .............................................................................................................................202 6 Lista de Tablas Tabla 4.1 Tamaño de la Muestra e Importancia de los Sub-conjuntos de Alimentos A1-A4 ..........................................................................................................................................................72 Tabla 4.2 Resumen Estadístico del Gasto y del Ingreso Total .................................................74 Tabla 4.3 Descripción de las variables Socioeconómicas y Demográficas Consideradas ....79 Tabla 5.1 Evaluación de los Criterios de Selección del Suavizado .........................................87 Tabla 5.2 Medidas de Evaluación de Estimadores No Paramétricos. Total Alimentos y Bebidas (A) ......................................................................................................................................99 Tabla 5.3 R-cuadrado de los Estimadores No Paramétricos con iguales grados de libertad. Total Alimentos y Bebidas (A) ...................................................................................................100 Tabla 5.4 Medidas de Evaluación de Estimadores No Paramétricos. Conjuntos Específicos de Alimentos: A1-A4 ..................................................................................................................101 Tabla 5.5 Derivadas y Elasticidades – Gasto. Total Alimentos y Bebidas............................108 Tabla 5.6 Derivadas y Elasticidades – Gasto. Conjuntos Específicos de Alimentos A1-A4 ........................................................................................................................................................109 Tabla 5.7 Pruebas de Hipótesis de Especificaciones Paramétricas .......................................111 Tabla 5.8 Estimaciones Paramétricas Simples de CE. Total Alimentos y Bebidas (A) .......113 Tabla 5.9 Pruebas de Hipótesis de Especificaciones Paramétricas. Conjuntos Específicos de Alimentos: A1-A4.........................................................................................................................114 Tabla 6.1 Efectos/Diferencias Promedios de los tipos de hogares.........................................126 Tabla 6.2 Efecto Interacción de las Características Demográficas con el Gasto Total. Derivada Promedio del ESC. Alimentos (A) ............................................................................145 Tabla 6.3 Comparación Modelos Paramétricos. Estimación MCO. Alimentos (A) ............146 Tabla 6.4 Efecto Interacción de las Características Demográficas con el Gasto Total. Derivada Promedio del ESC. Alimentos A1-A4 ......................................................................148 Tabla 7.1 CE Semiparamétricas. Estimador de Doble Residuos. Total Alimentos y Bebidas ........................................................................................................................................................157 Tabla 7.2 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A1 .................159 Tabla 7.3 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A2 .................161 Tabla 7.4 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A3 .................163 Tabla 7.5 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A4 .................165 Tabla 7.6 Elasticidades-Gasto Promedios y Evaluadas en la Media .....................................170 Tabla 7.7 Componentes Paramétricas de la CE. Corrección por Endogeneidad ................171 Tabla A.1 Medidas de Performance de los Estimadores. CE Lineal .....................................194 Tabla A.2 Medidas de Performance de los Estimadores. CE Cuadrática ............................195 7 Tabla A.3 Medidas de Performance de los Estimadores. CE Cúbica....................................196 Tabla A.4 CE Paramétricas con Variables Demográficas e Interacciones. A1-A4...............199 Tabla A.5 CE Paramétricas Seleccionadas. Total Alimentos y Bebidas (A) y Subconjuntos A1-A4 .............................................................................................................................................201 8 Lista de Figuras Figura 4.1 Diagrama de Puntos. Log del Ingreso total – log del Gasto Total ........................74 Figura 4.2 Densidades Marginales y Conjunta de la Participación del Gasto en Alimentos y Bebidas y del Logaritmo del Gasto Total ................................................................................76 Figura 4.3 Densidades Marginales Estimadas de la Participación del Gasto en Alimentos A1-A4 ...............................................................................................................................................77 Figura 4.4 Relaciones de Engel – Diagramas de Puntos ...........................................................78 Figura 5.1 Comportamiento de las Funciones de Selección de Suavizados ..........................89 Figura 5.2 Estimadores No Paramétricos de Curvas de Engel. Total Alimentos y Bebidas (A) .....................................................................................................................................................91 Figura 5.3 Curvas de Engel de Alimentos y Bebidas (A). Comparación de estimadores ....92 Figura 5.4 Estimadores No Paramétricos de Curvas de Engel. Conjunto A1 .......................93 Figura 5.5 Estimadores No Paramétricos de Curvas de Engel. A2 .........................................95 Figura 5.6 Estimadores No Paramétricos de Curvas de Engel. A3 .........................................96 Figura 5.7 Estimadores No Paramétricos de Curvas de Engel. A4 .........................................97 Figura 5.8 Curvas de Engel de Conjuntos Específicos de Alimentos. Comparación de Estimadores.....................................................................................................................................98 Figura 5.9 Derivada de la CE y Elasticidad- Gasto. Alimentos y Bebidas (A) ....................104 Figura 5.10 Derivada de la CE y Elasticidad- Gasto. Alimentos A1 .....................................105 Figura 5.11 Derivada de la CE y Elasticidad- Gasto. Alimentos A2 .....................................106 Figura 5.12 Derivada de la CE y Elasticidad- Gasto. Alimentos A3 .....................................107 Figura 5.13 Derivada de la CE y Elasticidad- Gasto. Alimentos A4 ....................................107 Figura 5.14 Ajuste Cúbico de la CE versus Ajustes No Paramétricos ..................................112 Figura 5.15 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para el Subconjunto de Alimentos A1................................................................................................115 Figura 5.16 Comparación del Ajuste Cúbico, Cuadrático, Lineal y No Paramétrico de las CE para el Subconjunto de Alimentos A2 ................................................................................115 Figura 5.17 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para el Subconjunto de Alimentos A3................................................................................................116 Figura 5.18 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para los Subconjunto de Alimentos A4..............................................................................................117 Figura 6.1 Curvas de Engel de Alimentos y Bebidas por Tipos de Hogares .......................123 Figura 6.2 Efecto Sustitución de las Características entre Tipos de Hogares (A)................124 Figura 6.3 Efecto Sustitución de las Características. Alimentos Particulares (A1-A4) .......129 9 Figura 6.4 Efectos de la presencia de Menores en el Hogar en el Consumo de Alimentos y Bebidas (A) ....................................................................................................................................131 Figura 6.5 Efectos Sustitución de las Características. Presencia de Menores en el Hogar. Subconjuntos de Alimentos A1-A4 ...........................................................................................132 Figura 6.6 Efectos de la Presencia de los Adultos Mayores en el Hogar en el Consumo de Alimentos y Bebidas (A) .............................................................................................................133 Figura 6.7 Efectos Sustitución de las Características. Presencia de Adultos Mayores en el Hogar. Subconjuntos de Alimentos A1-A4 ..............................................................................135 Figura 6.8 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos. Estimador Spline ..........................................................................................................................137 Figura 6.9 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos. Estimador Local Lineal................................................................................................................138 Figura 6.10 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos A1-A4139 Figura 6.11 Relación entre la Edad del Jefe de Hogar e Ingresos Totales (Suavizado Spline) ........................................................................................................................................................140 Figura 6.12 Efectos de la Edad del Jefe/a de Hogar en el Consumo de Alimentos.............141 Figura 6.13 Efectos del Edad del Jefe/a de Hogar en el Consumo de Alimentos A1-A4 ...142 Figura 7.1 Componente No Paramétrica de la CE. Estimador de Doble Residuos. Total Alimentos y Bebidas ....................................................................................................................157 Figura 7.2 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A1)....159 Figura 7.3 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A2)....162 Figura 7.4 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A3)....164 Figura 7.5 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A4)....165 Figura 7.6 Elasticidades – Gasto. Comparación de Estimadores. Total Alimentos y Bebidas ........................................................................................................................................................167 Figura 7.7 Elasticidades – Gasto. Comparación de Estimadores. Más Conjunto de Alimentos A1-A4..........................................................................................................................169 Figura 7.8 Elasticidad–Gasto Corregida y Elasticidad Ingreso .............................................173 Figura 7.9 Elasticidad–Gasto Corregida y Elasticidad Ingreso. Conjuntos A1-A4 .............174 Figura A.1 Diagrama de puntos de los datos generados. N= 1000 .......................................190 Figura A.2 Estimaciones No Paramétricas. CE Lineal ............................................................191 Figura A.3 Estimaciones No Paramétricas. CE Cuadrática....................................................192 Figura A.4 Estimaciones No Paramétricas. CE Cúbica ...........................................................193 10 11 Capítulo 1 Introducción 1.1 Problema de Investigación El estudio del comportamiento del consumo de la población de los diferentes bienes y servicios resulta crucial tanto por su papel en la determinación de la actividad económica como por su relación con el nivel de bienestar alcanzado por la sociedad. De este modo, el conocimiento de los patrones de consumo cobra relevancia para la implementación de políticas económicas y sociales, como ser una reforma impositiva o la asignación de subsidios familiares. En particular, el análisis del consumo de alimentos ha generado especial atención desde el trabajo pionero de Ernst Engel (1895), puesto que la participación del gasto de los alimentos es comúnmente tomada como un índice inverso del bienestar de los hogares. Ello se debe a la regla empírica, denominada ‘ley de Engel’, según la cual la demanda de alimentos se incrementa a una tasa menor que el ingreso. Las curvas de Engel se definen desde el punto de vista teórico como las funciones que relacionan el gasto en bienes y servicios que desembolsa una determinada familia, con sus ingresos o recursos totales percibidos, así como otras variables que caracterizan la composición de la familia, dado los precios fijos. La teoría microeconómica no determina alguna forma funcional específica para las curvas de Engel pero establece criterios que ésta debe cumplir en concordancia con la teoría del consumidor (Deaton y Muellbauer, 1980a). Desde el punto de vista empírico o estadístico, el término curva de Engel es usado para describir la dependencia empírica entre el gasto realizado en un determinado bien (o conjunto de bienes) y el ingreso total en una población de consumidores muestreada en un lugar y tiempo determinado (Lewbel, 2006). 12 Es deseable cerrar la brecha entre la definición económica y estadística a fin de corroborar resultados, conseguir mediciones confiables -verbigracia las elasticidades ingreso/gasto- y obtener conclusiones robustas acerca de los patrones de consumo. Ante esta necesidad se busca una correcta especificación de la forma funcional de la curva de Engel, tema que se viene abordando en la última década desde diversas perspectivas. Las consideraciones finales sobre la elección de la especificación por lo general recaen en el interés del investigador, quien pondera sus ventajas y desventajas, dada la dificultad de encontrar una forma funcional superior en todo sentido (Depetris et al., 2006) Por un lado se encuentran los estudios paramétricos, es decir modelos donde se supone el conocimiento de la función de distribución. Entre éstos se encuentran los influyentes trabajos realizados por Working (1943) y Leser (1963) quienes brindaron un conjunto de criterios metodológicos para especificar curvas de Engel mediante el estudio de varios modelos lineales. Concluyeron con la especificación denominada Working-Leser, la cual presenta una relación lineal entre la proporción del gasto en un determinado bien sobre el gasto total y el logaritmo de este último. Esta forma funcional fue perfeccionada por Deaton y Muellbauer (1980b) colocándola dentro de la integrabilidad de la teoría del consumidor. Lewbell (1991) señala que si bien las demandas de las familias pueden ser bien modeladas a través de una especificación lineal-logarítmica, se necesitan modelos más complejos cuando la muestra con la que se trabaja incluye familias de muy bajos ingresos-gastos o de elevados ingresos-gastos. Una de las principales desventajas de los métodos paramétricos es el restrictivo supuesto de la linealidad y el supuesto del conocimiento a priori de la distribución. Por ello se han introducido los métodos no paramétricos, los cuales suponen una mayor flexibilidad pues no exigen hacer algún supuesto sobre la distribución, aunque sí sobre la regularidad de la función pertinente (i.e. continuidad y derivabilidad) sin establecer explícitamente una forma funcional entre las variables. Por su parte, los modelos no paramétricos permiten una forma flexible a las curvas de Engel. Adicionalmente, con los mismos se puede contrastar la validez de diferentes formas funcionales especificas, contribuyendo de esta manera a la definición de nuevas curvas de Engel y sistemas de demanda paramétricos. 13 Entre las primeras aplicaciones empíricas de métodos de regresión no paramétricos para estimar curvas de Engel se pueden mencionar los trabajos de Bierens y Pottbuter (1990), Lewbel (1991), Delgado y Miles (1997) y Banks et al.(1997); y más recientemente Fousekis y Lazaridis (2001) y Parpiev y Yusupov (2011), entre otros. Finalmente, existe un importante número de trabajos recientes que aplican métodos semiparamétricos en los cuales se permite una forma funcional flexible para la relación entre la participación de gasto en un bien o servicio y el gasto total, mientras que las variables demográficas (verbigracia el tamaño de la familia, el género y edad de sus integrantes) entran en el modelo de una forma lineal y paramétrica. Esta investigación cobra importancia por las implicaciones de asignación del gasto dentro de los hogares y su relación con las características de la composición del hogar. Entre este tipo de trabajos encontramos Bundell et al. (1998), Bhalotra y Atfield (1998), Gong et al. (2000) Lyssiotou P et al. (2008), Sulgaham y Zapata (2006), Barrientos Marin (2009) y Barrientos Marin et al (2011), entre otros. Para Argentina, si bien en los últimos años ha crecido el número de trabajos empíricos de consumo y demanda, como ser Berges y Casella (2007), Rossini et al. (2008), Rossini y Depetris Guiguet (2008) y García Arancibia et al. (2009a, 2009b), entre otros, la mayoría se basan en especificaciones paramétricas. Respecto a los trabajos que aplican métodos no paramétricos, las referencias son más escasas. Entre éstos pueden mencionarse los estudios de Pizzolitto (2007) quien utiliza aproximaciones de Fourier con datos del Banco Mundial; y Carugati (2008) quien emplea regresiones kernel simples para la estimación del consumo de alimentos en general. Más recientemente, Berges (2010) utiliza especificaciones semiparamétricas para la estimación de las escalas de equivalencia para la región metropolitana del GBA. De este relevamiento surge la necesidad de realizar un estudio que evalúe en términos estadísticos y económicos métodos no paramétricos alternativos para la estimación de Curvas de Engel para Argentina o de algunas de sus regiones. Un análisis metodológico, teórico y empírico, permitiría desarrollar investigaciones futuras en el marco de la teoría del consumidor aplicada. En esta tesis se propone abordar el problema de estimación de curvas de Engel no paramétricas y semiparamétricas poniendo énfasis tanto en la cuestión metodológica- 14 estadística como en la económica, con la aplicación al caso específico del consumo de Alimentos en Argentina, utilizando datos de Encuesta de Hogares. En particular se tomará la región Pampeana, por su importancia relativa en el país, más allá de la región metropolitana del Gran Buenos Aires. La aplicación se realizará utilizando la base de la Encuesta Nacional de Gastos de Hogares 1996/97 elaborada por el Instituto Nacional de Estadísticas y Censos, tomando el caso específico de la región Pampeana, teniendo una muestra aproximada de 7500 hogares válidos. Además de tomar el rubro de Alimentos y Bebidas en general, se considerarán los siguientes grupos de alimentos: (A1); Productos de panadería, harinas, arroz, cereales y pastas; (A2) Carnes vacuna, porcina, ovina, aves, pescados y mariscos; (A3) Leche y productos lácteos; y (A4) Verduras, legumbres y frutas. Dado que esta tesis se realiza en el marco de la Maestría en Estadística Aplicada, se busca desarrollar un trabajo que aplique los conocimientos adquiridos en los diferentes cursos, como así también extender el conocimiento en otros tópicos no vistos en el cursado regular, como ser en métodos de regresión no-paramétrica y semiparamétrica, considerando la importancia que los mismos están teniendo en la econometría aplicada actual. 1.2 Objetivos El objetivo general del presente trabajo es evaluar, desde el punto de vista estadístico y económico, algunas estimaciones de especificaciones no paramétricas y semiparamétricas de Curvas de Engel de Alimentos en la Región Pampeana Argentina, utilizando datos de Encuesta de Hogares. Los objetivos específicos son: 1. Comparar diferentes métodos de regresión no paramétrica de curvas de Engel aplicado al caso específico de consumo de alimentos con el fin de obtener conclusiones relevantes sobre la bondad de ajuste y poder de predicción de cada modelo, y resultados económicos implicados por las elasticidades-gasto derivadas de cada estimación. 15 2. Del análisis puramente no paramétrico, determinar la relación entre el comportamiento del consumidor y las características demográficas de los hogares. 3. Estimar las elasticidades y/o los efectos marginales de cada variable, derivados de las especificaciones, no paramétricas y semiparamétricas de las Curvas de Engel para ciertos grupos de alimentos. 4. Constatar las hipótesis sobre especificaciones paramétricas de curvas de Engel. 5. Elaborar conclusiones que sirvan de guía para el desarrollo de modelos econométricos aplicados a la teoría del consumidor. Para el cumplimiento del Objetivo Específico 1 se compararán tres estimadores no paramétricos de Curvas de Engel, estando entre los más utilizados en la literatura econométrica: 1) Las regresiones kernel, tomando como caso especial el estimador Nadaraya- Watson (N-W) (Nadaraya, 1964; Watson, 1964); 2) Regresiones por polinomios locales; y 3) Suavizados Spline. Una vez obtenidas las estimaciones por estos tres métodos(N-W, polinomios locales y spline), se realiza una comparación en base a criterios estadísticos como también económicos. En términos estadísticos, se realizarán comparaciones sobre diferentes medidas de los errores de estimación y predicción de cada modelo, como así también de su bondad de ajuste. En términos económicos, se realizarán comparaciones computando las elasticidades-gasto (eg) a partir de las distintas estimaciones y para los distintos tipos de alimentos considerado0s. Para llevar a cabo el Objetivo Específico 2 se tomarán variables demográficas de los hogares que caracterizan su composición. Específicamente, las variables que cuantifican la cantidad de miembros por grupo etario (menores de 14 y mayores de 65 años), los tipos de hogares (unipersonal, nuclear sin hijos, nuclear con hijos y extendidos), y la edad y género del jefe/a de hogar. A partir de éstas, se forman especificaciones desagregadas por características de los hogares. Con ellas se busca conocer cómo afectan tales características en la participación del gasto que tiene un bien en el presupuesto del hogar, y su comportamiento respecto al poder adquisitivo. Tal efecto ha sido denominado como Efecto Sustitución de las Características (ESC) (Delgado y Miles, 1997). En la estimación no 16 paramétrica, involucrada en la obtención del ESC, se consideran los resultados de la evaluación realizada previamente (Objetivo 1). El Objetivo Específico 3 constituye la etapa final de la tesis en lo que hace a la estimación de curvas de Engel, contemplando varios aspectos que hacen a la heterogeneidad de los hogares, además de su poder adquisitivo. Para cumplir con este objetivo, en primer lugar, se incluyen en la especificación las variables que caracterizan la composición de los hogares (definidas previamente para el objetivo 2) y aquéllas que representan la situación socioeconómica del Jefe de Hogar: Nivel de Educación y Situación ocupacional1. Se elige una representación semiparamétrica de las CE, especificando un Modelo Parcialmente Lineal (MPL), dejando como componente no paramétrica el logarítmo del gasto total. Para su estimación se utilizará el método de “doble residuos”, propuesto de forma simultánea por Robinson (1988) y Speckman (1988). Del modelo se obtienen la elasticidad-gasto y los efectos marginales de las demás variables a los fines de su interpretación económica. Adicionalmente, se trata la posible endogeneidad del gasto total, corrigiendo con variables instrumentales y/o regresiones auxiliares (Blundell et al., 2008; Sulgaham y Zapata, 2006, Barrientos Marin, 2009; Barrientos Marin et al., 2011; entre otros). La variable clave para instrumentar es el ingreso total. Sin embargo, es usual que tal variable tenga problemas respecto a su declaración real en las encuestas, lo que pone en duda las correcciones propuestas. Respecto al Objetivo Específico 4, se desea contrastar la hipótesis de linealidad y/o del efecto cuadrático o cúbico del gasto total. Existe una gran cantidad de estadísticos propuestos para realizar pruebas de especificación, con distribuciones asintóticas generalmente conocidas2. La elección de los estadísticos a utilizar en esta tesis, se realiza en base a criterios de flexibilidad respecto al método no paramétrico que se utilice y teniendo en cuenta su facilidad computacional. En base a tal criterio, se aplica un test paramétrico, basado en una aproximación de la distribución F, y otro no paramétrico basado en la distribución empírica derivada a través del método bootstrap. 1 La elección de tales variables se realiza en base a aquellas que resultaron relevantes en estudios empíricos sobre consumo y demanda aplicados a Argentina (Berges y Casella, 2007; Rossini et al., 2008, Rossini y Depetris Guiguet, 2008; García Arancibia et al., 2009, 2011). 2 En Yatchew (2003) se presenta un buen resumen de los mismos 17 Por último, de los resultados encontrados de la consecución de los objetivos 1-4, se espera obtener conclusiones sobre: 1) La validez de especificar curvas de Engel paramétricas para el caso de alimentos en Argentina; 2) El método no paramétrico recomendable, si se opta por una especificación flexible; 3) La sensibilidad de las elasticidades-gasto respecto al método de estimación; 3) La conveniencia de incorporar variables interacción entre las características de los hogares y el gasto total/ingreso, en especificaciones paramétricas; 4) La sensibilidad de las estimaciones semiparamétricas ante la corrección de la posible endogeneidad del gasto total, instrumentando con el ingreso total; y 5) Las diferencias que se presentan entre los distintos grupos de alimentos. Con esto se cubriría el Objetivo Específico 5. 1.3 Organización de la Tesis La tesis está organizada en dos partes. La Parte I incluye todo el marco teórico y metodológico utilizado. Está compuesta de tres capítulos. El primero de ellos hace un breve recorrido sobre los fundamentos económicos-teóricos de las Curvas de Engel. Trata, desde el rol de las metodologías no paramétricas en el desarrollo histórico del tratamiento de los presupuestos familiares como función del poder adquisitivo, hasta las restricciones que se derivan de la teoría neoclásica del consumidor, y las adaptaciones econométricas a ellas. En el Capitulo 2 se presentan todos los métodos estadísticos que son aplicados en la tesis. El mismo parte de los métodos de estimación e inferencia no paramétricos, las propuestas para su evaluación y la obtención de las elasticidades-gasto no paramétricas. El último capítulo de esta primera parte explica el tratamiento de la base de datos utilizada, las variables con las que se trabaja y los procedimientos computacionales llevados a cabo. La segunda parte también tiene tres capítulos y contiene los resultados empíricos de la tesis. Estos tres capítulos surgieron del modo en que se esquematizó la tesis en un comienzo. Se pensaba presentar un total de tres trabajos o papers, relacionados entre sí de una forma anidada o progresiva. De hecho, tanto la metodología como el orden en que se presentan los resultados responden a un ordenamiento progresivo, donde se parte de modelos más básicos con un perfil más evaluativo y metodológico, hasta llegar a modelos 18 más completos con una visión más amplia sobre la influencia de las variables económicas de interés. Por lo tanto, si bien la tesis adopta ahora un formato más tradicional, los tres capítulos de los resultados pueden leerse de una manera independiente, aunque contienen un anidamiento de forma que cada capítulo se referencia en el o los anteriores. El primer capítulo de esta segunda parte, el Capítulo 5 de la tesis, expone los resultados del análisis comparativo de las curvas de Engel especificadas como función del logaritmo del gasto total, de forma totalmente no paramétrica. En el Capítulo 6 se estudia el efecto de las características demográficas de los hogares, utilizando las CE no paramétricas, seleccionando el o los estimadores apropiados según los resultados del capítulo evaluativo anterior. Por último, el Capitulo 7 integra de cierta manera a los dos anteriores, estudiándose los resultados de los modelos semiparamétricos de las CE. El modo de presentación, tanto del marco metodológico como de los resultados, responde a un formato más acorde a los estudios econométricos aplicados (y en particular, de consumo y demanda), que a uno puramente estadístico. Esta elección se hizo considerando la formación base de quien escribe, y de la utilidad presente y futura para manejarse en el ámbito académico al que pertenece. No obstante, se puso énfasis en lo metodológico con un perfil micro-econométrico, donde la precisión estadística y la interpretación de los resultados deben conjugarse para responder a un análisis económico con fundamentos más sólidos. 19 Primera Parte MARCO TEÓRICO Y METODOLÓGICO 20 Capítulo 2 Sobre las Curvas de Engel 2.1 Introducción Para la visión contemporánea, las curvas de Engel (CE) tienen dos acepciones estrechamente relacionadas, por un lado la teórica y por otra, la empírica o estadística (Lewbel, 2006). Las diferencias existentes entre ambas puede generar cierta preocupación o no, dependiendo de la postura metodológica que se adopte. Se puede pensar desde el enfoque apriorista de la teoría económica, mediante el desarrollo de los principios básicos de la teoría del consumidor, valiéndose de un dominio diferente al dominio estándar de los fenómenos económicos (Scarano E., 2002). También desde una perspectiva mishaniana donde la búsqueda de una coherencia entre la teoría y los resultados resulta simplemente en una pérdida de tiempo y energía, no importando si la curva se deriva de una teoría consistente, sino simplemente la aplicación de los conceptos (Himmelweit et al., 2001: 55)3. Desde el punto de vista teórico, las curvas de Engel quedan definidas como las funciones que relacionan el gasto en bienes y servicios que desembolsa una determinada familia, con sus ingresos o recursos totales percibidos, así como otras variables que caracterizan la composición de la familia, dado los precios fijos. La teoría microeconómica no determina alguna forma funcional específica para las curvas de Engel pero establece criterios que ésta debe cumplir en concordancia con la teoría del consumidor, a partir de lo cual puede realizarse una determinada especificación. Desde el punto de vista empírico o estadístico, el término curva de Engel es usado para describir la dependencia empírica entre el gasto realizado en un determinado bien (o Las afirmaciones de Mishan (1961) se refieren más específicamente a la ley de demanda, considerándolo aquí como un enfoque general de esta disyuntiva, aplicándose claramente al problema de especificación de las formas de Engel. 3 21 conjunto de bienes) y el ingreso o gasto total en una población de consumidores muestreada en un lugar y tiempo determinado. En esta última definición se enmarca el trabajo original de Engel, quien infirió desde el estudio estadístico de las proporciones del gasto asignadas por las familias en función de su ingreso, una de las proposiciones más relevantes del estudio de los presupuestos familiares, y más tarde, de la teoría del consumidor. Las investigaciones tempranas de Ernst Engel transcurren en la segunda mitad del siglo XIX4, cuando la incipiente teoría del consumidor carecía de una incorporación cabal de los efectos ingresos sobre las decisiones de las familias, al mismo tiempo en que no se contaba con una sólida fundamentación de los modelos de regresión estadística. Si bien la derivación de las funciones de demanda a partir del análisis de la utilidad, desarrollada en los trabajos de Jevons y Walras, fueron contemporáneos a las obra de Engel, hay autores que sostienen la inexistencia de indicios de que el mismo Engel utilizara tales conceptos o soporte teórico. Por ello proponen re-interpretar la obra de Engel, despojando las ideas del mainstream actual, corroborando las leyes empíricas reveladas por él, sea utilizando nuevos datos (y realidades) como así también métodos estadísticos más consolidados y aplicados a la luz de las concepciones originales de Engel, no así de la moderna teoría del consumidor. En esta línea se encuentras los trabajos recientes de Chai y Moneta (2008; 2011), y Chakrabarty y Hildenbrand (2011). Entre los primeros en reconocer la importancia de una adecuación del análisis empírico de los presupuestos familiares con la teoría microeconómica se encuentran Allen y Bowley (1935). Desde este punto de vista se busca obtener un modelo del comportamiento individual de los hogares y derivar conceptos teóricos de la función de demanda individual, en base a hipótesis de la maximización de la utilidad sujeto a una restricción presupuestaria. Tal enfoque es el que ha sido adoptado comúnmente en las investigaciones micro-econométricas de consumo y demanda de las últimas décadas. Una de las obras con mayor impacto en esta línea es la de Deaton y Muelbauer (1980a), quienes realizan una excelente presentación del ensamble posible de la microeconomía teórica y aplicada. 4 Die Productions- und Consumtionsverhältnisse des Kónigreichs Sachsen, E. Engel (1857) 22 Bajo una perspectiva empírica o aplicada, las CE han recorrido un camino que va desde la inferencia de una ley a la especificación de una forma funcional, y luego una vuelta a un análisis de mayor flexibilidad funcional, manteniendo los requerimientos básicos de la teoría del consumidor. En este capítulo se busca mostrar este recorrido de una forma resumida. Con ello se desea presentar los fundamentos detrás de las CE, tanto en lo que hace al marco teórico en el cual se sustentan como así también en el modo en el que ha sido encarada su estimación y tratamiento estadístico a lo largo de la historia a partir de la obra original de Engel. Lejos de ser exhaustivo, este tratamiento busca ser ilustrativo y resumido a la vez, dado los objetivos de la presente tesis. El capítulo se organiza de la siguiente manera. En primer lugar, se realizará una presentación de las ideas originales de Engel, a la luz de lo que se entiende hoy por CE, y cómo se encara su tratamiento empírico. Luego se presenta el marco teórico propuesto por la teoría (neoclásica) del consumidor. Las últimas dos secciones están dedicadas a presentar la forma en que se viene desarrollando la especificación econométrica de las CE. 2.2 La Ley de Engel por Ernst Engel La investigación de Ernst Engel (1857) se centró en el estudio del comportamiento de las familias en cuanto a la asignación que realizan de sus gastos en diferentes categorías de bienes, tomando como medida aproximada del bienestar, la proporción del gasto en ciertos bienes, específicamente considerando la noción smithiana de ‘necesidades’. De aquí el foco en la relación de tales proporciones presupuestarias y los cambios en los niveles de ingresos, contemplando específicamente categorías dentro de una definición previa de clases socioeconómicas – específicamente, fundamentado en nivel de ingreso medio – obteniendo mediante el estudio de una serie de datos de consumo de las familias, la famosa ley de Engel: Mientras más pobre es una familia, una mayor proporción de su gasto total es destinado al consumo de alimentos5. 5 “je ärmer eine Familie ist, einen desto grösseren Antheil von der Gesamtausgabe muss zur Beschaffung der Nahrung aufgewendet warden” . Traducción de Stigler (1954: 98): “the poorer a family, the greater the proportion on its total expenditure that mast be devoted to the provision of food”. Traducción propia al español. 23 Si bien no es objetivo en el presente indagar en el problemático terreno de las ‘leyes’ de la economía, el enunciado de ley por parte de Engel cobra el sentido de una relación teórica inferida desde los datos por inducción. Al sostener un enfoque metodológico inductivista, se refiere con ello a la posibilidad de descubrir resultados teóricos desde el ensamble y clasificación de hechos y observaciones (Chai y Moneta, 2008; citado a partir de la obra original de E. Engel de 1854). En este sentido, siguiendo a Blaug (1985) podemos considerar la propuesta de ley de Engel, como una ley estadística para la cual su cumplimiento está ligado a una alta probabilidad de que se cumpla (análogamente, a la ley de demanda). Lo curioso es que en esta primera formulación no existe ninguna imposición sobre la forma funcional específica para la derivación de la curva de Engel, lo que lleva a tal estimación a encontrarse dentro del espíritu no paramétrico, si bien los métodos aplicados por entonces, no pueden considerarse rigurosamente dentro de las regresiones paramétricas o no paramétricas como son conocidas hoy en día (Chai y Moneta, 2008). A pesar de ello, la estimación de Engel tiene una gran similitud con la estimación no paramétrica por intervalos conocida como regresogramas (Engel y Kneip, 1996). Claramente, como señalan estos autores, dada la época en la que Engel desarrolla sus investigaciones, ni el método de mínimos cuadrados, y menos aún, los fundamentos de la estadística no paramétrica estaban aún desarrollados. En este punto es necesario aclarar que si bien el método de mínimos cuadrados fue desarrollado y publicado de forma casi simultánea por Adrien-Marie Legendre en 1805 y por Carl Friedrich Gauss en 1809 (en el que menciona que tal método fue planteado por el mismo en 1795), recién con Galton en 1886 se desarrolla dicho método en un marco más acorde al enfoque de la estadística moderna (Abdi, 2007: 532). Por lo tanto, de aquí podría pensarse que existen dos factores determinantes en la decisión de no fijar una forma funcional precisa para el estudio de la relación entre la asignación de los presupuestos familiares y los ingresos percibidos por las mismas. Por un lado, como ya se mencionó, el estado del arte de las técnicas estadísticas de estimación desarrolladas a fines del siglo XIX. Por otra parte - los cuales son vinculantes por medio del desarrollo posterior de modelos - para el período se tiene un incompleto desarrollo de la teoría del consumidor y más precisamente, del papel del ingreso o renta como variable clave de la 24 teoría económica, que no fue teóricamente reconocido hasta la década de 1890 y no fue sistemáticamente analizado a partir de 1930 (Blaug M., 1985: 189). Por lo tanto es esperable el desarrollo tardío que fundamenta la especificación entre el ingreso de las familias y la proporción del gasto que realizan en un determinado producto respecto a la estimación temprana de esta relación, sin forma funcional alguna, infiriéndose desde valores observados; con una clasificación final de los tipos de consumo descrito por las elasticidades- ingreso tratadas posteriormente por la teoría, y con un tratamiento empírico más claro mediante el impulso de los desarrollos econométricos. A pesar de que la diferencia temporal parece ser crucial a la hora de diferenciar el tratamiento original de la obra de Engel respecto a las investigaciones actuales de estimación de funciones de Engel y de los sistemas de demanda, claramente el inductivismo creador de teorías genera a la vez una separación mayor con los desarrollos tempranos de especificaciones paramétricas. También un acercamiento hacia la generalización de las expresiones funcionales generadas por los recientes estudios no paramétricos. Al fin, esta ambivalencia parece ser resuelta ante una posición equilibrada donde la flexibilidad de la CE y su adecuación teórica pueden tener lugar en una misma línea de investigación. 2.3 La Curva de Engel desde la Teoría del Consumidor En lo que sigue se presentarán, de una forma simple, los fundamentos teóricos básicos del comportamiento del consumidor a partir del cual se derivan las CE. Esto se realiza en el marco onto-metodológico de la teoría neoclásica del consumidor; entendida ésta a partir del afianzamiento con el ordinalismo introspectivo de Slustzky, Allen y Hicks, la generalización mediante la teoría de las preferencias reveladas de Samuelson, la teoría de la utilidad esperada de Neumann-Morgestern y la teoría de las características de las mercancías de Lancaster (Blaug, 1985: 186). Suponiendo que u (q ) es la función de utilidad de una familia u hogar que representa sus preferencias en cuanto a la elección de n bienes representados por el vector de cantidades q T = (q1 , K , q n ) . Sea G el gasto total del hogar en bienes y servicios o su ‘ingreso 25 nominal’ (Barnett y Serletis, 2008), y p T = ( p1 , K , p n ) el vector correspondiente de precios de los n bienes6, luego el problema del hogar se traduce en max u (q ) q sujeto a pT q = G (2.1) De las condiciones de primer orden del problema de optimización (2.1) se obtiene las usuales funciones de demanda marshalianas q j ≡ g j (p, G ) j = 1, K , n Si los precios son absorbidos por la forma funcional, luego de (2.2) (2.2) se obtiene la denominada curva de Engel (Deaton y Muellbauer, 1980: 19), esto es q j = g j (G ) * (2.3) Los sistemas de Demanda o de curvas de Engel en general son expresados en términos de la participación que tiene cada bien en el gasto total o presupuesto del hogar w j donde w j = p j g j (p, G ) / G (2.4) Las demandas marshalianas satisfacen ciertas propiedades, algunas de ellas derivadas de los requerimientos del problema del óptimo y con ello de las propiedades de las funciones de utilidad, mientras que otras se derivan de la misma restricción presupuestaria. Entre las más relevantes se tienen (i) Aditividad. Ésta se deriva del hecho de que las funciones que conforman el sistema (2.2) deben cumplir con la restricción presupuestaria, por lo tanto p T g (p, G ) = G (ii) Homogeneidad. Las funciones de demanda son homogéneas de grado cero en (p, x ) , i.e. ∀θ > 0 e j = 1, K , n , se cumple que g j (θ p, θ G ) = g j (p, G ) . En términos económicos esta restricción indica la ausencia de ilusión monetaria: la 6 En este capítulo teórico se toma a G como un equivalente del gasto o del ingreso total. Sin embargo, claramente ambos conceptos son diferentes. La elección del gasto total como medida de poder adquisitivo se fundamente en aspectos tanto teóricos-empíricos, como prácticos. Por un lado, su elección permite el cumplimiento de algunas propiedades teóricas en las especificaciones empíricas al tratar con sistemas (Deaton y Muellbauer, 1980). A su vez, la elección del gasto total resulta más compatible con la investigación original de Engel. Desde el punto de vista práctico, el ingreso total es más difícil de captar que el gasto total, existiendo a su vez una alta correlación entre ellos (Iyengar, 1967) 26 forma en que están expresados los precios y el gasto o ingreso total no tienen efecto sobre el consumo (iii) Simetría y Negatividad de la matriz de Sustitución. Sea la matriz S = [∂g (p, G ) / ∂p T + (∂g (p, G ) / ∂G )g (p, G ) ] , T la misma es simétrica y semi-definida negativa. Las propiedades (i)-(iii), junto con la positividad de las funciones de demanda, constituyen las denominadas condiciones de integrabilidad de la teoría del consumidor, pues su cumplimiento permite reconstruir el pre-orden de preferencias a partir del sistema de demanda. Si tales propiedades son testeadas empíricamente y no pueden ser rechazadas, entonces se puede inferir que existe la función de utilidad que genera el sistema de demanda (Barnett y Serletis, 2008: 211). De aquí puede observarse, que las propiedades (i)-(iii) no imponen alguna forma funcional para la curva de Engel q j = g j (G ) más que su suavidad. Por lo tanto, en el * estudio de la forma funcional de curvas de Engel separadas (no en sistema), con las condiciones básicas de regularidad (continuidad y derivabilidad) alcanza. Sin embargo, la forma específica que adopte la CE, considerando las transformaciones usuales realizadas sobre las variables implicadas, hacen que en la especificación de un sistema, puedan o no cumplirse todas o algunas de las condiciones de integrabilidad. Por algo, algunos sistemas de demanda, que suponen una forma específica sobre la CE, han tenido más éxito que otros. De las funciones de demanda (2.2) se obtienen las elasticidades precio e ingreso (o gasto). De las CE, se obtienen solamente la elasticidad-gasto, que es computada en esta tesis, tanto como función de G, como en sus valores promedios. La definición teórica de la misma es ∂g j (G ) G ∂G g j (G ) * e j (G ) = * (2.5) A partir del valor que asume se pueden clasificar los bienes y servicios en: bienes de lujo, necesarios e inferiores, dependiendo de si e j > 1 , 0 < e j < 1 o e j < 0 , respectivamente. Si 27 la CE es expresada en términos de la participación de cada bien en el gasto total, esta clasificación pueden entenderse mirando cómo se comporta tal participación a medida que se incrementa el poder adquisitivo del hogar: Si el hogar destina una mayor proporción de su presupuesto en el bien ante incrementos adicionales del ingreso, entonces se trata de un bien de lujo. Si se destina una menor proporción del presupuesto ante incrementos del poder adquisitivo, se trata de un bien necesario, y si la participación cae en mayor proporción al aumento del ingreso, entonces se trata de un bien inferior. Esta clarificación resulta crucial para entender cuestiones económicas muy relevantes, como la incidencia de impuestos específicos a determinados bienes. A su vez, para determinados rangos de ingreso, un bien puede ser de lujo para hogares con cierto poder adquisitivo, mientras que es un bien necesario o inferior para hogares pertenecientes a otra categoría según ingresos. A su vez, las circunstancias de consumo pueden resultar muy relevantes para clasificar al bien (García Arancibia, 2011). La forma simple (2.3) puede extenderse de modo que incluya las características demográficas y socioeconómicas del hogar, más allá de su ingreso o gasto total, i.e q j = g j (G , z ) * (2.6) Usando la transformación (2.4), luego se tiene la CE teórica que será analizada empíricamente a lo largo de la tesis w j = m j (G, z ) (2.7) Respecto a la curva de demanda marshaliana, estas CE pueden entenderse como una adaptación de las mismas para un nivel de precios dado (fijos), o bien donde el efecto de los precios es absorbido por la forma funcional. Esta última interpretación se ajusta más a lo que se observa de las CE estimadas empíricamente. Por otra parte, debe tenerse en cuenta que las derivaciones de las funciones generales (2.2)-(2.7) se realizan sobre un consumidor ‘representativo’, por lo que su extensión al nivel de ‘hogares’ en el análisis aplicado, requiere al menos dos consideraciones. Por un lado, aceptar como unidad de análisis el hogar en el sentido de que las decisiones racionales se toman en él como unidad. Es decir, que más allá de las distintas preferencias de los miembros de un hogar, debe suponer que el hogar como un todo revela un (pre)orden de preferencias bien 28 definido. Por otra parte, se supone que para un nivel fijo de z todos los hogares tienen las mismas preferencias, y enfrentan un mismo vector de precios p. Claramente, el cumplimiento de tales condiciones resulta algo desalentador en la pretensión de querer encajar de un modo perfecto la teoría con la práctica. Sin embargo, existe un margen donde la empiria puede ser contrastada con formas funcionales y determinadas propiedades que resultan consistentes en el marco de la teoría del consumidor. Si bien la presente tesis está enfocada al problema de estimación de especificaciones no paramétricas y semiparamétricas de curvas de Engel, la especificación general adopta una forma que puede ser contrastable con especificaciones paramétricas fijas consistentes con la teoría económicas Tales especificaciones surgen a mitad del siglo pasado, y con los años se fueron extendiendo y adaptando a las condiciones de integrabilidad de la teoría del consumidor, y hasta el día de hoy son profusamente utilizadas en los estudios económicos aplicados. 2.3 Especificaciones Tempranas El esfuerzo volcado hacia especificaciones ‘correctas’ de las formas de curvas de Engel tiene como objetivo general obtener conclusiones, de resultados empíricos, capaces de corroborar las proposiciones fundamentales derivadas mediante deducciones lógicas a partir del marco axiomatizado de la teoría neoclásica del consumidor. Como se pudo ver de la sección anterior, a pesar de los lineamientos que brinda dicha teoría, la misma no da una forma funcional explicita, por lo que ésta debe ser estimada o bien mediante la especificación de una determinada forma funcional –lineal, cuadrática, cúbica, etc - o bien suponiendo solamente unas condiciones de regularidad suficientes. Entre los primeras propuestas de una especificación econométrica de la CE, claramente predominó la metodología paramétrica, es decir modelos donde se supone el conocimiento de la relación funcional entre el gasto total del hogar y la cantidad demandada de un bien, adicionalmente al conocimiento de la distribución de la componente estocástica. Uno de los primeros estudios donde se prueban diferentes relaciones funcionales simples, es el clásico trabajo de Prais y Houthakker (1955). Estos 29 comparan tres especificaciones, mostrando la superioridad de algunas sobre otras para diferentes bienes o rangos del gasto total. Estas son: La Doble-Logarítmica: ln q j = α j + β j ln G (2.8) La Semi-Logarítmica: q j = α j + β j ln G (2.9) La Recíproca: ln q j = α j + β j G −1 (2.10) Si bien algunas de las especificaciones (2.8)-(2.10) puede brindar un ajuste aceptable con los datos, las mismas no han sido muy utilizadas en el desarrollo de las especificaciones de CE debido a que ninguna satisface por completo la restricción (i) de aditividad (Deaton y Muellbauer, 1980: 17-19). Puesto que la misma se termina corroborando a través de sistemas completos de demanda o CE, la utilización de (2.8)-(2.10) ha sido defendida para las aplicaciones empíricas que involucran un solo bien, utilizándose en varios estudios actuales de CE (Haque, 2005; García Arancibia, 2011; entre otros). Sin embargo, existen especificaciones de CE que son compatibles con los requerimientos de la teoría del consumidor, y no implican una mayor complejidad. En particular, se encuentran los trabajos pioneros realizados por Working (1943) y Leser (1963) quienes brindaron un conjunto de criterios metodológicos para especificar curvas de Engel: 1. Conexión íntima con la función de utilidad directa o indirecta 2. La función debería ser válida para un rango extenso de valores positivos del gasto total y las variaciones en la elasticidad-ingresos vinculadas con tal especificación deberían así mismo, ser plausibles. 3. La estimación de parámetros debería ser simple persiguiendo una evaluación confiable y un buen ajuste, con un error de especificación razonable. Claramente los requisitos de Leser dan el puntapié a la problemática de la especificación, sintetizando en (1) y (2) los requerimientos mínimos de una consistencia entre la forma funcional y lo que dicta la teoría del consumidor; mientras que (3) pone en relevancia las consideraciones econométricas. 30 De estos primeros trabajos surgió la comúnmente denominada especificación WorkingLeser representada por una forma lineal que relaciona la participación que tiene un determinado bien en el presupuesto familiar con el logaritmo natural del gasto total, tomada esta última como variable proxy del ingreso, i.e. w j = α j + β j ln G (2.11) con w j = p j q j / G . Posteriormente, esta forma funcional fue perfeccionada por Deaton y Maulbauer (1980) colocándola dentro de la integrabilidad de la teoría del consumidor. A partir de ello, las formas de Engel cobran relevancia dentro de los sistemas usuales de demanda (AIDS, translog, PIGL, y PIGLOG) pero que, como señala Costa (2001), éstos han sido favorecidos por su mejor representación de la propiedad de agregación de los agentes económicos más que por poseer un ajuste superior. Lewbell (1991) es quien propone la utilización de modelos más complejos que la especificación lineal logarítmica, y en particular cuando la muestra con la que se trabaja incluye familias de muy bajos ingresos-gastos o de elevados ingresos-gastos. Así Hausman et al. (1995) encuentran que al tener la expresión cúbica de la covariable obtienen un mejor ajuste que para cualquier polinomio de grado menor. En definitiva, se puede ver que el desarrollo de una mejor especificación responde a ambas necesidades (teórica- econométrica), pudiendo complicarse la forma funcional adoptada aunque ganando en términos de ajuste, como es en el caso de las expresiones polinomiales. Por lo tanto, lo que resulta claro es que, con el desarrollo de la teoría del consumidor (y las transformaciones metodológicas de la economía en general) el problema de estudiar los estándares de vida de las familias como función de la relación gasto-ingreso, cobró un sentido más estricto en cuanto a la búsqueda y determinación de una relación funcional exacta. 31 2.4 De Nuevo al ‘Espíritu’ No Paramétrico Ahora bien, hasta el momento se trata a una especificación econométrica a partir de formas funcionales fijas para la estimación de las relaciones de Engel. Sin embargo, en los últimos tiempos ha crecido el número de investigaciones en los cuales se aceptan formas funcionales más flexibles. De esta manera, la CE simple adopta la forma general (2.7) abordada de forma no paramétrica. En general, dada la dificultad de estimar una función de varias variables de forma no paramétrica (por la conocida maldición de la dimensionalidad), se ha optado por especificar de forma no paramétrica al gasto o ingreso total (i.e. a la ‘esencia’ de la CE), incorporando a su vez como covariables adicionales las características socioeconómicas y demográficas de las familias en forma paramétrica. Esta especificación se denomina semiparamétrica y cobra gran importancia por las implicaciones de asignación del gasto dentro de los hogares y su relación con las características de la composición del hogar. Ahora bien, ¿Cuál es la ventaja de utilizar una especificación no paramétrica de la CE? Básicamente, la mayor flexibilidad que supone el solo requisito de las condiciones mínimas de regularidad de la función de distribución. En particular, Blundell et al. (2003) enumeran algunas ventajas de las especificaciones no paramétricas de CE. En primer lugar, sostienen que los estudios paramétricos de demanda basados en micro datos, por lo general no cumplen con la propiedad de simetría de Slutsky la cual es una de las implicaciones del problema de maximización de utilidades sujeto a la restricción presupuestaria. Esto podría deberse, o bien a una forma funcional errónea, o bien porque no existen unas preferencias bien definidas que puedan estar racionalizadas en los datos. Los análisis no paramétricos permiten chequear esto. Por otro lado, al usar métodos paramétricos siempre existe incertidumbre acerca de hasta qué punto las conclusiones sobre el bienestar son reflejadas por la forma funcional. Las técnicas no paramétricas permiten obtener ciertos límites sobre los efectos en el bienestar posibilitando usar estos límites a fin de determinar la importancia de la forma funcional sobre las conclusiones de bienestar. También el análisis no paramétrico puede ayudar a desarrollar un nuevo sistema de demanda paramétrico. 32 Por lo tanto, la vuelta ‘al espíritu no paramétrico’ del trabajo original de Engel no solo implica una ganancia en la mayor flexibilidad, desde ya garantizada en las estimaciones más precarias de Engel, sino que también se puede ganar precisamente en determinar si alguna forma funcional compatible con la teoría del consumidor es concordante con la función derivada de ‘hacer hablar a los datos’. En esta tesis, dentro de estas formas flexibles, se busca aquélla que mejor represente los datos en términos estadísticos como así también económicos. Del mismo modo, las CE flexibles se contraponen con especificaciones tipo Working-Leser, para conocer si para determinados tipos de alimentos se puede trabajar con un modelo paramétrico compatible que cumpla con los requerimientos teóricos básicos. Asimismo, se considera que las CE totalmente no paramétricas, analizadas en sub-muestras por tipos de familias u hogares (lo que es compatible con el enfoque original de Engel), resultan ser un instrumento muy poderoso e ilustrativo para la economía aplicada. Por su parte, las CE semiparamétricas permiten incorporar estas CE de cada sub-muestra en una sola ecuación, aunque con sus limitaciones. 33 Capítulo 3 Metodología 3.1 Introducción En este capítulo se presentan los métodos de estimación e inferencia utilizados en la tesis, aplicados en los tres capítulos que componen la segunda parte de la misma. Por lo tanto, el desarrollo del marco metodológico se presenta de forma que siga un orden cronológico de acuerdo a la forma en que se siguen los capítulos que conforman los resultados. En la sección 3.2 se describen los métodos de estimación no paramétricos que serán considerados y comparados en lo que hace a su aplicación en la estimación de curvas de Engel (CE). Luego en la sección 3.3 se presenta la construcción de intervalos de confianza bootstrap para tales estimadores y los test de especificación que se utilizarán para contrastar especificaciones paramétricas usuales. En las secciones 3.4 y 3.5 se exponen las medidas que son utilizadas para la evaluación estadística y económica de los estimadores no paramétricos. Para la evaluación estadística se proponen una serie de medidas del error de estimación y predicción, y de bondad de ajuste, para la comparabilidad de los estimadores. Para la evaluación económica, se muestra la forma que adoptan las elasticidades-gasto y su metodología de estimación. Las mismas no solo tienen por fin evaluar los estimadores sino que también son utilizadas para la interpretación económica. Hasta aquí se tienen los métodos que son aplicados en el capítulo 5 de los resultados. En la sección 3.6 se desarrolla el marco metodológico para el Capitulo 6 de Resultados. Específicamente se presenta el modo en que son estudiadas las características demográficas de los hogares mediante un enfoque totalmente no paramétrico. Dado el carácter anidado de la tesis, se ven aplicados los métodos de las secciones anteriores. 34 Por último, en la sección 3.7, se desarrolla la especificación semiparamétrica de las CE que será estudiada, mostrando el procedimiento de estimación y el cómputo de desvíos estándares heterocedásticos para la inferencia. Adicionalmente, se proponen correcciones de las CE y de sus elasticidades ante la presencia de un gasto total endógeno debido a la posible simultaneidad de las elecciones de los hogares consumidores. 3.2 Metodologías de Estimación No Paramétricas Considerando la expresión estocástica general de una curva de Engel especificada a través de la participación en el gasto que tiene un determinado bien j en el presupuesto del hogar i ( wij ) como función del gasto total Gi , (tomado en su logarítmo) , i.e. wij = m j (ln Gi ) + ε ij (3.1) se supone que mh , j ∈ ℑh , siendo ℑh un espacio de funciones suaves. Para la estimación de m h , j ( x) = E (wij | ln Gi = x ) existen métodos de regresión o ‘suavizados’ no paramétricos con propiedades particulares que hacen que algunos estimadores se prefieran a otros, en base a criterios que van desde su simplicidad computacional a su mejor poder predictivo. En las investigaciones econométricas aplicadas, los estimadores más utilizados son aquéllos basados en núcleos o kernel, incluyendo a los polinomios locales; y últimamente se ha extendido el uso de regresiones spline, aunque siguen predominando los primeros (Cameron & Trivedi, 2005). En la presente sección se presentarán tales métodos con los que se trabajará a lo largo de la tesis. 3.2.1 El Estimador N-W Un caso especial de las regresiones kernel, lo constituye el denominado estimador Nadaraya-Watson7 (Nadaraya, 1964; Watson, 1964). Para el caso de diseños aleatorios, el mismo puede derivarse a partir de la definición de esperanza condicional utilizando funciones kernel o núcleos para la estimación de densidades (Härdle et al., 2004). De esta manera, m (x ) puede expresarse de la forma 7 De aquí en adelante Estimador N-W 35 f ( x, w) ∫ wf ( x, w)dw dw = f ln G ( x) f ln G ( x) m( x) = E (w | ln G = x ) = ∫ w (3.2) donde f ( x, w) es la densidad conjunta de w y ln G , y f ln G la densidad marginal de ln G . Sea K (.) una función acotada, simétrica y cuya integral en todo su dominio es igual a la unidad, para las observaciones {xi , wi }iN=1 , el estimador por núcleos de la densidad fˆ ( x, w) = conjunta f ( x, w) viene dado por 1 N ∑ K ( )K ( ) y para x − xi h w− wi g f ln G el estimador i por núcleos es fˆln G ( x ) = 1 N ∑ K (x − x ) . Desarrollando ∫ wfˆ ( x, w)dw , haciendo uso de las i i propiedades de las funciones kernel, de (3.2) se obtiene la expresión del estimador N-W: N N −1 ∑ K h ( x − xi )wi , j i =1 mˆ h , j ( x) = N N −1 ∑ K (x − x ) h i i =1 N x − xi ( Nh) −1 ∑ K wi , j h i =1 = N x − xi ( Nh) −1 ∑ K h i =1 (3.3) siendo h el parámetro de suavizado o ventana (bandwidth) y K (.) una determinada función núcleo ponderadora, donde K h (u ) = h −1 K (u / h ) . Entre las funciones K (.) más utilizadas se tiene la Uniforme o Rectangular ( K (u ) = K (u) = (1− | u |) I |u|≤1 (u ) ), la Gaussiana ( K (u ) = 1 2π e −u 2 1 2 I |u|≤1 (u ) ), la Triangular ( /2 ), la Epanechnikov ( K (u ) = 34 (1 − u 2 ) I |u|≤1 (u ) ) y la Tricúbica ( K (u ) = (1− | u |3 ) 3 I |u|≤1 (u ) ). La elección de K (.) tiene poco efecto sobre la performance del estimador, contrariamente de lo que ocurre con la ventana h (Härdle, 1991). Siguiendo a Loader (1999) se utilizará el núcleo Tricúbico en todas las estimaciones que involucren a una función del tipo K (.) . La elección de h , lejos de ser arbitraria, resulta crucial para el manejo del ‘trade-off’ entre sesgo y varianza de los ˆ h ( xi ) → wi por lo que se obtiene una estimadores no paramétricos. Cuando h → 0 , m ˆ h (xi ) → w y por lo tanto el interpolación de los datos. Por otra parte, si h → ∞ luego m estimador se transforma en una función constante e igual a la media muestral de la variable respuesta para cada valor del gasto total. En términos generales, el suavizado * óptimo h es aquel que minimiza el Error Cuadrático Medio (ECM). Bajo ciertas 36 ∫ ( ) condiciones ( K (u ) du < ∞ , lim uK (u ) = 0 y E w 2 < ∞ ) y suponiendo que h → 0 , |u |→ ∞ Nh → ∞ , es posible demostrar que8 ECM [mˆ h ( x )] ≈ ( Nh ) −1 σ 2 (x ) h4 K2+ 4 f ln G ( x) 2 2 m' ( x ) f ln G ' ( x) 2 m' ' ( x ) + 2 µ 2 (K ) f ln G ( x) Con σ 2 ( x ) = V (w | ln G = x ) , µ 22 (K ) = u 2 K (u ) du y m ∫ (k ) (3.4) la k-ésima derivada de m . El primer término de (3.4) se corresponde con la varianza del estimador, mientras que el segundo es el sesgo al cuadrado del mismo. El término 2[ m' ( x ) f ln G ' ( x )] / f ln G ( x ) en la expresión sesgo al cuadrado, es denominado ‘sesgo de diseño’ debido a que depende de la distribución de la variable ln G , por lo que el sesgo es sensible a la posición de las x i ’s. Relacionado con esto, una característica del estimador N-W es la presencia de un mayor sesgo en los extremos (‘sesgo de frontera’), siendo una desventaja respecto a otros estimadores menos sensibles a los puntos extremos. Ya con los polinomios locales, que se presentan en la próxima sub-sección, se logra reducir tal sesgo. La versión asintótica de (3.4) puede escribirse de la forma ECMA( N , h ) = ( Nh) −1 C1 + h 4 C 2 (3.5) siendo C1 y C2 términos constantes con respecto a ( N , h) (Härdle et al., 2004). Minimizando tal expresión con respecto a h , es fácil ver que el parámetro de suavizado ( ) óptimo será h * = O N −1 / 5 , y con ello de (3.4) – (3.5) se deduce que, en el óptimo, el error ( ) cuadrático medio decrece a una tasa del orden O N −4 / 5 . Esta tasa de convergencia menor a la del estimador mínimo cuadrático del modelo lineal paramétrico, es el costo que debe asumirse al utilizar métodos de regresión no-paramétrica. Claramente, en términos prácticos la elección del parámetro de suavizado a partir de (3.4)-(3.5) no resulta directamente viable debido a que depende de m y de sus derivadas, como así también de la densidad de la variable ln G , por lo que se recurre a diferentes métodos empíricos para * la elección h . Más adelante se presentan los métodos de selección del suavizado utilizados en el presente trabajo y que son aplicables al conjunto de ‘suavizados lineales’. Ver Härdle et al. (2004), Cap. 4 (Sección 4.1.2.3). Bajo las mismas condiciones se demuestra la convergencia en probabilidad del estimador N-W. 8 37 La expresión (3.3) del estimador N-W puede re-expresarse de la forma N mˆ h (x ) = ∑ H h ,i ( x )wi (3.6) i =1 con H h ,i ( x ) = N −1 K h ( x − x i ) N N −1 ∑ K h ( x − xi ) i =1 Con lo cual N ∑ H (x ) = 1 h ,i i =1 Por lo tanto, el estimador N-W puede interpretarse como un promedio ponderado local de la variable respuesta alrededor de x0 o bien como una combinación lineal de la variable respuesta wij . De aquí que pertenezca a la clase de suavizados lineales. Esta propiedad es compartida por varios estimadores no paramétricos, y en particular, por los otros dos métodos que se aplicarán en la presente investigación. De la literatura relevada, el estimador N-W parece ser el más utilizado para la estimación no paramétrica y semiparamétrica de curvas de Engel (Banks et al., 1997; Delgado & Miles, 1997 ; Blundell & Duncan, 1998; Fousekis & Lazaridis, 2001; Blundell et al., 2003; Barrientos Marín, 2006; 2009; entre otros). Sin embargo, otros estimadores poseen ventajas estadísticas sobre éste, sin necesidad de incurrir en mayores costos o complejidad computacional. 3.2.2 Polinomios Locales El estimador N-W puede ser interpretado como un caso particular de regresiones polinómicas locales. Específicamente, el estimador N-W puede derivarse de obtener aquel polinomio local de grado cero (i.e. constante) que minimiza la suma de cuadrados de los residuos ponderada por ωh ,i ( x0 ) = K h ( xi − x ) . Es decir: 38 N aˆ ≡ mˆ h = arg min ∑ (wi − a ) ω h ,i ( x ) a 2 (3.7) i =1 De las condiciones de primer orden para un mínimo, surge que â es justamente el estimador N-W de (3.6). Por lo tanto, el estimador N-W puede ser visto como una constante (o polinomio de grado cero) local, obtenido del problema de ‘mínimos cuadrados ponderados locales’. Una generalización de esto resulta de proponer un polinomio local de grado p. De esta manera, para un punto x0 del logaritmo del gasto ( total, se busca un vector aˆ = aˆ0 ,K, aˆ p N ) T tal que [ min ∑ wi − a 0 − a1 ( x i − x ) − K − a1 ( xi − x ) a ]ω p 2 h ,i (x ) (3.8) i =1 Se puede observar que el estimador â está evaluado en un punto específico de la covariable y por lo tanto varía ante cambios en el valor de las x' s . P ello resulta conveniente ( ) expresarlo de la forma aˆ ( x ) = aˆ0 ( x ),K, aˆ p ( x ) . La solución de (3.8) es la que corresponde T a mínimos cuadrados ponderados, aunque en este caso para cada valor de la variable ln G . Es decir: ( aˆ ( x ) = XTx Ω x X x ) −1 XTx Ω x w w = (w1 , K, wN ) , T donde 1 1 Xx = M 1 (x1 − x ) (x2 − x ) K K M O (x N − x ) K (3.9) (3.10) (x1 − x ) p (x 2 − x ) p , M (x N − x ) p Ω x = I N × N (ω h ,1 ( x ), K , ω h , N ( x )) T (3.11) (3.12) Con ωh ,i ( x ) = K h ( xi − x ) ≡ K (( xi − x ) / h ) . De (3.9) se concluye que los polinomios locales pertenecen también a la clase de suavizados lineales. 39 Por lo tanto, de la estimación por polinomios locales se obtienen regresiones locales a cada punto x j de la muestra {xi }i =1 . A pesar de obtener en (3.9) un vector de estimadores â de N los coeficientes polinómicos, de (3.8) se puede observar que el estimador local polinómico de la función de regresión m vendrá dado por mˆ h = aˆ0 ( x ) (3.13) Para el caso particular de p = 0 se tiene el estimador local constante que no es más ni menos que el estimador N-W. Cuando p = 1 se tiene el denominado estimador local lineal y para p = 2 el estimador local cuadrático. Para las aplicaciones de la tesis se consideran estos dos estimadores locales polinómicos, además del N-W, dado que ajustes cúbicos o de mayor orden rara vez producen mejoras adicionales en la estimación (Loader, 1999: 22). Ahora bien, ¿Por qué puede resultar conveniente utilizar un polinomio con p > 0 en vez de conformarse con el ajuste del N-W? La respuesta a esta pregunta recae esencialmente en la disminución del sesgo del estimador, principalmente en los puntos extremos, disminuyendo así mismo la sensibilidad ante ‘outliers’. Para ver esto, basta con observar las componentes del error cuadrático medio del estimador local lineal. Siguiendo a Härdle et al. (2004) el mismo puede expresarse de la siguiente manera: ECMA[mˆ h ( x )] ≈ ( Nh) −1 σ 2 (x ) f ln G ( x) 2 K2+ h4 {m' ' (x )}2 µ 22 (K ) 4 (3.14) Comparando con (3.4) se observa que el estimador local lineal no presenta el sesgo de diseño, y desaparece cuando m es lineal. Con esto se tiene que el estimador local lineal logra mejorar la estimación en aquellos intervalos donde las observaciones están más esparcidas, como es en los niveles extremos de ingresos. Específicamente, en los puntos extremos el estimador N-W tiene un sesgo asintótico de orden h , mientras que el sesgo 2 del estimador local es del orden h , por lo que este último apacigua el sesgo de frontera (Wasserman, 2006). Respecto a estimadores polinómicos locales con p > 1 puede decirse que es esperable que un mayor grado conlleve un estimador con menor sesgo, aunque incrementando su variabilidad debido a la mayor cantidad coeficientes a estimar, mezclándose los efectos del grado del polinomio con los del parámetro de suavizado. Por lo tanto, se recomienda 40 trabajar con polinomios de grado 1 y/o 2 y luego concentrarse en la elección del parámetro de suavizado óptimo para cada caso (Loader, 1999). 3.2.3 Suavizado Spline Los estimadores presentados anteriormente guardan una estrecha relación, a saber: el estimador N-W puede ser visto como un caso particular de los estimadores polinómicos locales, pudiéndose expresar como resultados de problemas de minimización locales de los residuos al cuadrado ponderado por una determinada función núcleo. Existen otros estimadores no paramétricos que descansan en enfoques, casi en su totalidad, diferentes a tales suavizados locales, aunque se basan en algún proceso de optimización de alguna función de los residuos. Uno de ellos es el suavizado mediante splines. El mismo está basado en el criterio de mínimos cuadrados penalizados. El problema consiste en elegir m de forma tal que minimice N ∑ (w i i =1 − m( xi ) ) + λ m´´ 2 2 2 (3.15) Con m´´ 2 = ∫ m' ' ( x )dx 2 (3.16) El término (3.16) se corresponde con la penalización por la ‘rugosidad’ de la curva estimada. En este caso el parámetro λ es el que controla la suavidad de m̂ manejando el trade-off entre un ajuste interpolado y la penalización. Cuando λ = 0 , la solución de (3.15) es simplemente la función interpoladora. Mientras mayor sea λ , más peso se le otorga a 2 m´´ 2 , derivando en un estimado más suave. En el límite, si λ → ∞ , m̂ converge a la estimación lineal por mínimos cuadrados ordinarios (MCO). En este problema la penalización recae sobre la derivada segunda de la función, por lo que debe suponerse que la misma existe. El problema de mínimos cuadrados penalizados puede generalizarse incorporando la k-ésima derivada en la componente de penalización mediante la norma de Sobovev, para la cual m Sob = (∫ m + (m') + L +(m 2 2 ) dx) (k ) 2 1/ 2 (Yatchew, 2003: 37-40). 41 La función m ˆ ( x ) que minimiza (3.15) es lo que se conoce como un spline cúbico natural cuyos nodos son los datos ordenados, i.e. {x (1) , K , x ( N ) } con x(i ) ≤ x(i +1) (Green y Silverman, 1994). Específicamente, considerando la clases de funciones dos veces diferenciables en el intervalo [ x (1) , x ( N ) ] , luego se demuestra9 que la única función que mˆ λ ( x) representado por medio de minimiza (3.15) está dada por un estimador polinomios cúbicos de la forma pi ( x ) = β0,i + β1, i x + β 2,i x + β3,i x 2 2 para cada intervalo [ x(i ) , x( i +1) ] con i = 1,K, n − 1 . Para una base de B-Splines de orden 4, {Bi , i = 1, K , N + 4} , el spline cúbico natural puede escribirse como combinación lineal de tal base, i.e. mˆ ( x ) = N +4 ∑ bˆ B (x ) j (3.17) j j =1 ( Por lo tanto, para obtener m ˆ ( x ) basta con estimar bˆ = bˆ1 , K , bˆN + 4 ) T . De esta manera, se puede re-expresar el problema de mínimos cuadrados penalizados utilizando la expresión de m por medio de su base, obteniendo el siguiente planteo: min (w − Bb ) (w − Bb ) + λb T Ψb T b (3.18) ∫ Donde [B]ij ≡ Bij = B j ( xi ) y [ Ψ ] jk ≡ ψ jk = B 'j' ( x )Bk'' ( x )dx . Resolviendo (3.18) se tiene que: ( bˆ = B T B + λΨ ) −1 BT w (3.19) De esta manera, de (3.17) y (3.19) se observa que los suavizados spline pertenecen a la clase de suavizados lineales. 3.2.4 Matrices de los Suavizados y Grados de Libertad Como se mencionó anteriormente, los tres tipos de estimadores no paramétricos presentados pertenecen a una clase más general de suavizados lineales. Esta propiedad que comparten tales estimadores es una ventaja al momento de proponer criterios comunes para la elección de los suavizados y construcción de medidas o estadísticos para su comparación. En esta sub-sección se presentarán algunos componentes de los 9 Para un desarrollo exhaustivo de los suavizados spline ver Green y Silverman (1994). 42 suavizados lineales, que resultan cruciales para abordar los problemas de estimación e inferencia, bajo una perspectiva común. Anteriormente se presentó a los suavizados lineales como aquéllos que pueden expresarse como combinaciones lineales de los valores observados de la variable respuesta (que en el caso de curvas de Engel sería la participación del algún alimento específico en el gasto total, i.e. w = {wi }iN=1 ). Más formalmente, se dice que un estimador m̂ de m es un suavizado lineal si existe una matriz L , denominada matriz de suavizado, tal que m̂ = Lw (3.20) donde m ˆ ≡ (mˆ ( x1 ), K , mˆ ( x N ) ) = (wˆ 1 , K , wˆ N ) ≡ ŵ , y L es una matriz de orden n × n con [L]ij = l j ( xi ) , por lo que cada fila de L es un vector de ponderaciones que se aplican a cada wi para obtener el estimador m ˆ ( xi ) . En base a esta definición general de los suavizados lineales puede observarse de (3.6) que la matriz de suavizado para el estimador N-W viene dada por: L NW = H h,i Con H h ,i ( x k ) = N −1 K h ( x k − xi ) N −1 N ∑ K (x h k − xi ) H h,1 ( x1 ) L H h ,n ( x1 ) = M O M H ( x ) L H ( x ) h ,n N h,1 N (3.21) ˆ NW = L NW w . , con lo cual m i =1 Para el caso de los polinomios locales, de (3.9) y (3.13), se tiene que la matriz de suavizado puede escribirse de la forma T ( L PL = e1 XT ΩX ( ) donde e1 = (1,0,K ,0 ) , X = diag X x1 , X x2 , K , X x N T ( −1 ) XT Ω con X xi (3.22) defendida por (3.11) y ) Ω = diag Ω x1 , Ω x 2 ,K, Ω xn , donde Ω xi está definida en (3.12). Por último, los suavizados spline, a partir de (3.17) y (3.19), definen la siguiente matriz de suavizado: ( L S = B BT B + λΨ ) −1 BT (3.23) 43 Con B y Ψ definidas anteriormente. En base a estas matrices, se presentan dos medidas globales de “la cantidad o monto de suavizado” de un estimador obtenido por medio de un suavizado lineal (Loader, 2004:11). A su vez ambas son definiciones de los ‘grados de libertad’ o ‘número efectivo de parámetros’ en el caso no paramétrico. La primer definición de grados de libertad de un estimador m̂ de m cuya matriz de suavizado es L , viene dada por la traza de la misma, i.e. N v1 = tr (L ) = ∑ lev( xi ) (3.24) i =1 Donde con lev se representa los ‘leverage’, i.e. los elementos de la diagonal principal de la matriz de suavizado, y miden la sensibilidad de la curva ajustada m ˆ ( xi ) en cada punto particular de los datos observados. Otra definición de grados de libertad viene dada por ( v2 = tr LT L ) (3.25) La gran ventaja de contar con los grados de libertad (3.24) y (3.25) es que proveen una medida del suavizado que es comparable entre diferentes estimadores aplicados a la misma base de datos (Loader, 1999: 28). Para los fines de este capítulo resulta crucial contar con un marco general y un conjunto de medidas aplicadas en común tanto a las regresiones N-W, a los polinomios locales, como así también a los suavizados splines. 3.2.5 Elección del Parámetro de Suavizado Si bien se tiene una medida en común del suavizado para la clase de estimadores no paramétricos lineales, los grados de libertad óptimos pueden diferir (y generalmente lo hacen) entre estimadores. Sin embargo, pueden tomarse criterios o metodologías automáticas de elección de suavizado que se apliquen a todos los suavizados lineales que se estén comparando. Aquí se presentan algunos de los métodos que se utilizan en la presente tesis, aunque, por la similitud de los resultados en unos casos o por el menor error cuadrático medio muestral arrojado, resulta conveniente la elección de un solo criterio, y de ahí comparar los estimadores con sus parámetros de suavizados óptimos. 44 En primer lugar se debe notar que todos los métodos de suavizado presentados dependen de un parámetro que determina el grado de suavizado de la curva estimada. Para el estimador N-W y los polinomios locales, éste viene dado por la ventana o bandwith h , mientras que en el spline, el parámetro de penalización λ controla el suavizado. Con esto, el método de elección de dichos parámetros debe descansar en algún criterio que mida la performance del ajuste contemplando el trade-off entre el sesgo y la varianza de los estimadores. Existen varios enfoques para encarar el problema en base a diferentes medidas alternativas. Siguiendo el criterio de minimización del error cuadrático medio, una medida posible viene dada por el error cuadrático promedio (ECP): N ECP (h ) ≡ N −1 ∑ (mˆ (xi ) − m( xi )) 2 (3.26) i =1 O también su esperanza, el Error Cuadrático Medio Promedio (ECMP), definido por N ECMP (h ) ≡ N −1 ∑ E (mˆ (xi ) − m( xi )) . Esta última es una versión discreta, de una medida 2 i =1 global de discrepancia, denominado Error Cuadrático Medio Integrado: ∞ ECMI (h ) = E ∫ [mˆ ( xi ) − m( xi )]2 −∞ (3.27) Dado que el ECP, el ECMP, el ECMI o el ECI (equivalente al ECMI sin la esperanza) producen asintóticamente el mismo suavizado (Marron & Härdle, 1986), en general se trabaja con el más fácil de calcular, el ECP. Sin embargo, al no conocer m(.) , el ECP no puede minimizarse de forma directa, sino a través de aproximaciones. Uno de los primeros métodos para la elección automática del parámetro de suavizado en estimaciones no paramétricas fue el de convalidación cruzada (CV)10, motivado en la elección de un parámetro de suavizado que minimice el riesgo u error de predicción EP ≡ E[ y + − yˆ + ] 2 , siendo ŷ + la predicción para una nueva observación x+ , i.e. ŷ+ = m( x+ ) . Puesto que EP = σ 2 + E[mˆ ( x ) − mˆ ( x )] 2 = σ 2 + ECM , entonces la minimización del EP promedio con respecto a h resulta equivalente de resolver para el ECMP o el ECP. Para estimar el error de predicción, el método CV propone omitir cada Entre los primeros trabajo que introducen el criterio CV se encuentran el de Allen (1974) para modelos paramétricos. Clark (1975) lo aplica caso del estimador N-W, y Wahba y Wold (1975) para estimadores splines 10 45 observación ( xi , wi ) del conjunto de datos, y luego obtener su predicho de las restantes N1 observaciones. De esta forma se tiene un estimador del riesgo de predicción dada por el error de validación cruzada11: N CV (h ) = N −1 ∑ (wi − mˆ −i ( xi )) 2 (3.28) i =1 Este método es confiable en muestras grandes en el sentido de que si ĥ (o λ̂ ) minimizan (3.28), luego ECMI( ĥ )/ECMI( hECMI ) converge a uno cuando n → ∞ , siendo hECMI el suavizado que minimiza (3.27) (Yatchew, 2003: 44). La aplicación de (3.28) implica un alto costo computacional, y más aún para muestras grandes. Sin embargo, se puede demostrar que para el caso de suavizados lineales se tiene que mˆ − i ( xi ) = mˆ ( xi ) − li ( xi )wi mˆ ( xi ) − [L]ii wi ≡ 1 − li ( xi ) 1 − [L]ii Por lo que (3.28) puede escribirse de la forma w − mˆ ( xi ) CV (h ) = N ∑ i i =1 1 − [L ] ii −1 N 2 (3.28’) Por lo tanto, el criterio CV se reduce a minimizar la función (3.28’) (Wasserman 2006: 70). Otra alternativa a minimizar la función CV, es usar el criterio de convalidación cruzada generalizada (GCV), donde simplemente se sustituye cada elemento de la diagonal [L]ii de (3.27) por su promedio 1 N ∑ [L] ii = tr (L ) / N = v1 / N , obteniendo12 i w − mˆ ( xi ) GCV (h ) = N ∑ i i =1 1 − v1 / N −1 N 2 (3.29) Adicionalmente a los criterios CV y GCV, se considerará una metodología alternativa basada en una versión del criterio de información de Akaike para la elección del parámetro de suavizado, siguiendo la propuesta mejorada por Hurvich et al. (1998). La función a minimizar viene dada por: 11 Esta función es comúnmente denominada leave-one-out cross-validation score El criterio GCV puede ser visto como caso particular del enfoque más general de ‘funciones de penalización’ (Ver Härdle et al., 2004, Cap 4, Sec. 4.3.3) 12 46 N 2[v1 + 1] AICc = ln N −1 ∑ [ wi − mˆ ( xi )]2 + 1 + N − v1 − 2 i =1 (3.30) Mediante pruebas de simulación Hurvich et al.(1998) demuestra que el criterio de selección de ventana por medio del AICc da mejores resultados en comparación a métodos plug-in y al GCV. Por su parte Li y Racine (2004) muestran que para muestras pequeñas se obtienen mejores resultados que los del CV, mientras que en muestras grandes las diferencias son mínimas. En la presente tesis se utilizan estas metodologías ((3.28)-(3.30)) por su facilidad computacional, a diferencia de los métodos plug-in, y a su vez, muestran un buen desempeño general en ejercicios de simulación y aplicado a datos reales. Si bien se utilizan los tres criterios (CV, GCV, y AICc), es deseable elegir sólo uno de ellos en función de alguna medida comparativa del desempeño de los mismos. Como se verá en la sección de resultados, en general el criterio que se adopta es el de validación cruzada generalizada, pero entre éste y los resultados de los otros dos, no hay grandes diferencias en la mayor parte de los casos. 3.3 Inferencia en las Regresiones No Paramétricas 3.3.1 Intervalos de Confianza Un intervalo de confianza (IC) para un suavizado lineal m̂( x ) , bajo el supuesto de que E(mˆ (x )) = m( x ) , tiene la forma mˆ ( x ) ± c. Var(mˆ ( x )) (3.31) Sin embargo los suavizados lineales son sesgados, por lo que (3.29) es en realidad un intervalo de confianza para E(m̂( x )) . Para afrontar el problema del sesgo se puede estimar el mismo por medio de métodos plug-in, sin embargo esto tampoco resuelve del todo el problema (Loader, 1999: 168). En general se opta por estimar el intervalo de confianza eligiendo una ventana menor a la óptima, de manera de apaciguar el sesgo (Loader, 2004; Yatchew, 2003). Para construir un IC a partir de (3.30) es necesario estimar 47 la varianza del estimador. Para el caso homocedástico con Var (ε i ) = σ 2 , de la expresión general (3.20) se tiene que E (m̂( x )) = ∑ Li (x )m( xi ) (3.32) i Var (mˆ ( x )) = σ 2 ∑ l i ( x ) = σ 2 l ( x ) 2 2 (3.33) i Para el caso heterocedástico con Var (ε i ) = σ 2 ( xi ) , (3.33) se transforma en Var(mˆ ( x )) = ∑ σ 2 ( xi )li (x ) 2 (3.34) i 2 Suponiendo errores homocedásticos, la varianza σ puede ser estimada usando la suma de los cuadrados de los residuos normalizada, considerando los grados de libertad v1 y v2 , definidos en (3.24) y (3.25), respectivamente13, i.e. σˆ 2 = 1 N − 2v1 + v 2 N ∑[w i − mˆ ( xi )]2 (3.35) i =1 En el caso de trabajar con varianza no constante, se puede estimar σˆ 2 ( xi ) suponiendo alguna estructura de varianzas. En ambos casos se construye (3.31) para alguna constante c. Bajo la hipótesis de normalidad de los errores ε i , la constante c puede ser elegida de una distribución t-Student con n − 2v1 + v 2 grados de libertad (Loader, 2004) o directamente de la normal estándar (Wasserman, 2006). Ambos criterios descansan en las propiedades asintóticas de los suavizados lineales. En la presente investigación no se trabajará con las fórmulas asintóticas sino que los IC serán computados por medio de la metodología bootstrap utilizando los residuos empíricos como aproximación de la verdadera distribución de los errores. Se considera que en estos casos de muestras finitas, teniendo en cuenta que los métodos no paramétricos tienen una convergencia menor que N , y son a su vez asintóticamente sesgados, la metodología bootstrap puede ser más segura para una inferencia adecuada. Específicamente se realizará un wild bootstrap a los fines de captar la heterocedasticidad 13 Tomando estos grados de libertad, se obtiene un estimador insesgado de la varianza (Loader, 1999: 37) 48 de los errores (Li y Wang, 1998: 150-151). Siguiendo a Yatchew (2003: 161), el procedimiento para el estimador N-W y los polinomios locales es el siguiente: * 1. Estimar m usando un parámetro de suavizado óptimo h elegido mediante ˆ h* . alguno de los criterios propuestos (CV, CGV o AICc). De aquí se obtiene m 2. Volver a estimar m aplicando un mayor suavizado que el óptimo. En particular se elige h + = (1,2) h* . De aquí se obtiene m̂h + . 3. Volver a estimar m aplicando un menor suavizado que el óptimo. En particular se ˆ h _ y se calculan los residuos εˆh _ . elige h − = (0,8) h* . De aquí se obtiene m 4. Se obtiene una muestra usando el wild bootstrap: εˆboot = aεˆh _ con una probabilidad p = (5 + 5 ) / 10 y εˆboot = bεˆh _ con probabilidad 1 − p = (5 − 5 ) / 10 , donde a = (1 − 5 ) / 2 y b = (1 + 5 ) / 2 . ˆ h+ + εˆboot , con wˆ h + = mˆ h + (x ) 5. Construir los datos bootstrap de la forma wboot = w N 6. Estimar m usando la muestra bootstrap {wboot,i , xi }i =1 utilizando el parámetro de * ˆ boot , h* suavizado óptimo h . De aquí se obtiene m 7. Repetir B veces los pasos 4-6 8. Para calcular un IC del 95% para m , obtener los cuantiles de 0,025 y 0,075 de la ˆ boot , h* . distribución de m Para el caso de los suavizados splines hay una modificación ligera en el algoritmo anterior dado que en éste, el suavizado está representado por el parámetro de penalización o bien por los grados de libertad. En esta investigación la búsqueda del suavizado óptimo para los estimadores splines se realiza por medio de los grados de libertad. Lo único que cambia serían los pasos 1-3, donde se busca en primer lugar los grados de libertad * correspondientes al óptimo v , y luego se ajusta con v + = (0,9)v* y v − = (1,1)v* en los pasos 2 y 3, respectivamente. 49 3.3.2 Test de Especificación Una vez obtenidos los estimadores no paramétricos, es deseable conocer si alguna especificación paramétrica de las curvas de Engel es adecuada respecto a lo obtenido mediante un suavizado no paramétrico. Específicamente, se puede construir un test para saber si un ajuste lineal o cuadrático es adecuado, tomando como referencia un ajuste no paramétrico. En términos generales el test de hipótesis puede plantearse de la forma H 0 : m(ln G ) ∈ ℑθ vs. H1 : m(ln G ) ∉ ℑθ (3.36) Siendo ℑ θ un cierto espacio de funciones paramétricas. Si ℑ θ comprende la formas funciones lineales, luego se tiene la clásica especificación lineal Working- Leser (Working, 1943; Leser, 1964), la que puede expresarse por wi = θ0 + θ1 ln Gi + ε i (3.37) Una variante paramétrica de la misma, es su versión cuadrática (Banks et al., 1997) o cúbica (Costa, 2001; Blow, 2003). Esto es wi = θ 0 + θ1 ln Gi + θ 2 (ln Gi ) + ε~i 2 (3.38) O bien ~ 2 3 wi = θ 0 + θ1 ln Gi + θ 2 (ln Gi ) + θ3 (ln Gi ) + ε~i (3.39) En este trabajo se considerarán estas tres variantes paramétricas dada su relevancia en la literatura económica. Sea H la matriz de estimación del modelo paramétrico (hat matrix) y L la matriz de suavizado correspondiente a un ajuste no paramétrico, se define el siguiente estadístico T= Lw − Hw / η σˆ 2 (3.40) Con η = tr{(L − H ) (L − H )} y σ̂ 2 definido en (3.35). Bajo la hipótesis nula, la T distribución del estadístico T puede aproximarse a una distribución F con v1 grados de libertad en el numerador y N − 2v1 + v 2 en el denominador. Una forma equivalente de mostrar el estadístico (3.40) es a través de la suma de cuadrados de los residuos (Cleveland & Devlin, 1988). Sea SCRθ la suma de cuadrados de los residuos del modelo 50 paramétrico (sea (3.37), (3.38) o (3.39)) y SCRnp la suma de cuadrados de los residuos del suavizado no paramétrico, luego podemos se tiene el siguiente estadístico T= ( SCRθ − SCRL ) /(vθ − vnp ) SCRnp / vnp (3.40’) ( SCRθ − SCRnp ) /(vθ − vnp ) = σˆ 2 Con vθ = tr (I − H ) vnp = tr{(I − L) T (I − L)} = N − 2v1 + v2 . y Considerando la aproximación a la distribución F, luego se rechaza H 0 a un nivel de α % si T > Fvθ − v L , v L (1 − α ) Dado que este F-test es simplemente una aproximación, aún bajo el supuesto de normalidad de los errores (Loader, 2004), es recomendable simular la distribución de T bajo la hipótesis nula (Cai et al., 2000; Fan et al., 2001; Le & Ullah, 2003). Para ello se realiza el siguiente wild- bootstrap para encontrar el p-valor bajo la hipótesis nula: 1. Del ajuste paramétrico correspondiente a la hipótesis nula se calcula SCRθ y del suavizado no paramétrico usando el parámetro de suavizado óptimo se obtiene SCRnp . Luego se computa el siguiente estadístico T* = ( SCRθ − SCRnp ) (3.41) SCRnp Este estadístico más simple que el (3.40’) es propuesto en Ullah (1985). Dado que con las réplicas del bootstrap los grados de libertad permanecen inalterados, luego (3.40’) y (3.41) son equivalentes para el test derivado del bootstrap (Loader, 2004: 555). ~ εˆboot ,i = aεˆnp ,i con una 2. Se obtiene una muestra usando el wild bootstrap: p = (5 + 5 ) / 10 probabilidad 1 − p = (5 − 5 ) / 10 , donde y ~ εˆboot ,i = bεˆnp ,i a = (1 − 5 ) / 2 , con probabilidad b = (1 + 5 ) / 2 y N ε~ˆnp ,i = εˆnp ,i − N −1 ∑ εˆnp ,i siendo εˆnp,i los residuos de la estimación no paramétrica. i =1 51 ˆ θ + εˆboot , siendo wˆ θ = xT θˆ el 3. Construir los datos bootstrap de la forma wboot = w predicho del modelo paramétrico. N 4. Estimar m usando la muestra bootstrap {wboot,i , xi }i =1 en base a la especificación paramétrica y también el modelo no paramétrico utilizando el mismo parámetro de suavizado que en el paso 1. De aquí se obtiene las sumas de cuadrados de los residuos SCRboot ,θ y SCRboot ,np , y se computa el estadístico * Tboot = ( SCRboot ,θ − SCRboot , np ) SCRboot , np * . 5. Repetir B veces los pasos 2-4 obteniendo la distribución empírica de Tboot 6. Se computa el p-valor de la forma * * B 1+ #{Tboot , k > T }k =1 1+ B . En resumen, el test de especificación (3.36), para cada una de las formas paramétricas (3.37)-(3.39) se llevará a cabo usando dos pruebas, una paramétrica y la otra no paramétrica. La primera en base al estadístico T utilizando la aproximación a la distribución F. La segunda utilizando el estadístico T * en base a la distribución empírica del mismo mediante réplicas bootstrap, y considerando la posible heterocedasticidad de los errores. La gran ventaja de estas pruebas es el amplio alcance de las mismas respecto a la utilización de cualquier suavizado lineal, a la vez que también pueden implementarse para comparar dos regresiones no paramétricas de diferente naturaleza, dentro de la familia de suavizados lineales. Existen otros test de especificación que, o bien son independientes del tipo de suavizado no paramétrico (como ser el test de Bierens (1990)), o están basados en algún método de suavizado especifico, como ser en regresiones kernel (Härdle & Mamnen, 1993; Li, 1994 ; Zhen, 1996). Por el hecho de que la presente investigación se enfoca en el análisis comparativo de los diferentes suavizados lineales propuestos, es necesario contar con pruebas de hipótesis que sean aplicables a cada uno de ellos. 52 3.4 Performance Comparativa Teniendo los diferentes suavizados lineales propuestos, es necesario contar con alguna medida que indique el o los estimadores preferidos en base a algún criterio (estadístico), para así poder focalizar el estudio de las relaciones de Engel bajo una perspectiva más económica, una vez seguros de que el estimador elegido es el “mejor” entre una cierta clase de estimadores alternativos. En base a esto, se proponen una serie de medidas de performance estadística que serán aplicados a los diferentes suavizados de curvas de Engel propuestos, una vez que cada uno de ellos es estimado utilizando un suavizado óptimo (en base a algún criterio, sea CV, GCV, AICc). En base al error de predicción (EP), un estimador naive del mismo es el Error Cuadrático de Predicción Promedio en la muestra (ECPP), definido por N ECPP = N −1 ∑ [ wi − mˆ h ( xi )] 2 (3.42) i =1 Esta medida es muy simple de computar y, con algunas variantes, es comúnmente utilizada en la literatura empírica para comparar la performance estadística de diferentes tipos de suavizados (Aydin, 2007) o del mismo suavizado con ventanas óptimas según distintos criterios (Aydin y Omay, 2006). Para el caso de curvas de Engel, Blundell y Duncan (1998) utilizan el ECPP para comprar diferentes suavizados basados en núcleos. Esta medida, si bien puede ser útil para comparar diferentes estimadores no paramétricos, resulta muy deficiente como medida de performance para la búsqueda del suavizado óptimo, pues la minimización del (3.42) se logra cuando wi = m ˆ h ( xi ) para cada i. De todas formas, en el presente contexto se computa una vez que ya fue el elegido el suavizado óptimo mediante CV,GCV o AICc. Una medida análoga a (3.42), que en ciertos casos permite ver mejor la “diferencia de performance” entre dos estimadores, es el Error Absoluto de Predicción Promedio (EAMP), el que puede escribirse de la forma N EAPP = N −1 ∑ wi − mˆ h ( xi ) (3.43) i =1 Adicionalmente de estas dos medidas basadas en el error de predicción, se computará el riesgo de estimación Cp introducido por Mallows (1973) en el contexto de regresiones 53 paramétricas. Considerando el error de estimación, dado por ∑[mˆ (x ) − m (x )] 2 i i , el i criterio Cp propone un estimador insesgado del mismo definido por Cp = 1 σ2 ∑ [w i − mˆ ( xi )]2 − N + 2v1 Con σ 2 = Var (ε i ) , la que es estimada utilizando (3.35). (3.44) Una forma alternativa de expresarlo (Wasserman, 2004; Aydin y Omay, 2006; entre otros) es Cp = 1N 2 2 ∑ [ wi − mˆ ( xi )] + 2σˆ v1 N i =1 (3.44’) Engel y Kneip (1996) utilizan esta versión del Cp para comparar distintas estimaciones de curvas de Engel no paramétricas, algunas de ellas basadas en suavizados óptimos locales. La expresión (3.44´) permite ver que el estadístico Cp también puede ser entendido como una corrección del estimador ‘naive’ ECPP, penalizando por el número de “parámetros”, lo que surge de tomar esperanza en (3.44’). Específicamente, es fácil probar que E (EAPP ) = EP + σ 2 2tr (L )N −1 , lo que significa que el estadístico Cp resulta ser un estimador más sensible del error de predicción. Como se verá en la aplicación empírica y en un ejercicio de simulación, la corrección introducida por Cp puede ser crucial en la comparación de performance de estimadores no paramétricos14. De (3.44) se observa que Cp depende de σˆ 2 , y por (3.35), la estimación de ésta depende de los grados de libertad de la estimación no paramétrica, por lo que se tiene una estimación de σˆ 2 para cada ajuste no paramétrico. Sin embargo para el análisis comparativo, es 2 necesario implementar (3.44’) considerando el mismo estimador de σ para los diferentes ajustes correspondientes a diferentes parámetros de suavizado. Cleveland y Devlin (1988) 2 recomiendan estimar σ usando el ajuste con el menor ventana (o mayores grados de libertad) entre los que se están considerando. El criterio Cp suele también utilizarse para la selección de la ventana óptima de los estimadores no paramétricos. Sin embargo, respecto al criterio GCV, puede que las diferencias sean despreciables, dado que el estadístico Cp puede expresarse como una aproximación del GCV (Wasserman, 2006: 70). Por lo tanto, en la presente investigación la medida Cp se usará para comparar los diferentes suavizados con los grados de libertad óptimos ya seleccionados. 14 54 Por último, se computará una medida de bondad de ajuste análoga al R-cuadrado de los modelos paramétricos. En términos teóricos el R-cuadrado o coeficiente de determinación está dado por R 2 = 1 − E(Var (w | x )) / Var (w ) = Var (E (w | x )) / Var (w ) . Doksum y Samarov (1995) proponen el siguiente estimador 2 N ∑ ( wi − w )( wˆ i − m ) R 2 = N i =1 N ∑ ( wi − w ) 2 ∑ ( wˆ i − m ) 2 i =1 (3.45) i =1 Siendo wi el valor observado de la variable respuesta, w su media muestral, ŵi el valor predicho para la observación xi y m su media muestral, es decir m = N −1 ∑i wˆ i ≡ N −1 ∑i mˆ ( xi ) . Se puede probar que R 2 ∈ [0,1] . Cuando es igual a uno, el estimador brinda un ajuste perfecto a los datos de la muestra. Cuando el R-cuadrado se aproxima a cero, entonces el estimador no ofrece un ajuste superior a aquél dado por la media simple no condicionada de las observaciones. Este R-cuadrado para modelos no paramétricos permite la comparabilidad entre dos estimadores no paramétricos cualesquiera, y más aún es aplicable a cualquier modelo, sea lineal o no-lineal, mostrando una medida de bondad de ajuste la cual no es por sí sola un criterio de selección de modelos, sino una medida adicional para reportar (Hayfield y Racine 2008: 10). Al igual que ocurre en el caso usual de modelos lineales, el R-cuadrado es creciente con los grados de libertad (el equivalente a la cantidad de parámetros) del estimador. Por lo tanto, para una mejor interpretación, conviene comparar los R-cuadrado de los estimadores no paramétricos con grados de libertad similares, adicionalmente de hacerlo con los ajustes derivados de aplicar los suavizados “óptimos” correspondiente a cada caso. Huang y Chen (2008) proponen un R-cuadrado alternativo al (3.45), basado en la estructura de un ANOVA no paramétrico, puesto que el de (3.45), basado en la noción de correlación, no la posee. La propuesta de Huang y Chen es sumamente interesante dado que brinda herramientas para un ANOVA no paramétrico, con un R-cuadrado resultante del mismo, y más aún, la posibilidad de corregirlo por los grados de libertad (análogo al R-cuadrado ajustado de los modelos lineales). Sin embargo, teniendo como objetivo la simple obtención de una medida adicional de performance del estimador, el R-cuadrado 55 basado en el ANOVA es más intensivo computacionalmente, a la vez que es necesario redefinir una nueva matriz de suavizado a partir de la matriz L, y, a pesar de ello, los resultados numéricos muestran pocas diferencias con el R-cuadrado de (3.45). Por lo tanto, se trabajará con este último. En síntesis, al evaluar el ‘desempeño estadístico’ de los estimadores no paramétricos se analizarán los valores arrojados por estas cuatro medidas, a saber: el ECMP, EAMP, Cp y el R 2 . Adicionalmente se incluyen los valores obtenidos de convalidación cruzada y del estadístico AICc. Si bien cada uno de ellos tiene sus debilidades para conformar un criterio estricto de selección, la combinación de los resultados brindados por los mismos, dan un perfil del mejor comportamiento en lo que hace al poder predictivo y de ajuste del modelo estimado. 3.5 Derivadas y Elasticidades No Paramétricas En general, en los estudios económicos de consumo y demanda, el fin último es conocer los comportamientos de los agentes económicos sintetizados en las elasticidades. En particular, para el caso de las relaciones o curvas de Engel el interés recae en las elasticidades gasto o ingreso, i.e. cuál es la variación porcentual en la cantidad demandada ante un cambio porcentual del poder adquisitivo. Si bien cada familia u hogar tiene su propia elasticidad-gasto, en general interesa tener una medida que sintetice, por lo que las elasticidades suelen evaluarse en el ‘hogar promedio’ o promediando las elasticidades de los hogares. Por definición, la elasticidad-gasto del bien j para el hogar i en un nivel de gasto total Gi = yi , está definida por: eG = d ln qij d ln Gi = dqij yi dGi qij ( y i ) (3.46) Donde qij ( yi ) representa la cantidad demanda del hogar i al nivel de gasto yi . De (3.1) se tiene que, bajo el supuesto de que el gasto total es exógeno dwij d ln Gi = mj' (3.47) 56 donde m j ' representa la derivada primera de m j respecto a ln Gi . Por definición, la variable respuesta se puede descomponer de la forma wij = pij qij / Gi . Por lo tanto (3.47) puede escribirse de la siguiente manera d [ pij qij / Gi ] d ln Gi = mj' (3.47’) Puesto que sobre una determinada curva de Engel, los precios se suponen constantes, luego el primer miembro de (3.47’) puede desarrollarse de la forma d [ p ij q ij / Gi ] d ln Gi = p ij [Gi dq ij − q ij dGi ] / G 2 dGi / Gi = p ij = dq ij dGi − p ij q ij dGi Gi dGi p ij q ij dq ij / q ij Gi = wij dGi / Gi dqij / qij dGi / Gi − p ij q ij Gi − wij (3.48) Luego de (3.47’), (3.48) y (3.46) se obtiene la expresión de la elasticidad-gasto correspondiente a una especificación generalizada de la curva de Engel Working-Leser. Específicamente, la elasticidad-gasto del bien j para el hogar i cuando su nivel de gasto es yi (o equivalentemente, su nivel del logaritmo del gasto es xi = ln yi ) viene dada por eijG = 1+ m j ' ( xi ) wij (3.49) De (3.49) se observa que para el cálculo de las elasticidades es necesario contar con la derivada primera de m. Específicamente, dada una estimación no paramétrica m̂( x ) se busca obtener de la misma, su primera derivada m̂' . La forma que la misma adopta, y la manera de computarla depende del estimador específico que se está considerando. Para el caso de estimador N-W, de (3.3) se tiene que su derivada analítica viene dada por 57 N x − xi ( Nh) −1 ∑ wi , j K ' h i =1 mˆ ' h , ( x ) N x − xi ( Nh) −1 ∑ K ' h i =1 (3.50) donde K ' ( z ) ≡ dK ( z ) / dz . Ullah (1988) y Rilstone y Ullah (1989), proponen estimar numéricamente esta derivada, dado que es más sencillo computacionalmente, y la misma puede obtenerse directamente a partir de la estimación de m . A su vez, es aproximadamente igual a la solución analítica y tienen las mismas propiedades asintóticas (Pagan y Ullah, 1999: 165). Específicamente, estos autores proponen la derivada numérica basada en la diferencia central usando dos puntos, esto es mˆ ' ( x ) = (2h) −1 [mˆ ( x + h ) − mˆ ( x − h )] (3.51) En el presente trabajo se utilizará (3.51) para la estimación de la derivada del estimador NW. Para el caso de los polinomios locales lineales y cuadráticos, la estimación de la derivada primera es mucho más directa. Dado que los ajustes polinómicos están motivados en la expansión de Taylor (Härdle et al., 2004), i.e. m(t ) ≈ m( x ) + m' ( x )(t − x) + K + m ( p ) ( x )(t − x) p (1 / p !) Luego por (3.8) se tiene que el estimador de la derivada primera de m , vendrá dado por mˆ ' ( x ) = aˆ1 ( x ) (3.52) El que es obtenido en el mismo proceso de minimización (3.8) para estimar m . Por lo tanto, ésta es una ventaja adicional de los polinomios locales lineales y cuadráticos sobre el constante o N-W 15. El suavizado spline goza de la misma propiedad de obtención de la derivada del estimador directamente de la estimación de m . El razonamiento es similar, al estar basado en polinomios cúbicos locales16. Por lo tanto, para la obtención de las elasticidades-gasto, en (3.49) se utilizarán las estimaciones de las derivadas correspondiente a cada método, usando la aproximación En términos más exactos, (3.5) es una aproximación a la derivada de la curva ajustada. El valor de (3.52) es denominado ‘estimador de la pendiente local’ (local slope estímate). El cómputo exacto requiere la incorporación de los residudos del polinomio local, lo cual implica un trabajo adicional, y la ganancia de obtener el estimador exacto es, en general, despreciable (Loader, 1999:102) 16 Para una presentación más extensa y detallada sobre las derivadas a partir de las regresiones spline, y de sus propiedades ver Zhou y Wolfe (2000) 15 58 numérica (3.51), y las obtenidas directamente a partir de las estimaciones polinómicas locales lineales y cuadráticas, y del suavizados spline. Con esto se obtienen curvas de las elasticidades-gasto como funciones del gasto total. Para la obtención de una medida resumen existen, al menos, dos posibilidades. Una es computar la elasticidad-gasto promedio, y la otra, evaluarla en el nivel medio del gasto. Para el primer caso, se debe obtener la derivada promedio. Considerando que E (m' ( x )) = ∫ m' ( x ) p (x )dx Siendo p(x ) la densidad del logaritmo del gasto total (evaluada en x ), luego un estimador del valor esperado de la derivada, viene dado por la siguiente derivada promedio (DP) DP = ∫ mˆ ' (x ) pˆ ( x )dx (3.53) La misma se obtiene estimando la densidad por algún método no paramétrico (en el presente caso se utiliza la estimación kernel de densidad) y aplicando algún método de integración numérica. Luego sustituyendo (3.53) en (3.49) y la media de los predichos m̂ , se obtiene la elasticidad promedio. Para el cómputo de elasticidad evaluada en el gasto medio simplemente se utilizan los predichos de la regresión no paramétrica y de su derivada, evaluados en la media del logaritmo del gasto total. Adicionalmente, se estiman los desvíos estándar de ambas elasticidades (como también de la derivada promedio) por medio del método wild-bootstrap. Ahora bien, a partir de las estimaciones de las elasticidades, ¿en qué consiste la evaluación económica de los estimadores? Además de poder captar cuando un bien es ‘inferior’, ‘necesario’ o ‘de lujo’, una propiedad deseable de las elasticidades-gasto, principalmente para el caso de alimentos, es que éstas sean decrecientes a medida que se incrementa el poder adquisitivo. Esto significa que el consumo de un bien alcanza niveles de saturación, de modo que incrementos adicionales del ingreso llevan a los hogares consumidores a destinar su presupuesto a otro tipo de necesidad, dado que las del alimento en cuestión ya están prácticamente satisfechas para un nivel dado de ingresos (Brown y Deaton, 1972). Si 59 esto no ocurre, una explicación plausible tiene que ver con un cambio (aumento) de la calidad del alimento consumido (Deaton, 1988). 3.6 Efecto de las Características Demográficas de los Hogares La incorporación de la heterogeneidad de los hogares en las estimaciones de CE no sólo brinda la posibilidad de estudiar el efecto de los cambios en las características de los hogares sobre el comportamiento de consumo, sino que adicionalmente, el análisis no paramétrico de las mismas permite conocer el comportamiento de tales efectos para diferente niveles del poder adquisitivo de los hogares. Con esto también se puede verificar la existencia de efectos cruzados de forma tal que los mismos puedan ser incorporados en CE paramétricas. Adicionalmente, el análisis no paramétrico de CE subdividiendo las muestras según los tipos de hogares se corresponde con el espíritu original de la obra de Engel, donde la investigación de su ‘ley’ se refiere a la participación del gasto en alimentos en una población determinada por alguna característica en particular, sea su ubicación geográfica, nacionalidad, tipo de familia, situación laboral, etc. El trabajo original de Engel, contrariamente a la derivación micro-económica de las CE, no supone que todos los hogares de la población enfrentan los mismos precios, ni que los hogares son idénticos en ciertas características del hogar (Chakrabarty y Hildenbrand; 2011: 290) En la presente tesis, luego de la evaluación económica y estadística de las especificaciones no paramétricas de CE, y por ende, seleccionando la o las mejores metodologías de estimación, se buscará conocer cómo son afectadas las mismas para hogares con diferente estructura demográfica. Específicamente se tomarán las variables de los hogares que caracterizan su composición y tipología, seleccionado el género y edad del jefe de hogar; la cantidad de miembros por grupo etario (menores de 14 y mayores de 65 años); y los tipos de hogares (unipersonal, nuclear sin hijos, nuclear con hijos y extendidos), en base a su importancia revelada en diferentes estudios empíricos de consumo y demanda de alimentos para Argentina (p.ej. Rossini y Depetris Guiguet., 2008, Rossini et al., 2008; García Arancibia et al., 2009a ; 2009b ; García Arancibia, 2011, entre otros). 60 Sea Z i f un vector que representa las características del hogar i, para una determinada característica Z i f = z f , la expresión (3.1) de la curva de Engel del bien j puede escribirse de la forma ( ) wijf = m j ln Gi | Z i f = z f + ε ijf , (3.54) O bien ( m jf ( x ) = E wijf | ln Gi = x, Z i f = z f ) (3.55) Con estas especificaciones desagregadas por características de los hogares se busca conocer cómo afectan las mismas al comportamiento de la participación del gasto en el bien j respecto al poder adquisitivo. Tal efecto ha sido denominado como “Efecto Sustitución de las Características” (ESC)17. Para dos características a y b, el ESC viene dado por { } ESC a ,b ( x ) = mˆ a (x ) − mˆ b (x ) , (3.56) a b donde m ˆ ( x ) y mˆ ( x ) son las CE no paramétricas estimadas para los hogares con las características a y b, respectivamente. Esta ecuación estima los cambios en el consumo del bien j de pasar de ser del tipo a a b, para un determinado nivel de gasto fijo en x, y tal cambio será de la proporción y signo del ESC a,b ( x ) . Los resultados que se hallan del estudio del ESC, además de contribuir para la interpretación económica del comportamiento del consumidor, tienen implicancias muy relevantes para las especificaciones econométricas de curvas de Engel, principalmente paramétricas. La simple incorporación aditiva de variables dummies para caracterizar a los hogares, sin incluir algunos efectos interacción con el gasto o ingreso, puede generar problemas de mala especificación (Fousekis y Lazaridis, 2001). La expresión (3.56) define una curva para los diferentes niveles del logaritmo del gasto total. A los efectos de tener una medida resumen del cambio de la CE ante cambios en las 17 Characteristics Substitution Effects (Delgado y Miles, 1997) 61 características, se estima el efecto sustitución de las características promedio (ESCP) para cada par de características (a,b). El mismo puede escribirse como ESCP (a, b ) = ∫ ESC a ,b ( x ) p ( x )dx = ∫ [m a ( x ) − m b ( x )] p ( x )dx [( (3.57) ) ( )] = ∫ E wia | ln Gi = x, Z i f = a − E wib | ln Gi = x, Z i f = b p ( x )dx Para la estimación de (3.57) se construye una grilla de valores de x, para la cual se estima la densidad de p̂(x ) . Utilizando la misma grilla, se predicen los valores del ESC, usando f las regresiones no paramétricas m (x ) , estimadas con todos los datos de los hogares que tienen las característica f. Por lo tanto, la densidad p̂(x ) es la misma para los pares de CE que se están comparando, de forma tal que para cada punto el gasto total (como proxy del poder adquisitivo), es el mismo18. Para expresar el ESCP en términos proporcionales (porcentuales) se computa ESC a,b ( x ) ESCP (a, b )∆ % = 100 × ∫ p (x )dx b m (x ) (3.58) En base a estas medidas se estudia la importancia que tienen las características demográficas en el consumo de alimentos, expresado por medio de las CE. Si el efecto de las características es constante, se refleja en una ESC aproximadamente plana. Esto sugiere que para medir el cambio del ESC ante diferentes niveles del poder adquisitivo de los hogares, se puede mirar su derivada promedio ( d ESC ). En el apartado anterior, se presentó la forma de computar la derivada promedio de las CE. Puesto que la función ESC es la diferencia entre dos estimaciones de la CE, su derivada promedio viene dada por d ESC (a, b ) ≡ ∫ dESC a ,b ( x ) pˆ ( x )dx = ∫ mˆ ' a ( x ) pˆ ( x )dx − ∫ mˆ 'b ( x ) pˆ ( x )dx dx (3.59) De los resultados de (3.59), junto con especificaciones paramétricas, se estudiará la importancia de las interacciones entre las características del hogar y el nivel de ingreso 18 Una metodología similar utilizan Deaton y Paxson (1998) para la comparación de hogares con diferente tamaño. 62 (medido a través del gasto total). Para la inferencia se computan errores estándar bootstrap para la d ESC . 3.7 Especificaciones Semiparamétricas Por ahora se vienen presentando aplicaciones metodológicas para CE no paramétricas en una variable (i.e. como funciones del logaritmo del gasto total). La evidencia empírica (con soporte teórico) muestra que la situación socioeconómica del hogar y sus características demográficas, más allá del gasto/ingreso total, resultan cruciales en la determinación de los patrones de consumo. Por ello resulta necesario incluirlos en el análisis de CE y funciones de demanda. En la sección 3.6 se presenta una metodología para incorporar las características demográficas de los hogares en el análisis, y seguir utilizando las regresiones no paramétricas en una variable. De ello se obtienen varias CE (una para cada sub-muestra que se esté analizando). Sin embargo el análisis puede ser simplificado si se incorporan todas las características junto con el efecto del gasto total, en una sola especificación. Debido a la ‘maldición de la dimensionalidad’19, inevitable en modelos totalmente no paramétricos, se han dejado de lado las pretensiones de incorporar todas las variables en forma no paramétrica. Por ello, los estudios micro-econométricos de consumo y demanda, se han enfocado en especificaciones semiparamétricas. En particular, el modelo semiparamétrico más utilizado es el denominado Modelo Parcialmente Lineal (MPL). Para el caso de curvas de Engel y funciones de demanda, en general se opta por dejar que la relación con el gasto total sea flexible, mientras que para las otras características se consideran efectos lineales20 . Es decir que el gasto total se sigue incorporando de manera no paramétrica, mientras que las otras características socioeconómicas y demográficas de los hogares se plantean de forma paramétrica. La utilización de los MPL no sólo ha sido justificada debido a la maldición de la dimensionalidad, sino que por otra parte, las variables (en su mayoría categóricas) que caracterizan a los hogares, en general muestran un comportamiento aproximadamente En la mayoría de los libros de textos aparece el tópico de la ‘maldición de la dimensionalidad’ (Curse of Dimensionality). Yatchew (2003:17) presenta un ejemplo sencillo y muy ilustrador. 20 Para un estudio donde se propone la flexibilidad de los efectos de las características demográfica de los hogares en vez del gasto total, ver Lissiotou et al.(2008) 19 63 lineal sobre la participación del gasto (Sulgham y Zapata, 2006; Barrientos Marín, 2009; Barrientos Marín et al., 2011; entre otros). Por lo tanto, siguiendo este enfoque generalizado en los últimos trabajos empíricos, se trabaja con la siguiente especificación de la curva de Engel para el alimento j wij = γ ´jT z i + m j (ln Gi ) + ξ ij (3.60) Siendo z i el vector de co-variables que caracterizan la estructura socioeconómica y ( 2 ) demográfica del hogar i, con ξij ~ iid 0,σ i . En (3.60) se excluye el intercepto (i.e. que en z i se excluye el 1), por cuestiones de identificabilidad, dado la flexibilidad de m j (Li y Racine, 2006: 222-223). Además de las características demográficas de los hogares (cantidad de adultos en el hogar, cantidad de menores de 14 años y de mayores de 65, género y edad del jefe/a, y los tipos de hogar) se incluyen dos variables que caracterizan el nivel socioeconómico del jefe de hogar: la categoría ocupacional (no ocupado, asalariado, patrón o cuenta propista) y el nivel de instrucción (si realizo o no estudios superiores)21. 3.7.1 Estimación Para la estimación de (3.60) se utilizará el método de Doble Residuos, propuesto de forma simultánea por Robinson (1988) y Speckman (1988). Con este método es posible obtener estimadores N - consistenes para γˆ´j , y m̂ j con la tasa usual de convergencia no paramétrica de modelos univariados, siempre que los parámetros de suavizados de las estimaciones no paramétricas involucradas sean de orden N −1 / 5 . Tomando la esperanza condicionada en (3.60) se obtiene ( ) E wij | ln G = γ ´jT E(z i | ln G ) + m j (ln G ) ( (3.61) ) Suponiendo que E ξ ij | x = 0 . Luego de (3.60) y (3.61) se tiene que 21 La descripción más detallada de tales variables se realiza en el Capitulo 4. 64 ( ) wij − E wij | ln Gi = γ Tj (z i − E(z i | ln Gi )) + ξ ij ( De (3.62) se observa que si conocen E wij | ln Gi ) (3.62) y E (z i | ln Gi ) , luego se obtiene un estimador consistente y asintóticamente normal para el vector de p parámetros γ j , aplicando simplemente mínimos cuadrados. Puesto que ambas esperanzas son desconocidas, el método de Robinson propone estimarlas de forma no paramétrica, demostrando que con ello no se ve afectada la distribución asintótica del γˆ j estimado por ( ) hˆ j (x ) un estimador no paramétrico de h j ( x ) = E wij | ln Gi = x , y MCO22. Sea gˆ j ( x ) = (gˆ j1 (x ), K , gˆ jp (x )) un vector, de orden p × 1 , de estimadores no paramétricos de g j ( x ) = (g j1 ( x ), K , g jp (x )) ≡ (E ( z1 | ln Gi = x ), , K , E (z p | ln G i = x )) , luego (3.62) puede escribirse de la forma w j − h j ( x ) ≅ (Z − gˆ j ( x ))γ j + ξ j (3.63) Siendo w j y hˆ j (x ) vectores de orden N × 1 , Z − gˆ j ( x ) y Z − gˆ j ( x ) , matrices de orden N × p y γ j un vector p × 1 . Luego, de (3.63), se obtiene de forma análoga al estimador MCO, el estimador de Doble Residuos: [ ] (Z − gˆ (x)) (w γˆ j = (Z − gˆ j (x ))T (Z − gˆ j (x )) −1 T j j − hˆ j ( x )) (3.64) Para muestras grandes se cumple que23 ( ) D ( N γˆ j − γ j → N 0, σ ξ2 ∑ z| x Con ∑ z| x [ −1 ) (3.65) ] = E (z − E (z | x ))(z − E (z | x )) , siendo z un vector p × 1 cuyas componentes son T las variables aleatorias que representan las características socioeconómicas y demográficas Si bien en el trabajo original de Robinson se propone el estimador N-W, las propiedades se mantienen para otros estimadores no paramétricos, lo relevante es su tasa de convergencia. Newey (1994) generaliza las condiciones para validar los resultados del estimador de Robinson. Para los suavizados lineales presentados se cumplen tales condiciones, por lo que puede aplicarse este procedimiento sin afectar sus propiedades. 23 En esta sección se sigue a Yatchew (2003: 49). Para un análisis más formal ver Li y Racine (2006). 22 65 2 de los hogares. La varianza de los residuos σ ξ puede estimarse consistentemente mediante [ s 2 = N −1 w j − hˆ j ( x ) − (Z − gˆ j ( x ))γˆ j ] [w T j − hˆ j ( x ) − (Z − gˆ j ( x ))γˆ j ] Luego, un estimador consistente de la matriz de varianza y covarianzas de γˆ j , σ ξ2 (3.66) ∑ −1 z| x viene dado por [ ] s 2 (Z − gˆ j ( x )) (Z − gˆ j ( x )) T −1 (3.67) Generalmente en los micro-datos de corte transversal, la presencia de heterocedasticidad es más la regla que la excepción: Por lo tanto, a los efectos de corregir los desvíos estándares del estimador paramétrico para una correcta inferencia, la matriz (3.67) puede sustituirse por una versión consistente –heterocedástica similar a la propuesta de White (1980) para los estimadores MCO (también son denominados desvíos estándar robustos heterocedásticos). Suponiendo que los residuos tienen matriz de covarianza igual a Ω , luego la matriz de varianzas y covarianza del estimador (3.64) es aproximadamente igual a [ ] [N (Z − gˆ (x )) Ω(Z − gˆ (x ))] var(γˆ j ) ≅ N −1 N −1 (Z − gˆ j ( x )) (Z − gˆ j ( x )) T −1 −1 T j [ (Z − gˆ (x )) (Z − gˆ (x ))] × N −1 T −1 j j (3.68) j T Para el caso heterocedástico se toma Ω̂ = ξ j ξ j , i.e la suma de los residuos al cuadrado. En los resultados de los MPL presentados en esta tesis, se reportan los desvíos estándar heterocedásticos obtenidos a partir de (3.68). Por último, por (3.61), la función m j se estima a partir de ( ) E w j − Zγˆ j | ln G = m j (ln G ) (3.69) El estimador m̂ j puede obtenerse aplicando cualquier tipo de suavizado lineal de los visto anteriormente (u otro estimador no paramétrico con una tasa de convergencia similar). En la presente tesis, en base a los resultados de la evaluación de las CE puramente no paramétricas, se elegirán los dos métodos que arrojaron una mejor performance, a fin de aplicarlos al estimador de Doble-Residuos. Adicionalmente, entre este 66 par de estimadores se computarán las medidas de performance sobre la parte no paramétrica (3.69) con el fin de terminar seleccionando un solo estimador para las especificaciones semiparamétricas de CE. Puesto que en (3.60) el gasto total es separable de las demás variables, luego el cómputo de elasticidades-gasto es igual al presentado en la sección 7.5, utilizando el estimador de la derivada de m resultante de la regresión (3.69). 3.7.2 Endogeneidad del Gasto Total Como se mencionó en el capítulo anterior, existen motivos tanto metodológicos como teóricos por lo cual se toma al gasto total como medida del poder adquisitivo o proxy del ingreso nominal de los hogares, en vez de tomar directamente el ingreso percibido en los mismos. Sin embargo, es posible pensar que los hogares determinan de manera conjunta cuánto gastar y qué participación del gasto asignar a los alimentos. Es decir, que puede existir simultaneidad en las decisiones de gasto, sea total o en un bien específico. Sin embargo, uno de los supuestos esenciales en el tratamiento de las especificaciones (3.1) y (3-60) es que el gasto es exógeno en el sentido de que E(ξ | ln G ) = 0 . Por ello, en la presente sección se presenta una forma de considerar la posible endogeneidad por simultaneidad del gasto total, de forma que la misma pueda ser testeada (rechazada o no), y a la vez, obtener una versión corregida de la CE. Dado el carácter anidado o progresivo de la tesis, este problema de endogeneidad se tratará en el caso del MPL, y constituye el último punto a considerar en la misma. Asumiendo que ahora el MPL correspondiente a la CE, expresado de forma matricialvectorial, viene dado por24 w = Zγ + m(ln G ) + ξ , E(ξ | ln G ) ≠ 0 (3.70) Suponiendo que existe, al menos, una variable instrumental U para ln(G ) tal que ln G = αU + υ , E(υ | U ) = 0 , E(ξ | U ) = 0 24 (3.71) Se omite el subíndice j correspondiente al bien sobre el que se estudia la CE. 67 Suponiendo adicionalmente que E(ξ | lnG,U ) = ρυ , lo cual es un supuesto bastante fuerte25; luego los residuos de la ecuación original pueden escribirse como ξ = ρυ + ν (3.72) Luego de (3.71) y (3.72), (3.70) puede re-escribirse de la forma w = Zγ + m(ln G ) + ρυ + ν , E(v | ln G, Z,υ ) = 0 (3.73) De esta manera se tiene un MPL ampliado con una variable adicional υ , la que puede ser estimada a partir de los residuos de (3.71), i.e. υˆ = ln G − αˆU . Por lo tanto, en una primera etapa se estima (3.71), en una segunda etapa se obtiene (γˆ, ρˆ ) aplicando el método de Robinson, estimando finalmente m aplicando un suavizado lineal sobre E(w − Zγˆ − ρˆυˆ | ln G ) = m(ln G ) (3.74) Para testear la endogeneidad del gasto total, simplemente se observa si ρ̂ es significativamente diferente de cero. En caso afirmativo, se prueba estadísticamente que ln(G ) es endógeno, bajo el supuesto de que U constituye un instrumento válido Ahora bien, queda seleccionar qué variable instrumental utilizar para la corrección de endogeneidad. Naturalmente, la mayoría de los trabajos de CE o sistemas de demanda que corrigen la endogeneidad, utilizan el ingreso total o disponible (en general, con la transformación logarítmica) y algunas otras variables que caracterizan el nivel socioeconómico del hogar (Barrientos Marin, 2009; Blundell et al., 2007; Sulgaham y Zapata, 2006; entre otros). En la presente tesis se terminan seleccionando dos variables como instrumentos: el logaritmo del gasto total y el régimen de tenencia del hogar (propietario o no, sea inquilino o ocupante). En este caso, para el cómputo de las elasticidades-gasto, debe tenerse en cuenta que ahora ∂E(wi | ln G, Z,υ ) dm(ln G ) = +ρ ∂ ln G d ln G (3.75) Luego, aplicando esta expresión de la derivada en vez de (3.47), se puede computar la elasticidad gasto corregida por endogeneidad. Adicionalmente, al utilizar el ingreso como instrumento, se puede computar la elasticidad-ingreso ( I ), basta ver que 25 Para un enfoque más general ver Sperlich (2007) 68 ∂E(wi | ln G, Z,υ ) dm(ln G ) ∂ ln I = − α I ρ = α I [m' (ln G ) − ρ ] ∂ ln I d ln G ∂ ln G (3.76) Luego aplicando los procedimientos de la sección 3.5 puede computarse la elasticidadingreso. Las correcciones de la elasticidad-gasto y el cómputo de la elasticidad-ingreso se aplican en el último capítulo de resultados para las especificaciones semiparamétricas de las CE, sin que ello signifique que las mismas no son aplicables a CE puramente no paramétricas, que son un caso especial de la especificación más general del MPL. 69 Capítulo 4 Datos, Variables y Procedimientos 4.1 Introducción Para completar la primera parte del marco teórico y metodológico, en el presente capítulo se presenta una descripción de los datos y variables utilizadas en el análisis aplicado de la tesis. Adicionalmente, se detallan los procedimientos llevados a cabo para aplicar las metodologías presentadas en el capítulo anterior, y su implementación computacional con el software correspondiente. 4.2 Datos Los datos utilizados corresponden a los base de la Encuesta Nacional de Gastos de Hogares del período 1996-97 elaborada por el Instituto Nacional de Estadísticas y Censos de Argentina (INDEC)26. El tamaño total de la muestra es de 27260 hogares correspondientes al total de las 6 regiones geográficas en que está dividido el país: Región Metropolitana (Capital Federal y Buenos Aires), Región Pampeana (Córdoba, Buenos Aires, Entre Ríos, La Pampa y Santa Fe), Noroeste (Salta, Jujuy, Tucumán, Santiago del Estero, Catamarca y La Rioja), Noreste (Misiones, Corrientes, Chaco y Formosa), Cuyo (San Juan, Mendoza y San Luís) y Región Patagónica (Neuquén, Río Negro, Chubut, Santa Cruz y Tierra del Fuego). En el período 2005-2006 este organismo realizó otra Encuesta de Gasto de Hogares, la que aún no fue puesta a disposición de los investigadores. A pesar de que los resultados del presente trabajo quedan desactualizados, su contenido tiene un perfil más metodológico, aunque claramente se hubiera deseado trabajar con una base más actualizada. 26 70 En esta tesis se considera solamente la Región Pampeana, por su importancia relativa en el país, más allá de la región metropolitana del Gran Buenos Aires. Para la Región Pampeana, el tamaño total de la muestra es de 7743 hogares. De un análisis exhaustivo de la misma se detectó la existencia de hogares que no reportan ciertas características, otros que mostraban algunas inconsistencias en el valor de ciertas variables, como ser un gasto total o un ingreso negativo, o participaciones del gasto en un bien (sobre el gasto total) mayores a 1. En general tales hogares coincidían en encontrarse en algún extremo (inferior o superior) del gasto total. Al eliminarse tales observaciones, la muestra depurada es de 7592 hogares válidos. En esta depuración también se tuvo en cuenta la eliminación de nueve hogares que reportaban gastos nulos en la partida de gasto del total de Alimentos y Bebidas. Por lo tanto, para la estimación de CE para el total de alimentos se utilizó esta muestra de 7592 hogares. Como se mencionó anteriormente, además de tomar el rubro de alimentos y bebidas en general, se consideran los siguientes grupos de alimentos: (A1); Productos de panadería, harinas, arroz, cereales y pastas; (A2) Carnes vacuna, porcina, ovina, aves, pescados y mariscos; (A3) Leche y productos lácteos; y (A4) Verduras, legumbres y frutas. La selección de los mismos se realiza por su relevancia en el gasto total de alimentos y bebidas. Estos cuatro grupos de alimentos conforman, en promedio, cerca del 75% del gasto total en alimentos. En la tabla 4.1 se muestran los valores promedio de la participación de cada Aj en el presupuesto alimenticio de los hogares. Las carnes, y principalmente la vacuna, es la que representa el mayor porcentaje en el gasto en alimentos, seguido de los productos basados en harinas, arroz y cereales. En la misma tabla, se reportan el tamaño de la muestra considerado en cada caso. Los mismos surgen de sacar de los 7500 hogares, aquellos hogares con gastos nulos en cada partida correspondiente, a los fines de evitar el problema de datos censurados, y centrar la atención en la formas de las CE de cada caso. De aquí se observa que la mayor cantidad de ‘ceros’ reportados por los hogares, se dan en el consumo de leche y productos lácteos. A su vez, considerando sólo los casos donde el gasto es positivo, estos productos representan el menor porcentaje de gastos en comparación a los otros tres conjuntos de productos alimenticios. 71 Tabla 4.1 Tamaño de la Muestra e Importancia de los Sub-conjuntos de Alimentos A1-A4 Conjunto de Alimentos N Gasto en Aj /Gasto Total en Alimentos (%) A1 7500 19.3 A2 7107 26.1 A3 6705 12.2 A4 7258 17.5 Fuente: Elaboración Propia en base a la ENGH 96/97 En el siguiente apartado se analiza el comportamiento de las variables que entran en la relación de Engel, comenzando por las que hacen a la especificación básica, i.e. participación del gasto en alimentos y gasto total. Luego se exponen aquellas variables demográficas y socioeconómicas seleccionadas para caracterizar la heterogeneidad de los hogares, y que son incorporadas en especificaciones más completas, sean semiparamétricas o paramétricas. 4.3 Descripción de las Variables La variable explicada en cada CE que se estima, es la participación en el gasto total que tiene el bien en cuestión ( w j ), sea alimentos a nivel agregado (A), o los subconjuntos más desagregados: A1-A4. La Tabla 4.2 presenta las estadísticas básicas (media, desvío estándar, mínimo y máximo) de cada una de las participaciones presupuestarias de los alimentos. Para el total, los hogares gastan, en promedio, cerca de la mitad de su gasto total en alimentos, existiendo hogares donde todo su ‘ingreso nominal’ se destina al gasto en alimentos. En general, para el conjunto de alimentos específicos, las carnes (A2) ocupan, en promedio, un poco más del 10% del presupuesto familiar27, teniendo casos de hogares donde se destina aproximadamente el 50%. Para los alimentos A1, también hay hogares que destinan casi la mitad de su presupuesto en estos alimentos, aunque el promedio es inferior al de las carnes. Similar es el caso de las legumbres, futas y verduras, donde la máxima participación presupuestaria es del 40 por ciento, pero en promedio los hogares no gastan más del 7%. La menor participación en el gasto total es para leche y los A los fines de una interpretación económica más cabal, a partir de aquí el gasto total se entenderá como proxy del ingreso total, del poder adquisitivo o de compra y del presupuesto familiar. 27 72 productos lácteos (análogo a los resultados presentados en la Tabla 4.1). Esto resulta razonable si se tiene en cuenta que los conjuntos A1, A2 y A4 comprenden alimentos que tiene una relación más directa con la preparación de platos acabados, como ser guisos, pastas y carnes, mientras que la leche y los productos lácteos, son más complementarios en este sentido, o bien son consumidos en desayunos o meriendas que, en la cultura argentina, constituyen las comidas diarias más livianas, mientras que el almuerzo y/ la cena constituyen comúnmente los ‘platos fuertes’. Tabla 4.2 Estadístico de las Variables Dependientes de las CE wA wA1 w A2 w A3 w A4 Media DE Min. Max. 0.416 0.179 0.010 1 0.081 0.057 0.001 0.442 0.112 0.072 0.002 0.491 0.049 0.035 0.001 0.285 0.065 0.045 0.001 0.408 Fuente: Elaboración Propia en base a la ENGH 96/97 La variable explicativa que hace a la relación de Engel, es el ingreso o gasto total. En particular, por razones de especificación econométrica, se toma el logaritmo natural de la misma. A su vez, en la especificación básica de las CE se considera el logaritmo del gasto (lnG) en vez del logaritmo del ingreso total (ln I), por dos razones básicas, que fueron comentadas en el capítulo 2: Por un lado, en ecuaciones separables de CE se suele tomar el gasto total como variable proxy del ingreso, al ser una variable más confiable que el ingreso en el momento del relevamiento y captación de la misma. A su vez, la elección del gasto total se fundamenta en la alta correlación que existe con el ingreso permanente (Iyengar, 1967) y adicionalmente porque esta categoría permite separar el problema de asignación del consumo total de bienes del problema de decisión de la familia de cuánto ahorrar o desahorrar del ingreso corriente (Lewbel, 2006). Por otra parte, en el análisis económico en general se toma el gasto total por motivos teóricos en la especificación de sistemas completos de demanda que cumplan con las restricciones básicas derivadas de la teoría del consumidor. 73 A pesar de esto, el ingreso suele utilizarse como la principal variable instrumental, en el caso de que el gasto total sea endógeno. En el último capítulo de la tesis, se utiliza el ingreso total a los fines de corregir el problema de endogeneidad. En la Tabla 4.3 se muestra la media y el desvío estándar del gasto e ingreso total, y la correlación que existe entre ambos. También se presentan los resultados para las transformaciones logarítmicas utilizadas en los modelos econométricos. Como es de esperarse, el ingreso total promedio es superior al gasto total, como también su varianza. Al aplicar la transformación logarítmica, las diferencias, en términos del promedio y desvío estándar, son muy pequeñas. Se observa que la correlación (lineal) entre ambas variables es significativa. La Figura 4.1 muestra una clara relación, aproximadamente lineal, entre ambas variables expresadas en logaritmos. Tabla 4.2 Resumen Estadístico del Gasto y del Ingreso Total Media DE Gasto Total ( G ) 734.98 578.71 Ingreso Total ( I ) 943.11 924.28 corr (G, I ) ln G ln I 0.71 corr (ln G , ln I ) 6.326 0.755 6.53 0.799 0.78 Fuente: Elaboración Propia en base a la ENGH 96/97 2 4 ln(Y) 6 8 10 Figura 4.1 Diagrama de Puntos. Log del Ingreso total – log del Gasto Total 4 5 6 7 8 ln(G) Fuente: Elaboración Propia en base a la ENGH 96/97 74 Puesto que las variables básicas que entran en la relación de Engel son la participación del gasto en un alimento y logaritmo del gasto total, se presentan a continuación diferentes gráficas de la distribución de las mismas, y posteriormente los diagramas de puntos de tales relaciones. En la Figura 4.2 se muestran las densidades marginales de la participación del gasto en alimentos y bebidas (panel (a)) y la del logaritmo del gasto total (panel (b)). Éstas son estimadas por medio de histogramas y del estimador de densidad por núcleos o kernel (con ventana óptima obtenida por medio de convalidación cruzada, CV). En el panel (c) se muestra la distribución conjunta de ambas variables, también estimada utilizando el estimador de núcleos. Ambas distribuciones marginales muestran un poco de asimetría, una hacia la izquierda y la otra hacia la derecha, aunque no es muy notoria. La mayoría de los hogares se encuentran en los niveles de gasto superiores a los 665 pesos mensuales a precios del 96/97 (i.e. exp(6.5)), los que terminan acumulando una participación del gasto menor a 0.5. Esta simple inspección de la distribución, permite ver, en cierto sentido, el cumplimiento de la ley de Engel. Esto también se observa de la distribución conjunta (panel (c)) donde la ‘campana’ está ubicada en niveles medios-altos de gasto total y medios-bajos de la participación del gasto en alimentos. Para el caso de los conjuntos de alimentos específicos (Figura 4.3), las distribuciones estimadas muestran una mayor asimetría, concentrando alrededor de los valores de la media (Tabla 4.3). Los diagramas de puntos de puntos de las relaciones de Engel, se presentan en los gráficos de la Figura 4.4. De la mismas se observa una relación negativa entre el logaritmo del gasto total y la participación en el gasto de cada conjunto de alimentos, i.e. un cumplimiento general de la ley de Engel. La dispersión de los datos difiere, mostrando una mayor variabilidad en el extremo inferior del gasto total. A pesar de la relación negativa teóricamente esperable entre ambas variables, de la simple inspección visual no puede dilucidarse una forma funcional (aproximada) conocida. Se espera una curva decreciente en el logaritmo del gasto total con algunos cambios de curvatura leves, en el sentido de que no cambian el signo de las pendientes de sus tangentes, aunque si el valor 75 absoluto de su magnitud. Los diagramas de puntos también muestran que para los diferentes tipos de alimentos, las relaciones de Engel difieren entre sí. Figura 4.2 Densidades Marginales y Conjunta de la Participación del Gasto en Alimentos y Bebidas y del Logaritmo del Gasto Total (b) Histográma – Densidad Kernel (h=0.09)-- ln G wA 0.2 0.3 Density 1.0 0.0 0.1 0.5 0.0 0.0 0.2 0.4 0.6 0.8 4 1.0 5 6 7 8 (c) fˆ (w A , ln G ) - Estimación por Núcleos (CV) 1.0 D Joint ensit 0.5 y 1.0 0.0 0.5 8 wA Density 1.5 0.4 2.0 0.5 (a) Histográma – Densidad Kernel (h=0.03)- 6 lnG 4 0.0 Fuente: Elaboración Propia en base a la ENGH 96/97 76 Figura 4.3 Densidades Marginales Estimadas de la Participación del Gasto en Alimentos A1-A4 A2 3 Density 0 0 1 2 2 4 Density 4 6 5 8 6 7 A1 0.0 0.1 0.2 0.3 0.0 0.4 0.1 0.2 0.3 0.4 0.5 N = 7107 Bandwidth = 0.0051 N = 7500 Bandwidth = 0.005802 A4 0 6 0 2 5 4 Density Density 10 8 10 15 12 A3 0.00 0.05 0.10 0.15 0.20 N = 6705 Bandwidth = 0.002565 0.25 0.30 0.0 0.1 0.2 0.3 0.4 N = 7258 Bandwidth = 0.003693 Fuente: Elaboración Propia en base a la ENGH 96/97 77 Figura 4.4 Relaciones de Engel – Diagramas de Puntos 0 .2 .4 w_A .6 .8 1 A: Total Alimentos y Bebidas 4 5 6 ln(G) 7 8 A2: Carnes 0 0 .1 .1 .2 w_A1 .2 w_A2 .3 .3 .4 .4 .5 A1: Panadería, Harinas, Arroz, Cereales y Pastas 4 5 6 ln(G) 7 4 8 6 ln(G) 7 8 A4: Frutas, Verduras y Legumbres 0 0 .1 .1 w_A3 w_A4 .2 .2 .3 .4 .3 A3: Leche y Productos Lácteos 5 4 5 6 ln(G) 7 8 4 5 6 ln(G) 7 8 Fuente: Elaboración Propia en base a la ENGH 96/97 78 Adicionalmente al logaritmo del gasto total, en la especificación semiparamétricas se consideran las características socioeconómicas y demográficas de los hogares. La descripción de las mismas se presenta en la Tabla 4.4 Tabla 4.3 Descripción de las variables Socioeconómicas y Demográficas Consideradas Descripción Variables Tipo Edad del jefe de Hogar jedad Continua jgenero binaria, 1 si es hombre y 0 si es mujer Género del jefe de hogar Cantidad de miembros adultos en el hogar (mayores de 14 y menores de 65) adultos Continua Cantidad de miembros menores de 14 menor14 Cantidad de miembros mayores a 65 mayor65 Nivel de instrucción del jefe de hogar edu Situación ocupacional , no ocupado noocupado Continua Continua Binaria; =1 si el jefe de hogar tiene estudios universitario o terciario (base) Binaria; =1 si el jefe es no ocupado Asalariado asalariado Binaria; =1 si el jefe es asalariado Cuenta propia o patrón patron Binaria; =1 si trabaja por cuenta propia o es patrón Tipo de hogar unipersonal tipo1 (base) Binaria; =1 si el hogar es unipersonal tipo2 Binaria; =1 si el hogar es nuclear s/hijos tipo3 Binaria; =1 si el hogar es nuclear c/hijos tipo4 Binaria; =1 si es hogar extendido Tipo de hogar nuclear sin hijos Tipo de hogar nuclear con hijos hogar extendido Fuente: Elaboración Propia El valor promedio de la edad del jefe de hogar en la muestra es de 50 años, con un desvío estándar de 16 años. Del total de la muestra el 74,6% está compuesto por hogares con jefe 79 varón, mientras que el 25% restante corresponde a hogares con jefatura femenina. El tamaño promedio del hogar (cantidad total de miembros) es de 3.5, compuesto por una media de 1 menor por hogar (menor14), 0.3 adultos mayores (mayor65) y 2.2 adultos en edad intermedia (adultos). Los máximos alcanzados son de 10, 4 y 10, respectivamente. Respecto al nivel de instrucción del jefe/a de hogar (edu), solo el 16% de los hogares tiene un jefe con estudios secundarios completos y superiores (completos o incompletos). Aproximadamente, el 42% de los hogares tiene jefe o jefa asalariado, el 23% son patrones o trabajadores por cuenta propia, y el 35% restante son no ocupados (inactivos o desocupados). Por último, respecto de los tipos de hogares, la mayor proporción (53%) corresponde a hogares nucleares con hijos (tipo3). Luego siguen los hogares extendidos con un 18%, y los unipersonales y nucleares sin hijos representando cada uno un 14% de la muestra. 4.4 Procedimientos y Software Para el primer ordenamiento y exploración de la base de datos se utilizó el software Stata (StataCorp). El resto de la tesis se desarrolló utilizando el software R (R-Project). La elección de este software se debió a diversos motivos. Por un lado, por ser libre y poder seguir trabajando con los comandos realizados, sin depender de algún vencimiento de licencia. Por otro lado, existen una gran variedad de paquetes disponibles sobre métodos no paramétricos y semiparamétricos, cada uno con sus propias particularidades, de forma que uno puede comparar y elegir aquél que resulte más conveniente en función de los intereses particulares que se tenga. El tercer motivo se debe a que en los cursos de la Maestría en Estadística Aplicada que requerían aplicaciones computacionales, en su gran mayoría se utilizó R. Dada la gran variedad de paquetes de R sobre estimaciones no paramétricas y semiparamétricas28, lo mejor es trabajar con un número reducido de paquetes, para poder comprenderlos de mejor manera. El criterio que se siguió en la elección tuvo en cuenta la flexibilidad de los programas incorporados, el output disponible luego de una ‘tirada’ y, fundamentalmente, que la escritura y los procedimientos de los mismos estén bien detallado en manuales o escritos para tales fines. En función de ello, para los estimadores 28 Para un resumen bastante actual sobre la disponibilidad de métodos ver Racine (2009) 80 basados en núcleos se eligió trabajar con el paquete ‘locfit’ (Loader, 2010) y ‘smooth.spline’ cuya referencias (para S) se encuentran en Chambers y Hastie (1992). Para la aplicación de los métodos de elección de suavizado, se escribieron programas para tales fines, con un vector de valores de ventanas y de grados de libertad, para luego ver el comportamiento gráfico de las funciones CV, GCV y AICc en función de ellos, y luego buscar el mínimo (considerando 3 dígitos). Puesto que el comando ‘smooth.spline’ tiene la posibilidad de elegir el suavizado por medio de los criterios CV o GCV (no así el AIC), se compararon tales valores de salidas, con los programas propios, coincidiendo en los resultados. La ventaja del ‘locfit’ y del ‘smooth.spline’ es que las salidas proporcionan suficiente información de la matriz de suavizados, y con ella se pueden formular todos los métodos propuestos para la elección del suavizados. Para la construcción de los IC bootstrap se construyó una función general, cuyo imputs son los datos y el método no paramétrico deseado, y el output son los puntos correspondientes de los IC al nivel del 95% para cada valor de la variable independiente. Se implementó el algoritmo presentado en el capítulo metodológico. En general, para todos los bootstrap realizados en la tesis, se utilizó un total de 500 réplicas, fijando un valor de la semilla igual a “123” en todos los casos. Todos ellos fueron programados mediante bucles, y construyendo funciones generales (<-function()) para aplicarlas a cada método y tipo de alimentos. En general, en algunos casos se construyeron programas generales para los estimadores basados en núcleos, y otros para los spline, a los efectos de facilitar las salidas. Para el test de especificación no paramétrico se implementó el algoritmo presentado en el capítulo de metodología. Para cada medida de performance de los estimadores, se construyeron funciones, tomando como argumentos los valores observados y los valores ajustados, y en algunos casos los grados de libertad de los estimadores. Para la función de evaluación Cp, otro argumento considerado es la varianza estimada, que no necesariamente corresponde a la del método que se está evaluando sino que puede ser de un par con el cual se está comparando. En general se elige aquélla con un suavizado que supone un menor sesgo. Las elasticidades se construyen en función de las derivadas estimadas. Para el estimador N-W, se aplica el método de la diferencia central usando dos puntos, mientras que para 81 los polinomios lineales y cuadráticos, a partir del ‘locfit’ se obtienen directamente, de igual modo que en el caso de los suavizados spline por medio de ‘smooth.spline’. Para computar la elasticidad promedio, primero se estima la densidad del logaritmo del gasto total con el método de kernel. Ésta pondera los valores puntuales de la elasticidad, y luego se estima la integral por medio de la suma ponderada usando la diferencia entre dos puntos consecutivos del logaritmo del gasto total. Para la construcción de las funciones ESC, se elige una grilla de valores del logaritmo del gasto total, igualmente espaciada, donde el mínimo de la misma es el mayor valor de los mínimos de las CE del par que se está comparando, mientras que el máximo es el menor valor de los máximos del par. Con los resultados de las estimaciones utilizando los datos originales, se obtiene predichos para tal grilla mediante interpolación (Loader, 1999: 243). Para el cómputo de la derivada del ESC se utiliza esta metodología con las predicciones obtenidas de las derivadas. Los errores estándar son obtenidos mediante la programación de un wild-bootstrap para cada caso. Por último, para la estimación semiparamétrica, si bien existen paquetes que permiten obtenerla directamente, para manejar el método que se quiere utilizar en cada etapa resulta conveniente (y sencillo) programarlo. Al elegir un suavizado no paramétrico en particular, el mismo se aplica tanto en la primera etapa del procedimiento (utilizando en cada caso, suavizados óptimos), como en la etapa de estimación de la componente no paramétrica de interés. Asimismo, los errores estándar heterocedásticos son programados, como así también las elasticidades-gasto e ingreso, utilizando los procedimientos anteriormente comentados. 82 Segunda Parte RESULTADOS 83 Capítulo 5 Análisis Comparativo de Regresiones No Paramétricas de Curvas de Engel 5.1 Introducción En el presente capítulo se comparan los estimadores no paramétricos de curvas de Engel (CE) en dos sentidos complementarios. Por un lado, desde la perspectiva estadística se computan algunas medidas de performance en base al poder predictivo, al error de estimación y bondad de ajuste de los diferentes estimadores propuestos. Desde el punto de vista económico, es deseable obtener curvas que reflejen comportamientos económicos consistentes dentro de la teoría y de la evidencia general en el marco de la teoría del consumidor. En primer lugar, en base a los criterios de selección automática del suavizado de los estimadores, se busca compararlos a los fines de seleccionar un criterio común a todos los estimadores que tenga un buen desempeño en términos del error cuadrático e implique un costo computacional aceptable. Específicamente se comparan el criterio de convalidación cruzada (CV), el de convalidación cruzada generalizada (GCV), y el basado en el criterio de información de AICc para estimadores no paramétricos. Una vez seleccionado un criterio de suavizado común, se analizan los resultados de las estimaciones para el conjunto de alimentos y bebidas (A), y luego para los subconjuntos de alimentos seleccionados: (A1) Productos de panadería, harinas, arroz, cereales y pastas; (A2) Carnes vacuna, porcina, ovina, aves, pescados y mariscos; (A3) Leche y productos lácteos; y (A4) Verduras, legumbres y frutas. Esta forma de presentar los resultados, primero para el caso general (A), y luego para los subconjuntos específicos, se repite a lo largo de la presentación de los resultados de este capítulo y de los posteriores (cap. 6 y 7). 84 Luego de un análisis gráfico de las estimaciones, con sus respectivos intervalos de confianza, se procede a compararlos en términos de los resultados arrojados por las medidas empíricas de performance estadística. Puesto que los resultados de las diferentes medidas no son totalmente consistentes en cuanto al ranking propuesto de los mejores estimadores (en términos del menor error), en el Anexo 1 se presenta una simulación para evaluar tales medidas de performance a los fines de apoyar las conclusiones a las que se arriba en esta sección. Posteriormente se procede a evaluar el comportamiento de las derivadas de las CE y de las elasticidades-gasto correspondientes. Con esto se busca realizar la evaluación económica de los diferentes estimadores. Adicionalmente a examinar las funciones estimadas de las derivadas y las elasticidades, se computan sus promedios, como así también la elasticidad evaluada en el ‘hogar’ promedio, con sus respectivos desvíos estándares bootstrap. Tales medidas resultan de suma importancia en el análisis económico aplicado puesto que son las medidas que generalmente se reportan, y permiten clasificar los bienes en alguna categoría particular para su interpretación económica. Por último, dadas las ventajas que existen en tener una especificación paramétrica, se procede a testear si las diferentes estimaciones no paramétricas se corresponden con alguna especificación paramétrica conocida. Particularmente se contrasta la hipótesis que establece una forma funcional tipo Working-Leser, tanto en su versión tradicional, esto es lineal, como en sus versiones extendidas, sea cuadrática o cúbica. Se aplican los dos test de hipótesis detallados en la sección metodológica de la tesis. Un test paramétrico basado en una aproximación de la distribución F, y otro no paramétrico, basada en la distribución empírica del estadístico, obtenida mediante réplicas bootstrap. Por lo tanto, lo que resta del presente capítulo se organiza de la siguiente manera: En la próxima sección se trata la elección del suavizado. Luego se analizan los resultados de las estimaciones, dado el criterio de elección del suavizado. La sección 5.4 muestra los resultados de la evaluación estadística. Posteriormente se presenta el análisis de las derivadas y elasticidades, y luego, en el apartado 5.6, los resultados de los test de especificación. Se finaliza el capítulo con unas breves conclusiones, a manera de síntesis 85 comentando los resultados hallados, donde las consideraciones establecidas son aplicadas en los posteriores capítulos que involucran estimaciones no paramétricas. 5.2 Elección del Suavizado Previo a la presentación de los resultados de las curvas estimadas, se desea aplicar un criterio uniforme de selección de suavizado para los cuatro tipos de estimadores que se están evaluando. Para ello se aplican tres criterios alternativos (presentados en el Capítulo 3) utilizando la base de datos, a fin de visualizar las diferencias que se presentan en los parámetros óptimos computados de acuerdo al criterio seleccionado. Considerando las curvas de Engel para Alimentos y Bebidas en su conjunto (A), los resultados se presentan en la Tabla 5.1. En la misma se detallan, para el caso de los estimadores basados en * núcleos, el parámetro óptimo h , los grados de libertad correspondientes (v), el valor alcanzado por la función minimizada, y tres medidas de evaluación estadística: el error * cuadrático medio y absoluto de predicción, y el estadístico Cp. El parámetro h está expresado en tres dígitos, mostrando con ello que en el proceso numérico de optimización se consideraron solo tres dígitos en el recorrido de las ventanas. Tal elección se fundamenta en que no existen grandes diferencias en los estimadores al considerar un mayor número de dígitos y, a su vez, se ahorra tiempo computacional. Para el caso de los suavizados spline, en la misma columna de las h se presenta, en su lugar, el parámetro de penalización λ . En este caso, se trabajó con los grados de libertad como parámetro para la búsqueda de los mínimos de cada una de las funciones correspondientes a la elección del suavizado. Para el estimador N-W, los criterios GCV y AICc coinciden, con un suavizado levemente inferior respecto al CV, y por ende, con mayores grados de libertad, dando menores errores de predicción. A su vez, se puede observar que el valor mínimo de la función CGV es menor a la del CV. En la regresión por polinomios locales lineales se observa que el criterio GCV arroja el menor suavizado, seguido del AICc, y luego del CV. Aquí las diferencias son mayores respecto al estimador anterior. Los menores valores de las ECMP, EAMP y Cp se encuentran para la estimación que utiliza la ventana GCV. Luego sigue la estimación con 86 la ventana AICc y, nuevamente, el criterio CV es el que arroja los mayores errores de predicción, según las medidas ECMP y EAMP. Tabla 5.1 Evaluación de los Criterios de Selección del Suavizado Cp ECPP EAPP h* v valor min Estimador / Criterio N-W CV GCV AICc 0.429 0.407 0.407 8.700 9.216 9.216 0.024860 0.024851 -2.694592 0.024795 0.024791 0.024791 0.125952 0.0248513 0.125937 0.0248509 0.125937 0.0248509 CV GCV AICc 0.838 0.668 0.768 6.600 7.493 7.055 0.024847 0.024837 -2.695164 0.024794 0.024787 0.024791 0.125870 0.0248377 0.125851 0.0248363 0.125860 0.0248368 CV GCV AICc 1.337 1.336 1.337 6.600 6.478 6.478 0.024838 0.024832 -2.695374 0.024792 0.024789 0.024792 0.125873 0.0248319 0.125838 0.0248316 0.125873 0.0248319 6.545 6.727 6.756 0.024834 0.024829 -2.695473 0.024786 0.024785 0.024785 0.125847 0.0248293 0.125846 0.0248291 0.125845 0.0248291 P Local Lineal P Local Cuadrático λ Spline CV 0.0783 GCV 0.0692 AICc 0.0679 Fuente: Elaboración Propia Para el caso de los polinomios cuadráticos locales, ahora la coincidencia de ventanas se da con a los criterios CV y AICc. Nuevamente el GCV da un menor suavizado, aunque las diferencias con los otros dos resultan despreciables (si se consideran ventanas con dos dígitos, las tres coinciden). Aunque la diferencia es leve, el GCV es el criterio que vuelve a dar los menores errores promedios. Con el suavizado spline, los menores ECMP y EAMP se dan con la ventana óptima del criterio AICc, seguido del GCV. Sin embargo, al observar los grados de libertad óptimos las diferencias entre ambos criterios son mínimas. En todos los casos, los tres criterios de evaluación estadística son consistentes en el sentido de informar sobre los menores errores de predicción y estimación. 87 La Figura 5.1 presenta el comportamiento de las funciones CV(h), GCV(h) y AICc(h) para el caso de los estimadores basados en núcleos y CV( λ ),GCV( λ ) y AICc( λ ) para los suavizados splines. Para cada estimador se observan comportamientos similares de dichas funciones. Mientras que en el caso del estimador N-W las funciones son más sensibles para valores mayores al entorno del óptimo, en los otros tres casos ocurre lo contrario. En las regresiones basadas en polinomios locales lineales, según se vio anteriormente, utilizando CV se obtiene el mínimo para un h de 0.84, sin embargo en un entorno superior a 0.6 hay un mínimo local, por lo que los resultados entre éste criterio y los otros dos serían más coincidentes. Para el caso de los polinomios locales cuadráticos se observa que existe un entorno más amplio alrededor del punto de mínimo en donde las funciones CV(h),GCV(h) y AICc(h) no experimentan grandes incrementos, por lo que el riesgo de error alrededor de la mínima ventana se reduce. Para el caso de los splines, las gráficas muestran que si el parámetro de penalización es mayor al óptimo, los errores, medidos por las funciones de selección, no se incrementan fuertemente, contrariamente a lo que ocurre a medida que λ se acerca a cero. De esta comparación se observa que entre los tres criterios seleccionados para la obtención de un suavizado óptimo no existen importantes diferencias. Sin embargo, el criterio GCV muestra la mejor performance en términos de los menores errores cuadráticos de predicción. A su vez este método requiere menor costo computacional que el CV, particularmente para la estimación por medio de suavizados splines, donde la obtención de cada elemento de la diagonal principal de la matriz de suavizado requiere más de N operaciones. Por lo tanto, en lo que resta de la tesis, cada vez que se estime una CE no paramétrica, se trabajará con el método de convalidación cruzada generalizada para la obtención de la ventana óptima,. Con respecto a los resultados empíricos para los conjuntos seleccionados de alimentos específicos (A1, A2, A3 y A4), se obtuvieron resultados similares. Las mayores diferencias se encuentran respecto al criterio CV, donde por lo general da como resultados mayores suavizados. Entre el GCV y el AICc, hay muy pocas diferencias. Incluso si se consideran los resultados de ventanas con dos dígitos, estos dos criterios dan los mismos suavizados. 88 Figura 5.1 Comportamiento de las Funciones de Selección de Suavizados N-W GCV AICc 0.2 0.4 0.6 0.8 0.2 0.4 0.6 h 0.8 0.2 1.0 1.0 -2.6940 AIC -2.6945 -2.6950 0.2 0.4 0.6 0.8 0.2 1.0 0.4 0.6 0.8 1.0 h h P Local Cuadrático GCV AICc 1.0 1.5 -2.692 AIC -2.695 0.5 2.0 1.0 1.5 2.0 0.5 -2.663 -2.664 AIC 0.02487 GCV -2.666 0.02485 0.15 0.20 0.25 0.30 lambda -2.667 0.02483 0.10 2.0 AICc 0.02489 0.02489 0.02487 0.02485 0.02483 0.05 1.5 h Suavizado Spline GCV CV 0.00 1.0 h h -2.665 0.5 -2.693 -2.694 GCV 0.02484 0.02484 0.02488 0.02488 0.02492 0.02492 0.02496 -2.691 CV CV 1.0 -2.6935 0.02488 0.02486 GCV 0.02485 0.02484 0.8 0.8 AICc 0.02487 0.02489 CV 0.02487 0.6 h CV 0.6 h P Local Lineal GCV 0.02485 0.4 0.4 h CV 0.2 -2.688 AIC 1.0 -2.690 -2.692 -2.694 0.02485 0.02485 0.02495 0.02495 CV GCV 0.02505 0.02505 -2.686 -2.684 CV 0.00 0.05 0.10 0.15 lambda 0.20 0.25 0.30 0.00 0.05 0.10 0.15 0.20 0.25 0.30 lambda Fuente: Elaboración Propia 89 5.3 Curvas de Engel Estimadas Dada la elección del criterio GCV para la obtención del parámetro de suavizado óptimo, en esta sección se analizarán los resultados de las CE estimadas, utilizando los gráficos de las regresiones no paramétricas y sus respectivos intervalos de confianza (IC) bootstrap. En la Figura 5.2 se presentan las curvas de Engel del total alimentos y bebidas (A) para los cuatro estimadores no paramétricos considerandos. En general se observa que, a partir de un gasto total de 150 pesos (a precios de 1996-97), donde la participación del gasto en alimentos y bebidas alcanza un máximo, el comportamiento de las curvas es compatible con la denominada ley de Engel, caracterizándolos como ‘bienes necesarios’ en la jerga de la teoría del consumidor. Sin embargo, las cuatro estimaciones muestran que para los hogares de menores recursos (menores valores del logaritmo del gasto total) la participación del gasto en alimentos aumenta con el incremento del poder adquisitivo, lo que prima facie contradice la ley de Engel. Este hecho puede asociarse a la deficiencia en canasta alimenticia de los hogares pobres, tanto en cantidad como en calidad (Barrientos Marin, 2009). Específicamente, la pendiente positiva de las líneas tangentes de la CE puede ser consistente con el comportamiento de un consumidor en la búsqueda de una mayor calidad para tales bienes de forma tal que los ‘convierte’ en bienes de lujo en el sentido de que incrementan su peso en el presupuesto del hogar (Deaton, 1988; Costa, 2000; Fleischer y Rivlin, 2009; García Arancibia, 2011). Entre los cuatro estimadores se observa que aquéllos basados en núcleos acentúan más tal comportamiento en los niveles de ingresos bajos. Por el contrario, para el estimador spline el crecimiento de la participación del gasto es mucho más leve, y, según los IC heterocedásticos, la precisión del estimador es mayor. En los tramos donde las CE son decrecientes (i.e. adoptan la forma regular según la ley de Engel), se observan algunos cambios en la pendiente. En particular, en el punto medio de logaritmo del gasto total (alrededor de 6) se observa una pendiente más pronunciada para niveles inferiores de dicho punto, respecto a los hogares con mayores niveles de gasto total. La simple inspección gráfica sugiere que la disminución del peso de los alimentos en el presupuesto del hogar por incrementos en el poder adquisitivo se realiza de forma más 90 acentuada o acelerada en hogares de menores ingresos. Este quiebre se refleja aún más con los estimadores N-W y spline. Figura 5.2 Estimadores No Paramétricos de Curvas de Engel. Total Alimentos y Bebidas (A) Estimador Local Lineal (h=0.66 ; v=7.56) 0.6 0.6 0.7 0.7 Estimador N-W (h=0.41 ; v=9.14) Curva de Engel Estimada 95% IC wild bootstrap 0.5 0.1 0.1 0.2 0.2 0.3 0.4 w_A 0.4 0.3 w_A 0.5 Curva de Engel Estimada 95% IC wild bootstrap 4 5 6 7 8 4 5 ln(G) 6 8 ln(G) Suavizado Spline. (λ=0.07 ; v=6.73) 0.6 0.6 0.7 0.7 Estimador Local Cuadrático (h=1.33 ; v=6.48) Curva de Engel Estimada 95% wild bootstrap IC 0.1 0.4 0.1 0.2 0.2 0.3 0.3 0.4 w_A 0.5 0.5 Curva de Engel Estimada 95% IC wild bootstrap w_A 7 4 5 6 7 8 4 5 6 7 8 ln(G) ln(G) Fuente: Elaboración Propia Al observar las curvas IC, se nota la pérdida de precisión en los extremos, dada la mayor variabilidad de los datos. Comparando los polinomios locales cuadráticos con el suavizado spline, cuyos grados de libertad son similares, este último muestra intervalos de confianza más precisos en los extremos. En los niveles medios del gasto total, las 91 curvas IC cubren con gran proximidad a las CE estimadas, por lo que pueden obtenerse deducciones del comportamiento económico de los consumidores de una forma más segura que en los extremos. En la Figura 5.3 se muestran las cuatro estimaciones en una misma gráfica, revelándose que las diferencias entre los estimadores no paramétricos son muy leves, con mayor divergencia en los niveles extremos del gasto total. Al comparar los estimadores locales lineales y cuadráticos, con el local constante (i.e. el N-W) se observa que los dos primeros reducen el sesgo en los niveles extremos. En general, el N-W siempre es más susceptible al sesgo y rara vez resulta ser el más adecuado en comparación con polinomios locales de mayor grado. Esto ocurre porque un incremento del grado de los polinomios locales, disminuye el sesgo, aunque aumenta la varianza del estimador. En general los polinomios más utilizados en la literatura empírica son los lineales y cuadráticos, y en algunos casos los cúbicos, puesto que un grado mayor del polinomio no siempre resulta ser más beneficioso (Loader, 1999: 22). Adicionalmente se tiene que, en general, los polinomios con grado impar proporcionan un mejor ajuste respecto a los pares (Härdle et al., 2004). 0.6 0.7 Figura 5.3 Curvas de Engel de Alimentos y Bebidas (A). Comparación de estimadores 0.4 0.3 0.2 0.1 w_A 0.5 N-W P Local Lineal P Local Cuadratico Spline 4 5 6 7 8 ln(G) Fuente: Elaboración Propia 92 Para el caso de los subconjuntos de alimentos considerados, se presentan diferentes formas de CE, cumpliéndose en general la denominada ‘ley de Engel’ (Figuras 5.4-5.7). Figura 5.4 Estimadores No Paramétricos de Curvas de Engel. Conjunto A1 Estimador Local Lineal (h=0.34 ; v=12.98) 0.15 Curva de Engel Estimada 95% IC wild bootstrap 0.00 0.00 0.05 0.10 0.10 w_A1 Curva de Engel Estimada 95% IC wild bootstrap 0.05 w_A1 0.15 0.20 0.20 Estimador N-W (h=0.33 ; v=11.22) 4 5 6 7 8 4 5 6 ln(G) 8 ln(G) Suavizado Spline. (λ=0.204 ; v=5.27) 0.15 Curva de Engel Estimada 95% wild bootstrap IC 0.00 0.00 0.05 0.05 0.10 w_A1 Curva de Engel Estimada 95% IC wild bootstrap 0.10 0.15 0.20 0.20 Estimador Local Cuadrático (h=1.6 ; v=5.77) w_A1 7 4 5 6 7 8 4 ln(G) 5 6 7 8 ln(G) Fuente: Elaboración Propia Para el conjunto de alimentos A1 (los productos de panadería, harinas, arroz, cereales y pastas), los estimadores N-W y por polinomios locales lineales presentan un suavizado óptimo similar, mostrando gran variabilidad en el extremo inferior del logaritmo del gasto total, con cambios del signo de la pendiente de las curvas de Engel en pequeños intervalos del dominio. Dada la forma que toman las curvas a partir de niveles mayores 93 del gasto total, es esperable que esta variabilidad se deba más a un problema de estimación que a un comportamiento esperado de los consumidores, derivado de la heterogeneidad de los mismos. De las estimaciones por polinomios locales cuadráticos y del suavizado spline se tiene un mayor suavizado óptimo, con aproximadamente cinco grados de libertad versus doce grados de libertad de las estimaciones N-W y local lineal. En este caso, se corrige la varianza de los estimadores en el extremo inferior, dando mejores resultados para la interpretación económica del comportamiento de los consumidores. Se observa que en hogares con menor poder adquisitivo, la disminución de la participación del gasto en A1 se realiza a una tasa menor que en hogares de ingresos medios. Esto significa que la tasa de sustitución de estos productos, que se caracterizan por un mayor rendimiento, en lo que hace a saciar el hambre en el hogar, es menor en hogares pobres, y la sustitución por otros alimentos más ricos en nutrientes se realiza de manera más pronunciada una vez que se ha adquirido un cierto nivel de poder adquisitivo en el hogar. Luego, como resulta esperable, en hogares con ingresos altos (alto logaritmo del gasto total) continúa la caída en la participación del gasto en A1 por incrementos del gasto total, pero en menor medida que en los hogares de gastos e ingresos medios. El consumo de carnes de todo tipo (A2) tiene un comportamiento mucho más homogéneo que en el caso anterior, y la variabilidad de los extremos queda representada en IC más amplios y no en cambios de signos de las regresiones no paramétricas. Mientras que las estimaciones basadas en núcleos muestran cierta curvatura, diferenciando en algún modo los hogares a partir del punto medio del logaritmo del gasto total, la CE del suavizado spline se aproxima a una línea recta, a pesar de que sus grados de libertad son similares a los de los polinomios locales lineales y cuadráticos. Sin embargo, se puede apreciar que la participación del gasto en carnes disminuye en menor medida en hogares con menor gasto total. Este menor grado de sustitución por otros alimentos, puede deberse a un cambio hacia un mayor nivel de calidad en los cortes de carnes una vez que el poder adquisitivo así lo permite. Para un hogar de bajos recursos, existen determinados cortes o tipos de carnes que permiten la elaboración de guisos de bajo costo y alto rendimiento, incluyendo el componente cárnico como algo complementario. Dado el fuerte arraigo del 94 consumo de carne en la cultura culinaria argentina, es más probable que en hogares donde la canasta alimenticia es deficiente, el mayor poder adquisitivo lleve a un hogar a comprar mejores cortes cárnicos que a sustituirlo por otros tipos de alimentos. Figura 5.5 Estimadores No Paramétricos de Curvas de Engel. A2 Estimador Local Lineal (h=1.33 ; v=4.57) 0.20 0.15 0.10 0.00 0.00 4 5 6 7 4 8 5 6 7 8 ln(G) Estimador Local Cuadrático (h=2.67 ; v=4.16) Suavizado Spline. (λ=0.56 ; v=4.18) 0.10 0.20 Curva de Engel Estimada 95% wild bootstrap IC 0.15 w_A2 0.15 Curva de Engel Estimada 95% IC wild bootstrap 0.00 0.00 0.05 0.10 0.20 0.25 0.25 ln(G) 0.05 w_A2 Curva de Engel Estimada 95% IC wild bootstrap 0.05 0.10 w_A2 0.15 Curva de Engel Estimada 95% IC wild bootstrap 0.05 w_A2 0.20 0.25 0.25 Estimador N-W (h=0.42 ; v=8.86) 4 5 6 7 8 4 ln(G) 5 6 7 8 ln(G) Fuente: Elaboración Propia En el caso del consumo de leche y productos lácteos (A3) se tiene que el estimador local lineal y el N-W presentan mayor varianza debido al menor suavizado óptimo, reflejada particularmente en el extremo inferior del logaritmo del gasto total. Las CE reflejan que a medida que se incrementa el poder adquisitivo del hogar, la participación de los lácteos 95 sobre el presupuesto total disminuye pero a menores tasas, particularmente a partir de los hogares de gastos medios. Figura 5.6 Estimadores No Paramétricos de Curvas de Engel. A3 Estimador Local Lineal (h=0.49 ; v=9.57) 0.15 0.15 Estimador N-W (h=0.32 ; v=11.33) Curva de Engel Estimada 95% IC wild bootstrap 0.00 0.00 0.05 0.05 w_A3 w_A3 0.10 0.10 Curva de Engel Estimada 95% IC wild bootstrap 4 5 6 7 4 8 5 6 7 8 Estimador Local Cuadrático (h=1.47 ; v=5.74) Suavizado Spline. (λ=0.24 ; v=4.91) 0.15 ln(G) 0.15 ln(G) Curva de Engel Estimada IC 95% wild bootstrap 0.00 0.00 0.05 0.05 w_A3 w_A3 0.10 0.10 Curva de Engel Estimada 95% IC wild bootstrap 4 5 6 7 8 4 5 6 7 8 ln(G) ln(G) Fuente: Elaboración Propia Un comportamiento similar tienen las CE de verduras, legumbres y Frutas (A4) (Figura 5.7), aunque en este caso se identifican tres tipos de curvaturas. En el extremo inferior, convexas con una mayor pendiente (de las líneas tangentes). Luego toma una forma cóncava, para luego volver a ser convexa, aunque con menores pendientes. 96 Figura 5.7 Estimadores No Paramétricos de Curvas de Engel. A4 Estimador Local Lineal (h=0.66 ; v=7.58) 0.15 0.15 Estimador N-W (h=0.4 ; v=9.34) Curva de Engel Estimada 95% IC wild bootstrap 0.00 0.00 0.05 0.05 w_A4 w_A4 0.10 0.10 Curva de Engel Estimada 95% IC wild bootstrap 4 5 6 7 4 8 5 7 8 ln(G) ln(G) Suavizado Spline. (λ=0.06 ; v=6.91) 0.15 Estimador Local Cuadrático (h=1.29 ; v=6.61) 0.15 6 Curva de Engel Estimada IC 95% wild bootstrap 0.00 0.00 0.05 0.05 w_A4 w_A4 0.10 0.10 Curva de Engel Estimada 95% IC wild bootstrap 4 5 6 7 8 4 5 6 7 8 ln(G) ln(G) Fuente: Elaboración Propia Para poder visualizar de mejor manera las diferencias entre los estimadores de los conjuntos de alimentos específicos, en la Figura 5.8 se presentan cuatro gráficas para los conjuntos A1-A4, en las que cada una contiene los cuatro estimadores no paramétricos estudiados. Se observa que, al igual que ocurría con el caso del total de alimentos y bebidas, las diferencias entre los estimadores se resaltan en los niveles extremos de gasto total. En todos los casos se tiene que el sesgo del estimador local constante (N-W) tiende a subestimar la curva de Engel en los niveles de gastos bajos y a sobreestimarla en los niveles de mayor poder adquisitivo. En algunos casos hay mayores coincidencias entre el 97 estimador local cuadrático y el suavizado spline (como ser en A1 y A3), y otras veces las estimaciones con polinomios locales resultan más similares (A2 y A4). De la forma general de las CE, se tiene una mayor similitud entre la de productos de panadería y pastas (A1) con la de carnes (A2) por un lado, y la de los productos lácteos (A3) con la de verduras, legumbres y las frutas (A4), por otro. En la sección 5.6 se estudian las derivadas y elasticidades-gasto de estas curvas, lo que permitirá complementar el análisis de forma más acabada. Figura 5.8 Curvas de Engel de Conjuntos Específicos de Alimentos. Comparación de Estimadores 0.15 0.20 N-W P Local Lineal P Local Cuadratica Spline 0.00 0.00 0.05 0.10 w_A2 0.15 0.10 N-W P Local Lineal P Local Cuadratico Spline 0.05 w_A1 A2: Carnes 0.25 0.20 A1: Productos de Panadería, Arroz, Cereales y Pastas 4 5 6 7 4 8 5 ln(G) 7 8 ln(G) A4: Verduras, Legumbres y Frutas 0.15 A3: Leche y Productos Lácteos 0.15 6 N-W P Local Lineal P Local Cuadratica Spline 0.00 0.00 0.05 0.05 w_A4 w_A3 0.10 0.10 N-W P Local Lineal P Local Cuadratica Spline 4 5 6 7 8 4 ln(G) 5 6 7 8 ln(G) Fuente: Elaboración Propia 98 5.4 Evaluación Estadística Si bien no se observan diferencias substanciales alrededor de la media entre los diferentes estimadores no paramétricos, es deseable encontrar cuáles de éstos permiten reflejar de mejor manera el comportamiento del consumidor, y más aun teniendo en cuenta las divergencias en los niveles extremos de ingresos, donde muchas veces recae el interés del análisis económico. En esta sección se evalúan los diferentes estimadores utilizando medidas alternativas de performance estadística, que en algunos casos resultan complementarias para la selección del ‘mejor’ estimador. En la Tabla 5.2 se presentan los parámetros de suavizado (la ventana, el parámetro de penalización del spline y los grados de libertad correspondientes), el valor del GCV alcanzado en la minimización del mismo, los errores de predicción ECPP y EAPP, los 2 estadísticos Cp y AICc, y también el R-cuadrado ( R ) no paramétrico. Tabla 5.2 Medidas de Evaluación de Estimadores No Paramétricos. Total Alimentos y Bebidas (A) Cp AICc R2 Estimador h/λ v GCV ECPP EAPP N-W 0.41 9.14 0.02485 0.024791 0.125937 0.024851 -2.69459 0.2308 Local Lineal 0.66 7.56 0.02484 0.024787 0.125851 0.024837 -2.69518 0.2306 Local Cuadrático 1.33 6.48 0.02483 0.024789 0.125838 0.024832 -2.69537 0.2305 Spline 0.069 6.73 0.02483 0.024785 0.125846 0.024829 -2.69548 0.2306 Fuente: Elaboración Propia Según el ECPP, el suavizado spline es el que da un menor error promedio, seguido del polinomio local lineal. A su vez, el estimador N-W es el que presenta el mayor valor del ECPP. Por su parte el error absoluto de predicción, coloca al polinomio local cuadrático en primer lugar (en términos del menor error), y en segundo lugar al spline. Los valores del Cp y el AICc, son coincidentes en cuanto al ranking que establecen de estimadores con menor error, colocando en primer lugar al suavizado spline, luego al polinomio local 99 cuadrático, seguido del lineal, y por último al N-W. Este ranking también se da al observar los valores mínimos de la función GCV evaluada en los respectivos suavizados óptimos. Por lo tanto, existen bastantes coincidencias entre las diferentes medidas de performance. 2 En cuanto al R , el mismo muestra que el N-W es el de mayor bondad de ajuste, aunque 2 las diferencias son muy pequeñas. Sin embargo, el R , al igual que en el caso paramétrico, tiene una gran dependencia (no decreciente) de los grados de libertad del estimador. En la Tabla 5.3 se muestra el valor del R-cuadrado de los estimadores para iguales grados de libertad (v). Se toma un v ‘alto’ de 8.3 (promedio del v óptimo para los estimadores N-W y local lineal) y otro ‘bajo’ de 6.3 (promedio del v óptimo para los 2 estimadores local cuadrático y spline). Se observa que ahora el de mayor R es el spline seguido del cuadrático y el N-W, y luego del local lineal. Sin embargo, nuevamente las diferencias son despreciables. A su vez, el R 2 se computa para tener una medida adicional y que sea comparable con la de los modelos de regresión paramétrica, donde 2 usualmente el R es reportado. Sin embargo, está lejos de considerarse como un criterio de selección (Racine, 2008: 46) Tabla 5.3 R-cuadrado de los Estimadores No Paramétricos con iguales grados de libertad. Total Alimentos y Bebidas (A) R2 Estimador v=8.3 v= 6.6 N-W 0.2307 0.2305 Local Lineal Local Cuadrático 0.2307 0.2307 0.2304 0.2305 Spline 0.2308 0.2306 Fuente: Elaboración Propia Para el conjunto de alimentos específicos A1-A4 se presenta los resultados de las medidas de performance en la tabla 5.4 (análoga a la Tabla 5.2). Para los Alimentos en base a harinas, cereales y arroz (A1), el estimador local lineal es el que presenta el menor ECPP, mientras que el cuadrático es de menor error según el EAPP. Ambas medidas colocan al N-W en el segundo lugar de los estimadores con menor error de predicción. El R2 muestra el mismo ranking para la bondad de ajuste. Por el contrario, 100 las medidas Cp y AICc muestran que el suavizado spline es el de menor error, seguido por el estimador local cuadrático; coincidiendo con el caso general de alimentos y bebidas (A) (Tabla 5.2). Tabla 5.4 Medidas de Evaluación de Estimadores No Paramétricos. Conjuntos Específicos de Alimentos: A1-A4 Estimador h/λ v GCV ECPP EAPP Cp AICc R2 A1 N-W 0.33 11.22 0.00247 0.002459 0.036562 0.0024661 -5.00485 0.2452 Local Lineal 0.34 12.99 0.00247 0.002457 0.036564 0.0024657 -5.00501 0.2455 Local Cuadrático 1.60 5.58 0.00247 0.002462 0.036555 0.0024655 -5.00509 0.2441 0.204 5.27 0.00247 0.002462 0.036568 0.0024650 -5.00529 0.2442 N-W 0.42 8.86 0.00406 0.004052 0.048339 0.004063 -4.50567 0.2266 Local Lineal 1.33 4.57 0.00406 0.004052 0.048358 0.004058 -4.50686 0.2262 Local Cuadrático 2.67 4.16 0.00406 0.004053 0.048299 0.004059 -4.50696 0.2262 0.564 4.18 0.00424 0.004052 0.048316 0.004057 -4.50699 0.2262 N-W 0.32 11.33 0.00102 0.001019 0.024046 0.0010222 -5.88548 0.1549 Local Lineal 0.49 9.57 0.00102 0.001019 0.024063 0.0010220 -5.88571 0.1545 Local Cuadrático 1.47 5.75 0.00102 0.001021 0.024066 0.0010224 -5.88527 0.1531 0.244 4.91 0.00102 0.001021 0.024065 0.0010223 -5.88541 0.1530 N-W 0.40 9.38 0.00162 0.0016116 0.029937 0.0016158 -5.42768 0.1940 Local Lineal 0.66 7.58 0.00162 0.0016116 0.029967 0.0016150 -5.42814 0.1936 Local Cuadrático 1.29 6.61 0.00162 0.0016122 0.029947 0.0016151 -5.42806 0.1934 0.057 6.91 0.00161 0.0016115 0.029944 0.0016146 -5.42841 0.1937 Spline A2 Spline A3 Spline A4 Spline Fuente: Elaboración Propia 101 En las estimaciones de CE para el consumo de carne (A2), el ECPP es igual en todos los casos, mientras que para el EAPP el polinomio local cuadrático seguido del spline son los que muestran los menores errores. El AICc, coincide respecto a estos dos estimadores, aunque en orden inverso, esto es, primero el suavizado spline y luego el local cuadrático. EL Cp si bien pone en primer lugar al spline, el segundo estimador con menor Cp es el local lineal. Para este subconjunto de alimentos, los grados de libertad son más similares; solo el N-W presenta grados de libertad más altos, duplicando al de los otros tres estimadores. En el consumo de leche y productos lácteos (A3), todas las medidas de performance estadística propuestas son consistentes, mostrando que las mejores CE están dadas por las que surgen del estimador local lineal y del constante (N-W). Los valores de las medidas para el caso del consumo de verduras, legumbres y frutas (A4) muestran que, según los criterios de los estadísticos ECPP, Cp y AICc, el estimador spline seguido del local lineal son los que muestran los menores errores de estimación y predicción. Para el EAPP, son el N-W y, nuevamente, el suavizado spline. De este análisis de la performance de los estimadores no paramétricos no siempre hay coincidencias en cuanto al ranking que proporcionan las diferentes medidas en base al criterio del menor error (muestral) de estimación y predicción. Ahora bien, cabe preguntarse qué tan buenas son tales medidas como aproximación de los errores. Para responder a ello, aunque de una forma parcial, se presenta en el Anexo 1 un sencillo ejercicio de simulación. En el mismo se plantea como verdaderas CE las tres formas funcionales conocidas en la versión simple y extendida de la Working-Leser; es decir, la especificación lineal, cuadrática y cúbica. En base al conocimiento de las curvas verdaderas, es posible computar los errores de estimación y predicción de forma exacta. Tales valores luego son comparados con las medidas empíricas de evaluación de performance. De este análisis se concluye que, bajo la hipótesis de que las CE tienen dichas formas funcionales rígidas, el Cp y el AICc son mejores medidas para representar los errores, mientras que el EEPP y el EAPP, pueden mostrar un ranking totalmente contrario al real o verdadero. Sin embargo, en esta aplicación empírica se observa que estas dos últimas medidas son bastante coincidentes con el Cp y el AICc, y a su vez, estos 102 dos últimos no siempre revelan el mismo resultado, aunque en general son muy consistentes. Ahora bien, de los resultados de esta sección ¿Cuál o cuáles estimadores tienen la mejor performance? Claramente, en los términos que se está evaluando, el suavizado spline es el de mejor desempeño. Luego, en algunos casos, sigue el estimador local cuadrático, y en otros, el local lineal. El N-W puede ser descartado entre estas alternativas, el que, justamente, es más utilizado en la literatura econométrica aplicada. En la próxima sección se analiza el comportamiento de las derivadas y las elasticidades, lo que contribuirá en el criterio de selección de los estimadores, mirando en ese caso, las respuestas de los consumidores ante variaciones en su poder adquisitivo, y con ello, justificando la elección en base a la interpretación económica más razonable que los estimadores ofrecen. 5.5 Derivadas y Elasticidades Como se presentó oportunamente en capítulo metodológico, para la estimación de las derivadas (y con ello, de las elasticidades-gasto) se utilizó un método numérico para el estimador N-W, dadas las dificultades de cómputo de su derivada analítica, mientras que para las estimadores locales lineales y cuadráticos, y los suavizados spline, la estimación de las mismas surgen directamente de la CE no paramétrica. Sin duda representa, otra ventaja de estos métodos. Por ello, en las gráficas que se verán a continuación, las derivadas del estimador N-W presentarán formas más discontinuas que el resto. En la Figura 5.9 se presentan los gráficos de las funciones estimadas de la derivada y de la elasticidad-gasto correspondiente al consumo total de alimentos y bebidas. Como pudo inferirse de las CE correspondientes, para el extremo inferior del gasto total la derivada es positiva, generando con ello una elasticidad-gasto superior a la unidad. De la misma se observa que si en los hogares pobres existe un incremento del 10% de su gasto total (medido como proxy de su ingreso), el gasto en alimentos se incrementa (a lo sumo) en un 12%. Una vez que la derivada comienza a ser negativa, existe una fuerte disminución de la misma hasta el nivel medio del gasto total, reduciéndose la elasticidad-gasto de 1 a un 103 valor aproximado de 0.7. Luego se mantiene en tal nivel, hasta el extremo superior donde nuevamente hay una caída fuerte de la derivada, y la elasticidad se reduce a la mitad. Esto es razonable en términos económicos puesto que es esperable que la elasticidad-gasto de los alimentos disminuya con el poder adquisitivo. Ello surge de suponer que las necesidades alimenticias, tanto en cantidad como en calidad, ya están cubiertas para un determinado nivel de ingresos. El hecho que la misma siga siendo positiva puede estar indicando que el mayor gasto total del hogar no necesariamente indica un mayor gasto per cápita en el mismo, sino que pueden ser hogares con más miembros y más receptores de ingresos, lo que da con ello un mayor ingreso total del hogar, pero así también “más bocas que alimentar”. Figura 5.9 Derivada de la CE y Elasticidad- Gasto. Alimentos y Bebidas (A) eAG 1.2 1.0 0.8 Elasticidad-Gasto 0.00 -0.05 N-W P Local Lineal P Local Cuadratico Spline -0.15 0.4 -0.10 Derivada 0.05 N-W P Local Lineal P Local Cuadratico Spline 0.6 0.10 mA ' 4 5 6 7 8 4 5 Log del Gasto Total 6 7 8 Log del Gasto Total Fuente: Elaboración Propia De la comparación de los estimadores surge que el suavizado spline da las derivadas y elasticidades con menor volatilidad, a la vez que muestra una menor sensibilidad en los extremos. Por el contrario el estimador local cuadrático tiene un comportamiento más pronunciado en los extremos. Sin embargo, todos los estimadores muestran un comportamiento económico muy similar. Esta similitud entre los estimadores no siempre ocurre, y un ejemplo de ello lo constituye el comportamiento de las derivadas y elasticidades para el caso de los alimentos A1. Se 104 puede observar cómo fluctúan las derivadas de los polinomios locales en el extremo inferior, lo que no ocurre con el suavizado spline. Esto genera variaciones repentinas de las derivadas que se traducen en elasticidades muy cambiantes en intervalos pequeños del gasto total. Es decir que muestran fuertes cambios del comportamiento promedio de asignación del presupuesto del hogar, en hogares con similares niveles de gasto total. Esto dificulta la interpretación económica al momento de obtener conclusiones sobre los niveles de elasticidad en hogares perteneciente a un rango de ingresos o poder adquisitivo. Específicamente, si se mira el estimador local lineal o constante para niveles del logaritmo del gasto total entre 4.5 y 5 se tiene que la elasticidad-gasto puede superar a la unidad como ser igual a 0.4, lo que en la interpretación económica resulta muy diferente. Sin embargo, del suavizado local cuadrático o del spline se puede conocer con mayor exactitud el valor de la elasticidad estimada para diferentes niveles de ingreso/gasto. Por lo tanto, no resulta recomendable contar con CE que muestren tal variabilidad en las elasticidades, y por ello, en este caso, el suavizado spline y el polinomio cuadrático son los preferidos. Figura 5.10 Derivada de la CE y Elasticidad- Gasto. Alimentos A1 G e A1 1.0 0.8 0.6 Elasticidad-Gasto 0.2 0.00 N-W P Local Lineal P Local Cuadratico Spline 0.0 -0.05 Derivada 0.05 N-W P Local Lineal P Local Cuadratico Spline 0.4 0.10 1.2 mA1 ' 4 5 6 7 8 4 Log del Gasto Total 5 6 7 8 Log del Gasto Total Fuente: Elaboración Propia 105 Para el consumo de carne (Figura 5.11), los cuatro estimadores muestran resultados similares, aunque el N-W presenta mayores sobresaltos, pudiendo ser el resultado de la estimación numérica de la derivada más allá de la misma estimación de la CE. Figura 5.11 Derivada de la CE y Elasticidad- Gasto. Alimentos A2 G eA2 1.0 0.8 0.6 Elasticidad-Gasto -0.03 N-W P Local Lineal P Local Cuadratico Spline -0.06 0.0 -0.05 0.2 -0.04 Derivada -0.02 -0.01 N-W P Local Lineal P Local Cuadratico Spline 0.4 0.00 1.2 mA2 ' 4 5 6 7 8 4 5 6 7 8 Log del Gasto Total Log del Gasto Total Fuente: Elaboración Propia En las estimaciones de CE de leche y productos lácteos (Figura 5.12) se observa que algunos estimadores poseen el mismo inconveniente que en el caso del conjunto A1. Esto es, demasiada variabilidad de los efectos marginales para pequeños intervalos del poder adquisitivo de los hogares, lo que en definitiva conlleva a complicaciones para el análisis económico. Nuevamente el suavizado spline y el polinomio cuadrático dan como resultado curvas más suaves reflejando de manera más clara el comportamiento del consumidor ante el efecto ingreso. Por último, para los alimentos A4 (Figura 5.13), se observa que la derivada de la CE tiene una tendencia creciente, contrariamente a lo ocurrido en los otros casos, lo que significa una mayor respuesta en el consumo de este tipo de alimentos en los hogares con mayor gasto (ingreso) total. Sin embargo, en términos proporcionales (medido por las elasticidades) no se observa una tendencia clara, sino oscilaciones alrededor de 0.6, y una fuerte caída cuando el gasto total alcanza su nivel extremo superior. 106 Figura 5.12 Derivada de la CE y Elasticidad- Gasto. Alimentos A3 G e A3 0.5 1.0 N-W P Local Lineal P Local Cuadratico Spline -0.15 0.0 Elasticidad-Gasto -0.05 N-W P Local Lineal P Local Cuadratico Spline -0.10 Derivada 0.00 m A3 ' 5 6 7 5 8 6 7 8 Log del Gasto Total Log del Gasto Total Fuente: Elaboración Propia Figura 5.13 Derivada de la CE y Elasticidad- Gasto. Alimentos A4 G eA4 0.4 0.6 0.8 N-W P Local Lineal P Local Cuadratico Spline 0.0 -0.10 0.2 Elasticidad-Gasto -0.04 -0.06 N-W P Local Lineal P Local Cuadratico Spline -0.08 Derivada -0.02 1.0 0.00 mA4 ' 4 5 6 7 8 4 Log del Gasto Total 5 6 7 8 Log del Gasto Total Fuente: Elaboración Propia A pesar de que las gráficas permiten una análisis del comportamiento del consumidor para los diferentes niveles del gasto total, usualmente en el análisis económico interesa contar con una medida resumen del comportamiento, por lo que en la literatura empírica suelen presentarse las elasticidades promedios o evaluadas en el gasto medio. En la Tabla 5.5 y 5.6 se presentan las derivadas promedio de las CE, ponderadas por la distribución del logaritmo del gasto total, y con ella se computa la elasticidad promedio. 107 Adicionalmente se muestran las elasticidades evaluadas en el gasto promedio. En cada caso se presentan los errores estándar bootstrap de tales estimaciones. Como puede apreciarse de la Tabla 5.5, no existen diferencias importantes entre las derivadas y elasticidades arrojadas por los diferentes estimadores. A su vez, la elasticidad promedio es muy similar a la elasticidad evaluada en el ‘hogar promedio’. Mayores similitudes se observan entre el estimador spline y el local lineal, por un lado, y entre en N-W y el local cuadrático por otro. Sin embargo puede concluirse que independientemente del estimador no paramétrico que se utilice, el significado económico derivado de la observación de las elasticidades-gasto promedio (o evaluada en la media) es el mismo. Tabla 5.5 Derivadas y Elasticidades – Gasto. Total Alimentos y Bebidas N-W P Local Lineal P Local Cuadrático Spline Derivada Promedio Elasticidad Promedio Elasticidad en el Gasto Medio -0.1067 (0.0023) -0.1117 (0.0024) -0.1065 (0.0027) -0.1111 (0.0023) 0.7436 (0.0053) 0.7317 (0.0055) 0.7438 (0.0065) 0.7330 (0.0055) 0.7718 (0.0261) 0.7245 (0.0198) 0.6960 (0.0099) 0.7226 (0.022) Nota: Errores estándar bootstrap entre paréntesis. Fuente: Elaboración Propia Para los conjuntos de alimentos específicos tampoco se observan diferencias importantes entre las derivadas y elasticidades computadas a partir de los diferentes estimadores. Aunque algunas diferencias se resaltan más en las elasticidades evaluadas en el gasto medio. Las elasticidades promedio muestran que los alimentos en base a harinas, arroz y cereales son menos elásticos. Sin embargo, si se toman las elasticidades valuadas en el gasto medio, los alimentos menos elásticos son las carnes. Esto significa que ambos alimentos responden menos ante variaciones en el poder adquisitivo de los hogares, y ello es consistente con la cultura culinaria pampeana argentina, donde el gusto está fuertemente volcado a las carnes y a las pastas (Alvarez y Pinotti, 1999: 115-117). 108 Si bien los lácteos, las frutas y las verduras presentan mayores elasticidades-gasto promedios, es poca la diferencia con los alimentos A1 y A2. Tabla 5.6 Derivadas y Elasticidades – Gasto. Conjuntos Específicos de Alimentos A1-A4 Estimador/Alimentos Derivada Promedio Elasticidad Promedio Elasticidad en el Gasto Medio -0.036 (0.0008) -0.038 (0.0011) -0.036 (0.0011) -0.037 (0.0009) 0.563 (0.094) 0.536 (0.0125) 0.559 (0.0134) 0.550 (0.0096) 0.662 (0.0587) 0.544 (0.0648) 0.502 (0.0131) 0.526 (0.0245) -0.044 (0.0010) -0.046 (0.0011) -0.044 (0.0013) -0.046 (0.0011) 0.608 (0.0084) 0.587 (0.0087) 0.604 (0.0112) 0.590 (0.0088) 0.599 (0.0388) 0.528 (0.0160) 0.541 (0.0101) 0.523 (0.0174) -0.018 (0.0006) -0.018 (0.0006) -0.019 (0.0008) -0.018 (0.0006) 0.640 (0.0104) 0.631 (0.0109) 0.611 (0.0155) 0.627 (0.0109) 0.768 (0.0732) 0.732 (0.0515) 0.651 (0.0153) 0.694 (0.0252) -0.025 (0.0007) -0.026 (0.0008) -0.026 (0.0009) -0.026 (0.0007) 0.618 (0.0094) 0.602 (0.0096) 0.605 (0.0131) 0.603 (0.0096) 0.758 (0.0409) 0.661 (0.0316) 0.574 (0.0164) 0.664 (0.0375) A1 N-W P Local Lineal P Local Cuadrático Spline A2 N-W P Local Lineal P Local Cuadrático Spline A3 N-W P Local Lineal P Local Cuadrático Spline A4 N-W P Local Lineal P Local Cuadrático Spline Nota: Errores estándar bootstrap entre paréntesis. Fuente: Elaboración Propia 109 Por lo tanto, si bien ambos promedios de elasticidades-gasto brindan medidas útiles para la clasificación económica de un bien, no expresan la diferencia que puede existir entre los estimadores, como tampoco distinguen claramente el comportamiento de los consumidores entre los distintos tipos de alimentos. De aquí se concluye que para una mejor interpretación económica, debe realizarse un uso conjunto de las curvas de elasticidades-gasto con sus promedios. Más aún, la visualización de las gráficas de las curvas de elasticidades no paramétricas, brinda pautas sobre los rangos en los cuales se podrían calcular los promedios, de forma de tener diferentes elasticidades-gasto en distintos intervalos de interés, dentro de los cuales, las elasticidades son estables. 5.6 Contraste con Especificaciones Paramétricas A pesar de la ventaja de contar con CE flexibles obtenidas a partir de las regresiones no paramétricas, tener una forma funcional conocida de la CE posibilita un análisis más simple para el cómputo de elasticidades y para la posterior especificación de sistemas de demanda paramétricos. Sin embargo, ¿Cómo se puede saber si una determinada especificación paramétrica representa bien el comportamiento del consumidor, ajustada correctamente al conjunto de datos con los que se cuenta? Si bien la teoría económica propone especificaciones que se ajustan a la teoría del consumidor, también deja un margen para la consideración de funciones más generales. Aquí es donde entran las regresiones no paramétricas, no sólo en su propuesta de formas flexibles, sino también brindando una alternativa para testear el rechazo o no rechazo de una especificación paramétrica dada. Por lo tanto, por más que el interés del investigador sea trabajar con CE paramétricas, un análisis no paramétrico previo, le brindaría información acerca de si su elección de la forma funcional es correcta o no en términos estadísticos. Si bien de la inspección gráfica de las CE se puede tener una idea de la forma funcional posible, existen varios test de especificación que ayudan a sustentar las decisiones. En el capítulo metodológico se presentaron dos test alternativos que poseen la ventaja de ser aplicados a cualquiera de los suavizados lineales propuestos. Uno es paramétrico, donde la distribución del estadístico T se aproxima a una F (sin ser exacta, ni siquiera a niveles asintóticos). El otro test, propone un estadístico similar T* y se computan los p-valores a 110 partir de su distribución empírica generada por el método wild-bootstrap. En la Tabla 5.7 se presentan los resultados de dichos test proponiendo como hipótesis nula las tres variantes de la Working-Leser. Se puede observar que para el caso general del consumo de alimentos y bebidas, ambas pruebas rechazan todas las hipótesis nulas, independientemente de cuál sea el estimador y la forma funcional propuesta. Las gráficas de las CE no paramétricas, tampoco sugirieron alguna forma funcional conocida. Tabla 5.7 Pruebas de Hipótesis de Especificaciones Paramétricas Estimador No Paramétrico N-W Especificación T Paramétrica (distribución (Ho) F aproxim.) Lineal Cuadrática Cúbica PLL Lineal Cuadrática Cúbica Lineal PLC Cuadrática Cúbica Lineal Spline Cuadrática Cúbica 7.1372 (0.0000) 7.5991 (0.0000) 2.8515 (0.0059) 9.8854 (0.0000) 11.0362 (0.0000) 4.5962 (0.0006) 12.8691 (0.0000) 15.2221 (0.0000) 6.7910 (0.0001) 13.8442 (0.0000) 16.6220 (0.0000) 7.9007 (0.0001) T* (wildbootstrap) 0.00838 (0.002) 0.00792 (0.002) 0.00260 (0.004) 0.00855 (0.002) 0.00809 (0.002) 0.00276 (0.002) 0.00846 (0.002) 0.00800 (0.002) 0.00267 (0.002) 0.00863 (0.002) 0.00817 (0.002) 0.00284 (0.002) Nota: p-valores entre paréntesis. Fuente: Elaboración Propia De los valores de los estadísticos T y T*, se observa que los mismos se incrementan al pasar de la Ho lineal a la cuadrática, y disminuyen significativamente cuando Ho es la 111 cúbica (experimentando un pequeño incremento del p-valor). Esto significa que la especificación cuadrática es la que menos se ajusta respecto a la no paramétrica, mientras que la cúbica, a pesar de rechazarse, parece ser la mejor opción entre la otras dos. En la Figura 5.14 se observa que gráficamente la CE cúbica no está tan lejos de las alternativas no paramétricas. Específicamente, hay mayor divergencia en el extremo superior del gasto total. Para la CE cúbica, en los hogares de mayor ingreso, llega un punto en donde la participación del gasto de los alimentos deja de disminuir ante aumentos adicionales del poder adquisitivo. Sin embargo, para las CE no paramétricas, si bien hay una leve disminución en la inclinación de las CE en el tramo de gastos totales superiores, la participación presupuestaria del gasto en alimentos sigue decreciendo. Dado el carácter de necesidades básicas que tienen los alimentos, lo reflejado por las CE no paramétricas resulta más consistente en términos económicos. 0.6 Figura 5.14 Ajuste Cúbico de la CE versus Ajustes No Paramétricos 0.4 0.2 0.3 w_A 0.5 W-L Cúbica P Local Lineal Spline 4 5 6 7 8 ln(G) Fuente: Elaboración Propia Los coeficientes estimados de los modelos paramétricos de CE para el caso del total de alimentos y bebidas (A) se presentan en la Tabla 5.6. Se puede ver que la bondad de ajuste 112 en términos del R 2 es menor a la de los ajustes no paramétricos, aunque la cantidad ‘equivalente’ de parámetros (v) es mayor en estos últimos (ver Tabla 5.2). Tabla 5.8 Estimaciones Paramétricas Simples de CE. Total Alimentos y Bebidas (A) Coeficientes Especificación Working-Leser Lineal 1.127 *** ( 0.0153) -0.112*** ( 0.0024) Cuadrática 0.953*** ( 0.095) -0.056* ( 0.0304) -0.0045* (0.0024) Cúbica -2.358*** (0.53) 1.579*** (0.259) -0.27*** (0.0419) 0.0142*** (0.0022) R2 0.224 0.2241 0.2281 EER 0.1581 0.1581 0.1577 θ0 θ1 θ2 θ3 Estadístico-F 2190 1097 748.8 Obs. 7588 7588 7588 Notas: Siguiendo la notación del capítulo 3, los θj son los coeficientes correspondientes a la potencia j del logaritmo natural del gasto total. Errores estándares entre paréntesis. EER: Error estándar de los residuos.***significativo al 1%; **significativo al 5%; * significativo al 10%. Fuente: Elaboración propia Si bien las tres hipótesis paramétricas para las CE del consumo total de alimentos y bebidas son estadísticamente rechazadas, para los subconjuntos de alimentos específicos los resultados de los test de especificación sugieren algunas especificaciones paramétricas. Los mismos se presentan en la Tabla 5.9 Para los alimentos A1, si bien se rechaza la hipótesis de linealidad, a un nivel del 1% no se rechaza la hipótesis cuadrática si se considera la prueba bootstrap, aunque con el test paramétrico sí se rechaza, excepto si se considera como alternativa el polinomio local cuadrático. Sin embargo, para ambos test y todos los estimadores, no existe evidencia estadística suficiente para rechazar la hipótesis de la CE cúbica. Por lo tanto, para este tipo de alimento puede tomarse a la Working-Leser cúbica como la mejor especificación. Ahora bien, al observar las gráficas superpuesta del ajuste cúbico, del cuadrático y del suavizado spline (Figura 5.15) se tiene que la CE cúbica es similar al spline en el extremo inferior del gasto total. Sin embargo, en el extremo superior, la cuadrática se ajusta más al 113 suavizado spline. En el rango intermedio de gasto, si bien las tres curvas son muy similares, la CE cúbica sigue de mejor manera a la curva no paramétrica. Tabla 5.9 Pruebas de Hipótesis de Especificaciones Paramétricas. Conjuntos Específicos de Alimentos: A1-A4 A1 Est. NP Ho Lineal N-W Cuadrática Cúbica Lineal PLL Cuadrática Cúbica Lineal PLC Cuadrática Cúbica Lineal Spline Cuadrática Cúbica A2 A3 A4 T T* T T* T T* T T* 5.0320 (0.0000) 2.3041 (0.0098) 1.8342 (0.0546) 4.8058 (0.0000) 2.4082 (0.0043) 2.0136 (0.0241) 3.7986 (0.0159) 4.6451 (0.0192) -1.6225 (1.0000) 14.7758 (0.0000) 6.6744 (0.0007) 6.6669 (0.0056) 0.00761 (0.004) 0.00318 (0.0978) 0.00228 (0.2116) 0.00825 (0.004) 0.00381 (0.1297) 0.00292 (0.2695) 0.00633 (0.002) 0.00191 (0.024) 0.00101 (0.0499) 0.00645 (0.002) 0.00202 (0.01) 0.00113 (0.02) 1.0938 (0.3637) 0.8951 (0.5153) -0.0669 (1.000) 3.0042 (0.0281) 3.1979 (0.0391) -0.5541 (1.000 3.7986 (0.0159) 4.6451 (0.0192) -1.6225 (1.000) 4.3225 (0.011) 5.7784 (0.012) -2.2521 (1.000) 0.00132 (0.2435) 0.00096 (0.2854) -0.00006 (0.9022) 0.00130 (0.0679) 0.00093 (0.0758) -0.00008 (0.6267) 0.00129 (0.0399) 0.00092 (0.0339) -0.00009 (0.4431) 0.00133 (0.0379) 0.00096 (0.0399) -0.00006 (0.5269) 5.426 (0.0000) 2.2819 (0.0102) 1.5825 (0.1097) 6.7563 (0.0000) 2.7651 (0.0049) 1.8772 (0.0698) 12.304 (0.0000) 3.7117 (0.0108) 1.1541 (0.3159) 16.7959 (0.0000) 5.5179 (0.0046) 1.7982 (0.1798) 0.0093 (0.002) 0.00357 (0.1198) 0.00224 (0.3673) 0.00900 (0.002) 0.00327 (0.1597) 0.00194 (0.3912) 0.00740 (0.002) 0.00168 (0.0739) 0.00035 (0.515) 0.00729 (0.002) 0.00157 (0.002) 0.00024 (0.3214) 3.5137 (0.0002) 1.8195 (0.0668) 1.7074 (0.1002) 4.8736 (0.0000) 2.6303 (0.0177) 2.6311 (0.0260) 5.7513 (0.0000) 2.9350 (0.0182) 3.0337 (0.0261) 10.557 (0.0000) 3.4485 (0.0085) 1.5728 (0.1951) 0.0044 (0.02) 0.0021 (0.1717) 0.0017 (0.2016) 0.0044 (0.0240) 0.002 (0.2116) 0.0017 (0.2295) 0.0041 (0.018) 0.0017 (0.1597) 0.0013 (0.1697) 0.00451 (0.01) 0.00211 (0.0619) 0.00175 (0.0639) Nota: p-valores entre paréntesis. Fuente: Elaboración Propia Para el consumo de carnes (A2) gráficamente se vio una forma casi lineal de la curva. Esto es verificado por la pruebas de hipótesis donde por lo general no hay rechazo de la hipótesis nula de linealidad. Los test basados en los estimadores N-W y local lineal son los que presentan mayor sustento estadístico para ello. Sin embargo tampoco se rechazan las formas cuadráticas y cúbicas. De la Figura 5.16, se observa que en extremo inferior, el ajuste cuadrático y el spline son prácticamente iguales. En el extremo superior de gasto total, el ajuste lineal se acerca más a la curva no paramétrica. Por lo tanto, del test y de la inspección gráfica se concluye que tanto una especificación lineal como cuadrática pueden funcionar como especificaciones paramétricas alternativas a los ajustes no paramétricos. 114 0.10 W-L Cúbica W-L Cuadrática Spline 0.00 0.05 w_A1 0.15 0.20 Figura 5.15 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para el Subconjunto de Alimentos A1 4 5 6 7 8 ln(G) Fuente: Elaboración propis 0.05 0.10 0.15 W-L Cúbica W-L Cuadrática W-L lineal Spline 0.00 w_A2 0.20 0.25 Figura 5.16 Comparación del Ajuste Cúbico, Cuadrático, Lineal y No Paramétrico de las CE para el Subconjunto de Alimentos A2 4 5 6 7 8 ln(G) Fuente: Elaboración propia 115 Para la leche y los productos lácteos (A3), algunos test, principalmente aquéllos basados en polinomios locales (tanto constante, como lineal y cuadrático) y considerando la distribución bootstrap, el ajuste cuadrático no se rechaza. Por otro lado, según el estimador spline, la misma se rechaza. Sin embargo se tiene que la especificación cúbica no se rechaza en ningún caso. En la Figura 5.17 se observa que las diferencias entre la CE cúbica y el suavizado spline son muy leves, excepto para el extremo superior del gasto total. No obstante, la forma de la curva se conserva. 0.12 Figura 5.17 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para el Subconjunto de Alimentos A3 0.06 0.00 0.02 0.04 w_A3 0.08 0.10 W-L Cúbica W-L Cuadrática Spline 4 5 6 7 8 ln(G) Fuente: Elaboración propia Por último, para las verduras, legumbres y frutas (A4), en general se rechaza la linealidad. La especificación cuadrática no es rechazada si se consideran los polinomios locales, mientras que la cúbica no se rechaza en ningún caso. De la Figura 5.18 se observa que las curvas estimadas por los dos ajustes no paramétricos se ubican alrededor de las alternativas paramétricas, difiriendo más en los extremos. En el extremo inferior, la especificación cúbica se aproxima mejor al spline y peor al local lineal, mientras que para la cuadrática ocurre lo contrario. Sin embargo en el extremo superior del gasto total, la WL cuadrática representa de mejor manera los ajustes no paramétricos respecto a la cúbica. 116 0.15 Figura 5.18 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para los Subconjunto de Alimentos A4 0.00 0.05 w_A4 0.10 W-L Cúbica W-L Cuadrática P Local Lineal Spline 4 5 6 7 8 ln(G) Fuente: Elaboración propia De este análisis surge la necesidad de utilizar los test estadísticos y la inspección gráfica de forma complementaria a los fines de decidir qué forma funcional se seleccionará para una CE, si el interés está en trabajar con modelos paramétricos. 5.7 Síntesis y Conclusiones Este capítulo estuvo destinado a evaluar los resultados empíricos de las CE no paramétricas de los alimentos seleccionados considerando criterios estadísticos y económicos. Las CE estimadas por los diferentes métodos tienden a diferenciarse en los niveles extremos del gasto total, lo que en gran parte se deriva de los distintos suavizados óptimos que proponen dichos métodos. De la evaluación estadística, se concluye que el estimador N-W es superado por cualquiera de los otros estimadores alternativos. Sin embargo, es uno de los estimadores más utilizados en la literatura econométrica aplicada. Los suavizados por medio de splines muestran tener un muy buen desempeño respecto a los errores de estimación y 117 predicción. Así también los polinomios locales lineales en unos casos, y los cuadráticos en otros, constituyen una buena elección al momento de considerar la estimación de CE. Si bien no hay una perfecta coincidencia respecto al ranking que implícitamente proponen las diferentes medidas de performance de los estimadores, en algunos casos mostraron resultados muy consistentes. Las mayores coincidencias se encuentran entre el Cp y el AICc, quienes, al corregir por los grados de libertad, resultan ser más confiables para la medición de los errores, lo que es confirmado mediante el ejercicio simple de simulación del Anexo 1. Respecto a la estimación de las elasticidades, las que surgen del suavizado spline muestran un comportamiento más consistente con lo esperado en términos económicos, principalmente en los niveles extremos de ingreso donde muchas veces recae el interés del análisis económico. Sin embargo, al computar los promedios, se encuentran muy pocas diferencias, y todos los estimadores terminan arrojando un valor de elasticidad-gasto similar. Por último, en los test de especificación se examinó cuales serían las formas funcionales más adecuadas para una representación paramétrica de la CE frente al ajuste no paramétrico. Para el caso general de alimentos y bebidas (A), ninguna de las tres especificaciones parece representar adecuadamente la forma funcional propuesta por los suavizados no paramétricos. Sin embargo se observó que gráficamente el ajuste cúbico da una aproximación aceptable de la CE no paramétrica. Para los subconjuntos de alimentos específicos se encontró que la especificación cúbica no se rechaza según las pruebas de hipótesis propuestas, confirmado, en general, mediante la inspección gráfica. La excepción es el consumo de carne (A2) donde una especificación lineal o cuadrática parece ajustarse mejor al suavizado no paramétrico, y representar de mejor manera el comportamiento del consumidor de tales bienes. También, para las verduras, legumbres y frutas (A4), la cuadrática puede ser preferida a la cúbica, principalmente en la representación de los hogares con mayores niveles de gasto total. Estas elecciones de ajustes paramétricos son las que se seleccionarán en los próximos capítulos cuando se requiera trabajar con especificaciones paramétricas. 118 Capítulo 6 Efectos de las Características de los Hogares 6.1 Introducción En el presente capítulo se extiende el análisis de las curvas de Engel (CE) no paramétricas correspondientes al consumo de alimentos, incorporando la heterogeneidad de los hogares representada a través de sus características sociodemográficas. Dada la evaluación de los métodos de estimación no paramétrica realizados en el capítulo anterior, en el presente se seleccionará el o los métodos que arrojaron los resultados más satisfactorios, aplicados a tipologías diferenciadas de los hogares. Específicamente, del capítulo anterior se pudo ver que los suavizados por medio de splines tienen la mejor performance estadística como así también en la interpretación económica. De los estimadores basados en núcleos, los polinomios locales superan al N-W. Por lo tanto en el presente capítulo se comenzará trabajando con estos dos estimadores: lo polinomios locales lineales y los suavizados spline. La metodología de análisis está presentada en la sección 3.6 del capítulo 3. La misma propone, en primer lugar, la comparación de las CE condicionadas a las características de los hogares, i.e. Z i f = z f , donde Z i f es un vector que representa las características del hogar i. Los cambios posibles de las CE se pueden reflejar en un simple desplazamiento, en un cambio de forma, en variaciones de la derivada y de la elasticidad-gasto, o en una combinación de cualquiera de dichas posibilidades. A partir de estas curvas se define el ( ) “efecto sustitución de las características” (ESC) entre un par cualquiera z a , z b , siguiendo a Delgado y Miles (1997). El ESC muestra la forma en que se sustituye el consumo de un alimento cuando cambia la característica del hogar, para un nivel dado de ingresos. A su vez, muestra si tal efecto sustitución va variando entre los diferentes niveles del poder 119 adquisitivo de los hogares. La forma en que esto ocurre, permite al investigador repensar cómo se puede incluir cierta característica del hogar en un modelo paramétrico, donde la interacción entre tal característica y el poder adquisitivo puede ser relevante en el modelo a los fines de una correcta especificación (Fousekis & Lazaridis, 2001). La elección de las características a incorporar en el vector Z i f va a depender de la información contenida en la muestra y del interés del investigador, influido en parte por los resultados encontrados en investigaciones anteriores donde se revela la importancia de incluir determinadas variables de los hogares. En base a esto, las características consideradas son: 1) Tamaño y Composición del hogar. Específicamente se toman los tipos de hogares y la presencia de grupos etarios extremos (menores de 14 y mayores de 65 años). 2) Características del Jefe de Hogar: Género y Edad del mismo29. Las hipótesis establecidas sobre el efecto de cada variable en las CE, en muchos casos dependen del modelo económico que se considere como así también del bien particular estudiado. Para el caso del tamaño del hogar, es bien conocido el “método de Engel” para las comparaciones de bienestar entre diferentes tipos de hogares. Específicamente, se toma a la participación del gasto en alimentos como un indicador de bienestar para comparar hogares de diferentes tamaño y composición, donde una mayor participación presupuestaria de los alimentos indicaría un menor bienestar del hogar. Engel observó que para un nivel dado de gasto total del hogar, un mayor tamaño del mismo (i.e. un aumento de la cantidad de miembros) disminuye el bienestar de los hogares manifestado en un incremento en la participación del gasto en alimentos. Esta afirmación es conocida como la segunda ley de Engel (Vernon, 2004: 20). Considerando el modelo de Barten (1969), para un nivel fijo de ingreso per cápita, la teoría predice que un hogar con mayor cantidad de miembros debería implicar una mayor participación del gasto en alimentos, debido a las economías de escala en el consumo de bienes públicos (como ser la vivienda). Sin embargo, Deaton y Paxson (1998) muestran que los resultados empíricos contradicen el modelo de Barten, lo que ha generado una serie de controversias intelectuales en el esfuerzo de resolver la aparente contradicción (Deaton & Paxson, 2003; 1998; Gan & 29 Otras variables socioeconómicas que resultan de interés son el nivel de instrucción y la categoría ocupacional del Jefe de Hogar. Dado que el presente capítulo se centra más en las características demográficas de los hogares, no se consideran los ESC para tales variables. Sin embargo son incorporadas en el análisis semiparamétrico del capítulo 7. 120 Vernon, 2003; Peralli 2008). Dado que las CE estimadas en este capítulo, están basadas en el (log) del gasto total (y no per cápita), no se podrá testear el modelo de Barten ni las economías de escala en el consumo de alimentos. De todos modos, el efecto ‘tamaño’ de los diferentes tipos de hogares será analizado a la luz de tales modelos y hallazgos empíricos. Adicionalmente a la composición reflejada en los tipos de hogares, se analiza el efecto de la presencia de menores de 14 años y de mayores de 65. La presencia de los mismos puede determinar un cierto patrón de consumo diferenciado, bajo la hipótesis de que tales grupos etarios tienen diferentes preferencias y necesidades alimenticias (Namie, 2008; Nørgaard et al., 2007). Por último se considera el género y la edad del jefe de hogar. Por la definición de jefe de hogar de la encuesta30, es esperable que las características del mismo influyan en los patrones de consumo del hogar (Gong et al., 2000) Lo que resta del presente capítulo se organiza de la siguiente manera: En la próxima sección se analiza el efecto de los tipos de hogares sobre las CE no paramétricas. Luego en la sección 6.3 se analizan las diferencias existentes en hogares con o sin miembros de grupos etarios extremos. Posteriormente se analizan las CE y el efecto sustitución de las características del jefe/a de hogar. Se culmina en la sección 6.5 con la aplicación de modelos paramétricos que incluyen los efectos cruzados sugeridos en los análisis de los ESC, testeando su significatividad estadística. 6.2 Tipos de Hogares La primera característica de los hogares que se analiza es su tipología, esto es, si el hogar es unipersonal (tipo 1), nuclear sin hijos (tipo 2), nuclear con hijos (tipo 3) o extendido (tipo 4). Esta variable categórica representa tanto la estructura del hogar como el tamaño del mismo, lo que determina de alguna manera la forma de organización del hogar en lo que hace a la preparación e ingesta de alimentos (García Arancibia et al., 2012; Restrepo y Maya, 2005; Díaz Méndez y Gómez Benito, 2001). Al analizar el efecto que tiene la 30 Quien toma las decisiones más relevantes o mantiene económicamente al hogar. 121 tipología de los hogares sobre el consumo de alimentos, se debe tener en cuenta que en el mismo coexisten efectos escala y composición, adicionalmente a factores culturales implícitos en determinadas tipologías de hogares (Brown, 2011). En la Figura 6.1 se presentan las diferentes curvas de Engel de Alimentos y Bebidas según el tipo de hogar, utilizando estimadores locales lineales y suavizados splines31, con sus respectivos suavizados óptimos según el criterio GCV. La mayor diferencia en la forma de la CE se da en el caso de los hogares unipersonales respecto al resto. Específicamente, en el rango de hogares de menores ingresos, las CE de hogares unipersonales ya no presentan el tramo positivo, a la vez de que la participación en el gasto total es mayor respecto a la revelada por los otros tipos de hogares, particularmente al observar la estimación local lineal. Por su parte, el suavizado spline muestra que la participación en el gasto total de alimentos es mayor en comparación con los nucleares sin hijos, no así en hogares nucleares con hijos y extendidos. Dado que los hogares unipersonales representan los hogares de menor tamaño, este resultado muestra que en el rango de menores ingresos y para un nivel dado del gasto total, cuando se incrementa el tamaño del hogar disminuye la participación de los alimentos en el gasto total, lo que no es compatible con al aprovechamiento de las economías de escala en el consumo de bienes públicos en el hogar. Sin embargo, para un mismo punto el gasto total, el gasto per cápita en los hogares nucleares es menor respecto a los unipersonales, por lo tanto no resultan comparables para el análisis de las predicciones del modelo de Barten. Por otra parte, se observa que en los hogares unipersonales las necesidades en suplir las deficiencias alimentarias son menores, por lo que un aumento del ingreso de los mismos desplaza la participación de los alimentos en el presupuesto, mientras que en hogares nucleares y extendidos la participación del gasto en alimentos se incrementa hasta alcanzar un punto a partir del cual comienza a descender para incrementos adicionales en el ingreso (gasto) total. 31 Estimadores elegidos en base al análisis de la performance de los mismos en el Capítulo 5. 122 Figura 6.1 Curvas de Engel de Alimentos y Bebidas por Tipos de Hogares Suavizados Spline 0.7 0.7 Polinomios Locales Lineales 0.6 0.3 0.4 w_A 0.5 0.4 0.1 0.1 0.2 0.2 0.3 w_A Unipersonal Nuclear sin hijos Nuclear con hijos Extendido 0.5 0.6 Unipersonal Nuclear sin hijos Nuclear con hijos Extendido 4 5 6 ln(G) 7 8 4 5 6 7 8 ln(G) Nota: Para el estimador local lineal, las ventanas óptimas (GCV) son ht1=0.64, ht2=0.66, ht3=0.6 y ht4=1.2. Para el suavizado spline se tienen los siguientes grados de libertad óptimos: (vt1=4.86; vt2=6.4; vt3=7.3; vt4=5.02). Fuente: Elaboración Propia Para rangos intermedios de ingreso, no se observan importantes cambios de la forma de las CE, aunque sí desplazamientos horizontales. Como es de esperarse, la CE de los hogares unipersonales está por debajo de los nucleares sin hijos, y ésta, por debajo de los hogares nucleares con hijos y extendidos. Esto por un lado es esperable puesto que se refuerzan dos hechos económicos: Por un lado, para un ingreso total dado, existe un ingreso per capita menor debido al incremento del tamaño del hogar, lo que es compatible con un menor bienestar de cada miembro (según el método de Engel) y por lo tanto, del hogar, lo que se refleja en una mayor participación del gasto en alimentos. Por otra parte, existe el efecto de las economías de escala en el consumo de bienes públicos, como ser la vivienda, generando un aumento del consumo de bienes privados, como ser los alimentos. A pesar de que ambas hipótesis resultan plausibles para explicar este fenómeno empírico, resultan ser contradictorias para responder cuestiones de bienestar (Deaton y Paxson, 1998: 903). 123 Figura 6.2 Efecto Sustitución de las Características entre Tipos de Hogares (A) ESC(1,3) PLL Spline -0.10 -0.05 ESC(1,3) 0.00 0.00 PLL Spline -0.05 ESC(1,2) 0.05 0.05 ESC(1,2) 4 5 6 7 8 4 5 6 ln(G) ESC(2,3) 0.00 0.00 PLL Spline -0.06 -0.10 -0.08 ESC(2,3) PLL Spline -0.04 -0.02 -0.14 -0.12 -0.10 -0.08 -0.06 -0.04 -0.02 5 6 7 4 8 5 6 ln(G) ln(G) ESC(2,4) ESC(3,4) 7 8 7 8 0.02 0.00 4 0.00 -0.02 PLL Spline -0.08 -0.10 -0.06 -0.08 -0.06 ESC(3,4) -0.04 -0.02 PLL Spline -0.04 ESC(1,4) 8 ln(G) ESC(1,4) ESC(2,4) 7 4 5 6 7 8 4 5 6 ln(G) ln(G) Fuente: Elaboración Propia 124 En la Figura 6.2 se presentan las gráficas de los ESC entre pares de tipos de hogares. Se puede ver que el efecto sustitución de las características entre los hogares unipersonales y el resto (ESC(1,2), ESC(1,3) y ESC(1,4)) es relativamente constante para niveles intermedios del gasto total (desplazamiento vertical de las CE). Esto significa que, para un nivel dado de gasto total (en el rango intermedio) los hogares unipersonales tienden a disminuir su gasto en alimentos respecto a hogares con mayor cantidad de miembros. Es decir, que al aumentar la cantidad de miembros tomando como punto de partida los hogares unipersonales, existe un proceso de sustitución de otros bienes por alimentos. Este proceso de sustitución desaparece en los rangos de ingreso muy alto o muy bajo. Para el caso del ESC (1,2) y el ESC(1,3), que asumen valores positivos en los extremos, se revela lo contrario. A su vez, para estos dos casos, se observa que aún en el rango intermedio, el efecto sustitución no es constante, sino que la diferencia (i.e. que la sustitución de otros bienes por alimentos en hogares con más miembros) va decreciendo para un mayor poder adquisitivo. Por otra parte, la curva ESC(2,3) muestra que en los hogares nucleares la incorporación de un hijo significa sustituir bienes no alimenticios por un mayor consumo (gasto) en alimentos. Tal sustitución es menor a medida que se incrementa el poder adquisitivo del hogar. En este caso, la interacción entre los tipos de hogar y el gasto total parece ser más relevante. Entre los hogares nucleares sin hijos y los extendidos, también se observa que la participación de los alimentos en el gasto total es menor para los primeros. Aquí no hay una tendencia clara del ESC ante cambios en el poder adquisitivo, aunque sí se observa que en los extremos se acentúa la diferencia entre ambos tipos de hogares. Por último, entre los hogares nucleares con hijos y los extendidos, la curva ESC oscila en el eje horizontal (ESC(3,4)=0), con un fuerte descenso en el extremo superior, mostrando que los hogares extendidos tienden a incrementar el consumo de alimento y disminuir el de otros bienes, respecto a los hogares nucleares. Esto puede deberse a que en los hogares extendidos es esperable una mayor cantidad de miembros, y por ende un menor ingreso per capita. Sin embargo no resulta fácil de dilucidar porque esto se da para los mayores niveles de gasto total del hogar. Una hipótesis plausible es que el tamaño de los hogares 125 nucleares con hijos con alto poder adquisitivo es relativamente muy pequeño respecto a los hogares extendidos, donde el ingreso total del hogar puede que venga de varios perceptores, que a su vez tienen más personas a cargo (p.ej. un hermano del jefe de hogar con sus descendientes). Para contar con una medida global de las diferencias existentes entre los tipos de hogares, se computa el efecto sustitución de las características promedio (ver Capítulo 3), presentando su valor en la Tabla 6.1 y sus desvíos estándares bootstrap. Adicionalmente se calcula el efecto (o diferencias) promedio de los tipos de hogares en términos porcentuales, con el fin de mostrar la variación proporcional de cambio en la CE ante un cambio en el tipo de hogar. En términos absolutos y relativos (procentuales) los mayores efectos se dan entre los hogares unipersonales y los nucleares con hijos y extendidos, donde la participación de alimentos en el gasto total en los hogares unipersonales es en promedio un 26% inferior. Tabla 6.1 Efectos/Diferencias Promedios de los tipos de hogares ( i, j ) i,j=1,2,3,4; i<j (1,2) PLL Spline (1,3) PLL Spline (1,4) PLL Spline (2,3) PLL Spline (2,4) PLL Spline (3,4) PLL Spline ESCP DE boots ESCP (Δ%) -0.0642 -0.0649 0.0074 0.0074 -15.55 -15.71 -0.1109 -0.1116 0.0062 0.0061 -26.45 -26.61 -0.1119 -0.1117 0.0072 0.0070 -25.86 -25.89 -0.0467 -0.0467 0.0052 0.0051 -11.14 -11.13 -0.0477 -0.0467 0.0065 0.0062 -11.02 -10.84 -0.0010 -0.0001 0.0054 0.0054 -0.22 -0.02 Fuente: Elaboración Propia 126 Entre los hogares unipersonales y los nucleares sin hijos, la diferencia es menor al caso anterior, aunque también resulta relevante. Luego, entre los nucleares sin hijos y los con hijos o extendidos, la diferencia se apacigua, aunque superando el 10%. Por su parte, entre los hogares nucleares con hijos y los extendidos la diferencia promedio se aproxima a cero. En general, los errores estándar bootstrap del ESCP son pequeños, y si con ellos se construyen intervalos de confianza asintóticos aproximados32, solo el ESCP(3,4) muestra ser no significativo. Si bien se optó por mostrar los resultados correspondientes a los dos estimadores no paramétricos seleccionados, se observa que, tanto en las curvas ESC como en los valores promedios de la Tabla 6.1, las diferencias entre ambos son mínimas. Dado que el suavizado spline tiene un mejor comportamiento en los extremos, en lo que sigue se optará utilizar los resultados de este estimador, salvo en algunos casos donde se presentan los resultados de ambos para corroborar que no existen diferencias importantes entre dichos estimadores, en lo que hace a la interpretación el efecto de las características de los hogares. Es esperable que al considerar determinados alimentos específicos, el efecto de la tipología del hogar sobre la asignación del gasto total, tenga sus particularidades más allá de lo que ocurre al tomar el conjunto de alimentos y bebidas. En la figura 6.3 se presentan los ESC entre pares de tipos de hogares, estimados usando suavizados spline, para los cuatro sub-conjuntos de alimentos considerados: productos de panadería, harinas, arroz, cereales y pastas (A1), carnes (A2), leche y productos lácteos (A3) y verduras, frutas y legumbres (A4). Partiendo de los hogares unipersonales, se puede observar que, para los niveles de gasto total más bajo, este tipo de hogar tiende a asignar un mayor gasto de consumo en productos lácteos, frutas, legumbres y verduras, y menor en arroz, pastas, productos de panadería y carne, respecto a los hogares nucleares y extendidos. Este resultado es relevante para la toma de decisiones de políticas públicas relacionadas con la alimentación, pues se observa que un mayor tamaño del hogar implica un menor gasto en 32 Como ser ESCP ± z α / 2 EE boot (ESCP ) o bien utilizando la corrección de Bonferroni ESCP ± zα /(2n) EEboot (ESCP) , o utilizando los valores de la distribución t-Student, en lugar de la normal estándar. 127 frutas, verduras y lácteos (A3 + A4) y más en carnes, arroz y productos basados en harinas (A1 + A2), lo que puede deberse a que estos últimos son más baratos y permiten saciar el hambre más rápidamente, adicionalmente a los factores asociados a la cultura culinaria argentina. No obstante, a partir de los niveles de ingreso medios, los hogares nucleares y extendidos consumen una mayor proporción de su gasto en los cuatro tipos de alimentos (A1-A4) que los hogares unipersonales. Dado que para un aumento del gasto total del hogar, el gasto per cápita de los unipersonales aumenta más que en los otros tipos de hogares, la sustitución de alimentos por otros tipos de bienes, se realiza más rápidamente en los primeros. La brecha se apacigua a medida que crece el poder adquisitivo del hogar, mostrando que la menor diferencia se da para los alimentos A3 y A4, lo que permite pensar que el consumo por miembro de frutas, verduras y lácteos es mayor en los hogares unipersonales en comparación al resto. De la comparación entre los hogares tipo 2 y 3 en los menores tramos de ingreso, se observa que para los alimentos A4 el efecto escala es similar al análisis anterior, i.e. el aumento en el tamaño del hogar implica un desplazamiento del presupuesto en frutas, verduras y legumbres a otro tipo de bienes. No ocurre lo mismo para el caso de leche y productos lácteos, donde al pasar de un hogar nuclear sin hijos a un hogar nuclear con hijos, además de haber un efecto escala existe un efecto composición. Considerando que el consumo de leche y productos lácteos es en general recomendado para los niños más pequeños, con la existencia de los mismos en el hogar (entre los hijos), es esperable un mayor consumo de tales productos. El efecto de los menores será visto con más detalle en la próxima sección. Adicionalmente en los hogares de menores recursos, se observa una brecha importante en el consumo de arroz, pasta, cereales y productos de panadería, siendo mayor en los nucleares con hijos. A medida que crece el poder adquisitivo, las diferencia entre ambos tipos de hogares son menores, observándose que un hijo implica sustituir o posponer el consumo de otros bienes a favor de los alimentos. Entre los hogares nucleares sin hijos, y los extendidos, las conclusiones son muy similares a las anteriores. Esto es compatible con las pocas diferencias que se observan entre los nucleares con hijos y los extendidos. 128 Figura 6.3 Efecto Sustitución de las Características. Alimentos Particulares (A1-A4) ESC(1,2) ESC(1,3) 0.05 0.05 A4 A3 A4 0.00 ESC(1,3) -0.05 -0.05 ESC(1,2) 0.00 A3 A2 A2 A1 A1 5 6 7 8 5 6 ln(G) 7 ln(G) ESC(2,3) 0.05 ESC(1,4) 0.05 8 A3 A3 A4 0.00 A2 -0.05 ESC(2,3) 0.00 -0.05 ESC(1,4) A4 A2 A1 5 A1 6 7 4.5 8 5.0 5.5 6.0 7.5 8.0 ESC(3,4) 0.05 0.05 ESC(2,4) A3 A2 0.00 A4 A1 -0.05 ESC(3,4) 0.00 A3 -0.05 ESC(2,4) 7.0 ln(G) ln(G) A4 6.5 A2 A1 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 ln(G) ln(G) Fuente: Elaboración Propia 129 Para los sub-conjuntos de alimentos específicos se tiene que ESC muestra una relación más clara con el logaritmo del gasto total. Particularmente, al comparar los unipersonales con el resto, más variaciones se observan en la curva ESC, más allá de los sobresaltos que el estimador pueda tener en el extremo inferior de ingresos. Esto sugiere que en una especificación paramétrica, si se incorporan los tipos de hogares por medio de variables dummies, tomando al hogar unipersonal como hogar base, una especificación correcta podría requerir la incorporación de las mismas más el efecto interacción con el gasto total. Esto se chequeará al final del capítulo. 6.3 Presencia de Menores y Adultos Mayores Una característica comúnmente muy relevante en los estudios de consumo y demanda del hogar, es la presencia de niños en el mismo, lo cual puede tener un influencia crucial en la elección del consumo de alimentos y bebidas en el hogar (García Arancibia, R., 2012; Namie, 2008; Nørgaard et al., 2007, entre otros). De la información disponible en la encuesta, se tiene una variable que cuenta la cantidad de menores de 14 años en cada hogar. Con la misma se construye una variable dicotómica que indica la presencia o ausencia de menores en el hogar, y si estiman las CE m f (x ) , con f =0,1, donde 0 indica la ausencia de menores y 1 la presencia de al menos un menor de 14 años. A su vez, esta variable categórica se define para los tipos de hogar 3 y 4 (nucleares con hijos y extendidos), puesto que en los tipos 1 y 2 no hay menores. De esta manera, se analiza el efecto de menores en hogares donde es probable la presencia de ellos. Del total de 5438 hogares (válidos) en la muestra de tipo 3 y 4, 2050 son hogares sin menores, mientras que en 3338 hay al menos un menor de 14 años. En la figura 6.4 se presentan las gráficas de las estimaciones de las CE y del ESC en el consumo de alimentos. Se observa que para un nivel dado del gasto total, la presencia de al menos un menor de 14 años genera un incremento en el gasto en alimentos y una disminución en el consumo de otros bienes. Si bien aquí puede existir un efecto escala, no se revela claramente, pues en la comparación de hogares con y sin menores existe la posibilidad de que los mismos tengan igual cantidad de miembros. Si este fuera el caso, los resultados empíricos contradicen el modelo de Barten, puesto que la sustitución de 130 menores por adultos disminuiría el tamaño efectivo del hogar, lo que implicaría un incremento en los ingresos per cápita y con ello una reducción en el presupuesto de los bienes necesarios (Deaton y Paxson, 1998: 902). Sin embargo, este resultado podría mostrar que, principalmente para los hogares de menores recursos, los requerimientos alimenticios en lo que hace a la calidad de los mismos, podrían ser mayores, lo que significaría un mayor costo en la compra, y por ende, un mayor destino del presupuesto en alimentos. Figura 6.4 Efectos de la presencia de Menores en el Hogar en el Consumo de Alimentos y Bebidas (A) ESC 4 5 6 ln(G) 7 8 0.10 0.08 0.06 0.04 0.02 0.00 0.4 0.1 0.2 0.3 w_A 0.5 0.6 Hogares sin menores de 14 Hogares con menores de 14 ESC(Hogar con Menores - Hogar sin Menores) 0.7 CE 4 5 6 7 8 ln(G) Nota: vs/menores=6.26; vc/menores=9.4 (g.l. de los estimadores). Fuente: Elaboración Propia En las gráficas anteriores se observa claramente que el ESC de la presencia de menores, lejos de ser independiente del nivel de gasto total, muestra una clara relación negativa. Para los hogares de mayores ingresos, la presencia de un menor no altera los patrones de asignación del gasto en alimentos. El ESC promedio (ESCP) es de 0.033, lo que equivale a un aumento promedio del 8.25% en la participación del gasto de alimentos ante la incorporación de un menor en el hogar. La mayor diferencia se presenta para los hogares de menores recursos, siendo aproximadamente del 15% (0.1/0.65). Por lo tanto, si bien la presencia de los menores en el hogar modifica la asignación del gasto, se observan mayores efectos en los cambios de los tipos de hogares (Tabla 6.1). Pero por otra parte, en 131 este caso se tiene una clara interacción entre el poder adquisitivo y la presencia de menores, no así para los diferentes tipos de hogares33. En el consumo de los alimentos específicos A1-A4 (Figura 6.5), el efecto de la presencia de menores y su comportamiento para diferentes niveles del gasto total, es menor al encontrado en el total de alimentos. Las mayores diferencias se encuentran en los productos de panadería, arroz y pastas (A1) y en los productos lácteos (A3). Para ambos se observa que la presencia de un menor implica un aumento en el gasto de ambos productos, sustituyéndolos por otros tipos. Para mayores niveles de ingreso, las diferencias van decreciendo. Para las legumbres, frutas y verduras (A4) y las carnes (A2), el ESC muestra un comportamiento más errático alrededor de cero. Sin embargo, en hogares de menores ingresos, se observa que la presencia de un menor incrementa el gasto en dichos bienes, para un nivel dado de gasto total. 0.06 0.04 A1 0.00 0.02 A3 A2 -0.02 ESC(Hogar con Menores - Hogar sin Menores) Figura 6.5 Efectos Sustitución de las Características. Presencia de Menores en el Hogar. Subconjuntos de Alimentos A1-A4 5 6 A4 7 8 ln(G) Fuente: Elaboración Propia 33 Esto ocurre cuando se está analizando el caso del total de alimentos y bebidas (A) puesto que para los subconjuntos específicos (A1-A4) se notó que algunas interacciones del ESC con el gasto total que podrían ser relevantes. 132 Otra característica del hogar, que hace a la composición del mismo y que influye en los patrones de consumo del hogar es la presencia de adultos mayores. Algunos trabajos muestran que en general el envejecimiento se relaciona con una alimentación más saludable (Lefèbvre, 2006), aunque en lo individual tal resultado depende de la posición socioeconómica del adulto mayor y/o de su familia (Wiemer, 1998; Jensen, 2004; Rodríguez Escobar, 2005). A su vez, algunos estudios han mostrado que en aquellos hogares con personas de mayor edad, se consumen más alimentos elaborados en el hogar que fuera del mismo, justificado por la sustitución de las horas laborales en horas de trabajo doméstico (Wang et al, 1995). Sin embargo, en ciertos sectores de la sociedad, una pareja de adultos mayores puede tener mayor estabilidad económica que una joven, y por lo tanto una mayor participación en el consumo los alimentos fuera del hogar (Yen et al., 2012). Esto, a su vez, depende de las circunstancias en las cuales se consume, sea en horas esparcimiento o de trabajo o estudio (García Arancibia, 2012). Dada la información de la ENGH, se toma la variable que mide la cantidad de personas mayores a 65 años, construyendo una variable dicotómica para indicar la presencia o ausencia de los mismos en el hogar. La figura 4.5 presenta las CE y el ESC, donde se aprecia un claro cambio en el signo del efecto sustitución del adulto mayor. Figura 6.6 Efectos de la Presencia de los Adultos Mayores en el Hogar en el Consumo de Alimentos y Bebidas (A) ESC 4 5 6 ln(G) 7 8 0.06 0.04 0.02 0.00 -0.02 -0.04 0.4 0.3 0.2 0.1 w_A 0.5 0.6 Hogares sin mayores de 65 Hogares con mayores de 65 ESC(Hogar con Adultos Mayores - Hogar sin Altos Mayores) 0.7 CE 5 6 7 8 ln(G) Nota: vsin mayores=7.06; vcon mayores=5.4 (g.l. de los estimadores). Fuente: Elaboración Propia 133 En los hogares con menor poder adquisitivo, la presencia de un adulto mayor se corresponde con un menor destino del presupuesto en el gasto de alimentos, mientras que en los hogares de mayor ingreso, para un gasto total dado, los alimentos tienen una mayor participación del mismo. Esto significa, ceteris paribus, una menor cantidad y/o calidad de los alimentos en los hogares pobres con adulto/s mayor/es, por lo que se corresponde con los resultados hallados en investigaciones que apuntan a dilucidar las problemáticas alimentarias de los adultos mayores que viven en condiciones de pobreza. Sin embargo, para sacar conclusiones más robustas habría que desglosar el efecto cruzando con otras variables, como ser el tipo de hogar, para tener en cuenta el efecto tamaño y la estructura familiar del mismo. Sin embargo, las diferencias máximas son del orden del 0.05, lo que equivale a 9% en los hogares más pobres y a un 14% en los de mayores ingresos, por lo que no parece ser tan fuerte el impacto del adulto mayor. Por su parte, el ESCP es de -0.009 (con DE boot=0.0074), por lo que difícilmente resulte estadísticamente significativo. La figura 6.7 muestra el efecto sustitución de los adultos mayores en el consumo de los alimentos específicos A1-A4. De la misma se puede observar que los hogares con al menos un adulto mayor tienden a incrementar su consumo en legumbres, frutas y verduras y a disminuir las compras de carne, productos de panadería, harinas, pastas y arroz. Para el caso de la leche y los productos lácteos (A4), se observa que para niveles muy bajos de gasto total, los hogares con adultos mayores tienden a incrementar el consumo de los mismos. Sin embargo, para niveles mayores del gasto total el ESC para tales productos va fluctuando alrededor del eje cero. De la gráfica también puede verse que la interacción con el gasto total es más pronunciada para los alimentos A1 y A2, mostrando un cambio del signo del ESC para los niveles mayores del gasto total, lo que indicaría que, en dicho rango de ingresos, los hogares con adultos mayores destinan una mayor parte de su presupuesto en los bienes que componen las canastas A1 y A2. Dicho cambio del efecto de la característica, podría deberse a la posibilidad de adquirir productos de mayor calidad, y con ello, probablemente más saludables. Tal consideración se puede hacer debido a la amplitud de calidades que pueden existir en los conjuntos de alimentos considerados, particularmente dentro de la categoría de carnes (A2). A su vez, en general, para los hogares de mayores ingresos, la presencia de al menos un adulto mayor incrementa el 134 gasto en los cuatro tipo de alimentos. Esto es consistente para un hogar donde, gran parte de las necesidades están cubiertas y existe tiempo disponible para el disfrute del placer culinario, sea dentro o fuera del hogar, lo que se daría en el caso de que el o los adultos mayores tengan un rol activo (o principal) en el hogar. 0.04 0.02 A3 0.00 A4 -0.02 A1 A2 -0.04 ESC(Hogar con Ad. May. - Hogar sin Ad. May.) Figura 6.7 Efectos Sustitución de las Características. Presencia de Adultos Mayores en el Hogar. Subconjuntos de Alimentos A1-A4 5 6 7 8 ln(G) Fuente: Elaboración Propia 6.4 Características del Jefe de Hogar Bajo el supuesto de que el jefe o jefa del hogar es quien toma las decisiones más relevante en el hogar, y en particular en lo que hace al destino del ingreso en las diferentes partidas del consumo, es de esperarse que sus características influyan en los patrones de consumo de alimentos y otros bienes. En particular, el género y la edad del jefe de hogar han mostrado tener influencia estadísticamente significativa en los estudios empíricos de demanda ( Rossini et al., 2008; García Arancibia, 2012 entre otros). Por ello se eligen estas dos características para analizar sus efectos sobre las curvas de Engel y los patrones de consumo de alimentos. 135 6.4.1 Género En cuanto al género, las diferencias en los patrones de consumo están fundadas en el uso 34 del tiempo y la división del trabajo doméstico . En general, la sociedad ha aceptado a la producción y el empleo como un espacio masculino, mientras que las cargas domésticas y actividades familiares, incluyendo “el consumo” han formado parte del ámbito femenino (Depetris Guiguet y García Arancibia, 2011; Borrás Catalá, 2007). Por ello, el género del jefe de hogar poco puede decirnos sobre los patrones de consumo en aquellos hogares nucleares, puesto que si el jefe varón es considerado como tal por su aporte con sus ingresos laborales, es probable que las decisiones de consumo las realice su cónyuge dentro del ámbito de las tareas domésticas. Herrero Zamora (2010) muestra que para el caso de las Encuestas Permanentes de Hogares (EPH) del INDEC, el reconocimiento de Jefa de hogar está muy condicionado a la participación de la mujer en el mercado laboral y al (mayor) aporte económico que realiza al hogar. Adicionalmente muestra que con la presencia de un adulto varón en el hogar es poco probable que haya jefatura femenina. A su vez, García Arancibia y otros (2011) muestran que para el caso de las Encuestas de Gastos de Hogares (ENGH), en hogares nucleares con cónyugue es poco probable que las mujeres sean reconocidas como jefas. En los hogares unipersonales, claro está, la jefatura determina quien realiza las decisiones de consumo del hogar. A su vez, en hogares nucleares con hijos pero sin cónyuge, predominan aquéllos con jefatura femenina. Por lo tanto, resulta plausible suponer que cuando la jefatura del hogar está presidida por una mujer, las decisiones de consumo son realizadas por la misma, mientras que si el jefe es varón, más allá de quien tome efectivamente las decisiones de alimentación, existe un ‘sesgo de masculinidad’. En la muestra, del total de hogares, en el 75% de los hogares (nh=5662), los jefes son hombres, mientas que en el 25% restante (nm=1930) son mujeres. En la figura 6.8 se presentan los suavizados spline de las CE diferenciadas por el género del jefe/a de hogar y la curva correspondiente del ESC. Se observa que las mayores diferencias se presentan en los hogares de menores recursos. Luego en el rango de ingresos medios, se observa una diferencia similar a un desplazamiento paralelo, Para lectura comprensiva sobre la diferencias de género y al distribución del trabajo doméstico ver Treas y Drobnic (2010) 34 136 cerrándose la brecha cuando se alcanzan los mayores niveles de gasto total. En general, para un nivel fijo de gasto total, un hogar con jefe varón destina una mayor parte de su presupuesto al consumo de alimentos. Esto puede deberse a que, como se señalo anteriormente, entre los hogares con jefatura femenina predominan los unipersonales y aquellos nucleares con hijos con madres solteras, viudas o separadas. Por lo tanto, puede que en los hogares con jefatura femenina, para un mismo nivel de ingreso total, el ingreso por miembro sea mayor, y con ello una CE desplazada hacia a la izquierda. Figura 6.8 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos. Estimador Spline ESC 0.7 CE 0.05 ESC(H,M) 0.4 0.1 0.00 0.2 0.3 w_A 0.5 0.10 0.6 JMujer JHombre 4 5 6 7 ln(G) 8 4 5 6 7 8 ln(G) Nota: vmujer=5.66; vhombre=5.8 . Fuente: Elaboración Propia En los hogares de menor poder adquisitivo, además de encontrar la mayor diferencia ‘vertical’, se observa un cambio en la forma de la CE. Mientras que en los hogares con jefatura masculina, la CE tiene pendiente negativa (aunque muy leve), en hogares con jefatura femenina la CE es creciente respecto al gasto total, característica que fue encontrada en las estimaciones de las CE para el caso general. De acuerdo a las hipótesis anteriormente establecidas, en los hogares pobres con jefa mujer, existe una tendencia a incrementar la participación de los alimentos en el presupuesto, ante incrementos adicionales del ingreso, sea por aumento en la cantidad o calidad de los productos 137 alimenticios. Para el caso de los hogares con jefe varón es probable que esto también ocurra, aunque en menor medida, puesto que la CE es casi plana. Por otra parte, si se compara con el estimador local lineal (Figura 6.9), se observa que independientemente del género del jefe de hogar, existe una CE con pendiente positiva en los hogares con menor gasto total. Más allá de esta distinción, ambos estimadores muestran una CE y una ESC muy similares. Figura 6.9 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos. Estimador Local Lineal ESC 0.7 CE 0.05 ESC(H,M) 0.4 0.1 0.00 0.2 0.3 w_A 0.5 0.10 0.6 JMujer JHombre 4 5 6 7 ln(G) 8 4 5 6 7 8 ln(G) Nota: vmujer=5.94; vhombre=5.79 . Fuente: Elaboración Propia Si bien el ESC es decreciente respecto al gasto total, se observa que en el rango medio de ingresos se mantiene relativamente constante, dando una pauta de que el efecto interacción de la característica con el gasto total no termina siendo demasiado relevante. Para los conjuntos de bienes A1-A4, las curvas ESC del género del jefe/a de hogar se presentan en la figura 6.10, estimados por medio de suavizados spline. De la misma se observa que cuando el jefe de hogar es hombre se tiende a aumentar el consumo de carnes y productos de panadería, harina, arroz y pastas, respecto a los hogares con jefa mujer. A su vez, nuevamente se detectan las mayores diferencias en el extremo inferior del gasto total. En dicho intervalo se observa que los hogares con jefatura femenina tienden a 138 sustituir el consumo de carnes y harinas por legumbres, frutas, verduras y lácteos. Esto resulta razonable dado que en promedio la mujer tiende a cuidarse mejor en la alimentación ya sea por cuestiones estéticas, de salud o culturales, lo que en definitiva son explicadas por diferencias de género (entendido como una construcción social). 0.06 0.04 A2 0.02 A1 0.00 ESC(H,M) 0.08 Figura 6.10 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos A1-A4 -0.04 -0.02 A4 A3 5 6 7 8 ln(G) Fuente: Elaboración Propia 6.4.2 Edad La edad del jefe de hogar es otra característica que generalmente afecta los patrones de consumo, y en general, un argumento sencillo para explicar las diferencias reveladas, viene dado porque entre generaciones suelen expresarse divergencias en gustos y preferencias. En la base de datos de la ENGH, se tiene que la variable edad del jefe es continua, pero para el análisis presente es necesario categorizarla, y en particular es deseable la creación de una variable binaria para simplificar el análisis. Por lo tanto, hay que elegir algún criterio para realizar el corte en la muestra, y así estimar las CE de las sub-muestras y con ello el ESC. En general, se busca captar un cambio de generación o bien un salto de la 139 diferente situación socioeconómica del jefe o jefa. Considerando el ingreso total del hogar, la estimación de la relación entre la edad del jefe y el ingreso, muestra que el mismo crece hasta que la edad del jefe alcanza aproximadamente los 45 años, y a partir de allí, el ingreso total del hogar comienza a decrecer. En base a esto, dividimos la muestra entre aquellos hogares cuya edad del jefe/a es menor a 45 años (n-45=3186) y por otro lado los hogares con jefes/as mayores de 45 (n+45=4106), incluyendo en este último grupo a aquellos que tienen exactamente 45 años de edad. 800 400 600 Ingreso 1000 1200 Figura 6.11 Relación entre la Edad del Jefe de Hogar e Ingresos Totales (Suavizado Spline) 20 40 60 80 Edad Fuente: Elaboración Propia Las curvas de Engel y el ESC (Figura 6.12) muestran que para niveles inferiores al gasto total medio, los hogares ‘jóvenes’ destinan mayor parte de su presupuesto en alimentos que los hogares cuyo jefe/a tiene más de 45 años. Esto se revierte en los hogares con mayor poder adquisitivo, donde al incrementarse la edad del jefe de hogar hay una sustitución a favor del consumo de alimentos. Para los niveles mayores de gasto total, es probable que en los hogares con jefe más joven existan ciertos bienes aún no adquiridos (a contraposición de hogares con jefes/as de mayor edad) por lo que se elige sustituir el consumo de alimentos a favor de otros tipos de bienes (como ser, en equipamiento del hogar, vivienda u otros bienes durables). 140 Dado que en los hogares con jefes más jóvenes es más probable que los hijos tengan menos de 14 años (considerando los hogares nucleares con hijos y los extendidos), este resultado se corresponde con el hallado anteriormente sobre el efecto de la presencia de menores. Del mismo modo, el efecto es muy similar al de la presencia de adultos mayores, por lo que algunas conclusiones son similares. Figura 6.12 Efectos de la Edad del Jefe/a de Hogar en el Consumo de Alimentos ESC 0.04 0.7 CE 0.1 0.00 -0.08 0.2 -0.06 -0.04 -0.02 ESC(+45,-45) 0.4 0.3 w_A 0.5 0.02 0.6 j_edad< 45 jedad>=45 4 5 6 ln(G) 7 8 5 6 7 8 ln(G) Nota: v jedad< 45 = 7; v jedad>= 45 = 6.37 . Fuente: Elaboración Propia La figura 6.13 muestra que en los hogares que tienen un menor gasto total, los hogares con jefes/as mayores de 45 años tienden a disminuir el consumo de productos basados en harinas, cereales y arroz (A1), en carnes (A3) y en lácteos (A3), y a incrementar el consumo de legumbres, frutas y verduras (A4). En general para todo nivel de ingreso (gasto total), la mayor edad del jefe tiene un efecto positivo sobre el consumo de alimentos del conjunto A4. Por el contrario, en el consumo de carnes (A3) el signo del ESC pasa de ser negativo a positivo a partir del gasto total medio, mostrando que un efecto positivo entre la edad del jefe y la participación presupuestaria del gasto en todo tipo carnes. En el mismo intervalo de ingresos/gastos, se observa que no existen diferencias en la asignación del gasto en A3 y A1 entre los tipos de hogares definidos por la edad del jefe/a. 141 El efecto interacción con el gasto total es más relevante para los alimentos A1 y A2. Para los lácteos se observa una pequeña diferencia de pasar de los hogares más pobres a los de ingresos medios, a partir del cual se estabiliza. Para las verduras, legumbres y frutas, prácticamente no se observa interacción con el gasto total, a pesar de la diferencia revelada en el extremo inferior. 0.04 Figura 6.13 Efectos del Edad del Jefe/a de Hogar en el Consumo de Alimentos A1-A4 A3 0.00 -0.02 ESC(+45,-45) 0.02 A4 -0.04 A1 A2 5 6 7 8 ln(G) Fuente: Elaboración Propia 6.5 Incorporación de las Interacciones Del análisis no paramétrico surgieron algunos aspectos para ser tenidos en cuenta en las especificaciones paramétricas, a partir de los cambios de las CE antes las diferentes características, y con ello, del comportamiento de las curvas ESC. En algunos casos, los cambios en las características sugieren un simple desplazamiento de la CE, por lo que tal efecto puede agregarse mediante la incorporación de una variable dummy de la característica, en forma aditiva. Esto significa que el ESC es constante e independiente del gasto total. Sin embargo, en otros casos se observaron cambios en la forma de las CE, planteando la posibilidad de la incorporación del efecto interacción con el poder 142 adquisitivo del hogar (medido a través del gasto total). En general, en los estudios econométricos de consumo y demanda, tales interacciones no son incluidas debido a que complican la interpretación de los resultados, a la vez de que no existen requerimientos teóricos que impongan las mismas. Sin embargo, la omisión de las mismas trae aparejado una especificación incorrecta (Fousekis y Lazaridis, 2001). El objetivo de este apartado es analizar la incorporación de los efectos interacción, a partir del estudio de la derivada promedio del ESC ( d ESC ), acompañado de la inspección visual de las gráficas anteriores y estudiando su significancia en especificaciones paramétricas. En el capítulo metodológico (Capítulo 3, pág. 62) se presentó la forma de computar la derivada promedio de las funciones ESC. La misma viene dada por d ESC (a, b ) ≡ ∫ dESC a ,b ( x ) pˆ ( x )dx dx (6.1) Donde p̂(x ) es una estimación de la densidad del logaritmo del gasto total. La forma (6.1) es estimada para una determinada grilla fija del gasto total, de la misma forma que se estiman las funciones ESC. Una vez computada la d ESC entre dos características, se desea saber si la misma es significativa o no. Es decir que, en términos gráficos, se desea conocer si la curva ESC es casi plana (lo que se corresponde con un simple desplazamiento de la CE) o muestra una pendiente significativa, indicando con ello la interacción con el gasto total. Por ello, se estiman los errores estándar bootstrap (usando, como siempre, la técnica wild bootstrap) y se construyen intervalos de confianza simples, de la forma [dˆ ESC − sboot z1−α / 2 , dˆ ESC + sboot z1−α / 2 ] (MacKinnon, 2006: S11), a los efectos de verificar si el valor cero (de ‘pendiente’) está o no incluido en los mismos. Adicionalmente al estudio de la derivada de las curvas ESC, los efectos interacción son incluidos en una simple especificación paramétrica, testeando su significatividad estadística. La especificación paramétrica general que adoptan las CE, considerando sólo las características demográficas de los hogares y sus interacciones, puede escribirse de la siguiente manera wi = θ o + ∑ γ j z ij + ∑ θ k (ln Gi ) + ∑ δ j z ij ln Gi + ξ ij k j k >0 (6.2) k 143 Donde w i es la participación en el gasto total del hogar i que tiene el bien en cuestión (los alimentos o un conjunto de estos) y hogar i. Los parámetros γ j z ij representa la característica demográfica j del y δ j corresponden a los efectos directos de las características y de sus interacciones con el gasto total, respectivamente. La especificación paramétrica elegida depende el exponente k (en relación al logaritmo del gasto total). En el capítulo anterior se vio que en algunos casos, la mejor opción es k=3, mientras que en otros un k=2, e incluso, para el caso de los alimentos A2, un k=1 puede proporcionar un buen ajuste. En las secciones anteriores del presente capítulo, para la estimación de las CE y de los ESC correspondientes, algunas características se categorizaron. La cantidad de miembros menores y mayores de 65 años, se resumió en una variable binaria para indicar la presencia o ausencia de los mismos. También la edad del jefe/a de hogar se dicotomizó a los efectos de simplificar el análisis. En las estimaciones que a continuación se presentan, se toman tales características en su forma original, esto es: cantidad de menores de 14 años, cantidad de mayores de 65 años y edad (en años) del jefe/a de hogar. Los tipos de hogar y el género del jefe/a de hogar, al ser en su origen categóricas, mantienen su forma. En la elección de las interacciones a incluir en (6.1), deben tenerse en cuenta sólo las más relevantes en términos estadísticos, puesto que las mismas terminan impactando sobre la elasticidad-gasto, y no es deseable complicar su cómputo de forma innecesaria. En la Tabla 6.2 se presentan los resultados del análisis de la “pendiente” promedio de las curvas ESC para el caso del consumo total de alimentos y bebidas. En primer lugar se observa que entre los tipos de hogares, a la vez que las derivadas medias son pequeñas, resultan no significativas. Los mayores efectos interacción (interpretados aquí a partir de la derivada promedio del ESC) se dan entre los hogares unipersonales y nucleares sin hijos, y entre los nucleares (con y sin hijos). Esto se condice con la inspección gráfica (Figura 6.2), donde se resaltó que más allá de lo ocurrido en los extremos, los ESC revelan desplazamientos ‘paralelos’ de las CE. 144 Tabla 6.2 Efecto Interacción de las Características Demográficas con el Gasto Total. Derivada Promedio del ESC. Alimentos (A) Características (a,b) d ESC (a, b ) DE boots Tipos de Hogar (1,2) 0.0005 0.0105 0.0210 -0.0200 (1,3) 0.0046 0.0086 0.0214 -0.0122 (1,4) 0.0008 0.0107 0.0217 -0.0202 (2,3) 0.0041 0.0074 0.0186 -0.0105 (2,4) 0.0003 0.0093 0.0186 -0.0180 (3,4) -0.0038 0.0076 0.0111 -0.0187 Composición Etaria (c/me14,s/me14) -0.0223 0.0061 -0.0103 -0.0342 (c/ma65,s/ma65) 0.0297 0.0061 0.0416 0.0178 Jefe de Hogar (H,M) -0.0155 0.0061 -0.0036 -0.0274 (+45,-45) 0.0269 0.0052 0.0371 0.0167 IC 95% (boot-normal) Fuente: Elaboración propia Respecto a la presencia de menores de 14 años y mayores de 65, se observa que el intervalo de confianza no incluye al cero. Esto se confirma al observar las Figuras 6.4 y 6.6, las que muestran una clara relación entre el gasto total y el efecto de la presencia de los menores y de adultos mayores en el hogar. También las características del jefe/a de hogar resultan estadísticamente significativas. Por lo tanto, los resultados sugieren incorporar las interacciones de la composición etaria y de las características del jefe/a, con el gasto total. Ahora cabe preguntarse qué ocurre con su incorporación paramétrica. La Tabla 6.3 muestra tres variantes del modelo (6.1) aplicado al consumo de alimentos y bebidas (A), estimado por mínimos cuadrados ordinarios (MCO)35. En todos los casos se usa una especificación cúbica, teniendo en cuenta las consideraciones realizadas en el Capítulo 5. 35 La notación y descripción de las variables se realizan en el Capítulo 4. 145 Tabla 6.3 Comparación Modelos Paramétricos. Estimación MCO. Alimentos (A) Variables intercepto Jedad Jgenero menor14 mayor65 tipo2 tipo3 tipo4 lnG lnG2 lnG3 Modelo sin Interacción Modelo Full Modelo Seleccionado -2.44*** (0.5) 0.002*** (0.0002) 0.05*** (0.0044) 0.025*** (0.0016) -0.015*** (0.004) -0.043*** (0.007) 0.081*** (0.0059) 0.09*** (0.007) 1.58*** (0.243) -0.274*** (0.039) 0.015*** (0.002) -2.37 *** (0.52) 0.002 (0.0014) 0.12*** (0.023) 0.065*** (0.014) -0.074** (0.035) 0.0004 (0.059) 0.046 (0.052) 0.059 (0.058) 1.533*** (0.025) -0.268*** (0.039) 0.014*** (0.002) -0.00001 (0.0002) -0.011* (0.006) -0.006*** (0.002) 0.009** (0.006) -0.0066 (0.009) -0.005 (0.008) 0.0046 (0.009) -2.29*** (0.499) 0.002*** (0.0002) 0.113*** (0.035) 0.063*** (0.0121) -0.074*** (0.025) -0.039*** (0.007) 0.038 *** (0.006) 0.047*** (0.0065) 1.502*** (0.244) -0.264*** (0.039) 0.014*** (0.002) jedad*lnG Jgenero*lnG menor14*lnG mayor65*lnG tipo2*lnG tipo3*lnG tipo4*lnG -0.01* (0.005) -0.006*** (0.0019) 0.009 ** (0.004) R2 0.318 0.321 0.321 F 354.6 210.8 273.3 Notas: Errores estándar entre paréntesis.***significativo al 1%; **significativo al 5%; * significativo al 10%. Tipo de hogar base: tipo 2, nuclear sin hijos. Fuente: Elaboración propia Por un lado, el modelo sin interacción muestra que todas las variables demográficas incluidas, como así también los coeficientes de logaritmo del gasto total, son 146 estadísticamente significativos a un nivel del 1%. En la segunda columna se muestran los resultados del modelo “Full” que incluye todas las interacciones dobles con el logaritmo del gasto total36. En este caso, las tres variables binarias que representan los tipos de hogares (tomando el tipo 1 como base) ya no son estadísticamente significativas, como tampoco la edad del jefe/a de hogar. Respecto a la interacción con el gasto total, sólo el género y la cantidad de miembros menores, y de adultos mayores, resultan estadísticamente significativas. En este caso, contrariamente a lo revelado en la Tabla 6.3, la interacción con la edad no es significativa. Sin embargo debe tenerse en cuenta que la variable jedad es una variable continua que mide la cantidad de años del jefe/a de hogar, mientras que en el ESC(+45,-45) se está considerando a la edad como una variable binaria con el objetivo de simplificar el análisis gráfico. Más allá de esta divergencia, se tiene una gran coincidencia entre lo revelado a partir del análisis de la derivada promedio del “efecto sustitución de las características”, con los resultados de las pruebas de significancia de los parámetros correspondientes a las interacciones en un modelo puramente paramétrico. Asimismo, existe bastante correspondencia entre el análisis del ESC como de su promedio, y del efecto de tal característica una vez que es incorporada de manera paramétrica. Adicionalmente, los análisis del ESCP y de la derivada d ESC brindan pautas para incorporar las dummies de algunas características y de su interacción con el gasto total. Verbigracia, en el caso del tipo de hogares, se toma como base el tipo 1, puesto que entre éste y el resto se observan los mayores desplazamientos promedios de las CE (Tabla 6.1). A su vez, al comparar con el tipo 3, se tiene la mayor interacción promedio, captado con la incorporación paramétrica de la variable tipo3*lnG 37. En la Tabla 6.4 se presentan las derivadas promedios del ESC, con sus desvíos estándares bootstrap y los correspondientes intervalos de confianza, para los subjoncuntos específicos de alimentos A1-A4. 36 También es posible incluir otro tipo de interacciones dobles, como ser entre la edad y el género, o bien interacciones de orden mayor. Se probaron un par de tiradas incluyendo algunas de ellas, sin embargo, en su mayoría no resultaron ser significativas. 37 Notar que de la manera en que está definidas las variables tipoj (j=1,2,3,4), no es posible realizar todas las comparaciones directas de a pares, una vez que se especifica el tipo de hogar base, ni de las interacciones. Sin embargo, lo mismo puede realizarse mediante la diferencia de los coeficientes estimados. 147 Tabla 6.4 Efecto Interacción de las Características Demográficas con el Gasto Total. Derivada Promedio del ESC. Alimentos A1-A4 Alimentos Características (a,b) d ESC (a, b ) DE boots (1,2) 0.0032 0.0038 0.0107 -0.0042 (1,3) 0.0085 0.0026 0.0135 0.0034 (1,4) 0.0106 0.0037 0.0178 0.0034 (2,3) 0.0052 0.0033 0.0118 -0.0013 (2,4) 0.0074 0.0041 0.0153 -0.0006 (3,4) 0.0022 0.0028 0.0077 -0.0033 (c/me14,s/me14) -0.0097 0.0022 -0.0053 -0.0141 (c/ma65,s/ma65) 0.0090 0.0020 0.0130 0.0050 IC 95% (boot-normal) A1 (H,M) -0.0036 0.0020 - 0.001 -0.0075 (+45,-45) 0.0100 0.0019 0.0137 0.0063 (1,2) 0.0024 0.0053 0.0127 -0.0079 (1,3) -0.0016 0.0037 0.0056 -0.0088 (1,4) -0.0041 0.0044 0.0046 -0.0128 (2,3) -0.0040 0.0040 0.0038 -0.0119 (2,4) -0.0065 0.0047 0.0027 -0.0157 (3,4) -0.0025 0.0033 0.0040 -0.0089 (c/me14,s/me14) -0.0021 0.0029 0.0035 -0.0077 (c/ma65,s/ma65) 0.0079 0.0025 0.0129 0.0029 A2 (H,M) -0.0067 0.0027 -0.0015 -0.0120 (+45,-45) 0.0101 0.0023 0.0147 0.0055 (1,2) -0.0107 0.0028 -0.0053 -0.0161 (1,3) -0.0106 0.0025 -0.0057 -0.0156 (1,4) -0.0124 0.0029 -0.0068 -0.0180 (2,3) 0.0001 0.0019 0.0037 -0.0035 (2,4) -0.0016 0.0023 0.0029 -0.0062 (3,4) -0.0017 0.0018 0.0019 -0.0053 (c/me14,s/me14) -0.0045 0.0015 -0.0015 -0.0075 (c/ma65,s/ma65) -0.0009 0.0015 0.0020 -0.0038 (H,M) 0.0045 0.0016 0.0076 0.0013 (+45,-45) 0.0014 0.0013 0.0040 -0.0012 A3 148 A4 (1,2) -0.0087 0.0033 -0.0023 -0.0151 (1,3) -0.0112 0.0027 -0.0059 -0.0166 (1,4) -0.0143 0.0031 -0.0082 -0.0204 (2,3) -0.0025 0.0024 0.0021 -0.0072 (2,4) -0.0056 0.0028 -0.0001 -0.0110 (3,4) -0.0030 0.0023 0.0014 -0.0075 (c/me14,s/me14) -0.0001 0.0020 0.0038 -0.0041 (c/ma65,s/ma65) 0.0001 0.0018 0.0036 -0.0034 (H,M) 0.0047 0.0021 0.0088 0.0005 (+45,-45) -0.0003 0.0016 0.0028 -0.0034 Fuente: Elaboración propia Para los alimentos A1, es significativa la interacción entre el unipersonal y los nucleares con hijos y extendidos, no así entre el resto. Esto sugiere tomar el tipo 1 como base e incorporar las interacciones tipo3*lnG y tipo4*lnG. El resto de las interacciones son todas estadísticamente significativas. Por lo tanto, la CE paramétrica de este tipo de alimentos, deberían considerarse todas las interacciones dobles de las características demográficas con el gasto total. El resultado del modelo paramétrico38, considerando las variables demográficas y especificando el gasto de forma cúbica (justificado a partir de los test de especificación del capítulo 5), confirman la incorporación de las interacciones de los tipos de hogares y de la cantidad de miembros menores de 14 años. No ocurre lo mismo con las características del jefe/a de hogar. En este caso, si se incluyen ambas, los coeficientes de las interacciones no son estadísticamente significativos, como tampoco el efecto propio de la edad. Sin embargo, si se incluye solo la interacción con el género y se deja de lado la de la edad, entonces la misma es significativa. De manera similar, si se incluye la interacción mayor65*lnG, luego ni el coeficiente de ésta, ni el de mayor65 es significativo, mientras que si se lo excluye el efecto propio sí lo es. Para el caso de las carnes (A2), sólo las características del jefe/a de hogar y la cantidad de personas mayores de 65 muestran curvas ESC con “pendiente” significativa (i.e. con interacciones significativas). Al correr el modelo paramétrico, se confirma la No se incluyen aquí las salidas de los modelos paramétricos (6.2) para los alimentos específicos A1-A4, para simplificar la exposición. Sin embargo, en el Anexo 2 se presentan los resultados de los modelos paramétricos con las interacciones seleccionadas. 38 149 significatividad estadística del efecto interacción de ambas características con el gasto total, no así la correspondiente a la cantidad de adultos mayores. Incluso cuando esta última interacción se incluye en el modelo, la variable que cuenta la cantidad de adultos mayores (mayor65) deja de ser significativa. Sin embargo, esto no significa que tal variable ya no tenga un impacto significativo sobre la variable respuesta. Se debe a que, al incluir la interacción, el efecto de una variable determinada debe probarse mediante un test conjunto de igualdad a cero de los dos coeficientes (el del efecto principal y el de la interacción), como ser mediante una prueba F. Para la leche y los productos lácteos, la d ESC muestra que las interacciones relevantes son las ocurridas en los tipos de hogares nucleares y extendidos respecto al unipersonal, en la cantidad de menores de 14 años y en el género del jefe de hogar. Exceptuando el caso del género, para el cual el ESC es aproximadamente cero, estos resultados son compatibles con los de un modelo paramétrico cúbico con variables demográficas incluyendo tales interacciones. Por lo tanto, para resulta razonable la incorporación paramétrica de los tipos de hogares y de la cantidad de menores de 14 años, excluyendo la del género. En el consumo de frutas, verduras y legumbres (A4) ocurre algo similar con la interacción del género con el gasto total. De la Figura 6.10 se observa que la curva ESC, más allá del extremo inferior, es aproximadamente igual a cero, por lo que a pesar de que su derivada muestre un signo significativo, no es relevante en para su incorporación paramétrica. En este caso, sólo las interacciones entre tipos de hogares y el gasto total muestran resultados estadísticamente significativos, tanto del análisis de la d ESC (Tabla 6.4) como de los test de significancia de la salida paramétrica correspondiente. Existen varias consideraciones adicionales que deben hacerse respecto a la incorporación de las interacciones en los modelos de regresión. En primer lugar, algo indispensable en el análisis económico, es la interpretación de las mismas. Por ejemplo, si se incorpora la interacción jedad*lnG, el coeficiente de jedad debe ser interpretado como la derivada parcial de la esperanza de la participación del gasto en alimentos con respecto a jedad, cuando lnG = 0, lo cual no tiene mucho sentido en el análisis de las CE. Una manera de presentar los resultados de forma que su interpretación sea más sencilla para el análisis económico, es tomar los efectos interacción desviados respecto a su media, con lo cual el coeficientes estimados de los efectos propios se interpretan respecto al valor promedio de 150 la otra variable con la cual se realiza la interacción, manteniendo así, la interpretación usual de los coeficientes de la regresión (Ozer-Balli y Sorensen, 2012). En segundo lugar, las interacciones aquí incorporadas se derivan del análisis no paramétrico empírico, sin tener algún marco teórico sólido que justifique la incorporación de las mismas, y posibilite el contraste de hipótesis derivadas del análisis económico formal. Claramente, los resultados empíricos dan pie a ciertas hipótesis de comportamiento, las cuales podrían ser modeladas en el ámbito del comportamiento de los (hogares) consumidores. Por último, la incorporación de interacciones en las CE paramétricas podría generar un problema de multicolinealidad, particularmente por la correlación entre los efectos propios y la interacción (Althauser, 1971; Smith and Sasaki, 1979). Sin embargo, como se mencionó anteriormente, su omisión podría traer aparejado problemas de especificación. De aquí que, en defensa de su incorporación, se considere que el problema de correlación entre el término propio y el de la interacción no sea más que otro de los tantos problemas que se dan en la economía empírica (Ozer-Balli y Sorensen, 2012: 2). 6.6 Síntesis y Conclusiones En este capítulo se vio que el análisis del comportamiento de las CE no paramétricas ante diferentes sub-muestras construidas en función de las características de los hogares, permite enriquecer el análisis económico a la vez que constituye un instrumental metodológico a los fines de la especificación econométrica. Se consideraron las características demográficas de los hogares que han mostrado mayor importancia en los análisis de demanda aplicados en Argentina con datos de encuestas de hogares; a saber: los tipos de hogares, la presencia de menores y adultos mayores, el género del jefe/a de hogar y su edad. A partir de tales características, se estiman CE para la sub-muestra definida a partir de la misma, y se computa el denominado “Efecto Sustitución de las Características” (ESC) a los fines de conocer el cambio en los patrones de consumo de alimentos ante dos características distintas del hogar. En base esto se puede conocer si el efecto de la característica sobre el desplazamiento de la CE es, en promedio, significativo, como también analizar las variaciones de tales efectos ante diferentes niveles del poder adquisitivo de los hogares. 151 Para los diferentes tipos de hogares, se observan desplazamientos “paralelos” de las CE para el total de alimentos y bebidas. El mayor cambio se da entre el hogar unipersonal y los nucleares con hijos y extendidos. Entre estos últimos, las CE son prácticamente iguales, siendo el efecto promedio no significativo. Exceptuando los niveles extremos de gasto total, las curvas ESC no muestran algún cambio importante del efecto sustitución respecto a los diferentes niveles del gasto total. Por lo tanto, para el caso del total de alimentos, resulta plausible suponer un ESC relativamente constante para todos los niveles de ingreso de los hogares. Sin embargo, para los alimentos específicos A1-A4, se observan interacciones entre los tipos de hogares y el gasto total. Tomando como base los hogares unipersonales, para los niveles más bajos de gasto total, este tipo de hogar tiende a asignar un mayor gasto de consumo en productos lácteos, frutas, legumbres y verduras, disminuyendo el de arroz, pastas, productos de panadería y carnes, respecto a los hogares nucleares y extendidos. Esto indicaría que el crecimiento en el tamaño del hogar implica una sustitución de las frutas, verduras y lácteos, por carnes, pastas y panadería. Tal brecha se achica para mayores niveles del gasto total, aunque se observa que en los hogares unipersonales sigue siendo mayor el consumo por miembro de frutas, verduras y lácteos. Por su parte, de la comparación de los hogares nucleares sin y con hijos, se observa que un hijo implica sustituir o posponer el consumo de otros bienes a favor de los alimentos. Respecto a la presencia de menores se tiene que, para un nivel dado del gasto total, un menor adicional genera un incremento en el gasto de alimentos en detrimento de otros gastos. Aquí existe una clara interacción con el gasto total, donde para los mayores niveles de gasto (ingreso) el ESC tiende a cero. Para los alimentos específicos se observa que la presencia de al menos un menor implica un aumento en el gasto de harinas, arroz, pastas y lácteos, mientras que el consumo de carnes, frutas, legumbres y verduras permanece prácticamente constante. La presencia de adultos mayores muestra un ESC promedio poco significativo, con cambio de signo a partir del gasto medio. En hogares con menor poder adquisitivo, la presencia de un adulto mayor implica una menor participación de los alimentos en el gasto total, mientras que en hogares con mayor poder de compra, los alimentos tienen una mayor participación presupuestaria. Para los conjuntos A1-A4, se tiene que los 152 hogares con al menos un adulto mayor, tienden a incrementar su consumo de legumbres, frutas y verduras y a disminuir el de carnes, panadería, pasta y arroz. Para el caso de lácteos, el ESC promedio no es significativo. En relación al género del jefe/a de hogar, las estimaciones muestran que para un nivel fijo de gasto total, un hogar con jefatura masculina destina una mayor parte del gasto total en alimentos, en relación a los hogares con jefas mujeres. En esto parece predominar el efecto tamaño, dadas las características de los hogares con jefatura femenina. La forma del ESC muestra un importante efecto interacción, donde la brecha debido al género se va cerrando para los hogares de mayor gasto total. Para los conjuntos particulares de alimentos se tiene que cuando el jefe es hombre hay una sustitución a favor del consumo de carne y de las pastas, harinas y productos de panadería, en relación a los hogares con jefas mujeres. Por su parte, éstas tienden a sustituir el consumo de carnes y harinas por legumbres, frutas, verduras y lácteos, principalmente en el rango de menor gasto total. En estos casos, las interacciones más relevantes se dan para A1 y A2, los que muestran una menor diferencia de género en el consumo. En relación a la edad del jefe de hogar, se tiene que cuando el jefe es mayor de 45 años tiende a sustituir alimentos como las harinas, los lácteos y las carnes a favor de las frutas, legumbres y verduras. Tal efecto se acentúa en los hogares con menores niveles de gasto total. En este caso, solo para el caso de A1 y A2, el efecto interacción es significativo según la derivada promedio del ESC, no así en la especificación paramétrica, para la cual solo en las carnes es estadísticamente significativo. 153 Capítulo 7 Curvas de Engel Semiparamétricas 7.1 Introducción Este capítulo constituye la fase final de la presente tesis, en donde se presentan los resultados de los modelos semiparamétricos de las CE, incorporando las características demográficas y socioeconómicas de los hogares en forma paramétrica, mientras que el gasto total sigue especificado de manera no paramétrica. Como se mencionó en el capítulo metodológico, el uso de modelos semiparamétricos permite incorporar todas las variables de interés sin tener que enfrentar la denominada ‘maldición de la dimensionalidad’, presente en modelos totalmente no paramétricos. A su vez, dado que se considera particularmente los modelos parcialmente lineales (MPL) como opción semiparamétrica de las CE, debe aceptarse el supuesto de que los efectos de las características de los hogares, diferentes del ingreso o gasto total, son aproximadamente lineales. En el capítulo 6 se vio que necesariamente esto no es así, y que algunos efectos de las características pueden cambiar significativamente para diferentes niveles del poder adquisitivo de los hogares. Para las especificaciones paramétricas, se presentó como una opción, la incorporación de las interacciones entre las características y el gasto total, focalizando sólo en aquellas que resultan estadísticamente relevantes. Sin embargo, en las especificaciones semiparamétricas, tanto el intercepto como funciones determinísticas del logaritmo del gasto total (variable que entra de forma no paramétrica), no deben incorporarse por cuestiones de identificabilidad (Li y Racine, 2006: 222-223). Por lo tanto, no se considerarán tales interacciones, y los resultados del presente capítulo se centrarán en el efecto directo de cada característica y en las elasticidades pertinentes, evaluando los resultados de diferentes estimadores no paramétricos que entran en la estimación de los MPL. 154 Dadas las variables definidas en el capítulo 4, la CE del hogar i a considerar para el bien j, puede escribirse de la siguiente manera wij = γ 1´ jedad i + γ 2´ jgeneroi + γ 3´ adultos i + γ 4´ menor14i + γ 5´ mayor65i + γ 6´ tipo2i + + γ 7´ tipo3i + γ´8 tipo4i + γ 9´ asalariadoi + γ 10´ patroni + γ 11´ edu + m j (ln Gi ) + ξ ij ( 2 (7.1) ) con ξij ~ iid 0,σ i . De (7.1) se observa que el tipo de hogar unipersonal (tipo1) es tomado como base, por lo que los coeficientes asociados de los restantes tipos de hogares deben interpretarse en relación a dicho tipo base. De la misma manera, asalariado y patrón, deben interpretarse en función a la categoría ocupacional base noocupado. Para aplicar el método de estimación de Robinson de Doble Residuos39 al MPL (7.1) se deben realizar estimaciones no paramétricas, no sólo para estimar la componente no paramétrica m j , sino que también en una primera etapa para luego poder aplicar MCO para estimar el vector de parámetros γ . En el capítulo 5 de la tesis se prueba que los suavizados splines y los polinomios locales (lineales en algunos casos, y cuadráticos en otros) muestran una mejor performance respecto al clásico estimador N-W. En este capítulo, para cada conjunto de alimentos, se seleccionan los dos estimadores de mayor performance, según los resultados del capítulo 5, y luego se compara el par elegido en términos de las dos medidas de error Cp y AICc, y también considerando el R-cuadrado del MPL. El método de estimación elegido para la fase intermedia del método de Robinson, será el mismo que el seleccionado para la componente no paramétrica de interés (i.e. m j ). Por lo tanto, cada método no paramétrico se evalúa de una forma más integrada, al considerarlo en cada etapa. Esto cobra sentido con la práctica habitual de los trabajos empíricos donde, por lo general, se elige el mismo método de estimación para las todas las p+2 estimaciones no paramétricas que comprenden la estimación de Doble Residuos de un MPL con p parámetros. Lo que resta del presente capítulo se organiza de la siguiente manera. En la sección 7.2 se muestran los resultados de la estimación de (7.1) bajo el supuesto de que el gasto total es exógeno. Seguidamente, se analizan los resultados de las elasticidades-gastos derivadas de los MPL. En la sección 7.4 se analizan la posible endogeneidad del gasto total, 39 Ver Capítulo3, sección 3.7.1. 155 incorporándola en la estimación de las CE utilizando una variable auxiliar en (7.1). Por último, se computan las elasticidades-gasto corregidas. Dado que se utiliza el ingreso de los hogares como variable instrumental, también se calcula la elasticidad-ingreso, comparándolas con las otras dos anteriores. 7.2 Resultados de los Modelos Parcialmente Lineales En lo que sigue se presentan los resultados de la estimación de (7.1), comparando entre dos metodologías no paramétricas seleccionadas según los criterios de performance a partir del análisis realizado en el capítulo 5. La tablas siguientes (7.1-7.5) muestran los resultados de la estimación de Doble Residuos para los conjuntos de alimentos considerados, aplicando suavizados spline por un lado, y polinomios locales, por otro (lineales o cuadráticos según cada caso); considerando que ambos son los que mostraron un mejor desempeño en la estimación de la componente no paramétrica. Adicionalmente de los coeficientes γˆ se presentan los errores estándar heterocedásticos. En la parte inferior se detalla: la suma de cuadrados de los residuos, los grados de libertad (v) de la componente no paramétrica m̂ , las medidas Cp y AICc para evaluar ambos suavizados locales computados para m̂ , y el R-cuadrado de los modelos semiparamétricos integrados. Considerando las CE para el conjunto total de alimentos y bebidas (Tabla 7.1), todas las características socioeconómicas y demográficas de los hogares muestran tener un efecto estadísticamente significativo a un nivel del 1%, exceptuando la situación ocupacional del jefe/a de hogar. En este caso, para el modelo que utiliza el estimador local lineal, el hecho de que el jefe de hogar sea patrón o cuenta propista es significativo, aunque a un nivel del 10%. Los coeficientes estimados para ambos modelos son prácticamente iguales, por lo tanto, en lo que hace a la parte paramétrica del MPL, es indiferente la elección de uno u otro. La Figura 7.1 muestra el gráfico de m̂ , donde se observa que la CE sigue manteniendo la forma del modelo totalmente no paramétrico, y la diferencia entre los dos estimadores es pequeña, manifestándose en mayor medida en extremo inferior del gasto total. 156 Tabla 7.1 CE Semiparamétricas. Estimador de Doble Residuos. Total Alimentos y Bebidas Spline Variables jedad jgenero Local Lineal Coeficiente EE het Coeficiente EE het 0.0012*** 0.0002 0.0012*** 0.0002 0.0323*** 0.0046 0.0323*** 0.0046 adultos 0.0244*** 0.0018 0.0244*** 0.0018 menor14 mayor65 0.0251*** 0.0016 0.0251*** 0.0015 0.0210*** 0.0047 0.0210*** 0.0047 tipo2 0.0214*** 0.0074 0.0213*** 0.0075 tipo3 0.0329*** 0.0071 0.0327*** 0.0071 tipo4 0.0250*** 0.0082 0.0249*** 0.0082 0.0015 0.0049 0.0016 0.0049 0.0084 0.0052 0.0085* 0.0052 -0.0348*** 0.0047 -0.0348*** 0.0047 asalariado patron edu SC(res) 0.0212 0.0212 v 6.998 7.564 Cp(m) 0.00005 0.00027 AICc(m) -2.8522 -2.8520 0.3423 0.3423 R 2 Notas:.***estadísticamente significativo al 1%; **significativo al 5%; * significativo al 10%. Fuente: Elaboración Propia 0.6 Figura 7.1 Componente No Paramétrica de la CE. Estimador de Doble Residuos. Total Alimentos y Bebidas 0.4 0.3 0.2 m(lnG) 0.5 Spline P Local Lineal 4 5 6 7 8 ln(G) Fuente: Elaboración Propia 157 El coeficiente de la variable jedad revela que a mayor edad del jefe/a de hogar, mayor es la participación del gasto en alimentos. Para un hogar promedio, donde la participación presupuestaria de los alimentos ronda el valor de 0.41, las estimaciones muestran que, en promedio, un hogar con un jefe/a 10 años mayor, destina en alimentos y bebidas un 3% más de su gasto total, respecto a un hogar con jefe/a 10 años más joven. Cuando el jefe es varón, la participación del gasto en alimentos es mayor respecto a los hogares con jefa mujeres. Considerando el hogar promedio, esto se traduce en un 9% superior en hogares con jefatura masculina. La cantidad de miembros en edad intermedia (adultos), incrementa la participación del gasto en alimentos, como también ocurre al considerar un hogar nuclear o extendido respecto a uno unipersonal. Del mismo modo, la cantidad de menores y de adultos mayores incrementa la participación de los alimentos en el gasto total. Por el contrario, un mayor nivel de instrucción del jefe o jefa de hogar, disminuye la participación del gasto en alimentos. Esto cobra sentido al considerar la posible relación positiva entre el nivel de educación con los ingresos percibidos, por lo que los resultados encontrados son compatibles con la ley de Engel. En general, todos los signos de los coeficientes son consistentes con los desplazamientos de las CE examinados en el capitulo anterior para las categorías demográficas. Un comentario especial merece el caso de los adultos mayores y de la edad del jefe de hogar, donde el ESC cambiaba de signo a partir de un cierto ingreso. Los coeficiente positivos de ambas variables, muestran que el efecto ocurrido en los hogares con un poder adquisitivo medio-alto termina dominando (ver Figuras 6.6 y 6.12) al controlar el modelo con las restantes variables. A su vez, debe tenerse en cuenta que en este caso ambas variables son continuas (conteo), mientras que en el caso anterior se definieron categorías binarias para las mismas. Respecto a la CE propiamente dicha (Figura 7.1), el suavizado spline muestra un comportamiento ‘menos exagerado’ en el rango donde los hogares incrementan su participación del gasto en alimentos ante aumentos de su poder de compra. Al comparar las medidas de performance Cp y AICc se tiene que, si bien las diferencias son muy leves, se confirma la superioridad del estimador por splines, en el sentido que tienen tales medidas como aproximaciones de los errores de estimación y/o predicción. 158 Tabla 7.2 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A1 Spline Variables jedad jgenero Local Cuadrático Coeficiente EE het Coeficiente EE het 0.0001 0.0001 0.0001 0.0001 0.0013 0.0014 0.0013 0.0014 adultos 0.0104*** 0.0006 0.0104*** 0.0006 menor14 mayor65 0.0101*** 0.0005 0.0101*** 0.0005 0.0083*** 0.0015 0.0083*** 0.0015 tipo2 0.0119*** 0.0022 0.0119*** 0.0022 tipo3 0.0127*** 0.0022 0.0126*** 0.0022 tipo4 0.0112*** 0.0027 0.0111*** 0.0027 asalariado patron -0.0042*** 0.0015 -0.0041*** 0.0015 -0.0021 0.0016 -0.0021 0.0016 edu -0.0064*** 0.0012 -0.0064*** 0.0012 SC(res) 0.001996 0.001996 v 5.056 5.714 Cp(m) 0.000003 0.00004 AICc(m) -5.2151 -5.2149 0.3872 0.3872 R 2 Notas: ****estadísticamente significativo al 1%. Fuente: Elaboración Propia 0.20 Figura 7.2 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A1) 0.10 0.05 0.00 m(lnG) 0.15 Spline P Local Cuadrático 4 5 6 7 8 ln(G) Fuente: Elaboración Propia 159 Considerando ahora las estimaciones para los subconjuntos de alimentos específicos, para los A1 (Tabla 7.2) se tiene que la edad y el género del jefe/a de hogar no son significativos. Las variables que hacen al tamaño y composición del hogar nuevamente tienen un efecto estadísticamente significativo y positivo sobre la participación del gasto en los alimentos A1. Un adulto adicional incrementa la participación del gasto en A1 en un 13% en promedio40. El mismo efecto promedio produce un menor más. Por su parte, la presencia de un adulto mayor (o un adulto mayor más) aumenta la participación de los alimentos A1 en aproximadamente un 10%, considerando el ‘hogar promedio’. También, como en el caso general, un nivel de instrucción superior del jefe/a de hogar reduce significativamente la participación del gasto en este tipo de alimentos. Ahora el hecho de ser asalariado versus a no estar ocupado, implica una reducción en la participación presupuestaria de este tipo de alimentos, aunque la misma no supera al 6% en promedio. Lo mismo ocurre si el jefe/a es patrón o trabaja por cuenta propia, aunque en este caso la diferencia no es significativa. Entre los tipos de hogares, el mayor impacto, respecto a los hogares unipersonales, se da en los nucleares con hijos, aunque el efecto de los otros tipos de hogares es similar. El aumento registrado, para un hogar con la participación presupuestaria promedio, ronda el 15%. En este caso se comparan el suavizado spline con los polinomios locales cuadráticos. No existen diferencias entre ambos en lo que hace al valor de los coeficientes de la componente paramétrica. Sin embargo, el suavizado spline muestra una posición favorable en términos de las medidas Cp y AICc. Al observar las curvas no paramétricas (Figura 7.2) se ve que las diferencia entre ambos estimadores es despreciable, diferenciándose un poco en el extremo inferior. De tales curvas se observa que la reducción presupuestaria de los alimentos A1 decae con mayor intensidad en los niveles medios del gasto total. Luego sigue decreciendo de forma menos acelerada. Este mismo comportamiento se apreció de la estimación no paramétrica pura (Figura 5.4). Para las carnes (A2) (Tabla y Figura 7.3), las únicas variables que no tienen un efecto estadísticamente significativo son las relacionadas a la situación ocupacional del jefe/a de hogar. El resto son significativas y muestran los mismos signos que en el caso del total de alimentos y bebidas. La edad del jefe/a si bien es significativa, su impacto es pequeño, 40 Considerando que la media de la participación del gasto en A1 es igual a 0.081 160 mostrando que si el jefe o jefa es mayor en 10 años, el incremento promedio de la participación de las carnes en el gasto total no llega a representar un 2% si se toma como referencia al ‘hogar promedio’ (i.e. aquéllos para los cuales w A2 = 0.112 ). El género muestra un efecto mucho mayor, cuyo coeficiente revela que en hogares con jefatura masculina, la participación presupuestaria de las carnes es, en promedio, un 11% superior a la de hogares con jefatura femenina. Este efecto es similar al de comparar un jefe con o sin educación superior. La cantidad de miembros de edad intermedia (adultos) muestra que un adulto más incrementa la participación del gasto en carnes en un 7%, mientras que el impacto promedio de un menor o de un adulto mayor se reduce a la mitad. Por otra parte, se observa que un hogar nuclear sin hijos tiene una participación del gasto en A2 del 16% superior a los hogares unipersonales, tomando de referencia al ‘hogar promedio’. Al considerar los hogares con hijos y extendidos, tal diferencia es del orden del 21%. Tabla 7.3 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A2 Spline Variables jedad jgenero Local Cuadrático Coeficiente EE het Coeficiente EE het 0.0004*** 0.0001 0.0004**** 0.0001 0.0128*** 0.0020 0.0128*** 0.0020 adultos 0.0081*** 0.0008 0.0081*** 0.0008 menor14 mayor65 0.0044*** 0.0007 0.0044*** 0.0007 0.0047** 0.0021 0.0046** 0.0021 tipo2 0.0181*** 0.0033 0.0181*** 0.0033 tipo3 0.0248*** 0.0030 0.0249*** 0.0030 tipo4 0.0242*** 0.0036 0.0243*** 0.0036 0.0001 0.0021 0.0001 0.0021 asalariado patron edu 0.0026 0.0023 0.0026 0.0023 -0.0114*** 0.0018 -0.0114*** 0.0018 SC(res) 0.00363 0.00363 v 4.425 4.171 Cp(m) 0.000005 0.0002 AICc(m) -4.6169 -4.6169 0.3067 0.3067 R2 Notas: ***significativo al 1%; **significativo al 5% Fuente: Elaboración Propia. 161 0.10 0.15 Spline P Local Cuadrático 0.00 0.05 m(lnG) 0.20 0.25 Figura 7.3 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A2) 4 5 6 7 8 ln(G) Fuente: Elaboración Propia Nuevamente las diferencias entre los métodos no paramétricos seleccionados, son mínimas en lo que hace a los coeficientes de la componente paramétrica como también del efecto del gasto total (Figura 7.3). Aquí el spline supera al polinomio local cuadrático según el estadístico Cp pero el AICc arroja los mismos resultados. Para la leche y los productos lácteos (A3), la única característica del jefe/a de hogar que resulta significativa es la edad, con un efecto pequeño que no alcanza ni al 1% respecto al ‘hogar promedio’ (con wA3 = 0.05 ). Las variables que resultan más relevantes, además del gasto total, son aquéllas relacionadas a la cantidad de miembros en los grupos etarios extremos. Los coeficientes de la Tabla 7.4 muestran que, en promedio, un adulto mayor adicional genera un aumento del 7.5% en la participación del gasto en lácteos, mientras que un menor adicional lo hace en un 10% (tomando como referencia al hogar promedio). Este mismo impacto también se refleja al comparar los hogares nucleares con hijos respectos a los unipersonales (coeficiente del tipo3). La forma que adopta la CE (Figura 7.4) muestra que las disminuciones del presupuesto en lácteos ante aumentos del poder adquisitivo se da de forma más acelerada en los hogares de menores recursos (lo que se 162 apreció en el Cap. 5 – Figura 5.6). Los dos estimadores no paramétricos muestran resultados muy similares en lo que hace a la componente paramétrica, con algunas diferencias, aunque leves, en la curva no paramétrica. Tanto el Cp como el AICc muestran que el spline brinda una estimación de la CE como menores errores, respecto a la de los polinomios locales lineales. Cuando se utiliza esta última metodología se obtiene una mayor bondad de ajuste, expresada en un R-cuadrado superior. Esta diferencia no sólo es depreciable (al considerar tres o dos dígitos del R2) sino que al ver los grados de libertad no paramétricos, se tiene que para el polinomio local v ≈ 7 , mientras que para el spline v ≈ 5 , por lo que es esperable que el primero arroje un mayor R-cuadrado. Sin embargo, la Figura 7.4 sugiere que este menor suavizado ‘óptimo’ del polinomio local no brinda una diferencia apreciable en la forma de la CE de modo que pueda captarse un comportamiento económico singular, por lo que el menor suavizado no es justificable. Tabla 7.4 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A3 Spline Variables jedad jgenero Local Lineal Coeficiente EE het Coeficiente EE het 0.0001*** 0.00001 0.0001*** 0.00001 -0.0009 0.0011 -0.0009 0.0011 adultos 0.0011** 0.0004 0.0011** 0.0004 menor14 mayor65 0.0050*** 0.0004 0.0050*** 0.0004 0.0038*** 0.0010 0.0038*** 0.0011 tipo2 0.0007 0.0017 0.0008 0.0017 tipo3 0.0051*** 0.0017 0.0051*** 0.0017 tipo4 0.0021 0.0020 0.0021 0.0020 asalariado patron 0.0008 0.0011 0.0008 0.0011 0.0004 0.0012 0.0004 0.0012 edu 0.0014 0.0010 0.0014 0.0010 SC(res) 0.000975 0.000976 v 4.968 6.788 Cp(m) 0.000001 0.0004 AICc(m) -5.9311 -5.9309 0.1909 0.1913 R 2 Notas: ***significativo al 1%; **significativo al 5% Fuente: Elaboración Propia. 163 0.12 Figura 7.4 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A3) 0.06 0.00 0.02 0.04 m(lnG) 0.08 0.10 Spline P Local Lineal 4 5 6 7 8 ln(G) Fuente: Elaboración Propia. Para el caso de las legumbres, frutas y verduras (Tabla y Figura 7.5), nuevamente las características del jefe/a no muestran ser muy relevante. Sólo la edad y el nivel de instrucción muestran efectos estadísticamente significativos. Para la primera se revela que en promedio un hogar con jefe/a 10 años mayor tiene una participación del gasto en A4 6% superior, tomando el hogar promedio con wA4 = 0.065 . Respecto al nivel de instrucción se observa que un hogar con jefe/a con estudios superiores destina, en promedio, un 5% menos de su presupuesto en legumbres, frutas y verduras, en relación a los hogares cuyo jefe/a tiene a lo sumo la educación secundaria terminada. Las variables que hacen al tamaño, composición y tipología de los hogares son, por lo general, estadísticamente significativas. Un adulto mayor adicional impacta positivamente, generando un aumento promedio del 7% en el presupuesto destinado a A4 (en referencia al ‘hogar promedio’). Por su parte, el impacto promedio de un menor adicional es del 6%, igual al efecto del incremento de un miembro en edad intermedia. También, un hogar nuclear con o sin hijos tiene, en promedio, una participación del gasto en A4 superior en un 10% respecto a los hogares unipersonales. 164 Tabla 7.5 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A4 Spline Variables jedad jgenero Local Lineal Coeficiente EE het Coeficiente EE het 0.0004*** 0.0000 0.0004*** 0.0000 0.0002 0.0013 0.0002 0.0013 adultos 0.0038*** 0.0005 0.0038*** 0.0005 menor14 mayor65 0.0038*** 0.0004 0.0038*** 0.0004 0.0043*** 0.0013 0.0043*** 0.0013 tipo2 0.0065*** 0.0021 0.0065*** 0.0021 tipo3 0.0060*** 0.0020 0.0060*** 0.0020 tipo4 0.0015 0.0023 0.0014 0.0023 asalariado patron -0.0021 0.0013 -0.0021 0.0013 -0.0012 0.0014 -0.0012 0.0014 -0.0031*** 0.0012 -0.0030*** 0.0012 edu SC(res) 0.001525 0.001527 v 7.245 7.583491 Cp(m) 0.000003 0.0002 AICc(m) -5.4833 -5.4831 0.2368 0.2368 R 2 Notas: ***significativo al 1%; **significativo al 5% Fuente: Elaboración Propia. 0.15 Figura 7.5 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A4) 0.00 0.05 m(lnG) 0.10 Spline P Local Lineal 4 5 6 7 8 ln(G) Fuente: Elaboración Propia. 165 De nuevo, las diferencias entre ambas metodologías no paramétricas son mínimas, y en lo que hace a las medidas de performance estadística, el spline sigue siendo superior. Del análisis de los MPL para cada conjunto de alimentos, se observa que el efecto de cada co-variable es totalmente compatible con lo analizado de las curvas ESC. A su vez, las CE no paramétricas adoptan la misma forma que las del capítulo 5, lo que es esperable dado que el resto de las variables se incluyen de manera aditiva, aunque la variabilidad explicada por éstas podría cambiar en algo las estimaciones no paramétricas de la segunda etapa del método de Robinson. 7.3 Elasticidades-Gasto Dado que las CE derivadas del MPL no experimentaron grandes cambios respecto a las CE totalmente no paramétricas (por lo menos, desde la inspección visual), se espera que el comportamiento de las elasticidades-gasto tampoco varíe mucho. Sin embargo, en esta sección se presentan las mismas, no sólo para chequear esto, sino también para hacer una comparación adicional entre los dos estimadores semiparamétricos seleccionados para los MPL, como así también con la elasticidad-gasto del modelo paramétrico que mejor se adapta a las funciones flexibles, según los test de hipótesis realizados en el Capítulo 5. Para el caso de alimentos y bebidas en general, para ambos test de especificación, todas las especificaciones W-L propuestas son rechazadas frente a la alternativa no paramétrica. A pesar de ello, gráficamente se vio que la W-L cúbica es la que mejor se adapta al comportamiento de la CE no paramétrica41. Por lo tanto, se elige ésta para computar su derivada. Dado que se tiene el logaritmo del gasto total hasta la potencia de 3, luego la elasticidad paramétrica viene dada por e (ln G ) = 1 + G j θˆ1 j + 2θˆ2 j ln G + 3θˆ3 j (ln G )2 wˆ j (7.2) Siendo θˆkj (k = 1,2,3) los coeficientes correspondiente a cada potencia k del logaritmo del gasto total, estimados por MCO del modelo paramétrico para el conjunto de alimentos j, y 41 Los resultados completos de los modelos paramétricos seleccionados se presentan en el Anexo 2. 166 ŵ j su predicho. Para las elasticidades no paramétricas derivadas del MPL, según se vio en el capítulo metodológico, su fórmula es e Gj (ln G ) = 1 + mˆ j ' (ln G ) mˆ j (ln G ) (7.3) Donde m ˆ j ' (.) representa la derivada estimada de la componente no paramétrica, y mˆ j (.) su predicho. En la Figura 7.6 se muestran los resultados para las dos especificaciones semiparamétricas, utilizando suavizados spline o polinomios locales lineales, y la obtenida a partir de (7.2). 1.2 Figura 7.6 Elasticidades – Gasto. Comparación de Estimadores. Total Alimentos y Bebidas 1.0 0.9 0.8 0.7 0.5 0.6 Elasticidad-Gasto 1.1 P Local Lineal Spline W-L Cúbica 4 5 6 7 8 ln(G) Fuente: Elaboración Propia. De la gráfica se observa que las diferencias en elasticidad que da un ajuste paramétrico son muy notorias respecto a los no paramétricos. Incluso, aquí la W-L muestra un comportamiento poco esperado en términos económicos cuando se alcanza cierto nivel del poder adquisitivo. Dado el principio de saturación, se espera que en tales niveles, la elasticidad-gasto alcance de los alimentos alcance los menores valores y siga decreciendo. 167 Sin embargo la W-L cúbica muestra un crecimiento repentino, alcanzado los mismos valores de elasticidad que en los hogares pobres. Por lo tanto, no es aconsejable el uso de esta especificación. Adicionalmente, al comparar con las elasticidades no paramétricas, la W-L cúbica la subestima en los niveles medios y bajos del gasto total. Al comparar las elasticidades con las dos metodologías no paramétricas alternativas, se observa un patrón similar. Sin embargo, el suavizado spline muestra un mejor comportamiento en los extremos, más compatibles en términos económicos. En la Figura 7.7 se presentan los resultados para los cuatro conjuntos de alimentos seleccionados. La derivada paramétrica de cada caso, corresponde al modelo elegido según los test de especificación. En estos casos se observa que las elasticidades paramétricas tienen un mejor comportamiento, y se ajustan mejor a las no paramétricas. Los mejores ajustes se dan para el caso de carnes, leche y productos lácteos (A2 y A3), donde la W-L cuadrática muestra un resultado compatible con el análisis económico (en términos de elasticidades-gasto decrecientes) y son próximas a las no paramétricas, y en particular a las del suavizado spline. Para las harinas, pastas, arroz y productos de panadería (A1), la elasticidad-gasto paramétrica (en este caso, utilizando la W-L cúbica) no capta las formas de las elasticidades no paramétricas, y la termina subestimando. Por otra parte, las elasticidades no paramétricas de las legumbres, frutas y verduras, muestran una gran variabilidad que es compatible con las diferentes formas que adoptan las CE en distintos intervalos del gasto total (como puede verse de 7.5). Estos cambios de forma no son captados por la CE paramétrica (W-L cuadrática), a pesar de que la misma de un resultado económicamente consistente. Por lo tanto, si bien el ajuste paramétrico no parece ser ‘tan malo’, deja de captar algunas curvaturas que pueden resultar de interés si se desea analizar la demanda de los alimentos tipo A4 por tramos de ingresos. En la Tabla 7.6 están computadas las elasticidades promedio y evaluadas en el gasto total medio, para las dos alternativas no paramétricas y la resultante de la W-L. Entre las dos primeras, como era de esperar, las diferencias son muy pequeñas. Por lo tanto, en lo que hace a tales medidas, la elección del estimador es irrelevante. Al compararlas con las elasticidades de los modelos paramétricos, se observa que éstas tienden a subestimar los 168 valores de la elasticidad. En algunos casos la diferencia es menos notoria que en otros, pero la brecha es relevante y más en casos donde se desea comparar las elasticidades para distintos bienes, o en bienes cuya elasticidad ronda el valor 1 (por lo que están al límite de caracterizarse por bienes necesarios o de lujo). Figura 7.7 Elasticidades – Gasto. Comparación de Estimadores. Más Conjunto de Alimentos A1-A4 A2 1.0 1.2 A1 0.4 0.6 0.8 P Local Cuadrático Spline W-L Cuadrática 0.0 0.2 Elasticidad-Gasto 0.8 0.6 0.4 0.0 -0.2 0.2 Elasticidad-Gasto 1.0 P Local Lineal Spline W-L Cúbica 4 5 6 7 8 4 5 ln(G) 8 1.0 1.0 A4 P Local Lineal Spline W-L Cuadrática P Local Cuadrático Spline W-L Cuadrática 0.6 0.2 -0.2 0.4 0.0 0.2 0.4 Elasticidad-Gasto 0.6 0.8 0.8 7 ln(G) A3 Elasticidad-Gasto 6 4 5 6 7 8 4 5 6 7 8 ln(G) ln(G) Fuente: Elaboración Propia. 169 Tabla 7.6 Elasticidades-Gasto Promedios y Evaluadas en la Media Elasticidad Promedio Alimentos Elasticidad en el Gasto Medio e EE boot E EE boot PL 0.732 0.006 0.722 0.020 Spline 0.733 0.006 0.725 0.024 W-L Cubica 0.703 0.007 0.655 0.010 PL 0.558 0.012 0.502 0.014 Spline 0.550 0.009 0.523 0.021 W-L Cubica 0.476 0.011 0.481 0.017 Total (A) A1 A2 PL 0.604 0.011 0.541 0.010 Spline 0.590 0.008 0.521 0.018 W-L Cuadrática 0.532 0.010 0.549 0.009 A3 PL 0.625 0.015 0.703 0.032 Spline 0.628 0.011 0.697 0.025 W-L Cubica 0.597 0.012 0.674 0.022 PL 0.603 0.010 0.662 0.032 Spline 0.604 0.009 0.675 0.039 W-L Cuadrática 0.596 0.010 0.618 0.009 A4 Fuente: Elaboración Propia. 7.4 Endogeneidad por Simultaneidad Dado que el gasto total de consumo en bienes y servicios, como el destino de dicho gasto a un bien en particular, son resultados de asignaciones de gasto, se argumenta que este problema de simultaneidad de las decisiones trae aparejado un problema de endogeneidad en los modelos de regresión de CE. En el capítulo metodológico se presentó la corrección de la misma mediante la incorporación de una variable auxiliar. Si la misma es significativa, entonces puede concluirse que el gasto total es endógeno. Adicionalmente, este procedimiento permite corregir el MPL bajo ciertos supuesto (ver Capítulo 3). La Tabla 7.7 presenta los resultados de las componentes paramétricas de los nuevos MPL considerando la posible endogeneidad del gasto total, utilizando suavizados spline en las estimaciones no paramétricas. Como se mencionó previamente, el ingreso total declarado 170 por el hogar y el régimen de tenencia de la vivienda son utilizados como variables instrumentales para la construcción de la variable auxiliar ( U ) que entra de forma paramétrica en los modelos. Para el total de alimentos y bebidas (A) y para el conjunto de alimentos A1, la variable es estadísticamente significativa a un nivel del 1%, y en los alimentos A3 a un nivel del 10%. Para A2 y A4, el efecto de la misma no es significativo. Por lo tanto, para estos últimos puede asumirse que el gasto total es exógeno. Los coeficientes de las características de los hogares experimentan leves cambios, manteniéndose la significatividad de cada variable de los modelos sin corregir. Tabla 7.7 Componentes Paramétricas de la CE. Corrección por Endogeneidad A A1 A2 A3 A4 0.0013*** (0.0002) 0.0338*** (0.0046) 0.0257*** (0.0018) 0.0245*** (0.0015) 0.0227*** (0.0047) 0.0244*** (0.0075) 0.0366*** (0.0071) 0.0296*** (0.0082) 0.0065 (0.0049) 0.0128** (0.0052) -0.0285*** (0.0048) 0.0258*** (0.0041) 0.0001 (0.0001) 0.0018 (0.0014) 0.0108*** (0.0006) 0.0099*** (0.0005) 0.0088*** (0.0015) 0.0129*** (0.0022) 0.0138*** (0.0022) 0.0126*** (0.0027) -0.0026* (0.0015) -0.0007 (0.0016) -0.0045*** (0.0013) 0.0082*** (0.0013) 0.0004*** (0.0001) 0.0127*** (0.0020) 0.0081*** (0.0008) 0.0044*** (0.0007) 0.0047** (0.0021) 0.0179*** (0.0033) 0.0246*** (0.0030) 0.0240*** (0.0036) 0.00005 (0.0021) 0.0026 (0.0023) -0.0117*** (0.0018) -0.0010 (0.0017) 0.0001 (0.00001) -0.0008 (0.0011) 0.0012*** (0.0004) 0.0049*** (0.0004) 0.0039*** (0.0011) 0.0010 (0.0017) 0.0054*** (0.0017) 0.0024 (0.0020) 0.0011 (0.0011) 0.0007 (0.0012) 0.0018* (0.0011) 0.0017* (0.0009) 0.0004*** (0.00004) 0.0003 (0.0013) 0.0039*** (0.0005) 0.0037*** (0.0004) 0.0044*** (0.0013) 0.0066*** (0.0021) 0.0062*** (0.0020) 0.0018 (0.0023) -0.0018 (0.0013) -0.0009 (0.0014) -0.0027** (0.0012) 0.0015 (0.0011) EE(res) 0.0010 0.0212 0.0036 0.0036 0.0015 v 7.01 5.07 4.5 4.96 7.22 R2 0.3461 0.3911 0.3066 0.1913 0.2370 Variables jedad jgenero adultos menor14 mayor65 tipo2 tipo3 tipo4 asalariado patron edu U Notas: Errores estándar heterocedásticos entre paréntesis. *** estadísticamente significativo al 1%; **significativo al 5% * significativo al 10%. Fuente: Elaboración Propia. 171 Por lo tanto, en algunos casos se rechaza la endogeneidad mientras que en otros no. Sin embargo debe tenerse en cuenta una serie de cuestiones al momento de establecer posiciones definitivas. En primer lugar, el método de corrección descansa en determinados supuestos. Lo ideal sería compararlos con otras metodologías, como ser la de Sperlich (2007). Por otra parte, es probable que, dada las dificultades en la captación del ingreso real de los hogares, la inclusión de la misma genere problemas de ‘errores de medición’, por lo que podrían buscarse instrumentos alternativos, o instrumentar el ingreso para evitar el sesgo de los errores de medición. Suponiendo que la corrección propuesta da resultados válidos, ¿Cambian significativamente las curvas de las elasticidades? Esto se responde en la próxima sección, mostrando adicionalmente el comportamiento de la elasticidad-ingreso. 7.5 Elasticidades-Gasto Corregidas y Elasticidades-Ingreso Al introducir una variable auxiliar compuesta del residuo derivado de la regresión entre el logaritmo del gasto total con el ingreso y el régimen de tenencia, luego las elasticidadesgasto deben corregirse por tal factor. Adicionalmente, al utilizar el ingreso del hogar como instrumento, es posible obtener la elasticidad-ingreso, i.e. el cambio porcentual en la cantidad demandada (suponiendo precios fijos) ante un cambio porcentual en el ingreso del hogar. La Figura 7.8 muestra que la corrección de la elasticidad-gasto por la posible endogeneidad del gasto total genera un desplazamiento de la curva de elasticidad hacia la derecha. Por lo tanto, en este caso la elasticidad gasto no corregida estaría sub-estimando los valores de elasticidad. Por su parte, la curva de elasticidad-ingreso tiene la misma forma que la de elasticidad gasto, mostrando valores menores que ella. Es decir que, ante aumentos en ingreso, los aumentos porcentuales de demanda de alimentos serían menores respecto a los que se dan ante aumentos porcentuales en el gasto total, lo que tiene sentido al considerar que ante un aumento del ingreso está la decisión de cuánto ahorrar y cuánto consumir. 172 1.2 Figura 7.8 Elasticidad–Gasto Corregida y Elasticidad Ingreso 0.9 0.8 0.5 0.6 0.7 Elasticidad-Gasto 1.0 1.1 Elasticidad-Gasto Elasticidad-Ingreso Elasticidad-Gasto NO Corregida 4 5 6 7 8 ln(G) Fuente: Elaboración Propia. Para los alimentos específicos, las elasticidades se muestran en la Figura 7.9. Al comparar los efectos de la corrección de la elasticidad-gasto, se tiene que sólo en los casos donde no es rechazada la endogeneidad del gasto total (A1 y A3), existen cambios considerables entre la elasticidad corregida y no corregida. Particularmente en el caso de los alimentos A1, la corrección parece ser relevante, y más aún en el extremo superior del gasto total. En todos los casos, la elasticidad-ingreso no cambia en forma respecto a la elasticidad gasto, y está por debajo de la misma, siendo consistente en términos económicos. 173 Figura 7.9 Elasticidad–Gasto Corregida y Elasticidad Ingreso. Conjuntos A1-A4 Elasticidad-Gasto Elasticidad-Ingreso Elasticidad-Gasto NO Corregida Elasticidad-Gasto Elasticidad-Ingreso Elasticidad-Gasto NO Corregida 0.0 0.0 0.2 0.2 0.4 0.4 0.6 0.6 0.8 A2 0.8 A1 5 6 7 4 8 5 ln(G) ln(G) A3 A4 7 8 0.6 0.8 0.4 0.6 0.2 0.4 0.2 Elasticidad-Gasto Elasticidad-Ingreso Elasticidad-Gasto NO Corregida 0.0 0.0 Elasticidad-Gasto Elasticidad-Ingreso Elasticidad-Gasto NO Corregida 4 5 6 7 ln(G) 7.6 6 0.8 4 8 4 5 6 7 8 ln(G) Síntesis y Conclusiones Del análisis de las regresiones semiparamétricas se pudo obtener una cuantificación del efecto de cada característica socioeconómica y demográfica sobre la participación del gasto en alimentos, adicionalmente al efecto del gasto total, expresado en una CE no paramétrica. Los signos y magnitudes de los efectos promedio de cada variable demográfica, son consistentes con los resultados del análisis de las curvas ESC del 174 capítulo anterior. En general, para todos los conjuntos de alimentos, las variables que hacen al tamaño, composición y tipología del hogar, son estadísticamente significativas. Por el contrario, las características del jefe, no lo son en todos los casos, con la excepción del nivel de instrucción que muestra una relación negativa entre éste y la participación del gasto en alimentos. Entre éstas, la situación ocupacional parece ser la menos relevante. Por su parte, la edad tiene efectos positivos significativos en todos los casos, excepto para los alimentos A1. El género es significativo en el total y en el consumo de carnes, mostrando que en hogares con jefatura masculina, se asigna una mayor proporción del gasto a las carnes. Respecto a la componente no paramétrica, las CE mantienen su forma en relación a las estimaciones realizadas en el capítulo 5. Al comparar los ‘dos mejores’ estimadores no paramétricos para cada tipo de alimentos, se concluye que si bien las diferencias son muy leves, el suavizado spline es superior en términos del menor error de estimación y predicción. De la comparación de las elasticidades-gasto, se tiene que aquéllas obtenidas por medio del spline responden mejor en los extremos. De las elasticidades-gasto derivadas de las especificaciones W-L seleccionadas, se concluye que para el caso del total de alimentos y bebidas, la W-L cúbica no representa de manera correcta el comportamiento esperado del consumidor, y diverge ampliamente de las elasticidades no paramétricas. En los otros casos, las elasticidades paramétricas son más similares a las no paramétricas, y también más consistente con la interpretación económica. Sin embargo, ante una CE con varios cambios de curvatura (como ser el caso de A4), su especificación paramétrica no capta los cambios de elasticidad involucrados. Por último, la corrección por la posible endogeneidad del gasto total muestra que sólo para el total de alimentos y bebidas (A), y para el conjunto A1, tal corrección es estadísticamente significativa al 1%; y para los alimentos A3 lo es pero a un nivel del 10%. Por lo tanto, bajo el supuesto de que esta metodología de corrección es la correcta, existen alimentos que pueden modelarse utilizando el gasto total, asumiendo que el mismo es exógeno. Por otra parte, en el caso de que no se rechace la endogeneidad, se observó que la corrección de la elasticidad-gasto es relevante, ya que las mismas resultan 175 subestimadas. A su vez, las curvas de elasticidades-ingreso son menores a la de las elasticidades-gasto, lo que resulta coherente en términos económicos, al considerar que la decisión de cuánto consumir y cuánto ahorrar del ingreso total, es previa a la decisión de cómo gastar. 176 Capítulo 8 Conclusiones En esta tesis se ha abordado el problema de estimación de curvas de Engel (CE) no paramétricas y semiparamétricas, en su versión de modelos parcialmente lineales, tomando el caso del consumo de alimentos en la región pampeana argentina. Específicamente, se evaluaron tales especificaciones en dos sentidos complementarios. Desde el punto de vista estadístico, se compararon diferentes estimadores no paramétricos pertenecientes a la clase de suavizados lineales, en relación a sus errores empíricos de estimación y predicción, bondad de ajuste, precisión y comportamiento en los puntos extremos, donde se revelan las mayores diferencias entre las alternativas no paramétricas seleccionadas. Adicionalmente, tales estimaciones no paramétricas son utilizadas para contrastar especificaciones paramétricas generalmente utilizadas en la literatura económica aplicada. Desde el punto de vista económico, se evaluó la validez de las conclusiones económicas obtenidas a partir de las formas de las CE arrojadas por los diferentes estimadores no paramétricos, y de las elasticidades-gasto obtenidas de los mismos. A partir de este doble análisis evaluativo se estudian los desplazamientos y posibles cambios de forma que tienen las CE ante cambios en las características demográficas. Con esto, además de obtener conclusiones relevantes sobre los cambios en los patrones de consumo de alimentos por cambios en las características, se tienen lineamientos para la incorporación de interacciones entre las características de los hogares con el poder adquisitivo de los mismos, en modelos paramétricos. En las especificaciones semiparamétricas también se comparó la performance de los métodos no paramétricos intervinientes en el procedimiento de dobles residuos. Esto se 177 realiza entre un par de estimadores elegidos previamente de la evaluación de CE totalmente no paramétricas. También se estudiaron los efectos marginales de cada característica del hogar en la participación del gasto en alimentos, y la posible endogeneidad del gasto total corregida mediante la introducción de una variable auxiliar. En lo que resta del presente capítulo se expondrán las conclusiones siguiendo el orden progresivo encontrado en los tres capítulos de la segunda parte de la tesis, correspondiente a los resultados. Por último se realizan comentarios sobre posibles extensiones y futuras líneas de investigación que se derivan de la tesis. Los primeros resultados empíricos se encuadran en un análisis más metodológico, enfocado en la elección de los ‘mejores’ suavizados para la componente no paramétrica de las CE. Inicialmente se elige un criterio uniforme para la selección de los parámetros de suavizados. Se opta por comparar tres criterios que pueden aplicarse a cualquier suavizado lineal, y que son consistentes para evaluar el error cuadrático medio del estimador. Estos son el de convalidación cruzada (CV), la versión mejorada del de información de Akaike (AICc) y el de convalidación cruzada generalizada (GCV). Este último es el que muestra un mejor desempeño junto con el AICc. Por ello, en todas las estimaciones no paramétricas de la tesis se optó por utilizar el criterio GCV, mientras que el score obtenido del AICc es presentado como una medida de performance adicional, una vez que los estimadores fueron obtenidos con el suavizado óptimo según el valor mínimo del GCV. Las CE no paramétricas estimadas para el total de alimentos y bebidas (A) mostraron un tramo creciente para el extremo inferior del gasto total, hasta que se alcanza un nivel máximo de la participación del gasto en alimentos, a partir del cual el comportamiento de las CE es compatible con la ley de Engel. El tramo creciente de la CE fue explicado por el hecho de que en hogares de menores recursos, es más probable la existencia de canastas alimenticias deficientes en cantidad y calidad. Esto hace que la mayor calidad en los alimentos se convierta en un bien de lujo en el sentido de que un aumento en el poder adquisitivo del hogar conlleva a incrementar la participación del gasto en alimentos hasta un punto para el cual los incrementos adicionales del ingreso son destinados a satisfacer otras necesidades y la participación de los alimentos comienza a decrecer, convirtiéndolos 178 en un bien necesario. Para el caso de los alimentos específicos A1-A4 se observó una mayor regularidad en la ley de Engel, con cambios en el valor absoluto de las pendientes de las rectas tangentes (y por ende, en las formas de las CE), no así en el signo, excepto para alguno estimadores cuyo menor suavizado óptimo se reflejó en una mayor variabilidad de la CE para en el extremo inferior del gasto total. Las mayores diferencias entre los estimadores se presentan en ambos extremos, mientras que en los niveles medios del gasto total son muy similares. En todos los casos, la precisión de los estimadores de las CE es menor en los extremos. En general, el estimador spline es el que muestra la menor banda de intervalos de confianza bootstrap. Con los resultados de las medidas empíricas de performance de los estimadores se llega a la conclusión de que el estimador spline es el de menor error de predicción y estimación, seguido en algunos casos por el estimador local lineal o por el local cuadrático, dependiendo del conjunto de alimentos que se esté considerando. Por su parte, el estimador N-W es superado por cualquiera de los estimadores alternativos presentados por lo que no es recomendable su uso en el análisis del comportamiento del consumidor con datos de encuestas de hogares. Los otros estimadores permiten reducir el sesgo y la varianza del estimador sin tener que incurrir en una inversión computacional cuantiosa. Se observó que las medidas de performance estadística de los estimadores no siempre son consistentes de acuerdo al ranking propuesto de mejores estimadores. Por ello se llevó a cabo un ejercicio simple de simulación en el que se detectó que el Cp y el AICc representan de mejor manera el ranking propuesto por los verdaderos errores de estimación y predicción. De los resultados empíricos se verifica esto, al ser ambas medidas las más consistentes. Por otra parte, el R-cuadrado no paramétrico, al igual que en el caso paramétrico, muestra una sensibilidad creciente respecto a los grados de libertad, por lo que la comparación de la bondad de ajuste entre estimadores no paramétricos no resulta confiable a menos que se comparen con los mismos grados de libertad. De este análisis se obtiene que el suavizado spline presenta el mayor R-cuadrado. En las elasticidades–gasto no paramétricas se obtuvo que los suavizados spline son los que tienen un mejor desempeño en términos de su interpretación económica. Por un lado, en general las curvas de elasticidades son decrecientes a lo largo del rango de ingresos o 179 gastos, mostrando una fuerte caída en los niveles de mayor poder adquisitivo, donde es esperable un mayor efecto saturación. Por otra parte, para intervalos pequeños del logaritmo del gasto total, las elasticidades-gasto obtenidas por splines muestran ser más robustas, sin cambios abruptos en la esperanza condicionada de la elasticidad, facilitando la interpretación económica. En algunos casos las elasticidades obtenidas de los polinomios locales tienen un comportamiento similar, aunque en algunos casos la variabilidad es mayor, particularmente en los extremos. Una consideración adicional que debe hacerse al respecto es que, tanto los splines como los polinomios locales lineales y cuadráticos, tienen una ventaja adicional sobre el N-W en relación al cómputo de las elasticidades: Las derivadas primeras de los primeros pueden obtenerse directamente de la estimación de la CE, mientras que en el caso del N-W es necesario aplicar métodos plugin o estimar numéricamente su derivada. A pesar de que las curvas de las derivadas y de las elasticidades-gasto mostraron algunas diferencias importantes entre estimadores, son muy similares cuando se comparan los promedios o las elasticidades valuadas en el gasto medio. Por lo tanto, si lo que interesa es una medida resumen de la elasticidad para caracterizar el comportamiento del consumidor promedio (o el comportamiento promedio del consumidor) cualquier suavizado lineal dará resultados muy similares de la elasticidad valuada en el gasto medio (o en la elasticidad promedio), por lo que pueden usarse de manera indiferente. Con los resultados de las CE no paramétricas, se implementaron dos test de especificación. Uno paramétrico, basado en una aproximación a la distribución F. Otro no paramétrico, basado en la distribución empírica del estadístico obtenida mediante réplicas bootstrap. Se probaron tres especificaciones paramétricas tipo Working-Leser: líneal, cuadrática y cúbica. Ambos test fueron bastante coincidentes, particularmente cuando el rechazo (o no rechazo) resulta más tajante según ambas pruebas. En algunos casos más intermedios, los resultados de los test divergieron. Para el caso del total de alimentos y bebidas (A) se rechazaron las tres especificaciones. De la inspección gráfica se concluye que la mejor representación, frente a las alternativas no paramétricas, viene dada por la Working-Leser cúbica. Para los conjuntos de alimentos específicos, la especificación cúbica no se rechazó en ningún caso. Sin embargo, para las carnes (A2) y las legumbres, frutas y verduras (A4), una especificación cuadrática muestra una mejor representación de 180 la CE, lo que es apoyado tanto por los resultados de los test de especificación como por la inspección gráfica. Con la selección de los ‘mejores’ estimadores no paramétricos de las CE, se procedió a analizar el comportamiento de las mismas ante diferentes sub-muestras definidas a partir de las características demográficas de los hogares. Se seleccionaron los tipos de hogares (unipersonal, nuclear sin hijos, nuclear con hijos y extendidos) y la presencia de menores de 14 años y de adultos mayores (mayores de 65 años), para representar el tamaño y la composición del hogar. Adicionalmente se tomaron dos características del jefe/a de hogar: el género y la edad. Esta última variable se categorizó a los fines de simplificar el análisis. Se tomó el criterio del ingreso percibido, lo que dividió a la muestra a partir de los 45 años de edad. Para analizar los efectos de las características de los hogares, adicionalmente de estimar CE para cada sub-muestra, se computó el denominado efecto sustitución de las características (ESC), indicando cómo cambia la asignación del gasto ante un cambio en la característica del hogar, para un nivel dado del logaritmo del gasto total. Para la estimación de las CE se utilizaron en un inicio suavizados spline y polinomios locales, de acuerdo al análisis evaluativo de tales métodos anteriormente realizado. Se encontraron pocas diferencias entre ambos a los efectos de evaluar los desplazamientos y cambios de formas de las CE, por lo que en general se optó por trabajar con suavizados spline, los que a vez mostraron un mejor comportamiento en los extremos. Considerando los tipos de hogares, se observó que la mayor diferencia en las CE se da entre los unipersonales y el resto de los hogares. No solo se evidenciaron desplazamientos sino cambios en la forma. Para los unipersonales en los niveles bajos de gasto total, se encontró una CE decreciente para el total de alimentos y bebidas, mientras que los otros tipos de hogares (al igual que en el total de la muestra), la CE es creciente. De aquí se concluyó que en los unipersonales, las necesidades en cubrir las deficiencias alimentarias son menores, por lo que un aumento en su poder de compra de los mismos disminuye la participación de los alimentos a favor de otros bienes. En los intervalos intermedios del logaritmo del gasto total no se observaron importantes cambios en la forma de las CE, sí desplazamientos horizontales. Específicamente desplazamientos hacia la derecha de pasar de un hogar más chico a otro de mayor tamaño. Este resultado pudo ser explicado tanto 181 por el enfoque de Engel como por la existencia de economías de escala en el consumo, a pesar de que ambos enfoques resulten contradictorios para cuestiones de bienestar. Más allá de los extremos, para el caso del total de alimentos y bebidas (A) el ESC entre tipos de hogares mostró ser relativamente constante para los diferentes niveles del gasto total. No se observó lo mismo para los alimentos A1-A4, donde se tienen relaciones más claras entre el ESC y el gasto total. En los niveles de gasto total más bajo, se mostró que los hogares unipersonales asignan un mayor gasto a A3 y A4 y menor a A1 y A2, respecto de los hogares nucleares y extendidos, lo que fue explicado por el costo y rendimiento de los platos que suponen los alimentos de A1 y A2, como también por la cultura culinaria argentina a favor de las pastas y las carnes. Sin embargo, en los ingresos medios, el efecto del tipo de hogar cambia, mostrando que los hogares nucleares y extendidos destinan un mayor presupuesto a los cuatro tipos de alimentos, respecto de los nucleares. El efecto de un hijo en los hogares nucleares, mostró el mismo ‘efecto tamaño’ en los niveles de menores ingresos, con una sustitución de las frutas por otro tipos de alimentos. Esto cambia a medida que el ingreso (gasto total) de los hogares se incrementa. Con estos cambios de signos del ESC se sugiere la incorporación de las interacciones entre el tipo de hogar y el gasto total, en especificaciones paramétricas; particularmente entre los hogares unipersonales y el resto. Esto se corrobora al estudiar la derivada promedio del efecto sustitución de las características, particularmente para el caso de la leche y los productos lácteos (A3) y de las frutas, legumbres y verduras, lo que también se verifica de los t-test de los coeficientes de las regresiones paramétricas con interacciones. Respecto a los menores de 14 años en el hogar, se encontró que la presencia de los mismos incrementa la participación presupuestaria de los alimentos en un 8.3% en promedio. Para los alimentos específicos, tal efecto es significativo solo en el caso de la leche y los productos lácteos (A3) y en el de harinas, panadería, arroz y pastas (A1). La curvas ESC es claramente decreciente en el logartimo del gasto total, y tal interacción resulta estadísticamente significativa en el caso del total (A), y para los alimentos específicos A1 y A3. Por su parte, se vio que la presencia de un adulto mayor tiene un efecto menor sobre las CE del total de alimentos, con un cambio de signo en el ESC, mostrando que en hogares 182 de menores ingreso, existe un menor destino de los alimentos en el presupuesto cuando hay al menos un adulto mayor, ocurriendo lo contrario en el caso de hogares con un gasto total superior a la media. Para el caso de los alimentos específicos, el mayores efectos sustitución se dan para las harinas y pastas (A1) y para las carnes (A2), donde la presencia de al menos un adulto mayor en el hogar, tiene un efecto negativo sobre estos bienes a favor de un mayor gasto en otros. Tal brecha se cierra y cambia de signo cuando el poder de compra del hogar es alto. De acuerdo a la derivada del ESC el efecto interacción con el gasto total es significativo para estos dos tipos de alimentos (A1 y A2) y para el total de alimentos y bebidas. Sin embargo, en la incorporación paramétrica, solo en este último caso la interacción entre los adultos mayores y el gasto total, mostró ser estadísticamente significativa. Sin embargo, como fue oportunamente detallado, el modelo paramétrico se corre con una variable continua que muestra la cantidad de mayores de 65 años, mientras que en el análisis del ESC se toma una binaria que refleja la presencia o ausencia del mismo. En relación a las características del jefe/a de hogar, en general se observó que para un nivel fijo de gasto total, un hogar con jefatura masculina destina una mayor parte del gasto total en alimentos, en relación a los hogares con jefas mujeres. Esto fue explicado más por el efecto tamaño que por cuestiones de género, al predominar entre los hogares con jefatura femenina, los unipersonales y nucleares con hijos y madres sin cónyuge. Se observa un importante efecto interacción, donde la brecha debido al género se va cerrando para los hogares de mayor gasto total. Considerando los conjuntos particulares de alimentos, se encontró que cuando el jefe es hombre se tiende a aumentar el consumo de carne (A2) y lo productos de A1, en relación a los hogares con jefas. Por su parte, éstas tienden a sustituir el consumo de carnes y harinas por legumbres, frutas, verduras y lácteos, principalmente en el rango de menor gasto total. En estos casos, las interacciones más relevantes se dan para A1 y A2, los que muestran una menor diferencia de género en el consumo. La edad del jefe de hogar, al igual que lo observado con la presencia de adultos mayores, mostró menores efectos interacción, con un cambio de signo en el nivel medio del gasto total. En general se encontró que la mayor edad del jefe de hogar tiende a sustituir alimentos como las harinas, los lácteos y las carnes a favor de las frutas, legumbres y verduras. Tal efecto se acentúa en los hogares con menores niveles de gasto 183 total. En este caso, solo para el caso de A1 y A2, el efecto interacción es significativo según la derivada promedio del ESC, no así en la especificación paramétrica, para la cual solo en las carnes es relevante. La última parte de la tesis consistió en el estudio de CE especificadas por medio de modelos parcialmente lineales (MLP), incorporando las características socioeconómicas y demográficas de los hogares en una sola CE. Dado que el procedimiento de dobles residuos de Robinson conlleva la estimación de p + 2 regresiones no paramétricas (donde p es la cantidad de parámetros de la componente paramétrica del MLP), se procedió a utilizar el mismo método en cada una de ellas, elegidos de acuerdo al análisis evaluativo de la componente no paramétrica (i.e. correspondiente al logaritmo del gasto total), utilizando en cada etapa el parámetro de suavizado óptimo de acuerdo al criterio GCV. Específicamente se compararon las estimaciones utilizando suavizados spline y polinomios locales, lineales o cuadráticos según la mejor performance revelada para cada conjunto de alimentos. Los resultados mostraron que los coeficientes estimados de la componente paramétrica de las CE (i.e. los correspondientes a las variables socioeconómicas y demográficas de los hogares) son prácticamente iguales, como también sus errores estándar heterocedásticos, y con ello, su significancia estadística. En relación a la parte no paramétrica, las medidas Cp y AICc revelaron menores errores para los suavizados spline, mientras que la bondad de ajuste, medida por los R-cuadrados del MLP completo, dio iguales resultados según se aplique spline o polinomios locales en las regresiones no paramétricas intervinientes. Mayores diferencias se encuentran en las elasticidades-gastos, donde nuevamente las estimaciones obtenidas con suavizado spline muestran un mejor comportamiento para el análisis económico. En general, para todos los conjuntos de alimentos, las variables que hacen al tamaño, composición y tipología del hogar, mostraron ser estadísticamente significativas, cuyos signos y magnitudes resultaron consistentes de acuerdo a lo encontrado a partir de los ESC. En los modelos semiparamétricos se incluyeron otras características del jefe, además del género y la edad, como ser el nivel de instrucción y la situación ocupacional. La primera mostró ser significativa con un efecto negativo sobre la participación del gasto en alimentos, mientras que la segunda en pocos casos mostró un impacto estadísticamente significativo. 184 Las elasticidades-gasto obtenidas de los modelos semiparamétricos mostraron diferencias relevantes respecto a las de una CE totalmente paramétrica. Particularmente, para el caso del total de alimentos y bebidas, la W-L cúbica no sólo diverge bastante de las no paramétricas sino que para los mayores niveles de gasto total reveló una clara tendencia creciente, lo que no es esperable dado el principio económico de saturación. Para los conjuntos específicos A1-A4, las elasticidades paramétricas tuvieron mayores coincidencias con las no paramétricas, aunque sin captar algunos cambios de curvatura representados por estas últimas. Al comprar los coeficientes de la componente paramétrica del MLP con los de las CE totalmente paramétricas, las diferencias son mínimas, manteniéndose las conclusiones obtenidas de la interpretación económica. Dada la posible simultaneidad de la elección del gasto total y la de un gasto en un bien en particular, se estudió la posible endogeneidad del gasto total en las CE debido a tal simultaneidad. Se realizó un procedimiento simple consistente en incorporar una variable auxiliar de forma paramétrica dentro del MLP, y estudiar su significancia. Si tal variable es estadísticamente significativa, entonces se rechaza el supuesto de exogeneidad del gasto total. Tal variable auxiliar surge de los residuos de la regresión entre el gasto total y variables instrumentales elegidas a tal efecto. Comúnmente se toma al ingreso total como instrumento al considerarlo exógeno respecto a las decisiones de gasto en bienes específicos, y por estar muy correlacionado con el gasto total. En esta tesis se consideró el ingreso total del hogar y el régimen de tenencia de la vivienda, ambos significativos para explicar el gasto total del hogar. Los resultados mostraron que sólo para el total de alimentos y bebidas y para el conjunto A1, la variable auxiliar es significativa a un nivel del 1%, mientras que para A3 lo es a un nivel del 10%. Por lo tanto, suponiendo que se cumplen los supuestos que fundamentan esta metodología, las CE de algunos alimentos pueden estimarse suponiendo que el gasto total es exógeno (como ser para A2 y A4), mientras que en otros resulta conveniente la corrección. Puesto que la corrección por endogeneidad conlleva a una a nuevas formas de cómputo de las elasticidades-gasto, los resultados muestran que las mismas tienen mayor importancia en los casos donde no se rechaza la endogeneidad, mostrando una subestimación en caso de no corregirlas. Este hecho adquiere mayor importancia cuando son comparadas con las elasticidades-ingreso, las que pudieron ser obtenidas al utilizar el ingreso total como instrumento. En general, 185 dado que la decisión de cuánto consumir y cuanto ahorrar del ingreso total, es previa a la decisión de cómo gastar, es esperable, en términos económicos, que las elasticidadesingreso sean menores a las elasticidades-gasto. Esto es corroborado al comparar las elasticidades-gasto corregidas con las elasticidades-ingreso. Sin embargo, si se toman las elasticidades sin corregir, ocurre lo contrario, principalmente en aquellos casos donde la hipótesis de exogeneidad del gasto fue rechazada. Por ello, para obtener mediciones fiables del comportamiento del consumidor, es recomendable contrastar la posible endogeneidad del gasto total. De este trabajo de tesis surgen varios aspectos que sugieren la continuación del análisis de CE no paramétricas y semiparamétricas en futuras investigaciones. En lo que sigue se enumeran algunas de ellas, las que a juicio del autor, son más relevantes: - En el proceso de evaluación de regresiones no paramétricas de CE, el estudio se acotó a una serie de suavizados lineales debido a su importancia en la literatura empírica relevada. Una extensión sería, claramente, la comparación con otros estimadores no paramétricos, como ser los suavizados utilizando funciones ortogonales o Wavelets, entre otros. Adicionalmente se podría aplicar otros métodos o medidas de evaluación para el análisis comparativo. - Existen otros métodos semiparamétricos que permitirían incorporar las variables demográficas de forma no paramétrica, y contrastar hasta que punto su incorporación paramétrica en los MLP es válida. Particularmente, con un modelo aditivo parcialmente lineal, puede trabajarse este punto. De hecho, existen trabajos recientes de este tipo, no así para el consumo de alimentos en Argentina. - Para la corrección por endogeneidad, podrían aplicarse otros métodos más recientes de variables instrumentales para MLP que descansan en supuestos más laxos, a pesar de que impliquen una implementación más costosa. - Quizás la extensión posible más evidente, es la especificación de CE por medio de un MLP con coeficientes variables o suaves (Semiparametric Varying Coefficient Model), donde los coeficientes que acompañan a las variables socioeconómicas y demográficas se especifican como funciones no paramétricas del gasto total. De 186 esta manera se tiene la incorporación de las posibles interacciones en un marco semiparamétrico de mayor flexibilidad. - Por último, en lo que hace a la relevancia para el análisis económico, su actualización es necesaria para un conocimiento más actual del comportamiento del consumidor en Argentina. Esto podrá realizarse una vez que se cuente con datos disponibles de nuevas encuestas de gastos de hogares para Argentina, o bien de la ENGH 2004/05 del total país, la que, por el momento, no fue puesta a disposición de los investigadores. 187 Anexo 1 Medidas de Performance de Estimaciones No Paramétricas de CE. Una Simulación de Monte Carlo En el presente Anexo se busca evaluar las medidas de performance que son utilizadas en la presente tesis (particularmente, en el Capítulo 5) para comparar los diferentes tipos de estimadores no paramétricos. Tal evaluación se realizará mediante un sencillo ejercicio de simulación, en donde las verdaderas curvas de Engel se corresponden con alguna versión de la forma funcional Working-Leser, sea lineal, cuadrática o cúbica. De esta manera, se generan datos a partir de la siguiente especificación polinómica general de una WorkingLeser paramétrica: wi = bi 0 + bi1 X i + bi 2 X i2 + bi 3 X i3 + u (1a) Con ( X i ~ N µ X , σ X2 ) ( ) , u i ~ N 0, σ X2 ( X i ) (2a) De (1a)-(2a) se pueden plantean tres modelos: lineal, cuadrático y cúbico. Los parámetros de los modelos son calibrados a partir de los datos de la ENGH tomando el consumo de alimentos y bebidas (A), para lo cual se tienen los siguientes valores: - Lineal: bi 0 = 1.13 , bi1 = −0.11 , bi 2 = bi 3 = 0 ; (3a) - Cuadrático: bi 0 = 0.95 , bi1 = −0.06 ; bi 2 = 0.005 , bi 3 = 0 ; (4a) - Cúbico: bi 0 = −2.36 , bi1 = 1.58 ; bi 2 = −0.27 , bi 3 = 0.014 ; (5a) 188 A su vez, se fija µ X = 6.3 y σ X2 = 0.75 . Dada las características de los datos microeconómicos, los términos de error se modelan heterocedásticos, en función de X . Para la especificación de la función de varianza se siguió a Camero y Trivedi (2005), ajustando los valores de acuerdo a la calibración basada en la ENGH. De esta manera se toma u i = ε i (0.15 − 0.2 X i con ε i ~ N (0,0.16 ) (6a) Los datos se generan considerando tres tamaños de muestra (N): 100,1000 y 5000. En base a los datos simulados, se estima el modelo E(w | X ) = m( X ) utilizando los cuatro estimadores propuestos: el N-W, polinomios locales lineales y cuadráticos, y suavizados splines, siguiendo el criterio de convalidación cruzada generalizada (GCV) para la elección del suavizado. A partir tales estimaciones se computan las medidas empíricas de performance o evaluación estadística presentados en el Capítulo 3 y aplicados en el Capítulo 6: los errores cuadráticos ECPP y EAPP, el estadístico Cp y el AICc. A los fines de evaluarlos, se los compara con el error cuadrático promedio y el error de predicción, i.e. N ECPnp ≡ N −1 ∑ (mˆ np ( X i ) − m( X i )) 2 (7a) i =1 Donde m( X i ) = ∑b ij X i j según cuál de los modelos (3a)-(4a) se está postulando, y j m̂( X i ) es el valor estimado de la función en X i , para un determinado estimador no paramétrico np, con np=N-W,PL1,PL2,SS. Adicionalmente, se computa el error promedio de predicción N ( ( ) ( )) EPPnp ≡ N −1 ∑ mˆ np X i+ − m X i+ 2 (8a) i =1 Siendo { X i+ }iN=1 una sucesión de nuevas observaciones. Puesto que en la simulación se realizan varias réplicas, si con X i ,k se denota a la observación i muestreada en la etapa k, + N N luego en la estimación del modelo con la réplica k se toma { X i }i =1 ≡ { X i ,k −1 }i =1 . Es decir, se toma como nuevo conjunto de variables para evaluar la predicción, al conjunto de covariables de la réplica anterior. Específicamente, dados los estimadores no paramétricos 189 de una réplica k, los mismos se utilizan para predecir con los valores muestreados en la etapa anterior, y a su vez, se calcula la predicción según el ‘verdadero’ modelo. De esta manera, se compararán los valores de las medidas empíricas de performance con los verdaderos errores de estimación y predicción dados por (7a) y (8a). Claro está que las conclusiones quedan acotadas a que la CE verdadera toma la forma simple dada en (1a). En la Figura A.1 se presentan las nubes de puntos generadas por los tres modelos simulados, para una determinada réplica de 1000 observaciones. Se observa que la forma funcional subyacentes a cada una de ellas no es directamente visible. Se puede ver una mayor variabilidad en el extremo inferior de las X’s, lo que es compatible con los observados de la encuesta de gastos. Figura A.1 Diagrama de puntos de los datos generados. N= 1000 Cuadrática Cúbica y y 0.0 0.0 0.2 0.2 0.2 0.4 0.4 y 0.4 0.6 0.6 0.6 0.8 Lineal 4 5 6 7 x 8 9 4 5 6 7 x 8 9 4 5 6 7 8 9 x Fuente: Datos generados a partir de los parámetros (1a)-(6a) Para esta réplica, las curvas estimadas por cada método, concatenadas con la verdadera curva, se presentan en las Figuras A.2-A.4. Las mismas ya dan una idea sobre qué estimador es más exacto en cada caso, sin embargo los resultados varían ante diferentes réplicas. Por ello, la simulación se lleva a cabo con 500 réplicas, para luego comparar los promedios de las medidas de evaluación de estimadores seleccionadas. Tales resultados son presentados en las Tablas A1-A3, para las tres formas funcionales elegidas. 190 0.6 0.6 0.7 0.7 Figura A.2 Estimaciones No Paramétricas. CE Lineal Recta verdadera Estimador N-W 0.5 0.2 0.2 0.3 0.4 w 0.4 0.3 w 0.5 Recta verdadera Estimador Local Lineal 4 5 6 7 8 9 4 5 6 X 7 9 0.6 0.6 0.7 0.7 X Recta verdadera Estimador Local Cuad 0.2 0.2 0.3 0.4 0.4 w 0.5 0.5 Recta verdadera Suavizado Spline 0.3 w 8 4 5 6 7 X 8 9 4 5 6 7 8 9 X Fuente: Funciones generadas a partir de los parámetros (3a)-(5a), y curvas no paramétricas ajustadas 191 0.6 0.6 Figura A.3 Estimaciones No Paramétricas. CE Cuadrática 0.5 Curva verdadera Estimador Local Lineal 0.0 0.0 0.1 0.1 0.2 0.2 0.3 0.3 w w 0.4 0.4 0.5 Curva verdadera Estimador N-W 4 5 6 7 8 4 9 5 6 7 8 9 X 0.6 0.6 X 0.5 Curva verdadera Suavizado Spline 0.0 0.0 0.1 0.1 0.2 0.2 0.3 0.3 w w 0.4 0.4 0.5 Curva verdadera Estimador Local Cuad 4 5 6 7 X 8 9 4 5 6 7 8 9 X Fuente: Funciones generadas a partir de los parámetros (3a)-(5a), y curvas no paramétricas ajustadas 192 0.5 0.5 Figura A.4 Estimaciones No Paramétricas. CE Cúbica Curva verdadera Estimador Local Lineal 0.2 0.2 0.3 0.3 w w 0.4 0.4 Curva verdadera Estimador N-W 4 5 6 7 8 9 4 5 6 X 7 8 9 0.5 0.5 X 0.2 0.3 w 0.2 0.3 w 0.4 Curva verdadera Suavizado Spline 0.4 Curva verdadera Estimador Local Cuad 4 5 6 7 X 8 9 4 5 6 7 8 9 X Fuente: Funciones generadas a partir de los parámetros (3a)-(5a), y curvas no paramétricas ajustadas Para el caso de que el verdadero modelo sea el lineal (Tabla A.1) se observa que mientras el estimador N-W es el que muestra los menores valores del ECPP y del EAPP, para el AICc y el Cp este estimador arroja los mayores valores. Análogamente, aunque forma inversa, ocurre con el suavizado spline. Sólo coinciden para el caso del polinomio local lineal, colocándolo en el segundo lugar en términos del menor error. Al observar los valores del ECP y el EPP, el estimador con menor error es el suavizado spline, seguido del estimador local lineal. Por lo tanto, sólo las medidas empíricas AICc y Cp proponen un ranking de evaluación consistente con los errores de estimación y predicción reales (i.e. ECP y EPP). 193 Tabla A.1 Medidas de Performance de los Estimadores. CE Lineal v ECPP EAPP AICc Cp ECP EPP 5.47 0.007976 0.070902 -3.70360 0.008886 0.00056 0.00056 4.57 0.007920 0.070613 -3.73079 0.008678 0.00046 0.00041 4.67 0.007959 0.070772 -3.72291 0.008740 0.00048 0.00049 3.56 0.008049 0.071318 -3.73699 0.008633 0.00035 0.00028 9.95 0.008445 0.073132 -3.75304 0.008614 0.00009 0.00009 4.61 0.008476 0.073269 -3.76020 0.008554 0.00005 0.00003 5.22 0.008478 0.073274 -3.75876 0.008567 0.00005 0.00004 3.95 0.008484 0.073305 -3.76055 0.008551 0.00004 0.00003 N=100 NW PLL PLC Spline N=1000 NW PLL PLC Spline N=5000 NW 15.07 0.008504 0.073365 -3.76102 0.008555 0.000026 0.000027 PLL 4.88 0.008518 0.073433 -3.76345 0.008534 0.000009 0.000006 PLC 5.61 0.008518 0.073434 -3.76312 0.008537 0.000011 0.000009 Spline 3.94 0.008521 0.073444 -3.76350 0.008534 0.000007 0.000005 Fuente: Elaboración propia en base a los resultados de las 500 replicaciones simuladas. Si la curva verdadera es la cuadrática, los estimadores que arrojan el menor error (real) son los polinomios locales cuadráticos y, nuevamente, los suavizados spline. Mientras que los estadísticos AICc y Cp muestran ser consistentes con ello, los errores medios empíricos, en términos cuadrático como absoluto, muestran resultados totalmente contrapuestos. Se observa de la Tabla A.2 que los grados de libertad óptimos (v) del estimador N-W difieren mucho del resto, y puesto que el ECPP y el EAPP no corrige por los mismos (contrariamente del Cp y el AICc), la ineficacia de tales medidas se realza con ello. 194 Tabla A.2 Medidas de Performance de los Estimadores. CE Cuadrática v ECPP EAPP 10.8 0.00764 0.06915 5.7 0.00785 4.7 AICc Cp ECP EPP -3.616 0.00951 0.00107 0.00167 0.07019 -3.7149 0.00881 0.00064 0.00074 0.00796 0.07077 -3.7229 0.00876 0.00048 0.00049 4.8 0.00797 0.07101 -3.7199 0.00878 0.00047 0.00047 18.8 0.0084 0.07292 -3.7402 0.00872 0.00018 0.00022 9.7 0.00843 0.07302 -3.7556 0.00859 0.00009 0.00010 5.2 0.00848 0.07327 -3.7588 0.00857 0.00005 0.00004 6.5 0.00847 0.07324 -3.7574 0.00858 0.00006 0.00005 23.7 0.00851 0.07339 -3.7569 0.00859 0.00006 0.00007 13.6 0.0085 0.07335 -3.762 0.00855 0.00002 0.00003 5.6 0.00852 0.07343 -3.7631 0.00854 0.00001 0.00001 8.0 0.00851 0.07342 -3.7626 0.00854 0.00001 0.00001 N=100 N-W PLL PLC Spline N=1000 N-W PLL PLC Spline N=5000 N-W PLL PLC Spline Fuente: Elaboración propia en base a los resultados de las 500 replicaciones simuladas. Para el caso del modelo cúbico, las conclusiones son similares, aunque mientras las medidas empíricas muestran valores que sugieren indiferencia entre la elección de dos estimadores alternativos, las medidas reales de error, muestran un clara superioridad del spline cuando N=100 y N=1000 (aunque una menor diferencia en este último caso), y para N=5000, donde los errores se reducen considerablemente, el polinomio local cuadrático supera al spline. 195 Tabla A.3 Medidas de Performance de los Estimadores. CE Cúbica v ECPP EAPP AICc Cp ECP EPP 5.98 0.00793 0.07068 -3.6971 0.00893 0.00059 0.000604 4.9 0.0079 0.07049 -3.7255 0.00872 0.00054 0.000563 4.91 0.00794 0.07067 -3.7198 0.00876 0.00053 0.000593 4.1 0.00803 0.07127 -3.7271 0.00871 0.00045 0.00045 10.7 0.00844 0.0731 -3.7522 0.00862 0.00010 0.00010 7.78 0.00845 0.07314 -3.757 0.00858 0.00008 0.00009 6.58 0.00847 0.07322 -3.7574 0.00858 0.00007 0.00007 7.02 0.00846 0.07323 -3.7567 0.00858 0.00006 0.00006 16.1 0.0085 0.07336 -3.7608 0.00856 0.00003 0.00003 12 0.0085 0.07336 -3.7622 0.00854 0.000023 0.000024 7.86 0.00851 0.07342 -3.7626 0.00854 0.000016 0.000016 9.41 0.00851 0.07341 -3.7622 0.00854 0.000017 0.000017 N=100 NW PLL PLC Spline N=1000 NW PLL PLC Spline N=5000 NW PLL PLC Spline Fuente: Elaboración propia en base a los resultados de las 500 replicaciones simuladas. Mientras que las medidas de error ECP y EPP muestran disminuciones considerables con el tamaño de muestra, siendo esto consistente con la teoría estadística, no se observa lo mismo en las medidas empíricas. Por lo tanto, este ejercicio de simulación ha mostrado que las medidas más simples para evaluar la performance y comparar estimadores no paramétricos, el ECPP y el EAPP, no resultan muy recomendables si el modelo que se está estimando tiene una función ‘muy’ suave y simple como ser lineal, cuadrático o cúbico. Sin embargo, las mismas son muy utilizadas en la literatura empírica, por lo que estos resultados buscan mostrar una alerta 196 para las futuras investigaciones. Como contraparte se observa que los estadísticos Cp y AICc muestran muy buen desempeño para tales fines. Para una interpretación cautelosa de estos resultados deben tenerse en cuenta las siguiente consideraciones: 1) Para cada estimador se aplicó el criterio de convalidación cruzada generalizada (GCV) para la obtención del suavizado óptimo. Por lo tanto, otro criterio podría arrojar diferentes resultados para las medidas de evaluación. 2) Las CE que se proponen como verdaderas, adoptan una forma quizás muy simple y suave para evaluar el desempeño de las medidas empíricas. Sin embargo, tales formas funcionales son las más vistas como especificaciones paramétricas en la literatura micro-econométrica. 3) Quizás sea más informativo evaluar las medidas empíricas para estimadores con los mismos suavizados o grados de libertad. Pero si se quiere evaluar la decisión del investigador aplicado, en elegir el método y luego suavizarlo con algún criterio automático, es más informativo mirar el output que tendría de su elección. 4) Para los datos reales (Capítulo 5), se observaron mayores coincidencias entre las medidas de performance, por lo que su uso complementario puede ser recomendable, y más aún cuando no puede probarse estadísticamente que las CE se corresponden con alguna forma simple conocida, como ocurre para el caso de alimentos y bebidas en general. 197 Anexo 2 Resultados de las Especificaciones Paramétricas En este Anexo se presentan los resultados de las estimaciones de las CE paramétricas, seleccionadas de acuerdo a los resultados de los test de especificación. Los mismos constituyen un soporte adicional para los capítulos 6 y 7. En un caso, presentando los resultados de las especificaciones paramétricas incluyendo solo las características demográficas de los hogares, con sus interacciones relevantes, analizadas en el capítulo 6. Luego se presentan los resultados de la CE incluyendo adicionalmente la situación ocupacional y educación del jefe de hogar, en este caso sin interacciones, con el objetivo de comparar con los resultados de las CE semiparamétricas del capítulo 7. Si bien para el caso del total de alimentos y bebidas se rechazaron las tres especificaciones tipo W-L, se seleccionó la cúbica como la mejor alternativa frente a la lineal y a la cuadrática. Para los casos de los conjuntos A1-A4, se tiene que varias formas de la W-L no fueron rechazadas. Junto con la inspección gráfica se seleccionaron la cúbica para A1 y A3, y la cuadrática para A2 y A4. En el capítulo 6, a partir de las derivadas promedios del ESC, se detectan las interacciones más relevantes. Al incluirlas en una especificación paramétrica, lo resultados no son totalmente coincidentes respecto a la significancia estadística de las interacciones. Sin embargo, como se explicó oportunamente, para la construcción de las curvas ESC es necesario la definición de categorías simples que representen a las características demográficas de los hogares, mientras que en los modelos paramétricos algunas de tales características fueron incluidas como variables continuas o de conteo, como ser la edad y la composición etaria. Por ello es esperable que las conclusiones de ambos análisis difieran en algún punto. 198 En la Tabla A.4 se presentan las salidas de los modelos paramétricos seleccionados, incluyendo solo las características demográficas analizadas por medio de las curvas ESC42. Tabla A.4 CE Paramétricas con Variables Demográficas e Interacciones. A1-A4 Alimentos Variables jedad jgenero menor14 mayor65 tipo2 tipo3 tipo4 ln G ln G2 ln G3 jgenero * ln G A1 A2 A3 A4 0.0005*** (0.00005) 0.0353*** (0.0134) 0.0330*** (0.0054) -0.0055*** (0.0012) 0.0150*** (0.0022) 0.0872*** (0.0156) 0.105*** (0.0187) 0.0728 (0.104) -0.0248 (0.0162) 0.0018** (0.0008) -0.0044** (0.002) -0.00014 (0.00049) 0.0563*** (0.0185) 0.0042*** (0.0007) -0.0074*** (0.0017) 0.0236*** (0.0033) 0.0396*** (0.0028) 0.0450*** (0.003) -0.109*** (0.0170) 0.0043*** (0.0012) 0.0001*** (0.00003) -0.0003 (0.001) 0.0144*** (0.0044) 0.0024*** (0.0009) -0.0408** (0.0161) -0.0321** (0.0155) -0.0441** (0.0172) -0.201** (0.0852) 0.0249* (0.0131) -0.0011* (0.0007) 0.0005*** (0.00004) 0.0024* (0.0012) 0.0036*** (0.0004) -0.0009 (0.0011) -0.0253 (0.019) -0.0131 (0.0168) -0.0425** (0.0186) -0.0588*** (0.0112) 0.0022** (0.0009) jedad * ln G menor14 * ln G -0.006** (0.0028) 0.0001* (0.00007) -0.0037*** (0.0008) tipo2 * ln G tipo3 * ln G tipo4 * ln G Constante R2 -0.0096*** (0.0024) -0.0114*** (0.0029) 0.109 (0.220) 0.366 0.546*** (0.0623) 0.292 -0.0015** (0.0007) 0.007*** (0.0025) 0.0064*** (0.0024) 0.0079*** (0.0027) 0.593*** (0.182) 0.192 0.0059** (0.003) 0.0045* (0.0026) 0.0089*** (0.0029) 0.304*** (0.0364) 0.229 Notas: Errores estándar heterocedásticos (robustos) entre paréntesis.***significativo al 1%; **significativo al 5%; * significativo al 10%. Tipo de hogar base: tipo 2, nuclear sin hijos. Fuente: Elaboración propia Para el total de alimentos y bebidas, en el capítulo 6 se presentan modelos paramétricos correspondientes (Tabla 6.3). 42 199 El análisis de las interacciones son tratadas en el capítulo 6. Conviene aclarar nuevamente que los coeficientes de las variables ‘propias’ que a su vez son incorporadas con su efecto interacción, ahora representan el efecto marginal sobre la participación del gasto cuando el logaritmo del gasto total es igual a cero. Por lo tanto el signo y magnitud de tales coeficientes no es comparable con las salidas de la componente paramétricas de los MLP. Para comparar las especificaciones semiparamétricas (MPL) con las paramétricas, los resultados de esta última son presentados en la tabla A.5. De los resultados de las componentes paramétricas de los MLP presentados en las tablas 7.1-7.5, se observa que los efectos marginales de las características socioeconómicas y demográficas de los hogares son muy similares, y en algunos casos iguales, a los del modelo totalmente paramétrico. Sin embargo, en el capítulo 7 se vio que en las elasticidades-gasto, las que son funciones del efecto marginal del gasto total, se observan importantes diferencias. Los R-cuadrados de los modelos paramétricos son menores a los de los semiparamétricos. Aquí debe notarse que para la estimación del efecto del gasto total, en los modelos paramétricos se utilizan a lo sumo cuatro parámetros incluyendo al intercepto, mientras que en los modelos semiparamétricos el valor óptimo de v (esto es, la cantidad equivalente de parámetros para estimar la componente no paramétrica) en general supera a cuatro. Por lo tanto, entre las especificaciones paramétricas y semiparamétricas, no existen muchas diferencias en las estimaciones de los parámetros (y en sus desvíos estándar) respecto a la componente paramétrica de estos últimos, sí en el impacto estimado del gasto total. A pesar de ello, como se vio en los capítulo 5 y 7, si se toma el promedio, sea través de las derivadas evaluadas en el gasto medio o en las derivadas promedio ponderadas por la distribución del logaritmo del gasto total, las diferencias entre el efecto no paramétrico y el paramétrico del gasto total resultan en muchos casos despreciables. 200 Tabla A.5 CE Paramétricas Seleccionadas. Total Alimentos y Bebidas (A) y Subconjuntos A1-A4 Variables jedad jgenero adultos menor14 mayor65 tipo2 tipo3 tipo4 asalariado patron edu ln G ln G2 ln G3 Constante Observaciones R 2 Alimentos A2 A A1 A3 A4 0.0012*** (0.0002) 0.0324*** (0.0046) 0.0243*** (0.0018) 0.0253*** (0.0016) 0.0208*** (0.0047) 0.0217*** (0.0075) 0.0328*** (0.0071) 0.0252*** (0.0082) 0.0014 (0.0049) 0.0085 (0.0052) -0.0343*** (0.0048) 1.551*** (0.297) -0.272*** (0.0468) 0.0145*** (0.0024) -2.375*** (0.623) 0.0001 (0.0001) 0.0013 (0.0014) 0.0104*** (0.0006) 0.0102*** (0.0005) 0.0083*** (0.0015) 0.0119*** (0.0022) 0.0126*** (0.0022) 0.0112*** (0.0027) -0.0042*** (0.0015) -0.0021 (0.0016) -0.0063*** (0.0012) 0.135 (0.102) -0.0355** (0.016) 0.0022*** (0.0008) 0.0310 (0.217) 0.0004*** (0.00007) 0.0128*** (0.002) 0.0081*** (0.0008) 0.0044*** (0.0007) 0.0046** (0.0021) 0.0183*** (0.0033) 0.025*** (0.003) 0.0242*** (0.0036) 0.00008 (0.0021) 0.0027 (0.0023) -0.0113*** (0.0018) -0.101*** (0.0151) 0.0038*** (0.0012) 0.0004*** (0.00004) 0.0002 (0.0013) 0.0038*** (0.0005) 0.0038*** (0.0004) 0.0043*** (0.0013) 0.0066*** (0.0021) 0.006*** (0.002) 0.0014 (0.0023) -0.0022* (0.0013) -0.0012 (0.0014) -0.003*** (0.0012) -0.0621*** (0.0109) 0.0028*** (0.0008) 0.522*** (0.0495) 0.0001*** (0.00004) -0.0009 (0.0011) 0.0011** (0.0004) 0.0049*** (0.0004) 0.0038*** (0.0011) 0.0008 (0.0017) 0.0051*** (0.0017) 0.0022 (0.002) 0.0008 (0.0012) 0.0004 (0.0012) 0.0014 (0.001) -0.241*** (0.0858) 0.0314** (0.0132) -0.0015** (0.0007) 0.666*** (0.184) 7,592 0.340 7,500 0.386 7,107 0.306 6,705 0.191 7,258 0.235 0.307*** (0.0356) Notas: Errores estándar heterocedásticos (robustos) entre paréntesis.***significativo al 1%; **significativo al 5%; * significativo al 10%. Tipo de hogar base: tipo 2, nuclear sin hijos. Fuente: Elaboración propia 201 Referencias ABDI, H. (2007). The Method of Lest Squares. En Salkind, N.J. Measurement and Statistics (p. 530). Thousand Oaks (CA): Sage. (Ed.). Encyclopedia of ALLEN, D. M. (1974). The relationship between variable selection and data augmentation and a method for prediction. Technometrics, 16,125–127. ALLEN, R. G. AND A. BOWLEY (1935). Family Expenditure: A Study of its Variation. London: P.S. King & Son. ALTHAUSER, R. (1971). Multicollinearity and Non-additive Regression Models. In Causal Models in the Social Sciences, H. M. Blalock Jr. (ed). Chicago: Aldine-Atherton. ALVAREZ, M. AND L. PINOTTI (1999). A la Mesa. Ritos y retos de la Alimentación Argentina. Buenos Aires: Grijalbo Editorial. AYDIN D. (2007). A Comparison of the Nonparametric Regression Models using Smoothing Spline and Kernel Regression. World Academy of Science, Engineering and Technology, 36, 253-257. AYDIN D. AND R. OMAY (2007). The Empirical Performances of the Selection Criteria for Nonparametric Regression Using Smoothing Spline. Proceedings of the 5th WSEAS Int. Conf. on Computational Intelligence, Man- Machine Systems and Cybernetics, Venice, Italy, November 20-22. BHALOTRA, S. AND C. ATTFIELD (1998). Intrahousehold Resource Allocation in Rural Pakistan: a Semiparametric Analysis. London School of Economics and Political Science Discussion Paper, DEDPS/11. BANKS J., BLUNDELL, R. AND A. LEWBEL (1997). Quadratic Engel Curves and Consumer Demand. Journal of Economics and Statistics, 79 (4), 527-539. BARNETT W. A. AND A. SERLETIS (2008). Consumer Preferences and Demand Systems. Journal of Econometrics, 79 (4), 527-539. BARRIENTOS MARÍN, J. (2006). Estimation and Testing An Additive Partially Linear Model in a System of Engel Curves. EVIE Working Papers, WP-AD 2006-23, University of Alicante. BARRIENTOS MARÍN, J. (2009). On the Consumer Behavior in Urban Colombia: The Case of Bogotá. Ensayos sobre Política Económica (Colombia), 27 (59), 46-82. BARRIENTOS MARÍN, J., GALLEGO J. Y J. SALDARRIAGA (2011). La Curva de Engel de los Servicios de Salud en Colombia. Una Aproximación Semiparamétrica. Lecturas de Economía, 74, 203-229. BARTEN, A. (1969). Family Composition, Prices and Expenditure Patterns. In Econometric Analysis for National Economic Planning, P. Hart, G. Mills and Jhon k. Whitaker (eds.), London: Butterworths. BERGES, M. Y K. CASELLAS. (2007). Estimación de un Sistema de Demanda de Alimentos: Un Análisis Aplicado a Hogares Pobres y No Pobres. En Da Silveira F., Servo L., Menezes, T. y Piola S. (comp.), Gasto e Consumo das Famílias Brasileiras Contemporâneas. Vol. 2 (pp. 529-551), IPEA, Brasilia. 202 BERGES, M. (2010). Escalas de Equivalencia y Cambios en el Nivel de Bienestar de los Hogares de la Ciudad de Buenos Aires. Anales de la XLV Reunión Anual de la Asociación Argentina de Economía Política, Buenos Aires. BIERENS, H. (1990). A Consistent Conditional Moment Test of Functional Form. Econometrica, 58, 1443-1458. BIERENS, H. AND H. POTT-BUTER (1990). Specification of Household Engel Curves by Nonparametric Regression. Econometric Reviews, 9, 123-184. BLAUG, M. (1985) Metodología de la Economía. Madrid: Editorial Alianza Universidad BLOW, L. (2003). Demographics in Demand Analysis. The Institute for Fiscal Studies, Working Paper 03/18. BLUNDELL, R. AND A. DUNCAN (1998). Kernel Regression in Empirical Microeconomics. The Journal of Human Resources, 33 (1), 62-87. BLUNDELL R. DUNCAN A. AND PENDAKUR K.(1998). Semiparametric Estimation and Consumer Demand” Journal of Applied Econometrics, 13, 435-461. BLUNDELL, R., BROWNING, R, AND I. CRAWFORD (2003). Nonparametric Engel Curves and Revealed Preference. Econometrica, 71 (1), 205-240. BLUNDELL, R., CHEN X. AND D. KRISTENSEN (2007). Semi-Nonparametric IV Estimation of Shape-Invariant Engel Curves. Econometrica, 75(6), 1613-1669. BORRÁS CATALÁ V. (2007). Las Desigualdades en el Consumo a través del Género. Revista Española de Sociología, 8, 139-156. BROWN, A. AND A. DEATON (1972) Surveys in Applied Economics: Models of Consumer Behavior. The Economic Journal, 82 (328), 1145-1236. BROWN (2011). Qualitative Exploration of the Influence of Culture and Extended Family Networks on the Weight-Related Behaviors of Urban African American Children. Ph.D. Dissertation, Johns Hopkins University, Baltimore, Maryland. CAI, Z., J. FAN, AND Q. YAO (2000). Functional-coefficient Regression Models for Nonlinear Time Series. Journal of the American Statistical Association, 95, 941-956. CAMERON, A. C. AND P. K. TRIVEDI (2005). Microeconometrics: Methods and Applications. New York: Cambridge University Press. CARUGATI, M. (2008). Estimación de Curvas de Engel en Argentina. Tesis de Grado (Economía), UNMP. CHACKRABARTY, M. AND W. HILDENBRAND (2011). Engel’s Law Reconsidered. Journal of Mathematical Economics, 47(3), 289-299. CHAI A. AND A. MONETA (2008). At the Origins of Engel Curves Estimation. Papers on Economic and Evolution, No. 0808, Max Planck Institute of Economics. CHAI A. AND A. MONETA (2011). Back to Engel? Some Evidence for the Hierarchy of Needs. Papers on Economic and Evolution, No. 1113, Max Planck Institute of Economics. 203 CHAMBERS, J. M. AND T. J. HASTIE (1992). Statistical Models in S. London: Wadsworth & Brooks/Cole. CLEVELAND W. AND S. DEVLIN (1988). Locally Wighted Regression: An Aproach to Regression Analysis by Local Fitting. Journla of the Amercian Statistical Association, 83, 596-610 COSTA, D. (2000). American Living Standards, 1888-1994: Evidence From Consumer Expenditures. NBER Working Papers 7650, National Bureau of Economic Research, Inc. COSTA, D. (2001). Aggregation, Rank and Some Historical Engel Curves. Economic Letters, 70, 183-186. CLARK, R. (1975). A Calibration Curve for Radiocarbon Dates. Antiquity, 49, 251-266. DEATON, A. (1988). Quality, Quantity, and Spatial Variation of Price. The American Economic Review, 78(3), 418-430. DEATON, A. AND J. MUELLBAUER (1980a). Economics and Consumer Behavior. Cambridge: Cambridge University Press. DEATON, A. AND J. MUELLBAUER . (1980b). An almost Ideal Demand System. The American Economic Review, 70 (3), 312-326. DEATON, A. AND C. PAXSON (1998). Economies of Scale, Household Size, and the Demand for Food. The Journal of Political Economy, 106 (5), 897-930. DEATON, A. AND C. PAXSON (2003). Engel’s What? A Response to Gan and Vernon. The Journal of Political Economy, 111 (6), 1378-1381. DELGADO, M. A. AND D. MILES (1997). Household Characteristics and Consumption Behaviour: A Nonparametric Approach. Empirical Economics, 22 (3), 409-429. DEPETRIS GUIGUET E. Y R. GARCÍA ARANCIBIA. (2011). Diferencias de Género en el Consumo de Alimentos Fuera del Hogar en la Región Pampeana en los ’90. Documentos de Trabajo del IECAL, 12-11, Universidad Nacional del Litoral. DÍAZ MÉNDEZ, C. Y C. GÓMEZ BENITO (2001). Del Consumo Alimentario a la Sociología de la Alimentación. Distribución y Consumo, 60, 5-22. DOKSUM, K. AND A. SAMAROV (1995). Global Functional and a Measure of the Explanatory Power of Covariates in Regression. The Annals of Statistics, 23(5), 1443-1473. ENGEL, E. (1857). Die Productions- und Consumtionsverhaltnisse des Königreichs Sachsen. En Zeitschrift des Statistischen Bureaus des Königlich-Sächsischen, Ministerium des Innern, No. 8 (9), 1-54. ENGEL, J. AND A. KNEIP (1996). Recent Approaches to Estimating Engel Curves. Journal of Economics, 63 (2), 187-212. FAN, Y. AND Q. LI (2002) .A Consistent Model Specification Test Based on the Kernel Sum of Squares of Residuals. Econometric Reviews, 21(3): 337-352. FLEISCHER, A. AND J. RIVLIN (2009). More or Better? Quantity and Quality Issues in Tourism Consumption, Journal of Travel Research, 47(3), 285-294. 204 FOUSEKIS, P. AND P. LAZARIDIS (2001). Food Expenditure Patterns of the Urban and the Rural Households in Greece. A Kernel Regression Analysis. Agricultural Economic Review, 2 (1), 5-19. GAN, L. AND V. VERNON. (2003). Testing the Barten Model of Economies of Scale in Household Consumption: Toward Resolving a Paradox of Deaton and Paxson. The Journal of Political Economy, 111 (6), 897-930. GARCÍA ARANCIBIA, R. (2011). Curvas de Engel de Alimentos Fuera del Hogar según Circunstancia de Consumo. El Caso de Argentina. Próximamente en Cuadernos de Economía, 58 (1) (en prensa). GARCÍA ARANCIBIA, R. (2012). Alcohol en el Presupuesto Familiar: Incidencia del Poder Adquisitivo y de la Composición Demográfica del Hogar. Próximamente en Papeles de Población. GARCÍA ARANCIBIA R., ROSSINI G. Y DEPETRIS GUIGUET E. (2009a). Incorporación de Decisiones Binarias Cruzadas en la Elección del Consumo de Lácteos en un Modelo LA/AIDS. II Congreso de Matemática Aplicada, Computacional e Industrial, SIAM, Rosario, Argentina. GARCÍA ARANCIBIA, R., ROSSINI, G Y DEPETRIS GUIGUET (2009b). Corrección de Datos Censurados en Sistemas de Demanda Mediante un Probit Multivariado. Una Aplicación al consumo de tipos de Carnes. XXXVII Coloquio Argentino de Estadística, UNCa, SAE, Octubre. GARCÍA ARANCIBIA, R, DEPETRIS GUIGUET, E. Y G. ROSSINI (2012). Consumo de Alimentos Fuera del Hogar en Argentina. Relevancia de la Composición Demográfica y Tipología de los Hogares. Próximamente en Población y Salud en Mesoamerica, Costa Rica. GARCÍA ARANCIBIA, R, DEPETRIS GUIGUET, E. , VICENTIN J. Y M. CORONEL (2012). Consumo de Alcohol en los Hogares y Diferencias de Género para un Tratamiento Equitativo en las Políticas de Prevención. Actas de Primeras Jornadas Internacionales Sociedad, Estado y Universidad, Noviembre, Mar del Plata. GONG X., VAN SOEST AND P. ZHAN (2000). Sexual Bias and Household Consumption: A Semiparametric Analysis of Engel Curves in Rural China. IZA Discussion Paper, 212. GREEN, P.J. AND B. W. SILVERMAN (1994). Nonparametric Regression and Generalized Linear Models: A Roughness Penalty Approach. New York: Chapman & Hall. HAQUE, O. M. (2005). Income Elasticity and Economic Development. Methods and Application. Advances Studies in Theorical and Applied Econometrics, Vol. 42, The Netherlands: Springer. HÄRDLE, W. (1991). Applied Nonparametrics Regression. Cambridge: Cambridge University Press. HÄRDLE, W. AND E. MAMMEN (1993). Comparing Nonparametric versus Parametric Regression Fits. Annals of Statistics, 21, 1926-1947. 205 HÄRDLE, W., MÜLLER M., SPERLICH, S. AND A. WERWATZ (2004). Nonparametrics and Semiparametrics Models. An Introducction. Berlin: Springer. (e-book: http://fedc.wiwi.hu-berlin.de/xplore/ebooks/html/spm/) HAUSMAN, J., NEWEY, W. AND J. POWELL (1995) “Nonlinear Errors in Variables. Estimation of Some Engel Curves. Journal of Econometrics, 65, 205–233. HAYFIELD, T AND J. S. RACINE (2008). Nonparametric Econometrics: The np Package. Journal of Statistical Software, 27 (5), 1-32. HERRERO ZAMORA, V. (2010). Ser Jefe en las Estadísticas Argentinas. Revista d'Estudis de la Violencia, ICEV, 10. HIMMELWEIT S., SIMONETTI R. AND A. TRIGG (2001). Microeconomics: Neoclassical and Institutionalist Perspectives on Economic Behaviour. London: Thomson. HOUTHAKKER, H.S. (1957). An International Comparison of Household Expenditure Patterns, Commemorating the Centenary of Engel’s Law. Econometrica, 25, 532-551. HUANG L.S AND J. CHEN (2008). Analysis of Variance, Coefficient of Determination and FTest for Local Polynomial Regression. The Annals of Statistics, 36 (5), 2085-2109. HURVICH, C., SIMONOFF, J. AND C. L. TAI (1998). Smoothing Parameter Selection in Nonparametric Regression using Improved Akaike Information Criterion. Journal of the Royal Society, Series B, 60, 271-293. IYENGAR, N. S. (1967). Some Estimates of Engel Elasticities Based on Nacional Sample Survey Data. Journal of the Royal Statistical Society, Serie A, 130 (1), 431-433. JENSEN, R. (2004). Socioeconomic Status, Nutrition, and Health among the Elderly. In Perspectives on the Economics of Aging (National Bureau of Economic Research Conference Report), David Wise (ed.), , Chicago: University of Chicago Press. LEE, T-H AND A. ULLAH (2003). Nonparametric Bootstrap Specification Testing in Econometric Models. In Computer Aided Econometrics, Chapter 15, edited by David Giles, Marcel Dekker, New York, 451-477. LEFÈBVRE M. (2006). Population Ageing and Consumption Demand in Belgium. CREPP Working Paper 2006/04. LESER, C.B.V. (1964). Forms of Engel Functions. Econometrica, 32 (4), 694-703. LEWBEL, A. (1991). The Rank of Demand System: Theory and Nonparmetric Estimation. Econometrica, 59, 711-730. LEWBEL, A. (2006). Engel Curves. In: The New Palgrave Dictionary of Economics, S. N. Darluf & L. E. Blume (Eds.), 2nd Ed., Palgrave Mcmillan. LI, Q. (1998). Some Simple Consistent Test for a Parametric Regression Function versus Semiparametric or Nonparametric Alternatives. Manuscript, Department of Economics, University of Guelph. LI, Q. AND S. WANG (1998). A Simple Consistent Bootstrap Test for a Parametric Regression Function., Journal of Econometrics, 87(1), 145-165. LI, Q. AND J. S. RACINE. (2004). Cross-Validated local linear Nonparametric Regression. 206 LI, Q. AND J. S. RACINE (2006). Nonparametric Econometrics. Theory and Practice. New Jersey: Princeton University Press. LOADER, C. (1999). Local Regression and Likelihood. Berlin: Springer. LOADER, C. (2004). Smoothing: Local Regression Techniques. Papers / Humboldt Universität Berlin, Center for Applied Statistics and Economics (CASE), No. 2004, 12, (Disponible en: http://hdl.handle.net/10419/22186) LOADER, C. (2010). locfit: Local Regression, Likelihood and Density Estimation.. R package version 1.5-6. ( http://CRAN.R-project.org/package=locfit) LYSSIOTOU, P., PASHARDES, P. AND T. STENGOS (2008). Demographic vs Expenditure Flexibility in Engel Curves. Empirical Economics, 34, 257-271. MACKINNON, J. G. (2006). Bootstrap Methods in econometrics. The Economic Record, 82 (special issue, September), S2-S18. MALLOWS, C. L. (1973). Some Comments on Cp. Technometrics, 15, 661-675. MARRON, J. S. AND HÄRDLE, W. (1986) Random Approximations to Some Measures of Accuracy in Nonparametric Curve Estimation. Journal of Multivariate Analysis, 20, 91113. MISHAN, E. J. (1961). Theories of Consumer’s Behaviour: A Cynical View. Economica. 28 (109): 1-11. NADARAYA, E. A. (1964). On Estimating Regression. Theory of Probability and Its Applications, 9, 141-142. NAMIE, J. (2008). The Power of Children Over Household Food Consumption. Anthropology News, April, 10-12. NEWEY, W. (1994). The Asymptotic Variance of Semiparametric Estimators. Econometrica, 62, 1349-1382. NØRGAARD, M., BRUNSØ, K. ; Christensen, P. & M. Mikkelsen (2007). Children's influence on Participation in the Family Decision Process During Food Buying. Young Consumers, 8 (3), 197-216. OZER-BALLI, H. AND B. E. SØRENSEN (2012). Interacction Effects in Econometrics. Forthcoming in Empirical Economics. PARPIEV, Z. AND K. YUSUPOV (2011). Testing Household Economies of Scale in Uzbekistan. Eurasian Journal of Business and Economics, 4 (7), 25-51. PAGAN, A. AND A. ULLAH (1999). Nonparametric Econometrics. Cambridge: Cambridge University Press. PERALI, F. (2008). The second Engel law: Is it a paradox? European Economic Review, 52 (8), 1353-1377. PIZZOLITTO, G. (2007). Curvas de Engel de Alimentos, Preferencias Heterogéneas y Características Demográficas de los Hogares: Estimaciones para Argentina. Documentos de Trabajo CEDLAS, 45, UNLP. 207 PRAIS S. AND H. HOUTHAKKER (1955). The Analysis of Family Budgets, Cambridge: Cambridge University Press. R-PROJECT. The R- Project for Statistical Computing. (http://www.r-project.org/) RACINE, J. S. (2008). Nonparametrics Econometrics: A Primer. Foundations and Trend in Econometrics, 3 (1), 1-88. RACINE, J. S. (2009). Nonparametric and Semiparametric Methods. In R.I Qi-Li and Jeffrey S. Racine (ed.) Nonparametric Econometric Methods (Advances in Econometrics, Volume 25, Emerald Group Publishing Limited, 335-375. RESTREPO, S. AND M. MAYA (2005). La Familia y su papel en la Formación de Hábitos Alimentarios en el Escolar. Un Acercamiento al la Cotidianidad. Boletín de Antropología, 19 (36), 127-148. RILSTONE, P. AND A. ULLAH (1989). Nonparametric Estimation of Response Coefficients. Communication in Statistics, Theory and Methods, 18, 2615-2627. ROBINSON, P. (1988). Root-N-Consistent Semiparametric Regression. Econometrica, 56, 931954. RODRÍGUEZ ESCOBAR, G. (2005). Alimentación y Nutrición del Adulto Mayor. Revista de la Facultad de Medicina, 10 (1), 17-24. ROSSINI, G., DEPETRIS GUIGUET, E. Y GARCÍA ARANCIBIA, R. (2008). La Demanda de Alimentos en Argentina. Un Modelo LA/AIDS con datos de Encuestas de Hogares. Anales de la XLIII Reunión Anual de la AAEP, Córdoba. ROSSINI, G. Y DEPETRIS GUIGUET, E. (2008). Demanda de alimentos en la región pampeana Argentina en la década de 1990: Una aplicación del modelo la-AIDS. Agroalimentaria, 14 (27), 55-65. SCARANO E. (2002). Teorías Económicas a priori. Anales de XXXVII Reunión Anual la Asociación Argentina de Economía Política, San Miguel de Tucuman. SPERLICH, S. (2007). A Note on Non-Parametric Estimation with Constructed Variables and Generated Regressors. Social Science Research Network (SSRN: http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1010923). SMITH, K. W. AND M. S. SASAKI (1979). Decreasing Multicollinearity: A Method for Models with Multiplicative Functions. Sociological Methods and Research, 8, 35-36. STIGLER, G. (1954). The Early History of Empirical Studies of Consumer Behavior. The Journal of Political Economy, 62 (2), 95-113. SULGAHAM, A. K. AND H. O. ZAPATA (2006). A Semiparametric Approach to Estimate Engel Curves using the US Micro Data. American Agricultural Economics Association Annual Meetings, Long Beach, California. SPECKMAN, P. (1988). Kernel Smoothing in Partial Linear Models. Journal of the Royal Statistical Society, Series B, 50, 413-436 STATACORP LP. STATA- Data Analysis and Satatistical Software (www.stata.com). 208 TREAS, J. AND S. DROBNIC (2010). Dividing the Domestic. Men, Woman and Household Work in Cross-National Perspective. Stanford: Stanford University Press. ULLAH, A. (1985). Specification Analysis of Econometric Models. Journal of Quantitative Economics, 1, 187-209. ULLAH, A. (1988). Nonparametric Estimation and Hypothesis Testing in Econometric Models. Empirical Economics, 13, 223-249. VERNON, V. (2004). Household Economies of Scale, Food Consumption and Intra-Household Allocation of Time. Ph.D. Dissertation, The University of Texas at Austin. WAHBA , G. AND S. WOLD (1975). A Completely Automatic French Curve: Fitting Spline Functions by Cross-Validation. Communications in Statistics, Series A, 4, 1-17. WANG, H., MOK, C. F., AND J. FOX (1995). Food expenditure patterns of elderly consumers: A question of time allocation. Family Economics and Resource Management Biennial: The Journal of the FERM, Section of AAFCS I, 185-192. WASSERMAN, L. (2006). All of Nonparametric Statistics. New York: Springer WATSON, G. S. (1964). Smooth Regression Analysis. Sankhya, 26, 359-372. WEIMER, J. (1998). Factors Affecting Nutrient Intake of the Elderly. Agricultural Economic Report No. 769, Food and Rural Economics Division, Economic Research Service, U.S. Department of Agriculture. WORKING, H. (1943). Statistical Laws of Family Expenditure. Journal of American Statistical Associations, 38, 43-56. YATCHEW, A. (2003). Semiparametric Regression for the Applied Econometrician. New York: Cambridge University Press. YEN, S., KASTERIDIS, P. AND J. RILEY (2012). Food Expenditures away from Home by Elderly Households. Agricultural and Applied Economics Association 2012 Annual Meeting, August 12-14, 2012, Seattle, Washington. ZHENG, J. (1996). A Consistent Test of Functional Forms via Nonparametric Estimation Techniques. Journal of Econometrics, 75, 263-289. ZHOU, S. AND D. A. WOLF (2000). On Derivative Estimation in Spline Regression. Statistica Sinica, 10, 93-108. 209