x - FaMAF - Universidad Nacional de Córdoba

Anuncio
UNIVERSIDAD NACIONAL DE CÓRDOBA
Título de Tesis:
Evaluación de Curvas de Engel No Paramétricas y Semiparamétricas.
Aplicación al Consumo de Alimentos en la Región Pampeana
Para optar al grado de:
MAGISTER EN ESTADÍSTICA APLICADA
Autor:
Lic. Rodrigo García Arancibia
Año 2012
COMISIÓN ASESORA DE TESIS
Directora:
Ph.D. Edith Depetris Guiguet
Universidad Nacional del Litoral
Miembros:
Dra. Margarita Díaz
Universidad Nacional de Córdoba
Ph.D. Gustavo Rossini
Universidad Nacional del Litoral
Fecha de Defensa y Aprobación de Tesis: 1 de Octubre de 2012
ii
Agradecimientos
En primer lugar quisiera agradecer a mi directora, la Dra. Edith Depetris Guiguet, por
toda su ayuda y apoyo desde que comencé mi carrera académica en la Facultad de
Ciencias Económicas de la UNL. Sin su confianza y atención, este trabajo no hubiera sido
posible.
Agradezco la disposición y paciencia del Dr. Gustavo Rossini, mi actual director del
doctorado, quien siempre atendió mis múltiples consultas desde el comienzo de la
maestría.
Quiero expresar mi gratitud a la Universidad Nacional del Litoral, quien financió mis
estudios durante los dos años de cursado, en el marco de Becas de Maestría para Docentes
de la UNL.
A todo el cuerpo docente de la maestría les quiero agradecer por la excelente relación
alumno-profesor que pudimos mantener. En especial, a la Dra. Margarita Díaz y al Dr.
José Luis Arrufat por sus valiosos comentarios y observaciones en relación el trabajo de
tesis.
Agradezco a mis padres, Ernesto y Mabel, por apoyarme siempre en mis estudios y en mi
carrera. A mis hermanos, Ernestito, María Laura y Natalia, quienes, a pesar de la
distancia, están siempre en las buenas y en las malas. A Rolo y Chiqui (suegros) por su
cariño y buena onda.
Por último, quiero expresarles mi enorme gratitud y dedicarles este trabajo a mi esposa
Natalia y a mi hijito Cosme, quienes me brindan su apoyo y amor todos días.
iii
Resumen
En esta tesis se aborda el problema de estimación de curvas de Engel (CE) no
paramétricas y semiparamétricas poniendo énfasis tanto en la cuestión metodológicaestadística como en la económica. Se aplica al caso específico del consumo de alimentos de
la región pampeana argentina. El objetivo es evaluar la aplicabilidad de diferentes
métodos no paramétricos en especificaciones en las cuales el gasto total entra en el modelo
de forma no paramétrica. Para ello se comparan diferentes métodos no paramétricos, en lo
que hace a sus errores de predicción y estimación, a la bondad de ajuste y a los resultados
económicos obtenidos por las elasticidades-gasto derivadas de cada estimación. Se
consideran tres estimadores basados en núcleos, el Nadaraya-Watson, los polinomios
locales lineales y los cuadráticos, y, adicionalmente, los suavizados spline, todos ellos
pertenecientes a la clase de suavizados lineales. Para tales estimadores se construyen
intervalos de confianza wild-bootstrap para tener en cuenta la heterocedasticidad de los
datos. La elección de los parámetros de suavizado se elige siguiendo el criterio de
convalidación cruzada generalizada, con ventajas sobre otras alternativas presentadas.
Para comparar el poder predictivo y de estimación, se proponen cuatro medidas
empíricas, las que son evaluadas por medio de un ejercicio de simulación. El ejercicio
prueba que los estadísticos Cp y AICc son más consistentes. Para tener una medida de
bondad de ajuste comparable con el R-cuadrado de los modelos lineales clásicos, se
computa una versión no paramétrica del mismo. Los resultados muestran que los
suavizados spline, en primer lugar, seguido de los polinomios locales (lineales en unos
casos y cuadráticos en otros), muestran la mejor performance en términos de tales
medidas. Por el contrario el Nadaraya-Watson revela los mayores errores empíricos, con
una alta variabilidad en los extremos.
A partir de las estimaciones no paramétricas se obtienen sus derivadas primeras y con ello
las elasticidades-gasto, con sus respectivos errores estándar bootstrap, las que son
evaluadas en términos económicos. De los resultados se tiene que el suavizado spline da
estimaciones más consistentes con lo esperado en términos económicos. Al comparar las
elasticidades promedios y evaluadas en la media, la diferencia entre estimadores es
mínima.
Frente a alternativas paramétricas se realizan dos tipos de test de especificación,
aplicables a todos los suavizados lineales propuestos, cuando éstos entran en la hipótesis
alternativa del test. Como hipótesis nula se proponen tres variantes de la denominada
Working-Leser: lineal, cuadrática y cúbica. Los resultados muestran que para el caso de la
CE del total de alimentos y bebidas, se rechazan las tres especificaciones. Sin embargo,
para subconjuntos de alimentos específicos, la cúbica, en unos casos, y la cuadrática en
otros, no son rechazadas.
Para estudiar el efecto de las características demográficas de los hogares sobre las CE, se
estima el efecto sustitución de las características (ESC) dado por la diferencia de CE para
hogares de distintas características. De este análisis no solo se puede comprobar qué
características tienen un efecto significativo sobre los gastos en consumo y en qué
dirección, sino que adicionalmente revela las posibles interacciones de las características
con el poder adquisitivo de los hogares. De aquí se estiman CE paramétricas
incorporando los efectos interacción derivados de las curvas ESC, analizando luego su
importancia.
1
Por último se estudian CE semiparamétricas especificadas por medio de modelos
parcialmente lineales, donde las características socioeconómicas y demográficas entran en
forma paramétrica, mientras que el gasto total lo hace de manera no paramétrica. Para su
estimación se aplica el método de dobles residuos de Robinson, comparando los resultados
de los suavizados spline con los de los polinomios locales, aplicados en todas las
regresiones no paramétricas intervinientes en el método. Los resultados son muy
similares, arrojando menores errores las estimaciones con suavizados spline. Dada la
posible endogeneidad del gasto total, la misma es testeada y corregida utilizando una
variable auxiliar construida a partir del ingreso total y del régimen de tenencia de la
vivienda. En algunos casos, la endogeneidad es rechazada, mientras que en otros no. Para
estos últimos casos, la corrección de la elasticidad-gasto muestra mayor diferencia. Al
utilizar el ingreso total como instrumento, se estiman las elasticidades-ingreso, las que
resultan ser menores que las elasticidades-gasto. Este hecho es coherente con las
decisiones sobre el destino del ingreso al consumo y al ahorro, previo a la elección del
destino del gasto.
Palabras Clave: Suavizados Lineales – Elasticidades – Gasto de Hogares - Demanda
2
Evaluation of Nonparametric and Semiparametric Engel Curves
Summary
This thesis addresses the problem of nonparametric and semiparametric Engel curves
(EC) estimation, considering statistical, methodological and economic issues. It is applied
to the specific case of food consumption in the Argentinean Pampas Region. The objective
is to evaluate the applicability of nonparametric methods in different specifications in
which total expenditure enters in the model non-parametrically. For this purpose, we
compare different nonparametric methods with respect to their prediction and estimation
errors, goodness of fit and the economic results of expenditure-elasticities obtained from
each estimator. We consider three estimators based on kernels, the Nadaraya-Watson,
local linear and quadratic polynomials, and additionally, the smoothing spline, all
belonging to the class of linear smoothers. In all cases wild- bootstrap confidence intervals
to account heteroskedasticity data are constructed. The smoothing parameters are chosen
according to the generalized cross validation criterion, with advantages over other
alternatives presented.
To compare the estimation and prediction power, we suggest four empirical measures
which are evaluated using Monte Carlo simulations. This exercise proves that the
statistical Cp and the AICc are more consistent. To get a measure of goodness of fit
comparable to the R-square of classical linear models, we compute a nonparametric
version of it. The results show that the smoothing spline, first, followed by local
polynomials (linear in some cases and quadratic in others) show the best performance in
terms of such measures. By contrast, the Nadaraya-Watson estimator reveals greater
empirical errors, with a high variability in tails.
From nonparametric estimates we obtained its first derivatives and expenditure
elasticities, with their bootstrap standard errors, which are evaluated in economic terms.
From the results, the smoothing splines are more consistent with the results predicted by
economic theory. By comparing the average elasticity, and evaluated in the average, the
difference between estimators is minimal.
Given parametric alternatives, we use two types of test specification applicable to all
selected linear smoothers, which enter as the alternative hypothesis of the test. As null
hypothesis we propose three variants of the so-called Working-Leser: linear, quadratic
and cubic. The results show that in the case of Engel curves for food and beverages, the
three specifications are rejected. However, for specific subsets of foods, the cubic, in some
cases, and quadratic in the others, the null is not rejected.
To study the effect of demographic characteristics of households on the EC, the
characteristics substitution effect (ESC) given by the difference of EC for households with
different characteristics is estimated. This analysis not only identifies what characteristic
has a significant effect on consumer spending and in what direction, but also reveals the
possible interactions of the characteristic with the income of households. From this
analysis, parametric specifications of EC are estimated, adding interaction effects derived
from ESC, testing their statistical significance.
3
Finally we study semiparametric EC specified by partially linear models, where the
socioeconomic and demographic characteristics enter parametrically, while the total
expenditure does it in non-parametric form. For its estimation we applied the ‘double
residual’ method of Robinson, comparing the results of smoothing spline with local
polynomials. The results are very similar, yielding smaller errors with smoothing spline
estimates. Given the possible endogeneity of total expenditure, it is tested and corrected
using an auxiliary variable constructed from the total income and housing tenure. In some
cases, endogeneity is rejected, while not in others. For the latter cases, the correction
shows greater difference in expenditure elasticity. By using the total income as an
instrumental variable, we estimate the income elasticities, which turn out to be smaller
than the expenditure elasticities. This fact is coherent with the decisions about income
allocation in consumption and savings, previously to the spending choice.
Key Words: Linear Smoothers – Elasticities – Household Expenditure - Demand
4
Tabla de Contenidos
Agradecimientos ........................................................................................................................ iii
Resumen ........................................................................................................................................1
Summary .......................................................................................................................................3
Lista de Tablas ..............................................................................................................................7
Lista de Figuras ............................................................................................................................9
CAPÍTULO 1. INTRODUCCIÓN .....................................................................................................12
1.1
Problema de Investigación........................................................................................12
1.2
Objetivos ......................................................................................................................15
1.3
Organización de la Tesis ...........................................................................................18
PARTE I MARCO TEÓRICO Y METODOLÓGICO ........................................................................20
CAPÍTULO 2. SOBRE LAS CURVAS DE ENGEL .............................................................................21
2.1
Introducción ................................................................................................................21
2.2
La Ley de Engel por Ernst Engel..............................................................................23
2.3
La Curva de Engel desde la Teoría del Consumidor ............................................25
2.3
Especificaciones Tempranas .....................................................................................29
2.4
De Nuevo al ‘Espíritu’ No Paramétrico ..................................................................32
CAPÍTULO 3. METODOLOGÍA ......................................................................................................34
3.1
Introducción ................................................................................................................34
3.2
Metodologías de Estimación No Paramétricas ......................................................35
3.3
Inferencia en las Regresiones No Paramétricas .....................................................47
3.4
Performance Comparativa ........................................................................................53
3.5
Derivadas y Elasticidades No Paramétricas ...........................................................56
3.6
Efecto de las Características Demográficas de los Hogares .................................60
3.7
Especificaciones Semiparamétricas .........................................................................63
CAPÍTULO 4. DATOS, VARIABLES Y PROCEDIMIENTOS .............................................................70
4.1
Introducción ................................................................................................................70
4.2
Datos ............................................................................................................................70
4.3
Descripción de las Variables .....................................................................................72
4.4
Procedimientos y Software .......................................................................................80
PARTE II RESULTADOS ...............................................................................................................83
CAPÍTULO 5. ANÁLISIS COMPARATIVO DE REGRESIONES NO PARAMÉTRICAS DE CURVAS DE
ENGEL ..........................................................................................................................................84
5.1
Introducción ................................................................................................................84
5
5.2
Elección del Suavizado ..............................................................................................86
5.3
Curvas de Engel Estimadas ......................................................................................90
5.4
Evaluación Estadística ...............................................................................................99
5.5
Derivadas y Elasticidades .........................................................................................103
5.6
Contraste con Especificaciones Paramétricas.......................................................110
5.7
Síntesis y Conclusiones ...........................................................................................117
CAPÍTULO 6. EFECTOS DE LAS CARACTERÍSTICAS DE LOS HOGARES .....................................119
6.1
Introducción ..............................................................................................................119
6.2
Tipos de Hogares .....................................................................................................121
6.3
Presencia de Menores y Adultos Mayores ...........................................................130
6.4
Características del Jefe de Hogar ...........................................................................135
6.5
Incorporación de las Interacciones .......................................................................142
6.6
Síntesis y Conclusiones ..........................................................................................151
CAPÍTULO 7. CURVAS DE ENGEL SEMIPARAMÉTRICAS ...........................................................154
7.1
Introducción ..............................................................................................................154
7.2
Resultados de los Modelos Parcialmente Lineales ..............................................156
7.3
Elasticidades-Gasto ..................................................................................................166
7.4
Endogeneidad por Simultaneidad .........................................................................170
7.5
Elasticidades-Gasto Corregidas y Elasticidades-Ingreso ...................................172
7.6
Síntesis y Conclusiones ...........................................................................................174
CAPÍTULO 8. CONCLUSIONES ...................................................................................................177
ANEXO 1.
MEDIDAS DE PERFORMANCE DE ESTIMACIONES NO PARAMÉTRICAS DE CE. UNA
SIMULACIÓN DE MONTE CARLO ..............................................................................................188
ANEXO 2.
RESULTADOS DE LAS ESPECIFICACIONES PARAMÉTRICAS......................................................198
REFERENCIAS .............................................................................................................................202
6
Lista de Tablas
Tabla 4.1 Tamaño de la Muestra e Importancia de los Sub-conjuntos de Alimentos A1-A4
..........................................................................................................................................................72
Tabla 4.2 Resumen Estadístico del Gasto y del Ingreso Total .................................................74
Tabla 4.3 Descripción de las variables Socioeconómicas y Demográficas Consideradas ....79
Tabla 5.1 Evaluación de los Criterios de Selección del Suavizado .........................................87
Tabla 5.2 Medidas de Evaluación de Estimadores No Paramétricos. Total Alimentos y
Bebidas (A) ......................................................................................................................................99
Tabla 5.3 R-cuadrado de los Estimadores No Paramétricos con iguales grados de libertad.
Total Alimentos y Bebidas (A) ...................................................................................................100
Tabla 5.4 Medidas de Evaluación de Estimadores No Paramétricos. Conjuntos Específicos
de Alimentos: A1-A4 ..................................................................................................................101
Tabla 5.5 Derivadas y Elasticidades – Gasto. Total Alimentos y Bebidas............................108
Tabla 5.6 Derivadas y Elasticidades – Gasto. Conjuntos Específicos de Alimentos A1-A4
........................................................................................................................................................109
Tabla 5.7 Pruebas de Hipótesis de Especificaciones Paramétricas .......................................111
Tabla 5.8 Estimaciones Paramétricas Simples de CE. Total Alimentos y Bebidas (A) .......113
Tabla 5.9 Pruebas de Hipótesis de Especificaciones Paramétricas. Conjuntos Específicos de
Alimentos: A1-A4.........................................................................................................................114
Tabla 6.1 Efectos/Diferencias Promedios de los tipos de hogares.........................................126
Tabla 6.2 Efecto Interacción de las Características Demográficas con el Gasto Total.
Derivada Promedio del ESC. Alimentos (A) ............................................................................145
Tabla 6.3 Comparación Modelos Paramétricos. Estimación MCO. Alimentos (A) ............146
Tabla 6.4 Efecto Interacción de las Características Demográficas con el Gasto Total.
Derivada Promedio del ESC. Alimentos A1-A4 ......................................................................148
Tabla 7.1 CE Semiparamétricas. Estimador de Doble Residuos. Total Alimentos y Bebidas
........................................................................................................................................................157
Tabla 7.2 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A1 .................159
Tabla 7.3 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A2 .................161
Tabla 7.4 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A3 .................163
Tabla 7.5 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A4 .................165
Tabla 7.6 Elasticidades-Gasto Promedios y Evaluadas en la Media .....................................170
Tabla 7.7 Componentes Paramétricas de la CE. Corrección por Endogeneidad ................171
Tabla A.1 Medidas de Performance de los Estimadores. CE Lineal .....................................194
Tabla A.2 Medidas de Performance de los Estimadores. CE Cuadrática ............................195
7
Tabla A.3 Medidas de Performance de los Estimadores. CE Cúbica....................................196
Tabla A.4 CE Paramétricas con Variables Demográficas e Interacciones. A1-A4...............199
Tabla A.5 CE Paramétricas Seleccionadas. Total Alimentos y Bebidas (A) y Subconjuntos
A1-A4 .............................................................................................................................................201
8
Lista de Figuras
Figura 4.1 Diagrama de Puntos. Log del Ingreso total – log del Gasto Total ........................74
Figura 4.2 Densidades Marginales y Conjunta de la Participación del Gasto en Alimentos
y Bebidas y del Logaritmo del Gasto Total ................................................................................76
Figura 4.3 Densidades Marginales Estimadas de la Participación del Gasto en Alimentos
A1-A4 ...............................................................................................................................................77
Figura 4.4 Relaciones de Engel – Diagramas de Puntos ...........................................................78
Figura 5.1 Comportamiento de las Funciones de Selección de Suavizados ..........................89
Figura 5.2 Estimadores No Paramétricos de Curvas de Engel. Total Alimentos y Bebidas
(A) .....................................................................................................................................................91
Figura 5.3 Curvas de Engel de Alimentos y Bebidas (A). Comparación de estimadores ....92
Figura 5.4 Estimadores No Paramétricos de Curvas de Engel. Conjunto A1 .......................93
Figura 5.5 Estimadores No Paramétricos de Curvas de Engel. A2 .........................................95
Figura 5.6 Estimadores No Paramétricos de Curvas de Engel. A3 .........................................96
Figura 5.7 Estimadores No Paramétricos de Curvas de Engel. A4 .........................................97
Figura 5.8 Curvas de Engel de Conjuntos Específicos de Alimentos. Comparación de
Estimadores.....................................................................................................................................98
Figura 5.9 Derivada de la CE y Elasticidad- Gasto. Alimentos y Bebidas (A) ....................104
Figura 5.10 Derivada de la CE y Elasticidad- Gasto. Alimentos A1 .....................................105
Figura 5.11 Derivada de la CE y Elasticidad- Gasto. Alimentos A2 .....................................106
Figura 5.12 Derivada de la CE y Elasticidad- Gasto. Alimentos A3 .....................................107
Figura 5.13 Derivada de la CE y Elasticidad- Gasto. Alimentos A4 ....................................107
Figura 5.14 Ajuste Cúbico de la CE versus Ajustes No Paramétricos ..................................112
Figura 5.15 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para
el Subconjunto de Alimentos A1................................................................................................115
Figura 5.16 Comparación del Ajuste Cúbico, Cuadrático, Lineal y No Paramétrico de las
CE para el Subconjunto de Alimentos A2 ................................................................................115
Figura 5.17 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para
el Subconjunto de Alimentos A3................................................................................................116
Figura 5.18 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para
los Subconjunto de Alimentos A4..............................................................................................117
Figura 6.1 Curvas de Engel de Alimentos y Bebidas por Tipos de Hogares .......................123
Figura 6.2 Efecto Sustitución de las Características entre Tipos de Hogares (A)................124
Figura 6.3 Efecto Sustitución de las Características. Alimentos Particulares (A1-A4) .......129
9
Figura 6.4 Efectos de la presencia de Menores en el Hogar en el Consumo de Alimentos y
Bebidas (A) ....................................................................................................................................131
Figura 6.5 Efectos Sustitución de las Características. Presencia de Menores en el Hogar.
Subconjuntos de Alimentos A1-A4 ...........................................................................................132
Figura 6.6 Efectos de la Presencia de los Adultos Mayores en el Hogar en el Consumo de
Alimentos y Bebidas (A) .............................................................................................................133
Figura 6.7 Efectos Sustitución de las Características. Presencia de Adultos Mayores en el
Hogar. Subconjuntos de Alimentos A1-A4 ..............................................................................135
Figura 6.8 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos.
Estimador Spline ..........................................................................................................................137
Figura 6.9 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos.
Estimador Local Lineal................................................................................................................138
Figura 6.10 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos A1-A4139
Figura 6.11 Relación entre la Edad del Jefe de Hogar e Ingresos Totales (Suavizado Spline)
........................................................................................................................................................140
Figura 6.12 Efectos de la Edad del Jefe/a de Hogar en el Consumo de Alimentos.............141
Figura 6.13 Efectos del Edad del Jefe/a de Hogar en el Consumo de Alimentos A1-A4 ...142
Figura 7.1 Componente No Paramétrica de la CE. Estimador de Doble Residuos. Total
Alimentos y Bebidas ....................................................................................................................157
Figura 7.2 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A1)....159
Figura 7.3 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A2)....162
Figura 7.4 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A3)....164
Figura 7.5 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A4)....165
Figura 7.6 Elasticidades – Gasto. Comparación de Estimadores. Total Alimentos y Bebidas
........................................................................................................................................................167
Figura 7.7 Elasticidades – Gasto. Comparación de Estimadores. Más Conjunto de
Alimentos A1-A4..........................................................................................................................169
Figura 7.8 Elasticidad–Gasto Corregida y Elasticidad Ingreso .............................................173
Figura 7.9 Elasticidad–Gasto Corregida y Elasticidad Ingreso. Conjuntos A1-A4 .............174
Figura A.1 Diagrama de puntos de los datos generados. N= 1000 .......................................190
Figura A.2 Estimaciones No Paramétricas. CE Lineal ............................................................191
Figura A.3 Estimaciones No Paramétricas. CE Cuadrática....................................................192
Figura A.4 Estimaciones No Paramétricas. CE Cúbica ...........................................................193
10
11
Capítulo 1
Introducción
1.1
Problema de Investigación
El estudio del comportamiento del consumo de la población de los diferentes bienes y
servicios resulta crucial tanto por su papel en la determinación de la actividad económica
como por su relación con el nivel de bienestar alcanzado por la sociedad. De este modo, el
conocimiento de los patrones de consumo cobra relevancia para la implementación de
políticas económicas y sociales, como ser una reforma impositiva o la asignación de
subsidios familiares. En particular, el análisis del consumo de alimentos ha generado
especial atención desde el trabajo pionero de Ernst Engel (1895), puesto que la
participación del gasto de los alimentos es comúnmente tomada como un índice inverso
del bienestar de los hogares. Ello se debe a la regla empírica, denominada ‘ley de Engel’,
según la cual la demanda de alimentos se incrementa a una tasa menor que el ingreso.
Las curvas de Engel se definen desde el punto de vista teórico como las funciones que
relacionan el gasto en bienes y servicios que desembolsa una determinada familia, con sus
ingresos o recursos totales percibidos, así como otras variables que caracterizan la
composición de la familia, dado los precios fijos. La teoría microeconómica no determina
alguna forma funcional específica para las curvas de Engel pero establece criterios que
ésta debe cumplir en concordancia con la teoría del consumidor (Deaton y Muellbauer,
1980a).
Desde el punto de vista empírico o estadístico, el término curva de Engel es usado para
describir la dependencia empírica entre el gasto realizado en un determinado bien (o
conjunto de bienes) y el ingreso total en una población de consumidores muestreada en
un lugar y tiempo determinado (Lewbel, 2006).
12
Es deseable cerrar la brecha entre la definición económica y estadística a fin de corroborar
resultados, conseguir mediciones confiables -verbigracia las elasticidades ingreso/gasto- y
obtener conclusiones robustas acerca de los patrones de consumo. Ante esta necesidad se
busca una correcta especificación de la forma funcional de la curva de Engel, tema que se
viene abordando en la última década desde diversas perspectivas. Las consideraciones
finales sobre la elección de la especificación por lo general recaen en el interés del
investigador, quien pondera sus ventajas y desventajas, dada la dificultad de encontrar
una forma funcional superior en todo sentido (Depetris et al., 2006)
Por un lado se encuentran los estudios paramétricos, es decir modelos donde se supone el
conocimiento de la función de distribución. Entre éstos se encuentran los influyentes
trabajos realizados por Working (1943) y Leser (1963) quienes brindaron un conjunto de
criterios metodológicos para especificar curvas de Engel mediante el estudio de varios
modelos lineales. Concluyeron con la especificación denominada Working-Leser, la cual
presenta una relación lineal entre la proporción del gasto en un determinado bien sobre el
gasto total y el logaritmo de este último. Esta forma funcional fue perfeccionada por
Deaton y Muellbauer (1980b) colocándola dentro de la integrabilidad de la teoría del
consumidor. Lewbell (1991) señala que si bien las demandas de las familias pueden ser
bien modeladas a través de una especificación lineal-logarítmica, se necesitan modelos
más complejos cuando la muestra con la que se trabaja incluye familias de muy bajos
ingresos-gastos o de elevados ingresos-gastos.
Una de las principales desventajas de los métodos paramétricos es el restrictivo supuesto
de la linealidad y el supuesto del conocimiento a priori de la distribución. Por ello se han
introducido los métodos no paramétricos, los cuales suponen una mayor flexibilidad pues
no exigen hacer algún supuesto sobre la distribución, aunque sí sobre la regularidad de la
función pertinente (i.e. continuidad y derivabilidad) sin establecer explícitamente una
forma funcional entre las variables.
Por su parte, los modelos no paramétricos permiten una forma flexible a las curvas de
Engel. Adicionalmente, con los mismos se puede contrastar la validez de diferentes
formas funcionales especificas, contribuyendo de esta manera a la definición de nuevas
curvas de Engel y sistemas de demanda paramétricos.
13
Entre las primeras aplicaciones empíricas de métodos de regresión no paramétricos para
estimar curvas de Engel se pueden mencionar los trabajos de Bierens y Pottbuter (1990),
Lewbel (1991), Delgado y Miles (1997) y Banks et al.(1997); y más recientemente Fousekis y
Lazaridis (2001) y Parpiev y Yusupov (2011), entre otros.
Finalmente, existe un importante número de trabajos recientes que aplican métodos
semiparamétricos en los cuales se permite una forma funcional flexible para la relación
entre la participación de gasto en un bien o servicio y el gasto total, mientras que las
variables demográficas (verbigracia el tamaño de la familia, el género y edad de sus
integrantes) entran en el modelo de una forma lineal y paramétrica. Esta investigación
cobra importancia por las implicaciones de asignación del gasto dentro de los hogares y
su relación con las características de la composición del hogar. Entre este tipo de trabajos
encontramos Bundell et al. (1998), Bhalotra y Atfield (1998), Gong et al. (2000) Lyssiotou P
et al. (2008), Sulgaham y Zapata (2006), Barrientos Marin (2009) y Barrientos Marin et al
(2011), entre otros.
Para Argentina, si bien en los últimos años ha crecido el número de trabajos empíricos de
consumo y demanda, como ser Berges y Casella (2007), Rossini et al. (2008), Rossini y
Depetris Guiguet (2008) y García Arancibia et al. (2009a, 2009b), entre otros, la mayoría se
basan en especificaciones paramétricas. Respecto a los trabajos que aplican métodos no
paramétricos, las referencias son más escasas. Entre éstos pueden mencionarse los
estudios de Pizzolitto (2007) quien utiliza aproximaciones de Fourier con datos del Banco
Mundial; y Carugati (2008) quien emplea regresiones kernel simples para la estimación del
consumo
de
alimentos
en
general.
Más
recientemente,
Berges
(2010)
utiliza
especificaciones semiparamétricas para la estimación de las escalas de equivalencia para
la región metropolitana del GBA. De este relevamiento surge la necesidad de realizar un
estudio que evalúe en términos estadísticos y económicos métodos no paramétricos
alternativos para la estimación de Curvas de Engel para Argentina o de algunas de sus
regiones. Un análisis metodológico, teórico y empírico, permitiría desarrollar
investigaciones futuras en el marco de la teoría del consumidor aplicada.
En esta tesis se propone abordar el problema de estimación de curvas de Engel no
paramétricas y semiparamétricas poniendo énfasis tanto en la cuestión metodológica-
14
estadística como en la económica, con la aplicación al caso específico del consumo de
Alimentos en Argentina, utilizando datos de Encuesta de Hogares. En particular se
tomará la región Pampeana, por su importancia relativa en el país, más allá de la región
metropolitana del Gran Buenos Aires. La aplicación se realizará utilizando la base de la
Encuesta Nacional de Gastos de Hogares 1996/97 elaborada por el Instituto Nacional de
Estadísticas y Censos, tomando el caso específico de la región Pampeana, teniendo una
muestra aproximada de 7500 hogares válidos. Además de tomar el rubro de Alimentos y
Bebidas en general, se considerarán los siguientes grupos de alimentos: (A1); Productos
de panadería, harinas, arroz, cereales y pastas; (A2) Carnes vacuna, porcina, ovina, aves,
pescados y mariscos; (A3) Leche y productos lácteos; y (A4) Verduras, legumbres y
frutas.
Dado que esta tesis se realiza en el marco de la Maestría en Estadística Aplicada, se busca
desarrollar un trabajo que aplique los conocimientos adquiridos en los diferentes cursos,
como así también extender el conocimiento en otros tópicos no vistos en el cursado
regular, como ser en métodos de regresión no-paramétrica y semiparamétrica,
considerando la importancia que los mismos están teniendo en la econometría aplicada
actual.
1.2
Objetivos
El objetivo general del presente trabajo es evaluar, desde el punto de vista estadístico y
económico, algunas estimaciones de especificaciones no paramétricas y semiparamétricas
de Curvas de Engel de Alimentos en la Región Pampeana Argentina, utilizando datos de
Encuesta de Hogares.
Los objetivos específicos son:
1. Comparar diferentes métodos de regresión no paramétrica de curvas de Engel
aplicado al caso específico de consumo de alimentos con el fin de obtener
conclusiones relevantes sobre la bondad de ajuste y poder de predicción de cada
modelo, y resultados económicos implicados por las elasticidades-gasto derivadas
de cada estimación.
15
2. Del análisis puramente no paramétrico, determinar la relación entre el
comportamiento del consumidor y las características demográficas de los hogares.
3. Estimar las elasticidades y/o los efectos marginales de cada variable, derivados de
las especificaciones, no paramétricas y semiparamétricas de las Curvas de Engel
para ciertos grupos de alimentos.
4. Constatar las hipótesis sobre especificaciones paramétricas de curvas de Engel.
5. Elaborar conclusiones que sirvan de guía para el desarrollo de modelos
econométricos aplicados a la teoría del consumidor.
Para el cumplimiento del Objetivo Específico 1 se compararán tres estimadores no
paramétricos de Curvas de Engel, estando entre los más utilizados en la literatura
econométrica: 1) Las regresiones kernel, tomando como caso especial el estimador
Nadaraya- Watson (N-W) (Nadaraya, 1964; Watson, 1964); 2) Regresiones por polinomios
locales; y
3)
Suavizados Spline. Una vez obtenidas las estimaciones por estos tres
métodos(N-W, polinomios locales y spline), se realiza una comparación en base a criterios
estadísticos como también económicos.
En términos estadísticos, se realizarán
comparaciones sobre diferentes medidas de los errores de estimación y predicción de cada
modelo, como así también de su bondad de ajuste. En términos económicos, se realizarán
comparaciones computando las elasticidades-gasto (eg) a partir de las distintas
estimaciones y para los distintos tipos de alimentos considerado0s.
Para llevar a cabo el Objetivo Específico 2 se tomarán variables demográficas de los
hogares que caracterizan su composición. Específicamente, las variables que cuantifican la
cantidad de miembros por grupo etario (menores de 14 y mayores de 65 años), los tipos
de hogares (unipersonal, nuclear sin hijos, nuclear con hijos y extendidos), y la edad y
género del jefe/a de hogar. A partir de éstas, se forman especificaciones desagregadas por
características de los hogares. Con ellas se busca conocer cómo afectan tales características
en la participación del gasto que tiene un bien en el presupuesto del hogar, y su
comportamiento respecto al poder adquisitivo. Tal efecto ha sido denominado como
Efecto Sustitución de las Características (ESC) (Delgado y Miles, 1997). En la estimación no
16
paramétrica, involucrada en la obtención del ESC, se consideran los resultados de la
evaluación realizada previamente (Objetivo 1).
El Objetivo Específico 3 constituye la etapa final de la tesis en lo que hace a la estimación
de curvas de Engel, contemplando varios aspectos que hacen a la heterogeneidad de los
hogares, además de su poder adquisitivo. Para cumplir con este objetivo, en primer lugar,
se incluyen en la especificación las variables que caracterizan la composición de los
hogares (definidas previamente para el objetivo 2) y aquéllas que representan la situación
socioeconómica del Jefe de Hogar: Nivel de Educación y Situación ocupacional1. Se elige
una representación semiparamétrica de las CE, especificando un Modelo Parcialmente
Lineal (MPL), dejando como componente no paramétrica el logarítmo del gasto total. Para
su estimación se utilizará el método de “doble residuos”, propuesto de forma simultánea
por Robinson (1988) y Speckman (1988). Del modelo se obtienen la elasticidad-gasto y los
efectos marginales de las demás variables a los fines de su interpretación económica.
Adicionalmente, se trata la posible endogeneidad del gasto total, corrigiendo con
variables instrumentales y/o regresiones auxiliares (Blundell et al., 2008; Sulgaham y
Zapata, 2006, Barrientos Marin, 2009; Barrientos Marin et al., 2011; entre otros). La variable
clave para instrumentar es el ingreso total. Sin embargo, es usual que tal variable tenga
problemas respecto a su declaración real en las encuestas, lo que pone en duda las
correcciones propuestas.
Respecto al Objetivo Específico 4, se desea contrastar la hipótesis de linealidad y/o del
efecto cuadrático o cúbico del gasto total. Existe una gran cantidad de estadísticos
propuestos para realizar pruebas de especificación, con distribuciones asintóticas
generalmente conocidas2. La elección de los estadísticos a utilizar en esta tesis, se realiza
en base a criterios de flexibilidad respecto al método no paramétrico que se utilice y
teniendo en cuenta su facilidad computacional. En base a tal criterio, se aplica un test
paramétrico, basado en una aproximación de la distribución F, y otro no paramétrico
basado en la distribución empírica derivada a través del método bootstrap.
1
La elección de tales variables se realiza en base a aquellas que resultaron relevantes en estudios empíricos
sobre consumo y demanda aplicados a Argentina (Berges y Casella, 2007; Rossini et al., 2008, Rossini y
Depetris Guiguet, 2008; García Arancibia et al., 2009, 2011).
2
En Yatchew (2003) se presenta un buen resumen de los mismos
17
Por último, de los resultados encontrados de la consecución de los objetivos 1-4, se espera
obtener conclusiones sobre: 1) La validez de especificar curvas de Engel paramétricas para
el caso de alimentos en Argentina; 2) El método no paramétrico recomendable, si se opta
por una especificación flexible; 3) La sensibilidad de las elasticidades-gasto respecto al
método de estimación; 3) La conveniencia de incorporar variables interacción entre las
características de los hogares y el gasto total/ingreso, en especificaciones paramétricas; 4)
La sensibilidad de las estimaciones semiparamétricas ante la corrección de la posible
endogeneidad del gasto total, instrumentando con el ingreso total; y 5) Las diferencias que
se presentan entre los distintos grupos de alimentos. Con esto se cubriría el Objetivo
Específico 5.
1.3
Organización de la Tesis
La tesis está organizada en dos partes. La Parte I incluye todo el marco teórico y
metodológico utilizado. Está compuesta de tres capítulos. El primero de ellos hace un
breve recorrido sobre los fundamentos económicos-teóricos de las Curvas de Engel. Trata,
desde el rol de las metodologías no paramétricas en el desarrollo histórico del tratamiento
de los presupuestos familiares como función del poder adquisitivo, hasta las restricciones
que se derivan de la teoría neoclásica del consumidor, y las adaptaciones econométricas a
ellas. En el Capitulo 2 se presentan todos los métodos estadísticos que son aplicados en la
tesis. El mismo parte de los métodos de estimación e inferencia no paramétricos, las
propuestas para su evaluación y la obtención de las elasticidades-gasto no paramétricas.
El último capítulo de esta primera parte explica el tratamiento de la base de datos
utilizada, las variables con las que se trabaja y los procedimientos computacionales
llevados a cabo.
La segunda parte también tiene tres capítulos y contiene los resultados empíricos de la
tesis. Estos tres capítulos surgieron del modo en que se esquematizó la tesis en un
comienzo. Se pensaba presentar un total de tres trabajos o papers, relacionados entre sí de
una forma anidada o progresiva. De hecho, tanto la metodología como el orden en que se
presentan los resultados responden a un ordenamiento progresivo, donde se parte de
modelos más básicos con un perfil más evaluativo y metodológico, hasta llegar a modelos
18
más completos con una visión más amplia sobre la influencia de las variables económicas
de interés. Por lo tanto, si bien la tesis adopta ahora un formato más tradicional, los tres
capítulos de los resultados pueden leerse de una manera independiente, aunque
contienen un anidamiento de forma que cada capítulo se referencia en el o los anteriores.
El primer capítulo de esta segunda parte, el Capítulo 5 de la tesis, expone los resultados
del análisis comparativo de las curvas de Engel especificadas como función del logaritmo
del gasto total, de forma totalmente no paramétrica. En el Capítulo 6 se estudia el efecto
de las características demográficas de los hogares, utilizando las CE no paramétricas,
seleccionando el o los estimadores apropiados según los resultados del capítulo
evaluativo anterior. Por último, el Capitulo 7 integra de cierta manera a los dos anteriores,
estudiándose los resultados de los modelos semiparamétricos de las CE.
El modo de presentación, tanto del marco metodológico como de los resultados, responde
a un formato más acorde a los estudios econométricos aplicados (y en particular, de
consumo y demanda), que a uno puramente estadístico. Esta elección se hizo
considerando la formación base de quien escribe, y de la utilidad presente y futura para
manejarse en el ámbito académico al que pertenece. No obstante, se puso énfasis en lo
metodológico con un perfil micro-econométrico, donde la precisión estadística y la
interpretación de los resultados deben conjugarse para responder a un análisis económico
con fundamentos más sólidos.
19
Primera Parte
MARCO TEÓRICO Y METODOLÓGICO
20
Capítulo 2
Sobre las Curvas de Engel
2.1
Introducción
Para la visión contemporánea, las curvas de Engel (CE) tienen dos acepciones
estrechamente relacionadas, por un lado la teórica y por otra, la empírica o estadística
(Lewbel, 2006). Las diferencias existentes entre ambas puede generar cierta preocupación
o no, dependiendo de la postura metodológica que se adopte. Se puede pensar desde el
enfoque apriorista de la teoría económica, mediante el desarrollo de los principios básicos
de la teoría del consumidor, valiéndose de un dominio diferente al dominio estándar de
los fenómenos económicos (Scarano E., 2002). También desde una perspectiva mishaniana
donde la búsqueda de una coherencia entre la teoría y los resultados resulta simplemente
en una pérdida de tiempo y energía, no importando si la curva se deriva de una teoría
consistente, sino simplemente la aplicación de los conceptos (Himmelweit et al., 2001: 55)3.
Desde el punto de vista teórico, las curvas de Engel quedan definidas como las funciones
que relacionan el gasto en bienes y servicios que desembolsa una determinada familia,
con sus ingresos o recursos totales percibidos, así como otras variables que caracterizan la
composición de la familia, dado los precios fijos. La teoría microeconómica no determina
alguna forma funcional específica para las curvas de Engel pero establece criterios que
ésta debe cumplir en concordancia con la teoría del consumidor, a partir de lo cual puede
realizarse una determinada especificación.
Desde el punto de vista empírico o estadístico, el término curva de Engel es usado para
describir la dependencia empírica entre el gasto realizado en un determinado bien (o
Las afirmaciones de Mishan (1961) se refieren más específicamente a la ley de demanda, considerándolo aquí
como un enfoque general de esta disyuntiva, aplicándose claramente al problema de especificación de las
formas de Engel.
3
21
conjunto de bienes) y el ingreso o gasto total en una población de consumidores
muestreada en un lugar y tiempo determinado. En esta última definición se enmarca el
trabajo original de Engel, quien infirió desde el estudio estadístico de las proporciones del
gasto asignadas por las familias en función de su ingreso, una de las proposiciones más
relevantes del estudio de los presupuestos familiares, y más tarde, de la teoría del
consumidor.
Las investigaciones tempranas de Ernst Engel transcurren en la segunda mitad del siglo
XIX4, cuando la incipiente teoría del consumidor carecía de una incorporación cabal de
los efectos ingresos sobre las decisiones de las familias, al mismo tiempo en que no se
contaba con una sólida fundamentación de los modelos de regresión estadística. Si bien la
derivación de las funciones de demanda a partir del análisis de la utilidad, desarrollada
en los trabajos de Jevons y Walras, fueron contemporáneos a las obra de Engel, hay
autores que sostienen la inexistencia de indicios de que el mismo Engel utilizara tales
conceptos o soporte teórico. Por ello proponen re-interpretar la obra de Engel, despojando
las ideas del mainstream actual, corroborando las leyes empíricas reveladas por él, sea
utilizando nuevos datos (y realidades) como así también métodos estadísticos más
consolidados y aplicados a la luz de las concepciones originales de Engel, no así de la
moderna teoría del consumidor. En esta línea se encuentras los trabajos recientes de Chai
y Moneta (2008; 2011), y Chakrabarty y Hildenbrand (2011).
Entre los primeros en reconocer la importancia de una adecuación del análisis empírico de
los presupuestos familiares con la teoría microeconómica se encuentran Allen y Bowley
(1935). Desde este punto de vista se busca obtener un modelo del comportamiento
individual de los hogares y derivar conceptos teóricos de la función de demanda
individual, en base a hipótesis de la maximización de la utilidad sujeto a una restricción
presupuestaria. Tal enfoque es el que ha sido adoptado comúnmente en las
investigaciones micro-econométricas de consumo y demanda de las últimas décadas. Una
de las obras con mayor impacto en esta línea es la de Deaton y Muelbauer (1980a), quienes
realizan una excelente presentación del ensamble posible de la microeconomía teórica y
aplicada.
4
Die Productions- und Consumtionsverhältnisse des Kónigreichs Sachsen, E. Engel (1857)
22
Bajo una perspectiva empírica o aplicada, las CE han recorrido un camino que va desde la
inferencia de una ley a la especificación de una forma funcional, y luego una vuelta a un
análisis de mayor flexibilidad funcional, manteniendo los requerimientos básicos de la
teoría del consumidor. En este capítulo se busca mostrar este recorrido de una forma
resumida. Con ello se desea presentar los fundamentos detrás de las CE, tanto en lo que
hace al marco teórico en el cual se sustentan como así también en el modo en el que ha
sido encarada su estimación y tratamiento estadístico a lo largo de la historia a partir de la
obra original de Engel. Lejos de ser exhaustivo, este tratamiento busca ser ilustrativo y
resumido a la vez, dado los objetivos de la presente tesis.
El capítulo se organiza de la siguiente manera. En primer lugar, se realizará una
presentación de las ideas originales de Engel, a la luz de lo que se entiende hoy por CE, y
cómo se encara su tratamiento empírico. Luego se presenta el marco teórico propuesto por
la teoría (neoclásica) del consumidor. Las últimas dos secciones están dedicadas a
presentar la forma en que se viene desarrollando la especificación econométrica de las CE.
2.2
La Ley de Engel por Ernst Engel
La investigación de Ernst Engel (1857) se centró en el estudio del comportamiento de las
familias en cuanto a la asignación que realizan de sus gastos en diferentes categorías de
bienes, tomando como medida aproximada del bienestar, la proporción del gasto en
ciertos bienes, específicamente considerando la noción smithiana de ‘necesidades’. De aquí
el foco en la relación de tales proporciones presupuestarias y los cambios en los niveles de
ingresos, contemplando específicamente categorías dentro de una definición previa de
clases socioeconómicas – específicamente, fundamentado en nivel de ingreso medio –
obteniendo mediante el estudio de una serie de datos de consumo de las familias, la
famosa ley de Engel: Mientras más pobre es una familia, una mayor proporción de su
gasto total es destinado al consumo de alimentos5.
5
“je ärmer eine Familie ist, einen desto grösseren Antheil von der Gesamtausgabe muss zur Beschaffung der Nahrung
aufgewendet warden” . Traducción de Stigler (1954: 98): “the poorer a family, the greater the proportion on its
total expenditure that mast be devoted to the provision of food”. Traducción propia al español.
23
Si bien no es objetivo en el presente indagar en el problemático terreno de las ‘leyes’ de la
economía, el enunciado de ley por parte de Engel cobra el sentido de una relación teórica
inferida desde los datos por inducción. Al sostener un enfoque metodológico inductivista,
se refiere con ello a la posibilidad de descubrir resultados teóricos desde el ensamble y
clasificación de hechos y observaciones (Chai y Moneta, 2008; citado a partir de la obra
original de E. Engel de 1854). En este sentido, siguiendo a Blaug (1985) podemos
considerar la propuesta de ley de Engel, como una ley estadística para la cual su
cumplimiento está ligado a una alta probabilidad de que se cumpla (análogamente, a la
ley de demanda).
Lo curioso es que en esta primera formulación no existe ninguna imposición sobre la
forma funcional específica para la derivación de la curva de Engel, lo que lleva a tal
estimación a encontrarse dentro del espíritu no paramétrico, si bien los métodos aplicados
por entonces, no pueden considerarse rigurosamente dentro de las regresiones
paramétricas o no paramétricas como son conocidas hoy en día (Chai y Moneta, 2008). A
pesar de ello, la estimación de Engel tiene una gran similitud con la estimación no
paramétrica por intervalos conocida como regresogramas (Engel y Kneip, 1996).
Claramente, como señalan estos autores, dada la época en la que Engel desarrolla sus
investigaciones, ni el método de mínimos cuadrados, y menos aún, los fundamentos de la
estadística no paramétrica estaban aún desarrollados. En este punto es necesario aclarar
que si bien el método de mínimos cuadrados fue desarrollado y publicado de forma casi
simultánea por Adrien-Marie Legendre en 1805 y por Carl Friedrich Gauss en 1809 (en el
que menciona que tal método fue planteado por el mismo en 1795), recién con Galton en
1886 se desarrolla dicho método en un marco más acorde al enfoque de la estadística
moderna (Abdi, 2007: 532).
Por lo tanto, de aquí podría pensarse que existen dos factores determinantes en la decisión
de no fijar una forma funcional precisa para el estudio de la relación entre la asignación de
los presupuestos familiares y los ingresos percibidos por las mismas. Por un lado, como
ya se mencionó, el estado del arte de las técnicas estadísticas de estimación desarrolladas
a fines del siglo XIX. Por otra parte - los cuales son vinculantes por medio del desarrollo
posterior de modelos - para el período se tiene un incompleto desarrollo de la teoría del
consumidor y más precisamente, del papel del ingreso o renta como variable clave de la
24
teoría económica, que no fue teóricamente reconocido hasta la década de 1890 y no fue
sistemáticamente analizado a partir de 1930 (Blaug M., 1985: 189). Por lo tanto es
esperable el desarrollo tardío que fundamenta la especificación entre el ingreso de las
familias y la proporción del gasto que realizan en un determinado producto respecto a la
estimación temprana de esta relación, sin forma funcional alguna, infiriéndose desde
valores observados; con una clasificación final de los tipos de consumo descrito por las
elasticidades- ingreso tratadas posteriormente por la teoría, y con un tratamiento empírico
más claro mediante el impulso de los desarrollos econométricos.
A pesar de que la diferencia temporal parece ser crucial a la hora de diferenciar el
tratamiento original de la obra de Engel respecto a las investigaciones actuales de
estimación de funciones de Engel y de los sistemas de demanda, claramente el
inductivismo creador de teorías genera a la vez una separación mayor con los desarrollos
tempranos de especificaciones paramétricas. También un acercamiento hacia la
generalización de las expresiones funcionales generadas por los recientes estudios no
paramétricos. Al fin, esta ambivalencia parece ser resuelta ante una posición equilibrada
donde la flexibilidad de la CE y su adecuación teórica pueden tener lugar en una misma
línea de investigación.
2.3
La Curva de Engel desde la Teoría del Consumidor
En lo que sigue se presentarán, de una forma simple, los fundamentos teóricos básicos
del comportamiento del consumidor a partir del cual se derivan las CE. Esto se realiza en
el marco onto-metodológico de la teoría neoclásica del consumidor; entendida ésta a
partir del afianzamiento con el ordinalismo introspectivo de Slustzky, Allen y Hicks, la
generalización mediante la teoría de las preferencias reveladas de Samuelson, la teoría de
la utilidad esperada de Neumann-Morgestern y la teoría de las características de las
mercancías de Lancaster (Blaug, 1985: 186).
Suponiendo que u (q ) es la función de utilidad de una familia u hogar que representa sus
preferencias en cuanto a la elección de n bienes representados por el vector de cantidades
q T = (q1 , K , q n ) . Sea G el gasto total del hogar en bienes y servicios o su ‘ingreso
25
nominal’ (Barnett y Serletis, 2008), y p T = ( p1 , K , p n ) el vector correspondiente de precios
de los n bienes6, luego el problema del hogar se traduce en
max u (q )
q
sujeto a
pT q = G
(2.1)
De las condiciones de primer orden del problema de optimización (2.1) se obtiene las
usuales funciones de demanda marshalianas
q j ≡ g j (p, G )
j = 1, K , n
Si los precios son absorbidos por la forma funcional, luego de (2.2)
(2.2)
se obtiene la
denominada curva de Engel (Deaton y Muellbauer, 1980: 19), esto es
q j = g j (G )
*
(2.3)
Los sistemas de Demanda o de curvas de Engel en general son expresados en términos de
la participación que tiene cada bien en el gasto total o presupuesto del hogar w j donde
w j = p j g j (p, G ) / G
(2.4)
Las demandas marshalianas satisfacen ciertas propiedades, algunas de ellas derivadas de
los requerimientos del problema del óptimo y con ello de las propiedades de las funciones
de utilidad, mientras que otras se derivan de la misma restricción presupuestaria. Entre
las más relevantes se tienen
(i)
Aditividad. Ésta se deriva del hecho de que las funciones que conforman el
sistema (2.2) deben cumplir con la restricción presupuestaria, por lo tanto
p T g (p, G ) = G
(ii)
Homogeneidad. Las funciones de demanda son homogéneas de grado cero en
(p, x ) ,
i.e. ∀θ > 0 e
j = 1, K , n , se cumple que g j (θ p, θ G ) = g j (p, G ) . En
términos económicos esta restricción indica la ausencia de ilusión monetaria: la
6
En este capítulo teórico se toma a G como un equivalente del gasto o del ingreso total. Sin embargo,
claramente ambos conceptos son diferentes. La elección del gasto total como medida de poder adquisitivo se
fundamente en aspectos tanto teóricos-empíricos, como prácticos. Por un lado, su elección permite el
cumplimiento de algunas propiedades teóricas en las especificaciones empíricas al tratar con sistemas (Deaton
y Muellbauer, 1980). A su vez, la elección del gasto total resulta más compatible con la investigación original
de Engel. Desde el punto de vista práctico, el ingreso total es más difícil de captar que el gasto total, existiendo
a su vez una alta correlación entre ellos (Iyengar, 1967)
26
forma en que están expresados los precios y el gasto o ingreso total no tienen
efecto sobre el consumo
(iii)
Simetría y Negatividad de la matriz de Sustitución. Sea la matriz
S = [∂g (p, G ) / ∂p T + (∂g (p, G ) / ∂G )g (p, G ) ] ,
T
la misma es simétrica y semi-definida negativa.
Las propiedades (i)-(iii), junto con la positividad de las funciones de demanda,
constituyen las denominadas condiciones de integrabilidad de la teoría del consumidor, pues
su cumplimiento permite reconstruir el pre-orden de preferencias a partir del sistema de
demanda. Si tales propiedades son testeadas empíricamente y no pueden ser rechazadas,
entonces se puede inferir que existe la función de utilidad que genera el sistema de
demanda (Barnett y Serletis, 2008: 211).
De aquí puede observarse, que las propiedades (i)-(iii) no imponen alguna forma
funcional para la curva de Engel q j = g j (G ) más que su suavidad. Por lo tanto, en el
*
estudio de la forma funcional de curvas de Engel separadas (no en sistema), con las
condiciones básicas de regularidad (continuidad y derivabilidad) alcanza. Sin embargo, la
forma específica que adopte la CE, considerando las transformaciones usuales realizadas
sobre las variables implicadas, hacen que en la especificación de un sistema, puedan o no
cumplirse todas o algunas de las condiciones de integrabilidad. Por algo, algunos sistemas
de demanda, que suponen una forma específica sobre la CE, han tenido más éxito que
otros.
De las funciones de demanda (2.2) se obtienen las elasticidades precio e ingreso (o gasto).
De las CE, se obtienen solamente la elasticidad-gasto, que es computada en esta tesis,
tanto como función de G, como en sus valores promedios. La definición teórica de la
misma es
∂g j (G )
G
∂G
g j (G )
*
e j (G ) =
*
(2.5)
A partir del valor que asume se pueden clasificar los bienes y servicios en: bienes de lujo,
necesarios e inferiores, dependiendo de si e j > 1 , 0 < e j < 1 o e j < 0 , respectivamente. Si
27
la CE es expresada en términos de la participación de cada bien en el gasto total, esta
clasificación pueden entenderse mirando cómo se comporta tal participación a medida
que se incrementa el poder adquisitivo del hogar: Si el hogar destina una mayor
proporción de su presupuesto en el bien ante incrementos adicionales del ingreso,
entonces se trata de un bien de lujo. Si se destina una menor proporción del presupuesto
ante incrementos del poder adquisitivo, se trata de un bien necesario, y si la participación
cae en mayor proporción al aumento del ingreso, entonces se trata de un bien inferior.
Esta clarificación resulta crucial para entender cuestiones económicas muy relevantes,
como la incidencia de impuestos específicos a determinados bienes. A su vez, para
determinados rangos de ingreso, un bien puede ser de lujo para hogares con cierto poder
adquisitivo, mientras que es un bien necesario o inferior para hogares pertenecientes a
otra categoría según ingresos. A su vez, las circunstancias de consumo pueden resultar
muy relevantes para clasificar al bien (García Arancibia, 2011).
La forma simple (2.3) puede extenderse de modo que incluya las características
demográficas y socioeconómicas del hogar, más allá de su ingreso o gasto total, i.e
q j = g j (G , z )
*
(2.6)
Usando la transformación (2.4), luego se tiene la CE teórica que será analizada
empíricamente a lo largo de la tesis
w j = m j (G, z )
(2.7)
Respecto a la curva de demanda marshaliana, estas CE pueden entenderse como una
adaptación de las mismas para un nivel de precios dado (fijos), o bien donde el efecto de
los precios es absorbido por la forma funcional. Esta última interpretación se ajusta más a
lo que se observa de las CE estimadas empíricamente. Por otra parte, debe tenerse en
cuenta que las derivaciones de las funciones generales (2.2)-(2.7) se realizan sobre un
consumidor ‘representativo’, por lo que su extensión al nivel de ‘hogares’ en el análisis
aplicado, requiere al menos dos consideraciones. Por un lado, aceptar como unidad de
análisis el hogar en el sentido de que las decisiones racionales se toman en él como
unidad. Es decir, que más allá de las distintas preferencias de los miembros de un hogar,
debe suponer que el hogar como un todo revela un (pre)orden de preferencias bien
28
definido. Por otra parte, se supone que para un nivel fijo de z todos los hogares tienen las
mismas preferencias, y enfrentan un mismo vector de precios p. Claramente, el
cumplimiento de tales condiciones resulta algo desalentador en la pretensión de querer
encajar de un modo perfecto la teoría con la práctica. Sin embargo, existe un margen
donde la empiria puede ser contrastada con formas funcionales y determinadas
propiedades que resultan consistentes en el marco de la teoría del consumidor.
Si bien la presente tesis está enfocada al problema de estimación de especificaciones no
paramétricas y semiparamétricas de curvas de Engel, la especificación general adopta una
forma que puede ser contrastable con especificaciones paramétricas fijas consistentes con
la teoría económicas Tales especificaciones surgen a mitad del siglo pasado, y con los años
se fueron extendiendo y adaptando a las condiciones de integrabilidad de la teoría del
consumidor, y hasta el día de hoy son profusamente utilizadas en los estudios económicos
aplicados.
2.3
Especificaciones Tempranas
El esfuerzo volcado hacia especificaciones ‘correctas’ de las formas de curvas de Engel
tiene como objetivo general obtener conclusiones, de resultados empíricos, capaces de
corroborar las proposiciones fundamentales derivadas mediante deducciones lógicas a
partir del marco axiomatizado de la teoría neoclásica del consumidor. Como se pudo ver
de la sección anterior, a pesar de los lineamientos que brinda dicha teoría, la misma no da
una forma funcional explicita, por lo que ésta debe ser estimada o bien mediante la
especificación de una determinada forma funcional –lineal, cuadrática, cúbica, etc - o bien
suponiendo solamente unas condiciones de regularidad suficientes.
Entre los primeras propuestas de una especificación econométrica de la CE, claramente
predominó la metodología paramétrica, es decir modelos donde se supone el
conocimiento de la relación funcional entre el gasto total del hogar y la cantidad
demandada de un bien, adicionalmente al conocimiento de la distribución de la
componente estocástica. Uno de los primeros estudios donde se prueban diferentes
relaciones funcionales simples, es el clásico trabajo de Prais y Houthakker (1955). Estos
29
comparan tres especificaciones, mostrando la superioridad de algunas sobre otras para
diferentes bienes o rangos del gasto total. Estas son:
La Doble-Logarítmica:
ln q j = α j + β j ln G
(2.8)
La Semi-Logarítmica:
q j = α j + β j ln G
(2.9)
La Recíproca:
ln q j = α j + β j G −1
(2.10)
Si bien algunas de las especificaciones (2.8)-(2.10) puede brindar un ajuste aceptable con
los datos, las mismas no han sido muy utilizadas en el desarrollo de las especificaciones
de CE debido a que ninguna satisface por completo la restricción (i) de aditividad (Deaton
y Muellbauer, 1980: 17-19). Puesto que la misma se termina corroborando a través de
sistemas completos de demanda o CE, la utilización de (2.8)-(2.10) ha sido defendida para
las aplicaciones empíricas que involucran un solo bien, utilizándose en varios estudios
actuales de CE (Haque, 2005; García Arancibia, 2011; entre otros). Sin embargo, existen
especificaciones de CE que son compatibles con los requerimientos de la teoría del
consumidor, y no implican una mayor complejidad. En particular, se encuentran los
trabajos pioneros realizados por Working (1943) y Leser (1963) quienes brindaron un
conjunto de criterios metodológicos para especificar curvas de Engel:
1.
Conexión íntima con la función de utilidad directa o indirecta
2.
La función debería ser válida para un rango extenso de valores positivos del
gasto total y las variaciones en la elasticidad-ingresos vinculadas con tal
especificación deberían así mismo, ser plausibles.
3.
La estimación de parámetros debería ser simple persiguiendo una evaluación
confiable y un buen ajuste, con un error de especificación razonable.
Claramente los requisitos de Leser dan el puntapié a la problemática de la especificación,
sintetizando en (1) y (2) los requerimientos mínimos de una consistencia entre la forma
funcional y lo que dicta la teoría del consumidor; mientras que (3) pone en relevancia las
consideraciones econométricas.
30
De estos primeros trabajos surgió la comúnmente denominada especificación WorkingLeser representada por una forma lineal que relaciona la participación que tiene un
determinado bien en el presupuesto familiar con el logaritmo natural del gasto total,
tomada esta última como variable proxy del ingreso, i.e.
w j = α j + β j ln G
(2.11)
con w j = p j q j / G .
Posteriormente, esta forma funcional fue perfeccionada por Deaton y Maulbauer (1980)
colocándola dentro de la integrabilidad de la teoría del consumidor. A partir de ello, las
formas de Engel cobran relevancia dentro de los sistemas usuales de demanda (AIDS,
translog, PIGL, y PIGLOG) pero que, como señala Costa (2001), éstos han sido favorecidos
por su mejor representación de la propiedad de agregación de los agentes económicos
más que por poseer un ajuste superior.
Lewbell (1991) es quien propone la utilización de modelos más complejos que la
especificación lineal logarítmica, y en particular cuando la muestra con la que se trabaja
incluye familias de muy bajos ingresos-gastos o de elevados ingresos-gastos. Así
Hausman et al. (1995) encuentran que al tener la expresión cúbica de la covariable
obtienen un mejor ajuste que para cualquier polinomio de grado menor.
En definitiva, se puede ver que el desarrollo de una mejor especificación responde a
ambas necesidades (teórica- econométrica), pudiendo complicarse la forma funcional
adoptada aunque ganando en términos de ajuste, como es en el caso de las expresiones
polinomiales.
Por lo tanto, lo que resulta claro es que, con el desarrollo de la teoría del consumidor (y las
transformaciones metodológicas de la economía en general) el problema de estudiar los
estándares de vida de las familias como función de la relación gasto-ingreso, cobró un
sentido más estricto en cuanto a la búsqueda y determinación de una relación funcional
exacta.
31
2.4
De Nuevo al ‘Espíritu’ No Paramétrico
Ahora bien, hasta el momento se trata a una especificación econométrica a partir de
formas funcionales fijas para la estimación de las relaciones de Engel. Sin embargo, en los
últimos tiempos ha crecido el número de investigaciones en los cuales se aceptan formas
funcionales más flexibles. De esta manera, la CE simple adopta la forma general (2.7)
abordada de forma no paramétrica. En general, dada la dificultad de estimar una función
de varias variables de forma no paramétrica (por la conocida maldición de la
dimensionalidad), se ha optado por especificar de forma no paramétrica al gasto o ingreso
total (i.e. a la ‘esencia’ de la CE), incorporando a su vez como covariables adicionales las
características socioeconómicas y demográficas de las familias en forma paramétrica. Esta
especificación se denomina semiparamétrica y cobra gran importancia por las
implicaciones de asignación del gasto dentro de los hogares y su relación con las
características de la composición del hogar.
Ahora bien, ¿Cuál es la ventaja de utilizar una especificación no paramétrica de la CE?
Básicamente, la mayor flexibilidad que supone el solo requisito de las condiciones
mínimas de regularidad de la función de distribución. En particular, Blundell et al. (2003)
enumeran algunas ventajas de las especificaciones no paramétricas de CE. En primer
lugar, sostienen que los estudios paramétricos de demanda basados en micro datos, por lo
general no cumplen con la propiedad de simetría de Slutsky la cual es una de las
implicaciones del problema de maximización de utilidades sujeto a la restricción
presupuestaria. Esto podría deberse, o bien a una forma funcional errónea, o bien porque
no existen unas preferencias bien definidas que puedan estar racionalizadas en los datos.
Los análisis no paramétricos permiten chequear esto. Por otro lado, al usar métodos
paramétricos siempre existe incertidumbre acerca de hasta qué punto las conclusiones
sobre el bienestar son reflejadas por la forma funcional. Las técnicas no paramétricas
permiten obtener ciertos límites sobre los efectos en el bienestar posibilitando usar estos
límites a fin de determinar la importancia de la forma funcional sobre las conclusiones de
bienestar. También el análisis no paramétrico puede ayudar a desarrollar un nuevo
sistema de demanda paramétrico.
32
Por lo tanto, la vuelta ‘al espíritu no paramétrico’ del trabajo original de Engel no solo
implica una ganancia en la mayor flexibilidad, desde ya garantizada en las estimaciones
más precarias de Engel, sino que también se puede ganar precisamente en determinar si
alguna forma funcional compatible con la teoría del consumidor es concordante con la
función derivada de ‘hacer hablar a los datos’.
En esta tesis, dentro de estas formas flexibles, se busca aquélla que mejor represente los
datos en términos estadísticos como así también económicos. Del mismo modo, las CE
flexibles se contraponen con especificaciones tipo Working-Leser, para conocer si para
determinados tipos de alimentos se puede trabajar con un modelo paramétrico compatible
que cumpla con los requerimientos teóricos básicos. Asimismo, se considera que las CE
totalmente no paramétricas, analizadas en sub-muestras por tipos de familias u hogares
(lo que es compatible con el enfoque original de Engel), resultan ser un instrumento muy
poderoso e ilustrativo para la economía aplicada. Por su parte, las CE semiparamétricas
permiten incorporar estas CE de cada sub-muestra en una sola ecuación, aunque con sus
limitaciones.
33
Capítulo 3
Metodología
3.1
Introducción
En este capítulo se presentan los métodos de estimación e inferencia utilizados en la tesis,
aplicados en los tres capítulos que componen la segunda parte de la misma. Por lo tanto,
el desarrollo del marco metodológico se presenta de forma que siga un orden cronológico
de acuerdo a la forma en que se siguen los capítulos que conforman los resultados.
En la sección 3.2 se describen los métodos de estimación no paramétricos que serán
considerados y comparados en lo que hace a su aplicación en la estimación de curvas de
Engel (CE). Luego en la sección 3.3 se presenta la construcción de intervalos de confianza
bootstrap para tales estimadores y los test de especificación que se utilizarán para
contrastar especificaciones paramétricas usuales. En las secciones 3.4 y 3.5 se exponen las
medidas que son utilizadas para la evaluación estadística y económica de los estimadores
no paramétricos. Para la evaluación estadística se proponen una serie de medidas del
error de estimación y predicción, y de bondad de ajuste, para la comparabilidad de los
estimadores. Para la evaluación económica, se muestra la forma que adoptan las
elasticidades-gasto y su metodología de estimación. Las mismas no solo tienen por fin
evaluar los estimadores sino que también son utilizadas para la interpretación económica.
Hasta aquí se tienen los métodos que son aplicados en el capítulo 5 de los resultados.
En la sección 3.6 se desarrolla el marco metodológico para el Capitulo 6 de Resultados.
Específicamente se presenta el modo en que son estudiadas las características
demográficas de los hogares mediante un enfoque totalmente no paramétrico. Dado el
carácter anidado de la tesis, se ven aplicados los métodos de las secciones anteriores.
34
Por último, en la sección 3.7, se desarrolla la especificación semiparamétrica de las CE
que será estudiada, mostrando el procedimiento de estimación y el cómputo de desvíos
estándares heterocedásticos para la inferencia. Adicionalmente, se proponen correcciones
de las CE y de sus elasticidades ante la presencia de un gasto total endógeno debido a la
posible simultaneidad de las elecciones de los hogares consumidores.
3.2
Metodologías de Estimación No Paramétricas
Considerando la expresión estocástica general de una curva de Engel especificada a través
de la participación en el gasto que tiene un determinado bien j en el presupuesto del
hogar i ( wij ) como función del gasto total Gi , (tomado en su logarítmo) , i.e.
wij = m j (ln Gi ) + ε ij
(3.1)
se supone que mh , j ∈ ℑh , siendo ℑh un espacio de funciones suaves. Para la estimación
de
m h , j ( x) = E (wij | ln Gi = x ) existen métodos de regresión o ‘suavizados’ no
paramétricos con propiedades particulares que hacen que algunos estimadores se
prefieran a otros, en base a criterios que van desde su simplicidad computacional a su
mejor poder predictivo. En las investigaciones econométricas aplicadas, los estimadores
más utilizados son aquéllos basados en núcleos o kernel, incluyendo a los polinomios
locales; y últimamente se ha extendido el uso de regresiones spline, aunque siguen
predominando los primeros (Cameron & Trivedi, 2005). En la presente sección se
presentarán tales métodos con los que se trabajará a lo largo de la tesis.
3.2.1 El Estimador N-W
Un caso especial de las regresiones kernel, lo constituye el denominado estimador
Nadaraya-Watson7 (Nadaraya, 1964; Watson, 1964). Para el caso de diseños aleatorios, el
mismo puede derivarse a partir de la definición de esperanza condicional utilizando
funciones kernel o núcleos para la estimación de densidades (Härdle et al., 2004). De esta
manera, m (x ) puede expresarse de la forma
7
De aquí en adelante Estimador N-W
35
f ( x, w)
∫ wf ( x, w)dw
dw =
f ln G ( x)
f ln G ( x)
m( x) = E (w | ln G = x ) = ∫ w
(3.2)
donde f ( x, w) es la densidad conjunta de w y ln G , y f ln G la densidad marginal de ln G
. Sea K (.) una función acotada, simétrica y cuya integral en todo su dominio es igual a la
unidad, para las observaciones
{xi , wi }iN=1 ,
el estimador por núcleos de la densidad
fˆ ( x, w) =
conjunta f ( x, w) viene dado por
1
N
∑ K ( )K ( ) y para
x − xi
h
w− wi
g
f ln G el estimador
i
por núcleos es fˆln G ( x ) =
1
N
∑ K (x − x ) . Desarrollando ∫ wfˆ ( x, w)dw , haciendo uso de las
i
i
propiedades de las funciones kernel, de (3.2) se obtiene la expresión del estimador N-W:
N
N −1 ∑ K h ( x − xi )wi , j
i =1
mˆ h , j ( x) =
N
N
−1
∑ K (x − x )
h
i
i =1
N
 x − xi 
( Nh) −1 ∑ K 
 wi , j
h 

i =1
=
N
 x − xi 
( Nh) −1 ∑ K 

 h 
i =1
(3.3)
siendo h el parámetro de suavizado o ventana (bandwidth) y K (.) una determinada
función núcleo ponderadora, donde K h (u ) = h −1 K (u / h ) . Entre las funciones K (.) más
utilizadas se tiene la Uniforme o Rectangular ( K (u ) =
K (u) = (1− | u |) I |u|≤1 (u ) ),
la
Gaussiana
( K (u ) =
1
2π
e −u
2
1
2
I |u|≤1 (u ) ), la Triangular (
/2
),
la
Epanechnikov
(
K (u ) = 34 (1 − u 2 ) I |u|≤1 (u ) ) y la Tricúbica ( K (u ) = (1− | u |3 ) 3 I |u|≤1 (u ) ). La elección de K (.)
tiene poco efecto sobre la performance del estimador, contrariamente de lo que ocurre con
la ventana h (Härdle, 1991). Siguiendo a Loader (1999) se utilizará el núcleo Tricúbico en
todas las estimaciones que involucren a una función del tipo K (.) . La elección de h , lejos
de ser arbitraria, resulta crucial para el manejo del ‘trade-off’ entre sesgo y varianza de los
ˆ h ( xi ) → wi por lo que se obtiene una
estimadores no paramétricos. Cuando h → 0 , m
ˆ h (xi ) → w y por lo tanto el
interpolación de los datos. Por otra parte, si h → ∞ luego m
estimador se transforma en una función constante e igual a la media muestral de la
variable respuesta para cada valor del gasto total. En términos generales, el suavizado
*
óptimo h es aquel que minimiza el Error Cuadrático Medio (ECM). Bajo ciertas
36
∫
( )
condiciones ( K (u ) du < ∞ , lim uK (u ) = 0 y E w 2 < ∞ ) y suponiendo que h → 0 ,
|u |→ ∞
Nh → ∞ , es posible demostrar que8
ECM [mˆ h ( x )] ≈ ( Nh )
−1
σ 2 (x )
h4
K2+
4
f ln G ( x)
2
2

m' ( x ) f ln G ' ( x)  2
m' ' ( x ) + 2
 µ 2 (K )
f ln G ( x) 

Con σ 2 ( x ) = V (w | ln G = x ) , µ 22 (K ) = u 2 K (u ) du y m
∫
(k )
(3.4)
la k-ésima derivada de m . El
primer término de (3.4) se corresponde con la varianza del estimador, mientras que el
segundo es el sesgo al cuadrado del mismo. El término 2[ m' ( x ) f ln G ' ( x )] / f ln G ( x ) en la
expresión sesgo al cuadrado, es denominado ‘sesgo de diseño’ debido a que depende de
la distribución de la variable ln G , por lo que el sesgo es sensible a la posición de las x i ’s.
Relacionado con esto, una característica del estimador N-W es la presencia de un mayor
sesgo en los extremos (‘sesgo de frontera’), siendo una desventaja respecto a otros
estimadores menos sensibles a los puntos extremos. Ya con los polinomios locales, que se
presentan en la próxima sub-sección, se logra reducir tal sesgo.
La versión asintótica de (3.4) puede escribirse de la forma
ECMA( N , h ) = ( Nh) −1 C1 + h 4 C 2
(3.5)
siendo C1 y C2 términos constantes con respecto a ( N , h) (Härdle et al., 2004).
Minimizando tal expresión con respecto a h , es fácil ver que el parámetro de suavizado
(
)
óptimo será h * = O N −1 / 5 , y con ello de (3.4) – (3.5) se deduce que, en el óptimo, el error
(
)
cuadrático medio decrece a una tasa del orden O N −4 / 5 . Esta tasa de convergencia menor
a la del estimador mínimo cuadrático del modelo lineal paramétrico, es el costo que debe
asumirse al utilizar métodos de regresión no-paramétrica. Claramente, en términos
prácticos la elección del parámetro de suavizado a partir de (3.4)-(3.5) no resulta
directamente viable debido a que depende de m y de sus derivadas, como así también de
la densidad de la variable ln G , por lo que se recurre a diferentes métodos empíricos para
*
la elección h . Más adelante se presentan los métodos de selección del suavizado
utilizados en el presente trabajo y que son aplicables al conjunto de ‘suavizados lineales’.
Ver Härdle et al. (2004), Cap. 4 (Sección 4.1.2.3). Bajo las mismas condiciones se demuestra la convergencia en
probabilidad del estimador N-W.
8
37
La expresión (3.3) del estimador N-W puede re-expresarse de la forma
N
mˆ h (x ) = ∑ H h ,i ( x )wi
(3.6)
i =1
con
H h ,i ( x ) =
N −1 K h ( x − x i )
N
N −1 ∑ K h ( x − xi )
i =1
Con lo cual
N
∑ H (x ) = 1
h ,i
i =1
Por lo tanto, el estimador N-W puede interpretarse como un promedio ponderado local
de la variable respuesta alrededor de x0 o bien como una combinación lineal de la
variable respuesta wij . De aquí que pertenezca a la clase de suavizados lineales. Esta
propiedad es compartida por varios estimadores no paramétricos, y en particular, por los
otros dos métodos que se aplicarán en la presente investigación.
De la literatura relevada, el estimador N-W parece ser el más utilizado para la estimación
no paramétrica y semiparamétrica de curvas de Engel (Banks et al., 1997; Delgado & Miles,
1997 ; Blundell & Duncan, 1998; Fousekis & Lazaridis, 2001; Blundell et al., 2003;
Barrientos Marín, 2006; 2009; entre otros). Sin embargo, otros estimadores poseen ventajas
estadísticas sobre éste,
sin necesidad de incurrir en mayores costos o complejidad
computacional.
3.2.2 Polinomios Locales
El estimador N-W puede ser interpretado como un caso particular de regresiones
polinómicas locales. Específicamente, el estimador N-W puede derivarse de obtener aquel
polinomio local de grado cero (i.e. constante) que minimiza la suma de cuadrados de los
residuos ponderada por ωh ,i ( x0 ) = K h ( xi − x ) . Es decir:
38
N
aˆ ≡ mˆ h = arg min ∑ (wi − a ) ω h ,i ( x )
a
2
(3.7)
i =1
De las condiciones de primer orden para un mínimo, surge que â es justamente el
estimador N-W de (3.6). Por lo tanto, el estimador N-W puede ser visto como una
constante (o polinomio de grado cero) local, obtenido del problema de ‘mínimos
cuadrados ponderados locales’. Una generalización de esto resulta de proponer un
polinomio local de grado p. De esta manera, para un punto x0 del logaritmo del gasto
(
total, se busca un vector aˆ = aˆ0 ,K, aˆ p
N
)
T
tal que
[
min ∑ wi − a 0 − a1 ( x i − x ) − K − a1 ( xi − x )
a
]ω
p 2
h ,i
(x )
(3.8)
i =1
Se puede observar que el estimador â está evaluado en un punto específico de la covariable y por lo tanto varía ante cambios en el valor de las x' s . P ello resulta conveniente
(
)
expresarlo de la forma aˆ ( x ) = aˆ0 ( x ),K, aˆ p ( x ) . La solución de (3.8) es la que corresponde
T
a mínimos cuadrados ponderados, aunque en este caso para cada valor de la variable
ln G . Es decir:
(
aˆ ( x ) = XTx Ω x X x
)
−1
XTx Ω x w
w = (w1 , K, wN ) ,
T
donde
1

1
Xx = 
M
1

(x1 − x )
(x2 − x )
K
K
M
O
(x N − x ) K
(3.9)
(3.10)
(x1 − x ) p 
(x 2 − x ) p 
 ,
M

(x N − x ) p 
Ω x = I N × N (ω h ,1 ( x ), K , ω h , N ( x ))
T
(3.11)
(3.12)
Con ωh ,i ( x ) = K h ( xi − x ) ≡ K (( xi − x ) / h ) . De (3.9) se concluye que los polinomios locales
pertenecen también a la clase de suavizados lineales.
39
Por lo tanto, de la estimación por polinomios locales se obtienen regresiones locales a cada
punto x j de la muestra {xi }i =1 . A pesar de obtener en (3.9) un vector de estimadores â de
N
los coeficientes polinómicos, de (3.8) se puede observar que el estimador local polinómico
de la función de regresión m vendrá dado por
mˆ h = aˆ0 ( x )
(3.13)
Para el caso particular de p = 0 se tiene el estimador local constante que no es más ni
menos que el estimador N-W. Cuando p = 1 se tiene el denominado estimador local lineal
y para p = 2 el estimador local cuadrático. Para las aplicaciones de la tesis se consideran
estos dos estimadores locales polinómicos, además del N-W, dado que ajustes cúbicos o
de mayor orden rara vez producen mejoras adicionales en la estimación (Loader, 1999:
22). Ahora bien, ¿Por qué puede resultar conveniente utilizar un polinomio con p > 0 en
vez de conformarse con el ajuste del N-W? La respuesta a esta pregunta recae
esencialmente en la disminución del sesgo del estimador, principalmente en los puntos
extremos, disminuyendo así mismo la sensibilidad ante ‘outliers’. Para ver esto, basta con
observar las componentes del error cuadrático medio del estimador local lineal. Siguiendo
a Härdle et al. (2004) el mismo puede expresarse de la siguiente manera:
ECMA[mˆ h ( x )] ≈ ( Nh) −1
σ 2 (x )
f ln G ( x)
2
K2+
h4
{m' ' (x )}2 µ 22 (K )
4
(3.14)
Comparando con (3.4) se observa que el estimador local lineal no presenta el sesgo de
diseño, y desaparece cuando m es lineal. Con esto se tiene que el estimador local lineal
logra mejorar la estimación en aquellos intervalos donde las observaciones están más
esparcidas, como es en los niveles extremos de ingresos. Específicamente, en los puntos
extremos el estimador N-W tiene un sesgo asintótico de orden h , mientras que el sesgo
2
del estimador local es del orden h , por lo que este último apacigua el sesgo de frontera
(Wasserman, 2006).
Respecto a estimadores polinómicos locales con p > 1 puede decirse que es esperable que
un mayor grado conlleve un estimador con menor sesgo, aunque incrementando su
variabilidad debido a la mayor cantidad coeficientes a estimar, mezclándose los efectos
del grado del polinomio con los del parámetro de suavizado. Por lo tanto, se recomienda
40
trabajar con polinomios de grado 1 y/o 2 y luego concentrarse en la elección del parámetro
de suavizado óptimo para cada caso (Loader, 1999).
3.2.3 Suavizado Spline
Los estimadores presentados anteriormente guardan una estrecha relación, a saber: el
estimador N-W puede ser visto como un caso particular de los estimadores polinómicos
locales, pudiéndose expresar como resultados de problemas de minimización locales de
los residuos al cuadrado ponderado por una determinada función núcleo. Existen otros
estimadores no paramétricos que descansan en enfoques, casi en su totalidad, diferentes a
tales suavizados locales, aunque se basan en algún proceso de optimización de alguna
función de los residuos. Uno de ellos es el suavizado mediante splines. El mismo está
basado en el criterio de mínimos cuadrados penalizados. El problema consiste en elegir
m de forma tal que minimice
N
∑ (w
i
i =1
− m( xi ) ) + λ m´´ 2
2
2
(3.15)
Con
m´´ 2 = ∫ m' ' ( x )dx
2
(3.16)
El término (3.16) se corresponde con la penalización por la ‘rugosidad’ de la curva
estimada. En este caso el parámetro λ es el que controla la suavidad de m̂ manejando el
trade-off entre un ajuste interpolado y la penalización. Cuando λ = 0 , la solución de (3.15)
es simplemente la función interpoladora. Mientras mayor sea λ , más peso se le otorga a
2
m´´ 2 , derivando en un estimado más suave. En el límite, si λ → ∞ , m̂ converge a la
estimación lineal por mínimos cuadrados ordinarios (MCO). En este problema la
penalización recae sobre la derivada segunda de la función, por lo que debe suponerse
que la misma existe. El problema de mínimos cuadrados penalizados puede generalizarse
incorporando la k-ésima derivada en la componente de penalización mediante la norma
de Sobovev, para la cual
m Sob =
(∫ m + (m') + L +(m
2
2
) dx)
(k ) 2
1/ 2
(Yatchew, 2003: 37-40).
41
La función m
ˆ ( x ) que minimiza (3.15) es lo que se conoce como un spline cúbico natural
cuyos nodos son los datos ordenados, i.e.
{x (1) , K , x ( N ) }
con x(i ) ≤ x(i +1) (Green y
Silverman, 1994). Específicamente, considerando la clases de funciones dos veces
diferenciables en el intervalo [ x (1) , x ( N ) ] , luego se demuestra9 que la única función que
mˆ λ ( x) representado por medio de
minimiza (3.15) está dada por un estimador
polinomios cúbicos de la forma pi ( x ) = β0,i + β1, i x + β 2,i x + β3,i x
2
2
para cada intervalo
[ x(i ) , x( i +1) ] con i = 1,K, n − 1 . Para una base de B-Splines de orden 4, {Bi , i = 1, K , N + 4} ,
el spline cúbico natural puede escribirse como combinación lineal de tal base, i.e.
mˆ ( x ) =
N +4
∑ bˆ B (x )
j
(3.17)
j
j =1
(
Por lo tanto, para obtener m
ˆ ( x ) basta con estimar bˆ = bˆ1 , K , bˆN + 4
)
T
. De esta manera, se
puede re-expresar el problema de mínimos cuadrados penalizados utilizando la expresión
de m por medio de su base, obteniendo el siguiente planteo:
min (w − Bb ) (w − Bb ) + λb T Ψb
T
b
(3.18)
∫
Donde [B]ij ≡ Bij = B j ( xi ) y [ Ψ ] jk ≡ ψ jk = B 'j' ( x )Bk'' ( x )dx . Resolviendo (3.18) se tiene que:
(
bˆ = B T B + λΨ
)
−1
BT w
(3.19)
De esta manera, de (3.17) y (3.19) se observa que los suavizados spline pertenecen a la
clase de suavizados lineales.
3.2.4 Matrices de los Suavizados y Grados de Libertad
Como se mencionó anteriormente, los tres tipos de estimadores no paramétricos
presentados pertenecen a una clase más general de suavizados lineales. Esta propiedad
que comparten tales estimadores es una ventaja al momento de proponer criterios
comunes para la elección de los suavizados y construcción de medidas o estadísticos para
su comparación. En esta sub-sección se presentarán algunos componentes de los
9
Para un desarrollo exhaustivo de los suavizados spline ver Green y Silverman (1994).
42
suavizados lineales, que resultan cruciales para abordar los problemas de estimación e
inferencia, bajo una perspectiva común.
Anteriormente se presentó a los suavizados lineales como aquéllos que pueden expresarse
como combinaciones lineales de los valores observados de la variable respuesta (que en el
caso de curvas de Engel sería la participación del algún alimento específico en el gasto
total, i.e. w = {wi }iN=1 ). Más formalmente, se dice que un estimador m̂ de m es un
suavizado lineal si existe una matriz L , denominada matriz de suavizado, tal que
m̂ = Lw
(3.20)
donde m
ˆ ≡ (mˆ ( x1 ), K , mˆ ( x N ) ) = (wˆ 1 , K , wˆ N ) ≡ ŵ , y L es una matriz de orden n × n con
[L]ij = l j ( xi ) , por lo que cada fila de L es un vector de ponderaciones que se aplican a
cada wi para obtener el estimador m
ˆ ( xi ) . En base a esta definición general de los
suavizados lineales puede observarse de (3.6) que la matriz de suavizado para el
estimador N-W viene dada por:
L NW = H h,i
Con H h ,i ( x k ) =
N −1 K h ( x k − xi )
N
−1
N
∑ K (x
h
k
− xi )
 H h,1 ( x1 ) L H h ,n ( x1 ) 


=
M
O
M

 H ( x ) L H ( x )
h ,n
N 
 h,1 N
(3.21)
ˆ NW = L NW w .
, con lo cual m
i =1
Para el caso de los polinomios locales, de (3.9) y (3.13), se tiene que la matriz de suavizado
puede escribirse de la forma
T
(
L PL = e1 XT ΩX
(
)
donde e1 = (1,0,K ,0 ) , X = diag X x1 , X x2 , K , X x N
T
(
−1
)
XT Ω
con X xi
(3.22)
defendida por (3.11) y
)
Ω = diag Ω x1 , Ω x 2 ,K, Ω xn , donde Ω xi está definida en (3.12).
Por último, los suavizados spline, a partir de (3.17) y (3.19), definen la siguiente matriz de
suavizado:
(
L S = B BT B + λΨ
)
−1
BT
(3.23)
43
Con B y Ψ definidas anteriormente.
En base a estas matrices, se presentan dos medidas globales de “la cantidad o monto de
suavizado” de un estimador obtenido por medio de un suavizado lineal (Loader, 2004:11).
A su vez ambas son definiciones de los ‘grados de libertad’ o ‘número efectivo de
parámetros’ en el caso no paramétrico. La primer definición de grados de libertad de un
estimador m̂ de m cuya matriz de suavizado es L , viene dada por la traza de la misma,
i.e.
N
v1 = tr (L ) = ∑ lev( xi )
(3.24)
i =1
Donde con lev se representa los ‘leverage’, i.e. los elementos de la diagonal principal de
la matriz de suavizado, y miden la sensibilidad de la curva ajustada m
ˆ ( xi ) en cada punto
particular de los datos observados. Otra definición de grados de libertad viene dada por
(
v2 = tr LT L
)
(3.25)
La gran ventaja de contar con los grados de libertad (3.24) y (3.25) es que proveen una
medida del suavizado que es comparable entre diferentes estimadores aplicados a la
misma base de datos (Loader, 1999: 28). Para los fines de este capítulo resulta crucial
contar con un marco general y un conjunto de medidas aplicadas en común tanto a las
regresiones N-W, a los polinomios locales, como así también a los suavizados splines.
3.2.5
Elección del Parámetro de Suavizado
Si bien se tiene una medida en común del suavizado para la clase de estimadores no
paramétricos lineales, los grados de libertad óptimos pueden diferir (y generalmente lo
hacen) entre estimadores. Sin embargo, pueden tomarse criterios o metodologías
automáticas de elección de suavizado que se apliquen a todos los suavizados lineales que
se estén comparando. Aquí se presentan algunos de los métodos que se utilizan en la
presente tesis, aunque, por la similitud de los resultados en unos casos o por el menor
error cuadrático medio muestral arrojado, resulta conveniente la elección de un solo
criterio, y de ahí comparar los estimadores con sus parámetros de suavizados óptimos.
44
En primer lugar se debe notar que todos los métodos de suavizado presentados dependen
de un parámetro que determina el grado de suavizado de la curva estimada. Para el
estimador N-W y los polinomios locales, éste viene dado por la ventana o bandwith h ,
mientras que en el spline, el parámetro de penalización λ controla el suavizado. Con
esto, el método de elección de dichos parámetros debe descansar en algún criterio que
mida la performance del ajuste contemplando el trade-off entre el sesgo y la varianza de
los estimadores. Existen varios enfoques para encarar el problema en base a diferentes
medidas alternativas. Siguiendo el criterio de minimización del error cuadrático medio,
una medida posible viene dada por el error cuadrático promedio (ECP):
N
ECP (h ) ≡ N −1 ∑ (mˆ (xi ) − m( xi ))
2
(3.26)
i =1
O también su esperanza, el Error Cuadrático Medio Promedio (ECMP), definido por
N
ECMP (h ) ≡ N −1 ∑ E (mˆ (xi ) − m( xi )) . Esta última es una versión discreta, de una medida
2
i =1
global de discrepancia, denominado Error Cuadrático Medio Integrado:
∞

ECMI (h ) = E ∫ [mˆ ( xi ) − m( xi )]2 
 −∞

(3.27)
Dado que el ECP, el ECMP, el ECMI o el ECI (equivalente al ECMI sin la esperanza)
producen asintóticamente el mismo suavizado (Marron & Härdle, 1986), en general se
trabaja con el más fácil de calcular, el ECP. Sin embargo, al no conocer m(.) , el ECP no
puede minimizarse de forma directa, sino a través de aproximaciones.
Uno de los primeros métodos para la elección automática del parámetro de suavizado en
estimaciones no paramétricas fue el de convalidación cruzada (CV)10, motivado en la
elección de un parámetro de suavizado que minimice el riesgo u error de predicción
EP ≡ E[ y + − yˆ + ] 2 , siendo ŷ + la predicción para una nueva observación x+ , i.e.
ŷ+ = m( x+ ) .
Puesto
que
EP = σ 2 + E[mˆ ( x ) − mˆ ( x )] 2 = σ 2 + ECM ,
entonces
la
minimización del EP promedio con respecto a h resulta equivalente de resolver para el
ECMP o el ECP. Para estimar el error de predicción, el método CV propone omitir cada
Entre los primeros trabajo que introducen el criterio CV se encuentran el de Allen (1974) para modelos
paramétricos. Clark (1975) lo aplica caso del estimador N-W, y Wahba y Wold (1975) para estimadores splines
10
45
observación ( xi , wi ) del conjunto de datos, y luego obtener su predicho de las restantes N1 observaciones. De esta forma se tiene un estimador del riesgo de predicción dada por el
error de validación cruzada11:
N
CV (h ) = N −1 ∑ (wi − mˆ −i ( xi ))
2
(3.28)
i =1
Este método es confiable en muestras grandes en el sentido de que si ĥ (o λ̂ ) minimizan
(3.28), luego ECMI( ĥ )/ECMI( hECMI ) converge a uno cuando n → ∞ , siendo hECMI
el
suavizado que minimiza (3.27) (Yatchew, 2003: 44). La aplicación de (3.28) implica un alto
costo computacional, y más aún para muestras grandes. Sin embargo, se puede demostrar
que para el caso de suavizados lineales se tiene que
mˆ − i ( xi ) =
mˆ ( xi ) − li ( xi )wi mˆ ( xi ) − [L]ii wi
≡
1 − li ( xi )
1 − [L]ii
Por lo que (3.28) puede escribirse de la forma
 w − mˆ ( xi ) 

CV (h ) = N ∑  i
i =1  1 − [L ] ii

−1
N
2
(3.28’)
Por lo tanto, el criterio CV se reduce a minimizar la función (3.28’) (Wasserman 2006: 70).
Otra alternativa a minimizar la función CV, es usar el criterio de convalidación cruzada
generalizada (GCV), donde simplemente se sustituye cada elemento de la diagonal [L]ii de
(3.27) por su promedio
1
N
∑ [L]
ii
= tr (L ) / N = v1 / N , obteniendo12
i
 w − mˆ ( xi ) 

GCV (h ) = N ∑  i
i =1  1 − v1 / N 
−1
N
2
(3.29)
Adicionalmente a los criterios CV y GCV, se considerará una metodología alternativa
basada en una versión del criterio de información de Akaike para la elección del
parámetro de suavizado, siguiendo la propuesta mejorada por Hurvich et al. (1998). La
función a minimizar viene dada por:
11
Esta función es comúnmente denominada leave-one-out cross-validation score
El criterio GCV puede ser visto como caso particular del enfoque más general de ‘funciones de penalización’
(Ver Härdle et al., 2004, Cap 4, Sec. 4.3.3)
12
46
N
2[v1 + 1]


AICc = ln  N −1 ∑ [ wi − mˆ ( xi )]2  + 1 +
N − v1 − 2
i =1


(3.30)
Mediante pruebas de simulación Hurvich et al.(1998) demuestra que el criterio de
selección de ventana por medio del AICc da mejores resultados en comparación a
métodos plug-in y al GCV. Por su parte Li y Racine (2004) muestran que para muestras
pequeñas se obtienen mejores resultados que los del CV, mientras que en muestras
grandes las diferencias son mínimas.
En la presente tesis se utilizan estas metodologías ((3.28)-(3.30)) por su facilidad
computacional, a diferencia de los métodos plug-in, y a su vez, muestran un buen
desempeño general en ejercicios de simulación y aplicado a datos reales. Si bien se
utilizan los tres criterios (CV, GCV, y AICc), es deseable elegir sólo uno de ellos en función
de alguna medida comparativa del desempeño de los mismos. Como se verá en la sección
de resultados, en general el criterio que se adopta es el de validación cruzada
generalizada, pero entre éste y los resultados de los otros dos, no hay grandes diferencias
en la mayor parte de los casos.
3.3
Inferencia en las Regresiones No Paramétricas
3.3.1
Intervalos de Confianza
Un intervalo de confianza (IC) para un suavizado lineal m̂( x ) , bajo el supuesto de que
E(mˆ (x )) = m( x ) , tiene la forma
mˆ ( x ) ± c. Var(mˆ ( x ))
(3.31)
Sin embargo los suavizados lineales son sesgados, por lo que (3.29) es en realidad un
intervalo de confianza para E(m̂( x )) . Para afrontar el problema del sesgo se puede
estimar el mismo por medio de métodos plug-in, sin embargo esto tampoco resuelve del
todo el problema (Loader, 1999: 168). En general se opta por estimar el intervalo de
confianza eligiendo una ventana menor a la óptima, de manera de apaciguar el sesgo
(Loader, 2004; Yatchew, 2003). Para construir un IC a partir de (3.30) es necesario estimar
47
la varianza del estimador. Para el caso homocedástico con Var (ε i ) = σ 2 , de la expresión
general (3.20) se tiene que
E (m̂( x )) = ∑ Li (x )m( xi )
(3.32)
i
Var (mˆ ( x )) = σ 2 ∑ l i ( x ) = σ 2 l ( x )
2
2
(3.33)
i
Para el caso heterocedástico con Var (ε i ) = σ 2 ( xi ) , (3.33) se transforma en
Var(mˆ ( x )) = ∑ σ 2 ( xi )li (x )
2
(3.34)
i
2
Suponiendo errores homocedásticos, la varianza σ puede ser estimada usando la suma
de los cuadrados de los residuos normalizada, considerando los grados de libertad v1 y
v2 , definidos en (3.24) y (3.25), respectivamente13, i.e.
σˆ 2 =
1
N − 2v1 + v 2
N
∑[w
i
− mˆ ( xi )]2
(3.35)
i =1
En el caso de trabajar con varianza no constante, se puede estimar σˆ 2 ( xi ) suponiendo
alguna estructura de varianzas. En ambos casos se construye (3.31) para alguna constante
c. Bajo la hipótesis de normalidad de los errores ε i , la constante c puede ser elegida de
una distribución t-Student con n − 2v1 + v 2
grados de libertad (Loader, 2004) o
directamente de la normal estándar (Wasserman, 2006). Ambos criterios descansan en las
propiedades asintóticas de los suavizados lineales.
En la presente investigación no se trabajará con las fórmulas asintóticas sino que los IC
serán computados por medio de la metodología bootstrap utilizando los residuos
empíricos como aproximación de la verdadera distribución de los errores. Se considera
que en estos casos de muestras finitas, teniendo en cuenta que los métodos no
paramétricos tienen una convergencia menor que
N , y son a su vez asintóticamente
sesgados, la metodología bootstrap puede ser más segura para una inferencia adecuada.
Específicamente se realizará un wild bootstrap a los fines de captar la heterocedasticidad
13
Tomando estos grados de libertad, se obtiene un estimador insesgado de la varianza (Loader, 1999: 37)
48
de los errores (Li y Wang, 1998: 150-151). Siguiendo a Yatchew (2003: 161), el
procedimiento para el estimador N-W y los polinomios locales es el siguiente:
*
1. Estimar m usando un parámetro de suavizado óptimo h elegido mediante
ˆ h* .
alguno de los criterios propuestos (CV, CGV o AICc). De aquí se obtiene m
2. Volver a estimar m aplicando un mayor suavizado que el óptimo. En particular se
elige h + = (1,2) h* . De aquí se obtiene m̂h + .
3. Volver a estimar m aplicando un menor suavizado que el óptimo. En particular se
ˆ h _ y se calculan los residuos εˆh _ .
elige h − = (0,8) h* . De aquí se obtiene m
4. Se obtiene una muestra usando el wild bootstrap: εˆboot = aεˆh _ con una probabilidad
p = (5 + 5 ) / 10 y
εˆboot = bεˆh
_
con probabilidad 1 − p = (5 − 5 ) / 10 , donde
a = (1 − 5 ) / 2 y b = (1 + 5 ) / 2 .
ˆ h+ + εˆboot , con wˆ h + = mˆ h + (x )
5. Construir los datos bootstrap de la forma wboot = w
N
6. Estimar m usando la muestra bootstrap {wboot,i , xi }i =1 utilizando el parámetro de
*
ˆ boot , h*
suavizado óptimo h . De aquí se obtiene m
7. Repetir B veces los pasos 4-6
8. Para calcular un IC del 95% para m , obtener los cuantiles de 0,025 y 0,075 de la
ˆ boot , h* .
distribución de m
Para el caso de los suavizados splines hay una modificación ligera en el algoritmo anterior
dado que en éste, el suavizado está representado por el parámetro de penalización o bien
por los grados de libertad. En esta investigación la búsqueda del suavizado óptimo para
los estimadores splines se realiza por medio de los grados de libertad. Lo único que
cambia serían los pasos 1-3, donde se busca en primer lugar los grados de libertad
*
correspondientes al óptimo v , y luego se ajusta con v + = (0,9)v* y v − = (1,1)v* en los
pasos 2 y 3, respectivamente.
49
3.3.2
Test de Especificación
Una vez obtenidos los estimadores no paramétricos, es deseable conocer si alguna
especificación paramétrica de las curvas de Engel es adecuada respecto a lo obtenido
mediante un suavizado no paramétrico. Específicamente, se puede construir un test para
saber si un ajuste lineal o cuadrático es adecuado, tomando como referencia un ajuste no
paramétrico. En términos generales el test de hipótesis puede plantearse de la forma
H 0 : m(ln G ) ∈ ℑθ vs. H1 : m(ln G ) ∉ ℑθ
(3.36)
Siendo ℑ θ un cierto espacio de funciones paramétricas. Si ℑ θ comprende la formas
funciones lineales, luego se tiene la clásica especificación lineal Working- Leser (Working,
1943; Leser, 1964), la que puede expresarse por
wi = θ0 + θ1 ln Gi + ε i
(3.37)
Una variante paramétrica de la misma, es su versión cuadrática (Banks et al., 1997) o
cúbica (Costa, 2001; Blow, 2003). Esto es
wi = θ 0 + θ1 ln Gi + θ 2 (ln Gi ) + ε~i
2
(3.38)
O bien
~
2
3
wi = θ 0 + θ1 ln Gi + θ 2 (ln Gi ) + θ3 (ln Gi ) + ε~i
(3.39)
En este trabajo se considerarán estas tres variantes paramétricas dada su relevancia en la
literatura económica.
Sea H la matriz de estimación del modelo paramétrico (hat matrix) y L la matriz de
suavizado correspondiente a un ajuste no paramétrico, se define el siguiente estadístico
T=
Lw − Hw / η
σˆ 2
(3.40)
Con η = tr{(L − H ) (L − H )} y σ̂ 2 definido en (3.35). Bajo la hipótesis nula, la
T
distribución del estadístico T puede aproximarse a una distribución F con v1 grados de
libertad en el numerador y N − 2v1 + v 2 en el denominador. Una forma equivalente de
mostrar el estadístico (3.40) es a través de la suma de cuadrados de los residuos
(Cleveland & Devlin, 1988). Sea SCRθ la suma de cuadrados de los residuos del modelo
50
paramétrico (sea (3.37), (3.38) o (3.39)) y SCRnp la suma de cuadrados de los residuos del
suavizado no paramétrico, luego podemos se tiene el siguiente estadístico
T=
( SCRθ − SCRL ) /(vθ − vnp )
SCRnp / vnp
(3.40’)
( SCRθ − SCRnp ) /(vθ − vnp )
=
σˆ 2
Con
vθ = tr (I − H )
vnp = tr{(I − L) T (I − L)} = N − 2v1 + v2 .
y
Considerando
la
aproximación a la distribución F, luego se rechaza H 0 a un nivel de α % si
T > Fvθ − v L , v L (1 − α )
Dado que este F-test es simplemente una aproximación, aún bajo el supuesto de
normalidad de los errores (Loader, 2004), es recomendable simular la distribución de T
bajo la hipótesis nula (Cai et al., 2000; Fan et al., 2001; Le & Ullah, 2003). Para ello se realiza
el siguiente wild- bootstrap para encontrar el p-valor bajo la hipótesis nula:
1. Del ajuste paramétrico correspondiente a la hipótesis nula se calcula SCRθ y del
suavizado no paramétrico usando el parámetro de suavizado óptimo se obtiene
SCRnp . Luego se computa el siguiente estadístico
T* =
( SCRθ − SCRnp )
(3.41)
SCRnp
Este estadístico más simple que el (3.40’) es propuesto en Ullah (1985). Dado que
con las réplicas del bootstrap los grados de libertad permanecen inalterados, luego
(3.40’) y (3.41) son equivalentes para el test derivado del bootstrap (Loader, 2004:
555).
~
εˆboot ,i = aεˆnp ,i con una
2. Se obtiene una muestra usando el wild bootstrap:
p = (5 + 5 ) / 10
probabilidad
1 − p = (5 − 5 ) / 10 ,
donde
y
~
εˆboot ,i = bεˆnp ,i
a = (1 − 5 ) / 2 ,
con
probabilidad
b = (1 + 5 ) / 2
y
N
ε~ˆnp ,i = εˆnp ,i − N −1 ∑ εˆnp ,i siendo εˆnp,i los residuos de la estimación no paramétrica.
i =1
51
ˆ θ + εˆboot , siendo wˆ θ = xT θˆ el
3. Construir los datos bootstrap de la forma wboot = w
predicho del modelo paramétrico.
N
4. Estimar m usando la muestra bootstrap {wboot,i , xi }i =1 en base a la especificación
paramétrica y también el modelo no paramétrico utilizando el mismo parámetro
de suavizado que en el paso 1. De aquí se obtiene las sumas de cuadrados de los
residuos SCRboot ,θ y SCRboot ,np , y se computa el estadístico
*
Tboot
=
( SCRboot ,θ − SCRboot , np )
SCRboot , np
*
.
5. Repetir B veces los pasos 2-4 obteniendo la distribución empírica de Tboot
6. Se computa el p-valor de la forma
*
* B
1+ #{Tboot
, k > T }k =1
1+ B
.
En resumen, el test de especificación (3.36), para cada una de las formas paramétricas
(3.37)-(3.39) se llevará a cabo usando dos pruebas, una paramétrica y la otra no
paramétrica. La primera en base al estadístico T utilizando la aproximación a la
distribución F. La segunda utilizando el estadístico T * en base a la distribución empírica
del mismo mediante réplicas bootstrap, y considerando la posible heterocedasticidad de
los errores. La gran ventaja de estas pruebas es el amplio alcance de las mismas respecto a
la utilización de cualquier suavizado lineal, a la vez que también pueden implementarse
para comparar dos regresiones no paramétricas de diferente naturaleza, dentro de la
familia de suavizados lineales. Existen otros test de especificación que, o bien son
independientes del tipo de suavizado no paramétrico (como ser el test de Bierens (1990)),
o están basados en algún método de suavizado especifico, como ser en regresiones kernel
(Härdle & Mamnen, 1993;
Li, 1994 ; Zhen, 1996). Por el hecho de que la presente
investigación se enfoca en el análisis comparativo de los diferentes suavizados lineales
propuestos, es necesario contar con pruebas de hipótesis que sean aplicables a cada uno
de ellos.
52
3.4
Performance Comparativa
Teniendo los diferentes suavizados lineales propuestos, es necesario contar con alguna
medida que indique el o los estimadores preferidos en base a algún criterio (estadístico),
para así poder focalizar el estudio de las relaciones de Engel bajo una perspectiva más
económica, una vez seguros de que el estimador elegido es el “mejor” entre una cierta
clase de estimadores alternativos.
En base a esto, se proponen una serie de medidas de performance estadística que serán
aplicados a los diferentes suavizados de curvas de Engel propuestos, una vez que cada
uno de ellos es estimado utilizando un suavizado óptimo (en base a algún criterio, sea
CV, GCV, AICc). En base al error de predicción (EP), un estimador naive del mismo es el
Error Cuadrático de Predicción Promedio en la muestra (ECPP), definido por
N
ECPP = N −1 ∑ [ wi − mˆ h ( xi )] 2
(3.42)
i =1
Esta medida es muy simple de computar y, con algunas variantes, es comúnmente
utilizada en la literatura empírica para comparar la performance estadística de diferentes
tipos de suavizados (Aydin, 2007) o del mismo suavizado con ventanas óptimas según
distintos criterios (Aydin y Omay, 2006). Para el caso de curvas de Engel, Blundell y
Duncan (1998) utilizan el ECPP para comprar diferentes suavizados basados en núcleos.
Esta medida, si bien puede ser útil para comparar diferentes estimadores no paramétricos,
resulta muy deficiente como medida de performance para la búsqueda del suavizado
óptimo, pues la minimización del (3.42) se logra cuando wi = m
ˆ h ( xi ) para cada i. De todas
formas, en el presente contexto se computa una vez que ya fue el elegido el suavizado
óptimo mediante CV,GCV o AICc. Una medida análoga a (3.42), que en ciertos casos
permite ver mejor la “diferencia de performance” entre dos estimadores, es el Error
Absoluto de Predicción Promedio (EAMP), el que puede escribirse de la forma
N
EAPP = N −1 ∑ wi − mˆ h ( xi )
(3.43)
i =1
Adicionalmente de estas dos medidas basadas en el error de predicción, se computará el
riesgo de estimación Cp introducido por Mallows (1973) en el contexto de regresiones
53
paramétricas. Considerando el error de estimación, dado por
∑[mˆ (x ) − m (x )]
2
i
i
, el
i
criterio Cp propone un estimador insesgado del mismo definido por
Cp =
1
σ2
∑ [w
i
− mˆ ( xi )]2 − N + 2v1
Con σ 2 = Var (ε i ) , la que es estimada utilizando (3.35).
(3.44)
Una forma alternativa de
expresarlo (Wasserman, 2004; Aydin y Omay, 2006; entre otros) es
Cp =
1N

2
2
∑ [ wi − mˆ ( xi )] + 2σˆ v1 
N  i =1

(3.44’)
Engel y Kneip (1996) utilizan esta versión del Cp para comparar distintas estimaciones de
curvas de Engel no paramétricas, algunas de ellas basadas en suavizados óptimos locales.
La expresión (3.44´) permite ver que el estadístico Cp también puede ser entendido como
una corrección del estimador ‘naive’ ECPP, penalizando por el número de “parámetros”,
lo que surge de tomar esperanza en (3.44’). Específicamente, es fácil probar que
E (EAPP ) = EP + σ 2 2tr (L )N −1 , lo que significa que el estadístico Cp resulta ser un
estimador más sensible del error de predicción. Como se verá en la aplicación empírica y
en un ejercicio de simulación, la corrección introducida por Cp puede ser crucial en la
comparación de performance de estimadores no paramétricos14.
De (3.44) se observa que Cp depende de σˆ 2 , y por (3.35), la estimación de ésta depende de
los grados de libertad de la estimación no paramétrica, por lo que se tiene una estimación
de σˆ 2 para cada ajuste no paramétrico. Sin embargo para el análisis comparativo, es
2
necesario implementar (3.44’) considerando el mismo estimador de σ para los diferentes
ajustes correspondientes a diferentes parámetros de suavizado. Cleveland y Devlin (1988)
2
recomiendan estimar σ usando el ajuste con el menor ventana (o mayores grados de
libertad) entre los que se están considerando.
El criterio Cp suele también utilizarse para la selección de la ventana óptima de los estimadores no
paramétricos. Sin embargo, respecto al criterio GCV, puede que las diferencias sean despreciables, dado que el
estadístico Cp puede expresarse como una aproximación del GCV (Wasserman, 2006: 70). Por lo tanto, en la
presente investigación la medida Cp se usará para comparar los diferentes suavizados con los grados de
libertad óptimos ya seleccionados.
14
54
Por último, se computará una medida de bondad de ajuste análoga al R-cuadrado de los
modelos paramétricos. En términos teóricos el R-cuadrado o coeficiente de determinación
está dado por R 2 = 1 − E(Var (w | x )) / Var (w ) = Var (E (w | x )) / Var (w ) . Doksum y Samarov
(1995) proponen el siguiente estimador
2
N

∑ ( wi − w )( wˆ i − m )

R 2 = N i =1
N
∑ ( wi − w ) 2 ∑ ( wˆ i − m ) 2
i =1
(3.45)
i =1
Siendo wi el valor observado de la variable respuesta, w su media muestral, ŵi el valor
predicho
para
la
observación
xi
y
m
su
media
muestral,
es
decir
m = N −1 ∑i wˆ i ≡ N −1 ∑i mˆ ( xi ) . Se puede probar que R 2 ∈ [0,1] . Cuando es igual a uno, el
estimador brinda un ajuste perfecto a los datos de la muestra. Cuando el R-cuadrado se
aproxima a cero, entonces el estimador no ofrece un ajuste superior a aquél dado por la
media simple no condicionada de las observaciones. Este R-cuadrado para modelos no
paramétricos permite la comparabilidad entre dos estimadores no paramétricos
cualesquiera, y más aún es aplicable a cualquier modelo, sea lineal o no-lineal, mostrando
una medida de bondad de ajuste la cual no es por sí sola un criterio de selección de
modelos, sino una medida adicional para reportar (Hayfield y Racine 2008: 10).
Al igual que ocurre en el caso usual de modelos lineales, el R-cuadrado es creciente con
los grados de libertad (el equivalente a la cantidad de parámetros) del estimador. Por lo
tanto, para una mejor interpretación, conviene comparar los R-cuadrado de los
estimadores no paramétricos con grados de libertad similares, adicionalmente de hacerlo
con los ajustes derivados de aplicar los suavizados “óptimos” correspondiente a cada
caso. Huang y Chen (2008) proponen un R-cuadrado alternativo al (3.45), basado en la
estructura de un ANOVA no paramétrico, puesto que el de (3.45), basado en la noción de
correlación, no la posee. La propuesta de Huang y Chen es sumamente interesante dado
que brinda herramientas para un ANOVA no paramétrico, con un R-cuadrado resultante
del mismo, y más aún, la posibilidad de corregirlo por los grados de libertad (análogo al
R-cuadrado ajustado de los modelos lineales). Sin embargo, teniendo como objetivo la
simple obtención de una medida adicional de performance del estimador, el R-cuadrado
55
basado en el ANOVA es más intensivo computacionalmente, a la vez que es necesario redefinir una nueva matriz de suavizado a partir de la matriz L, y, a pesar de ello, los
resultados numéricos muestran pocas diferencias con el R-cuadrado de (3.45). Por lo
tanto, se trabajará con este último.
En síntesis, al evaluar el ‘desempeño estadístico’ de los estimadores no paramétricos se
analizarán los valores arrojados por estas cuatro medidas, a saber: el ECMP, EAMP, Cp y
el R 2 . Adicionalmente se incluyen los valores obtenidos de convalidación cruzada y del
estadístico AICc. Si bien cada uno de ellos tiene sus debilidades para conformar un criterio
estricto de selección, la combinación de los resultados brindados por los mismos, dan un
perfil del mejor comportamiento en lo que hace al poder predictivo y de ajuste del modelo
estimado.
3.5
Derivadas y Elasticidades No Paramétricas
En general, en los estudios económicos de consumo y demanda, el fin último es conocer
los comportamientos de los agentes económicos sintetizados en las elasticidades. En
particular, para el caso de las relaciones o curvas de Engel el interés recae en las
elasticidades gasto o ingreso, i.e. cuál es la variación porcentual en la cantidad
demandada ante un cambio porcentual del poder adquisitivo. Si bien cada familia u hogar
tiene su propia elasticidad-gasto, en general interesa tener una medida que sintetice, por
lo que las elasticidades suelen evaluarse en el ‘hogar promedio’ o promediando las
elasticidades de los hogares. Por definición, la elasticidad-gasto del bien j para el hogar i
en un nivel de gasto total Gi = yi , está definida por:
eG =
d ln qij
d ln Gi
=
dqij
yi
dGi qij ( y i )
(3.46)
Donde qij ( yi ) representa la cantidad demanda del hogar i al nivel de gasto yi . De (3.1) se
tiene que, bajo el supuesto de que el gasto total es exógeno
dwij
d ln Gi
= mj'
(3.47)
56
donde m j ' representa la derivada primera de m j respecto a ln Gi . Por definición, la
variable respuesta se puede descomponer de la forma wij = pij qij / Gi . Por lo tanto (3.47)
puede escribirse de la siguiente manera
d [ pij qij / Gi ]
d ln Gi
= mj'
(3.47’)
Puesto que sobre una determinada curva de Engel, los precios se suponen constantes,
luego el primer miembro de (3.47’) puede desarrollarse de la forma
d [ p ij q ij / Gi ]
d ln Gi
=
p ij [Gi dq ij − q ij dGi ] / G 2
dGi / Gi
= p ij
=
dq ij
dGi
−
p ij q ij dGi
Gi dGi
p ij q ij dq ij / q ij
Gi
= wij
dGi / Gi
dqij / qij
dGi / Gi
−
p ij q ij
Gi
− wij
(3.48)
Luego de (3.47’), (3.48) y (3.46) se obtiene la expresión de la elasticidad-gasto
correspondiente a una especificación generalizada de la curva de Engel Working-Leser.
Específicamente, la elasticidad-gasto del bien j para el hogar i cuando su nivel de gasto es
yi (o equivalentemente, su nivel del logaritmo del gasto es xi = ln yi ) viene dada por
eijG = 1+
m j ' ( xi )
wij
(3.49)
De (3.49) se observa que para el cálculo de las elasticidades es necesario contar con la
derivada primera de m. Específicamente, dada una estimación no paramétrica m̂( x ) se
busca obtener de la misma, su primera derivada m̂' . La forma que la misma adopta, y la
manera de computarla depende del estimador específico que se está considerando. Para el
caso de estimador N-W, de (3.3) se tiene que su derivada analítica viene dada por
57
N
 x − xi 
( Nh) −1 ∑ wi , j K ' 

h 

i =1
mˆ ' h , ( x )
N
 x − xi 
( Nh) −1 ∑ K ' 

 h 
i =1
(3.50)
donde K ' ( z ) ≡ dK ( z ) / dz . Ullah (1988) y Rilstone y Ullah (1989), proponen estimar
numéricamente esta derivada, dado que es más sencillo computacionalmente, y la misma
puede obtenerse directamente a partir de la estimación de m . A su vez,
es
aproximadamente igual a la solución analítica y tienen las mismas propiedades asintóticas
(Pagan y Ullah, 1999: 165). Específicamente, estos autores proponen la derivada numérica
basada en la diferencia central usando dos puntos, esto es
mˆ ' ( x ) = (2h) −1 [mˆ ( x + h ) − mˆ ( x − h )]
(3.51)
En el presente trabajo se utilizará (3.51) para la estimación de la derivada del estimador NW. Para el caso de los polinomios locales lineales y cuadráticos, la estimación de la
derivada primera es mucho más directa. Dado que los ajustes polinómicos están
motivados en la expansión de Taylor (Härdle et al., 2004), i.e.
m(t ) ≈ m( x ) + m' ( x )(t − x) + K + m ( p ) ( x )(t − x) p (1 / p !)
Luego por (3.8) se tiene que el estimador de la derivada primera de m , vendrá dado por
mˆ ' ( x ) = aˆ1 ( x )
(3.52)
El que es obtenido en el mismo proceso de minimización (3.8) para estimar m . Por lo
tanto, ésta es una ventaja adicional de los polinomios locales lineales y cuadráticos sobre
el constante o N-W 15. El suavizado spline goza de la misma propiedad de obtención de la
derivada del estimador directamente de la estimación de m . El razonamiento es similar,
al estar basado en polinomios cúbicos locales16.
Por lo tanto, para la obtención de las elasticidades-gasto, en (3.49) se utilizarán las
estimaciones de las derivadas correspondiente a cada método, usando la aproximación
En términos más exactos, (3.5) es una aproximación a la derivada de la curva ajustada. El valor de (3.52) es
denominado ‘estimador de la pendiente local’ (local slope estímate). El cómputo exacto requiere la
incorporación de los residudos del polinomio local, lo cual implica un trabajo adicional, y la ganancia de
obtener el estimador exacto es, en general, despreciable (Loader, 1999:102)
16 Para una presentación más extensa y detallada sobre las derivadas a partir de las regresiones spline, y de
sus propiedades ver Zhou y Wolfe (2000)
15
58
numérica (3.51), y las obtenidas directamente a partir de las estimaciones polinómicas
locales lineales y cuadráticas, y del suavizados spline. Con esto se obtienen curvas de las
elasticidades-gasto como funciones del gasto total. Para la obtención de una medida
resumen existen, al menos, dos posibilidades. Una es computar la elasticidad-gasto
promedio, y la otra, evaluarla en el nivel medio del gasto. Para el primer caso, se debe
obtener la derivada promedio. Considerando que
E (m' ( x )) = ∫ m' ( x ) p (x )dx
Siendo p(x ) la densidad del logaritmo del gasto total (evaluada en x ), luego un
estimador del valor esperado de la derivada, viene dado por la siguiente derivada
promedio (DP)
DP = ∫ mˆ ' (x ) pˆ ( x )dx
(3.53)
La misma se obtiene estimando la densidad por algún método no paramétrico (en el
presente caso se utiliza la estimación kernel de densidad) y aplicando algún método de
integración numérica. Luego sustituyendo (3.53) en (3.49) y la media de los predichos m̂ ,
se obtiene la elasticidad promedio.
Para el cómputo de elasticidad evaluada en el gasto medio simplemente se utilizan los
predichos de la regresión no paramétrica y de su derivada, evaluados en la media del
logaritmo del gasto total.
Adicionalmente, se estiman los desvíos estándar de ambas elasticidades (como también
de la derivada promedio) por medio del método wild-bootstrap.
Ahora bien, a partir de las estimaciones de las elasticidades, ¿en qué consiste la evaluación
económica de los estimadores? Además de poder captar cuando un bien es ‘inferior’,
‘necesario’ o ‘de lujo’, una propiedad deseable de las elasticidades-gasto, principalmente
para el caso de alimentos, es que éstas sean decrecientes a medida que se incrementa el
poder adquisitivo. Esto significa que el consumo de un bien alcanza niveles de saturación,
de modo que incrementos adicionales del ingreso llevan a los hogares consumidores a
destinar su presupuesto a otro tipo de necesidad, dado que las del alimento en cuestión ya
están prácticamente satisfechas para un nivel dado de ingresos (Brown y Deaton, 1972). Si
59
esto no ocurre, una explicación plausible tiene que ver con un cambio (aumento) de la
calidad del alimento consumido (Deaton, 1988).
3.6
Efecto de las Características Demográficas de los Hogares
La incorporación de la heterogeneidad de los hogares en las estimaciones de CE no sólo
brinda la posibilidad de estudiar el efecto de los cambios en las características de los
hogares sobre el comportamiento de consumo, sino que adicionalmente, el análisis no
paramétrico de las mismas permite conocer el comportamiento de tales efectos para
diferente niveles del poder adquisitivo de los hogares. Con esto también se puede
verificar la existencia de efectos cruzados de forma tal que los mismos puedan ser
incorporados en CE paramétricas.
Adicionalmente, el análisis no paramétrico de CE subdividiendo las muestras según los
tipos de hogares se corresponde con el espíritu original de la obra de Engel, donde la
investigación de su ‘ley’ se refiere a la participación del gasto en alimentos en una
población determinada por alguna característica en particular, sea su ubicación
geográfica, nacionalidad, tipo de familia, situación laboral, etc. El trabajo original de
Engel, contrariamente a la derivación micro-económica de las CE, no supone que todos los
hogares de la población enfrentan los mismos precios, ni que los hogares son idénticos en
ciertas características del hogar (Chakrabarty y Hildenbrand; 2011: 290)
En la presente tesis, luego de la evaluación económica y estadística de las especificaciones
no paramétricas de CE, y por ende, seleccionando la o las mejores metodologías de
estimación, se buscará conocer cómo son afectadas las mismas para hogares con diferente
estructura demográfica. Específicamente se tomarán las variables de los hogares que
caracterizan su composición y tipología, seleccionado el género y edad del jefe de hogar;
la cantidad de miembros por grupo etario (menores de 14 y mayores de 65 años); y los
tipos de hogares (unipersonal, nuclear sin hijos, nuclear con hijos y extendidos), en base a
su importancia revelada en diferentes estudios empíricos de consumo y demanda de
alimentos para Argentina (p.ej. Rossini y Depetris Guiguet., 2008, Rossini et al., 2008;
García Arancibia et al., 2009a ; 2009b ; García Arancibia, 2011, entre otros).
60
Sea Z i f un vector que representa las características del hogar i, para una determinada
característica Z i f = z f , la expresión (3.1) de la curva de Engel del bien j puede escribirse
de la forma
(
)
wijf = m j ln Gi | Z i f = z f + ε ijf
,
(3.54)
O bien
(
m jf ( x ) = E wijf | ln Gi = x, Z i f = z f
)
(3.55)
Con estas especificaciones desagregadas por características de los hogares se busca
conocer cómo afectan las mismas al comportamiento de la participación del gasto en el
bien j respecto al poder adquisitivo. Tal efecto ha sido denominado como “Efecto
Sustitución de las Características” (ESC)17. Para dos características a y b, el ESC viene
dado por
{
}
ESC a ,b ( x ) = mˆ a (x ) − mˆ b (x ) ,
(3.56)
a
b
donde m
ˆ ( x ) y mˆ ( x ) son las CE no paramétricas estimadas para los hogares con las
características a y b, respectivamente. Esta ecuación estima los cambios en el consumo del
bien j de pasar de ser del tipo a a b, para un determinado nivel de gasto fijo en x, y tal
cambio será de la proporción y signo del ESC a,b ( x ) . Los resultados que se hallan del
estudio del ESC, además de contribuir para la interpretación económica del
comportamiento del consumidor, tienen implicancias muy relevantes para las
especificaciones econométricas de curvas de Engel, principalmente paramétricas. La
simple incorporación aditiva de variables dummies para caracterizar a los hogares, sin
incluir algunos efectos interacción con el gasto o ingreso, puede generar problemas de
mala especificación (Fousekis y Lazaridis, 2001).
La expresión (3.56) define una curva para los diferentes niveles del logaritmo del gasto
total. A los efectos de tener una medida resumen del cambio de la CE ante cambios en las
17
Characteristics Substitution Effects (Delgado y Miles, 1997)
61
características, se estima el efecto sustitución de las características promedio (ESCP) para
cada par de características (a,b). El mismo puede escribirse como
ESCP (a, b ) = ∫ ESC a ,b ( x ) p ( x )dx
= ∫ [m a ( x ) − m b ( x )] p ( x )dx
[(
(3.57)
) (
)]
= ∫ E wia | ln Gi = x, Z i f = a − E wib | ln Gi = x, Z i f = b p ( x )dx
Para la estimación de (3.57) se construye una grilla de valores de x, para la cual se estima
la densidad de p̂(x ) . Utilizando la misma grilla, se predicen los valores del ESC, usando
f
las regresiones no paramétricas m (x ) , estimadas con todos los datos de los hogares que
tienen las característica f. Por lo tanto, la densidad p̂(x ) es la misma para los pares de CE
que se están comparando, de forma tal que para cada punto el gasto total (como proxy del
poder adquisitivo), es el mismo18. Para expresar el ESCP en términos proporcionales
(porcentuales) se computa
 ESC a,b ( x )

ESCP (a, b )∆ % = 100 ×  ∫
p (x )dx 
b
m (x )


(3.58)
En base a estas medidas se estudia la importancia que tienen las características
demográficas en el consumo de alimentos, expresado por medio de las CE.
Si el efecto de las características es constante, se refleja en una ESC aproximadamente
plana. Esto sugiere que para medir el cambio del ESC ante diferentes niveles del poder
adquisitivo de los hogares, se puede mirar su derivada promedio ( d ESC ). En el apartado
anterior, se presentó la forma de computar la derivada promedio de las CE. Puesto que la
función ESC es la diferencia entre dos estimaciones de la CE, su derivada promedio viene
dada por
d ESC (a, b ) ≡ ∫
dESC a ,b ( x )
pˆ ( x )dx = ∫ mˆ ' a ( x ) pˆ ( x )dx − ∫ mˆ 'b ( x ) pˆ ( x )dx
dx
(3.59)
De los resultados de (3.59), junto con especificaciones paramétricas, se estudiará la
importancia de las interacciones entre las características del hogar y el nivel de ingreso
18
Una metodología similar utilizan Deaton y Paxson (1998) para la comparación de hogares con diferente
tamaño.
62
(medido a través del gasto total). Para la inferencia se computan errores estándar
bootstrap para la d ESC .
3.7
Especificaciones Semiparamétricas
Por ahora se vienen presentando aplicaciones metodológicas para CE no paramétricas en
una variable (i.e. como funciones del logaritmo del gasto total). La evidencia empírica
(con soporte teórico) muestra que la situación socioeconómica del hogar y sus
características demográficas, más allá del gasto/ingreso total, resultan cruciales en la
determinación de los patrones de consumo. Por ello resulta necesario incluirlos en el
análisis de CE y funciones de demanda. En la sección 3.6 se presenta una metodología
para incorporar las características demográficas de los hogares en el análisis, y seguir
utilizando las regresiones no paramétricas en una variable. De ello se obtienen varias CE
(una para cada sub-muestra que se esté analizando). Sin embargo el análisis puede ser
simplificado si se incorporan todas las características junto con el efecto del gasto total, en
una sola especificación. Debido a la ‘maldición de la dimensionalidad’19, inevitable en
modelos totalmente no paramétricos, se han dejado de lado las pretensiones de incorporar
todas las variables en forma no paramétrica. Por ello, los estudios micro-econométricos de
consumo y demanda, se han enfocado en especificaciones semiparamétricas. En
particular, el modelo semiparamétrico más utilizado es el denominado Modelo
Parcialmente Lineal (MPL). Para el caso de curvas de Engel y funciones de demanda, en
general se opta por dejar que la relación con el gasto total sea flexible, mientras que para
las otras características se consideran efectos lineales20 . Es decir que el gasto total se sigue
incorporando de manera no paramétrica, mientras que las otras características
socioeconómicas y demográficas de los hogares se plantean de forma paramétrica.
La utilización de los MPL no sólo ha sido justificada debido a la maldición de la
dimensionalidad, sino que por otra parte, las variables (en su mayoría categóricas) que
caracterizan a los hogares, en general muestran un comportamiento aproximadamente
En la mayoría de los libros de textos aparece el tópico de la ‘maldición de la dimensionalidad’ (Curse of
Dimensionality). Yatchew (2003:17) presenta un ejemplo sencillo y muy ilustrador.
20 Para un estudio donde se propone la flexibilidad de los efectos de las características demográfica de los
hogares en vez del gasto total, ver Lissiotou et al.(2008)
19
63
lineal sobre la participación del gasto (Sulgham y Zapata, 2006; Barrientos Marín, 2009;
Barrientos Marín et al., 2011; entre otros). Por lo tanto, siguiendo este enfoque
generalizado en los últimos trabajos empíricos, se trabaja con la siguiente especificación
de la curva de Engel para el alimento j
wij = γ ´jT z i + m j (ln Gi ) + ξ ij
(3.60)
Siendo z i el vector de co-variables que caracterizan la estructura socioeconómica y
(
2
)
demográfica del hogar i, con ξij ~ iid 0,σ i . En (3.60) se excluye el intercepto (i.e. que en
z i se excluye el 1), por cuestiones de identificabilidad, dado la flexibilidad de m j (Li y
Racine, 2006: 222-223).
Además de las características demográficas de los hogares (cantidad de adultos en el
hogar, cantidad de menores de 14 años y de mayores de 65, género y edad del jefe/a, y los
tipos de hogar) se incluyen dos variables que caracterizan el nivel socioeconómico del jefe
de hogar: la categoría ocupacional (no ocupado, asalariado, patrón o cuenta propista) y el
nivel de instrucción (si realizo o no estudios superiores)21.
3.7.1 Estimación
Para la estimación de (3.60) se utilizará el método de Doble Residuos, propuesto de forma
simultánea por Robinson (1988) y Speckman (1988). Con este método es posible obtener
estimadores
N - consistenes para γˆ´j , y m̂ j con la tasa usual de convergencia no
paramétrica de modelos univariados, siempre que los parámetros de suavizados de las
estimaciones no paramétricas involucradas sean de orden N −1 / 5 . Tomando la esperanza
condicionada en (3.60) se obtiene
(
)
E wij | ln G = γ ´jT E(z i | ln G ) + m j (ln G )
(
(3.61)
)
Suponiendo que E ξ ij | x = 0 . Luego de (3.60) y (3.61) se tiene que
21
La descripción más detallada de tales variables se realiza en el Capitulo 4.
64
(
)
wij − E wij | ln Gi = γ Tj (z i − E(z i | ln Gi )) + ξ ij
(
De (3.62) se observa que si conocen E wij | ln Gi
)
(3.62)
y E (z i | ln Gi ) , luego se obtiene un
estimador consistente y asintóticamente normal para el vector de p parámetros γ j ,
aplicando simplemente mínimos cuadrados.
Puesto que ambas esperanzas son
desconocidas, el método de Robinson propone estimarlas de forma no paramétrica,
demostrando que con ello no se ve afectada la distribución asintótica del γˆ j estimado por
(
)
hˆ j (x ) un estimador no paramétrico de h j ( x ) = E wij | ln Gi = x , y
MCO22. Sea
gˆ j ( x ) = (gˆ j1 (x ), K , gˆ jp (x )) un vector, de orden p × 1 , de estimadores no paramétricos de
g j ( x ) = (g j1 ( x ), K , g jp (x )) ≡ (E ( z1 | ln Gi = x ), , K , E (z p | ln G i = x )) , luego (3.62) puede
escribirse de la forma
w j − h j ( x ) ≅ (Z − gˆ j ( x ))γ j + ξ j
(3.63)
Siendo w j y hˆ j (x ) vectores de orden N × 1 , Z − gˆ j ( x ) y Z − gˆ j ( x ) , matrices de orden
N × p y γ j un vector p × 1 . Luego, de (3.63), se obtiene de forma análoga al estimador
MCO, el estimador de Doble Residuos:
[
] (Z − gˆ (x)) (w
γˆ j = (Z − gˆ j (x ))T (Z − gˆ j (x ))
−1
T
j
j
− hˆ j ( x ))
(3.64)
Para muestras grandes se cumple que23
(
)
D
(
N γˆ j − γ j → N 0, σ ξ2 ∑ z| x
Con
∑
z| x
[
−1
)
(3.65)
]
= E (z − E (z | x ))(z − E (z | x )) , siendo z un vector p × 1 cuyas componentes son
T
las variables aleatorias que representan las características socioeconómicas y demográficas
Si bien en el trabajo original de Robinson se propone el estimador N-W, las propiedades se mantienen para
otros estimadores no paramétricos, lo relevante es su tasa de convergencia. Newey (1994) generaliza las
condiciones para validar los resultados del estimador de Robinson. Para los suavizados lineales presentados
se cumplen tales condiciones, por lo que puede aplicarse este procedimiento sin afectar sus propiedades.
23 En esta sección se sigue a Yatchew (2003: 49). Para un análisis más formal ver Li y Racine (2006).
22
65
2
de los hogares. La varianza de los residuos σ ξ puede estimarse consistentemente
mediante
[
s 2 = N −1 w j − hˆ j ( x ) − (Z − gˆ j ( x ))γˆ j
] [w
T
j
− hˆ j ( x ) − (Z − gˆ j ( x ))γˆ j
]
Luego, un estimador consistente de la matriz de varianza y covarianzas de γˆ j , σ ξ2
(3.66)
∑
−1
z| x
viene dado por
[
]
s 2 (Z − gˆ j ( x )) (Z − gˆ j ( x ))
T
−1
(3.67)
Generalmente en los micro-datos de corte transversal, la presencia de heterocedasticidad
es más la regla que la excepción: Por lo tanto, a los efectos de corregir los desvíos
estándares del estimador paramétrico para una correcta inferencia, la matriz (3.67) puede
sustituirse por una versión consistente –heterocedástica similar a la propuesta de White
(1980) para los estimadores MCO (también son denominados desvíos estándar robustos
heterocedásticos). Suponiendo que los residuos tienen matriz de covarianza igual a Ω ,
luego la matriz de varianzas y covarianza del estimador (3.64) es aproximadamente igual
a
[
] [N (Z − gˆ (x )) Ω(Z − gˆ (x ))]
var(γˆ j ) ≅ N −1 N −1 (Z − gˆ j ( x )) (Z − gˆ j ( x ))
T
−1
−1
T
j
[ (Z − gˆ (x )) (Z − gˆ (x ))]
× N
−1
T
−1
j
j
(3.68)
j
T
Para el caso heterocedástico se toma Ω̂ = ξ j ξ j , i.e la suma de los residuos al cuadrado.
En los resultados de los MPL presentados en esta tesis, se reportan los desvíos estándar
heterocedásticos obtenidos a partir de (3.68).
Por último, por (3.61), la función m j se estima a partir de
(
)
E w j − Zγˆ j | ln G = m j (ln G )
(3.69)
El estimador m̂ j puede obtenerse aplicando cualquier tipo de suavizado lineal de los
visto anteriormente (u otro estimador no paramétrico con una tasa de convergencia
similar). En la presente tesis, en base a los resultados de la evaluación de las CE
puramente no paramétricas, se elegirán los dos métodos que arrojaron una mejor
performance, a fin de aplicarlos al estimador de Doble-Residuos. Adicionalmente, entre este
66
par de estimadores se computarán las medidas de performance sobre la parte no
paramétrica (3.69) con el fin de terminar seleccionando un solo estimador para las
especificaciones semiparamétricas de CE.
Puesto que en (3.60) el gasto total es separable de las demás variables, luego el cómputo
de elasticidades-gasto es igual al presentado en la sección 7.5, utilizando el estimador de
la derivada de m resultante de la regresión (3.69).
3.7.2 Endogeneidad del Gasto Total
Como se mencionó en el capítulo anterior, existen motivos tanto metodológicos como
teóricos por lo cual se toma al gasto total como medida del poder adquisitivo o proxy del
ingreso nominal de los hogares, en vez de tomar directamente el ingreso percibido en los
mismos. Sin embargo, es posible pensar que los hogares determinan de manera conjunta
cuánto gastar y qué participación del gasto asignar a los alimentos. Es decir, que puede
existir simultaneidad en las decisiones de gasto, sea total o en un bien específico. Sin
embargo, uno de los supuestos esenciales en el tratamiento de las especificaciones (3.1) y
(3-60) es que el gasto es exógeno en el sentido de que E(ξ | ln G ) = 0 . Por ello, en la
presente sección se presenta una forma de considerar la posible endogeneidad por
simultaneidad del gasto total, de forma que la misma pueda ser testeada (rechazada o no),
y a la vez, obtener una versión corregida de la CE. Dado el carácter anidado o progresivo
de la tesis, este problema de endogeneidad se tratará en el caso del MPL, y constituye el
último punto a considerar en la misma.
Asumiendo que ahora el MPL correspondiente a la CE, expresado de forma matricialvectorial, viene dado por24
w = Zγ + m(ln G ) + ξ ,
E(ξ | ln G ) ≠ 0
(3.70)
Suponiendo que existe, al menos, una variable instrumental U para ln(G ) tal que
ln G = αU + υ , E(υ | U ) = 0 , E(ξ | U ) = 0
24
(3.71)
Se omite el subíndice j correspondiente al bien sobre el que se estudia la CE.
67
Suponiendo adicionalmente que E(ξ | lnG,U ) = ρυ , lo cual es un supuesto bastante
fuerte25; luego los residuos de la ecuación original pueden escribirse como
ξ = ρυ + ν
(3.72)
Luego de (3.71) y (3.72), (3.70) puede re-escribirse de la forma
w = Zγ + m(ln G ) + ρυ + ν ,
E(v | ln G, Z,υ ) = 0
(3.73)
De esta manera se tiene un MPL ampliado con una variable adicional υ , la que puede ser
estimada a partir de los residuos de (3.71), i.e. υˆ = ln G − αˆU . Por lo tanto, en una primera
etapa se estima (3.71), en una segunda etapa se obtiene (γˆ, ρˆ ) aplicando el método de
Robinson, estimando finalmente m aplicando un suavizado lineal sobre
E(w − Zγˆ − ρˆυˆ | ln G ) = m(ln G )
(3.74)
Para testear la endogeneidad del gasto total, simplemente se observa si ρ̂
es
significativamente diferente de cero. En caso afirmativo, se prueba estadísticamente que
ln(G ) es endógeno, bajo el supuesto de que U constituye un instrumento válido
Ahora bien, queda seleccionar qué variable instrumental utilizar para la corrección de
endogeneidad. Naturalmente, la mayoría de los trabajos de CE o sistemas de demanda
que corrigen la endogeneidad, utilizan el ingreso total o disponible (en general, con la
transformación logarítmica) y algunas otras variables que caracterizan el nivel
socioeconómico del hogar (Barrientos Marin, 2009; Blundell et al., 2007; Sulgaham y
Zapata, 2006; entre otros). En la presente tesis se terminan seleccionando dos variables
como instrumentos: el logaritmo del gasto total y el régimen de tenencia del hogar
(propietario o no, sea inquilino o ocupante).
En este caso, para el cómputo de las elasticidades-gasto, debe tenerse en cuenta que ahora
∂E(wi | ln G, Z,υ ) dm(ln G )
=
+ρ
∂ ln G
d ln G
(3.75)
Luego, aplicando esta expresión de la derivada en vez de (3.47), se puede computar la
elasticidad gasto corregida por endogeneidad. Adicionalmente, al utilizar el ingreso como
instrumento, se puede computar la elasticidad-ingreso ( I ), basta ver que
25
Para un enfoque más general ver Sperlich (2007)
68
∂E(wi | ln G, Z,υ ) dm(ln G ) ∂ ln I
=
− α I ρ = α I [m' (ln G ) − ρ ]
∂ ln I
d ln G ∂ ln G
(3.76)
Luego aplicando los procedimientos de la sección 3.5 puede computarse la elasticidadingreso.
Las correcciones de la elasticidad-gasto y el cómputo de la elasticidad-ingreso se aplican
en el último capítulo de resultados para las especificaciones semiparamétricas de las CE,
sin que ello signifique que las mismas no son aplicables a CE puramente no paramétricas,
que son un caso especial de la especificación más general del MPL.
69
Capítulo 4
Datos, Variables y Procedimientos
4.1
Introducción
Para completar la primera parte del marco teórico y metodológico, en el presente capítulo
se presenta una descripción de los datos y variables utilizadas en el análisis aplicado de la
tesis. Adicionalmente, se detallan los procedimientos llevados a cabo para aplicar las
metodologías presentadas en el capítulo anterior, y su implementación computacional con
el software correspondiente.
4.2
Datos
Los datos utilizados corresponden a los base de la Encuesta Nacional de Gastos de
Hogares del período 1996-97 elaborada por el Instituto Nacional de Estadísticas y Censos
de Argentina (INDEC)26. El tamaño total de la muestra es de 27260 hogares
correspondientes al total de las 6 regiones geográficas en que está dividido el país: Región
Metropolitana (Capital Federal y Buenos Aires), Región Pampeana (Córdoba, Buenos
Aires, Entre Ríos, La Pampa y Santa Fe), Noroeste (Salta, Jujuy, Tucumán, Santiago del
Estero, Catamarca y La Rioja), Noreste (Misiones, Corrientes, Chaco y Formosa), Cuyo
(San Juan, Mendoza y San Luís) y Región Patagónica (Neuquén, Río Negro, Chubut,
Santa Cruz y Tierra del Fuego).
En el período 2005-2006 este organismo realizó otra Encuesta de Gasto de Hogares, la que aún no fue puesta
a disposición de los investigadores. A pesar de que los resultados del presente trabajo quedan
desactualizados, su contenido tiene un perfil más metodológico, aunque claramente se hubiera deseado
trabajar con una base más actualizada.
26
70
En esta tesis se considera solamente la Región Pampeana, por su importancia relativa en
el país, más allá de la región metropolitana del Gran Buenos Aires. Para la Región
Pampeana, el tamaño total de la muestra es de 7743 hogares. De un análisis exhaustivo de
la misma se detectó la existencia de hogares que no reportan ciertas características, otros
que mostraban algunas inconsistencias en el valor de ciertas variables, como ser un gasto
total o un ingreso negativo, o participaciones del gasto en un bien (sobre el gasto total)
mayores a 1. En general tales hogares coincidían en encontrarse en algún extremo (inferior
o superior) del gasto total. Al eliminarse tales observaciones, la muestra depurada es de
7592 hogares válidos. En esta depuración también se tuvo en cuenta la eliminación de
nueve hogares que reportaban gastos nulos en la partida de gasto del total de Alimentos y
Bebidas. Por lo tanto, para la estimación de CE para el total de alimentos se utilizó esta
muestra de 7592 hogares.
Como se mencionó anteriormente, además de tomar el rubro de alimentos y bebidas en
general, se consideran los siguientes grupos de alimentos: (A1); Productos de panadería,
harinas, arroz, cereales y pastas; (A2) Carnes vacuna, porcina, ovina, aves, pescados y
mariscos; (A3) Leche y productos lácteos; y
(A4) Verduras, legumbres y frutas. La
selección de los mismos se realiza por su relevancia en el gasto total de alimentos y
bebidas. Estos cuatro grupos de alimentos conforman, en promedio, cerca del 75% del
gasto total en alimentos. En la tabla 4.1 se muestran los valores promedio de la
participación de cada Aj en el presupuesto alimenticio de los hogares. Las carnes, y
principalmente la vacuna, es la que representa el mayor porcentaje en el gasto en
alimentos, seguido de los productos basados en harinas, arroz y cereales. En la misma
tabla, se reportan el tamaño de la muestra considerado en cada caso. Los mismos surgen
de sacar de los 7500 hogares, aquellos hogares con gastos nulos en cada partida
correspondiente, a los fines de evitar el problema de datos censurados, y centrar la
atención en la formas de las CE de cada caso. De aquí se observa que la mayor cantidad
de ‘ceros’ reportados por los hogares, se dan en el consumo de leche y productos lácteos.
A su vez, considerando sólo los casos donde el gasto es positivo, estos productos
representan el menor porcentaje de gastos en comparación a los otros tres conjuntos de
productos alimenticios.
71
Tabla 4.1 Tamaño de la Muestra e Importancia de los Sub-conjuntos de Alimentos A1-A4
Conjunto de
Alimentos
N
Gasto en Aj /Gasto Total en Alimentos
(%)
A1
7500
19.3
A2
7107
26.1
A3
6705
12.2
A4
7258
17.5
Fuente: Elaboración Propia en base a la ENGH 96/97
En el siguiente apartado se analiza el comportamiento de las variables que entran en la
relación de Engel, comenzando por las que hacen a la especificación básica, i.e.
participación del gasto en alimentos y gasto total. Luego se exponen aquellas variables
demográficas y socioeconómicas seleccionadas para caracterizar la heterogeneidad de los
hogares,
y
que
son
incorporadas
en
especificaciones
más
completas,
sean
semiparamétricas o paramétricas.
4.3
Descripción de las Variables
La variable explicada en cada CE que se estima, es la participación en el gasto total que
tiene el bien en cuestión ( w j ), sea alimentos a nivel agregado (A), o los subconjuntos más
desagregados: A1-A4. La Tabla 4.2 presenta las estadísticas básicas (media, desvío
estándar, mínimo y máximo) de cada una de las participaciones presupuestarias de los
alimentos. Para el total, los hogares gastan, en promedio, cerca de la mitad de su gasto
total en alimentos, existiendo hogares donde todo su ‘ingreso nominal’ se destina al gasto
en alimentos. En general, para el conjunto de alimentos específicos, las carnes (A2)
ocupan, en promedio, un poco más del 10% del presupuesto familiar27, teniendo casos de
hogares donde se destina aproximadamente el 50%. Para los alimentos A1, también hay
hogares que destinan casi la mitad de su presupuesto en estos alimentos, aunque el
promedio es inferior al de las carnes. Similar es el caso de las legumbres, futas y verduras,
donde la máxima participación presupuestaria es del 40 por ciento, pero en promedio los
hogares no gastan más del 7%. La menor participación en el gasto total es para leche y los
A los fines de una interpretación económica más cabal, a partir de aquí el gasto total se entenderá como
proxy del ingreso total, del poder adquisitivo o de compra y del presupuesto familiar.
27
72
productos lácteos (análogo a los resultados presentados en la Tabla 4.1). Esto resulta
razonable si se tiene en cuenta que los conjuntos A1, A2 y A4 comprenden alimentos que
tiene una relación más directa con la preparación de platos acabados, como ser guisos,
pastas y carnes, mientras que la leche y los productos lácteos, son más complementarios
en este sentido, o bien son consumidos en desayunos o meriendas que, en la cultura
argentina, constituyen las comidas diarias más livianas, mientras que el almuerzo y/ la
cena constituyen comúnmente los ‘platos fuertes’.
Tabla 4.2 Estadístico de las Variables Dependientes de las CE
wA
wA1
w A2
w A3
w A4
Media
DE
Min.
Max.
0.416
0.179
0.010
1
0.081
0.057
0.001
0.442
0.112
0.072
0.002
0.491
0.049
0.035
0.001
0.285
0.065
0.045
0.001
0.408
Fuente: Elaboración Propia en base a la ENGH 96/97
La variable explicativa que hace a la relación de Engel, es el ingreso o gasto total. En
particular, por razones de especificación econométrica, se toma el logaritmo natural de la
misma. A su vez, en la especificación básica de las CE se considera el logaritmo del gasto
(lnG) en vez del logaritmo del ingreso total (ln I), por dos razones básicas, que fueron
comentadas en el capítulo 2: Por un lado, en ecuaciones separables de CE se suele tomar el
gasto total como variable proxy del ingreso, al ser una variable más confiable que el
ingreso en el momento del relevamiento y captación de la misma. A su vez, la elección del
gasto total se fundamenta en la alta correlación que existe con el ingreso permanente
(Iyengar, 1967) y adicionalmente porque esta categoría permite separar el problema de
asignación del consumo total de bienes del problema de decisión de la familia de cuánto
ahorrar o desahorrar del ingreso corriente (Lewbel, 2006). Por otra parte, en el análisis
económico en general se toma el gasto total por motivos teóricos en la especificación de
sistemas completos de demanda que cumplan con las restricciones básicas derivadas de la
teoría del consumidor.
73
A pesar de esto, el ingreso suele utilizarse como la principal variable instrumental, en el
caso de que el gasto total sea endógeno. En el último capítulo de la tesis, se utiliza el
ingreso total a los fines de corregir el problema de endogeneidad. En la Tabla 4.3 se
muestra la media y el desvío estándar del gasto e ingreso total, y la correlación que existe
entre ambos. También se presentan los resultados para las transformaciones logarítmicas
utilizadas en los modelos econométricos. Como es de esperarse, el ingreso total promedio
es superior al gasto total, como también su varianza. Al aplicar la transformación
logarítmica, las diferencias, en términos del promedio y desvío estándar, son muy
pequeñas. Se observa que la correlación (lineal) entre ambas variables es significativa. La
Figura 4.1 muestra una clara relación, aproximadamente lineal, entre ambas variables
expresadas en logaritmos.
Tabla 4.2 Resumen Estadístico del Gasto y del Ingreso Total
Media
DE
Gasto Total ( G )
734.98
578.71
Ingreso Total ( I )
943.11
924.28
corr (G, I )
ln G
ln I
0.71
corr (ln G , ln I )
6.326
0.755
6.53
0.799
0.78
Fuente: Elaboración Propia en base a la ENGH 96/97
2
4
ln(Y)
6
8
10
Figura 4.1 Diagrama de Puntos. Log del Ingreso total – log del Gasto Total
4
5
6
7
8
ln(G)
Fuente: Elaboración Propia en base a la ENGH 96/97
74
Puesto que las variables básicas que entran en la relación de Engel son la participación del
gasto en un alimento y logaritmo del gasto total, se presentan a continuación diferentes
gráficas de la distribución de las mismas, y posteriormente los diagramas de puntos de
tales relaciones. En la Figura 4.2 se muestran las densidades marginales de la
participación del gasto en alimentos y bebidas (panel (a)) y la del logaritmo del gasto total
(panel (b)). Éstas son estimadas por medio de histogramas y del estimador de densidad
por núcleos o kernel (con ventana óptima obtenida por medio de convalidación cruzada,
CV). En el panel (c) se muestra la distribución conjunta de ambas variables, también
estimada utilizando el estimador de núcleos.
Ambas distribuciones marginales muestran un poco de asimetría, una hacia la izquierda y
la otra hacia la derecha, aunque no es muy notoria. La mayoría de los hogares se
encuentran en los niveles de gasto superiores a los 665 pesos mensuales a precios del
96/97 (i.e. exp(6.5)), los que terminan acumulando una participación del gasto menor a 0.5.
Esta simple inspección de la distribución, permite ver, en cierto sentido, el cumplimiento
de la ley de Engel. Esto también se observa de la distribución conjunta (panel (c)) donde la
‘campana’ está ubicada en niveles medios-altos de gasto total y medios-bajos de la
participación del gasto en alimentos.
Para el caso de los conjuntos de alimentos específicos (Figura 4.3), las distribuciones
estimadas muestran una mayor asimetría, concentrando alrededor de los valores de la
media (Tabla 4.3).
Los diagramas de puntos de puntos de las relaciones de Engel, se presentan en los
gráficos de la Figura 4.4. De la mismas se observa una relación negativa entre el logaritmo
del gasto total y la participación en el gasto de cada conjunto de alimentos, i.e. un
cumplimiento general de la ley de Engel. La dispersión de los datos difiere, mostrando
una mayor variabilidad en el extremo inferior del gasto total. A pesar de la relación
negativa teóricamente esperable entre ambas variables, de la simple inspección visual no
puede dilucidarse una forma funcional (aproximada) conocida. Se espera una curva
decreciente en el logaritmo del gasto total con algunos cambios de curvatura leves, en el
sentido de que no cambian el signo de las pendientes de sus tangentes, aunque si el valor
75
absoluto de su magnitud. Los diagramas de puntos también muestran que para los
diferentes tipos de alimentos, las relaciones de Engel difieren entre sí.
Figura 4.2 Densidades Marginales y Conjunta de la Participación del Gasto en Alimentos
y Bebidas y del Logaritmo del Gasto Total
(b) Histográma – Densidad Kernel (h=0.09)-- ln G
wA
0.2
0.3
Density
1.0
0.0
0.1
0.5
0.0
0.0
0.2
0.4
0.6
0.8
4
1.0
5
6
7
8
(c) fˆ (w A , ln G ) - Estimación por Núcleos (CV)
1.0
D
Joint
ensit
0.5
y
1.0
0.0
0.5
8
wA
Density
1.5
0.4
2.0
0.5
(a) Histográma – Densidad Kernel (h=0.03)-
6
lnG
4
0.0
Fuente: Elaboración Propia en base a la ENGH 96/97
76
Figura 4.3 Densidades Marginales Estimadas de la Participación del Gasto en Alimentos
A1-A4
A2
3
Density
0
0
1
2
2
4
Density
4
6
5
8
6
7
A1
0.0
0.1
0.2
0.3
0.0
0.4
0.1
0.2
0.3
0.4
0.5
N = 7107 Bandwidth = 0.0051
N = 7500 Bandwidth = 0.005802
A4
0
6
0
2
5
4
Density
Density
10
8
10
15
12
A3
0.00
0.05
0.10
0.15
0.20
N = 6705 Bandwidth = 0.002565
0.25
0.30
0.0
0.1
0.2
0.3
0.4
N = 7258 Bandwidth = 0.003693
Fuente: Elaboración Propia en base a la ENGH 96/97
77
Figura 4.4 Relaciones de Engel – Diagramas de Puntos
0
.2
.4
w_A
.6
.8
1
A: Total Alimentos y Bebidas
4
5
6
ln(G)
7
8
A2: Carnes
0
0
.1
.1
.2
w_A1
.2
w_A2
.3
.3
.4
.4
.5
A1: Panadería, Harinas, Arroz, Cereales y Pastas
4
5
6
ln(G)
7
4
8
6
ln(G)
7
8
A4: Frutas, Verduras y Legumbres
0
0
.1
.1
w_A3
w_A4
.2
.2
.3
.4
.3
A3: Leche y Productos Lácteos
5
4
5
6
ln(G)
7
8
4
5
6
ln(G)
7
8
Fuente: Elaboración Propia en base a la ENGH 96/97
78
Adicionalmente al logaritmo del gasto total, en la especificación semiparamétricas se
consideran las características socioeconómicas y demográficas de los hogares. La
descripción de las mismas se presenta en la Tabla 4.4
Tabla 4.3 Descripción de las variables Socioeconómicas y Demográficas Consideradas
Descripción
Variables
Tipo
Edad del jefe de Hogar
jedad
Continua
jgenero
binaria, 1 si es hombre y 0 si es
mujer
Género del jefe de hogar
Cantidad de miembros adultos en el
hogar (mayores de 14 y menores de
65)
adultos
Continua
Cantidad de miembros menores de
14
menor14
Cantidad de miembros mayores a 65
mayor65
Nivel de instrucción del jefe de
hogar
edu
Situación ocupacional , no ocupado
noocupado
Continua
Continua
Binaria; =1 si el jefe de hogar
tiene estudios universitario o
terciario
(base)
Binaria; =1 si el jefe es no
ocupado
Asalariado
asalariado
Binaria; =1 si el jefe es
asalariado
Cuenta propia o patrón
patron
Binaria; =1 si trabaja por
cuenta propia o es patrón
Tipo de hogar unipersonal
tipo1 (base)
Binaria; =1 si el hogar es
unipersonal
tipo2
Binaria; =1 si el hogar es
nuclear s/hijos
tipo3
Binaria; =1 si el hogar es
nuclear c/hijos
tipo4
Binaria; =1 si es hogar
extendido
Tipo de hogar nuclear sin hijos
Tipo de hogar nuclear con hijos
hogar extendido
Fuente: Elaboración Propia
El valor promedio de la edad del jefe de hogar en la muestra es de 50 años, con un desvío
estándar de 16 años. Del total de la muestra el 74,6% está compuesto por hogares con jefe
79
varón, mientras que el 25% restante corresponde a hogares con jefatura femenina. El
tamaño promedio del hogar (cantidad total de miembros) es de 3.5, compuesto por una
media de 1 menor por hogar (menor14), 0.3 adultos mayores (mayor65) y 2.2 adultos en
edad intermedia (adultos). Los máximos alcanzados son de 10, 4 y 10, respectivamente.
Respecto al nivel de instrucción del jefe/a de hogar (edu), solo el 16% de los hogares tiene
un jefe con estudios secundarios completos y superiores (completos o incompletos).
Aproximadamente, el 42% de los hogares tiene jefe o jefa asalariado, el 23% son patrones
o trabajadores por cuenta propia, y el 35% restante son no ocupados (inactivos o
desocupados). Por último, respecto de los tipos de hogares, la mayor proporción (53%)
corresponde a hogares nucleares con hijos (tipo3). Luego siguen los hogares extendidos
con un 18%, y los unipersonales y nucleares sin hijos representando cada uno un 14% de
la muestra.
4.4
Procedimientos y Software
Para el primer ordenamiento y exploración de la base de datos se utilizó el software Stata
(StataCorp). El resto de la tesis se desarrolló utilizando el software R (R-Project). La
elección de este software se debió a diversos motivos. Por un lado, por ser libre y poder
seguir trabajando con los comandos realizados, sin depender de algún vencimiento de
licencia. Por otro lado, existen una gran variedad de paquetes disponibles sobre métodos
no paramétricos y semiparamétricos, cada uno con sus propias particularidades, de forma
que uno puede comparar y elegir aquél que resulte más conveniente en función de los
intereses particulares que se tenga. El tercer motivo se debe a que en los cursos de la
Maestría en Estadística Aplicada que requerían aplicaciones computacionales, en su gran
mayoría se utilizó R.
Dada la gran variedad de paquetes de R sobre estimaciones no paramétricas y
semiparamétricas28, lo mejor es trabajar con un número reducido de paquetes, para poder
comprenderlos de mejor manera. El criterio que se siguió en la elección tuvo en cuenta la
flexibilidad de los programas incorporados, el output disponible luego de una ‘tirada’ y,
fundamentalmente, que la escritura y los procedimientos de los mismos estén bien
detallado en manuales o escritos para tales fines. En función de ello, para los estimadores
28
Para un resumen bastante actual sobre la disponibilidad de métodos ver Racine (2009)
80
basados en núcleos se eligió trabajar con el paquete ‘locfit’ (Loader, 2010) y
‘smooth.spline’ cuya referencias (para S) se encuentran en Chambers y Hastie (1992).
Para la aplicación de los métodos de elección de suavizado, se escribieron programas para
tales fines, con un vector de valores de ventanas y de grados de libertad, para luego ver el
comportamiento gráfico de las funciones CV, GCV y AICc en función de ellos, y luego
buscar el mínimo (considerando 3 dígitos). Puesto que el comando ‘smooth.spline’ tiene la
posibilidad de elegir el suavizado por medio de los criterios CV o GCV (no así el AIC), se
compararon tales valores de salidas, con los programas propios, coincidiendo en los
resultados. La ventaja del ‘locfit’ y del ‘smooth.spline’ es que las salidas proporcionan
suficiente información de la matriz de suavizados, y con ella se pueden formular todos los
métodos propuestos para la elección del suavizados. Para la construcción de los IC
bootstrap se construyó una función general, cuyo imputs son los datos y el método no
paramétrico deseado, y el output son los puntos correspondientes de los IC al nivel del
95% para cada valor de la variable independiente. Se implementó el algoritmo presentado
en el capítulo metodológico.
En general, para todos los bootstrap realizados en la tesis, se utilizó un total de 500
réplicas, fijando un valor de la semilla igual a “123” en todos los casos. Todos ellos fueron
programados mediante bucles, y construyendo funciones generales (<-function()) para
aplicarlas a cada método y tipo de alimentos. En general, en algunos casos se
construyeron programas generales para los estimadores basados en núcleos, y otros para
los spline, a los efectos de facilitar las salidas. Para el test de especificación no paramétrico
se implementó el algoritmo presentado en el capítulo de metodología.
Para cada medida de performance de los estimadores, se construyeron funciones,
tomando como argumentos los valores observados y los valores ajustados, y en algunos
casos los grados de libertad de los estimadores. Para la función de evaluación Cp, otro
argumento considerado es la varianza estimada, que no necesariamente corresponde a la
del método que se está evaluando sino que puede ser de un par con el cual se está
comparando. En general se elige aquélla con un suavizado que supone un menor sesgo.
Las elasticidades se construyen en función de las derivadas estimadas. Para el estimador
N-W, se aplica el método de la diferencia central usando dos puntos, mientras que para
81
los polinomios lineales y cuadráticos, a partir del ‘locfit’ se obtienen directamente, de
igual modo que en el caso de los suavizados spline por medio de ‘smooth.spline’. Para
computar la elasticidad promedio, primero se estima la densidad del logaritmo del gasto
total con el método de kernel. Ésta pondera los valores puntuales de la elasticidad, y luego
se estima la integral por medio de la suma ponderada usando la diferencia entre dos
puntos consecutivos del logaritmo del gasto total.
Para la construcción de las funciones ESC, se elige una grilla de valores del logaritmo del
gasto total, igualmente espaciada, donde el mínimo de la misma es el mayor valor de los
mínimos de las CE del par que se está comparando, mientras que el máximo es el menor
valor de los máximos del par. Con los resultados de las estimaciones utilizando los datos
originales, se obtiene predichos para tal grilla mediante interpolación (Loader, 1999: 243).
Para el cómputo de la derivada del ESC se utiliza esta metodología con las predicciones
obtenidas de las derivadas. Los errores estándar son obtenidos mediante la programación
de un wild-bootstrap para cada caso.
Por último, para la estimación semiparamétrica, si bien existen paquetes que permiten
obtenerla directamente, para manejar el método que se quiere utilizar en cada etapa
resulta conveniente (y sencillo) programarlo. Al elegir un suavizado no paramétrico en
particular, el mismo se aplica tanto en la primera etapa del procedimiento (utilizando en
cada caso, suavizados óptimos), como en la etapa de estimación de la componente no
paramétrica de interés. Asimismo, los errores estándar heterocedásticos son programados,
como así también las elasticidades-gasto e ingreso, utilizando los procedimientos
anteriormente comentados.
82
Segunda Parte
RESULTADOS
83
Capítulo 5
Análisis Comparativo de Regresiones No
Paramétricas de Curvas de Engel
5.1
Introducción
En el presente capítulo se comparan los estimadores no paramétricos de curvas de Engel
(CE) en dos sentidos complementarios. Por un lado, desde la perspectiva estadística se
computan algunas medidas de performance en base al poder predictivo, al error de
estimación y bondad de ajuste de los diferentes estimadores propuestos. Desde el punto
de vista económico, es deseable obtener curvas que reflejen comportamientos económicos
consistentes dentro de la teoría y de la evidencia general en el marco de la teoría del
consumidor.
En primer lugar, en base a los criterios de selección automática del suavizado de los
estimadores, se busca compararlos a los fines de seleccionar un criterio común a todos los
estimadores que tenga un buen desempeño en términos del error cuadrático e implique
un costo computacional aceptable. Específicamente se comparan el criterio de
convalidación cruzada (CV),
el de convalidación cruzada generalizada (GCV), y
el
basado en el criterio de información de AICc para estimadores no paramétricos.
Una vez seleccionado un criterio de suavizado común, se analizan los resultados de las
estimaciones para el conjunto de alimentos y bebidas (A), y luego para los subconjuntos
de alimentos seleccionados: (A1) Productos de panadería, harinas, arroz, cereales y pastas;
(A2) Carnes vacuna, porcina, ovina, aves, pescados y mariscos; (A3) Leche y productos
lácteos; y (A4) Verduras, legumbres y frutas. Esta forma de presentar los resultados,
primero para el caso general (A), y luego para los subconjuntos específicos, se repite a lo
largo de la presentación de los resultados de este capítulo y de los posteriores (cap. 6 y 7).
84
Luego de un análisis gráfico de las estimaciones, con sus respectivos intervalos de
confianza, se procede a compararlos en términos de los resultados arrojados por las
medidas empíricas de performance estadística. Puesto que los resultados de las diferentes
medidas no son totalmente consistentes en cuanto al ranking propuesto de los mejores
estimadores (en términos del menor error), en el Anexo 1 se presenta una simulación para
evaluar tales medidas de performance a los fines de apoyar las conclusiones a las que se
arriba en esta sección.
Posteriormente se procede a evaluar el comportamiento de las derivadas de las CE y de
las elasticidades-gasto correspondientes. Con esto se busca realizar la evaluación
económica de los diferentes estimadores. Adicionalmente a examinar las funciones
estimadas de las derivadas y las elasticidades, se computan sus promedios, como así
también la elasticidad evaluada en el ‘hogar’ promedio, con sus respectivos desvíos
estándares bootstrap. Tales medidas resultan de suma importancia en el análisis
económico aplicado puesto que son las medidas que generalmente se reportan, y
permiten clasificar los bienes en alguna categoría particular para su interpretación
económica.
Por último, dadas las ventajas que existen en tener una especificación paramétrica, se
procede a testear si las diferentes estimaciones no paramétricas se corresponden con
alguna especificación paramétrica conocida. Particularmente se contrasta la hipótesis que
establece una forma funcional tipo Working-Leser, tanto en su versión tradicional, esto es
lineal, como en sus versiones extendidas, sea cuadrática o cúbica. Se aplican los dos test
de hipótesis detallados en la sección metodológica de la tesis. Un test paramétrico basado
en una aproximación de la distribución F, y otro no paramétrico, basada en la distribución
empírica del estadístico, obtenida mediante réplicas bootstrap.
Por lo tanto, lo que resta del presente capítulo se organiza de la siguiente manera: En la
próxima sección se trata la elección del suavizado. Luego se analizan los resultados de las
estimaciones, dado el criterio de elección del suavizado. La sección 5.4 muestra los
resultados de la evaluación estadística. Posteriormente se presenta el análisis de las
derivadas y elasticidades, y luego, en el apartado 5.6, los resultados de los test de
especificación. Se finaliza el capítulo con unas breves conclusiones, a manera de síntesis
85
comentando los resultados hallados, donde las consideraciones establecidas son aplicadas
en los posteriores capítulos que involucran estimaciones no paramétricas.
5.2
Elección del Suavizado
Previo a la presentación de los resultados de las curvas estimadas, se desea aplicar un
criterio uniforme de selección de suavizado para los cuatro tipos de estimadores que se
están evaluando. Para ello se aplican tres criterios alternativos (presentados en el Capítulo
3) utilizando la base de datos, a fin de visualizar las diferencias que se presentan en los
parámetros óptimos computados de acuerdo al criterio seleccionado. Considerando las
curvas de Engel para Alimentos y Bebidas en su conjunto (A), los resultados se presentan
en la Tabla 5.1. En la misma se detallan, para el caso de los estimadores basados en
*
núcleos, el parámetro óptimo h , los grados de libertad correspondientes (v), el valor
alcanzado por la función minimizada, y tres medidas de evaluación estadística: el error
*
cuadrático medio y absoluto de predicción, y el estadístico Cp. El parámetro h está
expresado en tres dígitos, mostrando con ello que en el proceso numérico de optimización
se consideraron solo tres dígitos en el recorrido de las ventanas. Tal elección se
fundamenta en que no existen grandes diferencias en los estimadores al considerar un
mayor número de dígitos y, a su vez, se ahorra tiempo computacional. Para el caso de los
suavizados spline, en la misma columna de las h se presenta, en su lugar, el parámetro de
penalización
λ . En este caso, se trabajó con los grados de libertad como parámetro para la
búsqueda de los mínimos de cada una de las funciones correspondientes a la elección del
suavizado.
Para el estimador N-W, los criterios GCV y AICc coinciden, con un suavizado levemente
inferior respecto al CV, y por ende, con mayores grados de libertad, dando menores
errores de predicción. A su vez, se puede observar que el valor mínimo de la función CGV
es menor a la del CV.
En la regresión por polinomios locales lineales se observa que el criterio GCV arroja el
menor suavizado, seguido del AICc, y luego del CV. Aquí las diferencias son mayores
respecto al estimador anterior. Los menores valores de las ECMP,
EAMP y Cp se
encuentran para la estimación que utiliza la ventana GCV. Luego sigue la estimación con
86
la ventana AICc y, nuevamente, el criterio CV es el que arroja los mayores errores de
predicción, según las medidas ECMP y EAMP.
Tabla 5.1 Evaluación de los Criterios de Selección del Suavizado
Cp
ECPP
EAPP
h*
v
valor min
Estimador / Criterio
N-W
CV
GCV
AICc
0.429
0.407
0.407
8.700
9.216
9.216
0.024860
0.024851
-2.694592
0.024795
0.024791
0.024791
0.125952 0.0248513
0.125937 0.0248509
0.125937 0.0248509
CV
GCV
AICc
0.838
0.668
0.768
6.600
7.493
7.055
0.024847
0.024837
-2.695164
0.024794
0.024787
0.024791
0.125870 0.0248377
0.125851 0.0248363
0.125860 0.0248368
CV
GCV
AICc
1.337
1.336
1.337
6.600
6.478
6.478
0.024838
0.024832
-2.695374
0.024792
0.024789
0.024792
0.125873 0.0248319
0.125838 0.0248316
0.125873 0.0248319
6.545
6.727
6.756
0.024834
0.024829
-2.695473
0.024786
0.024785
0.024785
0.125847 0.0248293
0.125846 0.0248291
0.125845 0.0248291
P Local Lineal
P Local
Cuadrático
λ
Spline
CV 0.0783
GCV 0.0692
AICc 0.0679
Fuente: Elaboración Propia
Para el caso de los polinomios cuadráticos locales, ahora la coincidencia de ventanas se
da con a los criterios CV y AICc. Nuevamente el GCV da un menor suavizado, aunque las
diferencias con los otros dos resultan despreciables (si se consideran ventanas con dos
dígitos, las tres coinciden). Aunque la diferencia es leve, el GCV es el criterio que vuelve a
dar los menores errores promedios.
Con el suavizado spline, los menores ECMP y EAMP se dan con la ventana óptima del
criterio AICc, seguido del GCV. Sin embargo, al observar los grados de libertad óptimos
las diferencias entre ambos criterios son mínimas.
En todos los casos, los tres criterios de evaluación estadística son consistentes en el sentido
de informar sobre los menores errores de predicción y estimación.
87
La Figura 5.1 presenta el comportamiento de las funciones CV(h), GCV(h) y AICc(h) para el
caso de los estimadores basados en núcleos y CV( λ ),GCV( λ ) y AICc( λ ) para los
suavizados splines. Para cada estimador se observan comportamientos similares de
dichas funciones. Mientras que en el caso del estimador N-W las funciones son más
sensibles para valores mayores al entorno del óptimo, en los otros tres casos ocurre lo
contrario. En las regresiones basadas en polinomios locales lineales, según se vio
anteriormente, utilizando CV se obtiene el mínimo para un h de 0.84, sin embargo en un
entorno superior a 0.6 hay un mínimo local, por lo que los resultados entre éste criterio y
los otros dos serían más coincidentes. Para el caso de los polinomios locales cuadráticos se
observa que existe un entorno más amplio alrededor del punto de mínimo en donde las
funciones CV(h),GCV(h) y AICc(h) no experimentan grandes incrementos, por lo que el
riesgo de error alrededor de la mínima ventana se reduce. Para el caso de los splines, las
gráficas muestran que si el parámetro de penalización es mayor al óptimo, los errores,
medidos por las funciones de selección, no se incrementan fuertemente, contrariamente a
lo que ocurre a medida que
λ se acerca a cero.
De esta comparación se observa que entre los tres criterios seleccionados para la obtención
de un suavizado óptimo no existen importantes diferencias. Sin embargo, el criterio GCV
muestra la mejor performance en términos de los menores errores cuadráticos de
predicción. A su vez este método requiere menor costo computacional que el CV,
particularmente para la estimación por medio de suavizados splines, donde la obtención
de cada elemento de la diagonal principal de la matriz de suavizado requiere más de N
operaciones. Por lo tanto, en lo que resta de la tesis, cada vez que se estime una CE no
paramétrica, se trabajará con el método de convalidación cruzada generalizada para la
obtención de la ventana óptima,.
Con respecto a los resultados empíricos para los conjuntos seleccionados de alimentos
específicos (A1, A2, A3 y A4), se obtuvieron resultados similares. Las mayores diferencias
se encuentran respecto al criterio CV, donde por lo general da como resultados mayores
suavizados. Entre el GCV y el AICc, hay muy pocas diferencias. Incluso si se consideran
los resultados de ventanas con dos dígitos, estos dos criterios dan los mismos suavizados.
88
Figura 5.1 Comportamiento de las Funciones de Selección de Suavizados
N-W
GCV
AICc
0.2
0.4
0.6
0.8
0.2
0.4
0.6
h
0.8
0.2
1.0
1.0
-2.6940
AIC
-2.6945
-2.6950
0.2
0.4
0.6
0.8
0.2
1.0
0.4
0.6
0.8
1.0
h
h
P Local Cuadrático
GCV
AICc
1.0
1.5
-2.692
AIC
-2.695
0.5
2.0
1.0
1.5
2.0
0.5
-2.663
-2.664
AIC
0.02487
GCV
-2.666
0.02485
0.15
0.20
0.25
0.30
lambda
-2.667
0.02483
0.10
2.0
AICc
0.02489
0.02489
0.02487
0.02485
0.02483
0.05
1.5
h
Suavizado Spline
GCV
CV
0.00
1.0
h
h
-2.665
0.5
-2.693
-2.694
GCV
0.02484
0.02484
0.02488
0.02488
0.02492
0.02492
0.02496
-2.691
CV
CV
1.0
-2.6935
0.02488
0.02486
GCV
0.02485
0.02484
0.8
0.8
AICc
0.02487
0.02489
CV
0.02487
0.6
h
CV
0.6
h
P Local Lineal
GCV
0.02485
0.4
0.4
h
CV
0.2
-2.688
AIC
1.0
-2.690
-2.692
-2.694
0.02485
0.02485
0.02495
0.02495
CV
GCV
0.02505
0.02505
-2.686
-2.684
CV
0.00
0.05
0.10
0.15
lambda
0.20
0.25
0.30
0.00
0.05
0.10
0.15
0.20
0.25
0.30
lambda
Fuente: Elaboración Propia
89
5.3
Curvas de Engel Estimadas
Dada la elección del criterio GCV para la obtención del parámetro de suavizado óptimo,
en esta sección se analizarán los resultados de las CE estimadas, utilizando los gráficos de
las regresiones no paramétricas y sus respectivos intervalos de confianza (IC) bootstrap.
En la Figura 5.2 se presentan las curvas de Engel del total alimentos y bebidas (A) para los
cuatro estimadores no paramétricos considerandos. En general se observa que, a partir de
un gasto total de 150 pesos (a precios de 1996-97), donde la participación del gasto en
alimentos y bebidas alcanza un máximo, el comportamiento de las curvas es compatible
con la denominada ley de Engel, caracterizándolos como ‘bienes necesarios’ en la jerga de
la teoría del consumidor. Sin embargo, las cuatro estimaciones muestran que para los
hogares de menores recursos (menores valores del logaritmo del gasto total) la
participación del gasto en alimentos aumenta con el incremento del poder adquisitivo, lo
que prima facie contradice la ley de Engel. Este hecho puede asociarse a la deficiencia en
canasta alimenticia de los hogares pobres, tanto en cantidad como en calidad (Barrientos
Marin, 2009). Específicamente, la pendiente positiva de las líneas tangentes de la CE
puede ser consistente con el comportamiento de un consumidor en la búsqueda de una
mayor calidad para tales bienes de forma tal que los ‘convierte’ en bienes de lujo en el
sentido de que incrementan su peso en el presupuesto del hogar (Deaton, 1988; Costa,
2000; Fleischer y Rivlin, 2009; García Arancibia, 2011). Entre los cuatro estimadores se
observa que aquéllos basados en núcleos acentúan más tal comportamiento en los niveles
de ingresos bajos. Por el contrario, para el estimador spline el crecimiento de la
participación del gasto es mucho más leve, y, según los IC heterocedásticos, la precisión
del estimador es mayor.
En los tramos donde las CE son decrecientes (i.e. adoptan la forma regular según la ley de
Engel), se observan algunos cambios en la pendiente. En particular, en el punto medio de
logaritmo del gasto total (alrededor de 6) se observa una pendiente más pronunciada para
niveles inferiores de dicho punto, respecto a los hogares con mayores niveles de gasto
total. La simple inspección gráfica sugiere que la disminución del peso de los alimentos en
el presupuesto del hogar por incrementos en el poder adquisitivo se realiza de forma más
90
acentuada o acelerada en hogares de menores ingresos. Este quiebre se refleja aún más
con los estimadores N-W y spline.
Figura 5.2 Estimadores No Paramétricos de Curvas de Engel. Total Alimentos y Bebidas
(A)
Estimador Local Lineal (h=0.66 ; v=7.56)
0.6
0.6
0.7
0.7
Estimador N-W (h=0.41 ; v=9.14)
Curva de Engel Estimada
95% IC wild bootstrap
0.5
0.1
0.1
0.2
0.2
0.3
0.4
w_A
0.4
0.3
w_A
0.5
Curva de Engel Estimada
95% IC wild bootstrap
4
5
6
7
8
4
5
ln(G)
6
8
ln(G)
Suavizado Spline. (λ=0.07 ; v=6.73)
0.6
0.6
0.7
0.7
Estimador Local Cuadrático (h=1.33 ; v=6.48)
Curva de Engel Estimada
95% wild bootstrap IC
0.1
0.4
0.1
0.2
0.2
0.3
0.3
0.4
w_A
0.5
0.5
Curva de Engel Estimada
95% IC wild bootstrap
w_A
7
4
5
6
7
8
4
5
6
7
8
ln(G)
ln(G)
Fuente: Elaboración Propia
Al observar las curvas IC, se nota la pérdida de precisión en los extremos, dada la mayor
variabilidad de los datos. Comparando los polinomios locales cuadráticos con el
suavizado spline, cuyos grados de libertad son similares, este último muestra intervalos
de confianza más precisos en los extremos. En los niveles medios del gasto total, las
91
curvas IC cubren con gran proximidad a las CE estimadas, por lo que pueden obtenerse
deducciones del comportamiento económico de los consumidores de una forma más
segura que en los extremos.
En la Figura 5.3 se muestran las cuatro estimaciones en una misma gráfica, revelándose
que las diferencias entre los estimadores no paramétricos son muy leves, con mayor
divergencia en los niveles extremos del gasto total. Al comparar los estimadores locales
lineales y cuadráticos, con el local constante (i.e. el N-W) se observa que los dos primeros
reducen el sesgo en los niveles extremos. En general, el N-W siempre es más susceptible al
sesgo y rara vez resulta ser el más adecuado en comparación con polinomios locales de
mayor grado. Esto ocurre porque un incremento del grado de los polinomios locales,
disminuye el sesgo, aunque aumenta la varianza del estimador. En general los polinomios
más utilizados en la literatura empírica son los lineales y cuadráticos, y en algunos casos
los cúbicos, puesto que un grado mayor del polinomio no siempre resulta ser más
beneficioso (Loader, 1999: 22). Adicionalmente se tiene que, en general, los polinomios
con grado impar proporcionan un mejor ajuste respecto a los pares (Härdle et al., 2004).
0.6
0.7
Figura 5.3 Curvas de Engel de Alimentos y Bebidas (A). Comparación de estimadores
0.4
0.3
0.2
0.1
w_A
0.5
N-W
P Local Lineal
P Local Cuadratico
Spline
4
5
6
7
8
ln(G)
Fuente: Elaboración Propia
92
Para el caso de los subconjuntos de alimentos considerados, se presentan diferentes
formas de CE, cumpliéndose en general la denominada ‘ley de Engel’ (Figuras 5.4-5.7).
Figura 5.4 Estimadores No Paramétricos de Curvas de Engel. Conjunto A1
Estimador Local Lineal (h=0.34 ; v=12.98)
0.15
Curva de Engel Estimada
95% IC wild bootstrap
0.00
0.00
0.05
0.10
0.10
w_A1
Curva de Engel Estimada
95% IC wild bootstrap
0.05
w_A1
0.15
0.20
0.20
Estimador N-W (h=0.33 ; v=11.22)
4
5
6
7
8
4
5
6
ln(G)
8
ln(G)
Suavizado Spline. (λ=0.204 ; v=5.27)
0.15
Curva de Engel Estimada
95% wild bootstrap IC
0.00
0.00
0.05
0.05
0.10
w_A1
Curva de Engel Estimada
95% IC wild bootstrap
0.10
0.15
0.20
0.20
Estimador Local Cuadrático (h=1.6 ; v=5.77)
w_A1
7
4
5
6
7
8
4
ln(G)
5
6
7
8
ln(G)
Fuente: Elaboración Propia
Para el conjunto de alimentos A1 (los productos de panadería, harinas, arroz, cereales y
pastas), los estimadores N-W y por polinomios locales lineales presentan un suavizado
óptimo similar, mostrando gran variabilidad en el extremo inferior del logaritmo del
gasto total, con cambios del signo de la pendiente de las curvas de Engel en pequeños
intervalos del dominio. Dada la forma que toman las curvas a partir de niveles mayores
93
del gasto total, es esperable que esta variabilidad se deba más a un problema de
estimación que a un comportamiento esperado de los consumidores, derivado de la
heterogeneidad de los mismos. De las estimaciones por polinomios locales cuadráticos y
del suavizado spline se tiene un mayor suavizado óptimo, con aproximadamente cinco
grados de libertad versus doce grados de libertad de las estimaciones N-W y local lineal.
En este caso, se corrige la varianza de los estimadores en el extremo inferior, dando
mejores resultados para la interpretación económica del comportamiento de los
consumidores.
Se observa que en hogares con menor poder adquisitivo, la disminución de la
participación del gasto en A1 se realiza a una tasa menor que en hogares de ingresos
medios. Esto significa que la tasa de sustitución de estos productos, que se caracterizan
por un mayor rendimiento, en lo que hace a saciar el hambre en el hogar, es menor en
hogares pobres, y la sustitución por otros alimentos más ricos en nutrientes se realiza de
manera más pronunciada una vez que se ha adquirido un cierto nivel de poder
adquisitivo en el hogar. Luego, como resulta esperable, en hogares con ingresos altos (alto
logaritmo del gasto total) continúa la caída en la participación del gasto en A1 por
incrementos del gasto total, pero en menor medida que en los hogares de gastos e
ingresos medios.
El consumo de carnes de todo tipo (A2) tiene un comportamiento mucho más homogéneo
que en el caso anterior, y la variabilidad de los extremos queda representada en IC más
amplios y no en cambios de signos de las regresiones no paramétricas. Mientras que las
estimaciones basadas en núcleos muestran cierta curvatura, diferenciando en algún modo
los hogares a partir del punto medio del logaritmo del gasto total, la CE del suavizado
spline se aproxima a una línea recta, a pesar de que sus grados de libertad son similares a
los de los polinomios locales lineales y cuadráticos. Sin embargo, se puede apreciar que la
participación del gasto en carnes disminuye en menor medida en hogares con menor
gasto total. Este menor grado de sustitución por otros alimentos, puede deberse a un
cambio hacia un mayor nivel de calidad en los cortes de carnes una vez que el poder
adquisitivo así lo permite. Para un hogar de bajos recursos, existen determinados cortes o
tipos de carnes que permiten la elaboración de guisos de bajo costo y alto rendimiento,
incluyendo el componente cárnico como algo complementario. Dado el fuerte arraigo del
94
consumo de carne en la cultura culinaria argentina, es más probable que en hogares
donde la canasta alimenticia es deficiente, el mayor poder adquisitivo lleve a un hogar a
comprar mejores cortes cárnicos que a sustituirlo por otros tipos de alimentos.
Figura 5.5 Estimadores No Paramétricos de Curvas de Engel. A2
Estimador Local Lineal (h=1.33 ; v=4.57)
0.20
0.15
0.10
0.00
0.00
4
5
6
7
4
8
5
6
7
8
ln(G)
Estimador Local Cuadrático (h=2.67 ; v=4.16)
Suavizado Spline. (λ=0.56 ; v=4.18)
0.10
0.20
Curva de Engel Estimada
95% wild bootstrap IC
0.15
w_A2
0.15
Curva de Engel Estimada
95% IC wild bootstrap
0.00
0.00
0.05
0.10
0.20
0.25
0.25
ln(G)
0.05
w_A2
Curva de Engel Estimada
95% IC wild bootstrap
0.05
0.10
w_A2
0.15
Curva de Engel Estimada
95% IC wild bootstrap
0.05
w_A2
0.20
0.25
0.25
Estimador N-W (h=0.42 ; v=8.86)
4
5
6
7
8
4
ln(G)
5
6
7
8
ln(G)
Fuente: Elaboración Propia
En el caso del consumo de leche y productos lácteos (A3) se tiene que el estimador local
lineal y el N-W presentan mayor varianza debido al menor suavizado óptimo, reflejada
particularmente en el extremo inferior del logaritmo del gasto total. Las CE reflejan que a
medida que se incrementa el poder adquisitivo del hogar, la participación de los lácteos
95
sobre el presupuesto total disminuye pero a menores tasas, particularmente a partir de
los hogares de gastos medios.
Figura 5.6 Estimadores No Paramétricos de Curvas de Engel. A3
Estimador Local Lineal (h=0.49 ; v=9.57)
0.15
0.15
Estimador N-W (h=0.32 ; v=11.33)
Curva de Engel Estimada
95% IC wild bootstrap
0.00
0.00
0.05
0.05
w_A3
w_A3
0.10
0.10
Curva de Engel Estimada
95% IC wild bootstrap
4
5
6
7
4
8
5
6
7
8
Estimador Local Cuadrático (h=1.47 ; v=5.74)
Suavizado Spline. (λ=0.24 ; v=4.91)
0.15
ln(G)
0.15
ln(G)
Curva de Engel Estimada
IC 95% wild bootstrap
0.00
0.00
0.05
0.05
w_A3
w_A3
0.10
0.10
Curva de Engel Estimada
95% IC wild bootstrap
4
5
6
7
8
4
5
6
7
8
ln(G)
ln(G)
Fuente: Elaboración Propia
Un comportamiento similar tienen las CE de verduras, legumbres y Frutas (A4) (Figura
5.7), aunque en este caso se identifican tres tipos de curvaturas. En el extremo inferior,
convexas con una mayor pendiente (de las líneas tangentes). Luego toma una forma
cóncava, para luego volver a ser convexa, aunque con menores pendientes.
96
Figura 5.7 Estimadores No Paramétricos de Curvas de Engel. A4
Estimador Local Lineal (h=0.66 ; v=7.58)
0.15
0.15
Estimador N-W (h=0.4 ; v=9.34)
Curva de Engel Estimada
95% IC wild bootstrap
0.00
0.00
0.05
0.05
w_A4
w_A4
0.10
0.10
Curva de Engel Estimada
95% IC wild bootstrap
4
5
6
7
4
8
5
7
8
ln(G)
ln(G)
Suavizado Spline. (λ=0.06 ; v=6.91)
0.15
Estimador Local Cuadrático (h=1.29 ; v=6.61)
0.15
6
Curva de Engel Estimada
IC 95% wild bootstrap
0.00
0.00
0.05
0.05
w_A4
w_A4
0.10
0.10
Curva de Engel Estimada
95% IC wild bootstrap
4
5
6
7
8
4
5
6
7
8
ln(G)
ln(G)
Fuente: Elaboración Propia
Para poder visualizar de mejor manera las diferencias entre los estimadores de los
conjuntos de alimentos específicos, en la Figura 5.8 se presentan cuatro gráficas para los
conjuntos A1-A4, en las que cada una contiene los cuatro estimadores no paramétricos
estudiados. Se observa que, al igual que ocurría con el caso del total de alimentos y
bebidas, las diferencias entre los estimadores se resaltan en los niveles extremos de gasto
total. En todos los casos se tiene que el sesgo del estimador local constante (N-W) tiende a
subestimar la curva de Engel en los niveles de gastos bajos y a sobreestimarla en los
niveles de mayor poder adquisitivo. En algunos casos hay mayores coincidencias entre el
97
estimador local cuadrático y el suavizado spline (como ser en A1 y A3), y otras veces las
estimaciones con polinomios locales resultan más similares (A2 y A4). De la forma general
de las CE, se tiene una mayor similitud entre la de productos de panadería y pastas (A1)
con la de carnes (A2) por un lado, y la de los productos lácteos (A3) con la de verduras,
legumbres y las frutas (A4), por otro. En la sección 5.6 se estudian las derivadas y
elasticidades-gasto de estas curvas, lo que permitirá complementar el análisis de forma
más acabada.
Figura 5.8 Curvas de Engel de Conjuntos Específicos de Alimentos. Comparación de
Estimadores
0.15
0.20
N-W
P Local Lineal
P Local Cuadratica
Spline
0.00
0.00
0.05
0.10
w_A2
0.15
0.10
N-W
P Local Lineal
P Local Cuadratico
Spline
0.05
w_A1
A2: Carnes
0.25
0.20
A1: Productos de Panadería, Arroz, Cereales y Pastas
4
5
6
7
4
8
5
ln(G)
7
8
ln(G)
A4: Verduras, Legumbres y Frutas
0.15
A3: Leche y Productos Lácteos
0.15
6
N-W
P Local Lineal
P Local Cuadratica
Spline
0.00
0.00
0.05
0.05
w_A4
w_A3
0.10
0.10
N-W
P Local Lineal
P Local Cuadratica
Spline
4
5
6
7
8
4
ln(G)
5
6
7
8
ln(G)
Fuente: Elaboración Propia
98
5.4
Evaluación Estadística
Si bien no se observan diferencias substanciales alrededor de la media entre los diferentes
estimadores no paramétricos, es deseable encontrar cuáles de éstos permiten reflejar de
mejor manera el comportamiento del consumidor, y más aun teniendo en cuenta las
divergencias en los niveles extremos de ingresos, donde muchas veces recae el interés del
análisis económico. En esta sección se evalúan los diferentes estimadores utilizando
medidas alternativas de performance estadística, que en algunos casos resultan
complementarias para la selección del ‘mejor’ estimador.
En la Tabla 5.2 se presentan los parámetros de suavizado (la ventana, el parámetro de
penalización del spline y los grados de libertad correspondientes), el valor del GCV
alcanzado en la minimización del mismo, los errores de predicción ECPP y EAPP, los
2
estadísticos Cp y AICc, y también el R-cuadrado ( R ) no paramétrico.
Tabla 5.2 Medidas de Evaluación de Estimadores No Paramétricos. Total Alimentos y
Bebidas (A)
Cp
AICc
R2
Estimador
h/λ
v
GCV
ECPP
EAPP
N-W
0.41
9.14
0.02485
0.024791
0.125937
0.024851 -2.69459
0.2308
Local Lineal
0.66
7.56
0.02484
0.024787
0.125851
0.024837 -2.69518
0.2306
Local Cuadrático
1.33
6.48
0.02483
0.024789
0.125838
0.024832 -2.69537
0.2305
Spline
0.069 6.73
0.02483
0.024785
0.125846
0.024829 -2.69548
0.2306
Fuente: Elaboración Propia
Según el ECPP, el suavizado spline es el que da un menor error promedio, seguido del
polinomio local lineal. A su vez, el estimador N-W es el que presenta el mayor valor del
ECPP. Por su parte el error absoluto de predicción, coloca al polinomio local cuadrático en
primer lugar (en términos del menor error), y en segundo lugar al spline. Los valores del
Cp y el AICc, son coincidentes en cuanto al ranking que establecen de estimadores con
menor error, colocando en primer lugar al suavizado spline, luego al polinomio local
99
cuadrático, seguido del lineal, y por último al N-W. Este ranking también se da al
observar los valores mínimos de la función GCV evaluada en los respectivos suavizados
óptimos. Por lo tanto, existen bastantes coincidencias entre las diferentes medidas de
performance.
2
En cuanto al R , el mismo muestra que el N-W es el de mayor bondad de ajuste, aunque
2
las diferencias son muy pequeñas. Sin embargo, el R , al igual que en el caso
paramétrico, tiene una gran dependencia (no decreciente) de los grados de libertad del
estimador. En la Tabla 5.3 se muestra el valor del R-cuadrado de los estimadores para
iguales grados de libertad (v). Se toma un v ‘alto’ de 8.3 (promedio del v óptimo para los
estimadores N-W y local lineal) y otro ‘bajo’ de 6.3 (promedio del v óptimo para los
2
estimadores local cuadrático y spline). Se observa que ahora el de mayor R es el spline
seguido del cuadrático y el N-W, y luego del local lineal. Sin embargo, nuevamente las
diferencias son despreciables. A su vez, el R
2
se computa para tener una medida
adicional y que sea comparable con la de los modelos de regresión paramétrica, donde
2
usualmente el R es reportado. Sin embargo, está lejos de considerarse como un criterio
de selección (Racine, 2008: 46)
Tabla 5.3 R-cuadrado de los Estimadores No Paramétricos con iguales grados de libertad.
Total Alimentos y Bebidas (A)
R2
Estimador
v=8.3
v= 6.6
N-W
0.2307
0.2305
Local Lineal
Local Cuadrático
0.2307
0.2307
0.2304
0.2305
Spline
0.2308
0.2306
Fuente: Elaboración Propia
Para el conjunto de alimentos específicos A1-A4 se presenta los resultados de las medidas
de performance en la tabla 5.4 (análoga a la Tabla 5.2).
Para los Alimentos en base a harinas, cereales y arroz (A1), el estimador local lineal es el
que presenta el menor ECPP, mientras que el cuadrático es de menor error según el EAPP.
Ambas medidas colocan al N-W en el segundo lugar de los estimadores con menor error
de predicción. El R2 muestra el mismo ranking para la bondad de ajuste. Por el contrario,
100
las medidas Cp y AICc muestran que el suavizado spline es el de menor error, seguido por
el estimador local cuadrático; coincidiendo con el caso general de alimentos y bebidas (A)
(Tabla 5.2).
Tabla 5.4 Medidas de Evaluación de Estimadores No Paramétricos. Conjuntos Específicos
de Alimentos: A1-A4
Estimador
h/λ
v
GCV
ECPP
EAPP
Cp
AICc
R2
A1
N-W
0.33
11.22
0.00247
0.002459
0.036562
0.0024661 -5.00485
0.2452
Local Lineal
0.34
12.99
0.00247
0.002457
0.036564
0.0024657 -5.00501
0.2455
Local Cuadrático
1.60
5.58
0.00247
0.002462
0.036555
0.0024655 -5.00509
0.2441
0.204
5.27
0.00247
0.002462
0.036568
0.0024650 -5.00529
0.2442
N-W
0.42
8.86
0.00406
0.004052
0.048339
0.004063 -4.50567
0.2266
Local Lineal
1.33
4.57
0.00406
0.004052
0.048358
0.004058 -4.50686
0.2262
Local Cuadrático
2.67
4.16
0.00406
0.004053
0.048299
0.004059 -4.50696
0.2262
0.564
4.18
0.00424
0.004052
0.048316
0.004057 -4.50699
0.2262
N-W
0.32
11.33
0.00102
0.001019
0.024046
0.0010222 -5.88548
0.1549
Local Lineal
0.49
9.57
0.00102
0.001019
0.024063
0.0010220 -5.88571
0.1545
Local Cuadrático
1.47
5.75
0.00102
0.001021
0.024066
0.0010224 -5.88527
0.1531
0.244
4.91
0.00102
0.001021
0.024065
0.0010223 -5.88541
0.1530
N-W
0.40
9.38
0.00162
0.0016116
0.029937
0.0016158 -5.42768
0.1940
Local Lineal
0.66
7.58
0.00162
0.0016116
0.029967
0.0016150 -5.42814
0.1936
Local Cuadrático
1.29
6.61
0.00162
0.0016122
0.029947
0.0016151 -5.42806
0.1934
0.057
6.91
0.00161
0.0016115
0.029944
0.0016146 -5.42841
0.1937
Spline
A2
Spline
A3
Spline
A4
Spline
Fuente: Elaboración Propia
101
En las estimaciones de CE para el consumo de carne (A2), el ECPP es igual en todos los
casos, mientras que para el EAPP el polinomio local cuadrático seguido del spline son los
que muestran los menores errores. El AICc, coincide respecto a estos dos estimadores,
aunque en orden inverso, esto es, primero el suavizado spline y luego el local cuadrático.
EL Cp si bien pone en primer lugar al spline, el segundo estimador con menor Cp es el
local lineal. Para este subconjunto de alimentos, los grados de libertad son más similares;
solo el N-W presenta grados de libertad más altos, duplicando al de los otros tres
estimadores.
En el consumo de leche y productos lácteos (A3), todas las medidas de performance
estadística propuestas son consistentes, mostrando que las mejores CE están dadas por las
que surgen del estimador local lineal y del constante (N-W).
Los valores de las medidas para el caso del consumo de verduras, legumbres y frutas (A4)
muestran que, según los criterios de los estadísticos ECPP, Cp y AICc, el estimador spline
seguido del local lineal son los que muestran los menores errores de estimación y
predicción. Para el EAPP, son el N-W y, nuevamente, el suavizado spline.
De este análisis de la performance de los estimadores no paramétricos no siempre hay
coincidencias en cuanto al ranking que proporcionan las diferentes medidas en base al
criterio del menor error (muestral) de estimación y predicción. Ahora bien, cabe
preguntarse qué tan buenas son tales medidas como aproximación de los errores. Para
responder a ello, aunque de una forma parcial, se presenta en el Anexo 1 un sencillo
ejercicio de simulación. En el mismo se plantea como verdaderas CE las tres formas
funcionales conocidas en la versión simple y extendida de la Working-Leser; es decir, la
especificación lineal, cuadrática y cúbica. En base al conocimiento de las curvas
verdaderas, es posible computar los errores de estimación y predicción de forma exacta.
Tales valores luego son comparados con las medidas empíricas de evaluación de
performance. De este análisis se concluye que, bajo la hipótesis de que las CE tienen
dichas formas funcionales rígidas, el Cp y el AICc son mejores medidas para representar
los errores, mientras que el EEPP y el EAPP, pueden mostrar un ranking totalmente
contrario al real o verdadero. Sin embargo, en esta aplicación empírica se observa que
estas dos últimas medidas son bastante coincidentes con el Cp y el AICc, y a su vez, estos
102
dos últimos no siempre revelan el mismo resultado, aunque en general son muy
consistentes.
Ahora bien, de los resultados de esta sección ¿Cuál o cuáles estimadores tienen la mejor
performance? Claramente, en los términos que se está evaluando, el suavizado spline es el
de mejor desempeño. Luego, en algunos casos, sigue el estimador local cuadrático, y en
otros, el local lineal. El N-W puede ser descartado entre estas alternativas, el que,
justamente, es más utilizado en la literatura econométrica aplicada.
En la próxima sección se analiza el comportamiento de las derivadas y las elasticidades,
lo que contribuirá en el criterio de selección de los estimadores, mirando en ese caso, las
respuestas de los consumidores ante variaciones en su poder adquisitivo, y con ello,
justificando la elección en base a la interpretación económica más razonable que los
estimadores ofrecen.
5.5
Derivadas y Elasticidades
Como se presentó oportunamente en capítulo metodológico, para la estimación de las
derivadas (y con ello, de las elasticidades-gasto) se utilizó un método numérico para el
estimador N-W, dadas las dificultades de cómputo de su derivada analítica, mientras que
para las estimadores locales lineales y cuadráticos, y los suavizados spline, la estimación
de las mismas surgen directamente de la CE no paramétrica. Sin duda representa, otra
ventaja de estos métodos. Por ello, en las gráficas que se verán a continuación, las
derivadas del estimador N-W presentarán formas más discontinuas que el resto.
En la Figura 5.9 se presentan los gráficos de las funciones estimadas de la derivada y de la
elasticidad-gasto correspondiente al consumo total de alimentos y bebidas. Como pudo
inferirse de las CE correspondientes, para el extremo inferior del gasto total la derivada
es positiva, generando con ello una elasticidad-gasto superior a la unidad. De la misma se
observa que si en los hogares pobres existe un incremento del 10% de su gasto total
(medido como proxy de su ingreso), el gasto en alimentos se incrementa (a lo sumo) en un
12%. Una vez que la derivada comienza a ser negativa, existe una fuerte disminución de la
misma hasta el nivel medio del gasto total, reduciéndose la elasticidad-gasto de 1 a un
103
valor aproximado de 0.7. Luego se mantiene en tal nivel, hasta el extremo superior donde
nuevamente hay una caída fuerte de la derivada, y la elasticidad se reduce a la mitad. Esto
es razonable en términos económicos puesto que es esperable que la elasticidad-gasto de
los alimentos disminuya con el poder adquisitivo. Ello surge de suponer que las
necesidades alimenticias, tanto en cantidad como en calidad, ya están cubiertas para un
determinado nivel de ingresos. El hecho que la misma siga siendo positiva puede estar
indicando que el mayor gasto total del hogar no necesariamente indica un mayor gasto per
cápita en el mismo, sino que pueden ser hogares con más miembros y más receptores de
ingresos, lo que da con ello un mayor ingreso total del hogar, pero así también “más bocas
que alimentar”.
Figura 5.9 Derivada de la CE y Elasticidad- Gasto. Alimentos y Bebidas (A)
eAG
1.2
1.0
0.8
Elasticidad-Gasto
0.00
-0.05
N-W
P Local Lineal
P Local Cuadratico
Spline
-0.15
0.4
-0.10
Derivada
0.05
N-W
P Local Lineal
P Local Cuadratico
Spline
0.6
0.10
mA '
4
5
6
7
8
4
5
Log del Gasto Total
6
7
8
Log del Gasto Total
Fuente: Elaboración Propia
De la comparación de los estimadores surge que el suavizado spline da las derivadas y
elasticidades con menor volatilidad, a la vez que muestra una menor sensibilidad en los
extremos. Por el contrario el estimador local cuadrático tiene un comportamiento más
pronunciado en los extremos. Sin embargo, todos los estimadores muestran un
comportamiento económico muy similar.
Esta similitud entre los estimadores no siempre ocurre, y un ejemplo de ello lo constituye
el comportamiento de las derivadas y elasticidades para el caso de los alimentos A1. Se
104
puede observar cómo fluctúan las derivadas de los polinomios locales en el extremo
inferior, lo que no ocurre con el suavizado spline. Esto genera variaciones repentinas de
las derivadas que se traducen en elasticidades muy cambiantes en intervalos pequeños del
gasto total. Es decir que muestran fuertes cambios del comportamiento promedio de
asignación del presupuesto del hogar, en hogares con similares niveles de gasto total. Esto
dificulta la interpretación económica al momento de obtener conclusiones sobre los
niveles de elasticidad en hogares perteneciente a un rango de ingresos o poder
adquisitivo. Específicamente, si se mira el estimador local lineal o constante para niveles
del logaritmo del gasto total entre 4.5 y 5 se tiene que la elasticidad-gasto puede superar a
la unidad como ser igual a 0.4, lo que en la interpretación económica resulta muy
diferente. Sin embargo, del suavizado local cuadrático o del spline se puede conocer con
mayor exactitud el valor de la elasticidad estimada para diferentes niveles de
ingreso/gasto. Por lo tanto, no resulta recomendable contar con CE que muestren tal
variabilidad en las elasticidades, y por ello, en este caso, el suavizado spline y el
polinomio cuadrático son los preferidos.
Figura 5.10 Derivada de la CE y Elasticidad- Gasto. Alimentos A1
G
e A1
1.0
0.8
0.6
Elasticidad-Gasto
0.2
0.00
N-W
P Local Lineal
P Local Cuadratico
Spline
0.0
-0.05
Derivada
0.05
N-W
P Local Lineal
P Local Cuadratico
Spline
0.4
0.10
1.2
mA1 '
4
5
6
7
8
4
Log del Gasto Total
5
6
7
8
Log del Gasto Total
Fuente: Elaboración Propia
105
Para el consumo de carne (Figura 5.11), los cuatro estimadores muestran resultados
similares, aunque el N-W presenta mayores sobresaltos, pudiendo ser el resultado de la
estimación numérica de la derivada más allá de la misma estimación de la CE.
Figura 5.11 Derivada de la CE y Elasticidad- Gasto. Alimentos A2
G
eA2
1.0
0.8
0.6
Elasticidad-Gasto
-0.03
N-W
P Local Lineal
P Local Cuadratico
Spline
-0.06
0.0
-0.05
0.2
-0.04
Derivada
-0.02
-0.01
N-W
P Local Lineal
P Local Cuadratico
Spline
0.4
0.00
1.2
mA2 '
4
5
6
7
8
4
5
6
7
8
Log del Gasto Total
Log del Gasto Total
Fuente: Elaboración Propia
En las estimaciones de CE de leche y productos lácteos (Figura 5.12) se observa que
algunos estimadores poseen el mismo inconveniente que en el caso del conjunto A1. Esto
es, demasiada variabilidad de los efectos marginales para pequeños intervalos del poder
adquisitivo de los hogares, lo que en definitiva conlleva a complicaciones para el análisis
económico. Nuevamente el suavizado spline y el polinomio cuadrático dan como
resultado curvas más suaves reflejando de manera más clara el comportamiento del
consumidor ante el efecto ingreso.
Por último, para los alimentos A4 (Figura 5.13), se observa que la derivada de la CE tiene
una tendencia creciente, contrariamente a lo ocurrido en los otros casos, lo que significa
una mayor respuesta en el consumo de este tipo de alimentos en los hogares con mayor
gasto (ingreso) total. Sin embargo, en términos proporcionales (medido por las
elasticidades) no se observa una tendencia clara, sino oscilaciones alrededor de 0.6, y una
fuerte caída cuando el gasto total alcanza su nivel extremo superior.
106
Figura 5.12 Derivada de la CE y Elasticidad- Gasto. Alimentos A3
G
e A3
0.5
1.0
N-W
P Local Lineal
P Local Cuadratico
Spline
-0.15
0.0
Elasticidad-Gasto
-0.05
N-W
P Local Lineal
P Local Cuadratico
Spline
-0.10
Derivada
0.00
m A3 '
5
6
7
5
8
6
7
8
Log del Gasto Total
Log del Gasto Total
Fuente: Elaboración Propia
Figura 5.13 Derivada de la CE y Elasticidad- Gasto. Alimentos A4
G
eA4
0.4
0.6
0.8
N-W
P Local Lineal
P Local Cuadratico
Spline
0.0
-0.10
0.2
Elasticidad-Gasto
-0.04
-0.06
N-W
P Local Lineal
P Local Cuadratico
Spline
-0.08
Derivada
-0.02
1.0
0.00
mA4 '
4
5
6
7
8
4
Log del Gasto Total
5
6
7
8
Log del Gasto Total
Fuente: Elaboración Propia
A pesar de que las gráficas permiten una análisis del comportamiento del consumidor
para los diferentes niveles del gasto total, usualmente en el análisis económico interesa
contar con una medida resumen del comportamiento, por lo que en la literatura empírica
suelen presentarse las elasticidades promedios o evaluadas en el gasto medio. En la Tabla
5.5 y 5.6 se presentan las derivadas promedio de las CE, ponderadas por la distribución
del logaritmo del gasto total, y con ella se computa la elasticidad promedio.
107
Adicionalmente se muestran las elasticidades evaluadas en el gasto promedio. En cada
caso se presentan los errores estándar bootstrap de tales estimaciones.
Como puede apreciarse de la Tabla 5.5, no existen diferencias importantes entre las
derivadas y elasticidades arrojadas por los diferentes estimadores. A su vez, la elasticidad
promedio es muy similar a la elasticidad evaluada en el ‘hogar promedio’. Mayores
similitudes se observan entre el estimador spline y el local lineal, por un lado, y entre en
N-W
y
el
local
cuadrático
por
otro.
Sin
embargo
puede
concluirse
que
independientemente del estimador no paramétrico que se utilice, el significado económico
derivado de la observación de las elasticidades-gasto promedio (o evaluada en la media)
es el mismo.
Tabla 5.5 Derivadas y Elasticidades – Gasto. Total Alimentos y Bebidas
N-W
P Local Lineal
P Local Cuadrático
Spline
Derivada
Promedio
Elasticidad
Promedio
Elasticidad
en el
Gasto Medio
-0.1067
(0.0023)
-0.1117
(0.0024)
-0.1065
(0.0027)
-0.1111
(0.0023)
0.7436
(0.0053)
0.7317
(0.0055)
0.7438
(0.0065)
0.7330
(0.0055)
0.7718
(0.0261)
0.7245
(0.0198)
0.6960
(0.0099)
0.7226
(0.022)
Nota: Errores estándar bootstrap entre paréntesis.
Fuente: Elaboración Propia
Para los conjuntos de alimentos específicos tampoco se observan diferencias importantes
entre las derivadas y elasticidades computadas a partir de los diferentes estimadores.
Aunque algunas diferencias se resaltan más en las elasticidades evaluadas en el gasto
medio. Las elasticidades promedio muestran que los alimentos en base a harinas, arroz y
cereales son menos elásticos. Sin embargo, si se toman las elasticidades valuadas en el
gasto medio, los alimentos menos elásticos son las carnes. Esto significa que ambos
alimentos responden menos ante variaciones en el poder adquisitivo de los hogares, y ello
es consistente con la cultura culinaria pampeana argentina, donde el gusto está
fuertemente volcado a las carnes y a las pastas (Alvarez y Pinotti, 1999: 115-117).
108
Si bien los lácteos, las frutas y las verduras presentan mayores elasticidades-gasto
promedios, es poca la diferencia con los alimentos A1 y A2.
Tabla 5.6 Derivadas y Elasticidades – Gasto. Conjuntos Específicos de Alimentos A1-A4
Estimador/Alimentos
Derivada
Promedio
Elasticidad
Promedio
Elasticidad
en el
Gasto Medio
-0.036
(0.0008)
-0.038
(0.0011)
-0.036
(0.0011)
-0.037
(0.0009)
0.563
(0.094)
0.536
(0.0125)
0.559
(0.0134)
0.550
(0.0096)
0.662
(0.0587)
0.544
(0.0648)
0.502
(0.0131)
0.526
(0.0245)
-0.044
(0.0010)
-0.046
(0.0011)
-0.044
(0.0013)
-0.046
(0.0011)
0.608
(0.0084)
0.587
(0.0087)
0.604
(0.0112)
0.590
(0.0088)
0.599
(0.0388)
0.528
(0.0160)
0.541
(0.0101)
0.523
(0.0174)
-0.018
(0.0006)
-0.018
(0.0006)
-0.019
(0.0008)
-0.018
(0.0006)
0.640
(0.0104)
0.631
(0.0109)
0.611
(0.0155)
0.627
(0.0109)
0.768
(0.0732)
0.732
(0.0515)
0.651
(0.0153)
0.694
(0.0252)
-0.025
(0.0007)
-0.026
(0.0008)
-0.026
(0.0009)
-0.026
(0.0007)
0.618
(0.0094)
0.602
(0.0096)
0.605
(0.0131)
0.603
(0.0096)
0.758
(0.0409)
0.661
(0.0316)
0.574
(0.0164)
0.664
(0.0375)
A1
N-W
P Local Lineal
P Local Cuadrático
Spline
A2
N-W
P Local Lineal
P Local Cuadrático
Spline
A3
N-W
P Local Lineal
P Local Cuadrático
Spline
A4
N-W
P Local Lineal
P Local Cuadrático
Spline
Nota: Errores estándar bootstrap entre paréntesis.
Fuente: Elaboración Propia
109
Por lo tanto, si bien ambos promedios de elasticidades-gasto brindan medidas útiles para
la clasificación económica de un bien, no expresan la diferencia que puede existir entre los
estimadores, como tampoco distinguen claramente el comportamiento de los
consumidores entre los distintos tipos de alimentos. De aquí se concluye que para una
mejor interpretación económica, debe realizarse un uso conjunto de las curvas de
elasticidades-gasto con sus promedios. Más aún, la visualización de las gráficas de las
curvas de elasticidades no paramétricas, brinda pautas sobre los rangos en los cuales se
podrían calcular los promedios, de forma de tener diferentes elasticidades-gasto en
distintos intervalos de interés, dentro de los cuales, las elasticidades son estables.
5.6
Contraste con Especificaciones Paramétricas
A pesar de la ventaja de contar con CE flexibles obtenidas a partir de las regresiones no
paramétricas, tener una forma funcional conocida de la CE posibilita un análisis más
simple para el cómputo de elasticidades y para la posterior especificación de sistemas de
demanda paramétricos. Sin embargo, ¿Cómo se puede saber si una determinada
especificación paramétrica representa bien el comportamiento del consumidor, ajustada
correctamente al conjunto de datos con los que se cuenta? Si bien la teoría económica
propone especificaciones que se ajustan a la teoría del consumidor, también deja un
margen para la consideración de funciones más generales. Aquí es donde entran las
regresiones no paramétricas, no sólo en su propuesta de formas flexibles, sino también
brindando una alternativa para testear el rechazo o no rechazo de una especificación
paramétrica dada. Por lo tanto, por más que el interés del investigador sea trabajar con CE
paramétricas, un análisis no paramétrico previo, le brindaría información acerca de si su
elección de la forma funcional es correcta o no en términos estadísticos.
Si bien de la inspección gráfica de las CE se puede tener una idea de la forma funcional
posible, existen varios test de especificación que ayudan a sustentar las decisiones. En el
capítulo metodológico se presentaron dos test alternativos que poseen la ventaja de ser
aplicados a cualquiera de los suavizados lineales propuestos. Uno es paramétrico, donde
la distribución del estadístico T se aproxima a una F (sin ser exacta, ni siquiera a niveles
asintóticos). El otro test, propone un estadístico similar T* y se computan los p-valores a
110
partir de su distribución empírica generada por el método wild-bootstrap. En la Tabla 5.7
se presentan los resultados de dichos test proponiendo como hipótesis nula las tres
variantes de la Working-Leser.
Se puede observar que para el caso general del consumo de alimentos y bebidas, ambas
pruebas rechazan todas las hipótesis nulas, independientemente de cuál sea el estimador
y la forma funcional propuesta. Las gráficas de las CE no paramétricas, tampoco
sugirieron alguna forma funcional conocida.
Tabla 5.7 Pruebas de Hipótesis de Especificaciones Paramétricas
Estimador No
Paramétrico
N-W
Especificación
T
Paramétrica (distribución
(Ho)
F aproxim.)
Lineal
Cuadrática
Cúbica
PLL
Lineal
Cuadrática
Cúbica
Lineal
PLC
Cuadrática
Cúbica
Lineal
Spline
Cuadrática
Cúbica
7.1372
(0.0000)
7.5991
(0.0000)
2.8515
(0.0059)
9.8854
(0.0000)
11.0362
(0.0000)
4.5962
(0.0006)
12.8691
(0.0000)
15.2221
(0.0000)
6.7910
(0.0001)
13.8442
(0.0000)
16.6220
(0.0000)
7.9007
(0.0001)
T*
(wildbootstrap)
0.00838
(0.002)
0.00792
(0.002)
0.00260
(0.004)
0.00855
(0.002)
0.00809
(0.002)
0.00276
(0.002)
0.00846
(0.002)
0.00800
(0.002)
0.00267
(0.002)
0.00863
(0.002)
0.00817
(0.002)
0.00284
(0.002)
Nota: p-valores entre paréntesis.
Fuente: Elaboración Propia
De los valores de los estadísticos T y T*, se observa que los mismos se incrementan al
pasar de la Ho lineal a la cuadrática, y disminuyen significativamente cuando Ho es la
111
cúbica (experimentando un pequeño incremento del p-valor). Esto significa que la
especificación cuadrática es la que menos se ajusta respecto a la no paramétrica, mientras
que la cúbica, a pesar de rechazarse, parece ser la mejor opción entre la otras dos. En la
Figura 5.14 se observa que gráficamente la CE cúbica no está tan lejos de las alternativas
no paramétricas. Específicamente, hay mayor divergencia en el extremo superior del gasto
total. Para la CE cúbica, en los hogares de mayor ingreso, llega un punto en donde la
participación del gasto de los alimentos deja de disminuir ante aumentos adicionales del
poder adquisitivo. Sin embargo, para las CE no paramétricas, si bien hay una leve
disminución en la inclinación de las CE en el tramo de gastos totales superiores, la
participación presupuestaria del gasto en alimentos sigue decreciendo. Dado el carácter
de necesidades básicas que tienen los alimentos, lo reflejado por las CE no paramétricas
resulta más consistente en términos económicos.
0.6
Figura 5.14 Ajuste Cúbico de la CE versus Ajustes No Paramétricos
0.4
0.2
0.3
w_A
0.5
W-L Cúbica
P Local Lineal
Spline
4
5
6
7
8
ln(G)
Fuente: Elaboración Propia
Los coeficientes estimados de los modelos paramétricos de CE para el caso del total de
alimentos y bebidas (A) se presentan en la Tabla 5.6. Se puede ver que la bondad de ajuste
112
en términos del R
2
es menor a la de los ajustes no paramétricos, aunque la cantidad
‘equivalente’ de parámetros (v) es mayor en estos últimos (ver Tabla 5.2).
Tabla 5.8 Estimaciones Paramétricas Simples de CE. Total Alimentos y Bebidas (A)
Coeficientes
Especificación Working-Leser
Lineal
1.127 ***
( 0.0153)
-0.112***
( 0.0024)
Cuadrática
0.953***
( 0.095)
-0.056*
( 0.0304)
-0.0045*
(0.0024)
Cúbica
-2.358***
(0.53)
1.579***
(0.259)
-0.27***
(0.0419)
0.0142***
(0.0022)
R2
0.224
0.2241
0.2281
EER
0.1581
0.1581
0.1577
θ0
θ1
θ2
θ3
Estadístico-F
2190
1097
748.8
Obs.
7588
7588
7588
Notas: Siguiendo la notación del capítulo 3, los θj son los coeficientes correspondientes a la potencia j del
logaritmo natural del gasto total. Errores estándares entre paréntesis. EER: Error estándar de los
residuos.***significativo al 1%; **significativo al 5%; * significativo al 10%. Fuente: Elaboración propia
Si bien las tres hipótesis paramétricas para las CE del consumo total de alimentos y
bebidas son estadísticamente rechazadas, para los subconjuntos de alimentos específicos
los resultados de los test de especificación sugieren algunas especificaciones paramétricas.
Los mismos se presentan en la Tabla 5.9
Para los alimentos A1, si bien se rechaza la hipótesis de linealidad, a un nivel del 1% no se
rechaza la hipótesis cuadrática si se considera la prueba bootstrap, aunque con el test
paramétrico sí se rechaza, excepto si se considera como alternativa el polinomio local
cuadrático. Sin embargo, para ambos test y todos los estimadores, no existe evidencia
estadística suficiente para rechazar la hipótesis de la CE cúbica. Por lo tanto, para este tipo
de alimento puede tomarse a la Working-Leser cúbica como la mejor especificación.
Ahora bien, al observar las gráficas superpuesta del ajuste cúbico, del cuadrático y del
suavizado spline (Figura 5.15) se tiene que la CE cúbica es similar al spline en el extremo
inferior del gasto total. Sin embargo, en el extremo superior, la cuadrática se ajusta más al
113
suavizado spline. En el rango intermedio de gasto, si bien las tres curvas son muy
similares, la CE cúbica sigue de mejor manera a la curva no paramétrica.
Tabla 5.9 Pruebas de Hipótesis de Especificaciones Paramétricas. Conjuntos Específicos
de Alimentos: A1-A4
A1
Est. NP
Ho
Lineal
N-W
Cuadrática
Cúbica
Lineal
PLL
Cuadrática
Cúbica
Lineal
PLC
Cuadrática
Cúbica
Lineal
Spline
Cuadrática
Cúbica
A2
A3
A4
T
T*
T
T*
T
T*
T
T*
5.0320
(0.0000)
2.3041
(0.0098)
1.8342
(0.0546)
4.8058
(0.0000)
2.4082
(0.0043)
2.0136
(0.0241)
3.7986
(0.0159)
4.6451
(0.0192)
-1.6225
(1.0000)
14.7758
(0.0000)
6.6744
(0.0007)
6.6669
(0.0056)
0.00761
(0.004)
0.00318
(0.0978)
0.00228
(0.2116)
0.00825
(0.004)
0.00381
(0.1297)
0.00292
(0.2695)
0.00633
(0.002)
0.00191
(0.024)
0.00101
(0.0499)
0.00645
(0.002)
0.00202
(0.01)
0.00113
(0.02)
1.0938
(0.3637)
0.8951
(0.5153)
-0.0669
(1.000)
3.0042
(0.0281)
3.1979
(0.0391)
-0.5541
(1.000
3.7986
(0.0159)
4.6451
(0.0192)
-1.6225
(1.000)
4.3225
(0.011)
5.7784
(0.012)
-2.2521
(1.000)
0.00132
(0.2435)
0.00096
(0.2854)
-0.00006
(0.9022)
0.00130
(0.0679)
0.00093
(0.0758)
-0.00008
(0.6267)
0.00129
(0.0399)
0.00092
(0.0339)
-0.00009
(0.4431)
0.00133
(0.0379)
0.00096
(0.0399)
-0.00006
(0.5269)
5.426
(0.0000)
2.2819
(0.0102)
1.5825
(0.1097)
6.7563
(0.0000)
2.7651
(0.0049)
1.8772
(0.0698)
12.304
(0.0000)
3.7117
(0.0108)
1.1541
(0.3159)
16.7959
(0.0000)
5.5179
(0.0046)
1.7982
(0.1798)
0.0093
(0.002)
0.00357
(0.1198)
0.00224
(0.3673)
0.00900
(0.002)
0.00327
(0.1597)
0.00194
(0.3912)
0.00740
(0.002)
0.00168
(0.0739)
0.00035
(0.515)
0.00729
(0.002)
0.00157
(0.002)
0.00024
(0.3214)
3.5137
(0.0002)
1.8195
(0.0668)
1.7074
(0.1002)
4.8736
(0.0000)
2.6303
(0.0177)
2.6311
(0.0260)
5.7513
(0.0000)
2.9350
(0.0182)
3.0337
(0.0261)
10.557
(0.0000)
3.4485
(0.0085)
1.5728
(0.1951)
0.0044
(0.02)
0.0021
(0.1717)
0.0017
(0.2016)
0.0044
(0.0240)
0.002
(0.2116)
0.0017
(0.2295)
0.0041
(0.018)
0.0017
(0.1597)
0.0013
(0.1697)
0.00451
(0.01)
0.00211
(0.0619)
0.00175
(0.0639)
Nota: p-valores entre paréntesis. Fuente: Elaboración Propia
Para el consumo de carnes (A2) gráficamente se vio una forma casi lineal de la curva. Esto
es verificado por la pruebas de hipótesis donde por lo general no hay rechazo de la
hipótesis nula de linealidad. Los test basados en los estimadores N-W y local lineal son los
que presentan mayor sustento estadístico para ello. Sin embargo tampoco se rechazan las
formas cuadráticas y cúbicas. De la Figura 5.16, se observa que en extremo inferior, el
ajuste cuadrático y el spline son prácticamente iguales. En el extremo superior de gasto
total, el ajuste lineal se acerca más a la curva no paramétrica. Por lo tanto, del test y de la
inspección gráfica se concluye que tanto una especificación lineal como cuadrática pueden
funcionar como especificaciones paramétricas alternativas a los ajustes no paramétricos.
114
0.10
W-L Cúbica
W-L Cuadrática
Spline
0.00
0.05
w_A1
0.15
0.20
Figura 5.15 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para
el Subconjunto de Alimentos A1
4
5
6
7
8
ln(G)
Fuente: Elaboración propis
0.05
0.10
0.15
W-L Cúbica
W-L Cuadrática
W-L lineal
Spline
0.00
w_A2
0.20
0.25
Figura 5.16 Comparación del Ajuste Cúbico, Cuadrático, Lineal y No Paramétrico de las
CE para el Subconjunto de Alimentos A2
4
5
6
7
8
ln(G)
Fuente: Elaboración propia
115
Para la leche y los productos lácteos (A3), algunos test, principalmente aquéllos basados
en polinomios locales (tanto constante, como lineal y cuadrático) y considerando la
distribución bootstrap, el ajuste cuadrático no se rechaza. Por otro lado, según el
estimador spline, la misma se rechaza. Sin embargo se tiene que la especificación cúbica
no se rechaza en ningún caso. En la Figura 5.17 se observa que las diferencias entre la CE
cúbica y el suavizado spline son muy leves, excepto para el extremo superior del gasto
total. No obstante, la forma de la curva se conserva.
0.12
Figura 5.17 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para
el Subconjunto de Alimentos A3
0.06
0.00
0.02
0.04
w_A3
0.08
0.10
W-L Cúbica
W-L Cuadrática
Spline
4
5
6
7
8
ln(G)
Fuente: Elaboración propia
Por último, para las verduras, legumbres y frutas (A4), en general se rechaza la linealidad.
La especificación cuadrática no es rechazada si se consideran los polinomios locales,
mientras que la cúbica no se rechaza en ningún caso. De la Figura 5.18 se observa que las
curvas estimadas por los dos ajustes no paramétricos se ubican alrededor de las
alternativas paramétricas, difiriendo más en los extremos. En el extremo inferior, la
especificación cúbica se aproxima mejor al spline y peor al local lineal, mientras que para
la cuadrática ocurre lo contrario. Sin embargo en el extremo superior del gasto total, la WL cuadrática representa de mejor manera los ajustes no paramétricos respecto a la cúbica.
116
0.15
Figura 5.18 Comparación del Ajuste Cúbico, Cuadrático y No Paramétrico de las CE para
los Subconjunto de Alimentos A4
0.00
0.05
w_A4
0.10
W-L Cúbica
W-L Cuadrática
P Local Lineal
Spline
4
5
6
7
8
ln(G)
Fuente: Elaboración propia
De este análisis surge la necesidad de utilizar los test estadísticos y la inspección gráfica
de forma complementaria a los fines de decidir qué forma funcional se seleccionará para
una CE, si el interés está en trabajar con modelos paramétricos.
5.7
Síntesis y Conclusiones
Este capítulo estuvo destinado a evaluar los resultados empíricos de las CE no
paramétricas de los alimentos seleccionados considerando criterios estadísticos y
económicos. Las CE estimadas por los diferentes métodos tienden a diferenciarse en los
niveles extremos del gasto total, lo que en gran parte se deriva de los distintos suavizados
óptimos que proponen dichos métodos.
De la evaluación estadística, se concluye que el estimador N-W es superado por
cualquiera de los otros estimadores alternativos. Sin embargo, es uno de los estimadores
más utilizados en la literatura econométrica aplicada. Los suavizados por medio de
splines muestran tener un muy buen desempeño respecto a los errores de estimación y
117
predicción. Así también los polinomios locales lineales en unos casos, y los cuadráticos en
otros, constituyen una buena elección al momento de considerar la estimación de CE. Si
bien no hay una perfecta coincidencia respecto al ranking que implícitamente proponen
las diferentes medidas de performance de los estimadores, en algunos casos mostraron
resultados muy consistentes. Las mayores coincidencias se encuentran entre el Cp y el
AICc, quienes, al corregir por los grados de libertad, resultan ser más confiables para la
medición de los errores, lo que es confirmado mediante el ejercicio simple de simulación
del Anexo 1.
Respecto a la estimación de las elasticidades, las que surgen del suavizado spline
muestran un comportamiento más consistente con lo esperado en términos económicos,
principalmente en los niveles extremos de ingreso donde muchas veces recae el interés del
análisis económico. Sin embargo, al computar los promedios, se encuentran muy pocas
diferencias, y todos los estimadores terminan arrojando un valor de elasticidad-gasto
similar.
Por último, en los test de especificación se examinó cuales serían las formas funcionales
más adecuadas para una representación paramétrica de la CE frente al ajuste no
paramétrico. Para el caso general de alimentos y bebidas (A), ninguna de las tres
especificaciones parece representar adecuadamente la forma funcional propuesta por los
suavizados no paramétricos. Sin embargo se observó que gráficamente el ajuste cúbico da
una aproximación aceptable de la CE no paramétrica. Para los subconjuntos de alimentos
específicos se encontró que la especificación cúbica no se rechaza según las pruebas de
hipótesis propuestas, confirmado, en general, mediante la inspección gráfica. La
excepción es el consumo de carne (A2) donde una especificación lineal o cuadrática parece
ajustarse mejor al suavizado no paramétrico, y representar de mejor manera el
comportamiento del consumidor de tales bienes. También, para las verduras, legumbres y
frutas (A4), la cuadrática puede ser preferida a la cúbica, principalmente en la
representación de los hogares con mayores niveles de gasto total. Estas elecciones de
ajustes paramétricos son las que se seleccionarán en los próximos capítulos cuando se
requiera trabajar con especificaciones paramétricas.
118
Capítulo 6
Efectos de las Características de los Hogares
6.1
Introducción
En el presente capítulo se extiende el análisis de las curvas de Engel (CE) no paramétricas
correspondientes al consumo de alimentos, incorporando la heterogeneidad de los
hogares representada a través de sus características sociodemográficas. Dada la
evaluación de los métodos de estimación no paramétrica realizados en el capítulo
anterior, en el presente se seleccionará el o los métodos que arrojaron los resultados más
satisfactorios, aplicados a tipologías diferenciadas de los hogares. Específicamente, del
capítulo anterior se pudo ver que los suavizados por medio de splines tienen la mejor
performance estadística como así también en la interpretación económica. De los
estimadores basados en núcleos, los polinomios locales superan al N-W. Por lo tanto en el
presente capítulo se comenzará trabajando con estos dos estimadores: lo polinomios
locales lineales y los suavizados spline.
La metodología de análisis está presentada en la sección 3.6 del capítulo 3. La misma
propone, en primer lugar, la comparación de las CE condicionadas a las características de
los hogares, i.e. Z i f = z f , donde Z i f es un vector que representa las características del
hogar i. Los cambios posibles de las CE se pueden reflejar en un simple desplazamiento,
en un cambio de forma, en variaciones de la derivada y de la elasticidad-gasto, o en una
combinación de cualquiera de dichas posibilidades. A partir de estas curvas se define el
(
)
“efecto sustitución de las características” (ESC) entre un par cualquiera z a , z b , siguiendo
a Delgado y Miles (1997). El ESC muestra la forma en que se sustituye el consumo de un
alimento cuando cambia la característica del hogar, para un nivel dado de ingresos. A su
vez, muestra si tal efecto sustitución va variando entre los diferentes niveles del poder
119
adquisitivo de los hogares. La forma en que esto ocurre, permite al investigador repensar
cómo se puede incluir cierta característica del hogar en un modelo paramétrico, donde la
interacción entre tal característica y el poder adquisitivo puede ser relevante en el modelo
a los fines de una correcta especificación (Fousekis & Lazaridis, 2001).
La elección de las características a incorporar en el vector Z i f va a depender de la
información contenida en la muestra y del interés del investigador, influido en parte por
los resultados encontrados en investigaciones anteriores donde se revela la importancia
de incluir determinadas variables de los hogares. En base a esto, las características
consideradas son: 1) Tamaño y Composición del hogar. Específicamente se toman los
tipos de hogares y la presencia de grupos etarios extremos (menores de 14 y mayores de
65 años). 2) Características del Jefe de Hogar: Género y Edad del mismo29.
Las hipótesis establecidas sobre el efecto de cada variable en las CE, en muchos casos
dependen del modelo económico que se considere como así también del bien particular
estudiado. Para el caso del tamaño del hogar, es bien conocido el “método de Engel” para
las comparaciones de bienestar entre diferentes tipos de hogares. Específicamente, se
toma a la participación del gasto en alimentos como un indicador de bienestar para
comparar hogares de diferentes tamaño y composición, donde una mayor participación
presupuestaria de los alimentos indicaría un menor bienestar del hogar. Engel observó
que para un nivel dado de gasto total del hogar, un mayor tamaño del mismo (i.e. un
aumento de la cantidad de miembros) disminuye el bienestar de los hogares manifestado
en un incremento en la participación del gasto en alimentos. Esta afirmación es conocida
como la segunda ley de Engel (Vernon, 2004: 20). Considerando el modelo de Barten
(1969), para un nivel fijo de ingreso per cápita, la teoría predice que un hogar con mayor
cantidad de miembros debería implicar una mayor participación del gasto en alimentos,
debido a las economías de escala en el consumo de bienes públicos (como ser la vivienda).
Sin embargo, Deaton y Paxson (1998) muestran que los resultados empíricos contradicen
el modelo de Barten, lo que ha generado una serie de controversias intelectuales en el
esfuerzo de resolver la aparente contradicción (Deaton & Paxson, 2003; 1998; Gan &
29
Otras variables socioeconómicas que resultan de interés son el nivel de instrucción y la categoría
ocupacional del Jefe de Hogar. Dado que el presente capítulo se centra más en las características demográficas
de los hogares, no se consideran los ESC para tales variables. Sin embargo son incorporadas en el análisis
semiparamétrico del capítulo 7.
120
Vernon, 2003; Peralli 2008). Dado que las CE estimadas en este capítulo, están basadas en
el (log) del gasto total (y no per cápita), no se podrá testear el modelo de Barten ni las
economías de escala en el consumo de alimentos. De todos modos, el efecto ‘tamaño’ de
los diferentes tipos de hogares será analizado a la luz de tales modelos y hallazgos
empíricos.
Adicionalmente a la composición reflejada en los tipos de hogares, se analiza el efecto de
la presencia de menores de 14 años y de mayores de 65. La presencia de los mismos
puede determinar un cierto patrón de consumo diferenciado, bajo la hipótesis de que tales
grupos etarios tienen diferentes preferencias y necesidades alimenticias (Namie, 2008;
Nørgaard et al., 2007).
Por último se considera el género y la edad del jefe de hogar. Por la definición de jefe de
hogar de la encuesta30, es esperable que las características del mismo influyan en los
patrones de consumo del hogar (Gong et al., 2000)
Lo que resta del presente capítulo se organiza de la siguiente manera: En la próxima
sección se analiza el efecto de los tipos de hogares sobre las CE no paramétricas. Luego en
la sección 6.3 se analizan las diferencias existentes en hogares con o sin miembros de
grupos etarios extremos. Posteriormente se analizan las CE y el efecto sustitución de las
características del jefe/a de hogar. Se culmina en la sección 6.5 con la aplicación de
modelos paramétricos que incluyen los efectos cruzados sugeridos en los análisis de los
ESC, testeando su significatividad estadística.
6.2
Tipos de Hogares
La primera característica de los hogares que se analiza es su tipología, esto es, si el hogar
es unipersonal (tipo 1), nuclear sin hijos (tipo 2), nuclear con hijos (tipo 3) o extendido
(tipo 4). Esta variable categórica representa tanto la estructura del hogar como el tamaño
del mismo, lo que determina de alguna manera la forma de organización del hogar en lo
que hace a la preparación e ingesta de alimentos (García Arancibia et al., 2012; Restrepo y
Maya, 2005; Díaz Méndez y Gómez Benito, 2001). Al analizar el efecto que tiene la
30
Quien toma las decisiones más relevantes o mantiene económicamente al hogar.
121
tipología de los hogares sobre el consumo de alimentos, se debe tener en cuenta que en el
mismo coexisten efectos escala y composición, adicionalmente a factores
culturales
implícitos en determinadas tipologías de hogares (Brown, 2011).
En la Figura 6.1 se presentan las diferentes curvas de Engel de Alimentos y Bebidas según
el tipo de hogar, utilizando estimadores locales lineales y suavizados splines31, con sus
respectivos suavizados óptimos según el criterio GCV. La mayor diferencia en la forma de
la CE se da en el caso de los hogares unipersonales respecto al resto. Específicamente, en
el rango de hogares de menores ingresos, las CE de hogares unipersonales ya no
presentan el tramo positivo, a la vez de que la participación en el gasto total es mayor
respecto a la revelada por los otros tipos de hogares, particularmente al observar la
estimación local lineal. Por su parte, el suavizado spline muestra que la participación en
el gasto total de alimentos es mayor en comparación con los nucleares sin hijos, no así en
hogares nucleares con hijos y extendidos. Dado que los hogares unipersonales
representan los hogares de menor tamaño, este resultado muestra que en el rango de
menores ingresos y para un nivel dado del gasto total, cuando se incrementa el tamaño
del hogar disminuye la participación de los alimentos en el gasto total, lo que no es
compatible con al aprovechamiento de las economías de escala en el consumo de bienes
públicos en el hogar. Sin embargo, para un mismo punto el gasto total, el gasto per cápita
en los hogares nucleares es menor respecto a los unipersonales, por lo tanto no resultan
comparables para el análisis de las predicciones del modelo de Barten.
Por otra parte, se observa que en los hogares unipersonales las necesidades en suplir las
deficiencias alimentarias son menores, por lo que un aumento del ingreso de los mismos
desplaza la participación de los alimentos en el presupuesto, mientras que en hogares
nucleares y extendidos la participación del gasto en alimentos se incrementa hasta
alcanzar un punto a partir del cual comienza a descender para incrementos adicionales en
el ingreso (gasto) total.
31
Estimadores elegidos en base al análisis de la performance de los mismos en el Capítulo 5.
122
Figura 6.1 Curvas de Engel de Alimentos y Bebidas por Tipos de Hogares
Suavizados Spline
0.7
0.7
Polinomios Locales Lineales
0.6
0.3
0.4
w_A
0.5
0.4
0.1
0.1
0.2
0.2
0.3
w_A
Unipersonal
Nuclear sin hijos
Nuclear con hijos
Extendido
0.5
0.6
Unipersonal
Nuclear sin hijos
Nuclear con hijos
Extendido
4
5
6
ln(G)
7
8
4
5
6
7
8
ln(G)
Nota: Para el estimador local lineal, las ventanas óptimas (GCV) son ht1=0.64, ht2=0.66, ht3=0.6 y ht4=1.2. Para
el suavizado spline se tienen los siguientes grados de libertad óptimos: (vt1=4.86; vt2=6.4; vt3=7.3; vt4=5.02).
Fuente: Elaboración Propia
Para rangos intermedios de ingreso, no se observan importantes cambios de la forma de
las CE, aunque sí desplazamientos horizontales. Como es de esperarse, la CE de los
hogares unipersonales está por debajo de los nucleares sin hijos, y ésta, por debajo de los
hogares nucleares con hijos y extendidos. Esto por un lado es esperable puesto que se
refuerzan dos hechos económicos: Por un lado, para un ingreso total dado, existe un
ingreso per capita menor debido al incremento del tamaño del hogar, lo que es compatible
con un menor bienestar de cada miembro (según el método de Engel) y por lo tanto, del
hogar, lo que se refleja en una mayor participación del gasto en alimentos. Por otra parte,
existe el efecto de las economías de escala en el consumo de bienes públicos, como ser la
vivienda, generando un aumento del consumo de bienes privados, como ser los
alimentos. A pesar de que ambas hipótesis resultan plausibles para explicar este
fenómeno empírico, resultan ser contradictorias para responder cuestiones de bienestar
(Deaton y Paxson, 1998: 903).
123
Figura 6.2 Efecto Sustitución de las Características entre Tipos de Hogares (A)
ESC(1,3)
PLL
Spline
-0.10
-0.05
ESC(1,3)
0.00
0.00
PLL
Spline
-0.05
ESC(1,2)
0.05
0.05
ESC(1,2)
4
5
6
7
8
4
5
6
ln(G)
ESC(2,3)
0.00
0.00
PLL
Spline
-0.06
-0.10
-0.08
ESC(2,3)
PLL
Spline
-0.04
-0.02
-0.14 -0.12 -0.10 -0.08 -0.06 -0.04 -0.02
5
6
7
4
8
5
6
ln(G)
ln(G)
ESC(2,4)
ESC(3,4)
7
8
7
8
0.02
0.00
4
0.00
-0.02
PLL
Spline
-0.08
-0.10
-0.06
-0.08
-0.06
ESC(3,4)
-0.04
-0.02
PLL
Spline
-0.04
ESC(1,4)
8
ln(G)
ESC(1,4)
ESC(2,4)
7
4
5
6
7
8
4
5
6
ln(G)
ln(G)
Fuente: Elaboración Propia
124
En la Figura 6.2 se presentan las gráficas de los ESC entre pares de tipos de hogares. Se
puede ver que el efecto sustitución de las características entre los hogares unipersonales y
el resto (ESC(1,2), ESC(1,3) y ESC(1,4)) es relativamente constante para niveles
intermedios del gasto total (desplazamiento vertical de las CE). Esto significa que, para un
nivel dado de gasto total (en el rango intermedio) los hogares unipersonales tienden a
disminuir su gasto en alimentos respecto a hogares con mayor cantidad de miembros. Es
decir, que al aumentar la cantidad de miembros tomando como punto de partida los
hogares unipersonales, existe un proceso de sustitución de otros bienes por alimentos.
Este proceso de sustitución desaparece en los rangos de ingreso muy alto o muy bajo.
Para el caso del ESC (1,2) y el ESC(1,3), que asumen valores positivos en los extremos, se
revela lo contrario. A su vez, para estos dos casos, se observa que aún en el rango
intermedio, el efecto sustitución no es constante, sino que la diferencia (i.e. que la
sustitución de otros bienes por alimentos en hogares con más miembros) va decreciendo
para un mayor poder adquisitivo.
Por otra parte, la curva ESC(2,3) muestra que en los hogares nucleares la incorporación de
un hijo significa sustituir bienes no alimenticios por un mayor consumo (gasto) en
alimentos. Tal sustitución es menor a medida que se incrementa el poder adquisitivo del
hogar. En este caso, la interacción entre los tipos de hogar y el gasto total parece ser más
relevante.
Entre los hogares nucleares sin hijos y los extendidos, también se observa que la
participación de los alimentos en el gasto total es menor para los primeros. Aquí no hay
una tendencia clara del ESC ante cambios en el poder adquisitivo, aunque sí se observa
que en los extremos se acentúa la diferencia entre ambos tipos de hogares.
Por último, entre los hogares nucleares con hijos y los extendidos, la curva ESC oscila en
el eje horizontal (ESC(3,4)=0), con un fuerte descenso en el extremo superior, mostrando
que los hogares extendidos tienden a incrementar el consumo de alimento y disminuir el
de otros bienes, respecto a los hogares nucleares. Esto puede deberse a que en los hogares
extendidos es esperable una mayor cantidad de miembros, y por ende un menor ingreso
per capita. Sin embargo no resulta fácil de dilucidar porque esto se da para los mayores
niveles de gasto total del hogar. Una hipótesis plausible es que el tamaño de los hogares
125
nucleares con hijos con alto poder adquisitivo es relativamente muy pequeño respecto a
los hogares extendidos, donde el ingreso total del hogar puede que venga de varios
perceptores, que a su vez tienen más personas a cargo (p.ej. un hermano del jefe de hogar
con sus descendientes).
Para contar con una medida global de las diferencias existentes entre los tipos de hogares,
se computa el efecto sustitución de las características promedio (ver Capítulo 3),
presentando su valor en la Tabla 6.1 y sus desvíos estándares bootstrap. Adicionalmente
se calcula el efecto (o diferencias) promedio de los tipos de hogares en términos
porcentuales, con el fin de mostrar la variación proporcional de cambio en la CE ante un
cambio en el tipo de hogar. En términos absolutos y relativos (procentuales) los mayores
efectos se dan entre los hogares unipersonales y los nucleares con hijos y extendidos,
donde la participación de alimentos en el gasto total en los hogares unipersonales es en
promedio un 26% inferior.
Tabla 6.1 Efectos/Diferencias Promedios de los tipos de hogares
( i, j )
i,j=1,2,3,4; i<j
(1,2)
PLL
Spline
(1,3)
PLL
Spline
(1,4)
PLL
Spline
(2,3)
PLL
Spline
(2,4)
PLL
Spline
(3,4)
PLL
Spline
ESCP
DE boots
ESCP (Δ%)
-0.0642
-0.0649
0.0074
0.0074
-15.55
-15.71
-0.1109
-0.1116
0.0062
0.0061
-26.45
-26.61
-0.1119
-0.1117
0.0072
0.0070
-25.86
-25.89
-0.0467
-0.0467
0.0052
0.0051
-11.14
-11.13
-0.0477
-0.0467
0.0065
0.0062
-11.02
-10.84
-0.0010
-0.0001
0.0054
0.0054
-0.22
-0.02
Fuente: Elaboración Propia
126
Entre los hogares unipersonales y los nucleares sin hijos, la diferencia es menor al caso
anterior, aunque también resulta relevante. Luego, entre los nucleares sin hijos y los con
hijos o extendidos, la diferencia se apacigua, aunque superando el 10%. Por su parte, entre
los hogares nucleares con hijos y los extendidos la diferencia promedio se aproxima a
cero. En general, los errores estándar bootstrap del ESCP son pequeños, y si con ellos se
construyen intervalos de confianza asintóticos aproximados32, solo el ESCP(3,4) muestra
ser no significativo.
Si bien se optó por mostrar los resultados correspondientes a los dos estimadores no
paramétricos seleccionados, se observa que, tanto en las curvas ESC como en los valores
promedios de la Tabla 6.1, las diferencias entre ambos son mínimas. Dado que el
suavizado spline tiene un mejor comportamiento en los extremos, en lo que sigue se
optará utilizar los resultados de este estimador, salvo en algunos casos donde se
presentan los resultados de ambos para corroborar que no existen diferencias importantes
entre dichos estimadores, en lo que hace a la interpretación el efecto de las características
de los hogares.
Es esperable que al considerar determinados alimentos específicos, el efecto de la
tipología del hogar sobre la asignación del gasto total, tenga sus particularidades más allá
de lo que ocurre al tomar el conjunto de alimentos y bebidas. En la figura 6.3 se presentan
los ESC entre pares de tipos de hogares, estimados usando suavizados spline, para los
cuatro sub-conjuntos de alimentos considerados: productos de panadería, harinas, arroz,
cereales y pastas (A1), carnes (A2), leche y productos lácteos (A3) y verduras, frutas y
legumbres (A4).
Partiendo de los hogares unipersonales, se puede observar que, para los niveles de gasto
total más bajo, este tipo de hogar tiende a asignar un mayor gasto de consumo en
productos lácteos, frutas, legumbres y verduras, y menor en arroz, pastas, productos de
panadería y carne, respecto a los hogares nucleares y extendidos. Este resultado es
relevante para la toma de decisiones de políticas públicas relacionadas con la
alimentación, pues se observa que un mayor tamaño del hogar implica un menor gasto en
32
Como
ser
ESCP ± z α / 2 EE boot (ESCP )
o
bien
utilizando
la
corrección
de
Bonferroni
ESCP ± zα /(2n) EEboot (ESCP) , o utilizando los valores de la distribución t-Student, en lugar de la normal
estándar.
127
frutas, verduras y lácteos (A3 + A4) y más en carnes, arroz y productos basados en
harinas (A1 + A2), lo que puede deberse a que estos últimos son más baratos y permiten
saciar el hambre más rápidamente, adicionalmente a los factores asociados a la cultura
culinaria argentina. No obstante, a partir de los niveles de ingreso medios, los hogares
nucleares y extendidos consumen una mayor proporción de su gasto en los cuatro tipos
de alimentos (A1-A4) que los hogares unipersonales. Dado que para un aumento del
gasto total del hogar, el gasto per cápita de los unipersonales aumenta más que en los otros
tipos de hogares, la sustitución de alimentos por otros tipos de bienes, se realiza más
rápidamente en los primeros. La brecha se apacigua a medida que crece el poder
adquisitivo del hogar, mostrando que la menor diferencia se da para los alimentos A3 y
A4, lo que permite pensar que el consumo por miembro de frutas, verduras y lácteos es
mayor en los hogares unipersonales en comparación al resto.
De la comparación entre los hogares tipo 2 y 3 en los menores tramos de ingreso, se
observa que para los alimentos A4 el efecto escala es similar al análisis anterior, i.e. el
aumento en el tamaño del hogar implica un desplazamiento del presupuesto en frutas,
verduras y legumbres a otro tipo de bienes. No ocurre lo mismo para el caso de leche y
productos lácteos, donde al pasar de un hogar nuclear sin hijos a un hogar nuclear con
hijos, además de haber un efecto escala existe un efecto composición. Considerando que el
consumo de leche y productos lácteos es en general recomendado para los niños más
pequeños, con la existencia de los mismos en el hogar (entre los hijos), es esperable un
mayor consumo de tales productos. El efecto de los menores será visto con más detalle en
la próxima sección. Adicionalmente en los hogares de menores recursos, se observa una
brecha importante en el consumo de arroz, pasta, cereales y productos de panadería,
siendo mayor en los nucleares con hijos. A medida que crece el poder adquisitivo, las
diferencia entre ambos tipos de hogares son menores, observándose que un hijo implica
sustituir o posponer el consumo de otros bienes a favor de los alimentos.
Entre los hogares nucleares sin hijos, y los extendidos, las conclusiones son muy similares
a las anteriores. Esto es compatible con las pocas diferencias que se observan entre los
nucleares con hijos y los extendidos.
128
Figura 6.3 Efecto Sustitución de las Características. Alimentos Particulares (A1-A4)
ESC(1,2)
ESC(1,3)
0.05
0.05
A4
A3
A4
0.00
ESC(1,3)
-0.05
-0.05
ESC(1,2)
0.00
A3
A2
A2
A1
A1
5
6
7
8
5
6
ln(G)
7
ln(G)
ESC(2,3)
0.05
ESC(1,4)
0.05
8
A3
A3
A4
0.00
A2
-0.05
ESC(2,3)
0.00
-0.05
ESC(1,4)
A4
A2
A1
5
A1
6
7
4.5
8
5.0
5.5
6.0
7.5
8.0
ESC(3,4)
0.05
0.05
ESC(2,4)
A3
A2
0.00
A4
A1
-0.05
ESC(3,4)
0.00
A3
-0.05
ESC(2,4)
7.0
ln(G)
ln(G)
A4
6.5
A2
A1
4.5
5.0
5.5
6.0
6.5
7.0
7.5
8.0
4.5
5.0
5.5
6.0
6.5
7.0
7.5
8.0
ln(G)
ln(G)
Fuente: Elaboración Propia
129
Para los sub-conjuntos de alimentos específicos se tiene que ESC muestra una relación
más clara con el logaritmo del gasto total. Particularmente, al comparar los unipersonales
con el resto, más variaciones se observan en la curva ESC, más allá de los sobresaltos que
el estimador pueda tener en el extremo inferior de ingresos. Esto sugiere que en una
especificación paramétrica, si se incorporan los tipos de hogares por medio de variables
dummies, tomando al hogar unipersonal como hogar base, una especificación correcta
podría requerir la incorporación de las mismas más el efecto interacción con el gasto total.
Esto se chequeará al final del capítulo.
6.3
Presencia de Menores y Adultos Mayores
Una característica comúnmente muy relevante en los estudios de consumo y demanda del
hogar, es la presencia de niños en el mismo, lo cual puede tener un influencia crucial en la
elección del consumo de alimentos y bebidas en el hogar (García Arancibia, R., 2012;
Namie, 2008; Nørgaard et al., 2007, entre otros). De la información disponible en la
encuesta, se tiene una variable que cuenta la cantidad de menores de 14 años en cada
hogar. Con la misma se construye una variable dicotómica que indica la presencia o
ausencia de menores en el hogar, y si estiman las CE m f (x ) , con f =0,1, donde 0 indica la
ausencia de menores y 1 la presencia de al menos un menor de 14 años. A su vez, esta
variable categórica se define para los tipos de hogar 3 y 4 (nucleares con hijos y
extendidos), puesto que en los tipos 1 y 2 no hay menores. De esta manera, se analiza el
efecto de menores en hogares donde es probable la presencia de ellos. Del total de 5438
hogares (válidos) en la muestra de tipo 3 y 4, 2050 son hogares sin menores, mientras que
en 3338 hay al menos un menor de 14 años.
En la figura 6.4 se presentan las gráficas de las estimaciones de las CE y del ESC en el
consumo de alimentos. Se observa que para un nivel dado del gasto total, la presencia de
al menos un menor de 14 años genera un incremento en el gasto en alimentos y una
disminución en el consumo de otros bienes. Si bien aquí puede existir un efecto escala, no
se revela claramente, pues en la comparación de hogares con y sin menores existe la
posibilidad de que los mismos tengan igual cantidad de miembros. Si este fuera el caso,
los resultados empíricos contradicen el modelo de Barten, puesto que la sustitución de
130
menores por adultos disminuiría el tamaño efectivo del hogar, lo que implicaría un
incremento en los ingresos per cápita y con ello una reducción en el presupuesto de los
bienes necesarios (Deaton y Paxson, 1998: 902). Sin embargo, este resultado podría
mostrar que, principalmente para los hogares de menores recursos, los requerimientos
alimenticios en lo que hace a la calidad de los mismos, podrían ser mayores, lo que
significaría un mayor costo en la compra, y por ende, un mayor destino del presupuesto
en alimentos.
Figura 6.4 Efectos de la presencia de Menores en el Hogar en el Consumo de Alimentos y
Bebidas (A)
ESC
4
5
6
ln(G)
7
8
0.10
0.08
0.06
0.04
0.02
0.00
0.4
0.1
0.2
0.3
w_A
0.5
0.6
Hogares sin menores de 14
Hogares con menores de 14
ESC(Hogar con Menores - Hogar sin Menores)
0.7
CE
4
5
6
7
8
ln(G)
Nota: vs/menores=6.26; vc/menores=9.4 (g.l. de los estimadores). Fuente: Elaboración Propia
En las gráficas anteriores se observa claramente que el ESC de la presencia de menores,
lejos de ser independiente del nivel de gasto total, muestra una clara relación negativa.
Para los hogares de mayores ingresos, la presencia de un menor no altera los patrones de
asignación del gasto en alimentos. El ESC promedio (ESCP) es de 0.033, lo que equivale a
un aumento promedio del 8.25% en la participación del gasto de alimentos ante la
incorporación de un menor en el hogar. La mayor diferencia se presenta para los hogares
de menores recursos, siendo aproximadamente del 15% (0.1/0.65). Por lo tanto, si bien la
presencia de los menores en el hogar modifica la asignación del gasto, se observan
mayores efectos en los cambios de los tipos de hogares (Tabla 6.1). Pero por otra parte, en
131
este caso se tiene una clara interacción entre el poder adquisitivo y la presencia de
menores, no así para los diferentes tipos de hogares33.
En el consumo de los alimentos específicos A1-A4 (Figura 6.5), el efecto de la presencia de
menores y su comportamiento para diferentes niveles del gasto total, es menor al
encontrado en el total de alimentos. Las mayores diferencias se encuentran en los
productos de panadería, arroz y pastas (A1) y en los productos lácteos (A3). Para ambos
se observa que la presencia de un menor implica un aumento en el gasto de ambos
productos, sustituyéndolos por otros tipos. Para mayores niveles de ingreso, las
diferencias van decreciendo. Para las legumbres, frutas y verduras (A4) y las carnes (A2),
el ESC muestra un comportamiento más errático alrededor de cero. Sin embargo, en
hogares de menores ingresos, se observa que la presencia de un menor incrementa el
gasto en dichos bienes, para un nivel dado de gasto total.
0.06
0.04
A1
0.00
0.02
A3
A2
-0.02
ESC(Hogar con Menores - Hogar sin Menores)
Figura 6.5 Efectos Sustitución de las Características. Presencia de Menores en el Hogar.
Subconjuntos de Alimentos A1-A4
5
6
A4
7
8
ln(G)
Fuente: Elaboración Propia
33
Esto ocurre cuando se está analizando el caso del total de alimentos y bebidas (A) puesto que para los
subconjuntos específicos (A1-A4) se notó que algunas interacciones del ESC con el gasto total que podrían
ser relevantes.
132
Otra característica del hogar, que hace a la composición del mismo y que influye en los
patrones de consumo del hogar es la presencia de adultos mayores. Algunos trabajos
muestran que en general el envejecimiento se relaciona con una alimentación más
saludable (Lefèbvre, 2006), aunque en lo individual tal resultado depende de la posición
socioeconómica del adulto mayor y/o de su familia (Wiemer, 1998; Jensen, 2004;
Rodríguez Escobar, 2005). A su vez, algunos estudios han mostrado que en aquellos
hogares con personas de mayor edad, se consumen más alimentos elaborados en el hogar
que fuera del mismo, justificado por la sustitución de las horas laborales en horas de
trabajo doméstico (Wang et al, 1995). Sin embargo, en ciertos sectores de la sociedad, una
pareja de adultos mayores puede tener mayor estabilidad económica que una joven, y por
lo tanto una mayor participación en el consumo los alimentos fuera del hogar (Yen et al.,
2012). Esto, a su vez, depende de las circunstancias en las cuales se consume, sea en horas
esparcimiento o de trabajo o estudio (García Arancibia, 2012).
Dada la información de la ENGH, se toma la variable que mide la cantidad de personas
mayores a 65 años, construyendo una variable dicotómica para indicar la presencia o
ausencia de los mismos en el hogar. La figura 4.5 presenta las CE y el ESC, donde se
aprecia un claro cambio en el signo del efecto sustitución del adulto mayor.
Figura 6.6 Efectos de la Presencia de los Adultos Mayores en el Hogar en el Consumo de
Alimentos y Bebidas (A)
ESC
4
5
6
ln(G)
7
8
0.06
0.04
0.02
0.00
-0.02
-0.04
0.4
0.3
0.2
0.1
w_A
0.5
0.6
Hogares sin mayores de 65
Hogares con mayores de 65
ESC(Hogar con Adultos Mayores - Hogar sin Altos Mayores)
0.7
CE
5
6
7
8
ln(G)
Nota: vsin mayores=7.06; vcon mayores=5.4 (g.l. de los estimadores). Fuente: Elaboración Propia
133
En los hogares con menor poder adquisitivo, la presencia de un adulto mayor se
corresponde con un menor destino del presupuesto en el gasto de alimentos, mientras que
en los hogares de mayor ingreso, para un gasto total dado, los alimentos tienen una
mayor participación del mismo. Esto significa, ceteris paribus, una menor cantidad y/o
calidad de los alimentos en los hogares pobres con adulto/s mayor/es, por lo que se
corresponde con los resultados hallados en investigaciones que apuntan a dilucidar las
problemáticas alimentarias de los adultos mayores que viven en condiciones de pobreza.
Sin embargo, para sacar conclusiones más robustas habría que desglosar el efecto
cruzando con otras variables, como ser el tipo de hogar, para tener en cuenta el efecto
tamaño y la estructura familiar del mismo. Sin embargo, las diferencias máximas son del
orden del 0.05, lo que equivale a 9% en los hogares más pobres y a un 14% en los de
mayores ingresos, por lo que no parece ser tan fuerte el impacto del adulto mayor. Por su
parte, el ESCP es de -0.009 (con DE boot=0.0074), por lo que difícilmente resulte
estadísticamente significativo.
La figura 6.7 muestra el efecto sustitución de los adultos mayores en el consumo de los
alimentos específicos A1-A4. De la misma se puede observar que los hogares con al menos
un adulto mayor tienden a incrementar su consumo en legumbres, frutas y verduras y a
disminuir las compras de carne, productos de panadería, harinas, pastas y arroz. Para el
caso de la leche y los productos lácteos (A4), se observa que para niveles muy bajos de
gasto total, los hogares con adultos mayores tienden a incrementar el consumo de los
mismos. Sin embargo, para niveles mayores del gasto total el ESC para tales productos va
fluctuando alrededor del eje cero. De la gráfica también puede verse que la interacción
con el gasto total es más pronunciada para los alimentos A1 y A2, mostrando un cambio
del signo del ESC para los niveles mayores del gasto total, lo que indicaría que, en dicho
rango de ingresos, los hogares con adultos mayores destinan una mayor parte de su
presupuesto en los bienes que componen las canastas A1 y A2. Dicho cambio del efecto de
la característica, podría deberse a la posibilidad de adquirir productos de mayor calidad,
y con ello, probablemente más saludables. Tal consideración se puede hacer debido a la
amplitud de calidades que pueden existir en los conjuntos de alimentos considerados,
particularmente dentro de la categoría de carnes (A2). A su vez, en general, para los
hogares de mayores ingresos, la presencia de al menos un adulto mayor incrementa el
134
gasto en los cuatro tipo de alimentos. Esto es consistente para un hogar donde, gran parte
de las necesidades están cubiertas y existe tiempo disponible para el disfrute del placer
culinario, sea dentro o fuera del hogar, lo que se daría en el caso de que el o los adultos
mayores tengan un rol activo (o principal) en el hogar.
0.04
0.02
A3
0.00
A4
-0.02
A1
A2
-0.04
ESC(Hogar con Ad. May. - Hogar sin Ad. May.)
Figura 6.7 Efectos Sustitución de las Características. Presencia de Adultos Mayores en el
Hogar. Subconjuntos de Alimentos A1-A4
5
6
7
8
ln(G)
Fuente: Elaboración Propia
6.4
Características del Jefe de Hogar
Bajo el supuesto de que el jefe o jefa del hogar es quien toma las decisiones más relevante
en el hogar, y en particular en lo que hace al destino del ingreso en las diferentes partidas
del consumo, es de esperarse que sus características influyan en los patrones de consumo
de alimentos y otros bienes. En particular, el género y la edad del jefe de hogar han
mostrado tener influencia estadísticamente significativa en los estudios empíricos de
demanda ( Rossini et al., 2008; García Arancibia, 2012 entre otros). Por ello se eligen estas
dos características para analizar sus efectos sobre las curvas de Engel y los patrones de
consumo de alimentos.
135
6.4.1 Género
En cuanto al género, las diferencias en los patrones de consumo están fundadas en el uso
34
del tiempo y la división del trabajo doméstico . En general, la sociedad ha aceptado a la
producción y el empleo como un espacio masculino, mientras que las cargas domésticas y
actividades familiares, incluyendo “el consumo” han formado parte del ámbito femenino
(Depetris Guiguet y García Arancibia, 2011; Borrás Catalá, 2007). Por ello, el género del
jefe de hogar poco puede decirnos sobre los patrones de consumo en aquellos hogares
nucleares, puesto que si el jefe varón es considerado como tal por su aporte con sus
ingresos laborales, es probable que las decisiones de consumo las realice su cónyuge
dentro del ámbito de las tareas domésticas. Herrero Zamora (2010) muestra que para el
caso de las Encuestas Permanentes de Hogares (EPH) del INDEC, el reconocimiento de
Jefa de hogar está muy condicionado a la participación de la mujer en el mercado laboral
y al (mayor) aporte económico que realiza al hogar. Adicionalmente muestra que con la
presencia de un adulto varón en el hogar es poco probable que haya jefatura femenina. A
su vez, García Arancibia y otros (2011) muestran que para el caso de las Encuestas de
Gastos de Hogares (ENGH), en hogares nucleares con cónyugue es poco probable que las
mujeres sean reconocidas como jefas. En los hogares unipersonales, claro está, la jefatura
determina quien realiza las decisiones de consumo del hogar. A su vez, en hogares
nucleares con hijos pero sin cónyuge, predominan aquéllos con jefatura femenina. Por lo
tanto, resulta plausible suponer que cuando la jefatura del hogar está presidida por una
mujer, las decisiones de consumo son realizadas por la misma, mientras que si el jefe es
varón, más allá de quien tome efectivamente las decisiones de alimentación, existe un
‘sesgo de masculinidad’.
En la muestra, del total de hogares, en el 75% de los hogares (nh=5662), los jefes son
hombres, mientas que en el 25% restante (nm=1930) son mujeres.
En la figura 6.8 se presentan los suavizados spline de las CE diferenciadas por el género
del jefe/a de hogar y la curva correspondiente del ESC. Se observa que las mayores
diferencias se presentan en los hogares de menores recursos. Luego en el rango de
ingresos medios, se observa una diferencia similar a un desplazamiento paralelo,
Para lectura comprensiva sobre la diferencias de género y al distribución del trabajo doméstico
ver Treas y Drobnic (2010)
34
136
cerrándose la brecha cuando se alcanzan los mayores niveles de gasto total. En general,
para un nivel fijo de gasto total, un hogar con jefe varón destina una mayor parte de su
presupuesto al consumo de alimentos. Esto puede deberse a que, como se señalo
anteriormente, entre los hogares con jefatura femenina predominan los unipersonales y
aquellos nucleares con hijos con madres solteras, viudas o separadas. Por lo tanto, puede
que en los hogares con jefatura femenina, para un mismo nivel de ingreso total, el ingreso
por miembro sea mayor, y con ello una CE desplazada hacia a la izquierda.
Figura 6.8 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos.
Estimador Spline
ESC
0.7
CE
0.05
ESC(H,M)
0.4
0.1
0.00
0.2
0.3
w_A
0.5
0.10
0.6
JMujer
JHombre
4
5
6
7
ln(G)
8
4
5
6
7
8
ln(G)
Nota: vmujer=5.66; vhombre=5.8 . Fuente: Elaboración Propia
En los hogares de menor poder adquisitivo, además de encontrar la mayor diferencia
‘vertical’, se observa un cambio en la forma de la CE. Mientras que en los hogares con
jefatura masculina, la CE tiene pendiente negativa (aunque muy leve), en hogares con
jefatura femenina la CE es creciente respecto al gasto total, característica que fue
encontrada en las estimaciones de las CE para el caso general. De acuerdo a las hipótesis
anteriormente establecidas, en los hogares pobres con jefa mujer, existe una tendencia a
incrementar la participación de los alimentos en el presupuesto, ante incrementos
adicionales del ingreso, sea por aumento en la cantidad o calidad de los productos
137
alimenticios. Para el caso de los hogares con jefe varón es probable que esto también
ocurra, aunque en menor medida, puesto que la CE es casi plana. Por otra parte, si se
compara con el estimador local lineal (Figura 6.9), se observa que independientemente del
género del jefe de hogar, existe una CE con pendiente positiva en los hogares con menor
gasto total. Más allá de esta distinción, ambos estimadores muestran una CE y una ESC
muy similares.
Figura 6.9 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos.
Estimador Local Lineal
ESC
0.7
CE
0.05
ESC(H,M)
0.4
0.1
0.00
0.2
0.3
w_A
0.5
0.10
0.6
JMujer
JHombre
4
5
6
7
ln(G)
8
4
5
6
7
8
ln(G)
Nota: vmujer=5.94; vhombre=5.79 . Fuente: Elaboración Propia
Si bien el ESC es decreciente respecto al gasto total, se observa que en el rango medio de
ingresos se mantiene relativamente constante, dando una pauta de que el efecto
interacción de la característica con el gasto total no termina siendo demasiado relevante.
Para los conjuntos de bienes A1-A4, las curvas ESC del género del jefe/a de hogar se
presentan en la figura 6.10, estimados por medio de suavizados spline. De la misma se
observa que cuando el jefe de hogar es hombre se tiende a aumentar el consumo de carnes
y productos de panadería, harina, arroz y pastas, respecto a los hogares con jefa mujer. A
su vez, nuevamente se detectan las mayores diferencias en el extremo inferior del gasto
total. En dicho intervalo se observa que los hogares con jefatura femenina tienden a
138
sustituir el consumo de carnes y harinas por legumbres, frutas, verduras y lácteos. Esto
resulta razonable dado que en promedio la mujer tiende a cuidarse mejor en la
alimentación ya sea por cuestiones estéticas, de salud o culturales, lo que en definitiva son
explicadas por diferencias de género (entendido como una construcción social).
0.06
0.04
A2
0.02
A1
0.00
ESC(H,M)
0.08
Figura 6.10 Efectos del Género del Jefe/a de Hogar en el Consumo de Alimentos A1-A4
-0.04
-0.02
A4
A3
5
6
7
8
ln(G)
Fuente: Elaboración Propia
6.4.2 Edad
La edad del jefe de hogar es otra característica que generalmente afecta los patrones de
consumo, y en general, un argumento sencillo para explicar las diferencias reveladas,
viene dado porque entre generaciones suelen expresarse divergencias en gustos y
preferencias.
En la base de datos de la ENGH, se tiene que la variable edad del jefe es continua, pero
para el análisis presente es necesario categorizarla, y en particular es deseable la creación
de una variable binaria para simplificar el análisis. Por lo tanto, hay que elegir algún
criterio para realizar el corte en la muestra, y así estimar las CE de las sub-muestras y con
ello el ESC. En general, se busca captar un cambio de generación o bien un salto de la
139
diferente situación socioeconómica del jefe o jefa. Considerando el ingreso total del hogar,
la estimación de la relación entre la edad del jefe y el ingreso, muestra que el mismo crece
hasta que la edad del jefe alcanza aproximadamente los 45 años, y a partir de allí, el
ingreso total del hogar comienza a decrecer. En base a esto, dividimos la muestra entre
aquellos hogares cuya edad del jefe/a es menor a 45 años (n-45=3186) y por otro lado los
hogares con jefes/as mayores de 45 (n+45=4106), incluyendo en este último grupo a aquellos
que tienen exactamente 45 años de edad.
800
400
600
Ingreso
1000
1200
Figura 6.11 Relación entre la Edad del Jefe de Hogar e Ingresos Totales (Suavizado Spline)
20
40
60
80
Edad
Fuente: Elaboración Propia
Las curvas de Engel y el ESC (Figura 6.12) muestran que para niveles inferiores al gasto
total medio, los hogares ‘jóvenes’ destinan mayor parte de su presupuesto en alimentos
que los hogares cuyo jefe/a tiene más de 45 años. Esto se revierte en los hogares con
mayor poder adquisitivo, donde al incrementarse la edad del jefe de hogar hay una
sustitución a favor del consumo de alimentos. Para los niveles mayores de gasto total, es
probable que en los hogares con jefe más joven existan ciertos bienes aún no adquiridos (a
contraposición de hogares con jefes/as de mayor edad) por lo que se elige sustituir el
consumo de alimentos a favor de otros tipos de bienes (como ser, en equipamiento del
hogar, vivienda u otros bienes durables).
140
Dado que en los hogares con jefes más jóvenes es más probable que los hijos tengan
menos de 14 años (considerando los hogares nucleares con hijos y los extendidos), este
resultado se corresponde con el hallado anteriormente sobre el efecto de la presencia de
menores. Del mismo modo, el efecto es muy similar al de la presencia de adultos mayores,
por lo que algunas conclusiones son similares.
Figura 6.12 Efectos de la Edad del Jefe/a de Hogar en el Consumo de Alimentos
ESC
0.04
0.7
CE
0.1
0.00
-0.08
0.2
-0.06
-0.04
-0.02
ESC(+45,-45)
0.4
0.3
w_A
0.5
0.02
0.6
j_edad< 45
jedad>=45
4
5
6
ln(G)
7
8
5
6
7
8
ln(G)
Nota: v jedad< 45 = 7; v jedad>= 45 = 6.37 . Fuente: Elaboración Propia
La figura 6.13 muestra que en los hogares que tienen un menor gasto total, los hogares
con jefes/as mayores de 45 años tienden a disminuir el consumo de productos basados en
harinas, cereales y arroz (A1), en carnes (A3) y en lácteos (A3), y a incrementar el
consumo de legumbres, frutas y verduras (A4). En general para todo nivel de ingreso
(gasto total), la mayor edad del jefe tiene un efecto positivo sobre el consumo de alimentos
del conjunto A4. Por el contrario, en el consumo de carnes (A3) el signo del ESC pasa de
ser negativo a positivo a partir del gasto total medio, mostrando que un efecto positivo
entre la edad del jefe y la participación presupuestaria del gasto en todo tipo carnes. En el
mismo intervalo de ingresos/gastos, se observa que no existen diferencias en la asignación
del gasto en A3 y A1 entre los tipos de hogares definidos por la edad del jefe/a.
141
El efecto interacción con el gasto total es más relevante para los alimentos A1 y A2. Para
los lácteos se observa una pequeña diferencia de pasar de los hogares más pobres a los de
ingresos medios, a partir del cual se estabiliza. Para las verduras, legumbres y frutas,
prácticamente no se observa interacción con el gasto total, a pesar de la diferencia
revelada en el extremo inferior.
0.04
Figura 6.13 Efectos del Edad del Jefe/a de Hogar en el Consumo de Alimentos A1-A4
A3
0.00
-0.02
ESC(+45,-45)
0.02
A4
-0.04
A1
A2
5
6
7
8
ln(G)
Fuente: Elaboración Propia
6.5
Incorporación de las Interacciones
Del análisis no paramétrico surgieron algunos aspectos para ser tenidos en cuenta en las
especificaciones paramétricas, a partir de los cambios de las CE antes las diferentes
características, y con ello, del comportamiento de las curvas ESC. En algunos casos, los
cambios en las características sugieren un simple desplazamiento de la CE, por lo que tal
efecto puede agregarse mediante la incorporación de una variable dummy de la
característica, en forma aditiva. Esto significa que el ESC es constante e independiente del
gasto total. Sin embargo, en otros casos se observaron cambios en la forma de las CE,
planteando la posibilidad de la incorporación del efecto interacción con el poder
142
adquisitivo del hogar (medido a través del gasto total). En general, en los estudios
econométricos de consumo y demanda, tales interacciones no son incluidas debido a que
complican la interpretación de los resultados, a la vez de que no existen requerimientos
teóricos que impongan las mismas. Sin embargo, la omisión de las mismas trae aparejado
una especificación incorrecta (Fousekis y Lazaridis, 2001). El objetivo de este apartado es
analizar la incorporación de los efectos interacción, a partir del estudio de la derivada
promedio del ESC ( d ESC ), acompañado de la inspección visual de las gráficas anteriores y
estudiando su significancia en especificaciones paramétricas.
En el capítulo metodológico (Capítulo 3, pág. 62) se presentó la forma de computar la
derivada promedio de las funciones ESC. La misma viene dada por
d ESC (a, b ) ≡ ∫
dESC a ,b ( x )
pˆ ( x )dx
dx
(6.1)
Donde p̂(x ) es una estimación de la densidad del logaritmo del gasto total. La forma (6.1)
es estimada para una determinada grilla fija del gasto total, de la misma forma que se
estiman las funciones ESC. Una vez computada la d ESC entre dos características, se desea
saber si la misma es significativa o no. Es decir que, en términos gráficos, se desea conocer
si la curva ESC es casi plana (lo que se corresponde con un simple desplazamiento de la
CE) o muestra una pendiente significativa, indicando con ello la interacción con el gasto
total. Por ello, se estiman los errores estándar bootstrap (usando, como siempre, la técnica
wild bootstrap) y se construyen intervalos de confianza simples, de la forma
[dˆ ESC − sboot z1−α / 2 , dˆ ESC + sboot z1−α / 2 ] (MacKinnon, 2006: S11), a los efectos de verificar si el
valor cero (de ‘pendiente’) está o no incluido en los mismos.
Adicionalmente al estudio de la derivada de las curvas ESC, los efectos interacción son
incluidos en una simple especificación paramétrica, testeando su significatividad
estadística. La especificación paramétrica general que adoptan las CE, considerando sólo
las características demográficas de los hogares y sus interacciones, puede escribirse de la
siguiente manera
wi = θ o + ∑ γ j z ij + ∑ θ k (ln Gi ) + ∑ δ j z ij ln Gi + ξ ij
k
j
k >0
(6.2)
k
143
Donde w i es la participación en el gasto total del hogar i que tiene el bien en cuestión (los
alimentos o un conjunto de estos) y
hogar i. Los parámetros γ
j
z ij representa la característica demográfica j del
y δ j corresponden a los efectos directos de las características
y de sus interacciones con el gasto total, respectivamente. La especificación paramétrica
elegida depende el exponente k (en relación al logaritmo del gasto total). En el capítulo
anterior se vio que en algunos casos, la mejor opción es k=3, mientras que en otros un k=2,
e incluso, para el caso de los alimentos A2, un k=1 puede proporcionar un buen ajuste.
En las secciones anteriores del presente capítulo, para la estimación de las CE y de los ESC
correspondientes, algunas características se categorizaron. La cantidad de miembros
menores y mayores de 65 años, se resumió en una variable binaria para indicar la
presencia o ausencia de los mismos. También la edad del jefe/a de hogar se dicotomizó a
los efectos de simplificar el análisis. En las estimaciones que a continuación se presentan,
se toman tales características en su forma original, esto es: cantidad de menores de 14
años, cantidad de mayores de 65 años y edad (en años) del jefe/a de hogar. Los tipos de
hogar y el género del jefe/a de hogar, al ser en su origen categóricas, mantienen su forma.
En la elección de las interacciones a incluir en (6.1), deben tenerse en cuenta sólo las más
relevantes en términos estadísticos, puesto que las mismas terminan impactando sobre la
elasticidad-gasto, y no es deseable complicar su cómputo de forma innecesaria.
En la Tabla 6.2 se presentan los resultados del análisis de la “pendiente” promedio de las
curvas ESC para el caso del consumo total de alimentos y bebidas. En primer lugar se
observa que entre los tipos de hogares, a la vez que las derivadas medias son pequeñas,
resultan no significativas. Los mayores efectos interacción (interpretados aquí a partir de
la derivada promedio del ESC) se dan entre los hogares unipersonales y nucleares sin
hijos, y entre los nucleares (con y sin hijos). Esto se condice con la inspección gráfica
(Figura 6.2), donde se resaltó que más allá de lo ocurrido en los extremos, los ESC revelan
desplazamientos ‘paralelos’ de las CE.
144
Tabla 6.2 Efecto Interacción de las Características Demográficas con el Gasto Total.
Derivada Promedio del ESC. Alimentos (A)
Características
(a,b)
d ESC (a, b )
DE boots
Tipos de Hogar
(1,2)
0.0005
0.0105
0.0210
-0.0200
(1,3)
0.0046
0.0086
0.0214
-0.0122
(1,4)
0.0008
0.0107
0.0217
-0.0202
(2,3)
0.0041
0.0074
0.0186
-0.0105
(2,4)
0.0003
0.0093
0.0186
-0.0180
(3,4)
-0.0038
0.0076
0.0111
-0.0187
Composición Etaria
(c/me14,s/me14)
-0.0223
0.0061
-0.0103
-0.0342
(c/ma65,s/ma65)
0.0297
0.0061
0.0416
0.0178
Jefe de Hogar
(H,M)
-0.0155
0.0061
-0.0036
-0.0274
(+45,-45)
0.0269
0.0052
0.0371
0.0167
IC 95% (boot-normal)
Fuente: Elaboración propia
Respecto a la presencia de menores de 14 años y mayores de 65, se observa que el
intervalo de confianza no incluye al cero. Esto se confirma al observar las Figuras 6.4 y 6.6,
las que muestran una clara relación entre el gasto total y el efecto de la presencia de los
menores y de adultos mayores en el hogar. También las características del jefe/a de hogar
resultan estadísticamente significativas. Por lo tanto, los resultados sugieren incorporar
las interacciones de la composición etaria y de las características del jefe/a, con el gasto
total. Ahora cabe preguntarse qué ocurre con su incorporación paramétrica.
La Tabla 6.3 muestra tres variantes del modelo (6.1) aplicado al consumo de alimentos y
bebidas (A), estimado por mínimos cuadrados ordinarios (MCO)35. En todos los casos se
usa una especificación cúbica, teniendo en cuenta las consideraciones realizadas en el
Capítulo 5.
35
La notación y descripción de las variables se realizan en el Capítulo 4.
145
Tabla 6.3 Comparación Modelos Paramétricos. Estimación MCO. Alimentos (A)
Variables
intercepto
Jedad
Jgenero
menor14
mayor65
tipo2
tipo3
tipo4
lnG
lnG2
lnG3
Modelo sin
Interacción
Modelo
Full
Modelo
Seleccionado
-2.44***
(0.5)
0.002***
(0.0002)
0.05***
(0.0044)
0.025***
(0.0016)
-0.015***
(0.004)
-0.043***
(0.007)
0.081***
(0.0059)
0.09***
(0.007)
1.58***
(0.243)
-0.274***
(0.039)
0.015***
(0.002)
-2.37 ***
(0.52)
0.002
(0.0014)
0.12***
(0.023)
0.065***
(0.014)
-0.074**
(0.035)
0.0004
(0.059)
0.046
(0.052)
0.059
(0.058)
1.533***
(0.025)
-0.268***
(0.039)
0.014***
(0.002)
-0.00001
(0.0002)
-0.011*
(0.006)
-0.006***
(0.002)
0.009**
(0.006)
-0.0066
(0.009)
-0.005
(0.008)
0.0046
(0.009)
-2.29***
(0.499)
0.002***
(0.0002)
0.113***
(0.035)
0.063***
(0.0121)
-0.074***
(0.025)
-0.039***
(0.007)
0.038 ***
(0.006)
0.047***
(0.0065)
1.502***
(0.244)
-0.264***
(0.039)
0.014***
(0.002)
jedad*lnG
Jgenero*lnG
menor14*lnG
mayor65*lnG
tipo2*lnG
tipo3*lnG
tipo4*lnG
-0.01*
(0.005)
-0.006***
(0.0019)
0.009 **
(0.004)
R2
0.318
0.321
0.321
F
354.6
210.8
273.3
Notas: Errores estándar entre paréntesis.***significativo al 1%; **significativo al 5%; * significativo al 10%. Tipo
de hogar base: tipo 2, nuclear sin hijos. Fuente: Elaboración propia
Por un lado, el modelo sin interacción muestra que todas las variables demográficas
incluidas, como así también los coeficientes de logaritmo del gasto total, son
146
estadísticamente significativos a un nivel del 1%. En la segunda columna se muestran los
resultados del modelo “Full” que incluye todas las interacciones dobles con el logaritmo
del gasto total36. En este caso, las tres variables binarias que representan los tipos de
hogares (tomando el tipo 1 como base) ya no son estadísticamente significativas, como
tampoco la edad del jefe/a de hogar. Respecto a la interacción con el gasto total, sólo el
género y la cantidad de miembros menores, y de adultos mayores, resultan
estadísticamente significativas. En este caso, contrariamente a lo revelado en la Tabla 6.3,
la interacción con la edad no es significativa. Sin embargo debe tenerse en cuenta que la
variable jedad es una variable continua que mide la cantidad de años del jefe/a de hogar,
mientras que en el ESC(+45,-45) se está considerando a la edad como una variable binaria
con el objetivo de simplificar el análisis gráfico. Más allá de esta divergencia, se tiene una
gran coincidencia entre lo revelado a partir del análisis de la derivada promedio del
“efecto sustitución de las características”, con los resultados de las pruebas de
significancia de los parámetros correspondientes a las interacciones en un modelo
puramente paramétrico. Asimismo, existe bastante correspondencia entre el análisis del
ESC como de su promedio, y del efecto de tal característica una vez que es incorporada de
manera paramétrica.
Adicionalmente, los análisis del ESCP y de la derivada d ESC
brindan pautas para incorporar las dummies de algunas características y de su interacción
con el gasto total. Verbigracia, en el caso del tipo de hogares, se toma como base el tipo 1,
puesto que entre éste y el resto se observan los mayores desplazamientos promedios de
las CE (Tabla 6.1). A su vez, al comparar con el tipo 3, se tiene la mayor interacción
promedio, captado con la incorporación paramétrica de la variable tipo3*lnG 37.
En la Tabla 6.4 se presentan las derivadas promedios del ESC, con sus desvíos estándares
bootstrap y los correspondientes intervalos de confianza, para los subjoncuntos
específicos de alimentos A1-A4.
36
También es posible incluir otro tipo de interacciones dobles, como ser entre la edad y el género, o bien
interacciones de orden mayor. Se probaron un par de tiradas incluyendo algunas de ellas, sin embargo, en su
mayoría no resultaron ser significativas.
37 Notar que de la manera en que está definidas las variables tipoj (j=1,2,3,4), no es posible realizar todas las
comparaciones directas de a pares, una vez que se especifica el tipo de hogar base, ni de las interacciones. Sin
embargo, lo mismo puede realizarse mediante la diferencia de los coeficientes estimados.
147
Tabla 6.4 Efecto Interacción de las Características Demográficas con el Gasto Total.
Derivada Promedio del ESC. Alimentos A1-A4
Alimentos
Características
(a,b)
d ESC (a, b )
DE boots
(1,2)
0.0032
0.0038
0.0107
-0.0042
(1,3)
0.0085
0.0026
0.0135
0.0034
(1,4)
0.0106
0.0037
0.0178
0.0034
(2,3)
0.0052
0.0033
0.0118
-0.0013
(2,4)
0.0074
0.0041
0.0153
-0.0006
(3,4)
0.0022
0.0028
0.0077
-0.0033
(c/me14,s/me14)
-0.0097
0.0022
-0.0053
-0.0141
(c/ma65,s/ma65)
0.0090
0.0020
0.0130
0.0050
IC 95% (boot-normal)
A1
(H,M)
-0.0036
0.0020
- 0.001
-0.0075
(+45,-45)
0.0100
0.0019
0.0137
0.0063
(1,2)
0.0024
0.0053
0.0127
-0.0079
(1,3)
-0.0016
0.0037
0.0056
-0.0088
(1,4)
-0.0041
0.0044
0.0046
-0.0128
(2,3)
-0.0040
0.0040
0.0038
-0.0119
(2,4)
-0.0065
0.0047
0.0027
-0.0157
(3,4)
-0.0025
0.0033
0.0040
-0.0089
(c/me14,s/me14)
-0.0021
0.0029
0.0035
-0.0077
(c/ma65,s/ma65)
0.0079
0.0025
0.0129
0.0029
A2
(H,M)
-0.0067
0.0027
-0.0015
-0.0120
(+45,-45)
0.0101
0.0023
0.0147
0.0055
(1,2)
-0.0107
0.0028
-0.0053
-0.0161
(1,3)
-0.0106
0.0025
-0.0057
-0.0156
(1,4)
-0.0124
0.0029
-0.0068
-0.0180
(2,3)
0.0001
0.0019
0.0037
-0.0035
(2,4)
-0.0016
0.0023
0.0029
-0.0062
(3,4)
-0.0017
0.0018
0.0019
-0.0053
(c/me14,s/me14)
-0.0045
0.0015
-0.0015
-0.0075
(c/ma65,s/ma65)
-0.0009
0.0015
0.0020
-0.0038
(H,M)
0.0045
0.0016
0.0076
0.0013
(+45,-45)
0.0014
0.0013
0.0040
-0.0012
A3
148
A4
(1,2)
-0.0087
0.0033
-0.0023
-0.0151
(1,3)
-0.0112
0.0027
-0.0059
-0.0166
(1,4)
-0.0143
0.0031
-0.0082
-0.0204
(2,3)
-0.0025
0.0024
0.0021
-0.0072
(2,4)
-0.0056
0.0028
-0.0001
-0.0110
(3,4)
-0.0030
0.0023
0.0014
-0.0075
(c/me14,s/me14)
-0.0001
0.0020
0.0038
-0.0041
(c/ma65,s/ma65)
0.0001
0.0018
0.0036
-0.0034
(H,M)
0.0047
0.0021
0.0088
0.0005
(+45,-45)
-0.0003
0.0016
0.0028
-0.0034
Fuente: Elaboración propia
Para los alimentos A1, es significativa la interacción entre el unipersonal y los nucleares
con hijos y extendidos, no así entre el resto. Esto sugiere tomar el tipo 1 como base e
incorporar las interacciones tipo3*lnG y tipo4*lnG. El resto de las interacciones son todas
estadísticamente significativas. Por lo tanto, la CE paramétrica de este tipo de alimentos,
deberían considerarse todas las interacciones dobles de las características demográficas
con el gasto total. El resultado del modelo paramétrico38, considerando las variables
demográficas y especificando el gasto de forma cúbica (justificado a partir de los test de
especificación del capítulo 5), confirman la incorporación de las interacciones de los tipos
de hogares y de la cantidad de miembros menores de 14 años. No ocurre lo mismo con las
características del jefe/a de hogar. En este caso, si se incluyen ambas, los coeficientes de las
interacciones no son estadísticamente significativos, como tampoco el efecto propio de la
edad. Sin embargo, si se incluye solo la interacción con el género y se deja de lado la de la
edad, entonces la misma es significativa. De manera similar, si se incluye la interacción
mayor65*lnG, luego ni el coeficiente de ésta, ni el de mayor65 es significativo, mientras que
si se lo excluye el efecto propio sí lo es.
Para el caso de las carnes (A2), sólo las características del jefe/a de hogar y la cantidad de
personas mayores de 65 muestran curvas ESC con “pendiente” significativa (i.e. con
interacciones significativas). Al correr el modelo paramétrico, se confirma la
No se incluyen aquí las salidas de los modelos paramétricos (6.2) para los alimentos específicos A1-A4, para
simplificar la exposición. Sin embargo, en el Anexo 2 se presentan los resultados de los modelos paramétricos
con las interacciones seleccionadas.
38
149
significatividad estadística del efecto interacción de ambas características con el gasto
total, no así la correspondiente a la cantidad de adultos mayores. Incluso cuando esta
última interacción se incluye en el modelo, la variable que cuenta la cantidad de adultos
mayores (mayor65) deja de ser significativa. Sin embargo, esto no significa que tal variable
ya no tenga un impacto significativo sobre la variable respuesta. Se debe a que, al incluir
la interacción, el efecto de una variable determinada debe probarse mediante un test
conjunto de igualdad a cero de los dos coeficientes (el del efecto principal y el de la
interacción), como ser mediante una prueba F.
Para la leche y los productos lácteos, la d ESC muestra que las interacciones relevantes son
las ocurridas en los tipos de hogares nucleares y extendidos respecto al unipersonal, en la
cantidad de menores de 14 años y en el género del jefe de hogar. Exceptuando el caso del
género, para el cual el ESC es aproximadamente cero, estos resultados son compatibles
con los de un modelo paramétrico cúbico con variables demográficas incluyendo tales
interacciones. Por lo tanto, para resulta razonable la incorporación paramétrica de los
tipos de hogares y de la cantidad de menores de 14 años, excluyendo la del género.
En el consumo de frutas, verduras y legumbres (A4) ocurre algo similar con la interacción
del género con el gasto total. De la Figura 6.10 se observa que la curva ESC, más allá del
extremo inferior, es aproximadamente igual a cero, por lo que a pesar de que su derivada
muestre un signo significativo, no es relevante en para su incorporación paramétrica. En
este caso, sólo las interacciones entre tipos de hogares y el gasto total muestran resultados
estadísticamente significativos, tanto del análisis de la d ESC (Tabla 6.4) como de los test de
significancia de la salida paramétrica correspondiente.
Existen varias consideraciones adicionales que deben hacerse respecto a la incorporación
de las interacciones en los modelos de regresión. En primer lugar, algo indispensable en el
análisis económico, es la interpretación de las mismas. Por ejemplo, si se incorpora la
interacción jedad*lnG, el coeficiente de jedad debe ser interpretado como la derivada
parcial de la esperanza de la participación del gasto en alimentos con respecto a jedad,
cuando lnG = 0, lo cual no tiene mucho sentido en el análisis de las CE. Una manera de
presentar los resultados de forma que su interpretación sea más sencilla para el análisis
económico, es tomar los efectos interacción desviados respecto a su media, con lo cual el
coeficientes estimados de los efectos propios se interpretan respecto al valor promedio de
150
la otra variable con la cual se realiza la interacción, manteniendo así, la interpretación
usual de los coeficientes de la regresión (Ozer-Balli y Sorensen, 2012). En segundo lugar,
las interacciones aquí incorporadas se derivan del análisis no paramétrico empírico, sin
tener algún marco teórico sólido que justifique la incorporación de las mismas, y posibilite
el contraste de hipótesis derivadas del análisis económico formal. Claramente, los
resultados empíricos dan pie a ciertas hipótesis de comportamiento, las cuales podrían ser
modeladas en el ámbito del comportamiento de los (hogares) consumidores. Por último,
la incorporación de interacciones en las CE paramétricas podría generar un problema de
multicolinealidad, particularmente por la correlación entre los efectos propios y la
interacción (Althauser, 1971; Smith and Sasaki, 1979). Sin embargo, como se mencionó
anteriormente, su omisión podría traer aparejado problemas de especificación. De aquí
que, en defensa de su incorporación, se considere que el problema de correlación entre el
término propio y el de la interacción no sea más que otro de los tantos problemas que se
dan en la economía empírica (Ozer-Balli y Sorensen, 2012: 2).
6.6
Síntesis y Conclusiones
En este capítulo se vio que el análisis del comportamiento de las CE no paramétricas ante
diferentes sub-muestras construidas en función de las características de los hogares,
permite enriquecer el análisis económico a la vez que constituye un instrumental
metodológico a los fines de la especificación econométrica.
Se consideraron las características demográficas de los hogares que han mostrado mayor
importancia en los análisis de demanda aplicados en Argentina con datos de encuestas de
hogares; a saber: los tipos de hogares, la presencia de menores y adultos mayores, el
género del jefe/a de hogar y su edad. A partir de tales características, se estiman CE para
la sub-muestra definida a partir de la misma, y se computa el denominado “Efecto
Sustitución de las Características” (ESC) a los fines de conocer el cambio en los patrones
de consumo de alimentos ante dos características distintas del hogar. En base esto se
puede conocer si el efecto de la característica sobre el desplazamiento de la CE es, en
promedio, significativo, como también analizar las variaciones de tales efectos ante
diferentes niveles del poder adquisitivo de los hogares.
151
Para los diferentes tipos de hogares, se observan desplazamientos “paralelos” de las CE
para el total de alimentos y bebidas. El mayor cambio se da entre el hogar unipersonal y
los nucleares con hijos y extendidos. Entre estos últimos, las CE son prácticamente
iguales, siendo el efecto promedio no significativo. Exceptuando los niveles extremos de
gasto total, las curvas ESC no muestran algún cambio importante del efecto sustitución
respecto a los diferentes niveles del gasto total. Por lo tanto, para el caso del total de
alimentos, resulta plausible suponer un ESC relativamente constante para todos los
niveles de ingreso de los hogares. Sin embargo, para los alimentos específicos A1-A4, se
observan interacciones entre los tipos de hogares y el gasto total. Tomando como base los
hogares unipersonales, para los niveles más bajos de gasto total, este tipo de hogar tiende
a asignar un mayor gasto de consumo en productos lácteos, frutas, legumbres y verduras,
disminuyendo el de arroz, pastas, productos de panadería y carnes, respecto a los hogares
nucleares y extendidos. Esto indicaría que el crecimiento en el tamaño del hogar implica
una sustitución de las frutas, verduras y lácteos, por carnes, pastas y panadería. Tal
brecha se achica para mayores niveles del gasto total, aunque se observa que en los
hogares unipersonales sigue siendo mayor el consumo por miembro de frutas, verduras y
lácteos. Por su parte, de la comparación de los hogares nucleares sin y con hijos, se
observa que un hijo implica sustituir o posponer el consumo de otros bienes a favor de los
alimentos.
Respecto a la presencia de menores se tiene que, para un nivel dado del gasto total, un
menor adicional genera un incremento en el gasto de alimentos en detrimento de otros
gastos. Aquí existe una clara interacción con el gasto total, donde para los mayores niveles
de gasto (ingreso) el ESC tiende a cero. Para los alimentos específicos se observa que la
presencia de al menos un menor implica un aumento en el gasto de harinas, arroz, pastas
y lácteos, mientras que el consumo de carnes, frutas, legumbres y verduras permanece
prácticamente constante.
La presencia de adultos mayores muestra un ESC promedio poco significativo, con
cambio de signo a partir del gasto medio. En hogares con menor poder adquisitivo, la
presencia de un adulto mayor implica una menor participación de los alimentos en el
gasto total, mientras que en hogares con mayor poder de compra, los alimentos tienen
una mayor participación presupuestaria. Para los conjuntos A1-A4, se tiene que los
152
hogares con al menos un adulto mayor, tienden a incrementar su consumo de legumbres,
frutas y verduras y a disminuir el de carnes, panadería, pasta y arroz. Para el caso de
lácteos, el ESC promedio no es significativo.
En relación al género del jefe/a de hogar, las estimaciones muestran que para un nivel fijo
de gasto total, un hogar con jefatura masculina destina una mayor parte del gasto total en
alimentos, en relación a los hogares con jefas mujeres. En esto parece predominar el efecto
tamaño, dadas las características de los hogares con jefatura femenina. La forma del ESC
muestra un importante efecto interacción, donde la brecha debido al género se va
cerrando para los hogares de mayor gasto total. Para los conjuntos particulares de
alimentos se tiene que cuando el jefe es hombre hay una sustitución a favor del consumo
de carne y de las pastas, harinas y productos de panadería, en relación a los hogares con
jefas mujeres. Por su parte, éstas tienden a sustituir el consumo de carnes y harinas por
legumbres, frutas, verduras y lácteos, principalmente en el rango de menor gasto total. En
estos casos, las interacciones más relevantes se dan para A1 y A2, los que muestran una
menor diferencia de género en el consumo.
En relación a la edad del jefe de hogar, se tiene que cuando el jefe es mayor de 45 años
tiende a sustituir alimentos como las harinas, los lácteos y las carnes a favor de las frutas,
legumbres y verduras. Tal efecto se acentúa en los hogares con menores niveles de gasto
total. En este caso, solo para el caso de A1 y A2, el efecto interacción es significativo según
la derivada promedio del ESC, no así en la especificación paramétrica, para la cual solo en
las carnes es estadísticamente significativo.
153
Capítulo 7
Curvas de Engel Semiparamétricas
7.1
Introducción
Este capítulo constituye la fase final de la presente tesis, en donde se presentan los
resultados de los modelos semiparamétricos de las CE, incorporando las características
demográficas y socioeconómicas de los hogares en forma paramétrica, mientras que el
gasto total sigue especificado de manera no paramétrica. Como se mencionó en el capítulo
metodológico, el uso de modelos semiparamétricos permite incorporar todas las variables
de interés sin tener que enfrentar la denominada ‘maldición de la dimensionalidad’,
presente en modelos totalmente no paramétricos. A su vez, dado que se considera
particularmente los modelos parcialmente lineales (MPL) como opción semiparamétrica
de las CE, debe aceptarse el supuesto de que los efectos de las características de los
hogares, diferentes del ingreso o gasto total, son aproximadamente lineales. En el capítulo
6 se vio que necesariamente esto no es así, y que algunos efectos de las características
pueden cambiar significativamente para diferentes niveles del poder adquisitivo de los
hogares. Para las especificaciones paramétricas, se presentó como una opción, la
incorporación de las interacciones entre las características y el gasto total, focalizando sólo
en aquellas que resultan estadísticamente relevantes. Sin embargo, en las especificaciones
semiparamétricas, tanto el intercepto como funciones determinísticas del logaritmo del
gasto total (variable que entra de forma no paramétrica), no deben incorporarse por
cuestiones de identificabilidad (Li y Racine, 2006: 222-223). Por lo tanto, no se
considerarán tales interacciones, y los resultados del presente capítulo se centrarán en el
efecto directo de cada característica y en las elasticidades pertinentes, evaluando los
resultados de diferentes estimadores no paramétricos que entran en la estimación de los
MPL.
154
Dadas las variables definidas en el capítulo 4, la CE del hogar i a considerar para el bien j,
puede escribirse de la siguiente manera
wij = γ 1´ jedad i + γ 2´ jgeneroi + γ 3´ adultos i + γ 4´ menor14i + γ 5´ mayor65i + γ 6´ tipo2i +
+ γ 7´ tipo3i + γ´8 tipo4i + γ 9´ asalariadoi + γ 10´ patroni + γ 11´ edu + m j (ln Gi ) + ξ ij
(
2
(7.1)
)
con ξij ~ iid 0,σ i . De (7.1) se observa que el tipo de hogar unipersonal (tipo1) es tomado
como base, por lo que los coeficientes asociados de los restantes tipos de hogares deben
interpretarse en relación a dicho tipo base. De la misma manera, asalariado y patrón, deben
interpretarse en función a la categoría ocupacional base noocupado.
Para aplicar el método de estimación de Robinson de Doble Residuos39 al MPL (7.1) se
deben realizar estimaciones no paramétricas, no sólo para estimar la componente no
paramétrica m j , sino que también en una primera etapa para luego poder aplicar MCO
para estimar el vector de parámetros γ . En el capítulo 5 de la tesis se prueba que los
suavizados splines y los polinomios locales (lineales en algunos casos, y cuadráticos en
otros) muestran una mejor performance respecto al clásico estimador N-W. En este
capítulo, para cada conjunto de alimentos, se seleccionan los dos estimadores de mayor
performance, según los resultados del capítulo 5, y luego se compara el par elegido en
términos de las dos medidas de error Cp y AICc, y también considerando el R-cuadrado
del MPL. El método de estimación elegido para la fase intermedia del método de
Robinson, será el mismo que el seleccionado para la componente no paramétrica de
interés (i.e. m j ). Por lo tanto, cada método no paramétrico se evalúa de una forma más
integrada, al considerarlo en cada etapa. Esto cobra sentido con la práctica habitual de los
trabajos empíricos donde, por lo general, se elige el mismo método de estimación para las
todas las p+2 estimaciones no paramétricas que comprenden la estimación de Doble
Residuos de un MPL con p parámetros.
Lo que resta del presente capítulo se organiza de la siguiente manera. En la sección 7.2 se
muestran los resultados de la estimación de (7.1) bajo el supuesto de que el gasto total es
exógeno. Seguidamente, se analizan los resultados de las elasticidades-gastos derivadas
de los MPL. En la sección 7.4 se analizan la posible endogeneidad del gasto total,
39
Ver Capítulo3, sección 3.7.1.
155
incorporándola en la estimación de las CE utilizando una variable auxiliar en (7.1). Por
último, se computan las elasticidades-gasto corregidas. Dado que se utiliza el ingreso de
los hogares como variable instrumental, también se calcula la elasticidad-ingreso,
comparándolas con las otras dos anteriores.
7.2
Resultados de los Modelos Parcialmente Lineales
En lo que sigue se presentan los resultados de la estimación de (7.1), comparando entre
dos metodologías no paramétricas seleccionadas según los criterios de performance a
partir del análisis realizado en el capítulo 5.
La tablas siguientes (7.1-7.5) muestran los resultados de la estimación de Doble Residuos
para los conjuntos de alimentos considerados, aplicando suavizados spline por un lado, y
polinomios locales, por otro (lineales o cuadráticos según cada caso); considerando que
ambos son los que mostraron un mejor desempeño en la estimación de la componente no
paramétrica. Adicionalmente de los coeficientes γˆ se presentan los errores estándar
heterocedásticos. En la parte inferior se detalla: la suma de cuadrados de los residuos, los
grados de libertad (v) de la componente no paramétrica m̂ , las medidas Cp y AICc para
evaluar ambos suavizados locales computados para m̂ , y el R-cuadrado de los modelos
semiparamétricos integrados.
Considerando las CE para el conjunto total de alimentos y bebidas (Tabla 7.1), todas las
características socioeconómicas y demográficas de los hogares muestran tener un efecto
estadísticamente significativo a un nivel del 1%, exceptuando la situación ocupacional del
jefe/a de hogar. En este caso, para el modelo que utiliza el estimador local lineal, el hecho
de que el jefe de hogar sea patrón o cuenta propista es significativo, aunque a un nivel del
10%. Los coeficientes estimados para ambos modelos son prácticamente iguales, por lo
tanto, en lo que hace a la parte paramétrica del MPL, es indiferente la elección de uno u
otro.
La Figura 7.1 muestra el gráfico de m̂ , donde se observa que la CE sigue manteniendo la
forma del modelo totalmente no paramétrico, y la diferencia entre los dos estimadores es
pequeña, manifestándose en mayor medida en extremo inferior del gasto total.
156
Tabla 7.1 CE Semiparamétricas. Estimador de Doble Residuos. Total Alimentos y Bebidas
Spline
Variables
jedad
jgenero
Local Lineal
Coeficiente
EE het
Coeficiente
EE het
0.0012***
0.0002
0.0012***
0.0002
0.0323***
0.0046
0.0323***
0.0046
adultos
0.0244***
0.0018
0.0244***
0.0018
menor14
mayor65
0.0251***
0.0016
0.0251***
0.0015
0.0210***
0.0047
0.0210***
0.0047
tipo2
0.0214***
0.0074
0.0213***
0.0075
tipo3
0.0329***
0.0071
0.0327***
0.0071
tipo4
0.0250***
0.0082
0.0249***
0.0082
0.0015
0.0049
0.0016
0.0049
0.0084
0.0052
0.0085*
0.0052
-0.0348***
0.0047
-0.0348***
0.0047
asalariado
patron
edu
SC(res)
0.0212
0.0212
v
6.998
7.564
Cp(m)
0.00005
0.00027
AICc(m)
-2.8522
-2.8520
0.3423
0.3423
R
2
Notas:.***estadísticamente significativo al 1%; **significativo al 5%; * significativo al 10%.
Fuente: Elaboración Propia
0.6
Figura 7.1 Componente No Paramétrica de la CE. Estimador de Doble Residuos. Total
Alimentos y Bebidas
0.4
0.3
0.2
m(lnG)
0.5
Spline
P Local Lineal
4
5
6
7
8
ln(G)
Fuente: Elaboración Propia
157
El coeficiente de la variable jedad revela que a mayor edad del jefe/a de hogar, mayor es la
participación del gasto en alimentos. Para un hogar promedio, donde la participación
presupuestaria de los alimentos ronda el valor de 0.41, las estimaciones muestran que, en
promedio, un hogar con un jefe/a 10 años mayor, destina en alimentos y bebidas un 3%
más de su gasto total, respecto a un hogar con jefe/a 10 años más joven. Cuando el jefe es
varón, la participación del gasto en alimentos es mayor respecto a los hogares con jefa
mujeres. Considerando el hogar promedio, esto se traduce en un 9% superior en hogares
con jefatura masculina. La cantidad de miembros en edad intermedia (adultos), incrementa
la participación del gasto en alimentos, como también ocurre al considerar un hogar
nuclear o extendido respecto a uno unipersonal. Del mismo modo, la cantidad de menores
y de adultos mayores incrementa la participación de los alimentos en el gasto total. Por el
contrario, un mayor nivel de instrucción del jefe o jefa de hogar, disminuye la
participación del gasto en alimentos. Esto cobra sentido al considerar la posible relación
positiva entre el nivel de educación con los ingresos percibidos, por lo que los resultados
encontrados son compatibles con la ley de Engel. En general, todos los signos de los
coeficientes son consistentes con los desplazamientos de las CE examinados en el capitulo
anterior para las categorías demográficas. Un comentario especial merece el caso de los
adultos mayores y de la edad del jefe de hogar, donde el ESC cambiaba de signo a partir
de un cierto ingreso. Los coeficiente positivos de ambas variables, muestran que el efecto
ocurrido en los hogares con un poder adquisitivo medio-alto termina dominando (ver
Figuras 6.6 y 6.12) al controlar el modelo con las restantes variables. A su vez, debe
tenerse en cuenta que en este caso ambas variables son continuas (conteo), mientras que
en el caso anterior se definieron categorías binarias para las mismas.
Respecto a la CE propiamente dicha (Figura 7.1), el suavizado spline muestra un
comportamiento ‘menos exagerado’ en el rango donde los hogares incrementan su
participación del gasto en alimentos ante aumentos de su poder de compra. Al comparar
las medidas de performance Cp y AICc se tiene que, si bien las diferencias son muy leves,
se confirma la superioridad del estimador por splines, en el sentido que tienen tales
medidas como aproximaciones de los errores de estimación y/o predicción.
158
Tabla 7.2 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A1
Spline
Variables
jedad
jgenero
Local Cuadrático
Coeficiente
EE het
Coeficiente
EE het
0.0001
0.0001
0.0001
0.0001
0.0013
0.0014
0.0013
0.0014
adultos
0.0104***
0.0006
0.0104***
0.0006
menor14
mayor65
0.0101***
0.0005
0.0101***
0.0005
0.0083***
0.0015
0.0083***
0.0015
tipo2
0.0119***
0.0022
0.0119***
0.0022
tipo3
0.0127***
0.0022
0.0126***
0.0022
tipo4
0.0112***
0.0027
0.0111***
0.0027
asalariado
patron
-0.0042***
0.0015
-0.0041***
0.0015
-0.0021
0.0016
-0.0021
0.0016
edu
-0.0064***
0.0012
-0.0064***
0.0012
SC(res)
0.001996
0.001996
v
5.056
5.714
Cp(m)
0.000003
0.00004
AICc(m)
-5.2151
-5.2149
0.3872
0.3872
R
2
Notas: ****estadísticamente significativo al 1%. Fuente: Elaboración Propia
0.20
Figura 7.2 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A1)
0.10
0.05
0.00
m(lnG)
0.15
Spline
P Local Cuadrático
4
5
6
7
8
ln(G)
Fuente: Elaboración Propia
159
Considerando ahora las estimaciones para los subconjuntos de alimentos específicos, para
los A1 (Tabla 7.2) se tiene que la edad y el género del jefe/a de hogar no son significativos.
Las variables que hacen al tamaño y composición del hogar nuevamente tienen un efecto
estadísticamente significativo y positivo sobre la participación del gasto en los alimentos
A1. Un adulto adicional incrementa la participación del gasto en A1 en un 13% en
promedio40. El mismo efecto promedio produce un menor más. Por su parte, la presencia
de un adulto mayor (o un adulto mayor más) aumenta la participación de los alimentos
A1 en aproximadamente un 10%, considerando el ‘hogar promedio’. También, como en el
caso general, un nivel de instrucción superior del jefe/a de hogar reduce
significativamente la participación del gasto en este tipo de alimentos. Ahora el hecho de
ser asalariado versus a no estar ocupado, implica una reducción en la participación
presupuestaria de este tipo de alimentos, aunque la misma no supera al 6% en promedio.
Lo mismo ocurre si el jefe/a es patrón o trabaja por cuenta propia, aunque en este caso la
diferencia no es significativa. Entre los tipos de hogares, el mayor impacto, respecto a los
hogares unipersonales, se da en los nucleares con hijos, aunque el efecto de los otros tipos
de hogares es similar. El aumento registrado, para un hogar con la participación
presupuestaria promedio, ronda el 15%.
En este caso se comparan el suavizado spline con los polinomios locales cuadráticos. No
existen diferencias entre ambos en lo que hace al valor de los coeficientes de la
componente paramétrica. Sin embargo, el suavizado spline muestra una posición
favorable en términos de las medidas Cp y AICc. Al observar las curvas no paramétricas
(Figura 7.2) se ve que las diferencia entre ambos estimadores es despreciable,
diferenciándose un poco en el extremo inferior. De tales curvas se observa que la
reducción presupuestaria de los alimentos A1 decae con mayor intensidad en los niveles
medios del gasto total. Luego sigue decreciendo de forma menos acelerada. Este mismo
comportamiento se apreció de la estimación no paramétrica pura (Figura 5.4).
Para las carnes (A2) (Tabla y Figura 7.3), las únicas variables que no tienen un efecto
estadísticamente significativo son las relacionadas a la situación ocupacional del jefe/a de
hogar. El resto son significativas y muestran los mismos signos que en el caso del total de
alimentos y bebidas. La edad del jefe/a si bien es significativa, su impacto es pequeño,
40
Considerando que la media de la participación del gasto en A1 es igual a 0.081
160
mostrando que si el jefe o jefa es mayor en 10 años, el incremento promedio de la
participación de las carnes en el gasto total no llega a representar un 2% si se toma como
referencia al ‘hogar promedio’ (i.e. aquéllos para los cuales w A2 = 0.112 ). El género
muestra un efecto mucho mayor, cuyo coeficiente revela que en hogares con jefatura
masculina, la participación presupuestaria de las carnes es, en promedio, un 11% superior
a la de hogares con jefatura femenina. Este efecto es similar al de comparar un jefe con o
sin educación superior.
La cantidad de miembros de edad intermedia (adultos) muestra que un adulto más
incrementa la participación del gasto en carnes en un 7%, mientras que el impacto
promedio de un menor o de un adulto mayor se reduce a la mitad. Por otra parte, se
observa que un hogar nuclear sin hijos tiene una participación del gasto en A2 del 16%
superior a los hogares unipersonales, tomando de referencia al ‘hogar promedio’. Al
considerar los hogares con hijos y extendidos, tal diferencia es del orden del 21%.
Tabla 7.3 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A2
Spline
Variables
jedad
jgenero
Local Cuadrático
Coeficiente
EE het
Coeficiente
EE het
0.0004***
0.0001
0.0004****
0.0001
0.0128***
0.0020
0.0128***
0.0020
adultos
0.0081***
0.0008
0.0081***
0.0008
menor14
mayor65
0.0044***
0.0007
0.0044***
0.0007
0.0047**
0.0021
0.0046**
0.0021
tipo2
0.0181***
0.0033
0.0181***
0.0033
tipo3
0.0248***
0.0030
0.0249***
0.0030
tipo4
0.0242***
0.0036
0.0243***
0.0036
0.0001
0.0021
0.0001
0.0021
asalariado
patron
edu
0.0026
0.0023
0.0026
0.0023
-0.0114***
0.0018
-0.0114***
0.0018
SC(res)
0.00363
0.00363
v
4.425
4.171
Cp(m)
0.000005
0.0002
AICc(m)
-4.6169
-4.6169
0.3067
0.3067
R2
Notas: ***significativo al 1%; **significativo al 5%
Fuente: Elaboración Propia.
161
0.10
0.15
Spline
P Local Cuadrático
0.00
0.05
m(lnG)
0.20
0.25
Figura 7.3 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A2)
4
5
6
7
8
ln(G)
Fuente: Elaboración Propia
Nuevamente las diferencias entre los métodos no paramétricos seleccionados, son
mínimas en lo que hace a los coeficientes de la componente paramétrica como también del
efecto del gasto total (Figura 7.3). Aquí el spline supera al polinomio local cuadrático
según el estadístico Cp pero el AICc arroja los mismos resultados.
Para la leche y los productos lácteos (A3), la única característica del jefe/a de hogar que
resulta significativa es la edad, con un efecto pequeño que no alcanza ni al 1% respecto al
‘hogar promedio’ (con wA3 = 0.05 ). Las variables que resultan más relevantes, además del
gasto total, son aquéllas relacionadas a la cantidad de miembros en los grupos etarios
extremos. Los coeficientes de la Tabla 7.4 muestran que, en promedio, un adulto mayor
adicional genera un aumento del 7.5% en la participación del gasto en lácteos, mientras
que un menor adicional lo hace en un 10% (tomando como referencia al hogar promedio).
Este mismo impacto también se refleja al comparar los hogares nucleares con hijos
respectos a los unipersonales (coeficiente del tipo3). La forma que adopta la CE (Figura
7.4) muestra que las disminuciones del presupuesto en lácteos ante aumentos del poder
adquisitivo se da de forma más acelerada en los hogares de menores recursos (lo que se
162
apreció en el Cap. 5 – Figura 5.6). Los dos estimadores no paramétricos muestran
resultados muy similares en lo que hace a la componente paramétrica, con algunas
diferencias, aunque leves, en la curva no paramétrica. Tanto el Cp como el AICc muestran
que el spline brinda una estimación de la CE como menores errores, respecto a la de los
polinomios locales lineales. Cuando se utiliza esta última metodología se obtiene una
mayor bondad de ajuste, expresada en un R-cuadrado superior. Esta diferencia no sólo es
depreciable (al considerar tres o dos dígitos del R2) sino que al ver los grados de libertad
no paramétricos, se tiene que para el polinomio local v ≈ 7 , mientras que para el spline
v ≈ 5 , por lo que es esperable que el primero arroje un mayor R-cuadrado. Sin embargo,
la Figura 7.4 sugiere que este menor suavizado ‘óptimo’ del polinomio local no brinda
una diferencia apreciable en la forma de la CE de modo que pueda captarse un
comportamiento económico singular, por lo que el menor suavizado no es justificable.
Tabla 7.4 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A3
Spline
Variables
jedad
jgenero
Local Lineal
Coeficiente
EE het
Coeficiente
EE het
0.0001***
0.00001
0.0001***
0.00001
-0.0009
0.0011
-0.0009
0.0011
adultos
0.0011**
0.0004
0.0011**
0.0004
menor14
mayor65
0.0050***
0.0004
0.0050***
0.0004
0.0038***
0.0010
0.0038***
0.0011
tipo2
0.0007
0.0017
0.0008
0.0017
tipo3
0.0051***
0.0017
0.0051***
0.0017
tipo4
0.0021
0.0020
0.0021
0.0020
asalariado
patron
0.0008
0.0011
0.0008
0.0011
0.0004
0.0012
0.0004
0.0012
edu
0.0014
0.0010
0.0014
0.0010
SC(res)
0.000975
0.000976
v
4.968
6.788
Cp(m)
0.000001
0.0004
AICc(m)
-5.9311
-5.9309
0.1909
0.1913
R
2
Notas: ***significativo al 1%; **significativo al 5%
Fuente: Elaboración Propia.
163
0.12
Figura 7.4 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A3)
0.06
0.00
0.02
0.04
m(lnG)
0.08
0.10
Spline
P Local Lineal
4
5
6
7
8
ln(G)
Fuente: Elaboración Propia.
Para el caso de las legumbres, frutas y verduras (Tabla y Figura 7.5), nuevamente las
características del jefe/a no muestran ser muy relevante. Sólo la edad y el nivel de
instrucción muestran efectos estadísticamente significativos. Para la primera se revela que
en promedio un hogar con jefe/a 10 años mayor tiene una participación del gasto en A4
6% superior, tomando el hogar promedio con wA4 = 0.065 . Respecto al nivel de
instrucción se observa que un hogar con jefe/a con estudios superiores destina, en
promedio, un 5% menos de su presupuesto en legumbres, frutas y verduras, en relación a
los hogares cuyo jefe/a tiene a lo sumo la educación secundaria terminada.
Las variables que hacen al tamaño, composición y tipología de los hogares son, por lo
general,
estadísticamente
significativas.
Un
adulto
mayor
adicional
impacta
positivamente, generando un aumento promedio del 7% en el presupuesto destinado a A4
(en referencia al ‘hogar promedio’). Por su parte, el impacto promedio de un menor
adicional es del 6%, igual al efecto del incremento de un miembro en edad intermedia.
También, un hogar nuclear con o sin hijos tiene, en promedio, una participación del gasto
en A4 superior en un 10% respecto a los hogares unipersonales.
164
Tabla 7.5 CE Semiparamétricas. Estimador de Doble Residuos. Alimentos A4
Spline
Variables
jedad
jgenero
Local Lineal
Coeficiente
EE het
Coeficiente
EE het
0.0004***
0.0000
0.0004***
0.0000
0.0002
0.0013
0.0002
0.0013
adultos
0.0038***
0.0005
0.0038***
0.0005
menor14
mayor65
0.0038***
0.0004
0.0038***
0.0004
0.0043***
0.0013
0.0043***
0.0013
tipo2
0.0065***
0.0021
0.0065***
0.0021
tipo3
0.0060***
0.0020
0.0060***
0.0020
tipo4
0.0015
0.0023
0.0014
0.0023
asalariado
patron
-0.0021
0.0013
-0.0021
0.0013
-0.0012
0.0014
-0.0012
0.0014
-0.0031***
0.0012
-0.0030***
0.0012
edu
SC(res)
0.001525
0.001527
v
7.245
7.583491
Cp(m)
0.000003
0.0002
AICc(m)
-5.4833
-5.4831
0.2368
0.2368
R
2
Notas: ***significativo al 1%; **significativo al 5%
Fuente: Elaboración Propia.
0.15
Figura 7.5 Componente No Paramétrica de la CE Estimador de Doble Residuos. (A4)
0.00
0.05
m(lnG)
0.10
Spline
P Local Lineal
4
5
6
7
8
ln(G)
Fuente: Elaboración Propia.
165
De nuevo, las diferencias entre ambas metodologías no paramétricas son mínimas, y en lo
que hace a las medidas de performance estadística, el spline sigue siendo superior.
Del análisis de los MPL para cada conjunto de alimentos, se observa que el efecto de cada
co-variable es totalmente compatible con lo analizado de las curvas ESC. A su vez, las CE
no paramétricas adoptan la misma forma que las del capítulo 5, lo que es esperable dado
que el resto de las variables se incluyen de manera aditiva, aunque la variabilidad
explicada por éstas podría cambiar en algo las estimaciones no paramétricas de la
segunda etapa del método de Robinson.
7.3
Elasticidades-Gasto
Dado que las CE derivadas del MPL no experimentaron grandes cambios respecto a las
CE totalmente no paramétricas (por lo menos, desde la inspección visual), se espera que el
comportamiento de las elasticidades-gasto tampoco varíe mucho. Sin embargo, en esta
sección se presentan las mismas, no sólo para chequear esto, sino también para hacer una
comparación adicional entre los dos estimadores semiparamétricos seleccionados para los
MPL, como así también con la elasticidad-gasto del modelo paramétrico que mejor se
adapta a las funciones flexibles, según los test de hipótesis realizados en el Capítulo 5.
Para el caso de alimentos y bebidas en general, para ambos test de especificación, todas
las especificaciones W-L propuestas son rechazadas frente a la alternativa no paramétrica.
A pesar de ello, gráficamente se vio que la W-L cúbica es la que mejor se adapta al
comportamiento de la CE no paramétrica41. Por lo tanto, se elige ésta para computar su
derivada. Dado que se tiene el logaritmo del gasto total hasta la potencia de 3, luego la
elasticidad paramétrica viene dada por
e (ln G ) = 1 +
G
j
θˆ1 j + 2θˆ2 j ln G + 3θˆ3 j (ln G )2
wˆ j
(7.2)
Siendo θˆkj (k = 1,2,3) los coeficientes correspondiente a cada potencia k del logaritmo del
gasto total, estimados por MCO del modelo paramétrico para el conjunto de alimentos j, y
41
Los resultados completos de los modelos paramétricos seleccionados se presentan en el Anexo 2.
166
ŵ j su predicho. Para las elasticidades no paramétricas derivadas del MPL, según se vio
en el capítulo metodológico, su fórmula es
e Gj (ln G ) = 1 +
mˆ j ' (ln G )
mˆ j (ln G )
(7.3)
Donde m
ˆ j ' (.) representa la derivada estimada de la componente no paramétrica, y mˆ j (.)
su predicho.
En la Figura 7.6 se muestran los resultados para las dos especificaciones semiparamétricas, utilizando suavizados spline o polinomios locales lineales, y la obtenida a
partir de (7.2).
1.2
Figura 7.6 Elasticidades – Gasto. Comparación de Estimadores. Total Alimentos y Bebidas
1.0
0.9
0.8
0.7
0.5
0.6
Elasticidad-Gasto
1.1
P Local Lineal
Spline
W-L Cúbica
4
5
6
7
8
ln(G)
Fuente: Elaboración Propia.
De la gráfica se observa que las diferencias en elasticidad que da un ajuste paramétrico
son muy notorias respecto a los no paramétricos. Incluso, aquí la W-L muestra un
comportamiento poco esperado en términos económicos cuando se alcanza cierto nivel
del poder adquisitivo. Dado el principio de saturación, se espera que en tales niveles, la
elasticidad-gasto alcance de los alimentos alcance los menores valores y siga decreciendo.
167
Sin embargo la W-L cúbica muestra un crecimiento repentino, alcanzado los mismos
valores de elasticidad que en los hogares pobres. Por lo tanto, no es aconsejable el uso de
esta especificación. Adicionalmente, al comparar con las elasticidades no paramétricas, la
W-L cúbica la subestima en los niveles medios y bajos del gasto total.
Al comparar las elasticidades con las dos metodologías no paramétricas alternativas, se
observa un patrón similar. Sin embargo, el suavizado spline muestra un mejor
comportamiento en los extremos, más compatibles en términos económicos.
En la Figura 7.7 se presentan los resultados para los cuatro conjuntos de alimentos
seleccionados. La derivada paramétrica de cada caso, corresponde al modelo elegido
según los test de especificación. En estos casos se observa que las elasticidades
paramétricas tienen un mejor comportamiento, y se ajustan mejor a las no paramétricas.
Los mejores ajustes se dan para el caso de carnes, leche y productos lácteos (A2 y A3),
donde la W-L cuadrática muestra un resultado compatible con el análisis económico (en
términos de elasticidades-gasto decrecientes) y son próximas a las no paramétricas, y en
particular a las del suavizado spline.
Para las harinas, pastas, arroz y productos de panadería (A1), la elasticidad-gasto
paramétrica (en este caso, utilizando la W-L cúbica)
no capta las formas de las
elasticidades no paramétricas, y la termina subestimando.
Por otra parte, las elasticidades no paramétricas de las legumbres, frutas y verduras,
muestran una gran variabilidad que es compatible con las diferentes formas que adoptan
las CE en distintos intervalos del gasto total (como puede verse de 7.5). Estos cambios de
forma no son captados por la CE paramétrica (W-L cuadrática), a pesar de que la misma
de un resultado económicamente consistente. Por lo tanto, si bien el ajuste paramétrico no
parece ser ‘tan malo’, deja de captar algunas curvaturas que pueden resultar de interés si
se desea analizar la demanda de los alimentos tipo A4 por tramos de ingresos.
En la Tabla 7.6 están computadas las elasticidades promedio y evaluadas en el gasto total
medio, para las dos alternativas no paramétricas y la resultante de la W-L. Entre las dos
primeras, como era de esperar, las diferencias son muy pequeñas. Por lo tanto, en lo que
hace a tales medidas, la elección del estimador es irrelevante. Al compararlas con las
elasticidades de los modelos paramétricos, se observa que éstas tienden a subestimar los
168
valores de la elasticidad. En algunos casos la diferencia es menos notoria que en otros,
pero la brecha es relevante y más en casos donde se desea comparar las elasticidades para
distintos bienes, o en bienes cuya elasticidad ronda el valor 1 (por lo que están al límite de
caracterizarse por bienes necesarios o de lujo).
Figura 7.7 Elasticidades – Gasto. Comparación de Estimadores. Más Conjunto de
Alimentos A1-A4
A2
1.0
1.2
A1
0.4
0.6
0.8
P Local Cuadrático
Spline
W-L Cuadrática
0.0
0.2
Elasticidad-Gasto
0.8
0.6
0.4
0.0
-0.2
0.2
Elasticidad-Gasto
1.0
P Local Lineal
Spline
W-L Cúbica
4
5
6
7
8
4
5
ln(G)
8
1.0
1.0
A4
P Local Lineal
Spline
W-L Cuadrática
P Local Cuadrático
Spline
W-L Cuadrática
0.6
0.2
-0.2
0.4
0.0
0.2
0.4
Elasticidad-Gasto
0.6
0.8
0.8
7
ln(G)
A3
Elasticidad-Gasto
6
4
5
6
7
8
4
5
6
7
8
ln(G)
ln(G)
Fuente: Elaboración Propia.
169
Tabla 7.6 Elasticidades-Gasto Promedios y Evaluadas en la Media
Elasticidad Promedio
Alimentos
Elasticidad en el Gasto Medio
e
EE boot
E
EE boot
PL
0.732
0.006
0.722
0.020
Spline
0.733
0.006
0.725
0.024
W-L Cubica
0.703
0.007
0.655
0.010
PL
0.558
0.012
0.502
0.014
Spline
0.550
0.009
0.523
0.021
W-L Cubica
0.476
0.011
0.481
0.017
Total (A)
A1
A2
PL
0.604
0.011
0.541
0.010
Spline
0.590
0.008
0.521
0.018
W-L Cuadrática
0.532
0.010
0.549
0.009
A3
PL
0.625
0.015
0.703
0.032
Spline
0.628
0.011
0.697
0.025
W-L Cubica
0.597
0.012
0.674
0.022
PL
0.603
0.010
0.662
0.032
Spline
0.604
0.009
0.675
0.039
W-L Cuadrática
0.596
0.010
0.618
0.009
A4
Fuente: Elaboración Propia.
7.4
Endogeneidad por Simultaneidad
Dado que el gasto total de consumo en bienes y servicios, como el destino de dicho gasto
a un bien en particular, son resultados de asignaciones de gasto, se argumenta que este
problema de simultaneidad de las decisiones trae aparejado un problema de
endogeneidad en los modelos de regresión de CE. En el capítulo metodológico se
presentó la corrección de la misma mediante la incorporación de una variable auxiliar. Si
la misma es significativa, entonces puede concluirse que el gasto total es endógeno.
Adicionalmente, este procedimiento permite corregir el MPL bajo ciertos supuesto (ver
Capítulo 3).
La Tabla 7.7 presenta los resultados de las componentes paramétricas de los nuevos MPL
considerando la posible endogeneidad del gasto total, utilizando suavizados spline en las
estimaciones no paramétricas. Como se mencionó previamente, el ingreso total declarado
170
por el hogar y el régimen de tenencia de la vivienda son utilizados como variables
instrumentales para la construcción de la variable auxiliar ( U ) que entra de forma
paramétrica en los modelos.
Para el total de alimentos y bebidas (A) y para el conjunto de alimentos A1, la variable es
estadísticamente significativa a un nivel del 1%, y en los alimentos A3 a un nivel del 10%.
Para A2 y A4, el efecto de la misma no es significativo. Por lo tanto, para estos últimos
puede asumirse que el gasto total es exógeno. Los coeficientes de las características de los
hogares experimentan leves cambios, manteniéndose la significatividad de cada variable
de los modelos sin corregir.
Tabla 7.7 Componentes Paramétricas de la CE. Corrección por Endogeneidad
A
A1
A2
A3
A4
0.0013***
(0.0002)
0.0338***
(0.0046)
0.0257***
(0.0018)
0.0245***
(0.0015)
0.0227***
(0.0047)
0.0244***
(0.0075)
0.0366***
(0.0071)
0.0296***
(0.0082)
0.0065
(0.0049)
0.0128**
(0.0052)
-0.0285***
(0.0048)
0.0258***
(0.0041)
0.0001
(0.0001)
0.0018
(0.0014)
0.0108***
(0.0006)
0.0099***
(0.0005)
0.0088***
(0.0015)
0.0129***
(0.0022)
0.0138***
(0.0022)
0.0126***
(0.0027)
-0.0026*
(0.0015)
-0.0007
(0.0016)
-0.0045***
(0.0013)
0.0082***
(0.0013)
0.0004***
(0.0001)
0.0127***
(0.0020)
0.0081***
(0.0008)
0.0044***
(0.0007)
0.0047**
(0.0021)
0.0179***
(0.0033)
0.0246***
(0.0030)
0.0240***
(0.0036)
0.00005
(0.0021)
0.0026
(0.0023)
-0.0117***
(0.0018)
-0.0010
(0.0017)
0.0001
(0.00001)
-0.0008
(0.0011)
0.0012***
(0.0004)
0.0049***
(0.0004)
0.0039***
(0.0011)
0.0010
(0.0017)
0.0054***
(0.0017)
0.0024
(0.0020)
0.0011
(0.0011)
0.0007
(0.0012)
0.0018*
(0.0011)
0.0017*
(0.0009)
0.0004***
(0.00004)
0.0003
(0.0013)
0.0039***
(0.0005)
0.0037***
(0.0004)
0.0044***
(0.0013)
0.0066***
(0.0021)
0.0062***
(0.0020)
0.0018
(0.0023)
-0.0018
(0.0013)
-0.0009
(0.0014)
-0.0027**
(0.0012)
0.0015
(0.0011)
EE(res)
0.0010
0.0212
0.0036
0.0036
0.0015
v
7.01
5.07
4.5
4.96
7.22
R2
0.3461
0.3911
0.3066
0.1913
0.2370
Variables
jedad
jgenero
adultos
menor14
mayor65
tipo2
tipo3
tipo4
asalariado
patron
edu
U
Notas: Errores estándar heterocedásticos entre paréntesis. *** estadísticamente significativo al 1%;
**significativo al 5% * significativo al 10%. Fuente: Elaboración Propia.
171
Por lo tanto, en algunos casos se rechaza la endogeneidad mientras que en otros no. Sin
embargo debe tenerse en cuenta una serie de cuestiones al momento de establecer
posiciones definitivas. En primer lugar, el método de corrección descansa en
determinados supuestos. Lo ideal sería compararlos con otras metodologías, como ser la
de Sperlich (2007). Por otra parte, es probable que, dada las dificultades en la captación
del ingreso real de los hogares, la inclusión de la misma genere problemas de ‘errores de
medición’, por lo que podrían buscarse instrumentos alternativos, o instrumentar el
ingreso para evitar el sesgo de los errores de medición.
Suponiendo
que
la
corrección
propuesta
da
resultados
válidos,
¿Cambian
significativamente las curvas de las elasticidades? Esto se responde en la próxima sección,
mostrando adicionalmente el comportamiento de la elasticidad-ingreso.
7.5
Elasticidades-Gasto Corregidas y Elasticidades-Ingreso
Al introducir una variable auxiliar compuesta del residuo derivado de la regresión entre
el logaritmo del gasto total con el ingreso y el régimen de tenencia, luego las elasticidadesgasto deben corregirse por tal factor. Adicionalmente, al utilizar el ingreso del hogar como
instrumento, es posible obtener la elasticidad-ingreso, i.e. el cambio porcentual en la
cantidad demandada (suponiendo precios fijos) ante un cambio porcentual en el ingreso
del hogar.
La Figura 7.8 muestra que la corrección de la elasticidad-gasto por la posible
endogeneidad del gasto total genera un desplazamiento de la curva de elasticidad hacia la
derecha. Por lo tanto, en este caso la elasticidad gasto no corregida estaría sub-estimando
los valores de elasticidad. Por su parte, la curva de elasticidad-ingreso tiene la misma
forma que la de elasticidad gasto, mostrando valores menores que ella. Es decir que, ante
aumentos en ingreso, los aumentos porcentuales de demanda de alimentos serían
menores respecto a los que se dan ante aumentos porcentuales en el gasto total, lo que
tiene sentido al considerar que ante un aumento del ingreso está la decisión de cuánto
ahorrar y cuánto consumir.
172
1.2
Figura 7.8 Elasticidad–Gasto Corregida y Elasticidad Ingreso
0.9
0.8
0.5
0.6
0.7
Elasticidad-Gasto
1.0
1.1
Elasticidad-Gasto
Elasticidad-Ingreso
Elasticidad-Gasto NO Corregida
4
5
6
7
8
ln(G)
Fuente: Elaboración Propia.
Para los alimentos específicos, las elasticidades se muestran en la Figura 7.9. Al comparar
los efectos de la corrección de la elasticidad-gasto, se tiene que sólo en los casos donde no
es rechazada la endogeneidad del gasto total (A1 y A3), existen cambios considerables
entre la elasticidad corregida y no corregida. Particularmente en el caso de los alimentos
A1, la corrección parece ser relevante, y más aún en el extremo superior del gasto total.
En todos los casos, la elasticidad-ingreso no cambia en forma respecto a la elasticidad
gasto, y está por debajo de la misma, siendo consistente en términos económicos.
173
Figura 7.9 Elasticidad–Gasto Corregida y Elasticidad Ingreso. Conjuntos A1-A4
Elasticidad-Gasto
Elasticidad-Ingreso
Elasticidad-Gasto NO Corregida
Elasticidad-Gasto
Elasticidad-Ingreso
Elasticidad-Gasto NO Corregida
0.0
0.0
0.2
0.2
0.4
0.4
0.6
0.6
0.8
A2
0.8
A1
5
6
7
4
8
5
ln(G)
ln(G)
A3
A4
7
8
0.6
0.8
0.4
0.6
0.2
0.4
0.2
Elasticidad-Gasto
Elasticidad-Ingreso
Elasticidad-Gasto NO Corregida
0.0
0.0
Elasticidad-Gasto
Elasticidad-Ingreso
Elasticidad-Gasto NO Corregida
4
5
6
7
ln(G)
7.6
6
0.8
4
8
4
5
6
7
8
ln(G)
Síntesis y Conclusiones
Del análisis de las regresiones semiparamétricas se pudo obtener una cuantificación del
efecto de cada característica socioeconómica y demográfica sobre la participación del
gasto en alimentos, adicionalmente al efecto del gasto total, expresado en una CE no
paramétrica. Los signos y magnitudes de los efectos promedio de cada variable
demográfica, son consistentes con los resultados del análisis de las curvas ESC del
174
capítulo anterior. En general, para todos los conjuntos de alimentos, las variables que
hacen al tamaño, composición y tipología del hogar, son estadísticamente significativas.
Por el contrario, las características del jefe, no lo son en todos los casos, con la excepción
del nivel de instrucción que muestra una relación negativa entre éste y la participación del
gasto en alimentos. Entre éstas, la situación ocupacional parece ser la menos relevante.
Por su parte, la edad tiene efectos positivos significativos en todos los casos, excepto para
los alimentos A1. El género es significativo en el total y en el consumo de carnes,
mostrando que en hogares con jefatura masculina, se asigna una mayor proporción del
gasto a las carnes.
Respecto a la componente no paramétrica, las CE mantienen su forma en relación a las
estimaciones realizadas en el capítulo 5. Al comparar los ‘dos mejores’ estimadores no
paramétricos para cada tipo de alimentos, se concluye que si bien las diferencias son muy
leves, el suavizado spline es superior en términos del menor error de estimación y
predicción.
De la comparación de las elasticidades-gasto, se tiene que aquéllas obtenidas por medio
del spline responden mejor en los extremos. De las elasticidades-gasto derivadas de las
especificaciones W-L seleccionadas, se concluye que para el caso del total de alimentos y
bebidas, la W-L cúbica no representa de manera correcta el comportamiento esperado del
consumidor, y diverge ampliamente de las elasticidades no paramétricas. En los otros
casos, las elasticidades paramétricas son más similares a las no paramétricas, y también
más consistente con la interpretación económica. Sin embargo, ante una CE con varios
cambios de curvatura (como ser el caso de A4), su especificación paramétrica no capta los
cambios de elasticidad involucrados.
Por último, la corrección por la posible endogeneidad del gasto total muestra que sólo
para el total de alimentos y bebidas (A), y para el conjunto A1, tal corrección es
estadísticamente significativa al 1%; y para los alimentos A3 lo es pero a un nivel del 10%.
Por lo tanto, bajo el supuesto de que esta metodología de corrección es la correcta, existen
alimentos que pueden modelarse utilizando el gasto total, asumiendo que el mismo es
exógeno. Por otra parte, en el caso de que no se rechace la endogeneidad, se observó que
la corrección de la elasticidad-gasto es relevante, ya que las mismas resultan
175
subestimadas. A su vez, las curvas de elasticidades-ingreso son menores a la de las
elasticidades-gasto, lo que resulta coherente en términos económicos, al considerar que la
decisión de cuánto consumir y cuánto ahorrar del ingreso total, es previa a la decisión de
cómo gastar.
176
Capítulo 8
Conclusiones
En esta tesis se ha abordado el problema de estimación de curvas de Engel (CE) no
paramétricas y semiparamétricas, en su versión de modelos parcialmente lineales,
tomando el caso del consumo de alimentos en la región pampeana argentina.
Específicamente, se evaluaron tales especificaciones en dos sentidos complementarios.
Desde el punto de vista estadístico, se compararon diferentes estimadores no
paramétricos pertenecientes a la clase de suavizados lineales, en relación a sus errores
empíricos de estimación y predicción, bondad de ajuste, precisión y comportamiento en
los puntos extremos, donde se revelan las mayores diferencias entre las alternativas no
paramétricas seleccionadas. Adicionalmente, tales estimaciones no paramétricas son
utilizadas para contrastar especificaciones paramétricas generalmente utilizadas en la
literatura económica aplicada.
Desde el punto de vista económico, se evaluó la validez de las conclusiones económicas
obtenidas a partir de las formas de las CE arrojadas por los diferentes estimadores no
paramétricos, y de las elasticidades-gasto obtenidas de los mismos.
A partir de este doble análisis evaluativo se estudian los desplazamientos y posibles
cambios de forma que tienen las CE ante cambios en las características demográficas. Con
esto, además de obtener conclusiones relevantes sobre los cambios en los patrones de
consumo de alimentos por cambios en las características, se tienen lineamientos para la
incorporación de interacciones entre las características de los hogares con el poder
adquisitivo de los mismos, en modelos paramétricos.
En las especificaciones semiparamétricas también se comparó la performance de los
métodos no paramétricos intervinientes en el procedimiento de dobles residuos. Esto se
177
realiza entre un par de estimadores elegidos previamente de la evaluación de CE
totalmente no paramétricas. También se estudiaron los efectos marginales de cada
característica del hogar en la participación del gasto en alimentos, y la posible
endogeneidad del gasto total corregida mediante la introducción de una variable auxiliar.
En lo que resta del presente capítulo se expondrán las conclusiones siguiendo el orden
progresivo encontrado en los tres capítulos de la segunda parte de la tesis,
correspondiente a los resultados. Por último se realizan comentarios sobre posibles
extensiones y futuras líneas de investigación que se derivan de la tesis.
Los
primeros resultados empíricos se encuadran en un análisis más metodológico,
enfocado en la elección de los ‘mejores’ suavizados para la componente no paramétrica de
las CE. Inicialmente se elige un criterio uniforme para la selección de los parámetros de
suavizados. Se opta por comparar tres criterios que pueden aplicarse a cualquier
suavizado lineal, y que son consistentes para evaluar el error cuadrático medio del
estimador. Estos son el de convalidación cruzada (CV), la versión mejorada del de
información de Akaike (AICc) y el de convalidación cruzada generalizada (GCV). Este
último es el que muestra un mejor desempeño junto con el AICc. Por ello, en todas las
estimaciones no paramétricas de la tesis se optó por utilizar el criterio GCV, mientras que
el score obtenido del AICc es presentado como una medida de performance adicional, una
vez que los estimadores fueron obtenidos con el suavizado óptimo según el valor mínimo
del GCV.
Las CE no paramétricas estimadas para el total de alimentos y bebidas (A) mostraron un
tramo creciente para el extremo inferior del gasto total, hasta que se alcanza un nivel
máximo de la participación del gasto en alimentos, a partir del cual el comportamiento de
las CE es compatible con la ley de Engel. El tramo creciente de la CE fue explicado por el
hecho de que en hogares de menores recursos, es más probable la existencia de canastas
alimenticias deficientes en cantidad y calidad. Esto hace que la mayor calidad en los
alimentos se convierta en un bien de lujo en el sentido de que un aumento en el poder
adquisitivo del hogar conlleva a incrementar la participación del gasto en alimentos hasta
un punto para el cual los incrementos adicionales del ingreso son destinados a satisfacer
otras necesidades y la participación de los alimentos comienza a decrecer, convirtiéndolos
178
en un bien necesario. Para el caso de los alimentos específicos A1-A4 se observó una
mayor regularidad en la ley de Engel, con cambios en el valor absoluto de las pendientes
de las rectas tangentes (y por ende, en las formas de las CE), no así en el signo, excepto
para alguno estimadores cuyo menor suavizado óptimo se reflejó en una mayor
variabilidad de la CE para en el extremo inferior del gasto total. Las mayores diferencias
entre los estimadores se presentan en ambos extremos, mientras que en los niveles medios
del gasto total son muy similares. En todos los casos, la precisión de los estimadores de las
CE es menor en los extremos. En general, el estimador spline es el que muestra la menor
banda de intervalos de confianza bootstrap.
Con los resultados de las medidas empíricas de performance de los estimadores se llega a
la conclusión de que el estimador spline es el de menor error de predicción y estimación,
seguido en algunos casos por el estimador local lineal o por el local cuadrático,
dependiendo del conjunto de alimentos que se esté considerando. Por su parte, el
estimador N-W es superado por cualquiera de los estimadores alternativos presentados
por lo que no es recomendable su uso en el análisis del comportamiento del consumidor
con datos de encuestas de hogares. Los otros estimadores permiten reducir el sesgo y la
varianza del estimador sin tener que incurrir en una inversión computacional cuantiosa.
Se observó que las medidas de performance estadística de los estimadores no siempre son
consistentes de acuerdo al ranking propuesto de mejores estimadores. Por ello se llevó a
cabo un ejercicio simple de simulación en el que se detectó que el Cp y el AICc representan
de mejor manera el ranking propuesto por los verdaderos errores de estimación y
predicción. De los resultados empíricos se verifica esto, al ser ambas medidas las más
consistentes. Por otra parte, el R-cuadrado no paramétrico, al igual que en el caso
paramétrico, muestra una sensibilidad creciente respecto a los grados de libertad, por lo
que la comparación de la bondad de ajuste entre estimadores no paramétricos no resulta
confiable a menos que se comparen con los mismos grados de libertad. De este análisis se
obtiene que el suavizado spline presenta el mayor R-cuadrado.
En las elasticidades–gasto no paramétricas se obtuvo que los suavizados spline son los
que tienen un mejor desempeño en términos de su interpretación económica. Por un lado,
en general las curvas de elasticidades son decrecientes a lo largo del rango de ingresos o
179
gastos, mostrando una fuerte caída en los niveles de mayor poder adquisitivo, donde es
esperable un mayor efecto saturación. Por otra parte, para intervalos pequeños del
logaritmo del gasto total, las elasticidades-gasto obtenidas por splines muestran ser más
robustas, sin cambios abruptos en la esperanza condicionada de la elasticidad, facilitando
la interpretación económica. En algunos casos las elasticidades obtenidas de los
polinomios locales tienen un comportamiento similar, aunque en algunos casos la
variabilidad es mayor, particularmente en los extremos. Una consideración adicional que
debe hacerse al respecto es que, tanto los splines como los polinomios locales lineales y
cuadráticos, tienen una ventaja adicional sobre el N-W en relación al cómputo de las
elasticidades: Las derivadas primeras de los primeros pueden obtenerse directamente de
la estimación de la CE, mientras que en el caso del N-W es necesario aplicar métodos plugin o estimar numéricamente su derivada.
A pesar de que las curvas de las derivadas y de las elasticidades-gasto mostraron algunas
diferencias importantes entre estimadores, son muy similares cuando se comparan los
promedios o las elasticidades valuadas en el gasto medio. Por lo tanto, si lo que interesa es
una medida resumen de la elasticidad para caracterizar el comportamiento del
consumidor promedio (o el comportamiento promedio del consumidor) cualquier
suavizado lineal dará resultados muy similares de la elasticidad valuada en el gasto
medio (o en la elasticidad promedio), por lo que pueden usarse de manera indiferente.
Con los resultados de las CE no paramétricas, se implementaron dos test de
especificación. Uno paramétrico, basado en una aproximación a la distribución F. Otro no
paramétrico, basado en la distribución empírica del estadístico obtenida mediante réplicas
bootstrap. Se probaron tres especificaciones paramétricas tipo Working-Leser: líneal,
cuadrática y cúbica. Ambos test fueron bastante coincidentes, particularmente cuando el
rechazo (o no rechazo) resulta más tajante según ambas pruebas. En algunos casos más
intermedios, los resultados de los test divergieron. Para el caso del total de alimentos y
bebidas (A) se rechazaron las tres especificaciones. De la inspección gráfica se concluye
que la mejor representación, frente a las alternativas no paramétricas, viene dada por la
Working-Leser cúbica. Para los conjuntos de alimentos específicos, la especificación
cúbica no se rechazó en ningún caso. Sin embargo, para las carnes (A2) y las legumbres,
frutas y verduras (A4), una especificación cuadrática muestra una mejor representación de
180
la CE, lo que es apoyado tanto por los resultados de los test de especificación como por la
inspección gráfica.
Con la selección de los ‘mejores’ estimadores no paramétricos de las CE, se procedió a
analizar el comportamiento de las mismas ante diferentes sub-muestras definidas a partir
de las características demográficas de los hogares. Se seleccionaron los tipos de hogares
(unipersonal, nuclear sin hijos, nuclear con hijos y extendidos) y la presencia de menores
de 14 años y de adultos mayores (mayores de 65 años), para representar el tamaño y la
composición del hogar. Adicionalmente se tomaron dos características del jefe/a de hogar:
el género y la edad. Esta última variable se categorizó a los fines de simplificar el análisis.
Se tomó el criterio del ingreso percibido, lo que dividió a la muestra a partir de los 45 años
de edad. Para analizar los efectos de las características de los hogares, adicionalmente de
estimar CE para cada sub-muestra, se computó el denominado efecto sustitución de las
características (ESC), indicando cómo cambia la asignación del gasto ante un cambio en la
característica del hogar, para un nivel dado del logaritmo del gasto total. Para la
estimación de las CE se utilizaron en un inicio suavizados spline y polinomios locales, de
acuerdo al análisis evaluativo de tales métodos anteriormente realizado. Se encontraron
pocas diferencias entre ambos a los efectos de evaluar los desplazamientos y cambios de
formas de las CE, por lo que en general se optó por trabajar con suavizados spline, los que
a vez mostraron un mejor comportamiento en los extremos.
Considerando los tipos de hogares, se observó que la mayor diferencia en las CE se da
entre los unipersonales y el resto de los hogares. No solo se evidenciaron desplazamientos
sino cambios en la forma. Para los unipersonales en los niveles bajos de gasto total, se
encontró una CE decreciente para el total de alimentos y bebidas, mientras que los otros
tipos de hogares (al igual que en el total de la muestra), la CE es creciente. De aquí se
concluyó que en los unipersonales, las necesidades en cubrir las deficiencias alimentarias
son menores, por lo que un aumento en su poder de compra de los mismos disminuye la
participación de los alimentos a favor de otros bienes. En los intervalos intermedios del
logaritmo del gasto total no se observaron importantes cambios en la forma de las CE, sí
desplazamientos horizontales. Específicamente desplazamientos hacia la derecha de pasar
de un hogar más chico a otro de mayor tamaño. Este resultado pudo ser explicado tanto
181
por el enfoque de Engel como por la existencia de economías de escala en el consumo, a
pesar de que ambos enfoques resulten contradictorios para cuestiones de bienestar.
Más allá de los extremos, para el caso del total de alimentos y bebidas (A) el ESC entre
tipos de hogares mostró ser relativamente constante para los diferentes niveles del gasto
total. No se observó lo mismo para los alimentos A1-A4, donde se tienen relaciones más
claras entre el ESC y el gasto total. En los niveles de gasto total más bajo, se mostró que los
hogares unipersonales asignan un mayor gasto a A3 y A4 y menor a A1 y A2, respecto de
los hogares nucleares y extendidos, lo que fue explicado por el costo y rendimiento de los
platos que suponen los alimentos de A1 y A2, como también por la cultura culinaria
argentina a favor de las pastas y las carnes. Sin embargo, en los ingresos medios, el efecto
del tipo de hogar cambia, mostrando que los hogares nucleares y extendidos destinan un
mayor presupuesto a los cuatro tipos de alimentos, respecto de los nucleares. El efecto de
un hijo en los hogares nucleares, mostró el mismo ‘efecto tamaño’ en los niveles de
menores ingresos, con una sustitución de las frutas por otro tipos de alimentos. Esto
cambia a medida que el ingreso (gasto total) de los hogares se incrementa. Con estos
cambios de signos del ESC se sugiere la incorporación de las interacciones entre el tipo de
hogar y el gasto total, en especificaciones paramétricas; particularmente entre los hogares
unipersonales y el resto. Esto se corrobora al estudiar la derivada promedio del efecto
sustitución de las características, particularmente para el caso de la leche y los productos
lácteos (A3) y de las frutas, legumbres y verduras, lo que también se verifica de los t-test
de los coeficientes de las regresiones paramétricas con interacciones.
Respecto a los menores de 14 años en el hogar, se encontró que la presencia de los mismos
incrementa la participación presupuestaria de los alimentos en un 8.3% en promedio. Para
los alimentos específicos, tal efecto es significativo solo en el caso de la leche y los
productos lácteos (A3) y en el de harinas, panadería, arroz y pastas (A1). La curvas ESC es
claramente decreciente en el logartimo del gasto total, y tal interacción resulta
estadísticamente significativa en el caso del total (A), y para los alimentos específicos A1 y
A3.
Por su parte, se vio que la presencia de un adulto mayor tiene un efecto menor sobre las
CE del total de alimentos, con un cambio de signo en el ESC, mostrando que en hogares
182
de menores ingreso, existe un menor destino de los alimentos en el presupuesto cuando
hay al menos un adulto mayor, ocurriendo lo contrario en el caso de hogares con un gasto
total superior a la media. Para el caso de los alimentos específicos, el mayores efectos
sustitución se dan para las harinas y pastas (A1) y para las carnes (A2), donde la presencia
de al menos un adulto mayor en el hogar, tiene un efecto negativo sobre estos bienes a
favor de un mayor gasto en otros. Tal brecha se cierra y cambia de signo cuando el poder
de compra del hogar es alto. De acuerdo a la derivada del ESC el efecto interacción con el
gasto total es significativo para estos dos tipos de alimentos (A1 y A2) y para el total de
alimentos y bebidas. Sin embargo, en la incorporación paramétrica, solo en este último
caso la interacción entre los adultos mayores y el gasto total, mostró ser estadísticamente
significativa. Sin embargo, como fue oportunamente detallado, el modelo paramétrico se
corre con una variable continua que muestra la cantidad de mayores de 65 años, mientras
que en el análisis del ESC se toma una binaria que refleja la presencia o ausencia del
mismo.
En relación a las características del jefe/a de hogar, en general se observó que para un
nivel fijo de gasto total, un hogar con jefatura masculina destina una mayor parte del
gasto total en alimentos, en relación a los hogares con jefas mujeres. Esto fue explicado
más por el efecto tamaño que por cuestiones de género, al predominar entre los hogares
con jefatura femenina, los unipersonales y nucleares con hijos y madres sin cónyuge. Se
observa un importante efecto interacción, donde la brecha debido al género se va
cerrando para los hogares de mayor gasto total. Considerando los conjuntos particulares
de alimentos, se encontró que cuando el jefe es hombre se tiende a aumentar el consumo
de carne (A2) y lo productos de A1, en relación a los hogares con jefas. Por su parte, éstas
tienden a sustituir el consumo de carnes y harinas por legumbres, frutas, verduras y
lácteos, principalmente en el rango de menor gasto total. En estos casos, las interacciones
más relevantes se dan para A1 y A2, los que muestran una menor diferencia de género en
el consumo. La edad del jefe de hogar, al igual que lo observado con la presencia de
adultos mayores, mostró menores efectos interacción, con un cambio de signo en el nivel
medio del gasto total. En general se encontró que la mayor edad del jefe de hogar tiende a
sustituir alimentos como las harinas, los lácteos y las carnes a favor de las frutas,
legumbres y verduras. Tal efecto se acentúa en los hogares con menores niveles de gasto
183
total. En este caso, solo para el caso de A1 y A2, el efecto interacción es significativo según
la derivada promedio del ESC, no así en la especificación paramétrica, para la cual solo en
las carnes es relevante.
La última parte de la tesis consistió en el estudio de CE especificadas por medio de
modelos parcialmente lineales (MLP), incorporando las características socioeconómicas y
demográficas de los hogares en una sola CE. Dado que el procedimiento de dobles
residuos de Robinson conlleva la estimación de p + 2 regresiones no paramétricas (donde
p es la cantidad de parámetros de la componente paramétrica del MLP), se procedió a
utilizar el mismo método en cada una de ellas, elegidos de acuerdo al análisis evaluativo
de la componente no paramétrica (i.e. correspondiente al logaritmo del gasto total),
utilizando en cada etapa el parámetro de suavizado óptimo de acuerdo al criterio GCV.
Específicamente se compararon las estimaciones utilizando suavizados spline y
polinomios locales, lineales o cuadráticos según la mejor performance revelada para cada
conjunto de alimentos. Los resultados mostraron que los coeficientes estimados de la
componente paramétrica de las CE (i.e. los correspondientes a las variables
socioeconómicas y demográficas de los hogares)
son prácticamente iguales, como
también sus errores estándar heterocedásticos, y con ello, su significancia estadística. En
relación a la parte no paramétrica, las medidas Cp y AICc revelaron menores errores para
los suavizados spline, mientras que la bondad de ajuste, medida por los R-cuadrados del
MLP completo, dio iguales resultados según se aplique spline o polinomios locales en las
regresiones no paramétricas intervinientes. Mayores diferencias se encuentran en las
elasticidades-gastos, donde nuevamente las estimaciones obtenidas con suavizado spline
muestran un mejor comportamiento para el análisis económico.
En general, para todos los conjuntos de alimentos, las variables que hacen al tamaño,
composición y tipología del hogar, mostraron ser estadísticamente significativas, cuyos
signos y magnitudes resultaron consistentes de acuerdo a lo encontrado a partir de los
ESC. En los modelos semiparamétricos se incluyeron otras características del jefe, además
del género y la edad, como ser el nivel de instrucción y la situación ocupacional. La
primera mostró ser significativa con un efecto negativo sobre la participación del gasto en
alimentos, mientras que la segunda en pocos casos mostró un impacto estadísticamente
significativo.
184
Las elasticidades-gasto obtenidas de los modelos semiparamétricos mostraron diferencias
relevantes respecto a las de una CE totalmente paramétrica. Particularmente, para el caso
del total de alimentos y bebidas, la W-L cúbica no sólo diverge bastante de las no
paramétricas sino que para los mayores niveles de gasto total reveló una clara tendencia
creciente, lo que no es esperable dado el principio económico de saturación. Para los
conjuntos
específicos
A1-A4,
las
elasticidades
paramétricas
tuvieron
mayores
coincidencias con las no paramétricas, aunque sin captar algunos cambios de curvatura
representados por estas últimas. Al comprar los coeficientes de la componente
paramétrica del MLP con los de las CE totalmente paramétricas, las diferencias son
mínimas, manteniéndose las conclusiones obtenidas de la interpretación económica.
Dada la posible simultaneidad de la elección del gasto total y la de un gasto en un bien en
particular, se estudió la posible endogeneidad del gasto total en las CE debido a tal
simultaneidad. Se realizó un procedimiento simple consistente en incorporar una variable
auxiliar de forma paramétrica dentro del MLP, y estudiar su significancia. Si tal variable
es estadísticamente significativa, entonces se rechaza el supuesto de exogeneidad del
gasto total. Tal variable auxiliar surge de los residuos de la regresión entre el gasto total y
variables instrumentales elegidas a tal efecto. Comúnmente se toma al ingreso total como
instrumento al considerarlo exógeno respecto a las decisiones de gasto en bienes
específicos, y por estar muy correlacionado con el gasto total. En esta tesis se consideró el
ingreso total del hogar y el régimen de tenencia de la vivienda, ambos significativos para
explicar el gasto total del hogar. Los resultados mostraron que sólo para el total de
alimentos y bebidas y para el conjunto A1, la variable auxiliar es significativa a un nivel
del 1%, mientras que para A3 lo es a un nivel del 10%. Por lo tanto, suponiendo que se
cumplen los supuestos que fundamentan esta metodología, las CE de algunos alimentos
pueden estimarse suponiendo que el gasto total es exógeno (como ser para A2 y A4),
mientras que en otros resulta conveniente la corrección. Puesto que la corrección por
endogeneidad conlleva a una a nuevas formas de cómputo de las elasticidades-gasto, los
resultados muestran que las mismas tienen mayor importancia en los casos donde no se
rechaza la endogeneidad, mostrando una subestimación en caso de no corregirlas. Este
hecho adquiere mayor importancia cuando son comparadas con las elasticidades-ingreso,
las que pudieron ser obtenidas al utilizar el ingreso total como instrumento. En general,
185
dado que la decisión de cuánto consumir y cuanto ahorrar del ingreso total, es previa a la
decisión de cómo gastar, es esperable, en términos económicos, que las elasticidadesingreso sean menores a las elasticidades-gasto. Esto es corroborado al comparar las
elasticidades-gasto corregidas con las elasticidades-ingreso. Sin embargo, si se toman las
elasticidades sin corregir, ocurre lo contrario, principalmente en aquellos casos donde la
hipótesis de exogeneidad del gasto fue rechazada. Por ello, para obtener mediciones
fiables del comportamiento del consumidor, es recomendable contrastar la posible
endogeneidad del gasto total.
De este trabajo de tesis surgen varios aspectos que sugieren la continuación del análisis de
CE no paramétricas y semiparamétricas en futuras investigaciones. En lo que sigue se
enumeran algunas de ellas, las que a juicio del autor, son más relevantes:
-
En el proceso de evaluación de regresiones no paramétricas de CE, el estudio se
acotó a una serie de suavizados lineales debido a su importancia en la literatura
empírica relevada. Una extensión sería, claramente, la comparación con otros
estimadores no paramétricos, como ser los suavizados utilizando funciones
ortogonales o Wavelets, entre otros. Adicionalmente se podría aplicar otros
métodos o medidas de evaluación para el análisis comparativo.
-
Existen otros métodos semiparamétricos que permitirían incorporar las variables
demográficas de forma no paramétrica, y contrastar hasta que punto su
incorporación paramétrica en los MLP es válida. Particularmente, con un modelo
aditivo parcialmente lineal, puede trabajarse este punto. De hecho, existen trabajos
recientes de este tipo, no así para el consumo de alimentos en Argentina.
-
Para la corrección por endogeneidad, podrían aplicarse otros métodos más
recientes de variables instrumentales para MLP que descansan en supuestos más
laxos, a pesar de que impliquen una implementación más costosa.
-
Quizás la extensión posible más evidente, es la especificación de CE por medio de
un MLP con coeficientes variables o suaves (Semiparametric Varying Coefficient
Model), donde los coeficientes que acompañan a las variables socioeconómicas y
demográficas se especifican como funciones no paramétricas del gasto total. De
186
esta manera se tiene la incorporación de las posibles interacciones en un marco
semiparamétrico de mayor flexibilidad.
-
Por último, en lo que hace a la relevancia para el análisis económico, su
actualización es necesaria para un conocimiento más actual del comportamiento
del consumidor en Argentina. Esto podrá realizarse una vez que se cuente con
datos disponibles de nuevas encuestas de gastos de hogares para Argentina, o bien
de la ENGH 2004/05 del total país, la que, por el momento, no fue puesta a
disposición de los investigadores.
187
Anexo 1
Medidas de Performance de Estimaciones No
Paramétricas de CE. Una Simulación de Monte
Carlo
En el presente Anexo se busca evaluar las medidas de performance que son utilizadas en
la presente tesis (particularmente, en el Capítulo 5) para comparar los diferentes tipos de
estimadores no paramétricos. Tal evaluación se realizará mediante un sencillo ejercicio de
simulación, en donde las verdaderas curvas de Engel se corresponden con alguna versión
de la forma funcional Working-Leser, sea lineal, cuadrática o cúbica. De esta manera, se
generan datos a partir de la siguiente especificación polinómica general de una WorkingLeser paramétrica:
wi = bi 0 + bi1 X i + bi 2 X i2 + bi 3 X i3 + u
(1a)
Con
(
X i ~ N µ X , σ X2
)
(
)
, u i ~ N 0, σ X2 ( X i )
(2a)
De (1a)-(2a) se pueden plantean tres modelos: lineal, cuadrático y cúbico. Los parámetros
de los modelos son calibrados a partir de los datos de la ENGH tomando el consumo de
alimentos y bebidas (A), para lo cual se tienen los siguientes valores:
-
Lineal: bi 0 = 1.13 , bi1 = −0.11 , bi 2 = bi 3 = 0 ;
(3a)
-
Cuadrático: bi 0 = 0.95 , bi1 = −0.06 ; bi 2 = 0.005 , bi 3 = 0 ;
(4a)
-
Cúbico: bi 0 = −2.36 , bi1 = 1.58 ; bi 2 = −0.27 , bi 3 = 0.014 ;
(5a)
188
A su vez, se fija µ X = 6.3 y σ X2 = 0.75 . Dada las características de los datos
microeconómicos, los términos de error se modelan heterocedásticos, en función de X .
Para la especificación de la función de varianza se siguió a Camero y Trivedi (2005),
ajustando los valores de acuerdo a la calibración basada en la ENGH. De esta manera se
toma
u i = ε i (0.15 − 0.2 X i
con ε i ~ N (0,0.16 )
(6a)
Los datos se generan considerando tres tamaños de muestra (N): 100,1000 y 5000. En base
a los datos simulados, se estima el modelo E(w | X ) = m( X ) utilizando los cuatro
estimadores propuestos: el N-W, polinomios locales lineales y cuadráticos, y suavizados
splines, siguiendo el criterio de convalidación cruzada generalizada (GCV) para la
elección del suavizado. A partir tales estimaciones se computan las medidas empíricas de
performance o evaluación estadística presentados en el Capítulo 3 y aplicados en el
Capítulo 6: los errores cuadráticos ECPP y EAPP, el estadístico Cp y el AICc. A los fines de
evaluarlos, se los compara con el error cuadrático promedio y el error de predicción, i.e.
N
ECPnp ≡ N −1 ∑ (mˆ np ( X i ) − m( X i ))
2
(7a)
i =1
Donde m( X i ) =
∑b
ij
X i j según
cuál de los modelos (3a)-(4a) se está postulando, y
j
m̂( X i ) es el valor estimado de la función en X i , para un determinado estimador no
paramétrico np, con np=N-W,PL1,PL2,SS. Adicionalmente, se computa el error promedio
de predicción
N
( ( ) ( ))
EPPnp ≡ N −1 ∑ mˆ np X i+ − m X i+
2
(8a)
i =1
Siendo { X i+ }iN=1 una sucesión de nuevas observaciones. Puesto que en la simulación se
realizan varias réplicas, si con X i ,k se denota a la observación i muestreada en la etapa k,
+ N
N
luego en la estimación del modelo con la réplica k se toma { X i }i =1 ≡ { X i ,k −1 }i =1 . Es decir,
se toma como nuevo conjunto de variables para evaluar la predicción, al conjunto de covariables de la réplica anterior. Específicamente, dados los estimadores no paramétricos
189
de una réplica k, los mismos se utilizan para predecir con los valores muestreados en la
etapa anterior, y a su vez, se calcula la predicción según el ‘verdadero’ modelo.
De esta manera, se compararán los valores de las medidas empíricas de performance con
los verdaderos errores de estimación y predicción dados por (7a) y (8a). Claro está que las
conclusiones quedan acotadas a que la CE verdadera toma la forma simple dada en (1a).
En la Figura A.1 se presentan las nubes de puntos generadas por los tres modelos
simulados, para una determinada réplica de 1000 observaciones. Se observa que la forma
funcional subyacentes a cada una de ellas no es directamente visible. Se puede ver una
mayor variabilidad en el extremo inferior de las X’s, lo que es compatible con los
observados de la encuesta de gastos.
Figura A.1 Diagrama de puntos de los datos generados. N= 1000
Cuadrática
Cúbica
y
y
0.0
0.0
0.2
0.2
0.2
0.4
0.4
y
0.4
0.6
0.6
0.6
0.8
Lineal
4
5
6
7
x
8
9
4
5
6
7
x
8
9
4
5
6
7
8
9
x
Fuente: Datos generados a partir de los parámetros (1a)-(6a)
Para esta réplica, las curvas estimadas por cada método, concatenadas con la verdadera
curva, se presentan en las Figuras A.2-A.4. Las mismas ya dan una idea sobre qué
estimador es más exacto en cada caso, sin embargo los resultados varían ante diferentes
réplicas. Por ello, la simulación se lleva a cabo con 500 réplicas, para luego comparar los
promedios de las medidas de evaluación de estimadores seleccionadas. Tales resultados
son presentados en las Tablas A1-A3, para las tres formas funcionales elegidas.
190
0.6
0.6
0.7
0.7
Figura A.2 Estimaciones No Paramétricas. CE Lineal
Recta verdadera
Estimador N-W
0.5
0.2
0.2
0.3
0.4
w
0.4
0.3
w
0.5
Recta verdadera
Estimador Local Lineal
4
5
6
7
8
9
4
5
6
X
7
9
0.6
0.6
0.7
0.7
X
Recta verdadera
Estimador Local Cuad
0.2
0.2
0.3
0.4
0.4
w
0.5
0.5
Recta verdadera
Suavizado Spline
0.3
w
8
4
5
6
7
X
8
9
4
5
6
7
8
9
X
Fuente: Funciones generadas a partir de los parámetros (3a)-(5a), y curvas no paramétricas ajustadas
191
0.6
0.6
Figura A.3 Estimaciones No Paramétricas. CE Cuadrática
0.5
Curva verdadera
Estimador Local Lineal
0.0
0.0
0.1
0.1
0.2
0.2
0.3
0.3
w
w
0.4
0.4
0.5
Curva verdadera
Estimador N-W
4
5
6
7
8
4
9
5
6
7
8
9
X
0.6
0.6
X
0.5
Curva verdadera
Suavizado Spline
0.0
0.0
0.1
0.1
0.2
0.2
0.3
0.3
w
w
0.4
0.4
0.5
Curva verdadera
Estimador Local Cuad
4
5
6
7
X
8
9
4
5
6
7
8
9
X
Fuente: Funciones generadas a partir de los parámetros (3a)-(5a), y curvas no paramétricas ajustadas
192
0.5
0.5
Figura A.4 Estimaciones No Paramétricas. CE Cúbica
Curva verdadera
Estimador Local Lineal
0.2
0.2
0.3
0.3
w
w
0.4
0.4
Curva verdadera
Estimador N-W
4
5
6
7
8
9
4
5
6
X
7
8
9
0.5
0.5
X
0.2
0.3
w
0.2
0.3
w
0.4
Curva verdadera
Suavizado Spline
0.4
Curva verdadera
Estimador Local Cuad
4
5
6
7
X
8
9
4
5
6
7
8
9
X
Fuente: Funciones generadas a partir de los parámetros (3a)-(5a), y curvas no paramétricas ajustadas
Para el caso de que el verdadero modelo sea el lineal (Tabla A.1) se observa que mientras
el estimador N-W es el que muestra los menores valores del ECPP y del EAPP, para el
AICc y el Cp este estimador arroja los mayores valores. Análogamente, aunque forma
inversa, ocurre con el suavizado spline. Sólo coinciden para el caso del polinomio local
lineal, colocándolo en el segundo lugar en términos del menor error. Al observar los
valores del ECP y el EPP, el estimador con menor error es el suavizado spline, seguido del
estimador local lineal. Por lo tanto, sólo las medidas empíricas AICc y Cp proponen un
ranking de evaluación consistente con los errores de estimación y predicción reales (i.e.
ECP y EPP).
193
Tabla A.1 Medidas de Performance de los Estimadores. CE Lineal
v
ECPP
EAPP
AICc
Cp
ECP
EPP
5.47 0.007976 0.070902 -3.70360 0.008886
0.00056
0.00056
4.57 0.007920 0.070613 -3.73079 0.008678
0.00046
0.00041
4.67 0.007959 0.070772 -3.72291 0.008740
0.00048
0.00049
3.56 0.008049 0.071318 -3.73699 0.008633
0.00035
0.00028
9.95 0.008445 0.073132 -3.75304 0.008614
0.00009
0.00009
4.61 0.008476 0.073269 -3.76020 0.008554
0.00005
0.00003
5.22 0.008478 0.073274 -3.75876 0.008567
0.00005
0.00004
3.95 0.008484 0.073305 -3.76055 0.008551
0.00004
0.00003
N=100
NW
PLL
PLC
Spline
N=1000
NW
PLL
PLC
Spline
N=5000
NW
15.07 0.008504 0.073365 -3.76102 0.008555 0.000026 0.000027
PLL
4.88 0.008518 0.073433 -3.76345 0.008534 0.000009 0.000006
PLC
5.61 0.008518 0.073434 -3.76312 0.008537 0.000011 0.000009
Spline
3.94 0.008521 0.073444 -3.76350 0.008534 0.000007 0.000005
Fuente: Elaboración propia en base a los resultados de las 500 replicaciones simuladas.
Si la curva verdadera es la cuadrática, los estimadores que arrojan el menor error (real)
son los polinomios locales cuadráticos y, nuevamente, los suavizados spline. Mientras que
los estadísticos AICc y Cp muestran ser consistentes con ello, los errores medios empíricos,
en términos cuadrático como absoluto, muestran resultados totalmente contrapuestos. Se
observa de la Tabla A.2 que los grados de libertad óptimos (v) del estimador N-W difieren
mucho del resto, y puesto que el ECPP y el EAPP no corrige por los mismos
(contrariamente del Cp y el AICc), la ineficacia de tales medidas se realza con ello.
194
Tabla A.2 Medidas de Performance de los Estimadores. CE Cuadrática
v
ECPP
EAPP
10.8
0.00764
0.06915
5.7
0.00785
4.7
AICc
Cp
ECP
EPP
-3.616
0.00951
0.00107
0.00167
0.07019
-3.7149
0.00881
0.00064
0.00074
0.00796
0.07077
-3.7229
0.00876
0.00048
0.00049
4.8
0.00797
0.07101
-3.7199
0.00878
0.00047
0.00047
18.8
0.0084
0.07292
-3.7402
0.00872
0.00018
0.00022
9.7
0.00843
0.07302
-3.7556
0.00859
0.00009
0.00010
5.2
0.00848
0.07327
-3.7588
0.00857
0.00005
0.00004
6.5
0.00847
0.07324
-3.7574
0.00858
0.00006
0.00005
23.7
0.00851
0.07339
-3.7569
0.00859
0.00006
0.00007
13.6
0.0085
0.07335
-3.762
0.00855
0.00002
0.00003
5.6
0.00852
0.07343
-3.7631
0.00854
0.00001
0.00001
8.0
0.00851
0.07342
-3.7626
0.00854
0.00001
0.00001
N=100
N-W
PLL
PLC
Spline
N=1000
N-W
PLL
PLC
Spline
N=5000
N-W
PLL
PLC
Spline
Fuente: Elaboración propia en base a los resultados de las 500 replicaciones simuladas.
Para el caso del modelo cúbico, las conclusiones son similares, aunque mientras las
medidas empíricas muestran valores que sugieren indiferencia entre la elección de dos
estimadores alternativos, las medidas reales de error, muestran un clara superioridad del
spline cuando N=100 y N=1000 (aunque una menor diferencia en este último caso), y para
N=5000, donde los errores se reducen considerablemente, el polinomio local cuadrático
supera al spline.
195
Tabla A.3 Medidas de Performance de los Estimadores. CE Cúbica
v
ECPP
EAPP
AICc
Cp
ECP
EPP
5.98
0.00793
0.07068
-3.6971
0.00893
0.00059 0.000604
4.9
0.0079
0.07049
-3.7255
0.00872
0.00054 0.000563
4.91
0.00794
0.07067
-3.7198
0.00876
0.00053 0.000593
4.1
0.00803
0.07127
-3.7271
0.00871
0.00045
0.00045
10.7
0.00844
0.0731
-3.7522
0.00862
0.00010
0.00010
7.78
0.00845
0.07314
-3.757
0.00858
0.00008
0.00009
6.58
0.00847
0.07322
-3.7574
0.00858
0.00007
0.00007
7.02
0.00846
0.07323
-3.7567
0.00858
0.00006
0.00006
16.1
0.0085
0.07336
-3.7608
0.00856
0.00003
0.00003
12
0.0085
0.07336
-3.7622
0.00854 0.000023 0.000024
7.86
0.00851
0.07342
-3.7626
0.00854 0.000016 0.000016
9.41
0.00851
0.07341
-3.7622
0.00854 0.000017 0.000017
N=100
NW
PLL
PLC
Spline
N=1000
NW
PLL
PLC
Spline
N=5000
NW
PLL
PLC
Spline
Fuente: Elaboración propia en base a los resultados de las 500 replicaciones simuladas.
Mientras que las medidas de error ECP y EPP muestran disminuciones considerables con
el tamaño de muestra, siendo esto consistente con la teoría estadística, no se observa lo
mismo en las medidas empíricas.
Por lo tanto, este ejercicio de simulación ha mostrado que las medidas más simples para
evaluar la performance y comparar estimadores no paramétricos, el ECPP y el EAPP, no
resultan muy recomendables si el modelo que se está estimando tiene una función ‘muy’
suave y simple como ser lineal, cuadrático o cúbico. Sin embargo, las mismas son muy
utilizadas en la literatura empírica, por lo que estos resultados buscan mostrar una alerta
196
para las futuras investigaciones. Como contraparte se observa que los estadísticos Cp y
AICc muestran muy buen desempeño para tales fines.
Para una interpretación cautelosa de estos resultados deben tenerse en cuenta las
siguiente consideraciones: 1) Para cada estimador se aplicó el criterio de convalidación
cruzada generalizada (GCV) para la obtención del suavizado óptimo. Por lo tanto, otro
criterio podría arrojar diferentes resultados para las medidas de evaluación. 2) Las CE que
se proponen como verdaderas, adoptan una forma quizás muy simple y suave para
evaluar el desempeño de las medidas empíricas. Sin embargo, tales formas funcionales
son las más vistas como especificaciones paramétricas en la literatura micro-econométrica.
3) Quizás sea más informativo evaluar las medidas empíricas para estimadores con los
mismos suavizados o grados de libertad. Pero si se quiere evaluar la decisión del
investigador aplicado, en elegir el método y luego suavizarlo con algún criterio
automático, es más informativo mirar el output que tendría de su elección. 4) Para los
datos reales (Capítulo 5), se observaron mayores coincidencias entre las medidas de
performance, por lo que su uso complementario puede ser recomendable, y más aún
cuando no puede probarse estadísticamente que las CE se corresponden con alguna forma
simple conocida, como ocurre para el caso de alimentos y bebidas en general.
197
Anexo 2
Resultados de las Especificaciones Paramétricas
En este Anexo se presentan los resultados de las estimaciones de las CE paramétricas,
seleccionadas de acuerdo a los resultados de los test de especificación. Los mismos
constituyen un soporte adicional para los capítulos 6 y 7. En un caso, presentando los
resultados de las especificaciones paramétricas incluyendo solo las características
demográficas de los hogares, con sus interacciones relevantes, analizadas en el capítulo 6.
Luego se presentan los resultados de la CE incluyendo adicionalmente la situación
ocupacional y educación del jefe de hogar, en este caso sin interacciones, con el objetivo
de comparar con los resultados de las CE semiparamétricas del capítulo 7.
Si bien para el caso del total de alimentos y bebidas se rechazaron las tres especificaciones
tipo W-L, se seleccionó la cúbica como la mejor alternativa frente a la lineal y a la
cuadrática. Para los casos de los conjuntos A1-A4, se tiene que varias formas de la W-L no
fueron rechazadas. Junto con la inspección gráfica se seleccionaron la cúbica para A1 y
A3, y la cuadrática para A2 y A4.
En el capítulo 6, a partir de las derivadas promedios del ESC, se detectan las interacciones
más relevantes. Al incluirlas en una especificación paramétrica, lo resultados no son
totalmente coincidentes respecto a la significancia estadística de las interacciones. Sin
embargo, como se explicó oportunamente, para la construcción de las curvas ESC es
necesario la definición de categorías simples que representen a las características
demográficas de los hogares, mientras que en los modelos paramétricos algunas de tales
características fueron incluidas como variables continuas o de conteo, como ser la edad y
la composición etaria. Por ello es esperable que las conclusiones de ambos análisis difieran
en algún punto.
198
En la Tabla A.4 se presentan las salidas de los modelos paramétricos seleccionados,
incluyendo solo las características demográficas analizadas por medio de las curvas ESC42.
Tabla A.4 CE Paramétricas con Variables Demográficas e Interacciones. A1-A4
Alimentos
Variables
jedad
jgenero
menor14
mayor65
tipo2
tipo3
tipo4
ln G
ln G2
ln G3
jgenero * ln G
A1
A2
A3
A4
0.0005***
(0.00005)
0.0353***
(0.0134)
0.0330***
(0.0054)
-0.0055***
(0.0012)
0.0150***
(0.0022)
0.0872***
(0.0156)
0.105***
(0.0187)
0.0728
(0.104)
-0.0248
(0.0162)
0.0018**
(0.0008)
-0.0044**
(0.002)
-0.00014
(0.00049)
0.0563***
(0.0185)
0.0042***
(0.0007)
-0.0074***
(0.0017)
0.0236***
(0.0033)
0.0396***
(0.0028)
0.0450***
(0.003)
-0.109***
(0.0170)
0.0043***
(0.0012)
0.0001***
(0.00003)
-0.0003
(0.001)
0.0144***
(0.0044)
0.0024***
(0.0009)
-0.0408**
(0.0161)
-0.0321**
(0.0155)
-0.0441**
(0.0172)
-0.201**
(0.0852)
0.0249*
(0.0131)
-0.0011*
(0.0007)
0.0005***
(0.00004)
0.0024*
(0.0012)
0.0036***
(0.0004)
-0.0009
(0.0011)
-0.0253
(0.019)
-0.0131
(0.0168)
-0.0425**
(0.0186)
-0.0588***
(0.0112)
0.0022**
(0.0009)
jedad * ln G
menor14 * ln G
-0.006**
(0.0028)
0.0001*
(0.00007)
-0.0037***
(0.0008)
tipo2 * ln G
tipo3 * ln G
tipo4 * ln G
Constante
R2
-0.0096***
(0.0024)
-0.0114***
(0.0029)
0.109
(0.220)
0.366
0.546***
(0.0623)
0.292
-0.0015**
(0.0007)
0.007***
(0.0025)
0.0064***
(0.0024)
0.0079***
(0.0027)
0.593***
(0.182)
0.192
0.0059**
(0.003)
0.0045*
(0.0026)
0.0089***
(0.0029)
0.304***
(0.0364)
0.229
Notas: Errores estándar heterocedásticos (robustos) entre paréntesis.***significativo al 1%; **significativo al
5%; * significativo al 10%. Tipo de hogar base: tipo 2, nuclear sin hijos. Fuente: Elaboración propia
Para el total de alimentos y bebidas, en el capítulo 6 se presentan modelos paramétricos correspondientes
(Tabla 6.3).
42
199
El análisis de las interacciones son tratadas en el capítulo 6. Conviene aclarar nuevamente
que los coeficientes de las variables ‘propias’ que a su vez son incorporadas con su efecto
interacción, ahora representan el efecto marginal sobre la participación del gasto cuando
el logaritmo del gasto total es igual a cero. Por lo tanto el signo y magnitud de tales
coeficientes no es comparable con las salidas de la componente paramétricas de los MLP.
Para comparar las especificaciones semiparamétricas (MPL) con las paramétricas, los
resultados de esta última son presentados en la tabla A.5. De los resultados de las
componentes paramétricas de los MLP presentados en las tablas 7.1-7.5, se observa que
los efectos marginales de las características socioeconómicas y demográficas de los
hogares son muy similares, y en algunos casos iguales, a los del modelo totalmente
paramétrico. Sin embargo, en el capítulo 7 se vio que en las elasticidades-gasto, las que
son funciones del efecto marginal del gasto total, se observan importantes diferencias. Los
R-cuadrados de los modelos paramétricos son menores a los de los semiparamétricos.
Aquí debe notarse que para la estimación del efecto del gasto total, en los modelos
paramétricos se utilizan a lo sumo cuatro parámetros incluyendo al intercepto, mientras
que en los modelos semiparamétricos el valor óptimo de v
(esto es, la cantidad
equivalente de parámetros para estimar la componente no paramétrica) en general supera
a cuatro. Por lo tanto, entre las especificaciones paramétricas y semiparamétricas, no
existen muchas diferencias en las estimaciones de los parámetros (y en sus desvíos
estándar) respecto a la componente paramétrica de estos últimos, sí en el impacto
estimado del gasto total. A pesar de ello, como se vio en los capítulo 5 y 7, si se toma el
promedio, sea través de las derivadas evaluadas en el gasto medio o en las derivadas
promedio ponderadas por la distribución del logaritmo del gasto total, las diferencias
entre el efecto no paramétrico y el paramétrico del gasto total resultan en muchos casos
despreciables.
200
Tabla A.5 CE Paramétricas Seleccionadas. Total Alimentos y Bebidas (A) y Subconjuntos
A1-A4
Variables
jedad
jgenero
adultos
menor14
mayor65
tipo2
tipo3
tipo4
asalariado
patron
edu
ln G
ln G2
ln G3
Constante
Observaciones
R
2
Alimentos
A2
A
A1
A3
A4
0.0012***
(0.0002)
0.0324***
(0.0046)
0.0243***
(0.0018)
0.0253***
(0.0016)
0.0208***
(0.0047)
0.0217***
(0.0075)
0.0328***
(0.0071)
0.0252***
(0.0082)
0.0014
(0.0049)
0.0085
(0.0052)
-0.0343***
(0.0048)
1.551***
(0.297)
-0.272***
(0.0468)
0.0145***
(0.0024)
-2.375***
(0.623)
0.0001
(0.0001)
0.0013
(0.0014)
0.0104***
(0.0006)
0.0102***
(0.0005)
0.0083***
(0.0015)
0.0119***
(0.0022)
0.0126***
(0.0022)
0.0112***
(0.0027)
-0.0042***
(0.0015)
-0.0021
(0.0016)
-0.0063***
(0.0012)
0.135
(0.102)
-0.0355**
(0.016)
0.0022***
(0.0008)
0.0310
(0.217)
0.0004***
(0.00007)
0.0128***
(0.002)
0.0081***
(0.0008)
0.0044***
(0.0007)
0.0046**
(0.0021)
0.0183***
(0.0033)
0.025***
(0.003)
0.0242***
(0.0036)
0.00008
(0.0021)
0.0027
(0.0023)
-0.0113***
(0.0018)
-0.101***
(0.0151)
0.0038***
(0.0012)
0.0004***
(0.00004)
0.0002
(0.0013)
0.0038***
(0.0005)
0.0038***
(0.0004)
0.0043***
(0.0013)
0.0066***
(0.0021)
0.006***
(0.002)
0.0014
(0.0023)
-0.0022*
(0.0013)
-0.0012
(0.0014)
-0.003***
(0.0012)
-0.0621***
(0.0109)
0.0028***
(0.0008)
0.522***
(0.0495)
0.0001***
(0.00004)
-0.0009
(0.0011)
0.0011**
(0.0004)
0.0049***
(0.0004)
0.0038***
(0.0011)
0.0008
(0.0017)
0.0051***
(0.0017)
0.0022
(0.002)
0.0008
(0.0012)
0.0004
(0.0012)
0.0014
(0.001)
-0.241***
(0.0858)
0.0314**
(0.0132)
-0.0015**
(0.0007)
0.666***
(0.184)
7,592
0.340
7,500
0.386
7,107
0.306
6,705
0.191
7,258
0.235
0.307***
(0.0356)
Notas: Errores estándar heterocedásticos (robustos) entre paréntesis.***significativo al 1%; **significativo al
5%; * significativo al 10%. Tipo de hogar base: tipo 2, nuclear sin hijos. Fuente: Elaboración propia
201
Referencias
ABDI, H. (2007). The Method of Lest Squares. En Salkind, N.J.
Measurement and Statistics (p. 530). Thousand Oaks (CA): Sage.
(Ed.). Encyclopedia of
ALLEN, D. M. (1974). The relationship between variable selection and data augmentation
and a method for prediction. Technometrics, 16,125–127.
ALLEN, R. G. AND A. BOWLEY (1935). Family Expenditure: A Study of its Variation. London:
P.S. King & Son.
ALTHAUSER, R. (1971). Multicollinearity and Non-additive Regression Models. In Causal
Models in the Social Sciences, H. M. Blalock Jr. (ed). Chicago: Aldine-Atherton.
ALVAREZ, M. AND L. PINOTTI (1999). A la Mesa. Ritos y retos de la Alimentación Argentina.
Buenos Aires: Grijalbo Editorial.
AYDIN D. (2007). A Comparison of the Nonparametric Regression Models using
Smoothing Spline and Kernel Regression. World Academy of Science, Engineering
and Technology, 36, 253-257.
AYDIN D. AND R. OMAY (2007). The Empirical Performances of the Selection Criteria for
Nonparametric Regression Using Smoothing Spline. Proceedings of the 5th WSEAS
Int. Conf. on Computational Intelligence, Man- Machine Systems and Cybernetics,
Venice, Italy, November 20-22.
BHALOTRA, S. AND C. ATTFIELD (1998). Intrahousehold Resource Allocation in Rural
Pakistan: a Semiparametric Analysis. London School of Economics and Political Science
Discussion Paper, DEDPS/11.
BANKS J., BLUNDELL, R. AND A. LEWBEL (1997). Quadratic Engel Curves and Consumer
Demand. Journal of Economics and Statistics, 79 (4), 527-539.
BARNETT W. A. AND A. SERLETIS (2008). Consumer Preferences and Demand Systems.
Journal of Econometrics, 79 (4), 527-539.
BARRIENTOS MARÍN, J. (2006). Estimation and Testing An Additive Partially Linear Model
in a System of Engel Curves. EVIE Working Papers, WP-AD 2006-23, University of
Alicante.
BARRIENTOS MARÍN, J. (2009). On the Consumer Behavior in Urban Colombia: The Case of
Bogotá. Ensayos sobre Política Económica (Colombia), 27 (59), 46-82.
BARRIENTOS MARÍN, J., GALLEGO J. Y J. SALDARRIAGA (2011). La Curva de Engel de los
Servicios de Salud en Colombia. Una Aproximación Semiparamétrica. Lecturas de
Economía, 74, 203-229.
BARTEN, A. (1969). Family Composition, Prices and Expenditure Patterns. In Econometric
Analysis for National Economic Planning, P. Hart, G. Mills and Jhon k. Whitaker (eds.),
London: Butterworths.
BERGES, M. Y K. CASELLAS. (2007). Estimación de un Sistema de Demanda de Alimentos:
Un Análisis Aplicado a Hogares Pobres y No Pobres. En Da Silveira F., Servo L.,
Menezes, T. y
Piola S. (comp.),
Gasto e Consumo das Famílias Brasileiras
Contemporâneas. Vol. 2 (pp. 529-551), IPEA, Brasilia.
202
BERGES, M. (2010). Escalas de Equivalencia y Cambios en el Nivel de Bienestar de los
Hogares de la Ciudad de Buenos Aires. Anales de la XLV Reunión Anual de la Asociación
Argentina de Economía Política, Buenos Aires.
BIERENS, H. (1990). A Consistent Conditional Moment Test of Functional Form.
Econometrica, 58, 1443-1458.
BIERENS, H. AND H. POTT-BUTER (1990). Specification of Household Engel Curves by
Nonparametric Regression. Econometric Reviews, 9, 123-184.
BLAUG, M. (1985) Metodología de la Economía. Madrid: Editorial Alianza Universidad
BLOW, L. (2003). Demographics in Demand Analysis. The Institute for Fiscal Studies,
Working Paper 03/18.
BLUNDELL, R. AND A. DUNCAN (1998). Kernel Regression in Empirical Microeconomics.
The Journal of Human Resources, 33 (1), 62-87.
BLUNDELL R. DUNCAN A. AND PENDAKUR K.(1998). Semiparametric Estimation and
Consumer Demand” Journal of Applied Econometrics, 13, 435-461.
BLUNDELL, R., BROWNING, R, AND I. CRAWFORD (2003). Nonparametric Engel Curves and
Revealed Preference. Econometrica, 71 (1), 205-240.
BLUNDELL, R., CHEN X. AND D. KRISTENSEN (2007). Semi-Nonparametric IV Estimation of
Shape-Invariant Engel Curves. Econometrica, 75(6), 1613-1669.
BORRÁS CATALÁ V. (2007). Las Desigualdades en el Consumo a través del Género. Revista
Española de Sociología, 8, 139-156.
BROWN, A. AND A. DEATON (1972) Surveys in Applied Economics: Models of Consumer
Behavior. The Economic Journal, 82 (328), 1145-1236.
BROWN (2011). Qualitative Exploration of the Influence of Culture and Extended Family
Networks on the Weight-Related Behaviors of Urban African American Children. Ph.D.
Dissertation, Johns Hopkins University, Baltimore, Maryland.
CAI, Z., J. FAN, AND Q. YAO (2000). Functional-coefficient Regression Models for Nonlinear
Time Series. Journal of the American Statistical Association, 95, 941-956.
CAMERON, A. C. AND P. K. TRIVEDI (2005). Microeconometrics: Methods and Applications.
New York: Cambridge University Press.
CARUGATI, M. (2008). Estimación de Curvas de Engel en Argentina. Tesis de Grado
(Economía), UNMP.
CHACKRABARTY, M. AND W. HILDENBRAND (2011). Engel’s Law Reconsidered. Journal of
Mathematical Economics, 47(3), 289-299.
CHAI A. AND A. MONETA (2008). At the Origins of Engel Curves Estimation. Papers on
Economic and Evolution, No. 0808, Max Planck Institute of Economics.
CHAI A. AND A. MONETA (2011). Back to Engel? Some Evidence for the Hierarchy of
Needs. Papers on Economic and Evolution, No. 1113, Max Planck Institute of Economics.
203
CHAMBERS, J. M. AND T. J. HASTIE (1992). Statistical Models in S. London: Wadsworth &
Brooks/Cole.
CLEVELAND W. AND S. DEVLIN (1988). Locally Wighted Regression: An Aproach to
Regression Analysis by Local Fitting. Journla of the Amercian Statistical Association, 83,
596-610
COSTA, D. (2000). American Living Standards, 1888-1994: Evidence From Consumer
Expenditures. NBER Working Papers 7650, National Bureau of Economic Research,
Inc.
COSTA, D. (2001). Aggregation, Rank and Some Historical Engel Curves. Economic Letters,
70, 183-186.
CLARK, R. (1975). A Calibration Curve for Radiocarbon Dates. Antiquity, 49, 251-266.
DEATON, A. (1988). Quality, Quantity, and Spatial Variation of Price. The American
Economic Review, 78(3), 418-430.
DEATON, A. AND J. MUELLBAUER (1980a). Economics and Consumer Behavior. Cambridge:
Cambridge University Press.
DEATON, A. AND J. MUELLBAUER . (1980b). An almost Ideal Demand System. The American
Economic Review, 70 (3), 312-326.
DEATON, A. AND C. PAXSON (1998). Economies of Scale, Household Size, and the Demand
for Food. The Journal of Political Economy, 106 (5), 897-930.
DEATON, A. AND C. PAXSON (2003). Engel’s What? A Response to Gan and Vernon. The
Journal of Political Economy, 111 (6), 1378-1381.
DELGADO, M. A. AND D. MILES (1997). Household Characteristics and Consumption
Behaviour: A Nonparametric Approach. Empirical Economics, 22 (3), 409-429.
DEPETRIS GUIGUET E. Y R. GARCÍA ARANCIBIA. (2011). Diferencias de Género en el
Consumo de Alimentos Fuera del Hogar en la Región Pampeana en los ’90.
Documentos de Trabajo del IECAL, 12-11, Universidad Nacional del Litoral.
DÍAZ MÉNDEZ, C. Y C. GÓMEZ BENITO (2001). Del Consumo Alimentario a la Sociología de
la Alimentación. Distribución y Consumo, 60, 5-22.
DOKSUM, K. AND A. SAMAROV (1995). Global Functional and a Measure of the Explanatory
Power of Covariates in Regression. The Annals of Statistics, 23(5), 1443-1473.
ENGEL, E. (1857). Die Productions- und Consumtionsverhaltnisse des Königreichs
Sachsen. En Zeitschrift des Statistischen Bureaus des Königlich-Sächsischen, Ministerium
des Innern, No. 8 (9), 1-54.
ENGEL, J. AND A. KNEIP (1996). Recent Approaches to Estimating Engel Curves. Journal of
Economics, 63 (2), 187-212.
FAN, Y. AND Q. LI (2002) .A Consistent Model Specification Test Based on the Kernel Sum
of Squares of Residuals. Econometric Reviews, 21(3): 337-352.
FLEISCHER, A. AND J. RIVLIN (2009). More or Better? Quantity and Quality Issues in
Tourism Consumption, Journal of Travel Research, 47(3), 285-294.
204
FOUSEKIS, P. AND P. LAZARIDIS (2001). Food Expenditure Patterns of the Urban and the
Rural Households in Greece. A Kernel Regression Analysis. Agricultural Economic
Review, 2 (1), 5-19.
GAN, L. AND V. VERNON. (2003). Testing the Barten Model of Economies of Scale in
Household Consumption: Toward Resolving a Paradox of Deaton and Paxson. The
Journal of Political Economy, 111 (6), 897-930.
GARCÍA ARANCIBIA, R. (2011). Curvas de Engel de Alimentos Fuera del Hogar según
Circunstancia de Consumo. El Caso de Argentina. Próximamente en Cuadernos de
Economía, 58 (1) (en prensa).
GARCÍA ARANCIBIA, R. (2012). Alcohol en el Presupuesto Familiar: Incidencia del Poder
Adquisitivo y de la Composición Demográfica del Hogar. Próximamente en Papeles de
Población.
GARCÍA ARANCIBIA R., ROSSINI G. Y DEPETRIS GUIGUET E. (2009a). Incorporación de
Decisiones Binarias Cruzadas en la Elección del Consumo de Lácteos en un Modelo
LA/AIDS. II Congreso de Matemática Aplicada, Computacional e Industrial, SIAM,
Rosario, Argentina.
GARCÍA ARANCIBIA, R., ROSSINI, G Y DEPETRIS GUIGUET (2009b). Corrección de Datos
Censurados en Sistemas de Demanda Mediante un Probit Multivariado. Una
Aplicación al consumo de tipos de Carnes. XXXVII Coloquio Argentino de Estadística,
UNCa, SAE, Octubre.
GARCÍA ARANCIBIA, R, DEPETRIS GUIGUET, E. Y G. ROSSINI (2012). Consumo de Alimentos
Fuera del Hogar en Argentina. Relevancia de la Composición Demográfica y
Tipología de los Hogares. Próximamente en Población y Salud en Mesoamerica, Costa
Rica.
GARCÍA ARANCIBIA, R, DEPETRIS GUIGUET, E. , VICENTIN J. Y M. CORONEL (2012). Consumo
de Alcohol en los Hogares y Diferencias de Género para un Tratamiento Equitativo
en las Políticas de Prevención. Actas de Primeras Jornadas Internacionales Sociedad,
Estado y Universidad, Noviembre, Mar del Plata.
GONG X., VAN SOEST AND P. ZHAN (2000). Sexual Bias and Household Consumption: A
Semiparametric Analysis of Engel Curves in Rural China. IZA Discussion Paper, 212.
GREEN, P.J. AND B. W. SILVERMAN (1994). Nonparametric Regression and Generalized Linear
Models: A Roughness Penalty Approach. New York: Chapman & Hall.
HAQUE, O. M. (2005). Income Elasticity and Economic Development. Methods and Application.
Advances Studies in Theorical and Applied Econometrics, Vol. 42, The Netherlands:
Springer.
HÄRDLE, W. (1991). Applied Nonparametrics Regression. Cambridge: Cambridge University
Press.
HÄRDLE, W. AND E. MAMMEN (1993). Comparing Nonparametric versus Parametric
Regression Fits. Annals of Statistics, 21, 1926-1947.
205
HÄRDLE, W., MÜLLER M., SPERLICH, S. AND A. WERWATZ (2004). Nonparametrics and
Semiparametrics
Models.
An
Introducction.
Berlin:
Springer.
(e-book:
http://fedc.wiwi.hu-berlin.de/xplore/ebooks/html/spm/)
HAUSMAN, J., NEWEY, W. AND J. POWELL (1995) “Nonlinear Errors in Variables. Estimation
of Some Engel Curves. Journal of Econometrics, 65, 205–233.
HAYFIELD, T AND J. S. RACINE (2008). Nonparametric Econometrics: The np Package.
Journal of Statistical Software, 27 (5), 1-32.
HERRERO ZAMORA, V. (2010). Ser Jefe en las Estadísticas Argentinas. Revista d'Estudis de la
Violencia, ICEV, 10.
HIMMELWEIT S., SIMONETTI R. AND A. TRIGG (2001). Microeconomics: Neoclassical and
Institutionalist Perspectives on Economic Behaviour. London: Thomson.
HOUTHAKKER, H.S. (1957). An International Comparison of Household Expenditure
Patterns, Commemorating the Centenary of Engel’s Law. Econometrica, 25, 532-551.
HUANG L.S AND J. CHEN (2008). Analysis of Variance, Coefficient of Determination and FTest for Local Polynomial Regression. The Annals of Statistics, 36 (5), 2085-2109.
HURVICH, C., SIMONOFF, J. AND C. L. TAI (1998). Smoothing Parameter Selection in
Nonparametric Regression using Improved Akaike Information Criterion. Journal of
the Royal Society, Series B, 60, 271-293.
IYENGAR, N. S. (1967). Some Estimates of Engel Elasticities Based on Nacional Sample
Survey Data. Journal of the Royal Statistical Society, Serie A, 130 (1), 431-433.
JENSEN, R. (2004). Socioeconomic Status, Nutrition, and Health among the Elderly. In
Perspectives on the Economics of Aging (National Bureau of Economic Research
Conference Report), David Wise (ed.), , Chicago: University of Chicago Press.
LEE, T-H AND A. ULLAH (2003). Nonparametric Bootstrap Specification Testing in
Econometric Models. In Computer Aided Econometrics, Chapter 15, edited by David
Giles, Marcel Dekker, New York, 451-477.
LEFÈBVRE M. (2006). Population Ageing and Consumption Demand in Belgium. CREPP
Working Paper 2006/04.
LESER, C.B.V. (1964). Forms of Engel Functions. Econometrica, 32 (4), 694-703.
LEWBEL, A. (1991). The Rank of Demand System: Theory and Nonparmetric Estimation.
Econometrica, 59, 711-730.
LEWBEL, A. (2006). Engel Curves. In: The New Palgrave Dictionary of Economics, S. N. Darluf
& L. E. Blume (Eds.), 2nd Ed., Palgrave Mcmillan.
LI, Q. (1998). Some Simple Consistent Test for a Parametric Regression Function versus
Semiparametric or Nonparametric Alternatives. Manuscript, Department of
Economics, University of Guelph.
LI, Q. AND S. WANG (1998). A Simple Consistent Bootstrap Test for a Parametric
Regression Function., Journal of Econometrics, 87(1), 145-165.
LI, Q. AND J. S. RACINE. (2004). Cross-Validated local linear Nonparametric Regression.
206
LI, Q. AND J. S. RACINE (2006). Nonparametric Econometrics. Theory and Practice. New Jersey:
Princeton University Press.
LOADER, C. (1999). Local Regression and Likelihood. Berlin: Springer.
LOADER, C. (2004). Smoothing: Local Regression Techniques. Papers / Humboldt
Universität Berlin, Center for Applied Statistics and Economics (CASE), No. 2004, 12,
(Disponible en: http://hdl.handle.net/10419/22186)
LOADER, C. (2010). locfit: Local Regression, Likelihood and Density Estimation.. R package
version 1.5-6. ( http://CRAN.R-project.org/package=locfit)
LYSSIOTOU, P., PASHARDES, P. AND T. STENGOS (2008). Demographic vs Expenditure
Flexibility in Engel Curves. Empirical Economics, 34, 257-271.
MACKINNON, J. G. (2006). Bootstrap Methods in econometrics. The Economic Record, 82
(special issue, September), S2-S18.
MALLOWS, C. L. (1973). Some Comments on Cp. Technometrics, 15, 661-675.
MARRON, J. S. AND HÄRDLE, W. (1986) Random Approximations to Some Measures of
Accuracy in Nonparametric Curve Estimation. Journal of Multivariate Analysis, 20, 91113.
MISHAN, E. J. (1961). Theories of Consumer’s Behaviour: A Cynical View. Economica. 28
(109): 1-11.
NADARAYA, E. A. (1964). On Estimating Regression. Theory of Probability and Its
Applications, 9, 141-142.
NAMIE, J. (2008). The Power of Children Over Household Food Consumption.
Anthropology News, April, 10-12.
NEWEY, W. (1994). The Asymptotic Variance of Semiparametric Estimators. Econometrica,
62, 1349-1382.
NØRGAARD, M., BRUNSØ, K. ; Christensen, P. & M. Mikkelsen (2007). Children's influence
on Participation in the Family Decision Process During Food Buying. Young
Consumers, 8 (3), 197-216.
OZER-BALLI, H. AND B. E. SØRENSEN (2012). Interacction Effects in Econometrics.
Forthcoming in Empirical Economics.
PARPIEV, Z. AND K. YUSUPOV (2011). Testing Household Economies of Scale in Uzbekistan.
Eurasian Journal of Business and Economics, 4 (7), 25-51.
PAGAN, A. AND A. ULLAH (1999). Nonparametric Econometrics. Cambridge: Cambridge
University Press.
PERALI, F. (2008). The second Engel law: Is it a paradox? European Economic Review, 52 (8),
1353-1377.
PIZZOLITTO, G. (2007). Curvas de Engel de Alimentos, Preferencias Heterogéneas y
Características Demográficas de los Hogares: Estimaciones para Argentina.
Documentos de Trabajo CEDLAS, 45, UNLP.
207
PRAIS S. AND H. HOUTHAKKER (1955). The Analysis of Family Budgets, Cambridge:
Cambridge University Press.
R-PROJECT. The R- Project for Statistical Computing. (http://www.r-project.org/)
RACINE, J. S. (2008). Nonparametrics Econometrics: A Primer. Foundations and Trend in
Econometrics, 3 (1), 1-88.
RACINE, J. S. (2009). Nonparametric and Semiparametric Methods. In R.I Qi-Li and Jeffrey
S. Racine (ed.) Nonparametric Econometric Methods (Advances in Econometrics, Volume
25, Emerald Group Publishing Limited, 335-375.
RESTREPO, S. AND M. MAYA (2005). La Familia y su papel en la Formación de Hábitos
Alimentarios en el Escolar. Un Acercamiento al la Cotidianidad. Boletín de
Antropología, 19 (36), 127-148.
RILSTONE, P. AND A. ULLAH (1989). Nonparametric Estimation of Response Coefficients.
Communication in Statistics, Theory and Methods, 18, 2615-2627.
ROBINSON, P. (1988). Root-N-Consistent Semiparametric Regression. Econometrica, 56, 931954.
RODRÍGUEZ ESCOBAR, G. (2005). Alimentación y Nutrición del Adulto Mayor. Revista de la
Facultad de Medicina, 10 (1), 17-24.
ROSSINI, G., DEPETRIS GUIGUET, E. Y GARCÍA ARANCIBIA, R. (2008). La Demanda de
Alimentos en Argentina. Un Modelo LA/AIDS con datos de Encuestas de Hogares.
Anales de la XLIII Reunión Anual de la AAEP, Córdoba.
ROSSINI, G. Y DEPETRIS GUIGUET, E. (2008). Demanda de alimentos en la región pampeana
Argentina en la década de 1990: Una aplicación del modelo la-AIDS. Agroalimentaria,
14 (27), 55-65.
SCARANO E. (2002). Teorías Económicas a priori. Anales de XXXVII Reunión Anual la
Asociación Argentina de Economía Política, San Miguel de Tucuman.
SPERLICH, S. (2007). A Note on Non-Parametric Estimation with Constructed Variables
and
Generated
Regressors.
Social
Science
Research
Network
(SSRN:
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1010923).
SMITH, K. W. AND M. S. SASAKI (1979). Decreasing Multicollinearity: A Method for Models
with Multiplicative Functions. Sociological Methods and Research, 8, 35-36.
STIGLER, G. (1954). The Early History of Empirical Studies of Consumer Behavior. The
Journal of Political Economy, 62 (2), 95-113.
SULGAHAM, A. K. AND H. O. ZAPATA (2006). A Semiparametric Approach to Estimate
Engel Curves using the US Micro Data. American Agricultural Economics Association
Annual Meetings, Long Beach, California.
SPECKMAN, P. (1988). Kernel Smoothing in Partial Linear Models. Journal of the Royal
Statistical Society, Series B, 50, 413-436
STATACORP LP. STATA- Data Analysis and Satatistical Software (www.stata.com).
208
TREAS, J. AND S. DROBNIC (2010). Dividing the Domestic. Men, Woman and Household Work in
Cross-National Perspective. Stanford: Stanford University Press.
ULLAH, A. (1985). Specification Analysis of Econometric Models. Journal of Quantitative
Economics, 1, 187-209.
ULLAH, A. (1988). Nonparametric Estimation and Hypothesis Testing in Econometric
Models. Empirical Economics, 13, 223-249.
VERNON, V. (2004). Household Economies of Scale, Food Consumption and Intra-Household
Allocation of Time. Ph.D. Dissertation, The University of Texas at Austin.
WAHBA , G. AND S. WOLD (1975). A Completely Automatic French Curve: Fitting Spline
Functions by Cross-Validation. Communications in Statistics, Series A, 4, 1-17.
WANG, H., MOK, C. F., AND J. FOX (1995). Food expenditure patterns of elderly consumers:
A question of time allocation. Family Economics and Resource Management Biennial: The
Journal of the FERM, Section of AAFCS I, 185-192.
WASSERMAN, L. (2006). All of Nonparametric Statistics. New York: Springer
WATSON, G. S. (1964). Smooth Regression Analysis. Sankhya, 26, 359-372.
WEIMER, J. (1998). Factors Affecting Nutrient Intake of the Elderly. Agricultural Economic
Report No. 769, Food and Rural Economics Division, Economic Research Service, U.S.
Department of Agriculture.
WORKING, H. (1943). Statistical Laws of Family Expenditure. Journal of American Statistical
Associations, 38, 43-56.
YATCHEW, A. (2003). Semiparametric Regression for the Applied Econometrician. New York:
Cambridge University Press.
YEN, S., KASTERIDIS, P. AND J. RILEY (2012). Food Expenditures away from Home by
Elderly Households. Agricultural and Applied Economics Association 2012 Annual
Meeting, August 12-14, 2012, Seattle, Washington.
ZHENG, J. (1996). A Consistent Test of Functional Forms via Nonparametric Estimation
Techniques. Journal of Econometrics, 75, 263-289.
ZHOU, S. AND D. A. WOLF (2000). On Derivative Estimation in Spline Regression. Statistica
Sinica, 10, 93-108.
209
Descargar