MODELOS MIXED LOGIT - Sociedad Chilena de Ingeniería de

Anuncio
61
MODELOS MIXED LOGIT: ANTECEDENTES TEÓRICOS Y APLICACIONES
Ricardo Alvarez Daziano y Marcela A. Munizaga
Departamento de Ingeniería Civil, Universidad de Chile. Casilla 228-3, Santiago, Chile.
mamuniza@cec. uchile.c 1, ralvarez@cec. uchile.cl
http://tamarugo.cec.uchile.cV~dicidet/
RESUMEN
El desarrollo de modelos de demanda de transporte se puede describir como una búsqueda de
modelos flexibles que se adapten a un mayor número de situaciones prácticas. Sin embargo, en
esta búsqueda la flexibilidad ha comprometido la estimabilidad de los modelos. Por un lado
aparecen los modelos tradicionales de la "familia" Logit que ofrecen probabilidades de elección
cerradas, pero con supuestos simplificatorios que no siempre son sostenibles. Por otro, está el
modelo Probit que permite trabajar con una estructura de error general, pero su estimación resulta
bastante compleja. En este contexto, caracterizado además por avances tecnológicos en materia de
computación y métodos numéricos, se ha cuestionado el uso de modelos simplificados y ha
aparecido con fuerza una nueva alternativa de modelación: el modelo Mixed Logit.
En este artículo se revisa detalladamente los antecedentes teóricos que sustentan la formulación
del modelo Mixed Logit, a través de un análisis de la matriz de covarianza se discute de qué
manera estos modelos son capaces de modelar condiciones en las cuales se violan los supuestos de
independencia y homoscedasticidad.
Este análisis se complementa con dos aplicaciones
numéricas que permiten comprobar la real posibilidad de utilizar este modelo y su capacidad de
adaptarse a situaciones prácticas. En los experimentos de simulación se construye bases de datos
que permiten controlar objetivamente la bondad de ajuste del modelo, la reproducción de la
muestra de calibración y el nivel de respuesta a cambios en los atributos de las alternativas. La
aplicación con datos reales pretende validar el estudio empírico y verificar la factibilidad de
aplicar herramientas econométricas sofisticadas. A pesar de que su estimación requiere de
simulación, se observa que en general el modelo entrega una adecuada reproducción de parámetros
y un buen ajuste a los cambios de política.
Se concluye que el Mixed Logit en efecto constituye
modelación de elecciones discretas, aunque se
implementación de una especificación particular,
utilizados y teniendo claras sus consecuencias previo
una alternativa interesante y poderosa para la
debe ser riguroso en la construcción e
justificando adecuadamente los supuestos
a la estimación de los parámetros.
Actas del X Congreso Chileno de Ingeniería de Trnnsporte. Concepción, 9 al 12 de Octubre de 2001
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
62
Ri~ardo
Alvarct. D. y Marcela Munua ga
l. INTRODUCCIÓN
El enfoque más utilizado en la actualidad para modelar elecciones discretas se basa en la teoría de
la utilidad aleatoria (McFadden, 1974). Según esta teoría, para cada una de las alternativas i el
individuo n tiene una función utilidad U111 asociada, escogiendo aquella alternativa que maximiza
su utilidad. Esta función inherente del individuo, puede dividirse en una componente sistemática
Vm, que recoge el efecto de las variables explicativas (atributos medibles u observables por parte
del modelador), y una componente aleatoria &m que intenta recoger todos aquellos efectos no
incluidos en la componente sistemática de la función de utilidad. De los supuestos que se asumen
sobre la distribución del error estocástico se deriva los distintos modelos planteados en la literatura
(Ortúzar y Willumsen, 1994).
Los modelos más utilizados en la actualidad son el Logit Multinomial (McFadden, 1974), que se
obtiene a partir de asumir que los términos de error &m son iid Gumbel, y el Logit Jerárquico
(Williams, 1977), que se deriva como una extensión del anterior, en que se considera que existe
una componente de error adicional, que representa correlación en un grupo de alternativas. En
síntesis, se trata de estructuras de covarianza (del término de error) muy básicas, lo cual es un
supuesto simplificatorio que no siempre es sostenible, pero que permite tener modelos simples de
entender y usar.
El modelo Probit (Daganzo, 1979), en cambio, se deriva a partir de suponer errores aleatorios
distribuidos Normal multivariada, aceptando en teoría cualquier estructura de covarian7..a que los
datos permitan estimar, lo cual implica un grado de dificultad de estimación considerable. A pesar
de sus bondades en cuanto a flexibilidad, este modelo ha sido incorporado tímidamente a la
práctica, pese a existir desde hace algún tiempo herramientas poderosas que permiten su
estimación mediante simulación (ver Munizaga y Ortúzar, 1997).
En este contexto, caracterizado por un compromiso entre estimabilidad y flexibilidad, es que han
irrumpido los modelos Mixed Logit -también conocidos como modelos de Error Compuesto o
Probit con Kernel Logit- (Ben Akiva y Bolduc, 1996; Brownstone y Train, 1999). Se trata de una
alternativa intermedia que se sitúa en algún punto entre el Logit y el Probit. Sus promotores
claman que tiene la flexibilidad del Probit, manteniendo parte de la simpleza del Logit. En este
trabajo se analiza los antecedentes teóricos que permiten formular este modelo, verificando la
consecuencia de sus hipótesis y contrastándolas con las de otros modelos de elección.
2. EL MODELO MIXED LOGIT
2.1. Formulación
Los orígenes del modelo se remontan a principios de la década de los '80 cuando en los trabajos de
Cardell y Dunbar ( 1980) y Boyd y Melman ( 1980) se describe un modelo equivalente a los
actuales Mixed Logit, con el nombre de modelo Hedónico. Su reciente reaparición con otro
nombre y renovados bríos puede deberse a los avances tecnológicos que permiten su estimación en
menor tiempo. Recientemente este tipo de modelos ha sido utilizado para modelar diversas
situaciones en distintos contextos (Train, 1999; Brownstone y Train, 1999; Algers et al., 1998).
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
MODELOS MIXED LOGIT : ANT ECEDENTES TEÓRICOS Y APLICACIONES
- - - - --·---
63
- · -- - -- - - - -- - - -
Los modelos Mixed Logit nacen de suponer una función de utilidad U;n conformada por una
componente determinística Vm, una componente aleatoria &;n independiente e idénticamente
distribuida, y uno o más términos aleatorios adicionales. Estos términos de error adicionales
pueden ser agrupados en un término aditivo r¡;n , que puede ser función de datos observados de la
alternativa, y que permite recoger la presencia de correlación y heteroscedasticidad. Así, la
función de utilidad queda definida como
(1)
donde C;n ~ Gumbel(O, ít) y '7m ~ f( 1]/ fJ'), donde fes una función densidad general y fJ' son
parámetros fijos que la describen ( e.g. media y varianza) 1• Como e es iid Gumbel, entonces la
probabilidad condicional en '7 de que el individuo n escoja la alternativa i corresponde
exactamente a un modelo Logit Multinomial (MNL):
pn (i / 1]) = -:.J-.
exp( ~n + '7m )
I
(2)
_---=.._____;_;;_:___
exp( VJn + '7¡n)
.J = I
Para obtenerse la probabilidad de elegir la alternativa, debe evaluarse la expresión anterior sobre
todos los valores posibles 1], lo que corresponde a la integral de la probabilidad condicional por la
función densidad del término aleatorio 1], esto es:
(3)
Como caso particular, puede suponerse una función de utilidad con la siguiente especificación2 :
um = /3' X m + f.J:nzm +¡;m
'--y---'
'---y--J
V,.
f/,.
( 4)
En esta expresión se asume que la componente determinística de la utilidad es lineal en los
parámetros fJ que ponderan a los atributos x," Por otro lado, se asume que '7 depende de ciertos
parámetros (f.Jm) y datos observados relacionados con la alternativa i (z;n), relación que también se
supone lineal en parámetros. Un supuesto adicional, que ha sido utilizado en la mayor parte de los
estudios previos (Ben Akiva y Bolduc, 1996; Brownstone y Train, 1999), es que el término f.J es
propio del individuo, sin variar entre alternativas. Es decir:
IJ;n
= f.Jn 1 Z;n-
1
La distribución de los términos aleatorios generalmente se asume Normal, existiendo diversos argumentos detrás de
este supuesto. Otra distribución que ha sido utilizada es la Lognormal, especialmente en aquellos casos en que se
quiere restringir el signo de un determinado parámetro.
2
fJ
es un vector de parámetros de dimensión L (hay L variables explicativas en la componente determinística de la
función de utilidad); Xm es un vector de atributos de dimensión L; f.l,, es un vector aleatorio de dimensión K cuyas
componentes tienen media cero y con matriz de covarianza Q; Zm es un vector de atributos asociados con la
alternativa i y el individuo n, y tiene dimensión K; finalmente, Cm es una variable aleatoria que representa el error
estocástico.
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
Rica rdo J\h·arcz D. , . Ma r<:da Muni 7"'ga
64
2.2. Matriz de Covarianza
Dada una función de utilidad como en ( 4) y considerando además el supuesto usual T/m = Jln 1 Zm,
sea Zn la matriz de dimensión KxJ que contiene a los vectores Zm para cada alternativa
perteneciente al conjunto de elección del individuo (i E Cn) y l.'n un vector aleatorio iid Gumbel
con matriz de covarianza L¿· y que contiene a los elementos E:¡ 11 • Si se asume que cada término de
1-'n tiene una función densidad con media cero y varianza dk y que el vector en su conjunto tiene
una matriz de covarianza Q , entonces la matriz de covarianza del modelo (l:), puede escribirse
como:
L
= z;, · Q · z, + I ,
=
<·
Q · ::::,
2
(5)
+ a, 1
Es fácil demostrar que la matriz de covarianza obtenida es simétrica y definida positiva. y que su
dimensión está bien detinida 3 . De esta expresión general se concluye que el modelo es capaz de
modelar correlación y heteroscedasticidad entre alternativas. En particular, dependiendo de la
especificación que se le dé al término de error adicional, es posible modelar situaciones como
alternativas similares y variaciones en los gustos. Si se obtie ne la covarianza entre dos alternativas
se observa que para i, j E ( 'n con i '#.j:
¡.;
(6)
cov(U,, ,U,, ) = Iz¡, nZk¡na:
k=1
que en general será distinto de cero si es que para al menos algún k,
a;> O y
zkm•zk;n
'#.O . En tal
caso, se asegura la presencia de correlación entre las alternativas i yj. Por otro lado,
(7)
luego si var(U,J '#. var(U ;n ) se asegura heteroscedasticidad entre dichas alternativas.
Se puede ver que se trata de una forma distinta de plantear y justificar un determinado modelo. La
forma usual es hacer supuestos directamente sobre la covarianza de E:¡n, como por ejemplo en el
caso del Probit. En cambio, en un modelo Mixed Logit lo que se hace es agregar términos que
sean fuente de correlación y/o heteroscedasticidad obteniéndose como resultado una determinada
estructura de covarianza.
3
La matriz de covarianza es de dimensión J x J. En efecto, como Q es de dimensión K x K (con K el número de
componentes aleatorias), y Z 11 tiene dimensión K x J, entonces .:'"Q Z 11 es una matri z de dimen sión J x J; luego al
sumarse esta última con la matriz I ,,, cuya dimen sión corresponde a J x J, se demuestra finalmente que
diml:=dim(z:1 ·Q· zn +l: ,: )=J x .J .
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
MODII.OS MIXFD l.()(jJT ANTECEDENTES JT(>R.ICOS Y APIICACIONI S
65
2.3. Algunas Propiedades del Mixed Logit
Probablemente la propiedad más interesante de este modelo es que bajo ciertas condiciones de
regularidad cualquier modelo de utilidad aleatoria tiene probabilidades de elección que pueden ser
aproximadas tan cerca como se desee por un Mixed Logit (McFadden y Train, 2001). Es así
como, por ejemplo, un modelo Mixed 1,ogit con parámetros aleatorios distribuidos Normal puede
aproximar a un modelo Probit.
Por otro lado, al permitir modelar alternativas correlacionadas, el Mixed Logit es capaz de levantar
el supuesto de independencia de alternativas irrelevantes propio del MNL. De esta manera. los
patrones de sustitución entre alternativas son flexibles y son un resultado de los datos y no una
imposición particular. como ocurre en el MNL.
La relación entre un modelo Mixed Logit y los modelos de parámetros - formulados con el
objetivo de modelar variaciones en los gustos- es directa. En ese sentido, se puede plantear que
los parámetros de gusto fJ,, poseen una media poblacional fJ más una componente aleatoria Jin que
representa la variación en los gustos del individuo n con respecto a la media. Esto se puede
interpretar como una estructura análoga a (4 ), en la cual r¡,n = Jin' Z¡n y z = x ( Brownstone y Train,
1999).
2.4. Estimación
La probabilidad de elección de un modelo Mixed Logit como la expresada en la ecuación (3 ), no
posee una expresión matemática cerrada a diferencia del Logit Multinomial o del Jerárquico. Es
más, como la integral no puede resolverse analíticamente es preciso usar algún método de
integración. En la literatura es posible observar que se prefiere utilizar simulación de Monte Cario
por sobre otros métodos como por ejemplo integración numérica por cuadratura (Bhat, 2000).
Además, se puede aprovechar el hecho de que la probabilidad condicional (2) tiene una expresión
de forma Logit Multinomial. Así, si se considera R valores de '7 obtenidos de su función densidad
./{ T¡IB"'). para cada una de las repeticiones es posible calcular
exp( V,n + r¡:n)
P,, (i 1r( ) = -J~'----"'------'-'-'-!_;___
L exp( V
111
(8)
+ 'l~n )
1~ 1
con r = l . .... R. Luego es posible obtener la probabilidad promedio
(9)
y con ella construir la función de verosimilitud simulada
.1
SL
= LLYm In P(i)
IIEIJ
(10)
t= l
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
Ricardo Alvarez D. y Marcela Munizaga
66
Bajo condiciones de regularidad, el estimador rnaXlmo verosímil simulado es consistente y
asintóticamente normal. A pesar de que ( 1O) es un estimador insesgado de la probabilidad, su
logaritmo natural resulta ser sesgado (Brownstone y Train, 1999); sin embargo, cuando el número
de repeticiones crece más rápido que la raíz cuadrada del número de observaciones, el estimador
resulta asintóticamente equivalente al estimador máximo verosímil (Hajivassilou y Ruud, 1994).
3. EXPERIMENTOS DE SIMULACIÓN
Siguiendo la metodología de Williams y Ortúzar (1982), se realizó un experimento de simulación
con el fin de comprobar la factibilidad real de aplicación del modelo. Para ello se creó distintas
bases de datos sintéticas considerando medias y desviaciones de los atributos a partir de una base
real construida para Santiago. Se consideró una situación de elección modal con cuatro alternativas
(auto, bus, metro y taxi) y cuatro variables explicativas (costo, tiempo de viaje, tiempo de acceso,
dummy de ingreso).
Se pretende modelar el caso en que las alternativas bus y metro son consideradas como similares
entre sí. Para construir la parte estocástica de la función utilidad se trabajó con el enfoque
planteado por Brownstone y Train (1999), considerado por los autores como un modelo Mixed
Logit (ML) "análogo" al Logit Jerárquico (LJ). Este modelo particular se construye agrupando las
alternativas en nidos, agregando un parámetro aleatorio asociado a una variable muda propia de
cada nido (que indica si la alternativa pertenece o no a éste). La presencia del parámetro aleatorio
común para aquellas alternativas que comparten nido, permite obtener una covarianza con
presencia de elementos fuera de la diagonal, obteniéndose un patrón de correlación similar al de un
LJ, pero no necesariamente una estructura de covarianza análoga. De hecho es posible comprobar
cierto compromiso entre correlación y heteroscedasticidad en esta especificación (Munizaga y
Alvarez, 2000). Así, se consideró un término de error iid Gumbel(O,A.) y, adicionalmente, un
término de error f.ln distribuido Normal(O,a-/) con el fin de modelar correlación. En primer lugar
se consideró este último sólo en las alternativas bus y metro, lo que sigue el enfoque planteado por
Brownstone y Train, cuya matriz de covarianza resulta heteroscedástica4 . Luego se consideró
errores iid Normal para las alternativas no anidadas con el fin de obtener una matriz
homoscedástica correspondiente a una estructura teóricamente modelable por un LJ.
Al asumir f.ln ~ N(O,a-/), entonces es posible escribir f.ln = SnO"p con Sn distribuido Normal estándar.
Como no se conoce a-f.l, entonces interesa estimar su valor, con el cual queda determinada la
distribución del término de error adicional. Nótese que al poseer el modelo un término de error
Gumbel, el parámetro estimado se verá escalado y se cumplirá que a~ = A-a- 1, . Para la estimación
de los modelos MNL, LJ y Probit se utilizó un código propio programado en Gauss (Aptech
Systems, 1994) basado en la rutina de máxima verosimilitud. Para la estimación del modelo Mixed
Logit se utilizó un código flexible en Gauss preparado por Kenneth Train, disponible en su página
web5 .
4
Debido a que la varianza total del error resulta mayor para las alternativas anidadas (Munizaga y Alvarez, 2000). En
ese sentido la especificación original no posee una estructura de covarianza análoga a la de un LJ.
5
http://elsa.berkdey.edu/- train/softwarc.html
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
MODI'I.OS MIXFD I.OGIT ANTFCFDI:NTLS TEÓRICOS Y APLICACIONES
67
Se trabajó con 8000 observaciones, y se consideró un coeficiente de correlación igual a 0.5 entre
las alternativas bus y metro 6 • lo que implica que CYp = CY1 (Munizaga y Alvarez, 2000). Primero se
generó una base de datos a partir de una matriz de covarianza heteroscedástica. mientras que la
segunda base posee una matriz homoscedástica. La varianz..a total del error se eligió de manera tal
que el factor de escala de un modelo MNL fuese igual a uno, asegurándose de que el experimento
no fuese completamente determinístico ni aleatorio.
La estimación del Probit se efectuó utili7..ando el simulador de probabilidades GHK con 1O
repet1c1ones. A su vez, para el Mixed Logit se usó con 200 repeticiones usando números
aleatorios basados en series de Halton (Train, 1999). Los valores reportados corresponden a
corridas realizadas en un computador personal con un procesador Pentium II de 450 MHz y 64
MB de memoria RAM. Los resultados de las estimaciones del MNL, LJ, Probit y ML para cada
situación de elección se presentan en la Tabla 1, en que también se entrega cada valor de
referencia. La tabla presenta las estimaciones de los parámetros para cada modelo, el estadígrafo t
de significancia estadística y el test t sobre el valor de referencia del parámetro para el ML. Para el
LJ, el valor de referencia de es calculado a partir de la correlación simulada.
.
Tabla I· Resultados Simulación
Base H omoscedástica
Pro bit
ML
Re f.
MNL
Base Heteroscedástica
Re f.
MNL
LJ
Cte
Auto
-0,4()
-0,.)4(12
( ·1.7'! 1)
-IJ,)if'2
1 ~. -!(>') )
·-
Cte
Metro
1!,20
Cte
Taxi
-0,4'i
Costo
-IJ,IIIIS
( l,.\ú1ú
(S.R·IR I
- -
--
- - ~ -- - - ---
11 ,.) 171
0,22ú "7
(:1,1<N)
(SJ22)
--
-0 ,2')4(,
-0 .2-ü4
( ·1.741)
( ~.! (¡ X \
_l!.X-IHI
11,2'il2
11.11721
-O,S21R
(-12.11ú)
11.81SI
-11,01 J.'i 'i
(· ll.flll)
-0,7(¡<))-l
1-1 .\ 0úS)
-11,110711
-11,007()
( II ,.Vl<J)
( 11.27~)
·11,01 14')
1-Jil,') 12)
-11,1044
-IJ, lOIIS
-0,0702
( -_)(,_.'i(¡()J
( ."12.1J"l5)
(- .10.7Ml)
-0,2012
l 47.029)
-0,1 'lS-1( 11 .2M)
-11,1.1"7')
( 35.-I'J'I)
-11,4H11
( 12.'157)
-0, 14l:l'J
(
0,20
(.S,2(dj
- · - · -·
-11,700 7
1 12.S57)
-IJ ,40
~.1 4 .1)
LJ
Probit
ML
-0,2R41
-0,1 ')21
-0,4ú l <J
l
-1 .~ (,') )
--- - ----- ---
0,4RH4
17.'1H2)
0,3úO'i
¡(,,.'i."\0)
( 1. ~n ¡;¡
0,2<JR2
r,!>.76H)
-0, 116(}
-0,1101
( 2.27 4)
( ~.'X IS ;
-0,2041
( 4.1S'Jj
-0,1 Hl'i
-U,OO.'i1
( K'Jiil )
-O,OO'i2
'fUS ."l)
-0,0041
( H,llú 7)
-O,OH
-U ,OR35
1 .>1 ,41>4)
-11.0760
-0,11614
( 21 ,'!1 HJ
-ll,17ú'i
H4.'!1'l)
-ll, 1 ó4 3
· ."IH.757)
-0,4'i
..J.:!.!{I'>~I
Tiempo
de Viaje
-11,08
Tiempo
de
Acceso
Ingreso
Alto
-11,16
;
0)0' 1
1,2
l ,492H
(24.094)
1,4 7.'iS
(2.),<)5"1)
O,S'J45
-0.0804
(-.1 1.1 72)
¡-o, l líll
-1l, l.'i63
( V>.t>7H)
IO.HCílil
1 ,OúRú
(21,."\0új
1,1 T ú
(21,4(>4)
-0,1 (¡
O,<JIJ(¡<)
(-27,0 .)2)
-0,1323
( 23 .7 12)
1,2
1,2454
(21. 11 7)
!,21N
(20.R2R)
IJ,"707J
l-0.2()11
-0,01)4')
( '!, 72 1)
-11,1179 l
(-."IO.H4 SJ
L0,544J
-0 ,1 'i%
(- ."lú,(>'JH)
l,!Rú6
(21.H42)
10,2471
0,5441
(S.RHO)
ll)458
(')'', S:=> X)
ll,'i lOO
(1,7(,()1
(·15'l7)
(H.ViC)
ú
)
-0,'!34(>9
'i
-11,93 42(¡
-O,<J.)(,HH
-O,'J32') l
'i
- 1,ll3JHO
'i
- 1,02') 1<)
-l,01BR
O,R472
('1..\SO)
1-ll.úSill
2
- 1 ,02Hú7
() ,Ú
II ,H
.Vi,S
42 ,)
(l,7
O,R
.1'i,2
!S2,'i
:')
..
--
----
-
.- - - e - -
(.) 1cst t con respecto a cero 1-1 1cst t con respecto al paramctro de rcfercnc oa
6
( -111.%7¡
O,')<)<)R
(IS.24."1)
O,'JOú'l
1 1.(>1 .ll
Iterac.
1(6)
Tiempo
[minl
(_"\_(,(¡(¡ 1
1--o.S!>'JI
-0,4(} l (J
IU. I111J
1 2.).9~ ."1 )
Up
7,<)~.;2)
I1J>71L
0,1711
Jl1.2.12J
-~
--
(
7
- - ~-
Se trabajó con coeficientes de correlación mayores, pero se optó por reportar los resultados para este nivel, debido a
que generalmente los grados de correlación prácticos no resultan sustancialmente altos.
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
Ricardo Alvare7. D. y Marcela Muni7.aga
68
El modelo ML permite recuperar adecuadamente los valores de todos los parámetros de gusto con
que fue generada la base de datos, lo cual es mostrado por el estadígrafo t, que es menor que 1,96
en todos los casos. El MNL presenta parámetros que son distintos de los valores verdaderos.
especialmente en el caso de correlación y heteroscedasticidad. Cabe hacer notar que para la base
heteroscedástica se observa ciertos efectos de escala sobre los parámetros estimados por el modelo
LJ, lo que reafirma ciertos estudios empíricos previos (Munizaga y Alvarez, 2000). Por otro lado,
a pesar del alto número de observaciones, el Probit presenta ciertas dificultades para recoger los
parámetros asociados a la correlación presente.
En la Tabla 2 se muestra los cambios de política considerados para efectuar un análisis de
respuesta de los modelos (Williams y Ortúzar, 1982); es posible ver que las políticas definidas
corresponden a cambios fuertes en los valores de los atributos, aumentando al doble o
disminuyendo a la mitad algunos valores en cada caso. Como medida de error para cada una de
las políticas definidas, se utiliza el índice Chi cuadrado de Gunn y Bates ( 1982), reportado en la
Tabla 3; éste se calcula como z 2 = L (Ñ,
'
2
-N, )
N,
,
donde Ñ, es el número de individuos que elige la
alternativa i según la predicción hecha por el modelo, y N¡ es el número de individuos que elige la
alternativa i de acuerdo al modelo de simulación.
Pl
Cono tk ViaJe
A litO
Bus
2,0
Tiempo de Acceso
Auto
Bus
Metro
2,0
P2
PJ
2,0
0,5
P4
P5
P6
Metro
Tabla 2: Cambios de Política
Tiempo de Viaje
Auto
Bus
Taxi
Metro Taxi
1,5
0,5
2,0
1,5
0,3
1,5
2,0
Taxi
0,5
0,5
1,5
2,0
2,0
T a bla 3 : Í nd"tcex
Base Heteroscedástica
MNL LJ
Probit ML
Base
pJ
Pi
PJ
P4
P5
P6
x
2
95%.J
0,00
10,21
9,65
4,32
10,35
8,99
1,87
= 7,81 S
0,03
10,62
9,81
3,41
6,64
8,24
3,40
0,40
9,00
7,50
1,16
3,41
3,96
3,33
0,00
6,01
5,65
1,41
8,03
5,16
2,64
Base Homoscedástica
Probit ML
MNL LJ
0,00
1,78
2,52
34,34
11,63
9,23
4, 15
0,00
1,79
0,91
11,79
5,44
8,25
5,01
0,53
0,67
0,81
11,88
13,46
1,54
4,91
0,01
2,52
1,42
11,37
5,41
6,01
6,64
Las mayores diferencias entre las predicciones de los modelos y los valores simulados (realidad
virtual) se encuentran para el MNL para ambos casos (homo/heteroscedástico ). Las predicciones
del LJ y ML son bastante similares (Ver Tabla 4), prácticamente indistinguibles, para el caso
homoscedástico, siendo ambas a su vez muy parecidas a lo que se ha llamado "realidad virtual".
Sin embargo, si la base es heteroscedástica se observa algunas pequeñas diferencias entre las
predicciones de ambos modelos.
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
MODELOS MIXED LOGIT ANTFCEDFNTES TEÓRICOS Y APLICACIONES
Al t.
l
1
UJ
2
<:
3
C/)
¡:o
4
l
2
~
3
......
3
,.J
4
l
2
4
¡....
l
1:0
2
~
3
¡:l..
4
1
2
~
3
4
Base
3225
1056
2625
1094
3227
1055
2624
1094
3217
1058
2628
1096
3238
1067
2610
1090
3224
1057
2625
1094
1
Tabla 4: Particiones de Mercado
Base Heteroscedástica
Pl 1 P2 1 P3 1 P4 1 P5 1 P6 Base 1 PI
2482
1146
3017
1355
2445
1232
3034
1289
2438
1234
3037
1291
2466
1239
2984
1318
2439
1221
3008
1332
2556
1190
2862
1392
2495
1266
2908
1331
2500
1269
2901
1329
2513
1275
2859
1361
2491
1257
2877
1375
2754
2262
2103
881
2675
2281
2166
878
2681
2317
2116
887
2725
2305
2103
875
2715
2297
2092
896
2961
157
3858
1024
2941
193
3882
983
2927
182
3907
984
3000
175
3830
997
2945
180
3889
986
2837
1341
3327
495
2713
1393
3398
496
2717
1391
3391
502
2791
1405
3324
486
2780
1369
3345
506
3818 3244
157 918
2897 2498
1128 1340
3806 3244
162 918
2865 2498
1166 --1340
3743 3242
157 919
2931 2499
1169 1340
3752 3263
150 932
2928 2478
1170- -1332
-3746 3245
158 920
2948 2498
1148 1338
2542
1090
2843
1525
2512
1065
2867
1556
2510
1066
2869
1556
2545
1082
2826
1553
2504
1065
2864
1568
69
Base Homoscedástica
1
P2
2596
1113
2729
1562
2548
1093
2758
1601
2577
1097
2735
1591
2589
1115
2709
1594
2579
1095
2724
1602
1
P3
2837
2050
1975
1138
2820
1869
2165
1145
2847
1929
2066
1159
2860
1938
2080
1129
2861
1927
2059
1153
1
P4
2973
162
3626
1239
3014
193
3557
1236
3005
168
3594
1232
3068
165
3528
1240
3013
167
3591
1228
1
P5
2919
1290
3171
620
2836
1239
3289
636
2859
1228
3262
650
2895
1270
3227
614
2884
1227
3255
633
1
P6
3665
158
2799
1378
3703
159
2717
1421
3588
145
2843
1425
3643139
2784
1435
3570
145
2854
1431
4. APLICACIÓN A UNA BASE DE DATOS REAL
Como una forma de validar el estudio empírico se utilizó la base de datos reales del corredor Las
Condes- Centro (Ortúzar y Donoso, 1983), básicamente por la estrictez de su construcción como
por el hecho de que ha sido ampliamente estudiada, lo que permite contrastar fácilmente los
resultados con estudios previos. La muestra consta de 697 observaciones y 9 modos alternativos.
Se trabajó con las siguientes variables de servicio: TDV (tiempo de viaje), TCAM (tiempo de
caminata), TESP (tiempo de espera), C/w (costo dividido por tasa salarial\ Se supuso la
existencia de correlación entre alternativas de transporte público, por lo que se consideró la
estructura anidada presentada en la Figura 18 . Los modelos estimados fueron el MNL, Probit
Independiente, LJ, Probit homoscedástico, y dos especificaciones ML. La primera (MLHe).
heteroscedástica, que sólo considera un término adicional dentro del nido; la segunda (MLHo ),
homoscedástica, que considera además términos de error adicionales independientes en las
alternativas no anidadas. Los resultados de la estimación se reportan en la Tabla 5. El coeficiente
de correlación al interior del nido se puede obtener, para el LJ, a través del parámetro estructural rjJ,
mientras que para el Probit corresponde a un parámetro más a estimar. En el caso del ML, lo que
se estima es <YJL y se puede demostrar fácilmente que:
(11)
7
8
Se considera esta variable como una aproximación a un modelo de tasa salarial.
Se probó con otras estructuras de nidos. En este trabajo se reporta la estructura que pennite hacer el mayor número
de comparaciones.
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
Ricardo .'\hun.:7 D . y M a n .::da Munit.(tga
70
.\uto
:\uto
T ax1
l\Ictro
( :olee t.
Bus
Chofer .\comp
-----------------------------
MNL
AutoAc.
,\ C:h
l\ktro
\ .\ e
l\ lctro
Tabla ~: Resultados Base Las Condes- Centro
Probit Ind.
Pro bit
LJ
T.Col.
l\ fctro
Bu s
,\ ktro
MLHe
MLHo
-11 ,1 )()411
ll,tli{).)
!0, 1')4 )
!. 0.1KI5J
11,41 1H.'\
I,!IJ'i .'\
(1).4 '1.l)
--- ~- ~- _o~~ ll )
3,2-f(,(,
),:u 11
( l,IHH¡
! K,2H'\ '
1,2-0S
2,H')J .1
(1,'1 1'))
(5.11 17)
11,1 5 12
0,4H3-t
- ll,l)()ij"'
O,I-Hl:2
fl,llll'!2
ll,ll:2H 1
(lUMl¡
{0.11 .\(};
; 0.11(>1> )
Taxi Col.
0,722')
O,.'>(tHR
0,7:2P
( 1,S7~
t·l.HIX J
Metro
( l.H2C>:,
4,(,(,ij)
-t,-t'nl
Bus
(11l,2i:'ll1
2,:2.1 H'
11 ,1 n(¡H
13
(11,tlK7)
1 ,2-+W
r4574J
11,1:2-:'-
:2. 11 r· -+
ltl,.lW
11,3 3SII
iii,<JI2)
(0,lH6)
(1_S71'l
¡tl.S24)
l l.(,ld ¡
( 1 .~ 15)
II,'Ji-\'i)
IJ,ú:251
1, 1M-+
(2.2.1X)
\ _2,ú(JI))
11,(¡(,1 )()
(11.7'i 11>)
1,SIJ1 ú
( ~:.202)
f2.7·17)
1 ,3C.'J')
2.-151)
ll,-t'JHH
11.1 h-ló
1,-HH8
(·1.1H-Ii
-O,OH2'\
1--1,7-l .l)
-ll, 1(, l ()
: H,62S)
-11,2.15')
0,.1 -E'i
t 1.2K 1\
1,12(,(¡
1·1.11 11> )
-11,1155-t
· -Ui.l1 )
-11' 1() T:'
1),(¡(,:2()
ti ,)H%
(O..l'J-1)
1,11 (,.f
(1,1l1K)
-IJ,fl'i .'iil
(-1.774¡
-11,111ú'7
1,0.1 53
(1,')\()'·
0, 1) 1:2H
(1.1•-lS¡
2,.'\(,() 1)
-,-- ' -
(-1,.'\5()\
-0 ,II'J S 1
( -l.'l.l(l)
-0,1 1)04
( 7.-lHK)
-0,2741
¡.).95')'
(S.O::!SJ
AutoChMetro
AutoAcMetro
T Col-Metro
Bus -Metro
TDV
TCAM
TESP
! 2. 2>K)
C/w
SEXO
AUTOLIC
-0,1124-t
(-.\,i>-1 7)
-11,2<J51
1- \.Vd '
2_3(¡()(,
(SJKI>)
.),:2~
~ ~.2ll )
' 1 .-IS~ )
1,H :~7
r.J.l7S)
.1)_()1)()-
-<U53 1
( 1,11 1'!)
-11,2¡-{1
1 1.%1>)
-0,0:22H
( H,úú2)
-0,14 7 5
(
4-.002)
i
~,U2H)
-11,() 1-t .'\
( 2,112Kj
( 2,854)
-11.1 5.1 1
( l. lli<J'
1,-tHH'J
(S.'J112i
-11,:2(,:27
(
1, ~(, 1) \
:2,:2111H
(-l_il42¡
;
( -7, 702)
-11,1-ti\4
¡.()_111'1)
l ,ll'JHú
(2 , 112)_
') ,:2i\.'i(l
(7 ,(, 1) ¡
:2,71 S-+
___
¡ 1 ,5~7¡
ll,-WO.'i
'")
,,.. , . ,
-11,( )1)1)')
1 -1./H.l·
-0,1 XI1-:'
( 7_1 X17¡
-0.2(¡-f 1
( I),S()()·
( 2.-I'!H)
¡ 2. 12 r.¿
-0,0142
(-1 .'!79·
-o.lr9
( 1,0-1'))
1,473(,
(1,7 .'\11)
-0,02).1
(-.1, \ 1K)
-11,:2H30
1 1.27.'\)
:2,5.1:2 1
-11,112(,:
( \ -1 24)
-0,2')2 .1
\ 1,.105)
2,:1:\0H
(S,(JI)Il)
(S, -1 %)
1 ,Wú 1
(\02(>1
1!,61 11(1'
O,H<J7 4
(2. 1'!1 )
11 ,32H7 '
ll,'Jl H1
(f>, 'i 75 )
(J'Il
11,1571 '
p
o ,m.1o
(11.2'1'1 )
Iteraciones
1(0)
TiempoConv
[min]
( *)
(¡
9
- - - -~
)
_,
')-
(¡
\-·- ·
- 1,) ú.f)(¡
- 1 ,.1 7H31
- 1 ,3 ú43'J
-1)7H2H
-1 ,'\ 'iH:17
'i,-+
).H
.VJ,H
22 6,-+
3 7 ,-t
--
'---
Lst1mado a part1r d..: t/J y a 11• r..:spccllvam<.:ntc.
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
K
- 1,1 5 'Jfl~
'i),7
MODELOS Mlxt-:D LOUI T ANTECFDf :NTI'S TFÓRI COS Y APLI CACION ES
71
Es posible verificar que los parámetros no poseen variaciones notables entre modelos, salvo
algunas diferencias con las constantes modales y ciertos parámetros para los modelos Probit. Sin
embargo, sí es posible observar diferencias importantes en el grado correlación estimado por los
distintos modelos. Mientras los modelos LJ y Probit obtienen una correlación muy baja, el MLHe
obtiene un valor considerablemente alto. E~ie valor baja prácticamente a la mitad cuando se
impone una estructura homoscedástica. Dos posibles explicaciones se pueden enunciar para este
extraño resultado . Por un lado, puede postularse que la base resulta ser heteroscedástica y
correlacionada, por ello al imponer homoscedasticidad se subestima la correlación. Por otro lado.
puede ser que el número de observaciones que posee la muestra no sea lo suficientemente alto
como para poder recoger de manera correcta efectos complejos de la estructura de covarianza.
5. CONCLUSIONES
El modelo Mixed Logit ofrece una alternativa interesante y útil de modelación. Permite modelar
situaciones prácticas en las que se espera el levantamiento de ciertos supuestos simplificatorios,
propios de los modelos clásicos y más utilizados. Su matriz de covarianza depende de la
especificación que se le dé a los términos de error adicionales que se consideren, y puede ser tan
general como se desee. En ese sentido, ofrece una estructura más flexible que otros modelos. En
particular se reconoce su capacidad de tratar con alternativas correlacionadas y variaciones en los
gustos expresada a través de parámetros aleatorios. Sin embargo. se debe ser riguroso con la
especificación que se esté utilizando, justificando adecuadamente en base a consideraciones
teóricas, la estructura de modelo previo a la estimación de los parámetros.
En este trabajo se presentó dos aplicaciones numéricas, una basada en experimentos de simulación
y otra con datos reales, ambas en un contexto de alternativas similares. Se muestra empíricamente
que el modelo presentado por Brownstone y Train ( 1999) como un Mixed Logit equivalente a un
Logit Jerárquico en realidad no lo es. Sin embargo, para el nivel de correlación reportado, si el
ML no se ajusta para obtener una matriz de covarianza homoscedástica, entonces las particiones
predichas por ambos no presentan severas diferencias. Además, en términos teóricos, esta
.. especificación siempre compromete la homoscedasticidad al definir correlación, lo que puede ser
visto como un problema si se desea comparar con el Logit Jerárquico, o como una ventaja por la
ganancia en flexibilidad.
AGRADECIMIENTOS
Este estudio fue parcialmente financiado por Fondecyt.
REFERENCIAS
Algers, S., Bergstrom, P., Dahlberg, M. y Dillen, J. (1999) Mixed logit estimation ofthe value of
travel time. Working Paper, Department ofEconomics, Uppsala University.
Aptech Systems (1994) GAUSS User's Manual. Maple Yalley, CA.
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
72
Ricardo Alvarcz D. y Marcel a Munizaga
--
··-
·- ··-··- - --
----·-- - - - -·-- · ----- -------·-- ·-··· ·-·---·-- ·- -- ·-·····---·-·····
--·-·-·-- - -----· --··- --··--- -
····· ·-·--
------· -····
Ben-Akiva, M.E. y Bolduc, D. ( 1996) Multinomial probit with a logit kernel and a general
parametric specitication of the covariance structure. Working Paper, Department d'Economique,
Université Lava!.
Bhat, C. (2000) Quasi-Random Maximum Simulated Likclihood Estimation of the Mixed
Multinomial Logit Model. 9'h lnternational Association for Travel Behaviour Research
Conference (IATBR), Queensland, Australia
Boyd, J. y Melman, R. ( 1980) The effect of fuel economy standards on the US automotive market:
an hedonic demand analysis. Transportation Research, Vol 14A, 367-378.
Brownstone, D. y Train, K. ( 1999) Forescating new product penetration with flexible substitution
patterns. Journal ofEconometrics, Vol89,109-129.
Cardell, N. y Dunbar, F. ( 1980) Measuring the societal impacts of automobile downsizing.
Transportation Research, Vol 14A, 423-434.
Daganzo, C.F. ( 1979) M ultinomial Probit: The Theory and its Applications to Travel Demand
Forecasting. Academic Press, Nueva York.
Gunn, H.F. y Bates, J.J. ( 1982) Statistical aspects of travel demand modelling. Transportation
Research, Vol16A, 371-382.
Hajivassiliou, V y Ruud, P. ( 1994) Classical estimation methods for LDV models using
simulation. En R. Engle y D. McFadden (Eds.), Handbook of Econometrics Vol IV . Elsevier.
Nueva York.
McFadden, O ( 1974) Conditional logit analysis of qualitative choice behavior. En P. Zarembka
(Ed.), Frontiers in Econometrics. Academic Press, Nueva York.
McFadden, D. y Train. K. (2001) Mixed MNL models for discrete response. Journal of Applied
Econometrics (en imprenta).
Munizaga, M.A. y Alvarez, R. (2000) Modelos mixed logit: uso y potencialidades. Actas del XI
Congreso Panamericano de Ingeniería de Tránsito y Transporte, Noviembre, Gramado,
Brasil, 523-535.
Munizaga, M.A. y Ortúzar, J. de D. (1997) On the applicability of the multinomial probit modcl.
Proceedings of the 25th European Transport Forum, Vol. P415. PTRC Education and
Research Services Ltd., Londres.
Munizaga, M. A. y Ortúzar, J. de D. ( l999a) Correlación entre alternativas: el modelo Logit
Jerárquico en profundidad. Actas del IX Congreso Chileno de Ingeniería de Transporte, 109120, Sociedad Chilena de Ingeniería de Transporte, Santiago.
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
MODH .OS MIXLD I.OGIT · ANTH'LDI'NTI'S Tf·ÚRI CO S Y API.ICACIONLS
73
Munizaga, M.A. y Ortú:t..ar, l de D. ( 1999b) Nested logit modelling: sorne hard facts. 27th
European Transport Conference. Vol P324. PTRC Education and Research Services Ltd.,
Londres. 25-36.
Ortúzar. J de O y Donoso, P. C. F .. ( 1983) Survey design, implentatíon, data coding and
evaluatíon for the estímatíon of disaggregate choice models in Santiago, Chile. 2nd lnternational
Conference on Survey Methods in Transport, Septiembre, Hungerford Hill Village, Australia
Ortúzar. J. de D. y Willumsen, L.G . ( 1994) Modelling Transport. Segunda Edición, John Wiley
and Sons, Chichester.
Train, K. ( 1999) Halton sequences for mixed logit. Working paper, Departmcnt of Economics.
University ofCalitornia at Berkeley.
Williams, H.C. W.L. ( 1977) On the formation of travel demand models and economic evaluation
- measures ofuser bendit. Environment and Planning, Vol9A, 285-344.
Williams. H.C. W.L. y Ortúzar. J. de D. ( 1982) Bchavioural theories of dispersion and the misspecification oftravel demand models. Transportation Research, Vol 168, 167-219
APÉNDICE
Sea i una alternativa perteneciente al nido k. La utilidad de esta alternativa, utilizando la
especificación ML considerada, corresponde a: U;n = V;n + j.Jkn + &m. con l:;n ~ Gumbel(O, 2) y j.Jkn ~
.f{O, crJl\ Es fácil ver que VAR( Um) = cr/ + cr/ y COY( Um. U1n) = cr/ ssi j E k. Este tipo de
estructura de la matriz de covarianza, implica el siguiente coeficiente de correlación:
(A 1)
Si f.lkn ~ N(O, a¡/\ entonces f.lkn = SknCYJl con Skn distribuido Normal estándar y el parámetro
estimado será tal que JI = 2crJl. Considerando (A.1) y la relación entre el factor de escala y la
a
varianza del término Gumbel, resulta directo demostrar que se cumple (11 ).
Acta X Congreso Chileno de Ingeniería de Transporte, 2001
Descargar