61 MODELOS MIXED LOGIT: ANTECEDENTES TEÓRICOS Y APLICACIONES Ricardo Alvarez Daziano y Marcela A. Munizaga Departamento de Ingeniería Civil, Universidad de Chile. Casilla 228-3, Santiago, Chile. mamuniza@cec. uchile.c 1, ralvarez@cec. uchile.cl http://tamarugo.cec.uchile.cV~dicidet/ RESUMEN El desarrollo de modelos de demanda de transporte se puede describir como una búsqueda de modelos flexibles que se adapten a un mayor número de situaciones prácticas. Sin embargo, en esta búsqueda la flexibilidad ha comprometido la estimabilidad de los modelos. Por un lado aparecen los modelos tradicionales de la "familia" Logit que ofrecen probabilidades de elección cerradas, pero con supuestos simplificatorios que no siempre son sostenibles. Por otro, está el modelo Probit que permite trabajar con una estructura de error general, pero su estimación resulta bastante compleja. En este contexto, caracterizado además por avances tecnológicos en materia de computación y métodos numéricos, se ha cuestionado el uso de modelos simplificados y ha aparecido con fuerza una nueva alternativa de modelación: el modelo Mixed Logit. En este artículo se revisa detalladamente los antecedentes teóricos que sustentan la formulación del modelo Mixed Logit, a través de un análisis de la matriz de covarianza se discute de qué manera estos modelos son capaces de modelar condiciones en las cuales se violan los supuestos de independencia y homoscedasticidad. Este análisis se complementa con dos aplicaciones numéricas que permiten comprobar la real posibilidad de utilizar este modelo y su capacidad de adaptarse a situaciones prácticas. En los experimentos de simulación se construye bases de datos que permiten controlar objetivamente la bondad de ajuste del modelo, la reproducción de la muestra de calibración y el nivel de respuesta a cambios en los atributos de las alternativas. La aplicación con datos reales pretende validar el estudio empírico y verificar la factibilidad de aplicar herramientas econométricas sofisticadas. A pesar de que su estimación requiere de simulación, se observa que en general el modelo entrega una adecuada reproducción de parámetros y un buen ajuste a los cambios de política. Se concluye que el Mixed Logit en efecto constituye modelación de elecciones discretas, aunque se implementación de una especificación particular, utilizados y teniendo claras sus consecuencias previo una alternativa interesante y poderosa para la debe ser riguroso en la construcción e justificando adecuadamente los supuestos a la estimación de los parámetros. Actas del X Congreso Chileno de Ingeniería de Trnnsporte. Concepción, 9 al 12 de Octubre de 2001 Acta X Congreso Chileno de Ingeniería de Transporte, 2001 62 Ri~ardo Alvarct. D. y Marcela Munua ga l. INTRODUCCIÓN El enfoque más utilizado en la actualidad para modelar elecciones discretas se basa en la teoría de la utilidad aleatoria (McFadden, 1974). Según esta teoría, para cada una de las alternativas i el individuo n tiene una función utilidad U111 asociada, escogiendo aquella alternativa que maximiza su utilidad. Esta función inherente del individuo, puede dividirse en una componente sistemática Vm, que recoge el efecto de las variables explicativas (atributos medibles u observables por parte del modelador), y una componente aleatoria &m que intenta recoger todos aquellos efectos no incluidos en la componente sistemática de la función de utilidad. De los supuestos que se asumen sobre la distribución del error estocástico se deriva los distintos modelos planteados en la literatura (Ortúzar y Willumsen, 1994). Los modelos más utilizados en la actualidad son el Logit Multinomial (McFadden, 1974), que se obtiene a partir de asumir que los términos de error &m son iid Gumbel, y el Logit Jerárquico (Williams, 1977), que se deriva como una extensión del anterior, en que se considera que existe una componente de error adicional, que representa correlación en un grupo de alternativas. En síntesis, se trata de estructuras de covarianza (del término de error) muy básicas, lo cual es un supuesto simplificatorio que no siempre es sostenible, pero que permite tener modelos simples de entender y usar. El modelo Probit (Daganzo, 1979), en cambio, se deriva a partir de suponer errores aleatorios distribuidos Normal multivariada, aceptando en teoría cualquier estructura de covarian7..a que los datos permitan estimar, lo cual implica un grado de dificultad de estimación considerable. A pesar de sus bondades en cuanto a flexibilidad, este modelo ha sido incorporado tímidamente a la práctica, pese a existir desde hace algún tiempo herramientas poderosas que permiten su estimación mediante simulación (ver Munizaga y Ortúzar, 1997). En este contexto, caracterizado por un compromiso entre estimabilidad y flexibilidad, es que han irrumpido los modelos Mixed Logit -también conocidos como modelos de Error Compuesto o Probit con Kernel Logit- (Ben Akiva y Bolduc, 1996; Brownstone y Train, 1999). Se trata de una alternativa intermedia que se sitúa en algún punto entre el Logit y el Probit. Sus promotores claman que tiene la flexibilidad del Probit, manteniendo parte de la simpleza del Logit. En este trabajo se analiza los antecedentes teóricos que permiten formular este modelo, verificando la consecuencia de sus hipótesis y contrastándolas con las de otros modelos de elección. 2. EL MODELO MIXED LOGIT 2.1. Formulación Los orígenes del modelo se remontan a principios de la década de los '80 cuando en los trabajos de Cardell y Dunbar ( 1980) y Boyd y Melman ( 1980) se describe un modelo equivalente a los actuales Mixed Logit, con el nombre de modelo Hedónico. Su reciente reaparición con otro nombre y renovados bríos puede deberse a los avances tecnológicos que permiten su estimación en menor tiempo. Recientemente este tipo de modelos ha sido utilizado para modelar diversas situaciones en distintos contextos (Train, 1999; Brownstone y Train, 1999; Algers et al., 1998). Acta X Congreso Chileno de Ingeniería de Transporte, 2001 MODELOS MIXED LOGIT : ANT ECEDENTES TEÓRICOS Y APLICACIONES - - - - --·--- 63 - · -- - -- - - - -- - - - Los modelos Mixed Logit nacen de suponer una función de utilidad U;n conformada por una componente determinística Vm, una componente aleatoria &;n independiente e idénticamente distribuida, y uno o más términos aleatorios adicionales. Estos términos de error adicionales pueden ser agrupados en un término aditivo r¡;n , que puede ser función de datos observados de la alternativa, y que permite recoger la presencia de correlación y heteroscedasticidad. Así, la función de utilidad queda definida como (1) donde C;n ~ Gumbel(O, ít) y '7m ~ f( 1]/ fJ'), donde fes una función densidad general y fJ' son parámetros fijos que la describen ( e.g. media y varianza) 1• Como e es iid Gumbel, entonces la probabilidad condicional en '7 de que el individuo n escoja la alternativa i corresponde exactamente a un modelo Logit Multinomial (MNL): pn (i / 1]) = -:.J-. exp( ~n + '7m ) I (2) _---=.._____;_;;_:___ exp( VJn + '7¡n) .J = I Para obtenerse la probabilidad de elegir la alternativa, debe evaluarse la expresión anterior sobre todos los valores posibles 1], lo que corresponde a la integral de la probabilidad condicional por la función densidad del término aleatorio 1], esto es: (3) Como caso particular, puede suponerse una función de utilidad con la siguiente especificación2 : um = /3' X m + f.J:nzm +¡;m '--y---' '---y--J V,. f/,. ( 4) En esta expresión se asume que la componente determinística de la utilidad es lineal en los parámetros fJ que ponderan a los atributos x," Por otro lado, se asume que '7 depende de ciertos parámetros (f.Jm) y datos observados relacionados con la alternativa i (z;n), relación que también se supone lineal en parámetros. Un supuesto adicional, que ha sido utilizado en la mayor parte de los estudios previos (Ben Akiva y Bolduc, 1996; Brownstone y Train, 1999), es que el término f.J es propio del individuo, sin variar entre alternativas. Es decir: IJ;n = f.Jn 1 Z;n- 1 La distribución de los términos aleatorios generalmente se asume Normal, existiendo diversos argumentos detrás de este supuesto. Otra distribución que ha sido utilizada es la Lognormal, especialmente en aquellos casos en que se quiere restringir el signo de un determinado parámetro. 2 fJ es un vector de parámetros de dimensión L (hay L variables explicativas en la componente determinística de la función de utilidad); Xm es un vector de atributos de dimensión L; f.l,, es un vector aleatorio de dimensión K cuyas componentes tienen media cero y con matriz de covarianza Q; Zm es un vector de atributos asociados con la alternativa i y el individuo n, y tiene dimensión K; finalmente, Cm es una variable aleatoria que representa el error estocástico. Acta X Congreso Chileno de Ingeniería de Transporte, 2001 Rica rdo J\h·arcz D. , . Ma r<:da Muni 7"'ga 64 2.2. Matriz de Covarianza Dada una función de utilidad como en ( 4) y considerando además el supuesto usual T/m = Jln 1 Zm, sea Zn la matriz de dimensión KxJ que contiene a los vectores Zm para cada alternativa perteneciente al conjunto de elección del individuo (i E Cn) y l.'n un vector aleatorio iid Gumbel con matriz de covarianza L¿· y que contiene a los elementos E:¡ 11 • Si se asume que cada término de 1-'n tiene una función densidad con media cero y varianza dk y que el vector en su conjunto tiene una matriz de covarianza Q , entonces la matriz de covarianza del modelo (l:), puede escribirse como: L = z;, · Q · z, + I , = <· Q · ::::, 2 (5) + a, 1 Es fácil demostrar que la matriz de covarianza obtenida es simétrica y definida positiva. y que su dimensión está bien detinida 3 . De esta expresión general se concluye que el modelo es capaz de modelar correlación y heteroscedasticidad entre alternativas. En particular, dependiendo de la especificación que se le dé al término de error adicional, es posible modelar situaciones como alternativas similares y variaciones en los gustos. Si se obtie ne la covarianza entre dos alternativas se observa que para i, j E ( 'n con i '#.j: ¡.; (6) cov(U,, ,U,, ) = Iz¡, nZk¡na: k=1 que en general será distinto de cero si es que para al menos algún k, a;> O y zkm•zk;n '#.O . En tal caso, se asegura la presencia de correlación entre las alternativas i yj. Por otro lado, (7) luego si var(U,J '#. var(U ;n ) se asegura heteroscedasticidad entre dichas alternativas. Se puede ver que se trata de una forma distinta de plantear y justificar un determinado modelo. La forma usual es hacer supuestos directamente sobre la covarianza de E:¡n, como por ejemplo en el caso del Probit. En cambio, en un modelo Mixed Logit lo que se hace es agregar términos que sean fuente de correlación y/o heteroscedasticidad obteniéndose como resultado una determinada estructura de covarianza. 3 La matriz de covarianza es de dimensión J x J. En efecto, como Q es de dimensión K x K (con K el número de componentes aleatorias), y Z 11 tiene dimensión K x J, entonces .:'"Q Z 11 es una matri z de dimen sión J x J; luego al sumarse esta última con la matriz I ,,, cuya dimen sión corresponde a J x J, se demuestra finalmente que diml:=dim(z:1 ·Q· zn +l: ,: )=J x .J . Acta X Congreso Chileno de Ingeniería de Transporte, 2001 MODII.OS MIXFD l.()(jJT ANTECEDENTES JT(>R.ICOS Y APIICACIONI S 65 2.3. Algunas Propiedades del Mixed Logit Probablemente la propiedad más interesante de este modelo es que bajo ciertas condiciones de regularidad cualquier modelo de utilidad aleatoria tiene probabilidades de elección que pueden ser aproximadas tan cerca como se desee por un Mixed Logit (McFadden y Train, 2001). Es así como, por ejemplo, un modelo Mixed 1,ogit con parámetros aleatorios distribuidos Normal puede aproximar a un modelo Probit. Por otro lado, al permitir modelar alternativas correlacionadas, el Mixed Logit es capaz de levantar el supuesto de independencia de alternativas irrelevantes propio del MNL. De esta manera. los patrones de sustitución entre alternativas son flexibles y son un resultado de los datos y no una imposición particular. como ocurre en el MNL. La relación entre un modelo Mixed Logit y los modelos de parámetros - formulados con el objetivo de modelar variaciones en los gustos- es directa. En ese sentido, se puede plantear que los parámetros de gusto fJ,, poseen una media poblacional fJ más una componente aleatoria Jin que representa la variación en los gustos del individuo n con respecto a la media. Esto se puede interpretar como una estructura análoga a (4 ), en la cual r¡,n = Jin' Z¡n y z = x ( Brownstone y Train, 1999). 2.4. Estimación La probabilidad de elección de un modelo Mixed Logit como la expresada en la ecuación (3 ), no posee una expresión matemática cerrada a diferencia del Logit Multinomial o del Jerárquico. Es más, como la integral no puede resolverse analíticamente es preciso usar algún método de integración. En la literatura es posible observar que se prefiere utilizar simulación de Monte Cario por sobre otros métodos como por ejemplo integración numérica por cuadratura (Bhat, 2000). Además, se puede aprovechar el hecho de que la probabilidad condicional (2) tiene una expresión de forma Logit Multinomial. Así, si se considera R valores de '7 obtenidos de su función densidad ./{ T¡IB"'). para cada una de las repeticiones es posible calcular exp( V,n + r¡:n) P,, (i 1r( ) = -J~'----"'------'-'-'-!_;___ L exp( V 111 (8) + 'l~n ) 1~ 1 con r = l . .... R. Luego es posible obtener la probabilidad promedio (9) y con ella construir la función de verosimilitud simulada .1 SL = LLYm In P(i) IIEIJ (10) t= l Acta X Congreso Chileno de Ingeniería de Transporte, 2001 Ricardo Alvarez D. y Marcela Munizaga 66 Bajo condiciones de regularidad, el estimador rnaXlmo verosímil simulado es consistente y asintóticamente normal. A pesar de que ( 1O) es un estimador insesgado de la probabilidad, su logaritmo natural resulta ser sesgado (Brownstone y Train, 1999); sin embargo, cuando el número de repeticiones crece más rápido que la raíz cuadrada del número de observaciones, el estimador resulta asintóticamente equivalente al estimador máximo verosímil (Hajivassilou y Ruud, 1994). 3. EXPERIMENTOS DE SIMULACIÓN Siguiendo la metodología de Williams y Ortúzar (1982), se realizó un experimento de simulación con el fin de comprobar la factibilidad real de aplicación del modelo. Para ello se creó distintas bases de datos sintéticas considerando medias y desviaciones de los atributos a partir de una base real construida para Santiago. Se consideró una situación de elección modal con cuatro alternativas (auto, bus, metro y taxi) y cuatro variables explicativas (costo, tiempo de viaje, tiempo de acceso, dummy de ingreso). Se pretende modelar el caso en que las alternativas bus y metro son consideradas como similares entre sí. Para construir la parte estocástica de la función utilidad se trabajó con el enfoque planteado por Brownstone y Train (1999), considerado por los autores como un modelo Mixed Logit (ML) "análogo" al Logit Jerárquico (LJ). Este modelo particular se construye agrupando las alternativas en nidos, agregando un parámetro aleatorio asociado a una variable muda propia de cada nido (que indica si la alternativa pertenece o no a éste). La presencia del parámetro aleatorio común para aquellas alternativas que comparten nido, permite obtener una covarianza con presencia de elementos fuera de la diagonal, obteniéndose un patrón de correlación similar al de un LJ, pero no necesariamente una estructura de covarianza análoga. De hecho es posible comprobar cierto compromiso entre correlación y heteroscedasticidad en esta especificación (Munizaga y Alvarez, 2000). Así, se consideró un término de error iid Gumbel(O,A.) y, adicionalmente, un término de error f.ln distribuido Normal(O,a-/) con el fin de modelar correlación. En primer lugar se consideró este último sólo en las alternativas bus y metro, lo que sigue el enfoque planteado por Brownstone y Train, cuya matriz de covarianza resulta heteroscedástica4 . Luego se consideró errores iid Normal para las alternativas no anidadas con el fin de obtener una matriz homoscedástica correspondiente a una estructura teóricamente modelable por un LJ. Al asumir f.ln ~ N(O,a-/), entonces es posible escribir f.ln = SnO"p con Sn distribuido Normal estándar. Como no se conoce a-f.l, entonces interesa estimar su valor, con el cual queda determinada la distribución del término de error adicional. Nótese que al poseer el modelo un término de error Gumbel, el parámetro estimado se verá escalado y se cumplirá que a~ = A-a- 1, . Para la estimación de los modelos MNL, LJ y Probit se utilizó un código propio programado en Gauss (Aptech Systems, 1994) basado en la rutina de máxima verosimilitud. Para la estimación del modelo Mixed Logit se utilizó un código flexible en Gauss preparado por Kenneth Train, disponible en su página web5 . 4 Debido a que la varianza total del error resulta mayor para las alternativas anidadas (Munizaga y Alvarez, 2000). En ese sentido la especificación original no posee una estructura de covarianza análoga a la de un LJ. 5 http://elsa.berkdey.edu/- train/softwarc.html Acta X Congreso Chileno de Ingeniería de Transporte, 2001 MODI'I.OS MIXFD I.OGIT ANTFCFDI:NTLS TEÓRICOS Y APLICACIONES 67 Se trabajó con 8000 observaciones, y se consideró un coeficiente de correlación igual a 0.5 entre las alternativas bus y metro 6 • lo que implica que CYp = CY1 (Munizaga y Alvarez, 2000). Primero se generó una base de datos a partir de una matriz de covarianza heteroscedástica. mientras que la segunda base posee una matriz homoscedástica. La varianz..a total del error se eligió de manera tal que el factor de escala de un modelo MNL fuese igual a uno, asegurándose de que el experimento no fuese completamente determinístico ni aleatorio. La estimación del Probit se efectuó utili7..ando el simulador de probabilidades GHK con 1O repet1c1ones. A su vez, para el Mixed Logit se usó con 200 repeticiones usando números aleatorios basados en series de Halton (Train, 1999). Los valores reportados corresponden a corridas realizadas en un computador personal con un procesador Pentium II de 450 MHz y 64 MB de memoria RAM. Los resultados de las estimaciones del MNL, LJ, Probit y ML para cada situación de elección se presentan en la Tabla 1, en que también se entrega cada valor de referencia. La tabla presenta las estimaciones de los parámetros para cada modelo, el estadígrafo t de significancia estadística y el test t sobre el valor de referencia del parámetro para el ML. Para el LJ, el valor de referencia de es calculado a partir de la correlación simulada. . Tabla I· Resultados Simulación Base H omoscedástica Pro bit ML Re f. MNL Base Heteroscedástica Re f. MNL LJ Cte Auto -0,4() -0,.)4(12 ( ·1.7'! 1) -IJ,)if'2 1 ~. -!(>') ) ·- Cte Metro 1!,20 Cte Taxi -0,4'i Costo -IJ,IIIIS ( l,.\ú1ú (S.R·IR I - - -- - - ~ -- - - --- 11 ,.) 171 0,22ú "7 (:1,1<N) (SJ22) -- -0 ,2')4(, -0 .2-ü4 ( ·1.741) ( ~.! (¡ X \ _l!.X-IHI 11,2'il2 11.11721 -O,S21R (-12.11ú) 11.81SI -11,01 J.'i 'i (· ll.flll) -0,7(¡<))-l 1-1 .\ 0úS) -11,110711 -11,007() ( II ,.Vl<J) ( 11.27~) ·11,01 14') 1-Jil,') 12) -11,1044 -IJ, lOIIS -0,0702 ( -_)(,_.'i(¡()J ( ."12.1J"l5) (- .10.7Ml) -0,2012 l 47.029) -0,1 'lS-1( 11 .2M) -11,1.1"7') ( 35.-I'J'I) -11,4H11 ( 12.'157) -0, 14l:l'J ( 0,20 (.S,2(dj - · - · -· -11,700 7 1 12.S57) -IJ ,40 ~.1 4 .1) LJ Probit ML -0,2R41 -0,1 ')21 -0,4ú l <J l -1 .~ (,') ) --- - ----- --- 0,4RH4 17.'1H2) 0,3úO'i ¡(,,.'i."\0) ( 1. ~n ¡;¡ 0,2<JR2 r,!>.76H) -0, 116(} -0,1101 ( 2.27 4) ( ~.'X IS ; -0,2041 ( 4.1S'Jj -0,1 Hl'i -U,OO.'i1 ( K'Jiil ) -O,OO'i2 'fUS ."l) -0,0041 ( H,llú 7) -O,OH -U ,OR35 1 .>1 ,41>4) -11.0760 -0,11614 ( 21 ,'!1 HJ -ll,17ú'i H4.'!1'l) -ll, 1 ó4 3 · ."IH.757) -0,4'i ..J.:!.!{I'>~I Tiempo de Viaje -11,08 Tiempo de Acceso Ingreso Alto -11,16 ; 0)0' 1 1,2 l ,492H (24.094) 1,4 7.'iS (2.),<)5"1) O,S'J45 -0.0804 (-.1 1.1 72) ¡-o, l líll -1l, l.'i63 ( V>.t>7H) IO.HCílil 1 ,OúRú (21,."\0új 1,1 T ú (21,4(>4) -0,1 (¡ O,<JIJ(¡<) (-27,0 .)2) -0,1323 ( 23 .7 12) 1,2 1,2454 (21. 11 7) !,21N (20.R2R) IJ,"707J l-0.2()11 -0,01)4') ( '!, 72 1) -11,1179 l (-."IO.H4 SJ L0,544J -0 ,1 'i% (- ."lú,(>'JH) l,!Rú6 (21.H42) 10,2471 0,5441 (S.RHO) ll)458 (')'', S:=> X) ll,'i lOO (1,7(,()1 (·15'l7) (H.ViC) ú ) -0,'!34(>9 'i -11,93 42(¡ -O,<J.)(,HH -O,'J32') l 'i - 1,ll3JHO 'i - 1,02') 1<) -l,01BR O,R472 ('1..\SO) 1-ll.úSill 2 - 1 ,02Hú7 () ,Ú II ,H .Vi,S 42 ,) (l,7 O,R .1'i,2 !S2,'i :') .. -- ---- - .- - - e - - (.) 1cst t con respecto a cero 1-1 1cst t con respecto al paramctro de rcfercnc oa 6 ( -111.%7¡ O,')<)<)R (IS.24."1) O,'JOú'l 1 1.(>1 .ll Iterac. 1(6) Tiempo [minl (_"\_(,(¡(¡ 1 1--o.S!>'JI -0,4(} l (J IU. I111J 1 2.).9~ ."1 ) Up 7,<)~.;2) I1J>71L 0,1711 Jl1.2.12J -~ -- ( 7 - - ~- Se trabajó con coeficientes de correlación mayores, pero se optó por reportar los resultados para este nivel, debido a que generalmente los grados de correlación prácticos no resultan sustancialmente altos. Acta X Congreso Chileno de Ingeniería de Transporte, 2001 Ricardo Alvare7. D. y Marcela Muni7.aga 68 El modelo ML permite recuperar adecuadamente los valores de todos los parámetros de gusto con que fue generada la base de datos, lo cual es mostrado por el estadígrafo t, que es menor que 1,96 en todos los casos. El MNL presenta parámetros que son distintos de los valores verdaderos. especialmente en el caso de correlación y heteroscedasticidad. Cabe hacer notar que para la base heteroscedástica se observa ciertos efectos de escala sobre los parámetros estimados por el modelo LJ, lo que reafirma ciertos estudios empíricos previos (Munizaga y Alvarez, 2000). Por otro lado, a pesar del alto número de observaciones, el Probit presenta ciertas dificultades para recoger los parámetros asociados a la correlación presente. En la Tabla 2 se muestra los cambios de política considerados para efectuar un análisis de respuesta de los modelos (Williams y Ortúzar, 1982); es posible ver que las políticas definidas corresponden a cambios fuertes en los valores de los atributos, aumentando al doble o disminuyendo a la mitad algunos valores en cada caso. Como medida de error para cada una de las políticas definidas, se utiliza el índice Chi cuadrado de Gunn y Bates ( 1982), reportado en la Tabla 3; éste se calcula como z 2 = L (Ñ, ' 2 -N, ) N, , donde Ñ, es el número de individuos que elige la alternativa i según la predicción hecha por el modelo, y N¡ es el número de individuos que elige la alternativa i de acuerdo al modelo de simulación. Pl Cono tk ViaJe A litO Bus 2,0 Tiempo de Acceso Auto Bus Metro 2,0 P2 PJ 2,0 0,5 P4 P5 P6 Metro Tabla 2: Cambios de Política Tiempo de Viaje Auto Bus Taxi Metro Taxi 1,5 0,5 2,0 1,5 0,3 1,5 2,0 Taxi 0,5 0,5 1,5 2,0 2,0 T a bla 3 : Í nd"tcex Base Heteroscedástica MNL LJ Probit ML Base pJ Pi PJ P4 P5 P6 x 2 95%.J 0,00 10,21 9,65 4,32 10,35 8,99 1,87 = 7,81 S 0,03 10,62 9,81 3,41 6,64 8,24 3,40 0,40 9,00 7,50 1,16 3,41 3,96 3,33 0,00 6,01 5,65 1,41 8,03 5,16 2,64 Base Homoscedástica Probit ML MNL LJ 0,00 1,78 2,52 34,34 11,63 9,23 4, 15 0,00 1,79 0,91 11,79 5,44 8,25 5,01 0,53 0,67 0,81 11,88 13,46 1,54 4,91 0,01 2,52 1,42 11,37 5,41 6,01 6,64 Las mayores diferencias entre las predicciones de los modelos y los valores simulados (realidad virtual) se encuentran para el MNL para ambos casos (homo/heteroscedástico ). Las predicciones del LJ y ML son bastante similares (Ver Tabla 4), prácticamente indistinguibles, para el caso homoscedástico, siendo ambas a su vez muy parecidas a lo que se ha llamado "realidad virtual". Sin embargo, si la base es heteroscedástica se observa algunas pequeñas diferencias entre las predicciones de ambos modelos. Acta X Congreso Chileno de Ingeniería de Transporte, 2001 MODELOS MIXED LOGIT ANTFCEDFNTES TEÓRICOS Y APLICACIONES Al t. l 1 UJ 2 <: 3 C/) ¡:o 4 l 2 ~ 3 ...... 3 ,.J 4 l 2 4 ¡.... l 1:0 2 ~ 3 ¡:l.. 4 1 2 ~ 3 4 Base 3225 1056 2625 1094 3227 1055 2624 1094 3217 1058 2628 1096 3238 1067 2610 1090 3224 1057 2625 1094 1 Tabla 4: Particiones de Mercado Base Heteroscedástica Pl 1 P2 1 P3 1 P4 1 P5 1 P6 Base 1 PI 2482 1146 3017 1355 2445 1232 3034 1289 2438 1234 3037 1291 2466 1239 2984 1318 2439 1221 3008 1332 2556 1190 2862 1392 2495 1266 2908 1331 2500 1269 2901 1329 2513 1275 2859 1361 2491 1257 2877 1375 2754 2262 2103 881 2675 2281 2166 878 2681 2317 2116 887 2725 2305 2103 875 2715 2297 2092 896 2961 157 3858 1024 2941 193 3882 983 2927 182 3907 984 3000 175 3830 997 2945 180 3889 986 2837 1341 3327 495 2713 1393 3398 496 2717 1391 3391 502 2791 1405 3324 486 2780 1369 3345 506 3818 3244 157 918 2897 2498 1128 1340 3806 3244 162 918 2865 2498 1166 --1340 3743 3242 157 919 2931 2499 1169 1340 3752 3263 150 932 2928 2478 1170- -1332 -3746 3245 158 920 2948 2498 1148 1338 2542 1090 2843 1525 2512 1065 2867 1556 2510 1066 2869 1556 2545 1082 2826 1553 2504 1065 2864 1568 69 Base Homoscedástica 1 P2 2596 1113 2729 1562 2548 1093 2758 1601 2577 1097 2735 1591 2589 1115 2709 1594 2579 1095 2724 1602 1 P3 2837 2050 1975 1138 2820 1869 2165 1145 2847 1929 2066 1159 2860 1938 2080 1129 2861 1927 2059 1153 1 P4 2973 162 3626 1239 3014 193 3557 1236 3005 168 3594 1232 3068 165 3528 1240 3013 167 3591 1228 1 P5 2919 1290 3171 620 2836 1239 3289 636 2859 1228 3262 650 2895 1270 3227 614 2884 1227 3255 633 1 P6 3665 158 2799 1378 3703 159 2717 1421 3588 145 2843 1425 3643139 2784 1435 3570 145 2854 1431 4. APLICACIÓN A UNA BASE DE DATOS REAL Como una forma de validar el estudio empírico se utilizó la base de datos reales del corredor Las Condes- Centro (Ortúzar y Donoso, 1983), básicamente por la estrictez de su construcción como por el hecho de que ha sido ampliamente estudiada, lo que permite contrastar fácilmente los resultados con estudios previos. La muestra consta de 697 observaciones y 9 modos alternativos. Se trabajó con las siguientes variables de servicio: TDV (tiempo de viaje), TCAM (tiempo de caminata), TESP (tiempo de espera), C/w (costo dividido por tasa salarial\ Se supuso la existencia de correlación entre alternativas de transporte público, por lo que se consideró la estructura anidada presentada en la Figura 18 . Los modelos estimados fueron el MNL, Probit Independiente, LJ, Probit homoscedástico, y dos especificaciones ML. La primera (MLHe). heteroscedástica, que sólo considera un término adicional dentro del nido; la segunda (MLHo ), homoscedástica, que considera además términos de error adicionales independientes en las alternativas no anidadas. Los resultados de la estimación se reportan en la Tabla 5. El coeficiente de correlación al interior del nido se puede obtener, para el LJ, a través del parámetro estructural rjJ, mientras que para el Probit corresponde a un parámetro más a estimar. En el caso del ML, lo que se estima es <YJL y se puede demostrar fácilmente que: (11) 7 8 Se considera esta variable como una aproximación a un modelo de tasa salarial. Se probó con otras estructuras de nidos. En este trabajo se reporta la estructura que pennite hacer el mayor número de comparaciones. Acta X Congreso Chileno de Ingeniería de Transporte, 2001 Ricardo .'\hun.:7 D . y M a n .::da Munit.(tga 70 .\uto :\uto T ax1 l\Ictro ( :olee t. Bus Chofer .\comp ----------------------------- MNL AutoAc. ,\ C:h l\ktro \ .\ e l\ lctro Tabla ~: Resultados Base Las Condes- Centro Probit Ind. Pro bit LJ T.Col. l\ fctro Bu s ,\ ktro MLHe MLHo -11 ,1 )()411 ll,tli{).) !0, 1')4 ) !. 0.1KI5J 11,41 1H.'\ I,!IJ'i .'\ (1).4 '1.l) --- ~- ~- _o~~ ll ) 3,2-f(,(, ),:u 11 ( l,IHH¡ ! K,2H'\ ' 1,2-0S 2,H')J .1 (1,'1 1')) (5.11 17) 11,1 5 12 0,4H3-t - ll,l)()ij"' O,I-Hl:2 fl,llll'!2 ll,ll:2H 1 (lUMl¡ {0.11 .\(}; ; 0.11(>1> ) Taxi Col. 0,722') O,.'>(tHR 0,7:2P ( 1,S7~ t·l.HIX J Metro ( l.H2C>:, 4,(,(,ij) -t,-t'nl Bus (11l,2i:'ll1 2,:2.1 H' 11 ,1 n(¡H 13 (11,tlK7) 1 ,2-+W r4574J 11,1:2-:'- :2. 11 r· -+ ltl,.lW 11,3 3SII iii,<JI2) (0,lH6) (1_S71'l ¡tl.S24) l l.(,ld ¡ ( 1 .~ 15) II,'Ji-\'i) IJ,ú:251 1, 1M-+ (2.2.1X) \ _2,ú(JI)) 11,(¡(,1 )() (11.7'i 11>) 1,SIJ1 ú ( ~:.202) f2.7·17) 1 ,3C.'J') 2.-151) ll,-t'JHH 11.1 h-ló 1,-HH8 (·1.1H-Ii -O,OH2'\ 1--1,7-l .l) -ll, 1(, l () : H,62S) -11,2.15') 0,.1 -E'i t 1.2K 1\ 1,12(,(¡ 1·1.11 11> ) -11,1155-t · -Ui.l1 ) -11' 1() T:' 1),(¡(,:2() ti ,)H% (O..l'J-1) 1,11 (,.f (1,1l1K) -IJ,fl'i .'iil (-1.774¡ -11,111ú'7 1,0.1 53 (1,')\()'· 0, 1) 1:2H (1.1•-lS¡ 2,.'\(,() 1) -,-- ' - (-1,.'\5()\ -0 ,II'J S 1 ( -l.'l.l(l) -0,1 1)04 ( 7.-lHK) -0,2741 ¡.).95')' (S.O::!SJ AutoChMetro AutoAcMetro T Col-Metro Bus -Metro TDV TCAM TESP ! 2. 2>K) C/w SEXO AUTOLIC -0,1124-t (-.\,i>-1 7) -11,2<J51 1- \.Vd ' 2_3(¡()(, (SJKI>) .),:2~ ~ ~.2ll ) ' 1 .-IS~ ) 1,H :~7 r.J.l7S) .1)_()1)()- -<U53 1 ( 1,11 1'!) -11,2¡-{1 1 1.%1>) -0,0:22H ( H,úú2) -0,14 7 5 ( 4-.002) i ~,U2H) -11,() 1-t .'\ ( 2,112Kj ( 2,854) -11.1 5.1 1 ( l. lli<J' 1,-tHH'J (S.'J112i -11,:2(,:27 ( 1, ~(, 1) \ :2,:2111H (-l_il42¡ ; ( -7, 702) -11,1-ti\4 ¡.()_111'1) l ,ll'JHú (2 , 112)_ ') ,:2i\.'i(l (7 ,(, 1) ¡ :2,71 S-+ ___ ¡ 1 ,5~7¡ ll,-WO.'i '") ,,.. , . , -11,( )1)1)') 1 -1./H.l· -0,1 XI1-:' ( 7_1 X17¡ -0.2(¡-f 1 ( I),S()()· ( 2.-I'!H) ¡ 2. 12 r.¿ -0,0142 (-1 .'!79· -o.lr9 ( 1,0-1')) 1,473(, (1,7 .'\11) -0,02).1 (-.1, \ 1K) -11,:2H30 1 1.27.'\) :2,5.1:2 1 -11,112(,: ( \ -1 24) -0,2')2 .1 \ 1,.105) 2,:1:\0H (S,(JI)Il) (S, -1 %) 1 ,Wú 1 (\02(>1 1!,61 11(1' O,H<J7 4 (2. 1'!1 ) 11 ,32H7 ' ll,'Jl H1 (f>, 'i 75 ) (J'Il 11,1571 ' p o ,m.1o (11.2'1'1 ) Iteraciones 1(0) TiempoConv [min] ( *) (¡ 9 - - - -~ ) _, ')- (¡ \-·- · - 1,) ú.f)(¡ - 1 ,.1 7H31 - 1 ,3 ú43'J -1)7H2H -1 ,'\ 'iH:17 'i,-+ ).H .VJ,H 22 6,-+ 3 7 ,-t -- '--- Lst1mado a part1r d..: t/J y a 11• r..:spccllvam<.:ntc. Acta X Congreso Chileno de Ingeniería de Transporte, 2001 K - 1,1 5 'Jfl~ 'i),7 MODELOS Mlxt-:D LOUI T ANTECFDf :NTI'S TFÓRI COS Y APLI CACION ES 71 Es posible verificar que los parámetros no poseen variaciones notables entre modelos, salvo algunas diferencias con las constantes modales y ciertos parámetros para los modelos Probit. Sin embargo, sí es posible observar diferencias importantes en el grado correlación estimado por los distintos modelos. Mientras los modelos LJ y Probit obtienen una correlación muy baja, el MLHe obtiene un valor considerablemente alto. E~ie valor baja prácticamente a la mitad cuando se impone una estructura homoscedástica. Dos posibles explicaciones se pueden enunciar para este extraño resultado . Por un lado, puede postularse que la base resulta ser heteroscedástica y correlacionada, por ello al imponer homoscedasticidad se subestima la correlación. Por otro lado. puede ser que el número de observaciones que posee la muestra no sea lo suficientemente alto como para poder recoger de manera correcta efectos complejos de la estructura de covarianza. 5. CONCLUSIONES El modelo Mixed Logit ofrece una alternativa interesante y útil de modelación. Permite modelar situaciones prácticas en las que se espera el levantamiento de ciertos supuestos simplificatorios, propios de los modelos clásicos y más utilizados. Su matriz de covarianza depende de la especificación que se le dé a los términos de error adicionales que se consideren, y puede ser tan general como se desee. En ese sentido, ofrece una estructura más flexible que otros modelos. En particular se reconoce su capacidad de tratar con alternativas correlacionadas y variaciones en los gustos expresada a través de parámetros aleatorios. Sin embargo. se debe ser riguroso con la especificación que se esté utilizando, justificando adecuadamente en base a consideraciones teóricas, la estructura de modelo previo a la estimación de los parámetros. En este trabajo se presentó dos aplicaciones numéricas, una basada en experimentos de simulación y otra con datos reales, ambas en un contexto de alternativas similares. Se muestra empíricamente que el modelo presentado por Brownstone y Train ( 1999) como un Mixed Logit equivalente a un Logit Jerárquico en realidad no lo es. Sin embargo, para el nivel de correlación reportado, si el ML no se ajusta para obtener una matriz de covarianza homoscedástica, entonces las particiones predichas por ambos no presentan severas diferencias. Además, en términos teóricos, esta .. especificación siempre compromete la homoscedasticidad al definir correlación, lo que puede ser visto como un problema si se desea comparar con el Logit Jerárquico, o como una ventaja por la ganancia en flexibilidad. AGRADECIMIENTOS Este estudio fue parcialmente financiado por Fondecyt. REFERENCIAS Algers, S., Bergstrom, P., Dahlberg, M. y Dillen, J. (1999) Mixed logit estimation ofthe value of travel time. Working Paper, Department ofEconomics, Uppsala University. Aptech Systems (1994) GAUSS User's Manual. Maple Yalley, CA. Acta X Congreso Chileno de Ingeniería de Transporte, 2001 72 Ricardo Alvarcz D. y Marcel a Munizaga -- ··- ·- ··-··- - -- ----·-- - - - -·-- · ----- -------·-- ·-··· ·-·---·-- ·- -- ·-·····---·-····· --·-·-·-- - -----· --··- --··--- - ····· ·-·-- ------· -···· Ben-Akiva, M.E. y Bolduc, D. ( 1996) Multinomial probit with a logit kernel and a general parametric specitication of the covariance structure. Working Paper, Department d'Economique, Université Lava!. Bhat, C. (2000) Quasi-Random Maximum Simulated Likclihood Estimation of the Mixed Multinomial Logit Model. 9'h lnternational Association for Travel Behaviour Research Conference (IATBR), Queensland, Australia Boyd, J. y Melman, R. ( 1980) The effect of fuel economy standards on the US automotive market: an hedonic demand analysis. Transportation Research, Vol 14A, 367-378. Brownstone, D. y Train, K. ( 1999) Forescating new product penetration with flexible substitution patterns. Journal ofEconometrics, Vol89,109-129. Cardell, N. y Dunbar, F. ( 1980) Measuring the societal impacts of automobile downsizing. Transportation Research, Vol 14A, 423-434. Daganzo, C.F. ( 1979) M ultinomial Probit: The Theory and its Applications to Travel Demand Forecasting. Academic Press, Nueva York. Gunn, H.F. y Bates, J.J. ( 1982) Statistical aspects of travel demand modelling. Transportation Research, Vol16A, 371-382. Hajivassiliou, V y Ruud, P. ( 1994) Classical estimation methods for LDV models using simulation. En R. Engle y D. McFadden (Eds.), Handbook of Econometrics Vol IV . Elsevier. Nueva York. McFadden, O ( 1974) Conditional logit analysis of qualitative choice behavior. En P. Zarembka (Ed.), Frontiers in Econometrics. Academic Press, Nueva York. McFadden, D. y Train. K. (2001) Mixed MNL models for discrete response. Journal of Applied Econometrics (en imprenta). Munizaga, M.A. y Alvarez, R. (2000) Modelos mixed logit: uso y potencialidades. Actas del XI Congreso Panamericano de Ingeniería de Tránsito y Transporte, Noviembre, Gramado, Brasil, 523-535. Munizaga, M.A. y Ortúzar, J. de D. (1997) On the applicability of the multinomial probit modcl. Proceedings of the 25th European Transport Forum, Vol. P415. PTRC Education and Research Services Ltd., Londres. Munizaga, M. A. y Ortúzar, J. de D. ( l999a) Correlación entre alternativas: el modelo Logit Jerárquico en profundidad. Actas del IX Congreso Chileno de Ingeniería de Transporte, 109120, Sociedad Chilena de Ingeniería de Transporte, Santiago. Acta X Congreso Chileno de Ingeniería de Transporte, 2001 MODH .OS MIXLD I.OGIT · ANTH'LDI'NTI'S Tf·ÚRI CO S Y API.ICACIONLS 73 Munizaga, M.A. y Ortú:t..ar, l de D. ( 1999b) Nested logit modelling: sorne hard facts. 27th European Transport Conference. Vol P324. PTRC Education and Research Services Ltd., Londres. 25-36. Ortúzar. J de O y Donoso, P. C. F .. ( 1983) Survey design, implentatíon, data coding and evaluatíon for the estímatíon of disaggregate choice models in Santiago, Chile. 2nd lnternational Conference on Survey Methods in Transport, Septiembre, Hungerford Hill Village, Australia Ortúzar. J. de D. y Willumsen, L.G . ( 1994) Modelling Transport. Segunda Edición, John Wiley and Sons, Chichester. Train, K. ( 1999) Halton sequences for mixed logit. Working paper, Departmcnt of Economics. University ofCalitornia at Berkeley. Williams, H.C. W.L. ( 1977) On the formation of travel demand models and economic evaluation - measures ofuser bendit. Environment and Planning, Vol9A, 285-344. Williams. H.C. W.L. y Ortúzar. J. de D. ( 1982) Bchavioural theories of dispersion and the misspecification oftravel demand models. Transportation Research, Vol 168, 167-219 APÉNDICE Sea i una alternativa perteneciente al nido k. La utilidad de esta alternativa, utilizando la especificación ML considerada, corresponde a: U;n = V;n + j.Jkn + &m. con l:;n ~ Gumbel(O, 2) y j.Jkn ~ .f{O, crJl\ Es fácil ver que VAR( Um) = cr/ + cr/ y COY( Um. U1n) = cr/ ssi j E k. Este tipo de estructura de la matriz de covarianza, implica el siguiente coeficiente de correlación: (A 1) Si f.lkn ~ N(O, a¡/\ entonces f.lkn = SknCYJl con Skn distribuido Normal estándar y el parámetro estimado será tal que JI = 2crJl. Considerando (A.1) y la relación entre el factor de escala y la a varianza del término Gumbel, resulta directo demostrar que se cumple (11 ). Acta X Congreso Chileno de Ingeniería de Transporte, 2001