Logit anidado

Anuncio
MODELOS DE ELECCIÓN MÚLTIPLE
Más de dos alternativas es más complejo hallar una
función de distribución que se ajuste a la función de
probabilidad que tenemos planteada.
Logit Multinomial
Extensión logit binomial
y es una v.a. que toma valores {0, 1, 2, ..., J}
P( y  j | x ) 
exp( x )
1   exp( x 
j
J
j= 1, 2, …, J
h
h 1
Dado que las probabilidades deben sumar la unidad,
P( y  0 | x ) 
1
1   exp( x 
J
h 1
h
.
1
Coeficientes (y no las variables) dependen de la alternativa
considerada. Es decir, si lo expresáramos en términos de
utilidad sería:
V(X, S ; βj)
Aplicación: decisión entrada mercado de trabajo
2
Interpretación coeficientes
Efectos parciales son complejos.
β no informa ni tan solo de la dirección del cambio.
Ratio de probabilidades es más informativa:
P ( x,  )
j
P ( x,  )
 exp( x )
j
o
Cambio
en
el
cociente
de
probabilidades
puede
aproximarse por:
 exp( x )x
jk
j
k
De manera equivalente:
log( P ( x,  ) / P ( x,  ))  x(    )
j
Si h=0
h
j
h
log( P ( x,  ) / P ( x,  ))  x
j
0
j
3
Predicción: para cada observación i, el resultado con
mayor probabilidad estimada es el resultado predicho.
Estimación por máxima verosimilitud
Para cada individuo i :
l   d log P  x ,  
J
i
j 0
ij
j
i
d  1 si el individuo i elige la alternativa j, y cero en
ij
cualquier otro caso.
El vector β se obtiene maximizando:
 l ( )
N
i 1
i
4
Logit condicional
Mc Fadden (1974) deriva un modelo similar al logit
multinomial a partir de la maximización de la utilidad
planeada anteriormente.
Supuesto: los términos de error se distribuyen idéntica e
independientemente, con función de distribución
F (  nj )  e
e
  nj
Función Gumbel o de valor extremo tipo I.
A partir de aquí podemos obtener la expresión para la
probabilidad de elección de una alternativa i por parte del
individuo n como:
Pi 
eV
i
J
e
Vj
j 1
Ahora V (Xj S, β) . Si la relación es lineal:
5
P( y  j | x ) 
n
exp( x  )
 exp( x  )
nj
J
nh
h 0
Variables x varían en j y posiblemente en n.
Para introducir una variable que sólo varíe entre los
individuos deberemos utilizar una variable ficticia.
Interpretación de los coeficientes
p ( x )
 p ( x )(1  p ( x )) 
x
j
j
j
k
jk
p ( x )
  p ( x) p ( x)
x
j
j
h
k
hk
Si todas las variables son específicas del individuo, el
modelo CL coincide con el MNL.
6
Principal limitación logit condicional
Propiedades relativas entre dos alternativas dependen sólo
de las características de estas dos alternativas.
p ( x ) exp( x  )

p ( x ) exp( x  )
j
j
j
h
h
h
Propiedad de Independencia de Alternativas Irrelevantes
La probabilidad relativa de elegir entre cualquier par de
alternativas es independiente de las características de las
demás alternativas del conjunto de elección.
7
Contraste de la propiedad de IIA
Test de Hausman-McFadden (1984).
Se estima el modelo con el conjunto de elección completo
(f) y restringido (s). Bajo la hipótesis nula de que se
cumple IIA, los coeficientes en ambos casos deberían ser
similares. Se contrasta la significatividad de dicha
diferencia.
  (ˆ  ˆ )Vˆ  Vˆ (ˆ  ˆ )
2
s
Donde
f
V̂s
y
s
Vˆ f
f
s
f
son la matriz de varianzas y covarianzas
estimada en cada caso.
Si rechazamos la hipótesis nula de validez de IIA,
debemos emplear un modelo alternativo al MNL
8
Modelos alternativos
La diferencia reside en la especificación del término
aleatorio.
Probit multinomial
Modelos GEV
Modelos HEV
Modelos Mixtos
9
Probit Multinomial (MNP)
U ni  ' xni   ni
 n ~ N ( 0,  )
(  n ) 
1
1
1
exp(


'

n )
1
/
2
n
J /2
2
( 2 ) 
Pni   I ( Vni   ni  Vnj   nj j  i ) (  n ) d n 
El MNP requiere calcular una integral de J dimensiones
para obtener Pni. Inviable con un alto número de
alternativas, salvo por métodos de simulación (Train 2003)
10
MODELOS GEV
Modelos de valor extremo generalizado (GEV). En estos
modelos el componente aleatorio sigue una distribución de
valor extremo, con distintos patrones de correlación. Un
caso particular es el modelo logit anidado.
Es posible probar que estos modelos son consistentes con
la maximización de U del tipo:
U V 
nj
nj
nj
Logit multinomial anidado – nested logit (NL):
Modelo adecuado cunado podemos dividir el conjunto de
elección en grupos de tal manera que:
- IIA se cumple entre alternativas pertenecientes al mismo
grupo.
- IIA no se cumple entre alternativas pertenecientes a
distintos grupos. Permitimos que la varianza difiera entre
grupos.
11
Ejemplo:
Train (2003)
Privado
Sólo
Compartido
Público
Bus
Tren
12
Especificación se plantea como un problema de elección
en distintos niveles.
Estructura implícita de elección en forma de árbol:
Grupo A
alt. 1
alt. 2
Grupo B
alt. 3
alt. 4
alt. 5
Primer nivel de elección: Grupo.
Segundo nivel de elección: alternativa, condicionada por
la elección del primer nivel.
Para cada nivel de elección tenemos un conjunto de
variables explicativas.
13
Las J alternativas se pueden particionar en B1, B2, ... , BK
grupos.
El modelo logit anidado se obtiene bajo la hipótesis de que
los componentes aleatorios siguen una distribución
generalizada de valor extremo. La función de distribución
acumulativa conjunta de εj es:



F ( )  exp     e   


 

K
k
j
k
k 1
jBk
La distribución marginal de εj es univariante de valor
extremo pero cada εj dentro de un subconjunto están
correlacionados.
K es una medida del grado de independencia del
componente aleatorio de las alternativas del grupo K. A
mayor K mayor independencia o menor correlación. Si K
= 1 para todo k, indica independencia entre todas las
alternativas en todos los grupos, el NL equivale al logit
condicional.
14
El modelo de probabilidad que se deriva de los anteriores
supuestos es:
e
P 
ni
 e


   e

Vni
k
Vni
k
jBk
Vnj
K
l 1
jBk






k 1
l
l
K  [0,1]  el NL es consistente con un comportamiento
maximizador de la utilidad
15
Descomposición del NL en dos Logit permite una
interpretación más ilustrativa.
U W Y 
nj
jB
nk
nj
nj
K
WnK depende sólo de variables que definen el grupo k.
Difieren entre grupos pero no dentro de un mismo grupo.
Ynj depende de variables que describen la alternativa j
De esta forma Pni puede escribirse como:
P P P
ni
ni |Bk
nBk
Dónde
Pni|Bk
Probabilidad condicional de elegir i dentro del
grupo k. Se define para variables que varían dentro de
cada grupo. (modelo segundo nivel).
16
PBk
Probabilidad marginal de elegir una alternativa
del grupo k. Se define para las variables que varían entre
grupos. (modelo del primer nivel).
La probabilidad marginal y condicional toman la forma de
logit de tal manera que su producto puede expresarse:
P P
·P 
ni | B
ni
|BK
K
e
Yni
e
k
Ynj
e
k
e
jBk
I nk  ln  e
Ynj
K
Wnk  k I nk
Wnl  k I nl
l 1
k
jB K
Interpretación económica: refleja la utilidad esperada de
un individuo de las alternativas del grupo k (Small y
Rosen, 1981). Valor inclusivo (utilidad inclusiva).
Estimación
Dos procedimientos:
1. Estimación en dos etapas. Descomponer la probabilidad
marginal y condicional.
17
a. Estimar la probabilidad condicional.
b. Calcular Ik
c. Estimar la probabilidad marginal incluyendo Ik
como variable explicativa.
Problemas:
- sesgo en los errores estándard
- imposibilidad de imponer ciertas restricciones
2. Máxima verosimilitud con información completa FIML.
Logit anidado se aplica también a la toma de dos o más
decisiones discreta. Ejemplo: decisión de número de
coches y elección del coche para ir al lugar de trabajo.
18
OTROS MODELOS
Modelo logit heteroscedástico
Extensión del logit condicional que relaja la hipótesis de
igual varianza para las perturbaciones dentro de un mismo
grupo.
Logit Mixto
Brownstone y Train
Modelo que combina parámetros aleatorios con una
estructura muy flexible para los componentes no
observables.
Característica
definitoria
es
que
los
factores
no
observables pueden descomponerse en dos elementos:
- Una parte que contiene toda la correlación y
heteroscedasticidad
y
puede
seguir
cualquier
distribución
- Una segunda parte que se distribuye i.i.d valor extremo
19
Descargar