MODELOS DE ELECCIÓN BINARIA

MODELOS DE ELECCIÓN BINARIA Econometría I – UNLP http://www.econometria1.depeco.econo.unlp.edu.ar/ Modelos de Elección Binaria: Introducción • Estamos interesados en la probabilidad de ocurrencia de cierto evento • Podemos representar la ocurrencia del evento mediante un indicador binario que es igual a 1 si el evento ocurre (éxito) y 0 si no ocurre (fracaso). • Denotemos a esta variable dependiente binaria como Y. Econometría I – 2011 – Modelos de Elección Binaria - 2 - Algunos ejemplos: 1 si el individuo trabaja 0 en caso contrario Modelos de empleo: Y = 1 si el banco quebró 0 en caso contrario Performance de entidades financieras: Y = 1 si el chico abandonó la escuela 0 en caso contrario Deserción escolar: Y = Econometría I – 2011 – Modelos de Elección Binaria - 3 - Un modelo de elección binaria (o de respuesta binaria) es un modelo de la probabilidad de ocurrencia del evento denotado por Y, condicional en un conjunto de variables explicativas incluidas en el vector X (kx1) pi ≡ Prob(Yi=1|Xi) para i = 1,…, N Ejemplos: • Probabilidad que un individuo esté empleado dado su nivel educativo y su experiencia laboral previa. • Probabilidad que un banco quiebre dada la composición de su cartera. • Probabilidad que un chico deje la escuela dada su edad y las características socioeconómicas y demográficas de su familia. Econometría I – 2011 – Modelos de Elección Binaria - 4 - Importante notar • Como Y toma sólo los valores 1 y 0, la distribución de Y condicional en X es Bernoulli. • Entonces, si denotamos Prob(Yi=1 | Xi) ≡ pi ⇒ Pr(Yi= 0 | Xi) ≡ 1 – pi • Y por lo tanto: E[Yi | Xi]= 1× pi + 0 × (1 – pi) = pi → Esperanza condicional de Yi V[Yi | Xi]= pi (1 – pi) → Varianza condicional de Yi Econometría I – 2011 – Modelos de Elección Binaria - 5 - El modelo lineal de probabilidad ¿Cómo especificamos la forma funcional de Pr(Yi=1 | Xi)? Una alternativa sería adoptar una forma funcional lineal: Prob(Yi=1 | Xi)= β1+β2 X2i +…+βK XKi = Xi’β → Modelo Lineal de Probabilidad (MLP) Notar: o E[Yi|Xi]= pi = Xi’β = β1+β2 X2i +…+βK XKi ⇒ Los parámetros β pueden ser estimados por MCO, regresando Y en X. o V[Yi|Xi]= pi (1 – pi ) = Xi’β (1- Xi’β) ⇒ Heterocedasticidad. ∂ Pr ob(Y = 1 | X ) = βk o ∂X k ⇒ El coeficiente coincide con el efecto marginal. Econometría I – 2011 – Modelos de Elección Binaria - 6 - Limitaciones del MLP: 1- Genera predicciones incoherentes con una probabilidad: • Vimos que si Y es una variable binaria la esperanza condicional de Y es una probabilidad (E[Y|X]=p), entonces debería darse que 0≤ E[Y|X] ≤1. • En el MLP, E[Y|X]= X’β. • Los estimadores MC de β pueden tomar cualquier valor. • Por lo general, para ciertos valores de X el MLP genera predicciones cuyos valores caen fuera del rango admisible para una probabilidad (negativos o mayores que uno). Econometría I – 2011 – Modelos de Elección Binaria - 7 - 2- Predice efectos marginales constantes ∂ Pr ob(Y = 1 | X ) = βk ∂X k • El efecto marginal del regresor k-ésimo sobre la Prob(Y=1|X) viene dado por βk, que es una magnitud constante independientemente del valor inicial de xk. • Aumentos sucesivos de xk provocarían siempre el mismo cambio en la probabilidad, lo que eventualmente llevaría a probabilidades negativas (si βk<0) o mayores que uno (si βk>0). • Para un modelo coherente de la probabilidad de cierto fenómeno esperaríamos efectos marginales que varíen con el valor de xk. Econometría I – 2011 – Modelos de Elección Binaria - 8 - Modelos no lineales de probabilidad: Logit y Probit Ante estos problemas del MLP, proponemos el siguiente modelo no lineal Prob(Yi | Xi) = pi = F (β1+β2 X2i +…+βK XKi) = F(Xi’β) para i= 1, …, N en donde F(.) satisface las siguientes propiedades: F(-∞) = 0 F(∞) = 1 f(z)≡dF(z)/dz>0 Notar: • estas propiedades son satisfechas por cualquier función de distribución acumulada. • el MLP corresponde a F(Xi’β)= Xi’β, que no está acotada entre 0 y 1. • Las variables X afectan la probabilidad sólo a través del índice lineal Xi’β. Econometría I – 2011 – Modelos de Elección Binaria - 9 - Dos modelos no lineales alternativos PROBIT LOGIT F(.) es la dist. acumulada Normal estándar F(.) es la distribución acumulada Logística F ( X i ' β ) = Φ( X i ' β ) = ∫ X i 'β −∞ 1 e 2π − z2 2 dz e X i 'β F ( X i ' β ) = Λ( X i ' β ) = 1 + e X i 'β Notar que las correspondientes funciones de densidad vienen dadas por 1 − f (Xi ' β ) = φ(Xi ' β ) = e 2π ( X i 'β ) 2 2 e X i 'β = Λ (.)[1 − Λ (.)] y f ( Xi ' β ) = λ( Xi ' β ) = (1 + e X i ' β ) 2 Econometría I – 2011 – Modelos de Elección Binaria - 10 - Gráficamente: la altura de las curvas mide la probabilidad que ocurra el evento correspondiente a Y=1 para cada valor posible del índice lineal Xi’β. 0 .2 Prob(Y=1 | X'b) .4 .6 .8 1 Probit vs. Logit -4 -2 0 X'b probit 2 4 logit Econometría I – 2011 – Modelos de Elección Binaria - 11 - ¿Cómo interpretar los modelos no lineales de probabilidad? El efecto marginal de la variable xk es el cambio en la probabilidad de Y=1 ante un cambio marginal en la variable xk. Formalmente: ∂pi ∂F ( X i ' β ) = = βk f (X i 'β ) ∂xk ∂xk • Dado que f (.) >0 siempre, el signo del efecto coincide con el del coeficiente βk, por lo tanto el signo del coeficiente es interpretable pero no su magnitud. Al término f (.) se lo suele llamar “factor de escala”. • El efecto marginal de xk no es constante, depende del punto donde se la evalúe (del valor que se fije para cada una de las variables explicativas X). Econometría I – 2011 – Modelos de Elección Binaria - 12 - Los efectos relativos comparan los efectos marginales de dos variables explicativas. Por ejemplo, para las variables xk y xj, el efecto relativo viene dado por: ∂pi ∂xk β k f ( X i ' β ) β k = = ∂pi ∂x j β j f ( X i ' β ) β j Notar: • Los efectos relativos no dependen del valor de las X • Los efectos relativos son constantes Econometría I – 2011 – Modelos de Elección Binaria - 13 - El efecto marginal de variables binarias no puede obtenerse derivando. Supongamos que el modelo de probabilidad viene dado por: Pr[Yi = 1 | X i , d i ] = F (β1 + β 2 X 2i + ... + β K X Ki + δ d i ) donde d toma únicamente los valores 0 y 1 (por ejemplo, d puede indicar el sexo del individuo) El efecto de d sobre la probabilidad de Y se obtiene haciendo: Pr[Y = 1 | X , d = 1] − Pr[Y = 1 | X , d = 0] = F ( β1 + β 2 X 2i + ... + β K X Ki + δ ) − F ( β1 + β 2 X 2i + ... + β K X Ki ) que también depende del valor que tomen todas las variables X. Econometría I – 2011 – Modelos de Elección Binaria - 14 - ¿Qué valores de las X usamos para computar los efectos marginales? → Una posibilidad: evaluar la derivada en las medias muestrales de las variables. → Problema: la media de las variables explicativas binarias no tiene intuición. → Otra alternativa es evaluar el efecto marginal para la variable explicativa binaria = 1, por ejemplo, y las demás variables en sus valores medios. → El valor que se fije para las variables dependerá del interés del analista y del problema en cuestión. Econometría I – 2011 – Modelos de Elección Binaria - 15 - ¿Logit o Probit? • Si z es logística, V[z]=π2/3 • Definamos w = z / (π2/3)1/2. Luego, V[w]=1. • Se puede mostrar que la distribución de w (logística reescalada) es muy similar a la normal estándar. En general, los coeficientes que se estiman a partir del modelo Logit exceden a los del Probit en (π2/3)1/2 ≈ 1.8, es decir: βL ≈ 1.8 βP • Elegir cualquiera de las dos especificaciones • Pero las comparaciones entre ambas serán válidas sólo si se reescalan los coeficientes. Econometría I – 2011 – Modelos de Elección Binaria - 16 - Gráficamente: 0 .2 Prob(Y=1 | X'b) .4 .6 .8 1 Probit vs. Scaled-Logit -4 -2 0 X'b probit 2 4 scaled_logit Econometría I – 2011 – Modelos de Elección Binaria - 17 - Ejemplo: Evaluación de metodología de enseñanza Motivación Analizar si una nueva metodología didáctica resulta eficaz o no en la enseñanza de la economía. Referencias: • Ejemplo 19.1 del libro “Análisis Econométrico” Tercera edición de William H. Greene. Muestra Muestra de 32 alumnos de un estudio realizado por Spector and Mazzeo (1980). Ver archivo green.dta Econometría I – 2011 – Modelos de Elección Binaria - 18 - El modelo Variable dependiente binaria: MEJORA: = 1 si el alumno mejoró la nota y 0 si no lo hizo. Variables explicativas: • CM: media de las calificaciones pasadas del alumno. • NP: nota del alumno en un examen previo al periodo de aprendizaje. • PSI: variable binaria que vale 1 si el alumno estudió con el nuevo método didáctico y 0 si estudió con el método viejo. Econometría I – 2011 – Modelos de Elección Binaria - 19 - Datos: Econometría I – 2011 – Modelos de Elección Binaria - 20 - Estimación del Modelo Lineal de Probabilidad por MCO . regress mejora cm np psi Source | SS df MS -------------+-----------------------------Model | 3.00227631 3 1.00075877 Residual | 4.21647369 28 .150588346 -------------+-----------------------------Total | 7.21875 31 .232862903 Number of obs F( 3, 28) Prob > F R-squared Adj R-squared Root MSE = = = = = = 32 6.65 0.0016 0.4159 0.3533 .38806 -----------------------------------------------------------------------------mejora | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------cm | .4638517 .1619563 2.86 0.008 .1320992 .7956043 np | .0104951 .0194829 0.54 0.594 -.0294137 .0504039 psi | .3785548 .1391727 2.72 0.011 .0934724 .6636372 _cons | -1.498017 .5238886 -2.86 0.008 -2.571154 -.4248801 ------------------------------------------------------------------------------ NOTA: no se pueden interpretar los estadísticos t porque el modelo es heterocedástico (se ve en las siguientes clases). Econometría I – 2011 – Modelos de Elección Binaria - 21 - El efecto del pasado académico sobre la probabilidad de mejora, según el MLP • Los alumnos con mayores calificaciones promedio en el pasado (CM) tienen mayor probabilidad de mejorar con la nueva metodología de enseñanza. • Dada la especificación lineal del modelo este efecto es constante: la probabilidad de mejorar aumenta en 0.46 (aprox.) independientemente del tipo de alumno. Econometría I – 2011 – Modelos de Elección Binaria - 22 - Problema: predicciones incoherentes con una probabilidad Predicción de probabilidad - MLP 1 -.068185 1 32 Observación Econometría I – 2011 – Modelos de Elección Binaria - 23 - Estimación del modelo Probit . probit mejora cm np psi Probit estimates Log likelihood = -12.818803 Number of obs LR chi2(3) Prob > chi2 Pseudo R2 = = = = 32 15.55 0.0014 0.3775 -----------------------------------------------------------------------------mejora | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------cm | 1.62581 .6938818 2.34 0.019 .2658269 2.985794 np | .0517289 .0838901 0.62 0.537 -.1126927 .2161506 psi | 1.426332 .595037 2.40 0.017 .2600814 2.592583 _cons | -7.45232 2.542467 -2.93 0.003 -12.43546 -2.469177 ------------------------------------------------------------------------------ Econometría I – 2011 – Modelos de Elección Binaria - 24 - Predicciones de probabilidad del Probit Predicción de probabilidad - mod 1 0 32 1 Observación Econometría I – 2011 – Modelos de Elección Binaria - 25 - Probit: efectos marginales I CM = media, NP = media, PSI = media: CM NP PSI Coeficientes Media X B'X 1.6258 3.1172 5.0680 0.0517 21.9375 1.1348 1.4263 0.4375 0.6240 -7.4523 1.0000 -7.4523 -0.6255 Distribución normal estand Factor de escala Efectos marginales 0.5333 0.0170 0.4679 0.2658 0.3281 Ver archivo interpretacion_probit.xls Econometría I – 2011 – Modelos de Elección Binaria - 26 - Probit: efectos marginales II (1) CM = media, NP = media, PSI = 0: CM NP PSI Coeficientes Media X B'X 1.6258 3.1172 5.0680 0.0517 21.9375 1.1348 1.4263 0 0 -7.4523 1.0000 -7.4523 -1.2496 Distribución normal estand Factor de escala Efectos marginales 0.2971 0.0095 0.2607 0.1057 0.1827 (2) CM = media, NP = media, PSI = 1: CM NP PSI Coeficientes Media X B'X 1.6258 3.1172 5.0680 0.0517 21.9375 1.1348 1.4263 1.0000 1.4263 -7.4523 1.0000 -7.4523 0.1768 Distribución normal estand Factor de escala Efectos marginales 0.6385 0.0203 0.5602 0.5702 0.3928 EFECTO MARGINAL PARA LA DUMMY PSI 0.4644 Econometría I – 2011 – Modelos de Elección Binaria - 27 - Estimación del modelo Logit . logit mejora cm np psi Logit estimates Log likelihood = -12.889633 Number of obs LR chi2(3) Prob > chi2 Pseudo R2 = = = = 32 15.40 0.0015 0.3740 -----------------------------------------------------------------------------mejora | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------cm | 2.826113 1.262941 2.24 0.025 .3507938 5.301432 np | .0951577 .1415542 0.67 0.501 -.1822835 .3725988 psi | 2.378688 1.064564 2.23 0.025 .29218 4.465195 _cons | -13.02135 4.931325 -2.64 0.008 -22.68657 -3.35613 ------------------------------------------------------------------------------ Efectos marginales ¾ Mismo procedimiento que con modelo Probit. ¾ Ver archivo interpretacion_logit.xls Econometría I – 2011 – Modelos de Elección Binaria - 28 - El efecto del pasado académico sobre la probabilidad de mejora, según el modelo Probit • El efecto es positivo y significativo al 5%, igual que lo era en el MLP • Pero la magnitud del coeficiente no es interpretable. El efecto marginal depende del valor de todas las variables explicativas. • Para un alumno que en el pasado tuvo una calificación media de 3, que obtuvo nota 21.94 en el examen previo y que estudió con el nuevo método, la probabilidad predicha de mejorar es de 0.494. • ¿Cómo cambia esta probabilidad a medida que aumenta la calificación media (CM)? - De 3.0 a 3.2 puntos → + 0.128 - De 3.2 a 3.4 puntos → + 0.116 - De 3.4 a 3.6 puntos → + 0.094 - De 3.6 a 3.8 puntos → + 0.069 - De 3.8 a 4.0 puntos → + 0.046 Econometría I – 2011 – Modelos de Elección Binaria - 29 -

MODELOS DE ELECCIÓN BINARIA

Documentos relacionados

Productos

Apoyo

MODELOS DE ELECCIÓN BINARIA

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib