Poisson Modelos de conteo Gabriel V. Montes-Rojas Gabriel Montes-Rojas Modelos de conteo Poisson Modelo de regresión de Poisson Supongamos que la variable dependiente puede tomar cualquier valor entero no negativo y = 0, 1, 2.... Estos modelos se llaman modelos de conteo (count models), en los cuales se quiere explicar cuantas veces ocurre un determinado evento. Ejemplo: y podrı́a ser cantidad de visitas al médico en un mes: y = 0 sin visitas y = 1 una visita y = 2 dos visitas y = 3 tres visitas .. . y = 20 veinte visitas y = ... no hay lı́mite superior ¿Tiene sentido usar una regresión MCO? Gabriel Montes-Rojas Modelos de conteo Poisson Modelo de regresión de Poisson Consideremos la distribución de Poisson f [y = j ] = exp (−λ)λj /j !, j = 0, 1, 2... donde y ! es el factorial de y , o sea y × (y − 1) × (y − 2) × ... × 3 × 2. Probar que si y ∼ Poisson(λ), entonces E (y ) = λ y V (y ) = λ. Ahora consideremos un modelo condicional con λ(x ) = exp (x β). Modelo de regresión de Poisson: P [y = j |x ] = exp [−exp (x β)] [exp (x β)]j /j ! Un supuesto restrictivo del modelo de Poisson es que Var (y |x ) = E (y |x ). Gabriel Montes-Rojas Modelos de conteo Poisson Modelo de regresión de Poisson `i ( β) = ∑j∞=1 1[yi = j ]log (P [yi = j |x ]) = yi (x i β) − exp (x i β) s i ( β) = yi x i0 − exp (x i β)x i0 Ejercicio: Probar que E [s i ( β)|x i ] = 0. H i ( β) = −exp (x i β)x i0 x i Para interpretar los parámetros notemos que para una x contı́nua ∂E [y |x ] [y |x ] [y |x ] 1 = exp (x i β) β j . Entonces β j = ∂E∂x = ∂logE . Ası́ β j se puede ∂x ∂x E [y |x ] j j j interpretar como la semi-elasticidad de E [y |x ] con respecto a xj . Para dummies, notemos que E [y |x, d = 1] = exp ( β 1 + β 2 x2 + ... + β d 1), y E [y |x, d = 1] = exp ( β 1 + β 2 x2 + ... + β d 0). Entonces el efecto de la dummy es simplemente exp ( β d ). Gabriel Montes-Rojas Modelos de conteo Poisson Modelo de regresión de Poisson: STATA En STATA simplemente hay que escribir poisson y x1 x2 x3 http://www.stata.com/manuals13/rpoisson.pdf http://www.stata.com/manuals13/rnbreg.pdf Ver http://www.ats.ucla.edu/stat/stata/examples/eacspd/chapter19.htm Gabriel Montes-Rojas Modelos de conteo Poisson Otros modelos de conteo (count data) El supuesto de media = varianza puede ser restrictivo. Entonces existen modelos alternativos que relajan esta condición. Binomial Negativa: asumamos que f (y |λ) = exp (−λ)λy /y ! pero λ = µ(x )ν donde es una variable aleatoria. Notemos que E (y |µ) = µE (ν) con lo cual si asumimos que E (ν) = 1 estamos en el modelo binomial. Imponiendo distintas distribuciones sobre ν podemos lograr más flexibilidad. Asumamos que ν ∼ Gamma, con densidad R∞ g (ν) = νδ−1 exp (−νδ)δδ /Γ(δ), ν, δ > 0, Γ(r ) = 0 z r −1 exp (−z )dz, y con propiedades E [ν] = 1, V [ν] = 1/δ. Se usa α = 1/δ. Entonces E [y |µ, α] = µ V [y |µ, α] = µ(1 + αµ) NegBin I asume V [y |µ, α] = µ(1 + γ), o sea, propocional a la media. NegBin II usa el modelo más general con una función cuadrática de la media. Gabriel Montes-Rojas Modelos de conteo