Regresión a través del origen

Anuncio
Regresión a través del origen
En el algunas ocasiones tendremos que estimar regresiones como la
presentada más abajo, en las cuales no existe el término del intercepto, las
cuales son llamadas regresiones a través del origen.
Yi = β2 X i + ui
(
)
ei = Yi − βˆ2 X i , elevando al cuadrado y sumando para todo i
∑
∑(
ei 2 =
Yi − βˆ2 X i
)
2
, planteando el problema de min y resolviendo
)
∑ ∑(
d ∑e
= 2∑ (Y − βˆ X ) ( − X ) = 0
ei 2 =
min
Yi − βˆ2 X i
2
2
i
d βˆ2
i
2
∑ (Y − βˆ X )( X ) = 0
∑ (Y X − βˆ X ) = 0
i
2
i
βˆ2 =
i
i
i
2
i
2
∑Y X
∑X
i
i
2
i
Insesgamiento
βˆ2 =
∑( β
2
X i + ui ) X i
∑X
2
i
∑ β X +∑ X u
=
∑X
∑X u
=β +
∑X
2
2
i
i i
2
i
2
i i
2
i
i
i
Tomando esperanza de β̂2

E  βˆ2  = E  β 2 +

∑ X u  = β , por lo tanto es un estimador insesgado
∑ X 
i i
2
i
2
Entonces,
( )
( )
var βˆ2 = E  βˆ2 − E βˆ2 


= E  βˆ2 − β2 

= E

2
∑
∑X

= E β 2 +

X i ui
∑
∑
2
X i ui 

X i2 
2
i

− β2 

2
2
Desarrollando el término dentro del corcho, tomando en cuenta que Xi es no
estocástica y las ui son homocedásticas y no correlacionadas, obtenemos:
σ2
ˆ
var β 2 =
X i2
( )
∑
donde la estimación de σ es:
2
σˆ
2
∑e
=
2
i
( n − 1)
Comparemos con los resultados del modelo con intercepto:
Regresión sin
intercepto
∑Y X
∑X
σ
var ( βˆ ) =
∑X
∑e
σˆ =
Estimador de β2
βˆ2 =
Varianza β2
i
Regresión con
intercepto
∑y x
∑x
σ
var ( βˆ ) =
∑x
∑e
σˆ =
βˆ2 =
i
2
i
2
2
Estimador de σ
2
2
i i
2
i
2
2
2
i
2
i
2
i
2
i
2
( n − 1)
( n − 2)
La diferencia consiste en que el modelo de regresión sin intercepto se utilizan
sumatorias sencillas, mientras que el modelo con intercepto se utilizan sumas
ajustadas por la media (en desvíos).
Algunas características del modelo sin intercepto:
1. La sumatoria de los errores estimados es diferente de cero.
2. El R2 puede ser negativo
La sumatoria de los errores estimados es diferente de cero
∑e ≠ 0
i
∑e ≠ 0
i
En el modelo de regresión con intercepto, de la primera ecuación normal,
concluimos que
ei = 0 . En el caso del modelo sin intercepto, no sucede
∑
esto, sino que ∑ e ≠ 0 . Supongamos que ∑ e = 0 , entonces:
i
i
∑ Y = βˆ ∑ X + ∑ e
∑ Y = βˆ ∑ X
∑Y
βˆ =
∑X
i
2
i
i
2
i
i
2
i
Y
βˆ2 =
X
i
Este estimador de β2 , es diferente al encontrado anteriormente, el cual se
demostró que era insesgado.
En el modelo a través del origen, no se cumple
∑ X e = 0 . (¿Por qué?)
concluimos que
∑e = 0 ;
i
aunque si
i i
El R2 en el modelo de regresión a través del origen (R2 simple)
En el modelo sin intercepto, no está garantizada que la SRC sea menor que el
STC, por lo que el R2 puede ser negativo. En el caso del modelo de regresión
a través del origen se puede calcular el llamado R2 simple:
∑( X Y )
R =
∑ X ∑Y
2
i
2
i
2
i
2
i
Este R2 simple, no es directamente comparable con el R2 convencional.
Debido a las características especiales del modelo sin intercepto es preciso ser
cauteloso al utilizarlo. Esto debido a:
•
•
Si el intercepto se incluye y resulta estadísticamente no significativo,
en la práctica, es como si tuviéramos una regresión por el origen.
Si el modelo tiene un intercepto, pero no lo incluimos, incurrimos en
el sesgo de especificación, uno de los supuestos clásicos.
Es preciso señalar, que si el intercepto está ausente, entonces es más preciso el
estimador de la pendiente.
Diferentes formas funcionales de los modelos de regresión
Modelo doble logaritmico, log-log o log-lineal
Yi = β1 X i β expu
2
i
ln Yi = ln β1 + β 2 ln X i + ui
d ln Y
= β2
d ln X
∆Y
Y = ∆Y X = β
2
∆X
∆X Y
X
∆ %Y
β2 =
∆% X
Donde β 2 es una elasticidad constante e indica el cambio % en la variable Y
provocado ante un cambio % de la variable X.
Modelo log-lin
ln Yi = ln β1 + β 2 X i + ui
d ln Y
= β2
dX
dY
Y =β
2
dX
∆ %Y
β2 =
∆X
En este caso β 2 es una semielasticidad, e indica el cambio % en Y ante un
cambio en unidades (absoluto) de la variable X.
Modelo lin-log
Yi = ln β1 + β 2 ln X i + ui
dY
= β2
d ln X
dY
= β2
dX
X
∆Y
β2 =
∆% X
En este modelo β 2 busca explicar cambios absolutos en Y ante cambios % de
X.
Descargar