Econometría I Tema 2: El modelo de regresión simple Ejercicios 1. Considera el siguiente gráfico en el cual esta representada la relación entre los años de existencia del mercado de valores (A) y el rendimiento real anual (R) para una muestra de 39 países. Rendimiento real anual (R) Años existencia del mercado (A) (a) Dada la información que tenemos en el gráfico, crees que hay una relación determinista entre el rendimiento real de un mercado (R) y los años de existencia del mismo (A)? Razona la respuesta. (b) Escribe un modelo de regresión lineal en el cual se pueda analizar el comportamiento esperado del rendimiento medio (R) en relación a los años de existencia (A). (c) Escoge dos elementos que hayas incluido en la especificación del modelo en la pregunta anterior. Explica brevemente que capta cada uno de estos elementos, haciendo referencia específica en el ejemplo que estemos considerando. 2. Considera el siguiente modelo que relaciona la renta per cápita, en miles de dólares, de un país i (RCi ), con su porcentaje de población en el sector agrícola (P Ai ): M odelo : RCi = β0 + β1 P Ai + ui 1 (a) Explica con palabras como interpretar los parámetros β0 y β1 . ¿Qué signeo crees que tendran? (b) Dibuja la recta de regresión poblacional (RRP) asocia a este modelo suponiendo que los parámetros β0 y β1 tienen el signo que has indicado en el apartado anterior. ¿Qué información te da esta recta? Comenta rigurosamente. 3. Considera el siguiente modelo: yi = β0 + β1 xi + ui Para estimar este modelo tenemos la siguiente muestra: xi 0 1 4 5 yi 2 1 3 2 (a) Estima por MCO los parámetros β0 y β1 , utilizando las expresiones siguientes: n P β̂1 = (xi − x̄)(yi − ȳ) i=1 n P (xi − x̄)2 i=1 β̂0 = ȳ − β̂1 x̄ Utiliza la ayuda de una Hoja de cálcul (Excel o similar) para hacer loss cálculos. (b) Estima por MCO els paràmetres β0 y β1 , utilizando la expresión: β̂ = (X 0 X)−1 X 0 Y Utiliza la ayuda de Gretl para hacer los cálculos. (c) Calcula los residuos MCO sin utilizar álgebra matricial y utilizando álgebra matricial. Comprueba que coinciden. n X (d) Comprueba que ûi = 0. i=1 4. Considera que se propone el siguiente modelo de regresión para analizar el comportamiento de la variable y : M odelo(1) yi = β0 + ui i = 1, ..., n. (a) ¿Cuántos parámetros tiene este modelo? ¿Cuántos regresores? Según el modelo propuesto, que puedes decir sobre el comportamiento de la variable y? 2 (b) Deriva, resolviendo el problema de optimazición corresponendiente, la expresión del estimador MCO del parámetro de este modelo sin utilizar álgebra matricial. ¿Te sorprende el resultado? (c) Si escribimos la expresión del M odelo(1) en álgebra matricial como y = Xβ + u. ¿Qué elementos incluiría y? ¿Y X? ¿Y u? (d) Comprueba que la expresión que has encontrado del estimador en (b) coincide con la que encontrarias si aplicasemos la expresión general en álgebra matricial: β̂ = (X 0 X)−1 X 0 y 5. Considera que se propone el seguiente modelo de regresión para analizar el comportamiento de la variable y: M odel(2) yi = β1 xi + ui i = 1, ..., n. (a) ¿Cuántos parámetros tiene este modelo? ¿Cuántos regresores? Según el modelo propuesto, ¿qué puedes decir sobre el comportamiento de la variable y? (b) Deriva, resolviendo el problema de optimización correspondiente, la expresión del estimador MQO del parámetreo β1 sin utilizar álgebra matricial. (c) Si escribimos el modelo anterior en álgebra matricial como y = Xβ + u. ¿Qué elementos incluiría y? ¿Y X? ¿Y u? (d) Comprueba que la expresión del estimador que has encontrado en (b) coincide con la que encontrarías si aplicamos la expresión general en álgebra matricial: β̂ = (X 0 X)−1 X 0 y 6. Discute que problema tendrías para estimar los parámetros de un modelo de regresión simple yi = β0 + β1 xi + ui para MCO utilizando la siguiente muestra: x 3 3 3 3 3 3 3 y 2 1 3 2 5 4 2 7. Considera los siguientes modelos: M odelo 1 : yi = β0 + β1 xi + ui 3 M odelo 2 : yi = β0∗ + β1∗ x∗i + ui Queremos ver como queda afectado el estimador de MCO cuando variamos las unidades de medida de la variable explicativa xi . Si redefinimos el regresor como x∗i = axi , como se relacionaría la estimación por MCO de β0 y β1 del Modelo 1 con la estimación per MCO de β0∗ y β1∗ del Modelo 2 ? (a) Analita como afectaría este cambio a la estimación de los parámetros sin utilizar álgebra matricial. (b) Repite el apartado anterior utilizando ahora álgebra matricial. 8. Queremos estimar los parámetros de este modelo: yi = β0 + β1 xi + ui i = 1, ..., 10 con los datos del fichero mostra1.xls. (a) Con la ayuda de Gretl haz un plot de las observaciones. (b) Con la ayuda de un guión de instrucciones de Gretl, estima los parámetros β0 y β1 del modelo, aplicando la expresión: β̂ = (X 0 X)−1 X 0 y (c) Vuelve a estimar el modelo, ahora usando la opción del menú de Gretl para estimar por MCO. Comprueba que los valores obtenidos son los mismos que has obtenido en el apartado (b). (d) Utilizando una hoja de cálculo, calcula el coeficiente de determinación utilizando las dos siguientes expresiones: n X R2 = SEC = i=1 n X ST C (ŷi − ȳ)2 (yi − ȳ)2 i=1 n X R2 = 1 − ûi 2 SRC = 1 − n i=1 X ST C (yi − ȳ)2 i=1 Comprueba que coincide con el reproducido en el output de Gretl. dan el mismo valor para este coeficiente 4 9. Tenemos los datos de la siguiente tabla sobre las horas de estudio (H) y las calificaciones obtenidas para una muestra de 8 estudiantes (G): estudiante 1 2 3 4 5 6 7 8 H G 21 7 24 8,5 26 7,5 27 8,75 29 9 25 7,5 25 6 30 9,25 (a) Escribe un modelo de regresión que te permita estudiar el comportamiento de la nota de un estudiante en función de las horas de estudio. Interpreta cada elemento. (b) Con la ayuda de la opción del menu de Gretl estima el modelo. Interpreta los coeficientes estimados y la bondad de ajuste. (c) ¿Qué predicción darías de la nota esperada de un estudiante que ha estudiado 20 hores? 10. Considera el siguiente mecanismo de generación de datos (mgd): yi = 10 + 2xi + ui , ui /x ∼ i.i.N (0, σ 2 ) donde las observaciones de x se generan a partir de una distribución uniforme (0, 30). (a) Escribe un guión de comandos de Gretl que genere una muestra de 80 observaciones de este mecanismo para el caso de σ 2 = 144. Incluye el comando set seed 123. (b) Ejecuta el guión. Haz un plot (scatter) con las 80 observaciones (xi , yi ) generadas. ¿Te sorprende? Comenta. (c) Repite los apartados (a) y (b) para el caso de σ 2 = 16. Compara los gráficos y comenta. 11. Considera el siguiente mecanismo de generación de datos: yi = 2 + 0, 5xi + ui , ui /x ∼ i.i.N (0, 16) donde las observaciones del regresor xi salen de una distribución uniforme (0,50). (a) Con la ayuda de un guión de instrucciones de Gretl, genera una muestra de 30 observaciones de este mecanismeo, utilizando el comando 1234 (set seed 1234). Dibuja la muestra generada en un plot (x,y). (b) Ahora estima el siguiente modelo de regresión con la muestra generada: yi = β0 + β1 xi + ui ¿Qué estimador obtienes para β0 ? ¿Para β1 ? 5 (c) Dado que conocemos el valor real de β0 y β1 , puedes decir si la estimación anterior sobreestima o subestima estos parámetros. (d) Considera ahora que queremos utilizar el mismo mecanismo de generación de datos para generar 10.000 muestras de 30 observaciones cada una. Con cada muestra, estimamos el siguiente modelo: yi = β0 + β1 xi + ui (e) ¿Cuántas estimaciones de β0 hemos obtenido? ¿Y de β1 ? (f) Escribe un guión de instrucciones de Gretl que (i ) genere 10.000 observaciones de acuerdo con el proceso de generación de datos incluido arriba, utilizando los mismos valores de las observaciones de x para cada muestra, (ii ) con cada muestra estima la regresión del modelo indicado arriba y (iii ) guarda las estimaciones del parámetro β1 en el archivo b1est.gdt. Incluye la instrucción set seed 1234 justo después de la instrucción nulldata. Guarda este guión como Script1. (g) Abre el archivo b1est.gdt. Calcula la media de las 10.000 estimaciones obtenidas de β1 . ¿Es este valor como esperabas? (h) Dibuja un histograma con las 10.000 estimaciones obtenidas de β1 . ¿Es este gráfico como esperabas? (i) ¿Qué propiedad nos demuestra el gráfico anterior? Justifica la respuesta. (j) Si en lugar de 10.000 muestras fuesemos capaces de generar el mayor número de muestras posibles con este mecanismo (todos con las mismas observaciones de x), ¿Qué títolo darías a este gráfico? 12. El fichero de datos employment.xls incluye datos sobre la tasa de crecimiento anual de la ocupación (employment) y la tasa de crecimiento económico anual (gdp) para 25 países durante los años 90. Para estudiar la creación de ocupación en relación al crecimiento económico en este periode, se propone el siguiente modelo de regresión lineal: employmenti = β0 + β1 gdpi + ui (a) Con la ayuda de Gretl (via menus) estima el modelo indicado. (b) ¿Ha salido el signo de la estimación del parámetro β1 tal como esperabas? (c) Comenta la bondad de ajuste. (d) Presenta la recta de regresión ajustada de forma analítica. Debajo de cada estimación incluye las desviaciones estandar estimadas. (e) Haz un plot de los datos. Incluye en el plot la recta ajustada. 13. El ficherro lexp2003.gdt incluye datos para 180 països sobre su renta per cápita (PPP) anual en dólares (R) y la esperanza de vida al nacer en años (LE), para el año 2003. Para extraer información de esta muestra sobre el comportamiento de la esperanza de vida en relación al nivel de renta per cápita, se propone el siguiente modelo de regresión: LEi = β0 + β1 ln(Ri ) + ui 6 (a) Sobre los datos: ¿Qué país tiene la esperanza de vida más grande? ¿Y más pequeña? ¿Qué país tiene la renta per cápita más grande? ¿Y más pequeña? ¿Cuál es la renta per cápita media? (b) Haz un plot de los datos en el plano (R, LE). (Es decir, la variable R en el eje horizontal y LE en el eje vertical.) Comenta sobre la relación entre estas variables. ¿Parece lineal? Haz un plot ahora en el plano(lnR, LE). Comenta. Dados los gráficos, ¿Crees que es razonable la regresión planteada en el enunciado? Comenta. (c) ¿Qué signo crees que tendrá el parámetro β1 ? Razona brevemente. (d) Con la ayuda de Gretl (via menus), estima el modelo anterior por M CO. (Atención, fijate que la variable explicativa del modelo es ln(R) y no R, así, antes de estimar, has de generar la variable correspondiente). Incluye como respuesta una cópia del output de Gretl. (e) Con la ayuda de un guión de instrucciones de Gretl y construyendo las matrices correspondientes, verifica el cálculo de la estimación de β0 y β1 y de las desviaciones estandar estimadas del estimador de cada uno de estos parámetros. (f) Presenta la recta de regresión ajustada en forma analítica. Debajo de cada estimación incluye las desviaciones estandar estimadas. (g) Con la ayuda de Gretl haz un gráfico de las observaciones y de la recta ajustada en el plano (lnR, LE). (h) Interpreta la estimación obtenida de β1 . (i) ¿Cuál es el valor del coeficiente de determinación ? Da la expresión exacta que se ha de hacer servir para calcularlo, haciendo referencia a las variables incluidas en este modelo. (j) Según la estimación obtenida, si un país tiene una renta per cápita un 1% más alta, ¿Cómo esperamos que varíe la esperanza de vida de su población? (k) ¿Qué estimación harías sobre la esperanza de vida de un país que tiene una renta per cápita de 15000 dolars al año? (l) ¿Crees que esta regresión serviría para medir el efecto que tiene la renta per cápita sobre la esperanza de vida ? Comenta de forma breve pero rigurosa. 14. El artículo de Sachs & Wagner (2001) en la European Economic Review es uno de los primeros en contrastar empíricamente la llamada "maledicción de los recursos naturales”, que sostiene que los países con abundancia de recursos naturales tienden a tener un crecimiento económico bajo. El fichero nr97m.gdt contiene los datos de 71 países utilizados por estos autores para contrastar esta hipótesis. Los autores utilizan el peso de las exportaciones de recursos naturales sobre el PNB para 1980 (sxp80) como medida de la abundancia de los recursos naturales de un país. Como indicador del crecimiento económico, utilizan el promedio de las tasas de crecimiento económico anuales entre 1970 y 1990 (gea7090). (a) Escribe un modelo de regresión que te permita estudiar el comportamiento del crecimiento económico (gea7090) en relación a la abundancia de recursos naturales (sxp80). Bajo la hipótesis de la "maledicción de los recursos naturales”, ¿qué signo esperarías que tuviera el parámetro asociado a sxp80? (b) Con la ayuda de Gretl, estima el modelo que has propuesto en el apartado anterior por M CO. Comenta. 7 15. El fichero ees2010.gdt incluye datos provenientes de la Encuesta de Estructura Salarial sobre salario y nivel educativo de 5000 personas para España, 2010. Entre las variables incluidas encontramos el salario en euros por hora (SALARIOHORA) y una variable fictícia que toma el valor 1 si la persona tiene estudios superiores y 0 si no tiene (SU P ERIORES). (a) Con la opción de Gretl correspondiente, encuentra los estadísticos de estadística descriptiva de todas las variables incluidas en la muestra. Comenta. ¿Qué estadísticos no tienen sentido? (b) Utilitzando los estadísticos de estadística descriptiva correspondientes, da una estimaciób de la diferencia promedio del salario hora en euros entre una persona con estudios superiores y una sin estudios superiores. Justifica tu respuesta. (c) Considera que definimos el siguiente modelo de regresión: SALARIHORAi = β0 + β1 SU P ERIORESi + ui Con la ayuda de Gretl estima este modelo por M CO. Interpreta los resultados: signo y valor de los coeficientes estimados y la bondad del ajuste. (d) Utilitzando los estadísticos de estadística descriptiva correspondientes, da una estimación de la diferencia promedio del salario hora en porcentaje entre una persona con estudios superiores y una sin estudios superiores. Justifica tu respuesta. (e) Considera que definimos el siguiente modelo de regresión: lnSALARIHORAi = β0 + β1 SU P ERIORESi + ui Con la ayuda de Gretl estima este modelo por M CO. Interpreta los resultados: signo y valor de los coeficientes estimados y la bondad del ajuste. (f) En el mismo fichero de datos tenemos la variable ESCOLARIDAD, que corresponde al número de años de escolarización, siendo el valor 6 el correspondiente a una persona sin estudios. Considera ahora que definimos el siguiente modelo de regresión: lnSALARIHORAi = β0 + β1 ESCOLARIDADi + ui Con la ayuda de Gretl estima este modelo por M CO. Interpreta los resultados: signo y valor de los coeficientes estimados y la bondad del ajuste. 16. El fichero epf 2012.gdt incluye datos provenientes de la Encuesta de Presupuestos Familiares sobre el gasto y nivel de renta anual de 21.808 hogares españoles para 2012. El fichero incluye la renta anual en euros (IN GRESOS) y el gasto anual (GAST O). (a) Con estos datos estima el siguiente modelo de regresión: GAST Oi = β0 + β1 IN GRESOSi + ui (b) ¿Qué estimación has obtenido de la propensión marginal a consumir? ¿Cómo ha salido la bondad de ajuste? Comenta. (c) Con la ayuda de Gretl haz un plot de las observaciones (scatter). Comenta. 8