Econometría I Ejercicios de repaso de estadística Poblaciones y parámetros 1. Considera una variable aleatoria Z que solo puede tomar cinco valores, todos ellos con la misma probabilidad: Z = {Z1 , Z2 , Z3 , Z4 , Z5 }. La variable Z es una variable medida en miles de euros. (a) Proporciona la expresión que define el valor esperado de Z, E(Z), la varianza, var(Z), y la desviación estandar, sd(Z). Presenta las expresiones utilizando sumatorios. (b) ¿ Qué información sobre el comportamiento de Z proporciona cada uno de estos parámetros? (c) Considera que tenemos los cinco valores que la variable Z puede tomar son: Z = {1, 2, 3, 4, 5}. Con la ayuda de una hoja de cálculo (Excel o similar) calcula E(Z), var(Z) y sd(Z), definiendo las formulas correspondientes. (Es decir, no utilitces las funciones predefinidas en la hoja de cálculo). (d) Considera ahora que redefinimos Z en euros. Es decir, queremos cambiar las unidades de medida de Z. Etiqueta esta variable Z definida en euros com Z ∗ . Así, los cinco valores que puede tomar Z ∗ son: Z = {1000, 2000, 3000, 4000, 5000}. Modifica la hoja de cálculo que antes has creado y calcula E(Z ∗ ), var(Z ∗ ) i sd(Z ∗ ). (e) Entra las observaciones de Z a Gretl. Crea un guión de instrucciones y utilizando las instrucciones correspondientes, calcula E(Z), var(Z), sd(Z) y E(Z ∗ ), var(Z ∗ ), sd(Z ∗ ). Verifica que los valores coincidencon tus cálculos anteriores. (f) Dados los resultados anteriores, ¿Dirias que el valor esperado de una variable depende de las unidades medida de las variables o independiente a estos cambios? ¿Y la varianza? ¿Y la desviación estandard? Justifica. 1 2. Considera dos variables Z y W , ambas medidas en miles de euros, que solo pueden tomar cinco pares de valores, todos ellos con la misma probabilidad: Z Z1 Z2 Z3 Z4 Z5 W W1 W2 W3 W4 W5 (a) Proporciona la expresión que define la covariància entre Z y W , cov(Z, W ), y tambén la expressión que define el coeficiente de correlación entre Z y W , corr(Z, W ). Presenta las expresiones utilizando sumatorios. (b) ¿ Qué información sobre el comportamiento de Z y W proporciona cada uno de estos parámetros? (c) Considera que tenemos los cinco pares de valores que pueden tomar (Z, W ): Z 1 2 3 4 5 W 2 4 6 8 10 Con la ayuda de una hoja de cálculo (Excel o similar) calcula cov(Z, W ) i corr(Z, W ), definiendo las formulas correspondientes. (Es decir, no utilitces las funciones predefinidas en la hoja de cálculo). (d) Considera que cambiamos las unidades de medida de estas dos variables de miles de euros a euros: Z∗ 1000 2000 3000 4000 5000 W∗ 2000 4000 6000 8000 10000 Modifica la hoja de cálculo que antes has creado y calcula cov(Z ∗ , W ∗ ) y corr(Z ∗ , W ∗ ). (e) Entra los pares de observaciones de (Z, W ) a Gretl. Crea un guión de instrucciones y utilizando las instrucciones correspondientes, calcula cov(Z, W ), corr(Z, W ) y cov(Z ∗ , W ∗ ), corr(Z ∗ , W ∗ ). Verifica que los valores coincidencon tus cálculos anteriores. (f) Dados los resultados anteriores, ¿Dirias que la covariància depende de las unidades de medida o es independente a estos cambios? ¿Y el coeficiente de correlación simple? Justifica. 3. Demuestra que si entre doss variables, X y Y , existe una relación lineal exacta, Y = a + bX con b 6= 0, el coeficiente de correlación entre X y Y es igual a 1 si b > 0 y igual a -1 si b < 0. 2 Distribuciones 4. Considera la variable aleatória Z= resultado de tirar el dado. (a) ¿Es Z una variable aleatoria continua o discreta? (b) Encuentra la función de probabilidad de Z. Cómo etiquetarias este tipo de función? 5. Considera que Z es una variable aleatoria continua con función de densidad N (0, 1). Con la ayuda de la tabla de la distribución normal que proporciona Gretl, encuentra el valor de c en los siguientes casos: (a) Prob {Z > c} = 0.025 (b) Prob {|Z| > c} = 0.10 6. Utilitzando las tablas de la distribución correspondiente que proporciona Gretl, encuentra cada una de las probabilidades siguientes sabiendo que Z ∼ N (0, 1). En cada caso, incluye un gráfico de la función de densidad, marcado la probabilidad corresponiente. (a) Prob {Z > 1.96} (b) Prob {|Z| > 1.96} (c) Prob {−1.96 < Z < 1.96} 7. Si sabemos que Z1 ∼ N (0, 1) y Z2 ∼ N (0, 1) són dos variables independentes. Qué podrias decir sobre la distribución (tipo, esperanza y varianza) de las siguientes variables: (a) Z3 = Z1 + Z2 (d) Z6 = Z1 − Z2 (b) Z4 = Z1 · 4 (e) Z7 = Z12 (c) Z5 = 2 + 4Z1 (f) Z8 = Z12 + Z22 Población y parámetros versus Muestra y estadísticos 8. Considera que conocemos todas las observaciones de la población de una variable Z viene dada por: Z = {6, 7, 6, 8, 5, 7, 6, 9, 10, 6}. (a) Calcula E(z) y var(z). (b) Considera que en lugar de toda la población, sólo tenemos la siguiente muestra, extraída aleatoriamente, de esta población: {6, 8, 10}. Calcula la \ mediana muestral, Z̄, y la varianza muestral de Z, var(Z). (c) Considera ahora que la muestra disponible sacada de esta población es: {6, 5, 9}. Calcula de nuevo la mediana mostral, Z̄, y la varianza muestral de Z asociada a esta segunda muestra. (d) ¿Crees que la mediana muestral, Z̄, es una variable aleatoria? ¿Y la varianza muestral? Razona la respuesta. 3 Simulación de la conducta de una variable aleatoria 9. Crea un fichero de instrucciones de Gretl que genere 100 observaciones de una variable aleatoria Z1 ∼ N (0, 1). Antes del comando que genera la variable, incluye el comando ’set seed 1234’. Ejecuta el guión. Una vez generadas estas observaciones, utilizando los menús de la ventana principal, encuentra: (a) Los estadísticos básicos para esta variable (media muestral, varianza y desviación estándar). ¿Han salido como esperabas? Comenta. (b) El histograma de frecuencias de las observaciones de Z1 de la muestra. ¿Han salido como esperabas? Comenta. 10. Repite el ejercicio anterior pero generando ahora 10.000 observaciones de Z1 en lugar de 100. Comenta los resultados: fijate en la mediana muestral, la varianza muestral y el histograma obtenidos en este ejercicio en comparación a lo obtenido en el ejercicio anterior. ¿Han variado en la dirección que esperabas? Relaciones lineales entre variables 11. Considera la variable aleatoria Z1 ∼ N (0, 4) y definimos Z2 = Z1 + 3. (a) ¿Qué puedes decir de la correlación entre Z1 y Z2 ? (b) Escribe un guión de instrucciones de Gretl que genere 1000 observacioes de estas dos variables. Ejecuta el guión. Incluye la instrucción ’set seed 10101’ antes de generar las observaciones. Haz un gráfico con las observaciones generadas, en el plano (Z1 , Z2 ). Utiliza el menu de Gretl para encontrar el coeficiente de correlación simple de observaciones de Z1 y Z2 incluidas en la muestra. Comenta. 12. Sabemos que Z1 ∼ N (3, 4) y Z2 = Z1 + v donde v ∼ N (0, 1). (a) ¿Qué podemos decir de la correlación entre Z1 i Z2 ? (b) Con la ayuda de un guión de instrucciones de Gretl genera 1000 observaciones de Z1 y Z2 . Incluye la instrucción ’set seed 10101’ antes de generar las observacions. Haz un gráfico con las observaciones generadas, en el plano (Z1 , Z2 ). Encuentra el coeficiente de correlación simple muestral entre Z1 y Z2 . (c) Si quisieramos disminuir la correlación entre las dos variables, ¿qué elemento en la generación de Z2 podriamos cambiar? 13. Considera Z1 ∼ N (0, 4). Define otra variable aleatoria Z2 de forma independente. Con la ayuda de Gretl, genera 1000 observaciones de Z1 y 1000 observaciones de Z2 . Incluye la instrucción ’set seed 10101’ antes de generar las observaciones. (a) Calcula el coeficiente de correlación simple muestral entre las dos. ¿Te han salido como esperabas? (b) Haz un gráfico de las 1000 observaciones en el plano (Z1 , Z2 ). ¿Te sorprende? Comenta. 4 Aplicaciones 14. El fichero Spain2013.gdt contiene información sobre la renta anual (hy022), en euros, de 12.053 hogares españoles para 2013. (a) Con la ayuda de Gretl estima la distribución de la renta en España utilizando un histograma. Comenta. (b) Calcula los estadísticos de estadística descriptiva básica. Comenta. (c) Crees que seria razonable suponer que la renta se distribuye normalmente? Justifica la respuesta. 15. El artículo de Sachs & Wagner (2001) publicado en la European Economic Review tenía como objetivo encontrar evidencia empírica para la llamada “maldición de los recursos naturales”, que sostiene que los países con abundancia de recursos naturales tienden a tener un crecimiento económico bajo. El fichero nr97m.gdt contiene los datos utilizados para estos autores de 71 países. Los autores utilizan el peso de las exportaciones de recursos naturales sobre el PNB para 1980 (sxp80) como medida de la abundancia de los recursos naturales. Como indicador del crecimiento económico los autores utilizan los promedios de las tasas de crecimiento económico anuales entre 1970 y 1990 (gea7090). (a) Con la ayuda de Gretl, calcula el coeficiente de correlación simple entre sxp80 y gea7090. ¿Crees que el valor encontrado apoya la hipótesis de la maldición de los recursos naturales? Comenta. (b) Haz un gráfico (scatter plot) de las observaciones de los 71 países poniendo gea7090 en el eje vertical y sxp80 en el eje horizontal. ¿Crees que el gráfico apoya la hipótesis de los autores? Comenta. Estadística para vectores de variables aleatorias Z1 un vector aleatorio. Sabiendo que E(Z1 ) = 4, E(Z2 ) = 8, 16. Sea z = Z2 V ar(Z1 ) = 100, V ar(Z2 ) = 49 y Cov(Z1 , Z2 ) = −2, encuentra E(z) y V ar(z). 17. Si definimos Z1 3 4 0 z= ∼N , Z2 5 0 9 (a) ¿Qué podemos decir de E(z), V ar(z), E(Z1 ), V ar(Z1 ), E(Z2 ), V ar(Z2 ), Cov(Z1 , Z2 ), Cov(Z2 , Z1 ) y Corr(Z1 , Z2 ) ? (b) ¿Qué podemos decir de la distribución de Z1 ? ¿Y de Z2 ? 18. Definimos: Z z= 1 Z2 como un vector que incluye las variables aleatorias Z1 y Z2 . Para cada uno de los seguientes casos, calcula el coeficiente de correlación simple entre Z1 y Z2 . 5 9 0 (a) V ar(z) = 0 100 9 30 (b) V ar(z) = 30 100 9 −18 (c) V ar(z) = −18 100 19. Considera que: (a) E(Z1 ) = 8, E(Z2 ) = −3 y E(Z3 ) = 5, (b) V ar(Z1 ) = 8, V ar(Z2 ) = 4 y V ar(Z3 ) = 16, (c) Cov(Z1 , Z2 ) = 16, Cov(Z1 , Z3 ) = −0.2 y Cov(Z2 , Z3 ) = 9, Z1 Detalla E(z) y V ar(z) si z = Z2 . Z3 20. Considera que tenemos un vector columna z que contiene dos variables aleatorias: Z1 y Z2 . Z z= 1 Z2 El vector z esta conjuntamente distribuida con una Normal con vector de esperanzas µ y matriz de varianzas y covarianzas, Σ: z ∼ N (µ, Σ) Considera que: E(Z1 ) = 4 E(Z2 ) = 10 V ar(Z1 ) = 2 V ar(Z2 ) = 4 Cov(Z1 , Z2 ) = 0. (a) Considera que definimos la variable W1 . Aplica las propiedades de la esperanza y la varianza para encontrar E(W1 ) y var(W1 ). ¿Qué puedes decir sobre la distribución que seguirá W1 ? (b) Considera la siguiente propiedad: Si z ∼ N (µ, Σ) → Az ∼ N (Aµ, AΣA0 ) donde A es una matriz de constantes. Queremos utilizar esta propiedad para encontrar E(W1 ) y var(W1 ). Detalla los elementos de µ, Σ. Detalla los elementos de la matriz A para que Az = W1 . (c) Aplica la propiedad dada en el apartado (b) para encontrar la distribución, la esperanza y la varianza de W1 . (d) Considera que definimos las variables: W1 = Z1 + 2Z2 W2 = Z1 − Z2 W3 = Z1 + Z2 . Utilizando la propiedad incluída en la pregunta 20b, hallar la esperanza y varianza de cada una de estas variables y también sus covarianzas. 6