2 - UAB

Anuncio
Econometría I
Ejercicios de repaso de estadística
Poblaciones y parámetros
1. Considera una variable aleatoria Z que solo puede tomar cinco valores, todos
ellos con la misma probabilidad:
Z = {Z1 , Z2 , Z3 , Z4 , Z5 }.
La variable Z es una variable medida en miles de euros.
(a) Proporciona la expresión que define el valor esperado de Z, E(Z), la varianza, var(Z), y la desviación estandar, sd(Z). Presenta las expresiones
utilizando sumatorios.
(b) ¿ Qué información sobre el comportamiento de Z proporciona cada uno de
estos parámetros?
(c) Considera que tenemos los cinco valores que la variable Z puede tomar
son:
Z = {1, 2, 3, 4, 5}.
Con la ayuda de una hoja de cálculo (Excel o similar) calcula E(Z), var(Z)
y sd(Z), definiendo las formulas correspondientes. (Es decir, no utilitces
las funciones predefinidas en la hoja de cálculo).
(d) Considera ahora que redefinimos Z en euros. Es decir, queremos cambiar
las unidades de medida de Z. Etiqueta esta variable Z definida en euros
com Z ∗ . Así, los cinco valores que puede tomar Z ∗ son:
Z = {1000, 2000, 3000, 4000, 5000}.
Modifica la hoja de cálculo que antes has creado y calcula E(Z ∗ ), var(Z ∗ )
i sd(Z ∗ ).
(e) Entra las observaciones de Z a Gretl. Crea un guión de instrucciones y
utilizando las instrucciones correspondientes, calcula E(Z), var(Z), sd(Z)
y E(Z ∗ ), var(Z ∗ ), sd(Z ∗ ). Verifica que los valores coincidencon tus cálculos
anteriores.
(f) Dados los resultados anteriores, ¿Dirias que el valor esperado de una variable depende de las unidades medida de las variables o independiente a
estos cambios? ¿Y la varianza? ¿Y la desviación estandard? Justifica.
1
2. Considera dos variables Z y W , ambas medidas en miles de euros, que solo
pueden tomar cinco pares de valores, todos ellos con la misma probabilidad:
Z
Z1
Z2
Z3
Z4
Z5
W
W1
W2
W3
W4
W5
(a) Proporciona la expresión que define la covariància entre Z y W , cov(Z, W ),
y tambén la expressión que define el coeficiente de correlación entre Z y
W , corr(Z, W ). Presenta las expresiones utilizando sumatorios.
(b) ¿ Qué información sobre el comportamiento de Z y W proporciona cada
uno de estos parámetros?
(c) Considera que tenemos los cinco pares de valores que pueden tomar (Z, W ):
Z
1
2
3
4
5
W
2
4
6
8
10
Con la ayuda de una hoja de cálculo (Excel o similar) calcula cov(Z, W )
i corr(Z, W ), definiendo las formulas correspondientes. (Es decir, no utilitces las funciones predefinidas en la hoja de cálculo).
(d) Considera que cambiamos las unidades de medida de estas dos variables
de miles de euros a euros:
Z∗
1000
2000
3000
4000
5000
W∗
2000
4000
6000
8000
10000
Modifica la hoja de cálculo que antes has creado y calcula cov(Z ∗ , W ∗ ) y
corr(Z ∗ , W ∗ ).
(e) Entra los pares de observaciones de (Z, W ) a Gretl. Crea un guión de instrucciones y utilizando las instrucciones correspondientes, calcula cov(Z, W ),
corr(Z, W ) y cov(Z ∗ , W ∗ ), corr(Z ∗ , W ∗ ). Verifica que los valores coincidencon tus cálculos anteriores.
(f) Dados los resultados anteriores, ¿Dirias que la covariància depende de las
unidades de medida o es independente a estos cambios? ¿Y el coeficiente
de correlación simple? Justifica.
3. Demuestra que si entre doss variables, X y Y , existe una relación lineal exacta,
Y = a + bX con b 6= 0, el coeficiente de correlación entre X y Y es igual a 1 si
b > 0 y igual a -1 si b < 0.
2
Distribuciones
4. Considera la variable aleatória Z= resultado de tirar el dado.
(a) ¿Es Z una variable aleatoria continua o discreta?
(b) Encuentra la función de probabilidad de Z. Cómo etiquetarias este tipo
de función?
5. Considera que Z es una variable aleatoria continua con función de densidad
N (0, 1). Con la ayuda de la tabla de la distribución normal que proporciona
Gretl, encuentra el valor de c en los siguientes casos:
(a) Prob {Z > c} = 0.025
(b) Prob {|Z| > c} = 0.10
6. Utilitzando las tablas de la distribución correspondiente que proporciona Gretl,
encuentra cada una de las probabilidades siguientes sabiendo que Z ∼ N (0, 1).
En cada caso, incluye un gráfico de la función de densidad, marcado la probabilidad corresponiente.
(a) Prob {Z > 1.96}
(b) Prob {|Z| > 1.96}
(c) Prob {−1.96 < Z < 1.96}
7. Si sabemos que Z1 ∼ N (0, 1) y Z2 ∼ N (0, 1) són dos variables independentes.
Qué podrias decir sobre la distribución (tipo, esperanza y varianza) de las siguientes variables:
(a) Z3 = Z1 + Z2
(d) Z6 = Z1 − Z2
(b) Z4 = Z1 · 4
(e) Z7 = Z12
(c) Z5 = 2 + 4Z1
(f) Z8 = Z12 + Z22
Población y parámetros versus Muestra y estadísticos
8. Considera que conocemos todas las observaciones de la población de una variable
Z viene dada por:
Z = {6, 7, 6, 8, 5, 7, 6, 9, 10, 6}.
(a) Calcula E(z) y var(z).
(b) Considera que en lugar de toda la población, sólo tenemos la siguiente
muestra, extraída aleatoriamente, de esta población: {6, 8, 10}. Calcula la
\
mediana muestral, Z̄, y la varianza muestral de Z, var(Z).
(c) Considera ahora que la muestra disponible sacada de esta población es:
{6, 5, 9}. Calcula de nuevo la mediana mostral, Z̄, y la varianza muestral
de Z asociada a esta segunda muestra.
(d) ¿Crees que la mediana muestral, Z̄, es una variable aleatoria? ¿Y la varianza muestral? Razona la respuesta.
3
Simulación de la conducta de una variable aleatoria
9. Crea un fichero de instrucciones de Gretl que genere 100 observaciones de una
variable aleatoria Z1 ∼ N (0, 1). Antes del comando que genera la variable,
incluye el comando ’set seed 1234’. Ejecuta el guión. Una vez generadas estas
observaciones, utilizando los menús de la ventana principal, encuentra:
(a) Los estadísticos básicos para esta variable (media muestral, varianza y
desviación estándar). ¿Han salido como esperabas? Comenta.
(b) El histograma de frecuencias de las observaciones de Z1 de la muestra.
¿Han salido como esperabas? Comenta.
10. Repite el ejercicio anterior pero generando ahora 10.000 observaciones de Z1
en lugar de 100. Comenta los resultados: fijate en la mediana muestral, la
varianza muestral y el histograma obtenidos en este ejercicio en comparación a
lo obtenido en el ejercicio anterior. ¿Han variado en la dirección que esperabas?
Relaciones lineales entre variables
11. Considera la variable aleatoria Z1 ∼ N (0, 4) y definimos Z2 = Z1 + 3.
(a) ¿Qué puedes decir de la correlación entre Z1 y Z2 ?
(b) Escribe un guión de instrucciones de Gretl que genere 1000 observacioes
de estas dos variables. Ejecuta el guión. Incluye la instrucción ’set seed
10101’ antes de generar las observaciones. Haz un gráfico con las observaciones generadas, en el plano (Z1 , Z2 ). Utiliza el menu de Gretl para
encontrar el coeficiente de correlación simple de observaciones de Z1 y Z2
incluidas en la muestra. Comenta.
12. Sabemos que Z1 ∼ N (3, 4) y Z2 = Z1 + v donde v ∼ N (0, 1).
(a) ¿Qué podemos decir de la correlación entre Z1 i Z2 ?
(b) Con la ayuda de un guión de instrucciones de Gretl genera 1000 observaciones de Z1 y Z2 . Incluye la instrucción ’set seed 10101’ antes de generar
las observacions. Haz un gráfico con las observaciones generadas, en el
plano (Z1 , Z2 ). Encuentra el coeficiente de correlación simple muestral
entre Z1 y Z2 .
(c) Si quisieramos disminuir la correlación entre las dos variables, ¿qué elemento en la generación de Z2 podriamos cambiar?
13. Considera Z1 ∼ N (0, 4). Define otra variable aleatoria Z2 de forma independente. Con la ayuda de Gretl, genera 1000 observaciones de Z1 y 1000 observaciones de Z2 . Incluye la instrucción ’set seed 10101’ antes de generar las
observaciones.
(a) Calcula el coeficiente de correlación simple muestral entre las dos. ¿Te han
salido como esperabas?
(b) Haz un gráfico de las 1000 observaciones en el plano (Z1 , Z2 ). ¿Te sorprende? Comenta.
4
Aplicaciones
14. El fichero Spain2013.gdt contiene información sobre la renta anual (hy022), en
euros, de 12.053 hogares españoles para 2013.
(a) Con la ayuda de Gretl estima la distribución de la renta en España utilizando un histograma. Comenta.
(b) Calcula los estadísticos de estadística descriptiva básica. Comenta.
(c) Crees que seria razonable suponer que la renta se distribuye normalmente?
Justifica la respuesta.
15. El artículo de Sachs & Wagner (2001) publicado en la European Economic Review tenía como objetivo encontrar evidencia empírica para la llamada “maldición
de los recursos naturales”, que sostiene que los países con abundancia de recursos
naturales tienden a tener un crecimiento económico bajo. El fichero nr97m.gdt
contiene los datos utilizados para estos autores de 71 países. Los autores utilizan el peso de las exportaciones de recursos naturales sobre el PNB para 1980
(sxp80) como medida de la abundancia de los recursos naturales. Como indicador del crecimiento económico los autores utilizan los promedios de las tasas
de crecimiento económico anuales entre 1970 y 1990 (gea7090).
(a) Con la ayuda de Gretl, calcula el coeficiente de correlación simple entre
sxp80 y gea7090. ¿Crees que el valor encontrado apoya la hipótesis de la
maldición de los recursos naturales? Comenta.
(b) Haz un gráfico (scatter plot) de las observaciones de los 71 países poniendo
gea7090 en el eje vertical y sxp80 en el eje horizontal. ¿Crees que el gráfico
apoya la hipótesis de los autores? Comenta.
Estadística para vectores de variables aleatorias
Z1
un vector aleatorio. Sabiendo que E(Z1 ) = 4, E(Z2 ) = 8,
16. Sea z =
Z2
V ar(Z1 ) = 100, V ar(Z2 ) = 49 y Cov(Z1 , Z2 ) = −2, encuentra E(z) y V ar(z).
17. Si definimos
Z1
3
4 0
z=
∼N
,
Z2
5
0 9
(a) ¿Qué podemos decir de E(z), V ar(z), E(Z1 ), V ar(Z1 ), E(Z2 ), V ar(Z2 ),
Cov(Z1 , Z2 ), Cov(Z2 , Z1 ) y Corr(Z1 , Z2 ) ?
(b) ¿Qué podemos decir de la distribución de Z1 ? ¿Y de Z2 ?
18. Definimos:
Z
z= 1
Z2
como un vector que incluye las variables aleatorias Z1 y Z2 . Para cada uno de
los seguientes casos, calcula el coeficiente de correlación simple entre Z1 y Z2 .
5
9 0
(a) V ar(z) =
0 100
9 30
(b) V ar(z) =
30 100
9 −18
(c) V ar(z) =
−18 100
19. Considera que:
(a) E(Z1 ) = 8, E(Z2 ) = −3 y E(Z3 ) = 5,
(b) V ar(Z1 ) = 8, V ar(Z2 ) = 4 y V ar(Z3 ) = 16,
(c) Cov(Z1 , Z2 ) = 16, Cov(Z1 , Z3 ) = −0.2 y Cov(Z2 , Z3 ) = 9,
 
Z1

Detalla E(z) y V ar(z) si z = Z2 .
Z3
20. Considera que tenemos un vector columna z que contiene dos variables aleatorias: Z1 y Z2 .
Z
z= 1
Z2
El vector z esta conjuntamente distribuida con una Normal con vector de esperanzas µ y matriz de varianzas y covarianzas, Σ:
z ∼ N (µ, Σ)
Considera que:
E(Z1 ) = 4
E(Z2 ) = 10
V ar(Z1 ) = 2
V ar(Z2 ) = 4
Cov(Z1 , Z2 ) = 0.
(a) Considera que definimos la variable W1 . Aplica las propiedades de la esperanza y la varianza para encontrar E(W1 ) y var(W1 ). ¿Qué puedes decir
sobre la distribución que seguirá W1 ?
(b) Considera la siguiente propiedad:
Si z ∼ N (µ, Σ)
→
Az ∼ N (Aµ, AΣA0 )
donde A es una matriz de constantes. Queremos utilizar esta propiedad
para encontrar E(W1 ) y var(W1 ). Detalla los elementos de µ, Σ. Detalla
los elementos de la matriz A para que Az = W1 .
(c) Aplica la propiedad dada en el apartado (b) para encontrar la distribución,
la esperanza y la varianza de W1 .
(d) Considera que definimos las variables:
W1 = Z1 + 2Z2
W2 = Z1 − Z2
W3 = Z1 + Z2 .
Utilizando la propiedad incluída en la pregunta 20b, hallar la esperanza y
varianza de cada una de estas variables y también sus covarianzas.
6
Descargar