Test Repaso Regresion - Departamento de Estadística

Anuncio
INGENIERÍA INDUSTRIAL
Departamento de Estadı́stica
Asignatura: ESTADÍSTICA II
Curso: 2007/2008
Relación número 5 de problemas
1. Se pretende estudiar si existe relación entre el peso de los recién nacidos y el tabaco
consumido por la madre durante el embarazo. Para ello, empleando datos de 1656
recién nacidos, se estima por mı́nimos cuadrados el siguiente modelo:
logYi = β0 + β1 Hi + β2 Ci + β3 Ei + β4 Ei2 + β5 Ni + ui
donde:
Yi es el peso del bebé al nacer en gramos
Hi es una variable dicotómica que vale 1 si el recién nacido es niño y 0 si es niña
Ci es el no de cigarros diarios fumados por la madre durante el embarazo
Ei es la edad de la madre en años
Ni es el no de veces que la madre acudió al médico durante el embarazo
Los resultados obtenidos son:
Indique, de las siguientes afirmaciones, la única correcta:
a) Se estima que por cada cigarro adicional que fume la madre durante el embarazo, con todo los demás constante, el peso del recién nacido disminuye
0,296 gramos.
b) Se estima que por cada cigarro adicional que fume la madre durante el embarazo, con todo los demás constante, el peso del recién nacido disminuye 0,00296
gramos.
1
c) Se estima que por cada cigarro adicional que fume la madre durante el embarazo, con todo los demás constante, el peso del recién nacido disminuye 0,296 %.
d) Se estima que por cada cigarro adicional que fume la madre durante el embarazo, con todo los demás constante, el peso del recién nacido disminuye
0,00296 %.
2. Cuando en un modelo de regresión existe multicolinealidad perfecta entre las variables explicativas:
a) No podemos estimar los parámetros por mı́nimos cuadrados ordinarios (MCO)
porque no podemos obtener la matriz X.
b) No podemos estimar los parámetros por mı́nimos cuadrados ordinarios (MCO)
porque no podemos obtener (X ′ X)−1 .
c) Podemos estimar los parámetros por mı́nimos cuadrados ordinarios (MCO)
aunque el estimador será ineficiente.
d) No podemos estimar los parámetros por mı́nimos cuadrados ordinarios (MCO)
porque no tenemos las observaciones de la variable.
3. Considérese el siguiente modelo de regresión estimado:
Señale cuál de las siguientes afirmaciones es correcta bajo un nivel de significación
de α = 0,05
2
a) En los contrastes de significatividad individual y conjunta se rechaza la hipótesis
nula
b) Existen indicios de multicolinealidad
c) El número total de observaciones es 21
d) La varianza residual es 392954
4. Para analizar la relación del precio de la vivienda con el tamaño y el número de
habitaciones, se ha estimado, con una muestra de 200 viviendas, el siguiente modelo
por mı́nimos cuadrados ordinarios:
donde yi es el precio en miles de euros de la vivienda i, x1i es el tamaño en metros
cuadrados de la vivienda i, x2i es el número de habitaciones de la vivienda i, y las
cifras entre paréntesis son los errores estándar de los parámetros estimados. Indique
cuál de las siguientes afirmaciones es cierta:
a) Si el número de habitaciones de la vivienda se incrementa en 1 %, manteniéndose
todo lo demás constante, el precio de la vivienda se incrementará en un 0, 1 %
b) Si el tamaño de la vivienda se incrementa en 1 %, manteniéndose todo lo demás
constante, el precio de la vivienda se incrementará en un 0, 9 %
c) Dado el número de habitaciones, el efecto del tamaño de la vivienda sobre el
precio es significativamente distinto de cero al 5 % (t197;0,025 ≈ z0,025 = 1,96)
d) Si el número de habitaciones de la vivienda se incrementa en 1 unidad, manteniéndose todo lo demás constante, el precio de la vivienda se incrementará en
un 0, 1 %
5. Considere el modelo de regresión
yi = β0 + β1 x1i + β2 x2i + ui
Con una muestra de tamaño 100, se ha obtenido una estimación nı́nimo cuadrática
de β1 = 2. Entonces:
a) La variable x1i es significativa al 5 % porque β1 > 1,96
b) Si x1i se incrementa en una unidad, el valor de y se incrementa en 2 unidades
para cualquier valor que tome x2i
c) Si x1i se incrementa en una unidad, el valor de y se incrementa en 2 unidades
manteniéndose constante x2i
d) El valor medio de y es igual a 2 tomando x1 = 0.
3
6. Sea el modelo de regresión lineal múltiple en el que se han incluido un total de 4
variables explicativas, cuya ecuación es:
yi = β0 + β1 x1i + β2 x2i + β3 x3i + β4 x4i + ui i = 1, . . . , 10
Señala cuál de las siguientes serı́a la matriz de varianzas covarianzas estimada del
T
vector βb = βb0 , βb1 , βb2 , βb3 , βb4
y cuáles son sus dimensiones.
2
a) SbR
(X ′ X)−1 que tendrá dimensión de 10 filas y 10 columnas
2
(X ′ X)−1 que tendrá dimensión de 4 filas y 5 columnas
b) SbR
c) σ 2 (X ′ X)−1 que tendrá dimensión de 4 filas y 5 columnas
2
d) SbR
(X ′ X)−1 que tendrá dimensión de 5 filas y 5 columnas
7. En un modelo de regresión múltiple, el hecho de que el determinante de una matriz
X ′ X sea practicamente cero indica que:
a) El modelo está correctamente especificado
b) Hay un problema de multicolinealidad
c) Es necesaria una transformación sobre la variable respuesta
d) El término constante β0 desaparece
8. Para estudiar la relación del salario de los individuos con sus años de estudio y sus
años de experiencia laboral se ha estimado con una muestra de 3000 individuos el
siguiente modelo:
log yi = β0 + β1 x1i + β2 x2i + ui
donde yi es el salario en euros del individuo i-ésimo, x1i son los años de estudios y
x2i son los años de experiencia laboral. Los resultados obtenidos son:
Indique cuál es la única respuesta correcta:
a) Si los años de estudio aumentan en un año, con la experiencia constante, el
salario aumenta 0,068 euros
b) Si los años de estudio aumentan en un año, con la experiencia constante, el
salario aumenta 0,068 por ciento
4
c) Si los años de estudio aumentan en un 1 por ciento, con la experiencia constante,
el salario aumenta 0,068 por ciento
d) Si los años de estudio aumentan en un año, con la experiencia constante, el
salario aumenta 6,8 por ciento
9. Sea el modelo de regresión múltiple Y = Xβ + U , donde U ≈ Nn (0, σ 2 I). Sea
βb = (X ′ X)−1 X ′ Y . Entre las siguientes afirmaciones:
I) βb es el estimador mı́nimo cuadrático de β
II) βb es el estimador máximo verosı́mil de β
III) βb es un estimador insesgado de β
son ciertas:
a) (I) y (II)
b) (II) y (III)
c) sólo (III)
d) Las tres
10. Sea el modelo de regresión múltiple Y = Xβ + U , donde la matriz X tiene una
columna de unos y U ≈ Nn (0, σ 2 I). Sea e el vector de residuos. Entre las siguientes
afirmaciones indicar cuál es FALSA:
a) El vector e sigue exactamente una distribución Nn (0, σ 2 I)
b) El vector e tiene n componentes
c) La suma de las componentes del vector e es cero
P 2
d) σ12
ei se distribuye como una χ2n−k−1 siendo k el número de variables explicativas del modelo
11. Sea el modelo de regresión múltiple Y = β0 + β1 X1 + β2 X2 + U . Se da el caso que
X2 = 5 + 2X1 . ¿Cuál de las siguientes afirmaciones es cierta?
a) βb1 es el doble de βb2
b) βb1 es la mitad de βb2
c) βb1 y βb2 son iguales
d) No es posible estimar ni βb1 ni βb2
12. Ajustamos una regresión lineal simple a 200 datos y calculamos el intervalo de
confianza para la pendiente de la regresión
s
1
b
b
β ± zα/2 SR
2
nSbX
¿Cuál de las siguientes hipótesis básicas son necesarias para que el intervalo de
confianza sea aproximadamente válido
5
I) Linealidad del efecto de la variable explicativa sobre la respuesta
II) Homocedasticidad, es decir, que todas las perturbaciones tienen la misma varianza
III) Normalidad de la distribución de las perturbaciones
IV) Independencia de las perturbaciones
Marcar la opción correcta:
a) I y II
b) I y III
c) I, II y IV
d) Todas
13. (Febrero 2007) En una regresión
I) los residuos son siempre ortogonales
II) la estimación de una observación está contenida en el subespacio generado por
las variables X ′ s
III) la media de los residuos es cero
IV) las variables X ′ s siguen una distribución normal
En estas condiciones, el número de afirmaciones ciertas es
a) 1
b) 2
c) 3
d) 4
e) Ninguna
14. (Febrero 2007) Dado el modelo de regresión lineal múltiple para una muestra de 100
datos:
y = −3 + 7x1 + 3x2 − x3
b 1 ) = 0,213,S(β
b 2 ) = 1,213,S(β
b 3 ) = 0,865, el número de variables significativas
con S(β
del modelo es
a) 0
b) 1
c) 2
d) NDA
15. (Febrero 2007) Para un modelo de regresión lineal simple se obtuvo la siguiente
tabla de residuos:
6
xi
ei
1
3
3
a
5
-2
6
-3
7
b
8
4
9
-1
Calcúlense los parámetros a y b
a) a + b = −1, 3a + 7b = 2
b) a + b = −1
c) a = 3, b = 7
d) NDA
16. (Febrero 2007) A partir de la recta de regresión de Y sobre X, ¿qué valor cabe
esperar que tome la variable Y cuando la variable X es igual a su media?
a) La media de Y
b) La media de X
c) Cero
d) NDA
7
Descargar