EXAMEN DE ESTADíSTICA II Junio de 2004 CUESTIONES (tiempo: 60 minutos) TIPO A

Anuncio
EXAMEN DE ESTADíSTICA II
Junio de 2004
CUESTIONES (tiempo: 60 minutos)
TIPO A
CUESTION 1 Se miden las calorías en las hamburguesas fabricadas por 54 marcas distintas. Las hamburguesas se clasifican en 3 grupos según su composición: vaca, pollo o mezcla de vaca, pollo y
cerdo. Para determinar si hay diferencias dependiendo de los ingredientes se hace un análisis
de la varianza:
ANOVA Table for Calories by Type
Analysis of Variance
Source
SS
Df
MS
F-Ratio P-Value
Between groups 17692.2
8846.1
16.07
0.0000
Within groups 28067.1
550.336
Total
45759.3
Elige, de entre las siguientes afirmaciones, la única correcta:
a) Rechazamos la hipótesis nula de que el nivel medio de calorías sea el mismo para los
tres tipos de hamburguesas a nivel de significación α = 0,05, pero la aceptamos a nivel
α = 0,01.
b) Los grados de libertad de los residuos son 53.
c) Los residuos muestran evidente heterocedasticidad.
d) No se cumple la hipótesis básica de normalidad.
CUESTION 2 En el contexto de regresión simple estimamos E(y|xh ) = β 0 + β 1 xh , el valor esperado de la
respuesta y en el punto xh , mediante ŷh = β̂ 0 +β̂ 1 xh . Indica cuál de las siguientes afirmaciones
es la correcta:
a) La varianza de la estimación ŷh puede ser arbitrariamente grande tomando xh fuera del
rango de valores observados de x.
b) Si xh pertenece al rango de valores observados de x, cuanto más cerca este xh del
máximo o mínimo de valores observados de x, mayor será la precisión de la estimación.
c) La menor precisión de ŷh corresponde a xh = x̄, la media muestral de las observaciones
de x.
1
d) El estimador ŷh es sesgado.
CUESTION 3 Se sabe que el volumen medio de ventas del producto estrella de una compañía depende
de la inversión realizada en publicidad. Concretamente, se sospecha que por cada 100 euros
invertidos en publicidad se produce un incremento porcentual fijo del volumen de ventas. Se
quiere contrastar la sospecha de la compañía, señale cuál de las siguientes afirmaciones es
FALSA.
a) Es necesario recoger datos del volumen de ventas conseguido para distintas inversiones
en publicidad. Se pueden llevar a cabo distintas campañas en diferentes ciudades, siempre y cuando los hábitos de consumo de las ciudades sean similares.
b) Para comprobar su sospecha, tiene que construir un modelo de regresión lineal simple
para los datos obtenidos y realizar el contraste de la regresión.
c) Para comprobar su sospecha, tiene que transformar la variable respuesta tomando
logaritmos, construir un modelo de regresión lineal simple para los datos transformados
y realizar el contraste de la regresión.
d) Si su sospecha es cierta y construye un modelo de regresión simple para los datos
originales, los residuos presentarán problemas de no linealidad, heterocedasticidad y
asimetría.
CUESTION 4 Considere el modelo de regresión
yi = β 0 + β 1 x1i + β 2 x2i + ui
i=1,...,100
donde ui satisface los supuestos clásicos.
Con una muestra de tamaño n=100, se ha obtenido una estimación mínimo cuadrática de
β̂ 1 = 2. Entonces:
a) La variable x1i es significativa al 5 % porque β̂ 1 > 1,96.
b) Si x1i se incrementa en una unidad, el valor medio de y se incrementa en 2 unidades
para cualquier valor que tome x2i .
c) Si x1i se incrementa en una unidad manteniéndose x2i constante, el valor medio de y
se incrementa en 2 unidades.
d) El valor medio de y es igual a 2 tomando x1 = 0.
2
CUESTION 5 En un estudio del análisis de la varianza para tres grupos y 5 observaciones cada uno de
ellos, hemos obtenido la siguiente tabla ADEVA
Fuentes de variabilidad S.C
Grados Varianzas F
VE
310
–
–
VNE
–
12
–
VT
358
–
¿Cúal de las siguientes afirmaciones es cierta?:
a)
La varianza residual es 4 y el valor del estadístico es 38.75.
b)
La varianza residual es 6 y la varianza total es 48.
c)
La varianza total se obtiene sumando la varianza explicada y la residual, obteniéndose 36.
d)
Los grados de libertad de la VT son 15 y VNE es 51.6.
CUESTION 6 En un análisis de varianza con dos factores e interacción, tenemos I = 3 niveles para el
primero, J = 2 niveles para el segundo factor y K = 5 replicaciones para cada combinación
de los dos. Los grados de libertad para la suma de los cuadrados de los residuos son:
a) 25.
b) 24.
c) 20.
d) 29.
CUESTION 7 Sea el modelo de regresión lineal múltiple (con los supuestos habituales) en el que se han
incluido un total de 4 variables explicativas introducidas en el modelo en el siguiente orden:
Yi = β 0 + β 1 X1i + β 2 X2i + β 3 X3i + β 4 X4i + ui
i=1,...,10
Señala cúal de las siguientes sería la matriz de varianzas y covarianzas estimada del vector
β̂ = (β̂ 0 , β̂ 1 , β̂ 2 , β̂ 3 , β̂ 4 )0 y cuáles son sus dimensiones.
a) ŜR2 (X t X)−1 que tendrá una dimensión de 10 filas y 10 columnas.
b) ŜR2 (X t X)−1 que tendrá una dimensión de 4 filas y 5 columnas.
c) σ 2 (X t X)−1 que tendrá una dimensión de 4 filas y 5 columnas.
d) ŜR2 (X t X)−1 que tendrá una dimensión de 5 filas y 5 columnas.
donde ŜR2 es la varianza residual y σ 2 es la varianza de las perturbaciones.
3
CUESTION 8 Se ha diseñado un estudio para contrastar las diferencias en el consumo de carburante de
tres tipos de coches A, B, C. Sin embargo, para reducir la variabilidad producida por el tipo
de conductor, éstos se han agrupado con respecto a su edad en seis categorías distintas. De
cada una de estas categorías se selecciona aleatoriamente un conductor al que se asigna un
tipo de coche, A, B, C.
En este experimento:
a) La edad del conductor es la variable bloque y el tipo de coche es el factor principal.
b) El tipo de coche es la variable bloque y el grupo de edad del conductor es el factor
principal.
c) El tipo de coche y el grupo de edad del conductor son ámbos variables bloque.
d) El tipo de coche y el grupo de edad del conductor son ámbos factores principales.
CUESTION 9 En un modelo de regresión simple, el coeficiente de determinación R2 es igual a 1. Entonces:
a) El término independiente β 0 = 0.
b) La variabilidad explicada es igual a la variabilidad no explicada.
c) La variabilidad no explicada es igual a 0.
d) La variabilidad explicada es igual a 1.
CUESTION 10 En un modelo de regresión múltiple, el hecho de que el determinante de una matriz X 0 X
sea prácticamente cero indica que:
a) El modelo está correctamente especificado.
b) Hay un problema de multicolinealidad.
c) Es necesaria una transformación sobre la variable respuesta y.
d) El término constante β 0 desaparece.
Solución:
Cuestión
Cuestión
Cuestión
Cuestión
Cuestión
Cuestión
Cuestión
Cuestión
Cuestión
Cuestión
Respuesta
1 d
2 a
3 b
4 c
5 a
6 b
7 d
8 a
9 c
10 b
4
Descargar