EXAMEN DE ESTADíSTICA II Junio de 2004 CUESTIONES (tiempo: 60 minutos) TIPO A CUESTION 1 Se miden las calorías en las hamburguesas fabricadas por 54 marcas distintas. Las hamburguesas se clasifican en 3 grupos según su composición: vaca, pollo o mezcla de vaca, pollo y cerdo. Para determinar si hay diferencias dependiendo de los ingredientes se hace un análisis de la varianza: ANOVA Table for Calories by Type Analysis of Variance Source SS Df MS F-Ratio P-Value Between groups 17692.2 8846.1 16.07 0.0000 Within groups 28067.1 550.336 Total 45759.3 Elige, de entre las siguientes afirmaciones, la única correcta: a) Rechazamos la hipótesis nula de que el nivel medio de calorías sea el mismo para los tres tipos de hamburguesas a nivel de significación α = 0,05, pero la aceptamos a nivel α = 0,01. b) Los grados de libertad de los residuos son 53. c) Los residuos muestran evidente heterocedasticidad. d) No se cumple la hipótesis básica de normalidad. CUESTION 2 En el contexto de regresión simple estimamos E(y|xh ) = β 0 + β 1 xh , el valor esperado de la respuesta y en el punto xh , mediante ŷh = β̂ 0 +β̂ 1 xh . Indica cuál de las siguientes afirmaciones es la correcta: a) La varianza de la estimación ŷh puede ser arbitrariamente grande tomando xh fuera del rango de valores observados de x. b) Si xh pertenece al rango de valores observados de x, cuanto más cerca este xh del máximo o mínimo de valores observados de x, mayor será la precisión de la estimación. c) La menor precisión de ŷh corresponde a xh = x̄, la media muestral de las observaciones de x. 1 d) El estimador ŷh es sesgado. CUESTION 3 Se sabe que el volumen medio de ventas del producto estrella de una compañía depende de la inversión realizada en publicidad. Concretamente, se sospecha que por cada 100 euros invertidos en publicidad se produce un incremento porcentual fijo del volumen de ventas. Se quiere contrastar la sospecha de la compañía, señale cuál de las siguientes afirmaciones es FALSA. a) Es necesario recoger datos del volumen de ventas conseguido para distintas inversiones en publicidad. Se pueden llevar a cabo distintas campañas en diferentes ciudades, siempre y cuando los hábitos de consumo de las ciudades sean similares. b) Para comprobar su sospecha, tiene que construir un modelo de regresión lineal simple para los datos obtenidos y realizar el contraste de la regresión. c) Para comprobar su sospecha, tiene que transformar la variable respuesta tomando logaritmos, construir un modelo de regresión lineal simple para los datos transformados y realizar el contraste de la regresión. d) Si su sospecha es cierta y construye un modelo de regresión simple para los datos originales, los residuos presentarán problemas de no linealidad, heterocedasticidad y asimetría. CUESTION 4 Considere el modelo de regresión yi = β 0 + β 1 x1i + β 2 x2i + ui i=1,...,100 donde ui satisface los supuestos clásicos. Con una muestra de tamaño n=100, se ha obtenido una estimación mínimo cuadrática de β̂ 1 = 2. Entonces: a) La variable x1i es significativa al 5 % porque β̂ 1 > 1,96. b) Si x1i se incrementa en una unidad, el valor medio de y se incrementa en 2 unidades para cualquier valor que tome x2i . c) Si x1i se incrementa en una unidad manteniéndose x2i constante, el valor medio de y se incrementa en 2 unidades. d) El valor medio de y es igual a 2 tomando x1 = 0. 2 CUESTION 5 En un estudio del análisis de la varianza para tres grupos y 5 observaciones cada uno de ellos, hemos obtenido la siguiente tabla ADEVA Fuentes de variabilidad S.C Grados Varianzas F VE 310 – – VNE – 12 – VT 358 – ¿Cúal de las siguientes afirmaciones es cierta?: a) La varianza residual es 4 y el valor del estadístico es 38.75. b) La varianza residual es 6 y la varianza total es 48. c) La varianza total se obtiene sumando la varianza explicada y la residual, obteniéndose 36. d) Los grados de libertad de la VT son 15 y VNE es 51.6. CUESTION 6 En un análisis de varianza con dos factores e interacción, tenemos I = 3 niveles para el primero, J = 2 niveles para el segundo factor y K = 5 replicaciones para cada combinación de los dos. Los grados de libertad para la suma de los cuadrados de los residuos son: a) 25. b) 24. c) 20. d) 29. CUESTION 7 Sea el modelo de regresión lineal múltiple (con los supuestos habituales) en el que se han incluido un total de 4 variables explicativas introducidas en el modelo en el siguiente orden: Yi = β 0 + β 1 X1i + β 2 X2i + β 3 X3i + β 4 X4i + ui i=1,...,10 Señala cúal de las siguientes sería la matriz de varianzas y covarianzas estimada del vector β̂ = (β̂ 0 , β̂ 1 , β̂ 2 , β̂ 3 , β̂ 4 )0 y cuáles son sus dimensiones. a) ŜR2 (X t X)−1 que tendrá una dimensión de 10 filas y 10 columnas. b) ŜR2 (X t X)−1 que tendrá una dimensión de 4 filas y 5 columnas. c) σ 2 (X t X)−1 que tendrá una dimensión de 4 filas y 5 columnas. d) ŜR2 (X t X)−1 que tendrá una dimensión de 5 filas y 5 columnas. donde ŜR2 es la varianza residual y σ 2 es la varianza de las perturbaciones. 3 CUESTION 8 Se ha diseñado un estudio para contrastar las diferencias en el consumo de carburante de tres tipos de coches A, B, C. Sin embargo, para reducir la variabilidad producida por el tipo de conductor, éstos se han agrupado con respecto a su edad en seis categorías distintas. De cada una de estas categorías se selecciona aleatoriamente un conductor al que se asigna un tipo de coche, A, B, C. En este experimento: a) La edad del conductor es la variable bloque y el tipo de coche es el factor principal. b) El tipo de coche es la variable bloque y el grupo de edad del conductor es el factor principal. c) El tipo de coche y el grupo de edad del conductor son ámbos variables bloque. d) El tipo de coche y el grupo de edad del conductor son ámbos factores principales. CUESTION 9 En un modelo de regresión simple, el coeficiente de determinación R2 es igual a 1. Entonces: a) El término independiente β 0 = 0. b) La variabilidad explicada es igual a la variabilidad no explicada. c) La variabilidad no explicada es igual a 0. d) La variabilidad explicada es igual a 1. CUESTION 10 En un modelo de regresión múltiple, el hecho de que el determinante de una matriz X 0 X sea prácticamente cero indica que: a) El modelo está correctamente especificado. b) Hay un problema de multicolinealidad. c) Es necesaria una transformación sobre la variable respuesta y. d) El término constante β 0 desaparece. Solución: Cuestión Cuestión Cuestión Cuestión Cuestión Cuestión Cuestión Cuestión Cuestión Cuestión Respuesta 1 d 2 a 3 b 4 c 5 a 6 b 7 d 8 a 9 c 10 b 4