ESTADISTICA II INGENIERIA INFORMATICA, 3ER Curso Primera Parte - Test 1 - Septiembre - 2.005 Nota : En la realización de este examen sólo esta permitido utilizar calculadoras que, a lo sumo, tengan funciones estadísticas básicas. No se pueden utilizar calculadoras programables. Existe una sóla respuesta correcta por pregunta. Cada respuesta correcta se valorará con 1 punto y cada incorrecta con -1/3. Las preguntas no contestadas no se valoran. Si se marcan varias respuestas a la vez se considerará la pregunta no contestada. El valor de esta primera parte del examen es de CINCO PUNTOS sobre diez. Responder con letras mayúsculas y bolígrafo. Las respuestas elegidas que se considerarán válidas son las que se consignen en el cuadro que se adjunta a continuación. Pregunta Respuesta Pregunta Respuesta 1 D 7 C 2 B 8 A 3 B 9 C 4 A 10 B 5 D 11 B 6 C 12 D CUESTIONES 1. Un test de hipótesis es "estadísticamente signi…cativo" si (a) Se acepta la hipótesis nula para < 0:05. (b) El tamaño muestral es lo su…cientemente grande para poder realizar el contraste. (c) Se acepta la hipótesis nula para (d) Se rechaza la hipótesis nula. > 0:01. 2. Para contrastar la igualdad de las medias de dos muestras pareadas se utiliza el test de la t. El p valor que se obtiene es (a) Igual al que proporciona el test de la F en un diseño de experimentos con un factor completamente aleatorizado. (b) Igual al que proporciona el test de la F en un diseño de experimentos en bloques completamente aleatorizados. (c) Igual al que proporciona el test de la F en un diseño de experimentos con dos factores, uno …jo y uno aleatorio. (d) Igual al que proporciona el test de la F en un diseño de experimentos con dos factores e interacción. 3. En un modelo de regresión lineal múltiple con k regresoras se ha obtenido el siguiente grá…co de los residuos ordinarios frente a las predicciones. Se observa (a) No se cumple la hipótesis de normalidad aunque si la de homocedasticidad.. (b) No se observa ninguna anomalía en él cumplimiento de las hipótesis básicas. (c) Hay un claro problema de multicolinealidad. (d) Por la existencia de observaciones in‡uyentes a posteriori el modelo de regresión está mal calculado. 4. En la grá…ca adjunta se presentan los residuos estandarizados de ajustar un diseño completamente aleatorizado frente a los niveles del factor. Se observa (a) Que hay un problema de falta de normalidad y existe un dato atípico. (b) Que existe un problema de heterocedasticidad. (c) Que hay un factor que no se ha tenido en cuenta. (d) Hay un problema de dependencia positiva lo que origina la existencia de atípicos. 5. Al ajustar un modelo de regresión lineal simple con diez observaciones se han obtenido los siguientes residuos estandarizados i ri 1 1:5 2 0:5 3 3 4 0 5 1 6 1:5 7 2:5 8 1 9 0:5 10 0:5 (a) La autocorrelación de orden 2 es 0:265 y es signi…cativa. (b) La autocorrelación de orden 2 es 0:444 y es signi…cativa. (c) La autocorrelación de orden 2 es 0:444 y no es signi…cativa. (d) La autocorrelación de orden 2 es 0:265 y no es signi…cativa. 6. Con los datos de la cuestión anterior contrastar si los residuos siguen una distribución uniforme [ 3; 3] utilizando Kolmogorov-Smirnov (a) El estadístico del contraste es Dn = 0:217 y se rechaza la hipótesis. (b) El estadístico del contraste es Dn = 0:508 y se acepta la hipótesis. (c) El estadístico del contraste es Dn = 0:217 y se acepta la hipótesis. (d) El estadístico del contraste es Dn = 0:508 y se rechaza la hipótesis. 7. Al ajustar un diseño de experimentos con un factor aleatorio yij = se ha obtenido scG = 290 + y i + "ij ; i = 1; 2; 3; 4; j = 1; 2; 3; 4; 5; 6 scR = 200: Al contrastar la hipótesis H0 : var( i ) = 0, se obtiene (a) Se acepta para todo (b) Se rechaza para 0:01 < (c) Se acepta para < 0:05. (d) Se rechaza para < 0:05 < 0:05 8. Al ajustar un diseño de experimentos con un factor …jo se sospecha que existe heterocedasticidad. Se ha encontrado la siguiente relación entre las desviaciones típicas de los residuos en cada nivel (si ) y las medias de la respuesta (yi: ) : si = 2(yi: )1=2 + error: Según Box-Cox, la transformación que debe hacerse es (a) zij = 2 1 (b) zij = log(yij ) p (c) zij = 2 yij 1 p yij 1 (d) Ninguna de las otras tres respuestas. ~ = X~ + ~": Sea F^M el estadístico del contraste de 9. En el modelo de regresión lineal múltiple Y regresión múltiple ¿Cuál de las siguientes igualdades es correcta? (a) F^M = (b) F^M = (c) F^M = 1 1 1 (d) Ninguna R2 R2 2 R R2 R2 n (k + 1) R2 k de las otras tres respuestas. 10. Al ajustar un modelo de regresión lineal múltiple con 50 observaciones y 3 regresoras se ha obtenido el siguiente valor del estadístico de Durbin-Watson: d^ = 3 (a) Se rechaza la hipótesis de independencia porque existe una dependencia positiva. (b) Se rechaza la hipótesis de independencia porque existe una dependencia negativa. (c) Se acepta la hipótesis de independencia. (d) El contraste no es concluyente. 11. En un análisis de regresión lineal múltiple, los residuos estandarizados vienen dados por (a) ri = yi y^i yi y^i (b) ri = p s^R 1 hii yi y^i (c) ri = s^R yi y^i (d) ri = 12. Al ajustar un modelo de regresión lineal múltiple entre una respuesta (Y ) y un conjunto de regresoras se observa que el F IV de la regresora xi es 30: Por tanto (a) Las variables regresoras son ortogonales. (b) El modelo ajustado proporciona malas predicciones. (c) El estimador s^2R proporciona malos resultados, es muy grande. (d) La varianza del estimador ^ i es grande. ESTADISTICA II, Ingeniería Informática, Problemas, 1 - Septiembre - 2.005 Responder de forma concisa y justi…cada a las siguientes cuestiones. Las respuestas se escribirán con bolígrafo a continuación de las preguntas. Cada una de las preguntas tiene una valoración máxima de 0.5 puntos sobre cinco. Para aprobar el examen es necesario obtener una puntuación igual o superior a 1 punto en cada uno de los dos problemas. Problema 1. Para estudiar la in‡uencia del rozamiento y de la habilidad del lanzador en el número de vueltas que da una peonza desde que se lanza hasta que se detiene, se plani…ca el siguiente experimento. Se eligen seis tipos de suelos (factor 1) y dos lanzadores (factor 2), procediendo a lanzar la peonza tres veces, cada lanzador, en cada tipo de suelo. Los resultados del experimento fueron los siguientes: Factor 1 S1 S2 S3 S4 S5 S6 528 542 63 137 184 480 P 462 532 32 127 192 385 Factor 2 L1 i yi = 10 811 663 538 8 225 118 316 554 500 31 193 90 312 489 476 7 134 202 306 L2 560 493 16 227 201 488 C.1.1. Utilizando los datos del problema 1, al ajustar un diseño de experimentos con dos factores e interacción, completar la tabla ANOVA e indicar los efectos que son signi…cativos al 5%. F. de variac. Factor 1 Factor 2 Interacción Residual Global Suma de Cuad. g.l. SCM F p valor ¿es signi…cativo? 4 088:81 1 410 823 C.1.2. Formular el modelo del apartado anterior, calcular el coe…ciente de determinación del modelo y encontrar un intervalo de con…anza al 90% para la desviación típica del error. C.1.3. En las mismas condiciones de los apartados anteriores encontrar intervalos de con…anza, al 95%, para el número medio de vueltas que dará la peonza cuando es lanzada por cada uno de los dos lanzadores. ¿Es consecuente el resultado con la tabla del apartado 1? C.1.4. En las mismas condiciones de los apartados anteriores dibujar el grá…co de interacciones poniendo en abscisas el Factor 1. Interpretar el resultado. C.1.5. A partir de los resultados de los apartados anteriores ¿tendría sentido formular diseño de efectos principales? Construir su tabla ANOVA y comentar las conclusiones que de ese modelo se obtienen. ESTADISTICA II, Ingeniería Informática, Problemas, 1 - Septiembre - 2.005 Problema 2: Un programa informático realiza un cálculo con un número. Se desea estudiar la relación entre el tiempo de ejecución (Y ) y la regresora número de dígitos del número (X) : Para ello se ha recogido una muestra de diez observaciones: x y 1 1 1 2 2 4 2 5 3 8 3 9 4 14 4 16 5 20 5 25 En base a la muestra recogida se han obtenido los siguientes datos: X X t X X X yi = 104; xi = 30; 1 0 B B = B B @ 23 10 X 33 20 1 4 yi2 = 1668; x2i = 110; 33 20 1 4 187 140 3 14 3 14 1 28 1 X X yi xi = 417; x3i = 450; X X yi x2i = 1797; x4i = 1958; C C C C A C.2.1. Ajustar un polinomio de segundo grado a partir de la muestra dada y calcular la predicción del tiempo de ejecución para un número de 6 digítos C.2.2. Respecto al modelo de la cuestión C.2.1. calcular el coe…ciente de correlación múltiple corregido por el número de grados de libertad C.2.3. Respecto al modelo de la cuestión C.2.1., calcular el número equivalente de observaciones asociado a la observación (2; 4) : ¿Es una observación in‡uyente a priori? C.2.4. Se han obtenido dos nuevos datos muestrales (hay doce observaciones muestrales) y se ha ajustado un polinomio de orden tres. El resultado obtenido es el siguiente (en la línea inferior entre paréntesis se da (^ i )) Y = 11:7 (5:6) 16:3 (10:7) x + 7:5 (2:2) x2 0:78 (0:29) x3 ¿qué variables regresoras son signi…cativas con nivel de signi…cación 0:05? C.2.5. Utilizando el modelo de la cuestión C.2.4. calcular las correlaciones parciales de la variable respuesta con las tres regresoras. Interpretar el resultado.