Universidad Nacional Agraria La Molina Departamento de Estadística e Informática Maestría en Estadística Aplicada Ciclo 2012 – 1 Examen Parcial de Regresión Aplicada 1. Se aplicó un estudio de orientación a una muestra de niños nacidos en Berkeley, California entre enero 1928 y junio 1929 sobre los que se realizaron diferentes mediciones hasta los 18 años. Los datos se encuentran en el archivo Berkeley.txt y las variables consideradas son: Peso2 Talla2 Peso9 Talla9 Diametro9 Fuerza9 Peso18 Talla18 Diametro18 Fuerza18 Puntuacion Peso a los 2 años (en kilogramos) Talla a los 2 años (en centímetros) Peso a los 9 años (en kilogramos) Talla a los 9 años (en centímetros) Diámetro de la pierna a los 9 años (en centímetros) Fuerza a los 9 años (en kilogramos) Peso a los 18 años (en kilogramos) Diámetro de la pierna a los 18 años (en centímetros) Diámetro de la pierna a los 18 años (en centímetros) Fuerza a los 18 años (en kilogramos) Puntuación desde 1 (muy delgado) hasta 7 (obeso) a. Obtener la matriz de dispersión y la matriz de correlaciones muestrales. Comente sus resultados. 3.0 ptos b. Suponer que el punto de partida es la función media que solo considera la variable predictora Peso9. Use el gráfico de variable añadida para evaluar el agregar Diametro9 a la función media anterior. Obtenga los cuatro gráficos equivalentes a los obtenidos en la Figura 3.1. Comente sus resultados. 3.0 ptos c. Estimar el modelo de regresión lineal múltiple cuya función media incluye las variables predictoras Talla2, Peso2, Talla9, Peso9 y Fuerza9. Hallar el coeficiente de determinación y el cuadro de ANVA. Use el estadístico t para evaluar si cada coeficiente de regresión es igual a cero. Comente sus resultados. 3.0 ptos d. Obtener el análisis de variancia secuencial estimando las variables de acuerdo al orden mencionado en la pregunta anterior. Plantear las hipótesis correspondientes y comentar los resultados obtenidos. 3.0 ptos e. Obtener el análisis de variancia secuencial estimando las variables en orden inverso al usado en la pregunta anterior. Explicar las diferencias obtenidas. ¿Qué gráficos podrían ayudarnos a comprender estas diferencias? 3.0 ptos 1 2. El archivo Grasa.txt contiene información que sirve para estimar el porcentaje de grasa en el cuerpo humano en función de X 1 Edad (en años), X 2 Peso (en libras), X 3 Altura (en pulgadas), X 4 Longitud del cuello (en cm), X 5 Longitud del pecho (en cm), X 6 Longitud del abdomen (en cm), X 7 Longitud de la cadera (en cm), X 8 Longitud del muslo (en cm), X 9 Longitud de la rodilla, X 10 Longitud del tobillo (en cm), X 11 Longitud del bíceps (en cm), X 12 Longitud del antebrazo (en cm) y X 13 Longitud de la muñeca (en cm). Se tomaron las mediciones anteriores en una muestra de 252 sujetos. Analice el conjunto de datos para encontrar el mejor modelo de regresión. 5.0 ptos La Molina, 19 de diciembre del 2011 2