Revisado_Abril_2015_LW B LAB 12 - Regresión Múltiple 1. Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (g) de una planta forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (g) y se registraron las características del suelo en el que crecía. Los datos están en el archivo Salinidad en InfoStat (Archivo>Abrir datos de prueba). a) Ajuste un modelo de regresión lineal múltiple (modelo 1) usando biomasa como variable dependiente, y pH, salinidad, zinc y potasio como variables independientes. Guarde los valores predichos y los residuos estudentizados. b) Obtenga la ecuación estimada de regresión y el valor del coeficiente de determinación. Interprete los coeficientes de regresión parciales en términos de este problema. c) Para verificar validez del modelo, construya gráficos de dispersión de residuos estudentizados versus cada una de las variables independientes. ¿Qué información obtenemos con estos gráficos? Observe con cuidado el gráfico residuos vs. salinidad. d) Ajuste un modelo (modelo 2) que incluya todas las variables independientes usadas anteriormente y un término cuadrático para salinidad (use la opción polinomios). Guarde nuevamente los residuos estudentizados y valores predichos. e) Para verificar validez del modelo, construya gráficos de dispersión de residuos estudentizados versus cada una de las variables independientes. f) Para este modelo, interprete los coeficientes de regresión parciales asociados con pH, potasio y zinc. ¿Por qué no se puede interpretar el coeficiente asociado a salinidad? g) Ajuste un modelo que no incluya potasio (modelo 3). Incluya solamente ph, zinc, salinidad y salinidad al cuadrado (use polinomios), guarde los residuos estudentizados y grafíquelos versus cada una de las variables independientes (incluyendo potasio). h) ¿Cuál de los tres modelos seleccionaría? Justifique su respuesta e indique la ecuación del modelo estimado. i) Para el modelo seleccionado verifique los supuestos de normalidad y homogeneidad de varianzas mediante gráficos y/o pruebas adecuadas. j) Prediga, si es posible, la biomasa producida en suelo de pH 6, con una salinidad de 35, un contenido de zinc de 20 y un contenido de potasio de 900. 2. Los datos abajo (gansos) se tomaron para estudiar el efecto de varias variables ambientales sobre el tiempo en el que una especie de ganso migratorio deja su nido a la mañana para ir a buscar alimento. Estos datos se tomaron durante varios días en un refugio de vida silvestre cerca de la costa de Texas en el invierno de 1987/88. La variable TIEMPO se indica en minutos antes (-) o después (+) del amanecer. La variable TEMP es la temperatura del aire en C, HUM es la humedad relativa ambiente, LUZ es la intensidad lumínica y NUBES es el porcentaje del cielo cubierto por nubes. AGRO 6600 – LAB 12 Page 1 Fecha 10-Nov-87 13-Nov-87 14-Nov-87 15-Nov-87 17-Nov-87 18-Nov-87 21-Nov-87 22-Nov-87 23-Nov-87 25-Nov-87 30-Nov-87 5-Dic-87 14-Dic-87 18-Dic-87 24-Dic-87 26-Dic-87 27-Dic-87 28-Dic-87 30-Dic-87 31-Dic-87 2-Ene-88 3-Ene-88 4-Ene-88 5-Ene-88 6-Ene-88 7-Ene-88 8-Ene-88 10-Ene-88 11-Ene-88 12-Ene-88 14-Ene-88 15-Ene-88 16-Ene-88 20-Ene-88 21-Ene-88 22-Ene-88 23-Ene-88 24-Ene-88 Tiempo 11 2 -2 -11 -5 2 -6 22 22 21 8 25 9 7 8 18 -14 -21 -26 -7 -15 -6 -23 -14 -6 -8 -19 -23 -11 5 -23 -7 9 -27 -24 -29 -19 -9 Temp 11 11 11 20 8 12 6 18 19 21 10 18 20 14 19 13 3 4 3 15 15 6 5 2 10 2 0 -4 -2 5 5 8 15 5 -1 -2 3 6 Hum 78 88 100 83 100 90 87 82 91 92 90 85 93 92 96 100 96 86 89 93 43 60 80 92 90 96 83 88 80 80 61 81 100 51 74 69 65 73 Luz 12.6 10.8 9.7 12.2 14.2 10.5 12.5 12.9 12.3 9.4 11.7 11.8 11.1 8.3 12 11.3 4.8 6.9 7.1 8.1 6.9 7.6 8.8 9 8 7.1 3.9 8.1 10.3 9 5.1 7.4 7.9 3.8 6.3 6.3 7.8 9.5 Nubes 100 80 30 50 0 90 30 20 80 100 60 40 95 90 40 100 100 100 40 95 100 100 100 60 100 100 100 20 10 95 95 100 100 0 0 0 30 30 a. Prepare e interprete una matriz de diagramas de dispersión (“scatterplot matrix”) y una matriz de correlación en Infostat. b. Ajuste ecuaciones de regresión lineal simple entre TIEMPO y cada una de las variables independientes ¿Cuáles variables muestran una relación lineal fuerte con TIEMPO? c. Conduzca un análisis de regresión múltiple para predecir el tiempo (Y) usando todas las otras variables como independientes (temp, hum, luz y nubes). Obtenga la ecuación estimada de regresión y el valor del coeficiente de determinación. Interprete los coeficientes de regresión parciales en términos de este problema. Use InfoStat y SAS. d. Prediga el tiempo promedio que estas aves dejan su nido cuando la temperatura es de 15C, la humedad relativa del 70%, la intensidad de luz de 10.5 y la cobertura de nubes del 65%. e. Pruebe 2 4 0.