Ejercicio 1. Se ha medido el contenido de oxígeno Y, en miligramos/litro, del lago Worther, en Austria, a una profundidad de X metros, obteniéndose los siguientes resultados: profundidad ( m ) 15 oxígeno ( mg/l ) 20 30 40 50 60 70 6.5 5.6 5.4 6.0 4.6 1.4 0.1 Se pide: a) Ajustar una recta a los datos obtenidos por el método de los mínimos cuadrados. b) Estudiar la correlación entre ambas variables. c) Para una profundidad comprendida entre 75 y 80 metros, ¿Qué contenido en oxígeno se podría esperar? d) ¿A qué profundidad es previsible que nos encontremos si el contenido en oxígeno medido es de 3.2 mr/l? Ejercicio 2. Cinco niñas de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos. a) Hallar la ecuación de la recta de regresión de la edad sobre el peso. b) ¿Cuál sería el peso aproximado de una niña de 6 años?. Ejercicio 3. La tabla muestra la lluvia caída (X, medida en mm) en diferentes regiones y los kilos de trigo cosechados por hectárea (Y) en cada una de estas regiones X(mm) 800 700 500 Y(Kg/Ha) 12000 11000 9000 9000 600 12000 10000 Ejercicio 4. En la tabla está reflejada la pérdida de actividad de un preparado farmacéutico en el curso del tiempo X: t (meses) 1 2 3 4 5 Y: % actividad restante 90 75 42 30 21 Nota.: Las predicciones son mejores cuanto más próximo a 1 en valor absoluto se encuentre el coeficiente de correlación de Pearson y cuanto más próximos se hallen los datos que se quieren predecir a los datos utilizados para obtener la recta de regresión. Solución1 Profundidad Oxígeno (m) (mg/l) X Y 15 20 30 40 50 60 70 xi·ni xi2·ni yi·ni yi2·ni xiyi·ni 15 20 30 40 50 60 70 225 400 900 1600 2500 3600 4900 6.5 5.6 5.4 6.0 4.6 1.4 0.1 42.25 31.36 29.16 36.00 21.16 1.96 0.01 97.5 112.0 162.0 240.0 230.0 84.0 7 285 14125 29.6 161.9 932.5 6.5 5.6 5.4 6.0 4.6 1.4 0.1 X (profundidad) Y (oxígeno) Medias Varianzas Desv. típicas Covarianza a) Luego las ecuaciones de las rectas de regresión serán: b) Hallamos el coeficiente de correlación: Esto nos indica que entre las variables existe una correlación lineal inversa, de manera que a medida que aumenta la profundidad disminuye el contenido de oxígeno. c) Para calcular los límites en los que oscilará el contenido en oxígeno entre dos niveles de profundidad (75 y 80 metros) basta con predecir los valores de Y en la recta de regresión para los valores de X, x1= 75 y x2 = 80. Luego el contenido de oxígeno estaría comprendido entre 0,79mg/l y 0,29mg/l. d) Para un contenido en oxígeno de 3,2 mg/l es de esperar que nos encontremos a una profundidad de 48,12 metros. Solución2 Edad Peso (años) (kg) ni X Y 2 3 5 7 8 xi·ni xi2·ni yi·ni yi2·ni xiyi·ni 14 20 32 42 44 1 1 1 1 1 2 3 5 7 8 4 9 25 49 64 14 20 32 42 44 196 400 1024 1764 1936 28 60 160 294 352 5 25 151 152 5320 894 X (edad) Y (peso) 5 30.4 Varianzas 5.2 139.84 Desv. típicas 2.28 11.83 Medias Covarianza 26.8 a) Luego las ecuaciones de las rectas de regresión serán: b) El peso aproximado de una niña de 6 años es: Solución3 X(mm) 800 700 500 Y(Kg/Ha) 12000 11000 9000 9000 600 12000 10000 Ayudados de una buena tabla, obtenemos la recta de regresión de Y sobre X: y = 0,008 x + 5,2 Hallada esta recta, la podemos utilizar para predecir resultados, por ejemplo: si en una región han caído 550 mm de lluvia, esperamos que recojan: y = 0,008 · 550 + 5,2 = 9,6 toneladas de trigo por hectárea. Solución4 X: t (meses) 1 2 3 4 5 Y: % actividad restante 90 75 42 30 21 Vamos a calcular las rectas de regresión de y sobre x, y de x sobre y. Hallamos las medias, varianzas y covarianza de las variables: x 3; y 51,6; s x2 2; s y2 703,44; s xy 36,60 La recta de regresión de y sobre x es y = -18,30x + 106,5 Hallada esta recta, la podemos utilizar para predecir resultados; por ejemplo: en 2,5 meses se espera un y = - 18,30 · 2,5 + 106,5 = 36,15 % de actividad. La recta de regresión de x sobre y es x = - 0,05y + 5,68 Hallada la recta, la podemos utilizar para predecir resultados; por ejemplo: para que aún tenga un 50 % de actividad, han de pasar y = - 0,05 · 50 + 5,68 = 3,18 meses. Ejercicio propuesto. Las distancias medias de los 9 planetas al Sol son: 1. Mer. 2. Ven. 3. Tie. 4. Mar. 5. Ast. 0,39 0,72 1 1,52 2,65 6. Jup. 7. Sat. 5,2 9,54 8. Ura. 9. Nep. 10. Plu 19,19 30,07 39,52 (Se ha tomado como unidad la distancia entre la Tierra y el Sol, a lo que se llama unidad astronómica (u.a.). El quinto lugar está ocupado por los asteroides que, para estos efectos, son considerados como un planeta más.) Representa la nube de puntos correspondiente, traza la recta de regresión y calcula el coeficiente de correlación. Si hubiera un nuevo planeta más allá de Plutón, ¿a qué distancia en u.a. estaría del Sol?. ¿Sería “fiable” esta medida? Ejemplo Vamos a realizar un estudio completo. La tabla de datos es: Altura Peso 175 180 162 157 180 173 171 168 165 165 80 82 57 63 78 65 66 67 62 58 Aunque en este caso tenemos dos variables muy relacionadas, y no está claramente definido cuál de ellas influye sobre la otra, decidimos estudiar cómo la altura de los individuos influye sobre su peso corporal. Entonces tomamos X=”Altura” como variable explicativa e Y=”Peso” como variable explicada. Comenzamos con la nube de puntos, para que nos informe si vale la pena iniciar el estudio de la regresión lineal o no hay motivos para ello. Nube de puntos Pesos (kg.) 82 77 72 67 62 57 150 155 160 165 170 175 180 Alturas (cm.) Se observa que los puntos siguen una tendencia, aunque uno de ellos, el (157,63), se aleja de dicha tendencia. A este dato se le llama dato atípico. En muestras numerosas un dato atípico no afecta demasiado al resultado, e incluso en ocasiones se elimina de la tabla, aunque no lo haremos en este caso. Así pues, el dibujo revela cierta tendencia de los puntos a agruparse en torno a una recta imaginaria. El coeficiente de determinación, que es el índice numérico que evaluará esa tendencia nos constatará que hay una buena relación lineal. Pasamos al cálculo de los estadísticos necesarios x 169'6 s x 7'2139 s y 8'7567 y 67'8 175 80 180 82 162 57 s xy 169'6 67'8 52'32 10 Ahora se puede calcular el coeficiente de correlación lineal rxy y el de determinación lineal R2 rxy 52'32 0'8282 y R 2 (0'8282)2 100 68'59% 7'2139 8'7567 que nos indica que la variable independiente “Altura” explica el 68’59% de la varianza de los pesos. Este mismo coeficiente de determinación se toma como índice de fiabilidad a la hora de hacer predicciones de la variable “Peso” a partir de datos de la variable “Altura”. Por ejemplo, según la tabla de datos, ¿qué peso corporal le debería corresponder a una persona de 178 cm. de estatura? La respuesta viene de la recta de regresión de “Peso” sobre “Altura”. La calculamos con los datos que ya tenemos, y 67'8 52'32 x 169'6 52'04 Quedando y 102'71 1'005 x Así, una persona de altura 178 cm. (correspondiente por tanto a x=178) tiene, en virtud de la recta de regresión, un peso (y) que se obtiene sustituyendo el valor de x, y vale y=76’177 kg. Se toma como fiabilidad de la predicción el índice R2 calculado con anterioridad. Es decir, se dice que la predicción tiene una fiabilidad del 68’59%.