Ejercicio 1.

Anuncio
Ejercicio 1.
Se ha medido el contenido de oxígeno Y, en miligramos/litro, del lago Worther, en
Austria, a una profundidad de X metros, obteniéndose los siguientes resultados:
profundidad ( m ) 15
oxígeno ( mg/l )
20
30
40
50
60
70
6.5 5.6 5.4 6.0 4.6 1.4 0.1
Se pide:
a) Ajustar una recta a los datos obtenidos por el método de los mínimos cuadrados.
b) Estudiar la correlación entre ambas variables.
c) Para una profundidad comprendida entre 75 y 80 metros, ¿Qué contenido en oxígeno
se podría esperar?
d) ¿A qué profundidad es previsible que nos encontremos si el contenido en oxígeno
medido es de 3.2 mr/l?
Ejercicio 2.
Cinco niñas de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44
kilos.
a) Hallar la ecuación de la recta de regresión de la edad sobre el peso.
b) ¿Cuál sería el peso aproximado de una niña de 6 años?.
Ejercicio 3.
La tabla muestra la lluvia caída (X, medida en mm) en diferentes regiones y los kilos de
trigo cosechados por hectárea (Y) en cada una de estas regiones
X(mm)
800
700
500
Y(Kg/Ha) 12000 11000 9000
9000 600
12000 10000
Ejercicio 4.
En la tabla está reflejada la pérdida de actividad de un preparado farmacéutico en el
curso del tiempo
X: t (meses)
1 2 3 4 5
Y: % actividad restante 90 75 42 30 21
Nota.: Las predicciones son mejores cuanto más próximo a 1 en valor absoluto se encuentre el coeficiente
de correlación de Pearson y cuanto más próximos se hallen los datos que se quieren predecir a los datos
utilizados para obtener la recta de regresión.
Solución1
Profundidad Oxígeno
(m)
(mg/l)
X
Y
15
20
30
40
50
60
70
xi·ni
xi2·ni
yi·ni
yi2·ni
xiyi·ni
15
20
30
40
50
60
70
225
400
900
1600
2500
3600
4900
6.5
5.6
5.4
6.0
4.6
1.4
0.1
42.25
31.36
29.16
36.00
21.16
1.96
0.01
97.5
112.0
162.0
240.0
230.0
84.0
7
285 14125 29.6 161.9
932.5
6.5
5.6
5.4
6.0
4.6
1.4
0.1

X (profundidad)
Y (oxígeno)
Medias
Varianzas
Desv. típicas
Covarianza
a) Luego las ecuaciones de las rectas de regresión serán:
b) Hallamos el coeficiente de correlación:
Esto nos indica que entre las variables existe una correlación lineal inversa, de manera que a medida que aumenta la
profundidad disminuye el contenido de oxígeno.
c) Para calcular los límites en los que oscilará el contenido en oxígeno entre dos niveles de profundidad (75 y 80
metros) basta con predecir los valores de Y en la recta de regresión para los valores de X, x1= 75 y x2 = 80.
Luego el contenido de oxígeno estaría comprendido entre 0,79mg/l y 0,29mg/l.
d) Para un contenido en oxígeno de 3,2 mg/l es de esperar que nos encontremos a una profundidad de 48,12 metros.
Solución2
Edad Peso
(años) (kg) ni
X
Y
2
3
5
7
8
xi·ni
xi2·ni
yi·ni
yi2·ni
xiyi·ni
14
20
32
42
44
1
1
1
1
1
2
3
5
7
8
4
9
25
49
64
14
20
32
42
44
196
400
1024
1764
1936
28
60
160
294
352

5
25
151
152
5320
894
X (edad)
Y (peso)
5
30.4
Varianzas
5.2
139.84
Desv. típicas
2.28
11.83
Medias
Covarianza
26.8
a) Luego las ecuaciones de las rectas de regresión serán:
b) El peso aproximado de una niña de 6 años es:
Solución3
X(mm)
800
700
500
Y(Kg/Ha) 12000 11000 9000
9000 600
12000 10000
Ayudados de una buena tabla, obtenemos la recta de regresión de Y sobre X:
y = 0,008 x + 5,2
Hallada esta recta, la podemos utilizar para predecir resultados, por ejemplo: si en una región han caído 550 mm de
lluvia, esperamos que recojan:
y = 0,008 · 550 + 5,2 = 9,6 toneladas de trigo por hectárea.
Solución4
X: t (meses)
1 2 3 4 5
Y: % actividad restante 90 75 42 30 21
Vamos a calcular las rectas de regresión de y sobre x, y de x sobre y.
Hallamos las medias, varianzas y covarianza de las variables:
x  3; y  51,6; s x2  2; s y2  703,44; s xy  36,60
La recta de regresión de y sobre x es y = -18,30x + 106,5
Hallada esta recta, la podemos utilizar para predecir resultados; por ejemplo: en 2,5 meses se espera un y = - 18,30 ·
2,5 + 106,5 = 36,15 % de actividad.
La recta de regresión de x sobre y es x = - 0,05y + 5,68
Hallada la recta, la podemos utilizar para predecir resultados; por ejemplo: para que aún tenga un 50 % de
actividad, han de pasar y = - 0,05 · 50 + 5,68 = 3,18 meses.
Ejercicio propuesto.
Las distancias medias de los 9 planetas al Sol son:
1. Mer. 2. Ven. 3. Tie. 4. Mar. 5. Ast.
0,39
0,72
1
1,52
2,65
6. Jup.
7. Sat.
5,2
9,54
8. Ura. 9. Nep. 10. Plu
19,19
30,07
39,52
(Se ha tomado como unidad la distancia entre la Tierra y el Sol, a lo que se llama
unidad astronómica (u.a.). El quinto lugar está ocupado por los asteroides que, para
estos efectos, son considerados como un planeta más.)
Representa la nube de puntos correspondiente, traza la recta de regresión y
calcula el coeficiente de correlación. Si hubiera un nuevo planeta más allá de
Plutón, ¿a qué distancia en u.a. estaría del Sol?. ¿Sería “fiable” esta medida?
Ejemplo
Vamos a realizar un estudio completo. La tabla de datos es:
Altura
Peso
175 180 162 157 180 173 171 168 165 165
80 82 57 63 78 65 66 67 62 58
Aunque en este caso tenemos dos variables muy relacionadas, y no está
claramente definido cuál de ellas influye sobre la otra, decidimos estudiar cómo la altura
de los individuos influye sobre su peso corporal. Entonces tomamos
X=”Altura” como variable explicativa e Y=”Peso” como variable explicada.
Comenzamos con la nube de puntos, para que nos informe si vale la pena iniciar el estudio de la regresión
lineal o no hay motivos para ello.
Nube de puntos
Pesos (kg.)
82
77
72
67
62
57
150
155
160
165
170
175
180
Alturas (cm.)
Se observa que los puntos siguen una tendencia, aunque uno de ellos, el (157,63), se aleja de dicha
tendencia. A este dato se le llama dato atípico. En muestras numerosas un dato atípico no afecta demasiado al
resultado, e incluso en ocasiones se elimina de la tabla, aunque no lo haremos en este caso. Así pues, el dibujo revela
cierta tendencia de los puntos a agruparse en torno a una recta imaginaria. El coeficiente de determinación, que
es el índice numérico que evaluará esa tendencia nos constatará que hay una buena relación lineal.
Pasamos al cálculo de los estadísticos necesarios
x  169'6
s x  7'2139
s y  8'7567
y  67'8
175  80  180  82  162  57  
s xy 
 169'6  67'8  52'32
10
Ahora se puede calcular el coeficiente de correlación lineal rxy y el de determinación lineal R2
rxy 
52'32
 0'8282 y R 2  (0'8282)2  100  68'59%
7'2139  8'7567
que nos indica que la variable independiente “Altura” explica el 68’59% de la varianza de los pesos. Este mismo
coeficiente de determinación se toma como índice de fiabilidad a la hora de hacer predicciones de la variable “Peso”
a partir de datos de la variable “Altura”.
Por ejemplo, según la tabla de datos, ¿qué peso corporal le debería corresponder a una persona de 178 cm.
de estatura? La respuesta viene de la recta de regresión de “Peso” sobre “Altura”. La calculamos con los datos que ya
tenemos,
y  67'8 
52'32
 x  169'6
52'04
Quedando
y  102'71  1'005 x
Así, una persona de altura 178 cm. (correspondiente por tanto a x=178) tiene, en virtud de la recta de
regresión, un peso (y) que se obtiene sustituyendo el valor de x, y vale y=76’177 kg. Se toma como fiabilidad de la
predicción el índice R2 calculado con anterioridad. Es decir, se dice que la predicción tiene una fiabilidad del
68’59%.
Descargar