Soluciones

Anuncio
MATEMATICAS
Primer curso de Ciencias Ambientales / Curso 2006-2007
Soluciónes HOJA 4
Problema 3: Los siguientes datos corresponden a la evolución del peso celular (en mgr./ml.) y la
cantidad de nitrato en un cultivo de algas durante 3 días (mediciones cada 24 horas).
Tiempo (T)
Inicio
1 dia
2 dias
3 dias
Peso (X)
0, 07
0, 19
0, 52
1, 07
Cantidad de nitrato (Y)
12, 5
10, 4
7, 8
4, 5
a) Ajustar una recta y una exponencial a los datos “peso’ (X) y “cantidad de nitrato” (Y).
b) Ajustar una curva a la evolución temporal del peso.
c) Mediante lo obtenido en a) y b) estimar la cantidad de nitrato que había en el cultivo al cabo
de 36 horas.
Solución:
El cálculo de estadísticos y las gráficas correspondientes se encontrar en el archivo Excel problema3.
Parte a)
Ajustar una recta es decir calcular la recta de regresión. Recordamos la formula
RR ≡ y − y =
COVXY
(x − x)
vx
Por tanto nuestra tarea es calcular los estadísticos
Pn
• media: x = n1 i=1 xi
Pn
Pn
• Varianza: vx = n1 ( i=1 (xi − x)2 = n1 ( i=1 x2i ) − x21
Pn
P
• Covarianza COV (X, Y ) = n1 i=1 (xi − x)(yi − y) = n1 ( i=1 xi yi ) − xy 2
Por tanto tenemos que:
COV (X, Y ) = −1.13953 ,
x = 0.46254 ,
vx = 0.155 , y = 8.8
y la recta de regresión es
R.R ≡ 12.3 − 7.588x
Para evaluar la bondad del ajuste, calculamos el coeficiente de correlación,
r=
COV (X, Y )
√
vx vy
El único estadístico que nos falta es la varianza de y que es vy = 8.935 . Obtenemos
r = −0.986
que es un buen coeficiente de correlación. En efecto vemos en la hoja EXCEL que la recta de
regresión aproxima bien los datos.
P
1
2
2
un error muy común utilizar la fórmula vx = n
( n
i=1 xi − x )
con el mismo error
3 en EXCEl =COVAR(B2:B5;C2:C5)
4 =PROMEDIO(B2:B5)
5 =VAR(B2:B5)*3/4. calcula la varianza dividiendo por n − 1 en vez de n. Por eso el comando que incluimos en la celda
es = V AR(B2 : B5) ∗ 3/4 ya que n = 4
6 =COEF.DE.CORREL(B2:B5;C2:C5)
1 Es
2 cuidado
1
Ajustar una exponencial
Queremos encontrar una curva de la forma
y = aebx = aEXP (bx)
(1)
que aproxime nuestros datos. Tomamos logaritmos obtenemos que (1) es equivalente a
log(Y )7 = log(a) + bx
Por tanto si definimos Z = log(Y ) encontar una curva exponencial que aproxime los datos X, Y es
equivalente a encontrar una recta que aproxime los datos X, Z. Despues veremos como se relacionan
las constantes.
Paso 1: Averiguamos los datos de la nueva variable Z.
Peso (X)
0.07
0.19
0.52
1.07
Peso (X)
log(Y)=Z
log(12.5)
0.07
log(10.4) ≡
0.19
log(7.8)
0.52
log(4.5)
1.07
log(Y)=Z
2, 525728644
2, 341805806
2, 054123734
1, 504077397
Paso 2: Recta de regresión de Z sobre X
A partir de aqui calculamos la recta de regresión de Z sobre X. Necesitamos los nuevos estadísticos
z = 2.106, vz = 0.149, COV (X, Z) = −0.1494
Con lo que podemos calcular la recta de regresión de Z sobre X
R.R = (z − z) =
COV (X, Z)
(x − x)
vx
obteniendo la expresión
R.R ≡ z = 2.556 − 0, 994966399x
Para evaluar el ajuste calculamos el coeficiente de correlación de Z sobre X.
r(Z, X) =
COV (X, Z)
= 0.998
√
vx vz
Asi que el ajuste lineal de Z sobre X es excelente y EQUIVALENTEMENTE el ajuste exponecial
de Y sobre X tambien lo es. Vemos en la gráfica que los puntos del diagrama de dispersión aparecen
sobre la curva.
Paso 3: Deshacemos el cambio Z = log(Y )
Sustituimos en la recta de regresión z = log(y)
log(y) = 2.556 − 0, 994966399x
y tomando exponenciales
y = e2.556 e−0,994966399x = 13.021e−0,994966399x
cuya representación gráfica viene en problema3.
Parte b)
7 usamos
log por logaritmo Neperiano ya que a lo largo del curso solo consideramos logaritmos neperianos
2
De el diagrama de dispersión observamos que los puntos parecen ajustables mediante una curva
exponencial. Para verificar esta intuición calculamos el ajuste exponencial y el correspondiente
coeficiente de correlación.
Paso1: Z = log(X)
Tiempo (T)
Inicio
1 dia
2 dias
3 dias
logPeso (X)
Tiempo (T)
logPeso (X)
log(0, 07)
Inicio
−2, 659260037
log(0, 19) ≡
1 dia
−1, 660731207
log(0, 52)
2 dias
−0, 653926467
log(1, 07)
3 dias
0, 067658648
Paso 2: Recta de regresión de Z sobre T
Calculamos los estadísticos de nuestra nuevas variables Z 8 y T
t = 1.5, vt = 1.25, z = −1, 226564766, vz = 1, 061011276, COV (T, Z) = 1, 148445099
Para evaluar la bondad del ajuste calculamos el correspondiente coeficiente de correlación
r(T, L(X)) = 0, 997229765
que es excelente, asi que concluimos que el ajuste exponencial es el correcto.
La correspondiente recta de regresión de Z sobre X es
R.R ≡ z = −2, 604698885 + 0, 91875608t
Paso 3: Deshacemos el cambio Z = log(X)
Obtenemos la curva exponencial que predice la evolución de X en función de T igual a.
X = 0.074e0.919t
(2)
Parte c)
Queremos predecir la cantidad de nitrato a las 36 horas = 1.5 dias. Recordamos que sabemos
predecir aproximadamente como evoluciona el peso en función del tiempo, y el nitrato en función
del peso
Y = 13.021e−0,994966399x , X = 0.074e0.919t
Asi que sustituimos primero X(1.5) = 0.074e0.919∗(1.5) = 0.293 y luego Y (0.294) = 13.021e−0,9949663990.294 =
9, 725816104
Problema 7: En un estudio de laboratorio se han medido, en una cierta especie canina, las variables
peso (X) y concentración en sangre (Y ) de una cierta sustancia. Los datos resumidos son los
siguientes:
P
P 2
0
0
Pn=7 0
P x2i = 130 5
P xi = 26 75
7
83 P xi yi = 220 23
P 1yi = 11
P y1 i = 19
yi
0
0
0
= 2 0374
xi = 3 7281
xi = 6 3206
x2
i
a) Calcular el coeficiente de correlación entre X e Y .
1
b) Ajustar una curva de ecuación Y = a + b X
a los datos.
Solución:
Parte a)
Recordamos la definición de los estadísticos
8 Aunque
la llamamos igual no tiene nada que ver con la Z de la parte a
3
• media: x =
Pn
1
n
i=1 xi
Pn
1
i=1 (xi
n(
Pn
− x)2 = n1 ( i=1 x2i ) − x2
Pn
• Covarianza COV (X, Y ) = n1 i=1 (xi − x)(yi − y) =
• Varianza: vx =
• r(X; Y ) =
1
n(
P
i=1
xi yi ) − xy 9
COV (X,Y )
√
vx vy
Obtenemos por tanto como n = 7
n
1X
11.7
13.5
xi =
= 1.9286, y =
= 1.6714,
7 i=1
7
7
X
22.23
COV (X, Y ) = 1/7(
xi yi ) − 1.92861.6714 =
− 1.92861.6714 = −0.0477
7
i=1
1X 2
26.75
vx =
xi − (1.9286)2 =
− (1.9286)2 = 0.1019,
7
7
−0.0477
= 0.7538
vy = 0.0393, r(X, Y ) = √
0.03930.1019
x=
Parte b)
Paso 1
1
1
Hacemos el cambio Z = X
ya que si y = a + b X
obtenemos que Y = a + bZ es decir Z e Y tienen
una regresion lineal que es lo que sabemos hacer. Por tanto necesitamos calcular los estadisticos de
la nueva variable Z e Y .
Paso 2
n
1X 1
11.7
3.7281
=
= 0.5326, y =
= 1.6714,
7 i=1 xi
7
7
X 1
6.3206
yi ) − 0.53261.6714 =
− 0.53261.6714 = 0.0128
COV (Z, Y ) = 1/7(
x
7
i
i=1
1X 1
2.0374
vz =
− (0.5326)2 = 0.00e74,
− (0.5326)2 =
7
x2i
7
0.0128
= 0.237410
vy = 0.0393, r(Z, Y ) = √
0.03930.074
z=
Calculamos la recta de regresion de Y sobre Z.
R.R = (y − y) =
R.R = (y − 1.6714) =
COV (Y, Z)
(z − z)
vz
0.0128
(z − 0.5326) ≡ y = 1.730z + 075
0.074
Deshacemos el cambio
Donde pone z volvemos a poner 1/x obteniendo la curva
y = 1.730
1
+ 0.74
x
Ejercicio 8: En cierta especie de pez se mide la longitud total y la de la aleta caudal, obteniendo los
siguientes datos:
Longitud total (Y)
16 39
Longitud de la aleta (X) 2 2, 5
9 cuidado
con el mismo error
4
53
2, 7
81
3
Se cree que existe una relación alométrica entre las dos longitudes. En consecuencia, se pide:
a) Expresar la longitud total en función de la longitud de la aleta mediante un modelo de regresión
potencial Y = aX b .
b) Evaluar el ajuste obtenido.
c) Estimar la longitud total de un pez, si su aleta caudal mide 2,3.
Solución
Los datos correspondientes se encuentran en el archivo ejercicio8
Paso 1: Identificar el cambio de variable apropiado
Como en los casos de la regresión logarítmica o exponencial buscamos la manera de transfomar las
variables para obtener nuevas variables que se relacionen linealmente.
Si Y = abX tenemos que log(Y ) = log(a)+b log(X). Asi que las variables W = log(Y ) y Z = log(X)
están relacionads linealmente.
Paso 2:Calculo de la recta de regresión de W sobre Z
Los nuevos datos son,
W=L(Y)
Z=L(X)
=
W
Z
log(16) log(39)
log(2) log(2, 5)
2, 772588722
0, 693147181
log(53)
log(2, 7)
log(81)
log(3)
3, 663561646 3, 970291914 4, 394449155
0, 91629073 0, 993251773 1, 098612289
Calculamos ahora los estadísticos de W, Z
Z = 0, 925325494, vz = 0, 022157672, w = 3, 700222859, vw = 0.354, COV (W, Z) = 0, 088588198
Asi que la recta de regresión de W sobre Z es
R.R ≡ W = 3.998Z + 0.00069
Paso 3: Deshacemos el cambio W = log(Y ), Z = log(X)
Obtenemos que en términos de W y Z la recta de regresión se escribe como
Log(Y ) = 3.9998log(X) + 0.00069
o tomando exponenciales (e identificando 3.9998=4)
Y = X 4 e0.00069
que es la curva tipo potencial que describe la relación alométrica entre la longitud de la aleta de los
peces y su tamaño total.
Parte b:
Para calcular la validez del ajuste como siempre consideramos el coeficiente de correlacion de las
variables donde hemos hecho la regresión lineal. En este caso W y Z obtenemos que
r(W ; Z) =
COV (W, Z)
= 0, 999998252
√
vw vz
asi que el ajuste es practicamente perfecto. (El ajuste exponencial no era malo 0.96 pero este es
mucho mejor)
5
Descargar