MATEMATICAS Primer curso de Ciencias Ambientales / Curso 2006-2007 Soluciónes HOJA 4 Problema 3: Los siguientes datos corresponden a la evolución del peso celular (en mgr./ml.) y la cantidad de nitrato en un cultivo de algas durante 3 días (mediciones cada 24 horas). Tiempo (T) Inicio 1 dia 2 dias 3 dias Peso (X) 0, 07 0, 19 0, 52 1, 07 Cantidad de nitrato (Y) 12, 5 10, 4 7, 8 4, 5 a) Ajustar una recta y una exponencial a los datos “peso’ (X) y “cantidad de nitrato” (Y). b) Ajustar una curva a la evolución temporal del peso. c) Mediante lo obtenido en a) y b) estimar la cantidad de nitrato que había en el cultivo al cabo de 36 horas. Solución: El cálculo de estadísticos y las gráficas correspondientes se encontrar en el archivo Excel problema3. Parte a) Ajustar una recta es decir calcular la recta de regresión. Recordamos la formula RR ≡ y − y = COVXY (x − x) vx Por tanto nuestra tarea es calcular los estadísticos Pn • media: x = n1 i=1 xi Pn Pn • Varianza: vx = n1 ( i=1 (xi − x)2 = n1 ( i=1 x2i ) − x21 Pn P • Covarianza COV (X, Y ) = n1 i=1 (xi − x)(yi − y) = n1 ( i=1 xi yi ) − xy 2 Por tanto tenemos que: COV (X, Y ) = −1.13953 , x = 0.46254 , vx = 0.155 , y = 8.8 y la recta de regresión es R.R ≡ 12.3 − 7.588x Para evaluar la bondad del ajuste, calculamos el coeficiente de correlación, r= COV (X, Y ) √ vx vy El único estadístico que nos falta es la varianza de y que es vy = 8.935 . Obtenemos r = −0.986 que es un buen coeficiente de correlación. En efecto vemos en la hoja EXCEL que la recta de regresión aproxima bien los datos. P 1 2 2 un error muy común utilizar la fórmula vx = n ( n i=1 xi − x ) con el mismo error 3 en EXCEl =COVAR(B2:B5;C2:C5) 4 =PROMEDIO(B2:B5) 5 =VAR(B2:B5)*3/4. calcula la varianza dividiendo por n − 1 en vez de n. Por eso el comando que incluimos en la celda es = V AR(B2 : B5) ∗ 3/4 ya que n = 4 6 =COEF.DE.CORREL(B2:B5;C2:C5) 1 Es 2 cuidado 1 Ajustar una exponencial Queremos encontrar una curva de la forma y = aebx = aEXP (bx) (1) que aproxime nuestros datos. Tomamos logaritmos obtenemos que (1) es equivalente a log(Y )7 = log(a) + bx Por tanto si definimos Z = log(Y ) encontar una curva exponencial que aproxime los datos X, Y es equivalente a encontrar una recta que aproxime los datos X, Z. Despues veremos como se relacionan las constantes. Paso 1: Averiguamos los datos de la nueva variable Z. Peso (X) 0.07 0.19 0.52 1.07 Peso (X) log(Y)=Z log(12.5) 0.07 log(10.4) ≡ 0.19 log(7.8) 0.52 log(4.5) 1.07 log(Y)=Z 2, 525728644 2, 341805806 2, 054123734 1, 504077397 Paso 2: Recta de regresión de Z sobre X A partir de aqui calculamos la recta de regresión de Z sobre X. Necesitamos los nuevos estadísticos z = 2.106, vz = 0.149, COV (X, Z) = −0.1494 Con lo que podemos calcular la recta de regresión de Z sobre X R.R = (z − z) = COV (X, Z) (x − x) vx obteniendo la expresión R.R ≡ z = 2.556 − 0, 994966399x Para evaluar el ajuste calculamos el coeficiente de correlación de Z sobre X. r(Z, X) = COV (X, Z) = 0.998 √ vx vz Asi que el ajuste lineal de Z sobre X es excelente y EQUIVALENTEMENTE el ajuste exponecial de Y sobre X tambien lo es. Vemos en la gráfica que los puntos del diagrama de dispersión aparecen sobre la curva. Paso 3: Deshacemos el cambio Z = log(Y ) Sustituimos en la recta de regresión z = log(y) log(y) = 2.556 − 0, 994966399x y tomando exponenciales y = e2.556 e−0,994966399x = 13.021e−0,994966399x cuya representación gráfica viene en problema3. Parte b) 7 usamos log por logaritmo Neperiano ya que a lo largo del curso solo consideramos logaritmos neperianos 2 De el diagrama de dispersión observamos que los puntos parecen ajustables mediante una curva exponencial. Para verificar esta intuición calculamos el ajuste exponencial y el correspondiente coeficiente de correlación. Paso1: Z = log(X) Tiempo (T) Inicio 1 dia 2 dias 3 dias logPeso (X) Tiempo (T) logPeso (X) log(0, 07) Inicio −2, 659260037 log(0, 19) ≡ 1 dia −1, 660731207 log(0, 52) 2 dias −0, 653926467 log(1, 07) 3 dias 0, 067658648 Paso 2: Recta de regresión de Z sobre T Calculamos los estadísticos de nuestra nuevas variables Z 8 y T t = 1.5, vt = 1.25, z = −1, 226564766, vz = 1, 061011276, COV (T, Z) = 1, 148445099 Para evaluar la bondad del ajuste calculamos el correspondiente coeficiente de correlación r(T, L(X)) = 0, 997229765 que es excelente, asi que concluimos que el ajuste exponencial es el correcto. La correspondiente recta de regresión de Z sobre X es R.R ≡ z = −2, 604698885 + 0, 91875608t Paso 3: Deshacemos el cambio Z = log(X) Obtenemos la curva exponencial que predice la evolución de X en función de T igual a. X = 0.074e0.919t (2) Parte c) Queremos predecir la cantidad de nitrato a las 36 horas = 1.5 dias. Recordamos que sabemos predecir aproximadamente como evoluciona el peso en función del tiempo, y el nitrato en función del peso Y = 13.021e−0,994966399x , X = 0.074e0.919t Asi que sustituimos primero X(1.5) = 0.074e0.919∗(1.5) = 0.293 y luego Y (0.294) = 13.021e−0,9949663990.294 = 9, 725816104 Problema 7: En un estudio de laboratorio se han medido, en una cierta especie canina, las variables peso (X) y concentración en sangre (Y ) de una cierta sustancia. Los datos resumidos son los siguientes: P P 2 0 0 Pn=7 0 P x2i = 130 5 P xi = 26 75 7 83 P xi yi = 220 23 P 1yi = 11 P y1 i = 19 yi 0 0 0 = 2 0374 xi = 3 7281 xi = 6 3206 x2 i a) Calcular el coeficiente de correlación entre X e Y . 1 b) Ajustar una curva de ecuación Y = a + b X a los datos. Solución: Parte a) Recordamos la definición de los estadísticos 8 Aunque la llamamos igual no tiene nada que ver con la Z de la parte a 3 • media: x = Pn 1 n i=1 xi Pn 1 i=1 (xi n( Pn − x)2 = n1 ( i=1 x2i ) − x2 Pn • Covarianza COV (X, Y ) = n1 i=1 (xi − x)(yi − y) = • Varianza: vx = • r(X; Y ) = 1 n( P i=1 xi yi ) − xy 9 COV (X,Y ) √ vx vy Obtenemos por tanto como n = 7 n 1X 11.7 13.5 xi = = 1.9286, y = = 1.6714, 7 i=1 7 7 X 22.23 COV (X, Y ) = 1/7( xi yi ) − 1.92861.6714 = − 1.92861.6714 = −0.0477 7 i=1 1X 2 26.75 vx = xi − (1.9286)2 = − (1.9286)2 = 0.1019, 7 7 −0.0477 = 0.7538 vy = 0.0393, r(X, Y ) = √ 0.03930.1019 x= Parte b) Paso 1 1 1 Hacemos el cambio Z = X ya que si y = a + b X obtenemos que Y = a + bZ es decir Z e Y tienen una regresion lineal que es lo que sabemos hacer. Por tanto necesitamos calcular los estadisticos de la nueva variable Z e Y . Paso 2 n 1X 1 11.7 3.7281 = = 0.5326, y = = 1.6714, 7 i=1 xi 7 7 X 1 6.3206 yi ) − 0.53261.6714 = − 0.53261.6714 = 0.0128 COV (Z, Y ) = 1/7( x 7 i i=1 1X 1 2.0374 vz = − (0.5326)2 = 0.00e74, − (0.5326)2 = 7 x2i 7 0.0128 = 0.237410 vy = 0.0393, r(Z, Y ) = √ 0.03930.074 z= Calculamos la recta de regresion de Y sobre Z. R.R = (y − y) = R.R = (y − 1.6714) = COV (Y, Z) (z − z) vz 0.0128 (z − 0.5326) ≡ y = 1.730z + 075 0.074 Deshacemos el cambio Donde pone z volvemos a poner 1/x obteniendo la curva y = 1.730 1 + 0.74 x Ejercicio 8: En cierta especie de pez se mide la longitud total y la de la aleta caudal, obteniendo los siguientes datos: Longitud total (Y) 16 39 Longitud de la aleta (X) 2 2, 5 9 cuidado con el mismo error 4 53 2, 7 81 3 Se cree que existe una relación alométrica entre las dos longitudes. En consecuencia, se pide: a) Expresar la longitud total en función de la longitud de la aleta mediante un modelo de regresión potencial Y = aX b . b) Evaluar el ajuste obtenido. c) Estimar la longitud total de un pez, si su aleta caudal mide 2,3. Solución Los datos correspondientes se encuentran en el archivo ejercicio8 Paso 1: Identificar el cambio de variable apropiado Como en los casos de la regresión logarítmica o exponencial buscamos la manera de transfomar las variables para obtener nuevas variables que se relacionen linealmente. Si Y = abX tenemos que log(Y ) = log(a)+b log(X). Asi que las variables W = log(Y ) y Z = log(X) están relacionads linealmente. Paso 2:Calculo de la recta de regresión de W sobre Z Los nuevos datos son, W=L(Y) Z=L(X) = W Z log(16) log(39) log(2) log(2, 5) 2, 772588722 0, 693147181 log(53) log(2, 7) log(81) log(3) 3, 663561646 3, 970291914 4, 394449155 0, 91629073 0, 993251773 1, 098612289 Calculamos ahora los estadísticos de W, Z Z = 0, 925325494, vz = 0, 022157672, w = 3, 700222859, vw = 0.354, COV (W, Z) = 0, 088588198 Asi que la recta de regresión de W sobre Z es R.R ≡ W = 3.998Z + 0.00069 Paso 3: Deshacemos el cambio W = log(Y ), Z = log(X) Obtenemos que en términos de W y Z la recta de regresión se escribe como Log(Y ) = 3.9998log(X) + 0.00069 o tomando exponenciales (e identificando 3.9998=4) Y = X 4 e0.00069 que es la curva tipo potencial que describe la relación alométrica entre la longitud de la aleta de los peces y su tamaño total. Parte b: Para calcular la validez del ajuste como siempre consideramos el coeficiente de correlacion de las variables donde hemos hecho la regresión lineal. En este caso W y Z obtenemos que r(W ; Z) = COV (W, Z) = 0, 999998252 √ vw vz asi que el ajuste es practicamente perfecto. (El ajuste exponencial no era malo 0.96 pero este es mucho mejor) 5