Capítulo 1 1.1 Teoría de Errores La obtención de información, la utilización de las herramientas computacionales y un criterio importante de cómo seleccionar un método particular para resolver un problema dado, es importante en múltiples ocasiones, es aquí donde es propicio el discutir la Teoría de Errores y observar como perturban los cálculos, afectando la exactitud de nuestros resultados por lo cual es preciso dar un seguimiento primordial, con la finalidad de poder estimar el grado de aproximación de una posible solución. Enseguida mostraremos el tema de Teoría de Errores y su propagación. Tipos de error Errores Indeterministicos, aleatorios o de ruido: Son el resultado de la contribución de numerosas fuentes no controladas que se desplazan al azar (en ambos sentidos, esto es, a favor o en contra), o bien son el valor de la medida aproximada, respecto a su valor real. Esto puede ser debido a variables como; presiones, vibraciones, iluminación, señales de interferencia, en donde no aparece una ley constante, estas no se pueden evitar y para reducir su influencia se recurre a la repetición de las medidas en variadas ocasiones. Errores Determinísticos: Se deben a la presencia de factores que se encuentran dentro de la naturaleza y que no se tienen en cuenta, pero, pueden determinarse mediante leyes, éstos, alteran significativamente el resultado de las observaciones y/o medidas. Entre estos están: Errores sistemáticos, o de escala: Se presentan en diferentes sistemas de medición y no se pueden obviar, en ellos se observa, por una parte errores de precisión debido a la escala de los aparatos y por otra parte, al efectuar la 1 medida, la incertidumbre experimental asociada a un dato o valor de una magnitud. Toda herramienta de medida presenta una limitación en cuanto a la precisión, X*, con la cual podemos obtener una determinada magnitud. La propia escala del instrumento hace imposible apreciar pequeñas variaciones en la medida de un determinado valor. Ejemplo1.1.1: Al medir con una regla de 30 cm. Observamos que las marcas no empiezan inmediatamente en el extremo de ella, limitándonos la precisión con la que pudiésemos verificar la medida. Y si la regla esta mal graduada, obtendremos un valor erróneo en las medidas (ya sea menor que el real o mayor). Este puede descubrirse utilizando otra regla y así comprobar que las mediciones no coinciden. Si queremos medir un tiempo con un cronómetro de agujas y el segundero no esta en el cero de su escala, antes de tomar la medida, podemos atrasar o adelantar una medida sin desearlo. Errores de observación: Debido a la actuación del observador y/o experimentador. Se presentan por no observar bien, el medio ambiente que rodea a un experimento, los instrumentos, ángulos de visión, calibración, etc. Errores algorítmicos: Estos se presentan al manipular los datos con herramientas computacionales. Aquí podemos encontrar una subclasificación como son: Léxicos: Un identificador, palabra reservada u operador mal escrito. Sintácticos: Un programa que no compensa la condiciones del lenguaje de máquina. Ejemplo1.1.2: Expresión aritmética con paréntesis no balanceados, un punto y coma faltante. Semánticos: Un error que requiere información sensible al argumento para ser identificado. Ejemplo1.1.3: Un operador aplicado a un tipo incompatible de operando, accesar una variable no declarada. 2 Lógicos: Aparecen en la ejecución de un algoritmo. Ejemplos1.1.4: Recursión infinita, accesar un arreglo fuera de los límites. Entre estos están los errores de: a)Truncamiento: Los que se deben a la necesidad de dar término a un algoritmo después de un número finito de pasos. b) Redondeo: Que acontecen al querer presentar los resultados en forma finita, generalmente con un número determinado de decimales. En cada uno de los casos anteriores la intención es eliminar este tipo de errores en la medida de lo posible. En los laboratorios, se trabajan con valores numéricos o magnitudes físicas provenientes de diversas fuentes como son: Medidas directas: Valores que se obtienen al efectuar medidas una sola vez, como: medida del Volumen con un vaso de precipitados: 80 mml., o que se repiten varias veces; segundos que transcurren: 51, 49, 50, 50, 49. Medidas indirectas: Son el resultado de operaciones desarrolladas con medidas directas, como, sustancia vertida en una mezcla, distancia recorrida de un objeto con velocidad constante , etc.. En resumen, al realizan medidas u obtención de datos de tablas gráficas o de otra fuente, estos se verán afectados de cierta incertidumbre con una mayor o menor exactitud limitada por los instrumentos de medición, la observación del experimentador. Estos al ser manipulados con una calculadora o computadora, nos proporcionaran, resultados de salida que quizá no coincidan con lo que esperamos. Es de todo esto que, debemos tener mucho cuidado con los errores antes mencionados y de poder elegir un buen algoritmo donde tengamos un procedimiento, paso a paso, que nos proporcione un resultado deseado en un número finito de pasos, como respuesta del modelo matemático planteado a nuestro problema. Es aquí donde podemos efectuar la utilización de los métodos numéricos, que nos darán una buena solución, la que llamaremos, solución numérica a nuestro problema. 3 1.2 Propagación de Errores Si “X ” es el valor real de una medida y “ X* ” el valor aproximado a esta, entonces X – X* o X* – X es una comparación entre ambos. A estas diferencias les llamaremos error. Utilizando la definición de valor absoluto podemos escribir estas expresiones en una sola y si su diferencia es, digamos, E estaremos en posición de definir lo siguiente: Definición 1.2.1 Si “ X ” es el valor real de una medida y “X* ” el valor aproximado, se definimos el error absoluto como: X X X X EA (1.2.1) Definición 1.2.2 Si el error absoluto es dividido entre el absoluto del valor real X, esto es: X X (1.2.2) X el resultado se define como error relativo (ER). Es así como logramos establecer la siguiente relación entre ambos errores: ER EA X X 0 (1.2.3) Lo cual expresa que, el error relativo, es una fracción del error absoluto. Dado esto podemos expresarlo de una forma porcentual y definir con esto el error porcentual como: 4 EP = 100× ER Error Porcentual (1.2.4) Ilustremos estas tres definiciones con el siguiente ejemplo. Ejemplo1.2.1 Se sabe que X = 1.414213562, es el valor real y X* = 1.4142, un valor aproximado o truncado de X, entonces: EA = 1.414213562 - 1.4142 = 1.4142 - 1.414213562 = 0.000013562 ER = EP = 1.414213562 - 1.4142 1.414213562 1.414213562 - 1.4142 1.414213562 = 1.4142 - 1.414213562 ×100 = 1.414213562 1.4142 - 1.414213562 1.414213562 = 0.0000095897802 ×100 = 0.000958978217% Ejemplo1.2.2 Sea X ≈ X* y Y ≈ Y* , si E1 y E2 son los errores respectivos al medir X e Y entonces el error al efectuar las operaciones de suma, producto, cociente entre ambos será: 1.2.2A) (X ± Y) - (X * ± Y * ) = E1 ± E2 1.2.2B) XY - X * Y * = X * E2 + Y * E1 + E1 E2 1.2.2C) X * + E1 X * X X* - * = * Y Y Y + E2 Y * Demostración: 1.2.2 A) Si X X * y Y Y *entonces X X * E1 y Y Y * E2 sumando directamente tenemos X Y X * E1 Y * E2 ya que lo real menos lo medido marca el error , al despejar , X * Y *obtenemos : X Y X * Y * E1 E2 error en la suma o resta 5 1.2.2 B) Si X X * y Y Y *entonces X X * E1 y Y Y * E2 multiplicando directamente tenemos XY X *Y * X * E2 Y * E1 E1 E2 ya que lo real menos lo medido marca el error , al despejar , X *Y *obtenemos : XY X *Y * X * E2 Y * E1 E1E2 X * E2 Y * E1 error en el producto si E1E2 0 1.2.2C ) Si X X * y Y Y *entonces X X * E1 y Y Y * E2 dividiendo directamente tenemos : X X * E1 * Y Y E2 el esquema, de que, lo real menos lo medido marca el error , al restar X* obtenemos : Y* * * * Y * E1 X * E2 Y * E1 X * E2 X X X E1 X * * E2 Y * Y * Y * E2 * 2 Y Y Y E2 Y 1 * Y * * Y E1 X E2 E2 error en el cociente si 0 *2 Y Y* a ambos lados Ejemplo1.2.3: Si X ≈ X* y Y ≈ Y* además E1 y E2 son los errores respectivos al medir X e Y , encuentre el error al efectuar las siguientes operaciones: 1.2.3A) 1.23X + 3.41Y 1.2.3C) 1.2.3.B) 1.23X × 3.41Y 1.2.4D) Solución: 6 1.23X 3.41Y 3.41Y 1.2.3 A) Si X X * y Y Y *entonces X X * E1 y de esto 1.23X = 1.23X * +1.23E1 Y Y * E2 y 3.41Y = 3.41Y * + 3.41E2 sumando directamente tenemos 1.23X + 3.41Y = 1.23X * +1.23E1 + 3.41Y * + 3.41E2 como, lo real menos lo medido marca el error al despejar 1.23X * + 3.41Y * obtenemos : 1.23X + 3.41Y - 1.23X * + 3.41Y * = 1.23E1 + 3.41E2 el resultado final , es el error en la suma. 1.2.3B) Si X X * y Y Y *entonces X X * E1 y Y Y * E2 de esto 1.23X = 1.23X * +1.23E1 y 3.41Y = 3.41Y * + 3.41E2 multiplicando directamente tenemos : 1.23X 3.41Y = 1.23X * 3.41Y * + 1.23X * 3.41E2 1.23E1 3.41Y * + 1.23E1 3.41E2 si lo real menos lo medido marca el error , despejamos 1.23X 3.41Y * * para obtener : 1.23X 3.41Y - 1.23X * 3.41Y * = 1.23X * 3.41E2 + 1.23E1 3.41Y * + 1.23E1 3.41E2 el segundo miembro, es el error en el producto. 7 1.2.3C ) Si X X * y Y Y * entonces X X * E1 y Y Y * E2 de esto 1.23X = 1.23X * + 1.23E1 y 3.41Y = 3.41Y * + 3.41E2 dividiendo miembro a miembro tenemos : 1.23X = 3.41Y 1.23 X * + E1 3.41 Y * + E2 1.23X siguiendo el esquema anterior al restar 3.41Y 1.23X 1.23X 1.23 X + E 1.23X = 3.41Y 3.41Y 3.41 Y + E 3.41Y * * * * * 1 * * * 2 de ambos lados obtenemos : error en el cociente 1.2.3D) Y Y * entonces Y = Y * + E2 de esto 3.41Y = 3.41Y * +3.41E2 aplicando raiz a ambos lados directamente tenemos 3.41Y = 3.41Y * +3.41E2 al restar , a ambos miembros 3.41Y - 3.41Y , 3.41Y = 3.41Y * * * obtenemos : +3.41E2 - 3.41Y = error en la operación * Estas reglas son parecidas a las reglas de derivación en el cálculo diferencial y se deben a lo siguiente. Si podemos expresar a f como una función de una sola variable real x, entonces diremos que y = f(x). Si esta es derivable en un intervalo I(a;b), de acuerdo al teorema de Taylor, podríamos obtener una expansión de esta en dicho intervalo, desarrollándola de la siguiente manera: f ( x x) f ( x) f ( I ) ( x) f ( II ) ( x) 2 x x 1! 2! con x suficientemente pequeño. 8 f ( N ) ( x) N x N! (1.2.5) Enseguida se presentaran algunos errores de propagación para distintas funciones, como lo muestra la tabla 1. FUNCION ERROR ABSOLUTO ERROR RELATIVO X E1 E1 X* X Y E1 E2 cXY c Y * E1 X * E2 E1 E2 X * Y* E1 E2 X * Y* NE1 X* XN X LnX cos X NX * N 1 E1 E1 * 2 X E1 X* E1 sen X * (1.2.7) E1 2 X* E1 X LnX * E1Tan X * * Tabla 1.1 1.3 Algunos conceptos de Estadística Los errores sistemáticos se pueden hacer desaparecer, pero no así los accidentales. En algunas ocasiones será necesario llevar un control estadístico basado en la teoría de probabilidad, el cual nos demuestra que al llevar a cabo una serie de mediciones, estas estarán muy cerca del valor deseado, de esta manera si aumentamos el número de mediciones estaremos más cerca del valor real al utilizar la media aritmética de estas observaciones, esto implica ciertas supuestos como son. 1) Si algún proceso está en funcionamiento en condiciones normales, con reglas ya establecidas, la variación de los resultados en las mediciones de cierta característica se debe sólo a un sistema de Causas Aleatorias, las cuales son inherentes a cada proceso en particular y el número de mediciones tendrá una distribución normal. 9 2) De no ser así y si aparece por alguna otra causa no asignable una desviación en las mediciones diremos que el proceso no es normal o bien que se encuentra fuera de control En cualesquier tipo de control estadístico, estos dos supuestos se consideran permanentemente, de tal manera que si se presentan uno o más resultados que contradigan a los mismos, siempre se dice que el proceso esta fuera de control y el proceso deberá detenerse, para llevar a cabo las correcciones necesarias del mismo. Después de esto se tomaran las mediciones necesarias con las cuales calcularemos el promedio y variación con las formulas conocidas de la teoría de probabilidad: X X i N s X X 2 i N (1.3.1) Es decir, al tener una serie de mediciones con magnitudes, X1, X2, X3,…,XN el valor promedio (más probable) será: N Xi X 1 X 2 X 3 ..... X N i 1 X N N (1.3.2) El cual no coincidirá con e1 valor real, ni con la mayoría de las mediciones hechas. A la diferencia entre cada una de las medidas observadas y el valor más probable se le llama "desviación", la cual podrá ser mayor, igual o menor que cero: di Xi X X Xi (1.3.3) también se define a la desviación media, como la media aritmética de los valores absolutos de las desviaciones respecto a la media aritmética de la siguiente manera: DM di N X i X (1.3.4) N dado que una de las propiedades de la desviación es que la suma total de estas siempre es cero, por lo regular se utiliza la suma de los cuadrados de 10 las desviaciones en promedio, a esto se le conoce como desviación típica, obteniendo la siguiente fórmula: s d 2 N (1.3.5) en donde d, es la diferencia entre los valores obtenidos y el verdadero. Esta ecuación tiene algunos inconvenientes cuando el número de mediciones es pequeño (menor de 30 según la teoría de pequeñas muestras), y si el número de mediciones es solo una, llega incluso a un absurdo. Es de esto que en algunas situaciones se aplique la fórmula siguiente: s d 2 N 1 (1.3.6) Ejemplo1.3.1 Una muestra de cinco medidas de diámetros de CD para computadora fabricados por cierta empresa son los siguientes: 12.01 cm., 11.98 cm., 11.99 cm., 12.02 cm., 11.99 cm. Encuentre la media, desviación media y desviación típica de estos datos. Valores ∑ 12.01 11.98 11.99 12.02 11.99 59.99 Media 11.998 d=Xi-Media d d2 0.012 -0.018 -0.008 0.022 -0.008 0 0.012 0.018 0.008 0.022 0.008 0.068 0.000144 0.000324 0.000064 0.000484 0.000064 0.00108 Tabla 1.2 X = (12.01+11.98 +11.99 +12.02+11.99)/5 = 59.99/5 = 11.998 DM = 0.068/5 = 0.0136 cm. s= (12.01- 11.998) +(11.98 - 11.998) +...+(11.99 - 11.998) /(5 - 1) = 2 2 2 = 0.00108/4 = 0.016431676 cm. 11 PROBLEMAS CAPITULO I 1.-Si X 1.37 e Y 4.02 encuentre el error, al efectuar las siguientes operaciones. Sea E1 el error al medir X, y E2 el error al medir Y. a) 0.1 X + 0.3 Y b) 0.1X 0.3Y c) (0.1X) (0.3Y) d) e0.1X 2.- En cada caso encuentre el error que se pide si E1 , E2 , E3 es el error en las medidas aproximadas de X , Y , Z . X 1.25 Y 0.33 Z 2.34 encuentre el error al efectuar: a) 2.23 X + 1.01Y b) (2.23X)/(1.01Y) c) (1.01X) ( 1.23Y) d) (2.23X)(1.01 Y) e) 1.01X + 1.23Y + 2.35Z f) (1.23X)½ 3.- Si X 1.07 e Y 2.05 encuentre el error al efectuar las siguientes operaciones, si E1=0.01 es el error al medir X, E2=0.02 el error al medir Y. a) 0.3 X + 1.1 Y b) 0.3 X 0.1Y c) (0.3X) (0.1Y) d) e0.3X 4.- Una expansión en series de Taylor para aproximar ex es la siguiente serie infinita x2 x3 xn x e 1+ x+ + +...+ 2! 3! n! si el valor de e2 ≈ 7.3891 calcule el valor de e2 si: a) Se toman tres términos de la serie b) Se toman cuatro términos de la serie Encuentre además el error absoluto y relativo en cada caso. 5.- Una expansión en series de Taylor para aproximar sen x es la siguiente serie infinita x3 x5 x7 x 2n+1 senx x - + - +...+ para n 1, 2,3,... 3! 5! 7! (2n+1)! 12 si el valor de sen(/4) ≈ 0.70711 calcule el valor de sen(0.7854) si: a) Se toman tres términos de la serie b) Se toman cuatro términos de la serie Encuentre además el error absoluto y relativo en cada caso. 6.- Utilizando las aproximaciones de e2 y sen(0.7854) y las expansiones del ejercicio 4 y 5 efectúe el cálculo de: e2 sen(0.7854) a) Si se toman tres términos de las series b) Si se toman cuatro términos de las series Encuentre además el error absoluto y relativo en cada caso. 3.218x + 0.1543 obtenga f(1) y f(1.01), además encuentre 0.6995x + 0.0129 el error absoluto y relativo entre ambas evaluaciones. 7.- Sea f(x) = 8.- El Volumen de un cilindro circular recto es construir uno, con r = 4 m h = 8 m. El costo por 32.50 dólares, con el espesor especificado para entregarse, las dimensiones de este fueron r = 4.01 m cantidad vario el Volumen respecto al original y porcentual del costo, en la fabricación. Vc r 2h . Se desea metro cuadrado es de su construcción. Al y h = 7.99 m. En que cual fue la variación 9.- Efectúe las siguientes operaciones a) 3.41 + 0.2792 b) 0.2792 × 216 c) ( 314 + 0.7826) – (137 + 4.2887) d) (0.0189 – 1) × (0.0189 + 1) i) exactamente ii) truncando el número y trabajando a 2 decimales iii) redondeando a 3 decimales. Además determine en cada caso el error absoluto y relativo. 10.- Si f(x) = sen x – x + x3 evalúe f(0) y f( 0.001) encontrando el error absoluto y relativo. 13 Capítulo 2 Solución de Ecuaciones Algebraicas 2.1 Teoría de un Método Iterativo Un evento importante en nuestros días es el avance que ha tenido la ciencia y tecnología, en particular, el surgimiento de herramientas como son los ordenadores computacionales ha facilitado la solución de problemas provenientes de fenómenos físicos, planteados mediante modelos matemáticos. Dentro de los problemas que se presentan con mayor frecuencia, es el tratar de resolver una ecuación de la forma f(x) = 0 (2.1.1) es decir, calcular el(los) valor(es) de x para el(los) cual(es) se verifica f(x)=0 siendo f una función continua, la cual puede ser una expresión polinomial o algebraica de grado “n” o bien una función polinomial combinada con una 14 trascendente. El hallar la solución de la ecuación (2.1) puede transformarse en el de hallar la solución de una ecuación de la forma F(x) = x. Esta última ecuación se obtendrá reajustando o transformando, de alguna manera, la ecuación original, por ejemplo si f(x) = 2 ½ la transformamos en f(x)2 = 2 de donde f(x)2 – 2 = 0, construyendo así F(x) = x2 - 2 , la cual es una expresión equivalente. Una buena transformación de una función nos puede garantizar la existencia del valor buscado y a su vez nos proporcionara un método de aproximación a la solución. En este capitulo estudiaremos diferentes procedimientos para tratar de encontrar solución a este tipo de problemas, los analizaremos y trataremos de elegir el mas eficiente y de esta manera lograr nuestro objetivo. Definición 2.1.1 Al procedimiento sistemático, para solucionar un problema de manera eficaz, utilizando una serie de reglas lógicas que nos permitan alcanzar nuestro objetivo le llamaremos Algoritmo. El hablar de eficiencia no es simple, ya que en un algoritmo, tratar de especificar un número finito de instrucciones bien definidas, que provoquen una solución concreta a un problema en muchas ocasiones no es fácil, ya que estas se deben elaborar, sin dar lugar a equivocaciones o errores en su ejecución. Un algoritmo debe ser: Sistemático: para definir de manera precisa todos los posibles casos presentes dentro del problema. Prescriptivo: para asegurar que este terminará, en un número finito de pasos. Bien Condicionado y Efectivo: para llegar a la solución que nos satisfaga en un periodo de tiempo finito. Por lo general los algoritmos que exhibiremos en este libro son de carácter numérico, con procedimientos detallados, concretos y de cierto modo demostrados de una manera práctica, en algunos casos. Tendremos en cada caso datos de entrada, instrucciones matemáticas que ejecutar, mediante un cálculo numérico, resultados básicos de salida, los cuales presentaran cierto tipo de sucesiones, que en algunos casos son recurrentes y en otros no, en 15 donde al evaluarse de manera repetitiva pueden o no aproximarse a un valor determinado. En muchas ocasiones la solución no es solo un valor numérico o cantidad sino una función o una correspondencia entre valores numéricos, debido a que la solución no dependerá de una fórmula ya que con esta, logramos una solución exacta. La razón del método numérico radica en dar solución al tipo de problemas en los que se conoce con precisión las leyes que gobiernan los procesos, pero que al querer solucionar el modelo matemático que se presenta en esas situaciones es de difícil acceso para las matemáticas tradicionales. Tal es el caso de querer encontrar el área entre dos curvas como f(x) = ex y g(x) = 4 – x2 (2.1.2) ya que encontrar los valores del intervalo de integración no es sencillo, es así como utilizaremos algún método numérico para poder obtener una solución aproximada a la solución real. Si las variables o incógnitas que intervienen en una ecuación, al tomar valores determinados y ser sustituidos en ella provocan que la expresión del lado izquierdo del signo de igual sea el mismo que el del lado derecho del signo de igual, decimos que la ecuación ha quedado satisfecha, o bien que esos valores son solución de esta. Una ecuación entera racional tiene la forma: anxn + an-1xn-1 + … +a2x2 + a1x1 + a0 = 0 (2.1.10) donde coeficientes an, an-1, …, a2, a1, a0 son constantes, y “n” entero positivo. Al mayor exponente de la variable que interviene en la ecuación, le llamaremos grado de la ecuación. Cuando el exponente “n” es 1, 2, 3 se conoce a las ecuaciones como: de primer grado o lineales, de segundo grado o cuadráticas, de tercer grado o cúbicas, respectivamente. Un polinomio de grado positivo “n” en la variable “x” es una función de “x” que expresaremos como: f(x) = anxn + an-1xn-1 + … +a2x2 + a1x + a0 16 (2.1.11) donde coeficientes an, an-1, …, a2, a1, a0 son constantes, “n” entero. De esta manera decimos que f(x) = 0 es una ecuación racional entera de grado “n” en la variable “x”. El valor x que anule f(x) recibirá el nombre de raíz de la ecuación f(x)= 0. Si f(x) = 4 - x2, dos raíces serian: x 2 , ya que, f(± 2) = 0 Otros tipos de expresiones se muestran el la tabla 2.2 Expresiones x 3 x 1 x 2 sen2 x + 3sen x = 1 2x + x2 = 1 3log x + 4(log x)2 = 7 Nombre Algebraica Trigonométrica Exponencial Logarítmica o Logística Tabla 2.2 Teorema 2.1.2 (Teorema del Residuo o Resto) Si “r” es una constante independiente de “x” y el polinomio f(x) es dividido por (x-r), el residuo que se obtiene es igual a f(r). Ejemplo 2.1.2 Sea f(x) = x3 – 2x2 +2 x + 2 y dividámoslo por (x-1), donde r = 1 f(1) = (1)3 - 2(1) + 2(1) + 2 = 3 de aquí que: (x3 - 2 x 2 + 2x + 2)/(x - 1) = P(x) + 3/(x - 1) con P(x) es un polinomio de grado n-1. Teorema 2.1.3 (Teorema del factor o divisor) Si r es una raíz de la ecuación f(x) = 0, es decir f(r) = 0, el binomio (x-r) es un factor de f(x). Recíprocamente, si (x-r) es un divisor de f(x) el número r es una raíz de la ecuación f(x) = 0, esto es , f(r) = 0. Si f(x) = x3 – 4x2 + x + 6 observamos que r = 2, -1, 3 son raíces ya que: f(2 )= f( –1) = f(3) = 0 17 por consiguiente (x – 2), (x + 1) y (x – 3) son factores o divisores de f(x) = x3 – 4x2 + x + 6 . Teorema 2.1.4.(Teorema fundamental del álgebra) Toda ecuación racional entera f(x)=0 admite al menos una raíz, ya sea real o compleja. Teorema 2.1.5. Toda ecuación racional entera f(x) = 0, de grado “n”, tiene exactamente “ n” raíces. Teorema 2.1.6 Si a + bi es raíz de una ecuación entera f(x) = 0, entonces su conjugado a – b i, también es raíz de la ecuación. Corolario 2.1.1 Si f(x) es una ecuación racional entera, con coeficientes reales y de grado impar, esta debe tener al menos una raíz real. Teorema 2.1.7 Si a + b es raíz irracional de una ecuación entera f(x)=0, entonces su conjugado irracional a b , también es raíz de la ecuación. Al ordenar los términos de f(x) en potencias decrecientes de x, diremos que se originó una variación de signos cuando dos términos consecutivos sean de signo opuesto. Para saber el número de raíces positivas o negativas se emplea la siguiente regla: Teorema 2.1.8 (Regla de los signos de Descartes) El número de raíces positivas será el número de variaciones de signo de f(x) o bien este número, menos un entero par. El número de variaciones de signo de f(-x) nos dará el número de raíces negativas de f(x) o bien este menos un entero par. Ejemplo 2.1.3 18 Dado el grado del siguiente polinomio, este debe tener 7 raíces y analizándolo con la regla de los signos de Descartes tenemos: f(x) = x7 – 3x6 + 5x5 – 3x4–2x3 – x2 + 5x + 4 f(-x) = – x7 – 3x6 – 5x5 – 3x4+ 2x3 – x2 – 5x + 4 dándonos como posibilidad de raíces, lo que se muestra en la tabla 2. 3. Positivas 4 2 0 4 2 0 Negativas 3 3 3 1 1 1 Complejas 0 2 4 2 4 6 Tabla 2.3 Si f es una función continua en el intervalo I[a;b], encontrar los valores de x tales que f(x) = 0, consiste en hallar las intersección de y = f(x) con el eje x, en ente caso encontrar r1, r2, r3,….. Un hecho fundamental en este tema es de que si f(a) y f(b) son de signo contrario, f(x) = 0 tiene por lo menos una raíz, en este intervalo, como lo muestra la figura 2.1. a r1 r2 b r3 Fig. 2.1 En genaral, el problema consiste en aislar las raices (si existen), examinando subintervalos [a1,b1], [a2,b2]...., en los que existe una y sola una raíz. Una 19 vez que logremos esto, trataremos de aproximarla con una cierta precisión, la cual fijaremos, dependiendo de nuestro propósito. 2.2 Método de Bisección El primer procedimiento numérico que estudiaremos es el de dividir el intervalo en mitades, conocido como método de bisección, de Bolzano, bipartición, o dicotomía. Para esto, debemos conocer los valores de x0 y x1 tales que f(x0) y f(x1) tienen signos opuestos, o bien, f(x0) f(x1)<0, la cual será una condición fundamental en este y otros algoritmos para encontrar raíces en un intervalo.. Por al teorema de valor intermedio, se tiene que f(x) = 0 tendrá una solución en I[x0 ; x1] si f(x0) f(x1)<0. De esta manera obtenemos el punto medio de este intervalo, como se muestra enseguida: x x x2 1 0 (2.2.1) 2 evaluaremos a f(x) en x = x2 , de la siguiente manera: x x f ( x2 ) f 1 0 2 Si al evaluar f(x2) , f(x) se anula, esto es f(x2) = 0, x2 será raíz de f(x) y habremos terminado el proceso. Si esto no sucede, continuamos particionando el intervalo inicial en dos, estimando una raíz hasta un nivel de precisión previamente especificado, evaluando así una sucesión de valores f(xn+1 ) , donde: xn xn 1 con f ( xn ) f ( xn 1 ) 0 2 La figura 2.2 muestra el inicio del algoritmo. xn 1 20 (2.2.2) f x2 x0 x1 r Fig. 2.2 Considérese siguiente ecuación f(x) = x3 – x2 – 3 x – 3 = 0. Si x = 2 f(2)= –5, si x = 3, f(3)= +6. Aquí la condición f(2)f(3)<0 se cumple y como la función es continua, el cambio de signo de la función entre x = 2 y x = 3 garantiza al menos una raíz en el intervalo (2, 3). Si ahora se evalúa la función en el punto medio, esto es f( 2.5) = –1.125 y se compara el resultado de esta evaluación con las evaluaciones en x = 2 y x = 3. Observamos que hay un cambio de signo entre f(2.5) y f(3). Puesto que la función cambia de signo entre x = 2.5 y x = 3, una raíz cae dentro de estos valores. Se puede, indiscutiblemente, continuar este proceso, obteniendo mitades de intervalos para determinar intervalos cada vez más pequeños dentro de los cuales se encuentra la raíz. La figura 2.3 muestra la grafica de esta función. y x Fig. 2.3 21 Ejemplo 2.2.1 Aplicando el método de bisección a f(x) = x3 – x2 – 3 x – 3 para encontrar una de sus raíces en el intervalo de [2 ; 3] obteniendo así la tabla 2 4: n xn-1 xn xn+1 f(xn+1) 1 2 3 4 5 6 7 8 … 15 30 31 2 2.5 2.5 2.5 2.5625 2.59375 2.59375 2.59375 … 2.598632813 2.598674506 2.598674507 3 3 2.75 2.625 2.625 2.625 2.609375 2.6015625 … 2.598693849 2.598674508 2.598674508 2.5 2.75 2.625 2.5625 2.59375 2.609375 2.6015625 2.59765625 … 2.598663331 2.598674507 2.5986745075 –1.125 1.984375 0.322265625 –0.4274902344 –0.0592346191 0.1298484802 0.0348916054 –0.0122751594 … –0.0001348145 –0.0000000106 –0.0000000046 Tabla 2.4 Obsérvese que, si la función es discontinua, f(x) puede cambiar de signo, y no tener raíz en el intervalo. Las funciones desconocidas deben de analizarse y comprobar su continuidad antes de hacer uso de este u otro método. Este método, no solo se limita a polinomios como veremos enseguida. Ejemplo 2.2.2 Aplicando el método de bisección a f(x) = 4x + 5 senx - e2x para encontrar una de sus muchas raíces en el intervalo de [0 ; 1] obtenemos la tabla 2.5: n 1 2 3 4 5 6 7 8 … 15 22 xn-1 0 0 0 0.125 0.125 0.125 0.140625 0.14844375 xn 1 0.5 0.250 0.250 0.1875 0.15625 0.15625 0.15625 0.150390625 0.15045166 xn+1 0.5 0.250 0.125 0.1875 0.15625 0.140625 0.1484375 0.15234375 f(xn+1) 1.678845865 0.5882985256 –0.1606517490 0.2270250692 0.0362370227 –0.061474897 –0.124321037 0.119496367 0.150421142 –0.0000390218 30 0.150427393 0.150427395 0.150427394 0.0000000002 31 0.150427393 0.150427394 0.1504273935 –0.0000000029 Tabla 2.4 Después de 30 iteraciones xn+1 = 0.150427394 se aproxima a la raíz de la función con un error estimado de: xn+1 - x30 < x31 - x30 = 0.150427393 - 0.150427394 = 0.000000001 x31 - x30 x30 = 0.150427393 - 0.150427394 0.150427394 = 6.64772534715× 10 -9 esto quiere decir que la aproximación es correcta a 8 cifras significativas dándonos el valor de la raíz con nueve cifras significativas de xn+1 = 0.1504273935. 2.3 Método de Interpolación Lineal El método de bisección es analíticamente llano, sin embargo, no es muy eficaz para la mayoría de las funciones, pero se puede optimizar la rapidez o razón de convergencia del valor buscado mediante otros procedimientos. Uno de estos métodos, es el de interpolación lineal, también llamado método de falsa posición, o regula falsi. Supóngase que la función es lineal sobre el intervalo I[x0, x1] en donde f(x0) f(x1)<0 esto es f(x0) y f(x1) son de signo opuesto. Si x0 , x1 son utilizados como aproximaciones al cero que buscamos, esperamos que una mejor aproximación sea la intersección de la recta que pasa por los puntos (x0, f(x0)) y (x1, f(x1)) con el eje X. El valor de la abscisa podemos encontrarlo como lo muestra la figura 2.4 R Q C=xr O A=x0 B=x1 P 23 Fig.2.4 Por semejanza de triángulos tenemos que: RQP CBP de esto se tiene: PQ PB RQ CB de donde: RQ PB así una aproximación de la raíz será OC OB CB PQ si OC xr OB x1 RQ x1 x0 PB f ( x1 ) PQ f ( x1 ) f ( x0 ) CB xr x1 ( x1 x0 ) f ( x1 ) f ( x1 ) f ( x0 ) (2.3.1) simplificando tenemos x0 f ( x1 ) x1 f ( x0 ) (2.3.2) f ( x1 ) f ( x0 ) a (2.3.2) se le llama fórmula de interpolación lineal y a xr interpolación dentro del intervalo [x0,x1] xr Ejemplo 2.3.1 Aplicado el método de interpolación halle, en el intervalo [2;3], la raíz de f(x) = x3 – x2 – 3 x – 3. Con x0=2 , f(x0) = -5, x1 = 3 y f(x1) = 6 obtenemos la tabla 2.6: n 0 1 2 3 4 5 … 11 12 13 14 Tabla 2.6 24 xr 2.454545455 2.569395018 2.592960407 2.59756836 2.598460715 2.598633199 … 2.598674506 2.598674507 2.598674508 2.598674508 f(xr) -1.600300526 -0.347367530 -0.068701647 -0.013334016 -0.00257845038 -0.0004982507 … -0.00000002626 -0.00000000535 -0.00000000127 -0.00000000038 Ejemplo 2.3.2 Aplicado el método de interpolación encuentre, en el intervalo [0;1], la raíz de f(x) = 4x + 5 senx - e2x Con x0 =0 , f(x0) = -1, x1 =1, f(x1) = 0.8182988251, iniciamos obteniendo así la tabla 2.7. n 0 1 2 3 4 5 6 7 8 9 xr 0.549964607 0.195773352 0.153373031 0.150608098 0.150438438 0.150428068 0.150427435 0.150427396 0.150427394 0.150427394 f(xr) 1.809190327 0.276452257 0.018358461 0.0012776893 0.00006893584 0.00000421249 0.00000025738 0.00000001573 0.00000000095 0.00000000006 Tabla 2.7 Si confrontamos las dos tablas anteriores, se puede observar una diferencia en el número de iteraciones para la convergencia del método de la interpolación. Si f(x) posee una curvatura pronunciada entre x0 y x1, provocará una velocidad de convergencia diferente para aproximarse a la raíz. Si en lugar de requerir que la función tenga signos opuestos en los dos valores utilizados para la interpolación, escogemos los dos valores más cercanos a la raíz, e interpolamos o extrapolamos a partir de estos. De primera mano los valores más próximos a la raíz serán los dos últimos valores calculados. A este método se le da el calificativo de Método de la Secante. 25 2.4 Método de la Secante Proveniente del método de Interpolación o Regula Falsi. Su diferencia reside en la no exigencia de localizar en cada paso a la raíz en uno de los dos subintervalos. Inicia con los valores de x0 y x1 y vamos construyendo una sucesión de valores aproximados a la raíz, utilizando para esto la siguiente fórmula recursiva: xn+1 = xn-1 f(xn ) - xn f(xn-1 ) f(xn ) - f(xn-1 ) para n 1, 2,3,... (2.4.1) los cuales dan los sucesivos puntos de corte de las secantes que pasan por los puntos (x0, f(x0)) y (x1, f(x1)),…, (xn-1,f(xn-1), y (xn , f(xn)) , sin preocuparnos si en los subintervalos [x0, x1],…, [xn-1, xn] , esta, o no, la raíz buscada. Este método es sencillo de utilizar, aunque a veces no converge. Ejemplo 2.4.1 Aplicando el método de la secante encuentre, en el intervalo [2;3], la raíz de f(x) = x3 – x2 – 3 x – 3. Si damos inicio al algoritmo con los siguientes valores: x0 = 2, f(x0) = -5, x1 = 3 y f(x1) = 6 , obtenemos la tabla 2.8: n x0 x1 xr f(xr) 0 1 2 3 4 5 6 2 3 2.454545455 2.569395018 2.601236313 2.598631772 5.298674446 3 2.454545455 2.569395018 2.601236313 2.598631772 5.298674446 5.598674508 2.454545455 -1.600300521 2.569395018 -0.347367529 2.601236313 0.030945056 2.598631772 -0.0005154671 5.298674446 -0.0000007466 5.598674508 0.0000000012 2.598674508 -0.00000000014 Tabla 2.8 Ejemplo 2.4.2 Aplicado el método de la secante encuentre, en el intervalo [0;1], la raíz de f(x) = 4x + 5 senx – e2x 26 Con x0=0, f(x0) = –1 , x1=1 y f(x1) = 0.8182988251 obtenemos la tabla 2.9 n 0 1 2 3 4 5 6 7 8 9 10 11 x0 0 1 0.549964607 1.371648594 0.763567854 0.927868619 1.294537306 1.031798408 1.068707818 1.086990751 1.085238359 1.085288829 x1 1 0.549964607 1.371648594 0.763567854 0.927868619 1.294537306 1.031798408 1.068707818 1.086990751 1.085238359 1.085288829 1.085288981 xr 0.549964607 1.371648594 0.763567854 0.927868619 1.294537306 1.031798408 1.068707818 1.086990751 1.085238359 1.085288829 1.085288981 1.085288981 f(xr) 1.809190325 -5.150360791 1.906819293 1.31678183 -3.328880116 0.544069782 0.180227745 -0.019105831 0.00056657906 0.00000169715 -0.00000000312 0.00000000012 Tabla 2.9 En esta última tabla se observa que el método converge fuera del intervalo señalado, encontrando así, otra raíz de f(x) , pero si cambiamos el intervalo de inicio, digamos [0 ; 0.5] podemos encontrar la raíz deseada en 7 iteraciones, lo cual dejaremos que el lector ejecute. 2.5 Método de Newton-Raphson Como ya se ha explicado, el problema de encontrar la solución de la ecuación f(x) = 0 en un intervalo I[a, b] puede transformarse en el de hallar el único punto fijo de una aplicación contractiva F. Esta función F puede elegirse de distintas formas. Suponiendo que la función f continua en I[x0, x1] y continuamente diferenciable en dos ocasiones en dicho intervalo, esto es, f C 2 x0 , x1 . Sea x* x0 , x1 una aproximación de la raíz tal que 27 f’(x*) 0 cuando x x* 0 . Es decir, f(x0) y f(x1) es derivable, una condición suficiente, para que la aplicación F sea contractiva en el intervalo [x0, x1] es que, |F’| ≤ c < 1 en el mismo intervalo. Si consideramos una expansión en series de Taylor para f(x) alrededor de xn, tenemos: (x - xn )2 f ( x) f ( xn ) ( x xn ) f ´( xn ) f ´´( ( x)), con xn ( x) x 2 dado que f(x) =0 y si x = xn+1 , tenemos: 0 f ( xn ) ( xn1 xn ) f ´( xn ) (xn+1 - xn )2 f ´´( ( xn1 )), con xn ( x) xn1 2 si consideramos que el término, ( x x* )2 0 , de esto obtenemos que: 0 f ( xn ) ( xn1 xn ) f ´( xn ) y despejando xn+1 , se consigue: xn1 xn f ( xn ) f ´( xn ) (2.5.1) a esta fórmula recursiva la llamaremos Método de Newton Raphson l método de Newton-Raphson, consiste en iniciar con un valor x0 próximo a la solución (una solución aproximada) y mejorar su aproximación por medio de la fórmula recursiva (2.5.1), deteniendo el proceso cuando, en dos de los valores consecutivos no se diste una diferencia. Comenzando a partir de una estimación inicial que esta lejos de la raíz, x0, se extrapola a los largo de la tangente hasta su intersección con el eje x, y se le toma esa como la siguiente aproximación. Esto se continúa hasta que los valores sucesivos de x están lo suficientemente cercanos, o el valor de la función sea lo suficientemente próximo a 0. El algoritmo de Newton se utiliza ampliamente debido a que, al menos en la vecindad cercana a la de la 28 raíz, converge más rápidamente que cualquiera de los métodos anteriores. Este método es cuadraticamente convergente, es decir, que el error en cada paso se aproxima proporcionalmente al cuadrado del error del paso anterior. Ejemplo 2.5.1 Aplicado el método de Newton Raphson halle, en el intervalo [2;3], la raíz de f(x) = x3 – x2 – 3 x – 3. Inicie con a) x0 = 2 , b) x0 = 5, Sol: La fórmula recursiva quedaría de la siguiente forma xn3 xn2 3xn 3 xn+1 = xn 3xn2 2xn 3 con la cual generamos la tabla 2.10: a) n 0 1 2 3 4 5 6 xn+1 2 3 2.6666 6666 7 2.6011 3960 1 2.5986 7792 5 2.5986 7450 8 2.5986 7450 8 b) n 0 1 2 3 4 5 6 xn+1 5 3.6774 1935 5 2.9435 0256 1 2.6507 0976 2 2.6001 3671 5 2.5986 7571 1 2.5986 7450 8 Tabla 2.10 Ejemplo 2.5.2 Aplicado el método de la Newton Raphson encuentre, en el intervalo [0;1], la raíz de f(x) = 4x+ 5 senx - e2x inicie en a) x0=0 , b) x0 = 1, c) x0 = -3 Con los valores dados y la fórmula recursiva 4xn + 5senxn - e 2xn obtenemos la siguiente tabla 2.11: xn+1 = xn 4 + 5cosxn - 2e2xn a) n 0 1 2 3 4 5 xn+1 b) n xn+1 c) n xn+1 0 0 1 0 -3 0.142857142 1 1.101317232 1 -16.30800377 0.150399712 2 1.08572591 2 -509.4085048 0.150427393 3 1.085289317 3 -268.1919809 0.150427394 4 1.085288981 4 269.1940722 0.150427394 5 1.085288981 5 Over flow Tabla 2.11 29 Cotejando estos resultados, vemos que el método de Newton en a) converge más rápidamente que los métodos anteriores, pero si iniciamos con otros valores, como en el inciso b), obtuvimos otra raíz o incluso el método puede no converger como lo muestra el inciso c). Si f(xn) es una función algo rara y el cálculo de f’(x n), se hace complicado, f ( x0 h) f ( x0 ) podemos hacer f’(xn)f’(x0), o bien hacer uso de f ´( x0 ) h con h lo suficientemente pequeño. 2.6 Aplicaciones En la actualidad podemos acudir a la utilización de diferentes herramientas matemáticas para obtener con lujo de detalles las raíces de ecuaciones polinomiales y no polinomiales mediante diferentes tipos de software para computadoras y calculadoras programables. Herramientas como el Maple, Matlab, Matemática, Derive, Winplot entre otros nos pueden auxiliar al tratar de encontrar raíces de este tipo de ecuaciones. El algoritmo de Newton Raphson y los teoremas antes mencionados son de gran ventaja para encontrar raíces de ecuaciones racionales enteras f(x)=0 y no racionales . Enseguida presentaremos algunos ejemplos para este algoritmo y haremos uso de los teoremas antes mencionados para analizarlos. 30 Ejemplo 2.6.1 Estimar el o los puntos de intersección de las ecuaciones (2.1.2). Sol: Las ecuaciones 2.1.2 son f(x) = ex y g(x) = 4 – x2 . Si deseamos encontrar los puntos de intersección hacemos f(x)=g(x), esto es, ex = 4 – x2 para construir la función 4 – x2 – ex = 0 = F(x). Haciendo uso del método de Newton Raspón, escribimos la siguiente fórmula recursiva 2 4 xn e xn xn 1 xn para obtener la tabla 2.12 e xn 2 xn n 0 1 2 3 4 xn+1 1 1.059707788 1.058007813 1.058006401 1.058006401 n 0 1 2 3 4 5 6 xn+1 -1 -2.612699837 -2.049908486 -1.966588005 -1.964636673 -1.964635597 -1.964635597 Tabla 2.12 Ejemplo 2.6.2 Encontrar el área entre las dos curvas del ejemplo 2.6.1 Solución: Graficando estas ecuaciones como la muestra la figura 2.5 y x Fig. 2.5 encontrar el área entre las dos curvas, es calcular la siguiente integral g(x) - f(x) dx = b b a a (4 - x 2 ) - e x dx 31 con a = -1.964635597 y b = 1.058006401 obteniendo como respuesta 6.42768737646 u2. Ejemplo 2.6.3 Analicemos el Ejemplo 2.1.3 f(x) = x7 – 3x6 + 5x5 – 3x4–2x3 – x2 + 5x + 4 La grafica se muestra en la figura 2.5 y x Tal como se puede observar, la gráfica tiene un solo corte en el eje x, lo Fig. 2.5 cual verifica el Corolario 2.1.1 por ser de grado impar, esto quiere decir que las 6 raíces restantes, son complejas y si encontramos una raíz irracional o una compleja sus conjugados también lo serán. Con el método de Newton Raphson encontraremos sus raíces inicializando con diversos valores y utilizando la siguiente fórmula recursiva. 7 xn+1 = xn - 6 5 4 3 2 xn - 3xn + 5xn - 3xn - 2xn - xn + 5xn + 4 6 5 4 3 2 7xn - 18xn + 25xn - 12xn - 6xn - 2xn + 5 Iniciando con x0 = 1 + i obteniendo así la tabla 2.13 n 0 1 2 3 4 xn-1 1+ i 0.800000000000 1.36621111928 1.17732052917 1.22515891306 9 1.44878699485 10 1.44878699485 32 + 0.400000000000 i - 1.03970609846 i - 0.759671966446 i - 0.378076991412 i - 0.50206536019 i - 0.50206536019 i Tabla 2.13 De donde 1.44878699485 + 0.50206536019 i también es raíz. Iniciando con x0 = i obtenemos la siguiente tabla 2.14 n 0 1 2 3 4 xn-1 i -0.062983425414 -0.451994829394 -0.475382417798 1.10631496995 + + - 0.603314917127 i 0.293260379514 i 0.398677368133 i 0.048577055275 i 29 0.847433463453 + 1.72630174167 i 30 0.847433463453 + 1.72630174167 i Tabla 2.14 De donde 0.847433463453 - 1.72630174167 i también es raíz. Iniciando con x0 = – 1 – i obtenemos la tabla 2.15 n 0 1 2 3 4 -1- i -0.811626331671 -0.661381033387 -0.547822892126 -0.491084105873 xn-1 7 8 -0.490880755114 - 0.715799194375 i -0.490880755114 - 0.715799194375 i - 0.854362953384 i 0.747465098359 i 0.695948073145 i 0.706221115956 i Tabla 2.15 De donde – 0.490880755114 + 0.715799194375 i , también es raíz. Por último si iniciamos con x0 = 1 obtenemos la última raíz, la raíz real –0.616079406381, la cual dejamos para ser comprobada por el lector. La convergencia del método de Newton Raphson, podemos dilucidarla como un método de búsqueda de punto fijo, es decir, un medio iterativo que consiste en transformar algebraicamente la ecuación que se presenta como f(x) = 0, de la cual se desea hallar una solución, llevándonos a una ecuación semejante de la forma F(x) = x, como se ilustro en el ejemplo 2.6.1. 33 PROBLEMAS CAPITULO II 1.-Por los métodos de bisección, interpolación encuentre la raíz aproximada de cada una de las siguientes ecuaciones en el intervalo que se especifica y resuelva por el método de Newton-Raphson inicializando, cada uno de ellos en el extremo izquierdo del intervalo dado. 1) ƒ(x) = ex – x2 – 3 (1 ; 2) 8) ƒ(x) = x2 sen x – cos x (0 ; 1) 2) ƒ(x) = (x – 2)ex – 3 (2 ; 3) 9) ƒ(x) = x5 + x2 - 9 (1 ; 2) 3) ƒ(x) = x3 – 5x + 1 (0; 1) 10) ƒ(x) = x5 – 75 (2 ; 3) 4) ƒ(x) = x4/3 – 3 (2 ; 3) 11) ƒ(x) = x3 – 3x – 3 (2 ; 3) 5) ƒ(x) = x3 – 3x – 1 (-2 ; -1 ) 12) ƒ(x) = x6 + 7x2 – 4 (0;1) 6) ƒ(x) = 2x – cos x (0 ; -1 ) l3) ƒ(x) = x2 + sen x (-1 ; -0.5) 7) ƒ(x) = sen x – 2x + 2 (1 ; 2) 14) ƒ(x) = 5x - cos x + 5 ( -1 ; 0 ) 15) ƒ(x) = x – 5x + 1 (2; 3) 17) ƒ(x) = x – 5x + 1 (-3; -2) 16) ƒ(x) = x3 – 3x – 1 (-1 ; 0) 18) ƒ(x) = x3 – 3x – 1 3 3 (1 ; 2 ) 2.-Por el método de Newton Raphson encuentre seis raíces de la ecuación ƒ(x) = x6 +7x2 – 4 , cuatro complejas y dos reales, las reales se encuentran en los intervalos (-1,0) y (0,1). 3.- Por el método de Newton Raphson encuentre las raíces de la ecuación f(x)= x4 – 6x3 +12x2 – 7x – 12 ( 2 reales y 2 complejas) 4.- Para encontrar 3 7 efectuamos la siguiente transformación 3 7 = x, 7 = x 3 , de donde f(x) = x 3 -7 o bien g(x) = 7 - x 3 encuentre dicha raíz por el método de Newton-Raphson, inicie x=2. 5.- Encuentre 5 65 efectuando una transformación similar a la del problema anterior e inicie en x = 1.5 6.- Por el método de Newton-Raphson encuentre la raíz de: a) f(x) = x – 0.2 cos x – 0.5 x b) f ( x ) cos x 2 34 inicie en x = 0.5 inicie en x = 1 Capítulo 3 Solución de Sistemas de Ecuaciones Algebraicas Lineales y no Lineales Las ecuaciones lineales juegan un papel esencial, no solo en las matemáticas, sino también en otras áreas en las que estas se manejan. Los sistemas de ecuaciones lineales y no lineales, se han hallado en textos de más de 2000 años de antigüedad, algunos con aplicación real y otros con la finalidad de transmitir un procedimiento para resolverlas. Si se estudian circuitos eléctricos, vibraciones elásticas o mecánicas, resistencia de materiales, dinámica, estática, estadística, etc., el modelo Matemático de muchas de sus Leyes o Proposiciones, nos conducen a ecuaciones lineales o no lineales y en alguna parte del problema surgirá el darle solución a estas. Existen diversos métodos para dar solución a estos problemas. Método de Igualación, Sustitución, Simultaneas, Regla de Cramer, Gauss, GaussJordan, Método de la Inversa, son algunos métodos, de los cuales se espera que el alumno haya adquirido generalidades en cursos básicos relacionados con el Álgebra Lineal. En nuestro caso la finalidad será el de proporcionar solución mediante un algoritmo Numérico. La razón de esto es que, ciertos sistemas de ecuaciones lineales se pueden resolver con facilidad mediante técnicas simples, pero si el número de ecuaciones y de incógnitas crece, las operaciones que debemos efectuar es mayor, convirtiéndose en una técnica laboriosa y tediosa, en estos casos los algoritmos para computadora nos harán consumir menos tiempo y serán más prácticos. Un elemento que nos ayudará para estudiar estos sistemas de ecuaciones son: las Matrices *. Su simbología describe el problema de manera práctica y operando con ellas, nos conducirán de manera casi inmediata a la solución. En este capítulo describiremos brevemente las propiedades elementales del Álgebra Matricial. * James Joseph Silvestre introduce el concepto de matriz en 1850, William Rowan Hamilton desarrollo de la teoría de matrices 1853. Arthur Cayley expone el simbolismo matricial abreviando así el sistema de m ecuaciones lineales con n incógnitas en 1858. 35 3.1 Álgebra Matricial Una buena parte del Álgebra Lineal implica encontrar soluciones a un sistema de ecuaciones lineales, del siguiente tipo: 5x – 3 y = 9 2x – y = 4 (3.1.1) Resolver este tipo de sistemas con métodos como los de Gauss y de GaussJordan* es práctico, cuando el número de ecuaciones y el número de incógnitas no es muy grande como ya se mencionó. Ignorando las variables y los signos de igual de (3.1.1), el resultado final es un ordenamiento de números que dominan una posición, a este tipo de ordenamientos se le conoce, usualmente, como Matriz. Esta se representa simbólicamente de la siguiente forma: 5 -3 2 -1 9 4 Definición 3.1.1 Una Matriz es un acomodo rectangular ordenado de números, por lo regular encerrado entre paréntesis o corchetes. Al conjunto horizontal de elementos se le llamara renglón o fila y al conjunto vertical de elementos le llamaremos columna. Las letras mayúsculas indicaran Matrices y a los elementos los representaremos por aij donde i indicará la pertenencia a la fila y j, la pertenencia a la columna, por ejemplo: a11 a21 am1 a12 a13 a22 a23 am2 am3 a1n a2n amn *Karl Friederich Gauss(1777-1855) y Camille Jordan(1838-1922) ambos matemáticos, el primero alemán, el segundo francés. 36 El elemento a21 indica que este se encuentra situado en la fila 2 columna 1, el elemento am3 indica que el elemento se encuentra colocado en la fila m columna 3 , de esta manera, la matriz anterior, contiene m filas y n columnas, por lo que diremos que tiene una dimensión o tamaño de m n . Al arreglo rectangular, cuando m = n, le llamamos, arreglo cuadrado o matriz cuadrada. En lo siguiente escribiremos, en algunos casos, a la matriz A = (aij) Ejemplo 3.1.1 Las siguientes matrices son de dimensión m n , mostrando en subíndice los valores de m y n respectivamente: 1 -2 7 1 0 5 -1 B = -6 A= 1 4 6 7 5 8 5 4×3 8 8 1 6 1 -1 4 C = 3 5 7 D = 1 5 2×2 -1 3×2 4 9 2 3×3 En el ejemplo anterior las matrices C y D son cuadradas. Existen matrices especiales que solo tienen una fila o una columna, a estas se les llama vector fila o vector columna, respectivamente, o estrictamente vectores, los cuales se representaran con letras minúsculas resaltadas en negrita. A los elementos de este tipo de matriz se les llama componentes. Su dimensión es de 1 n o m 1 Ejemplo 3.1.2 Dados el siguiente Conjunto de vectores u 5,7,8 0 2 -1 v w 3 3 -1 y y1 , y2 x1 x x2 x 3 u, y son vectores fila, el primero con 3 componentes y el segundo con 2, mientras que v, w y x son vectores columna con, 4, 2 y 3 componentes respectivamente. 37 Definición 3.1.2 Dos matrices A = (aij) y B = (bij), son iguales si y sólo si son de igual dimensión y si para todo i y j, aij = bij. Si A = (aij) es una matriz cuadrada, a los elementos a11, a22, a33,…, los designaremos como, diagonal principal de la matriz. Otros tipos de matrices cuadradas muy particulares son: Matriz traspuesta: Si A = (aij), At = (bij) , tal que, bij = aji , para todo ij por ejemplo: 1 2 2 1 4 7 Si A = 4 5 6 la traspuesta de A es AT = 2 5 8 7 8 9 3 6 9 Matriz nula: Es tal que aij = 0 para todo ij , por ejemplo 0 0 0 0 Matriz diagonal: aij = 0 para todo i j, sólo tiene elementos distintos de cero las aii . a11 0 0 0 a22 0 0 0 ann Matriz escalar: Es una matriz diagonal en donde sus elementos son todos iguales. k 0 0 k 0 0 38 0 0 k Matriz unidad: Es una matriz escalar tal que, aij = 0, para todo i j y si i = j , aii = 1 . 0 1 0 0 0 1 1 0 0 Matriz simétrica: Es aquella matriz que coincide con su traspuesta. Tiene iguales los elementos simétricos respecto a la diagonal. A es simétrica si y solo si aij = aji o A = At , por ejemplo, 1 2 1 2 5 4 1 4 9 Matriz triangular superior: Es aquella en la que todos los elementos por debajo de la diagonal principal son cero, esto es aij = 0 para todo i<j. a11 a12 a13 a14 0 a22 a23 a24 0 0 a33 a34 0 0 a44 0 Matriz triangular inferior: Es aquella en la que todos los elementos por arriba de la diagonal principal son cero, estoes aij =0 para todo i>j. a11 a21 a31 a41 0 0 a22 0 a32 a33 a42 a43 0 0 0 a44 Dadas las matrices A = (aij), B =(bij) de la misma dimensión, la suma de ambas, es otra matriz, C = (cij) de la misma dimensión que los sumandos y 39 con término genérico cij = aij + bij. De esta manera, para poder sumar dos matrices, estas han de tener la misma dimensión. La suma será denotada por A + B. A la diferencia de matrices, la representaremos por A – B y esta se obtiene de la siguiente manera : A – B = A + (–B) 3 + 3 7 6 2 3 5 3 2+ 5 + = = 4 -1 -1 2 4 +(-1) -1+ 2 3 1 El producto de una matriz A = (aij) por un número real k es otra matriz B = (bij) con el mismo tamaño que A, donde cada elemento bij de B , se obtiene multiplicando los elementos aij por k, es decir, bij = kaij. El producto de la matriz A, por el número real k, se designa por kA, ejemplo:. 2 3 (3)(2) (3)(3) 6 9 3 = = 4 -1 (3)(4) (3)(-1) 12 -3 Dadas dos matrices A = (aij) y B = (bij), su producto es otra matriz C=(cij) cuyos elementos se obtienen efectuando el producto interno de las filas de A por las columnas de B. cij n a k 1 ik bkj desarrollando esto obtenemos cij = ai1 b1j + ai2 b2j + ain bnj De esta manera, para poder consumar el producto de dos matrices, es necesario que el número de columnas de A coincida con el número de filas de B. Es decir, si A tiene dimensión m × n y B dimensión n × p, la matriz C será de orden m × p. Al producto lo denotaremos por AB. (1)(2)+(3)(-1) (1)(4)+(3)(0) (1)(6)+(3)(8) 1 3 2 4 6 * = 5 7 2×2 -1 0 8 2×3 (5)(2)+(7)(-1) (5)(4)+(7)(0) (5)(6)+(7)(8) 2×3 -1 4 30 3 20 86 = 40 3.2 Inversión de Matrices Sea A una matriz cuadrada no singular, es decir, su determinante es diferente de cero, denotado por A 0 . Por definición de matriz inversa decimos que A1 es la inversa de A sí: A A1 I . Haciendo x = A-1 y sustituyendo en la ecuación anterior, se obtiene: Ax I Esta última expresión representa un sistema de ecuaciones simultáneas, en donde no hay un solo vector de términos independientes ni de incógnitas, sino “n”, los cuales forman la matriz unitaria I. De lo anterior, podemos determinar la inversa de una matriz utilizando el método de Gauss-Jordán. Empleando operaciones elementales a los renglones de la matriz ampliada y de este modo transformar A en I. Ejemplo 3.2.1 Invertir la matriz 1 3 -2 n a11 a12 n 2 2 x A= 2 5 -3 X i ( X i X ) a21 a22 i 1 i 1 -3 2 -4 a 31 a32 a13 2 2 a23 lim 2 x 0 v u 2 a33 Solución: Primero escribamos la matriz A en forma de matriz ampliada, esto es 1 3 -2 2 5 -3 -3 2 -4 1 0 0 0 1 0 0 0 1 Usando a11 como pivote, el 1er renglón se utilizará para eliminar los coeficientes an1 para n = 2,3 de este sistema, mediante múltiplos (inversos aditivos de estos coeficientes) de la primera ecuación y los sumaremos a cada uno de los otros renglones, esto es: 41 1 3 -2 2 5 -3 -3 2 -4 1 0 0 (2) (3) 1 3 -2 0 1 0 0 -1 1 0 0 1 0 11 -10 1 0 0 -2 1 0 (3)(11) 3 0 1 Ahora, se utiliza a22 como pivote y se eliminan de los otros renglones a12 y a32, después de esto, cambiamos el signo de todos los elementos del 20 renglón, para obtener una nueva matriz, de la cual utilizaremos el coeficiente a33 para eliminar a13 y a23 para obtener así la matriz inversa, la cual aparecerá en el lado derecho del sistema ampliado. 1 0 1 0 1 -1 0 0 1 3 0 2 -1 0 -19 11 1 ( 1 )(-1) -5 14 -8 -1 Por lo tanto, la inversa de A es: A = -17 10 1 -19 11 1 -1 Con este método conseguimos satisfacer también a los sistemas de ecuaciones lineales, ya que si, Ax = b, entonces , x =A-1 b Es evidente que el método de inversión de matrices, se torna tedioso para alcanzar la solución de un conjunto amplio de ecuaciones lineales y esto se debe a la cantidad de operaciones aritméticas que se desarrollarán con los renglones de la matriz. 42 3.3 Métodos de solución de sistemas de ecuaciones lineales Como ya hemos citado, en muchas ramas de la ingeniería se plantean problemas donde es ineludible resolver algún sistema de ecuaciones, con un gran número de ecuaciones y de incógnitas y resolverlo manualmente es tedioso, por lo que describiremos algunos métodos directos e iterativos fáciles de programar, en alguna calculadora programable o computador. Uno de los objetivos de este capítulo, es el de comprender y aplicar diversos métodos para resolver un sistema de ecuaciones lineales. Explicaremos brevemente los algoritmos conocidos como Métodos directos o finitos, como, eliminación Gaussiana y de Métodos iterativos o infinitos, como son los métodos de Jacobi y Gauss-Seidel, estableciendo ventajas y desventajas de cada uno estos. Definición 3.3.1 Una combinación de coeficientes y variables en donde estas aparecen únicamente elevadas a la primera potencia. Por ejemplo: a11 x1 + a12 x2 + a13 x3 + ...+ a1n xn = b1 (3.3.1) le llamamos ecuación algebraica lineal en las variables x1, x2, x3,..., xn. En esta ecuación los coeficientes a11, a12, a13,..., a1n y el término b1, llamado termino independiente, son constantes reales, aunque en algunos casos pueden ser constantes complejas, pero aquí solo analizaremos sistemas de ecuaciones lineales con coeficientes reales. El conjunto de ecuaciones algebraicas lineales que deseamos resolver de manera simultanea, es de la forma: 43 a11 x1 + a12 x2 + a13 x3 + ...+ a1n xn = b1 a21 x1 + a22 x2 + a23 x3 + ...+ a2n xn = b2 (3.3.2) an1 x1 + an2 x2 + an3 x3 + ...+ ann xn = bn Aplicando la definición de producto entre matrices, este sistema de n ecuaciones algebraicas lineales con n incógnitas (3.3.2) podemos representarlo matricialmente, de la siguiente manera, a11 a 21 ... an1 a12 a22 ... an1 ... a1n ... a2 n ... ... ann x1 b1 x b 2 2 ... ... xn bn (3.3.3) Este sistema de ecuaciones, puede abreviarse simbólicamente como, Ax = b (3.3.4) Aquí a A se le conoce con el nombre de Matriz de coeficientes del Sistema, x es el vector columna solución y b es el vector columna de términos independientes. A la representación a11 a21 ... an1 a12 a22 ... an1 a1n b1 ... a2 n b2 ... ... ... ... ann bn ... (3.3.5) que es la matriz A, con el vector de términos independiente agregado, se le llamara: Matriz Ampliada del Sistema. Al los valores de las incógnitas que verifican simultáneamente a todas y cada una de las ecuaciones del sistema (3.3.2) le llamaremos, vector solución del sistema de ecuaciones lineales. 44 De acuerdo a la solución, los sistemas pueden clasificarse en: a) Consistentes: Si admiten solución; b) Inconsistente o Incompatible: Si no admiten solución . Los sistemas Consistentes a su vez podemos clasificarlos como: a)Determinados: Si la solución es única b)Indeterminado: Si la solución no es única. En este último existirá una infinidad de soluciones. Los métodos llamados directos, nos proporcionarán una solución exacta, si la hay, en un número finito de pasos, despreciando, en la mayoría de los casos, los errores por el redondeo, mientras que los métodos indirectos o infinitos, solo de nombre, ya que habitualmente no lo son, originarán una solución aproximada, si esta existe, en un número amplio de operaciones aritméticas, y en muchas ocasiones, con errores por truncamiento, pero a pesar de esto, los métodos indirectos son necesarios, e incluso en ocasiones, más deseables que los directos ya que en el, los errores por redondeo no son acumulables. 3.4 Método de eliminación PIVOTEO de GAUSS El primer método que se presenta usualmente en álgebra lineal, el cual es un método numérico fundamental para la solución de ecuaciones algébricas lineales simultáneas, es aquel en el que se eliminan las incógnitas mediante la combinación de las ecuaciones. Este método se conoce como Método de Eliminación o Eliminación Gaussiana, el cual es práctico cuando él número de ecuaciones y él número de incógnitas no es muy grande. 45 Utilizando el método de Gauss, un conjunto de n ecuaciones con n incógnitas se reduce a un sistema triangular equivalente (un sistema equivalente es un sistema que tiene iguales valores de la solución), el cual se resuelve fácilmente por "sustitución inversa" como describiremos posteriormente. El método de Gauss inicia al ir reduciendo un conjunto de ecuaciones simultáneas, del tipo (3.3.2), a un sistema triangular equivalente como: a11 x1 + a12 x2 + a13 x3 + a14 x4 + ... + a1n xn = b1 1 1 1 1 a22 x2 + a23 x3 + a24 x4 + ... + a2n xn = b21 2 2 2 a33 x3 + a34 x4 + ... + a3n xn = b32 (n-2) (n-1)(n-1) (n-1) a x n-2 (n-1)n +a (3.4.1) n-2 n-1 xn = b n-1 ann xn = bnn-1 en donde los superíndices indican los nuevos coeficientes que se crean en el proceso de reducción. La reducción se va efectuando de la siguiente manera: Dado el sistema de ecuaciones lineales (3.3.2) se selecciona de la primer columna, la componente con el mayor valor absoluto, reordenado las ecuaciones y estableciendo como primer ecuación a la que cumpla esta condición, se divide entre el coeficiente de x1, esto es, entre a11, llamado pivote (diferente de cero) para obtener: x1 + a a a12 b x 2 + 13 x 3+....+ 1n x n= 1 a11 a11 a11 a11 (3.4.2) La primera ecuación se multiplica por el inverso aditivo del coeficiente de x1 de la segunda ecuación y la ecuación obtenida se suma de la misma, eliminando así x1. La primera ecuación también se multiplica por el inverso aditivo del coeficiente de x1 de la tercera ecuación, y la ecuación obtenida se suma de la misma para eliminar x1 de esa ecuación. Así sucesivamente, x1 se elimina de todas las ecuaciones del conjunto excepto la primera, de manera que el sistema toma la siguiente forma, 46 a11 x1 + a12 x2 + a13 x3 + a24 x4 ...+ a1n xn = b1 1 1 1 1 a22 x2 + a23 x3 + a24 x4 + ...+ a2n xn = b21 (3.4.3) 1 1 1 1 an2 x2 + an3 x3 + an4 x4 + ...+ ann xn = bn1 La ecuación utilizada para eliminar las incógnitas en las ecuaciones que la siguen se denomina Ecuación Pivote. En la ecuación pivote, el coeficiente de la incógnita que se va a eliminar de las ecuaciones que la siguen se denomina el Coeficiente Pivote. Con el subsistema después de la primer ecuación, se repiten los pasos anteriores, se busca el segundo pivote para eliminar x2 de todas las ecuaciones que siguen a esta ecuación pivote. a11 x1 + a12 x2 + a13 x3 + a24 x4 + ...+ a1n xn = b1 1 1 1 1 a22 x2 + a23 x3 + a24 x4 + ... + a2n xn = b21 a332 x3 + a342 x4 + ... + a3n2 xn = b32 (3.4.4) + annn xn = bnn Enseguida se utiliza la tercera ecuación como ecuación pivote, y se usa el procedimiento descrito para eliminar x3 de todas las ecuaciones que siguen a la tercera ecuación. Este procedimiento, se continúa hasta que el conjunto original de ecuaciones ha sido reducido a una matriz triangular. Ya obtenido el conjunto triangular de ecuaciones, la última ecuación proporciona directamente el valor de xn. Este valor se sustituye en la antepenúltima ecuación para obtener un valor de xn-1, que a su vez se utiliza junto con el valor de xn en la penúltima ecuación para obtener un valor xn-2 y así sucesivamente. Al procedimiento anterior se le conoce como sustitución inversa. Ejemplo 3.4.1 Resolver el siguiente sistema de ecuaciones lineales por el método de Gauss con pivoteo. 47 2.1x1 + 4.3x2 - x3 + 3 x4 = 1 2.5x1 + 3.2x2 - 4x3 + x4 = 2 (3.4.5) x1 + x2 - 4.3 x3 + x4 = 1.2 2 x1 - x2 + 4.3 x3 - x4 = 0 Solución: Primero escribamos (3.4.5) en forma de matriz ampliada, esto es: 2.1 4.3 -1 3 2.5 3.2 -4 1 1 1 -4.3 1 -1 4.3 -1 2 Primer pivote 1 2 1.2 0 de la primer columna 2.5 es el mayor en valor absoluto, este será el primer pivote (a11=2.5), dividimos todos los elementos del renglón entre el, reordenamos los renglones y así obtenemos un sistema equivalente, posteriormente eliminaremos los coeficientes an1 para n=2, 3,4 de este sistema, mediante múltiplos (inversos aditivos de estos coeficientes) de la primer ecuación y los sumaremos a cada uno de los otros renglones, esto es: 1 1.28 -1.6 0.4 -4 1 2.1 3.2 1 1 -4.3 1 -1 4.3 -1 2 0.8 (2.1) (-1) (-2) 2 1.2 0 obteniendo el siguiente sistema equivalente. Segundo pivote 48 1 1.28 -1.6 0 1.612 2.36 0 -0.28 -2.7 0 -3.56 7.5 0.4 2.16 0.6 -1.8 0.8 -0.68 0.4 -1.6 Seguimos el mismo procedimiento con el sistema equivalente, de tal manera que el nuevo pivote es –3.56, ya que este es el número de mayor valor absoluto de la segunda columna. Dividimos todos los elementos del renglón donde se encuentra el 20 pivote entre él y reordenamos las ecuaciones, después eliminaremos a32, a42, mediante múltiplos de la segunda ecuación sumándolos de cada uno de estas, esto es: -1.6 0.4 1 1.28 1 -2.1067416 0.5056180 0 0 -0.28 -2.7 0.6 2.36 2.16 0 1.612 0.4494382 (0.28 ) (1.612) 0.4 -0.68 0.8 para obtener: Tercer pivote -1.6 0.4 1 1.28 0 1 -2.1067416 0.5056180 0 0 -3.2898876 0.7415730 5.7560675 1.3449438 0 0 0.4494382 0.5258427 -1.4044944 0.8 Continuando el proceso con el nuevo sistema equivalente, el siguiente pivote es 5.7560675, ya que es el de mayor valor absoluto entre el y –3.2898876, dividimos el renglón entre el 3er pivote y reordenamos las ecuaciones y a continuación eliminar a43, mediante múltiplos (inversos aditivos) de la tercera ecuación y la sumamos de esta, así: -1.6 0.4 1 1.28 0 1 -2.1067416 0.5056180 0 0 1 0.2336567 0 0 -3.2898876 0.7415730 0.4494382 -0.2440024 (3.2898876 ) 0.5258427 0.8 para obtener, asimismo, el último sistema equivalente de matriz ampliada el cual utilizaremos para realizar las sustituciones de manera regresiva. 49 -1.6 0.4 1 1.28 1 -2.1067416 0.5056180 0 0 0 1 0.2336567 0 0 0 1.5102773 0.4494382 -0.2440024 -0.2768978 0.8 el último renglón de este sistema ampliado, se interpreta: 1.5102773 x4 = –0.27688978 de donde x4 = –0.183342357 El tercer renglón es la abreviación de la siguiente ecuación: x3 + 0.2336567x4 = –0.2440024 y dado que ya obtuvimos el valor de x4 podemos obtener, despejando de ella, el valor de x3 , así: x3 = (–0.2336567)x4 –0.2440024 = (–0.2336567)( –0.183342357)-0.2440024 de donde x3 = –0.201163229 El segundo renglón se interpreta del siguiente modo: x2 – 2.1067416 x3 + 0.50561180 x4 = 0.4494382 de donde despejando x2 y sustituyendo los valores de x3 y x4 obtenidos anteriormente, tenemos: x2 = 2.1067416 x3 – 0.50561180 x4 + 0.4494382 x2=(2.1067416)( –0.201163229) – (0.50561180)( –0.183342357)+0.4494382 obteniendo el valor: x2=0.1183393 De la misma forma el primer renglón expresa lo siguiente: x1 +1.28x2 – 1.6x3 +0.4x4 = 0.8 despejando x1 tenemos: 50 x1 = –1.28x2 + 1.6x3 – 0.4x4 + 0.8 Sustituyendo los valores de x2 , x3 , x4 anteriores, obtenemos el valor de: x1 = 0.40000147 La tabla 3.1 muestra los resultados finales del sistema de ecuaciones lineales, así como, el error relativo y absoluto. x1 x2 x3 x4 solución gauss pivoteo 0.40000147 0.1183393 –0.201163229 –0.183342357 solución real 0.4 0.118340442032 -0.201163241567 -0.183342380768 Error absoluto Error relativo % 0.00000147 0.0003675 0.000001142032 0.000965 0.000000012567 0.0000062 0.000000023768 0.0000129 Tabla 3.1 Otra de las variantes del método de Gauss es el método del pivoteo total que consiste en elegir como pivote el elemento de mayor valor absoluto de la fila y columna con la que estamos trabajando, este es más efectivo que el pivoteo parcial en la propagación del error, solo que la búsqueda de el máximo valor es mucho más costosa que el pivoteo parcial, por lo que prácticamente se prefiere el pivoteo parcial, más aún, la diferencia entre ambos métodos no es muy significativa en términos de la propagación del error. 3.6 Solución de sistemas de ecuaciones lineales por métodos iterativos Como se mencionó al inicio de la sección 3.2 ahora estudiaremos los métodos de solución de ecuaciones lineales no directos, esto es, los métodos iterativos o infinitos. El término infinito, en este caso, así como en otros casos de las matemáticas, es muy relativo, ya que las iteraciones que se desarrollarán, para que los algoritmos converjan, están bien determinadas y no son muy grandes. 51 Por lo regular podemos encontrar dos técnicas para dar solución a los sistemas de ecuaciones lineales A x = b: El método de Jacobi y el método de Gauss Seidel. La convergencia de estos métodos no puede asegurarse si desarrollamos el algoritmo sin un análisis previo de la matriz principal, con esto queremos decir que estos métodos se utilizan bajo ciertas condiciones para asegurar su convergencia. Estos métodos, son aplicables a los sistemas consistentes, que contengan una solución única, donde además, la matriz principal no debe tener ceros en la diagonal principal. Si el sistema de ecuaciones lineales A x = b es un sistema consistente con solución única y si el determinante de A es diferente de cero (detA 0), podemos asegurar que ninguna columna o renglón esta formada por ceros, en cuyo caso podemos intercambiar renglones o columnas y de esta manera obtener un sistema equivalente, en donde la matriz principal se encuentre sin ceros en la diagonal principal. En pocas palabras una condición suficiente para que estos dos métodos converjan, es que la matriz A sea de diagonal estrictamente dominante. 3.6.1 Método de Jacobi Este método iterativo, desarrollado por Carl Gustav Jacob Jacobi matemático alemán (1804-1851), es un procedimiento que consiste en efectuar despejes de la diagonal principal del sistema de ecuaciones A x =b , partiendo de un vector arbitrario y efectuando sustituciones en cada una de las ecuaciones, para obtener un nuevo vector de salida, el cual nuevamente se sustituirá en todas las ecuaciones y así de manera repetitiva o recurrente, hasta que la diferencia entre dos vectores consecutivos sea menor que la tolerancia prefijada, y así detener el proceso. Supongamos que el sistema: 52 a11 x1 + a12 x2 + a13 x3 + ...+ a1n xn = b1 a21 x1 + a22 x2 + a23 x3 + ...+ a2n xn = b2 (3.6.1) an1 x1 + an2 x2 + an3 x3 + ...+ ann xn = bn es tal que A= ( aij ) , es de diagonal estrictamente dominante, el método de Jacobi consiste en resolver la i-ésima ecuación i =1,2,…,n para xi y de esta manera el sistema toma la siguiente forma: x1k 1 b1 a12 k a13 k x2 x3 a11 a11 a11 a1n k xn a11 x2k 1 b2 a21 k a23 k x1 x2 a22 a22 a11 a1n k xn a22 xnk 1 bn an1 k an 2 k x1 x2 ann ann ann an ( n 1) ann (3.6.2) xnk1 Enseguida se dan valores arbitrarios iniciales x1(0) , x2(0) ,..., xn(0) , se sustituyen las aproximaciones en todas y cada una de las ecuaciones, para obtener una nueva aproximación x1(1) , x2(1) ,..., xn(1) volviendo al primer paso, utilizando los nuevos valores, generando así sucesiones x (k ) 1 , x2( k ) ,..., xn( k ) , las cuales eventualmente convergerán a x1 , x2 ,..., xn ó, de no ser así, detendremos el proceso hasta que: x1( n 1) x1( n ) E1 , x2( n 1) x2( n ) E2 ,..., xn( n 1) xn( n ) En (3.6.3) Ejemplo 3.6.1.1 Por el método de Jacobi resuelva el siguiente sistema de ecuaciones lineales 1.5 x1 + 1.1x2 – 3.2 x3 = 43.78 -0.7 x1 + 5.4x2 +1.6 x3 = 3.16 3.08 x1 + 1.6x2 +0.9 x3 = 3.72 53 Primero efectuaremos un acomodo en las filas para que el sistema tome la forma con diagonal estrictamente dominante, aunque se mencionó que es una condición necesaria, en algunas ocasiones el método converge sin llevar a cabo un ordenamiento 3.08 x1 + 1.6x2 +0.9 x3 = 3.72 -0.7 x1 + 5.4x2 +1.6 x3 = 3.16 1.5 x1 + 1.1x2 – 3.2 x3 = 43.78 despejamos de la primera ecuación x1, x2 de la segunda, y por último x3 , de la tercera, con lo cual obtenemos, x1 = (3.72 - 1.6x2 - 0.9x3 )/3.08 x2 = (3.16 +0.7x1 - 1.6x3 )/5.4 (3.6.4) x3 = (43.78 - 1.5x1 - 1.1x2 )/(-3.2) Inicialicemos el algoritmo con un vector arbitrario, por lo general xi(0) 0, i = 1,2,...,n , así la primer iteración x10 = (3.72 - 1.6(0) - 0.9(0)) / 3.08 = 1.207792208 x20 = (3.16 +0.7(0) - 1.6(0)) / 5.4 = 0.585185185 x30 = (43.78 - 1.5(0) - 1.1(0)) / (-3.2)= -13.68125 En la segunda iteración, se repite el mismo procedimiento pero ahora sustituyendo los nuevos valores de x1 x1(0) , x2 x2(0) , x3 x3(0) : 3.72 - 1.6(0.585185185) - 0.9(-13.68125) = 4.901567761 3.08 3.16 +0.7(1.207792208) - 1.6(-13.68125) x22 = = 4.795454545 5.4 43.78 - 1.5(1.207792208) - 1.1(0.585185185) x32 = = -12.913940 -3.2 x12 = 54 este procedimiento se continúa hasta que la sucesión de valores converja (si converge). Enseguida se presenta en la tabla 3.2 los valores obtenidos en las iteraciones. n x1n x2n x3n 0 1 2 3 4 5 6 … 10 15 20 25 30 35 40 45 46 0 1.207792208 4.901567761 2.490200884 1.430714431 2.387399072 2.569193736 0 0.585185185 4.795454545 5.04692619 3.792493481 3.964451858 4.363383725 0 -13.68125 -12.913940 -9.735202612 -10.77908746 -11.70693298 -11.19937636 2.312857636 2.291259625 2.293538997 2.293426115 2.293426451 2.293426911 2.293426867 2.293426869 2.293426869 4.213790939 4.189708358 4.190811759 4.190816311 4.190811105 4.190811557 4.190811539 4.190811539 4.190811539 -11.14782874 -11.1648733 -11.16575918 -11.16560481 -11.16561496 -11.16561471 -11.16561469 -11.16561469 -11.16561469 Tabla 3.2 a ocho decimales podríamos decir que la iteración 46 es la solución del sistema de ecuaciones lineales. Una solución, con once cifras decimales es: x1 = 2.29342686929 x2 = 4.19081153891 x3 = – 11.1656146885 3.6.2 Método de Gauss Seidel Este método iterativo, desarrollado por Gauss y Philipp Ludwig Von Seidel(1821-1896), matemático alemán, es parecido al de Jacobi, solo que más refinado y por lo general (pero no siempre) converge rápidamente. Realiza los mismos despejes de la diagonal principal del sistema de ecuaciones A x = b , también inicializa con un vector arbitrario a partir del 55 cual, mediante una técnica sistemática, se obtiene una mejor aproximación al vector solución. La diferencia reside en que este método utiliza la información más actualizada, ya que, se efectúa la sustitución en la primer ecuación para obtener un valor de la primer variable, el vector inicial modifica su primer componente y es sustituido en la segunda ecuación para obtenemos un valor de la segunda variable, mismo que modificará nuevamente el vector, al asignarse como segunda componente, el proceso se continua para obtener xi y de esta manera regresar a la primer ecuación y repetir el proceso anterior hasta observar la convergencia, si es posible. La expresión anterior puede quedar descrita de la siguiente manera: x1k 1 b1 a12 k a13 k x2 x3 a11 a11 a11 x2k+1 = b2 a21 k+1 a23 k x1 x2 a22 a22 a11 xnk+1 = bn an1 k+1 an2 k+1 x1 x2 ann ann ann a1n k xn a11 a1n k xn a22 an(n-1) ann k+1 xn-1 En el algoritmo podemos definir una tolerancia para efectuar la comparación entre xi( n ) y xi( n 1) , de tal manera que si elegimos una tolerancia pequeña, mayor será la precisión de la solución. Ejemplo 3.6.2.1 Resolver el ejemplo 3.6.1.1 por el método Gauss-Seidel Solución: Iniciamos con las ecuaciones 3.6.4, ya despejadas: 56 x1 = (3.72 - 1.6x2 - 0.9x3 )/3.08 x2 = (3.16 +0.7x1 - 1.6x3 )/5.4 x3 = (43.78 - 1.5x1 - 1.1x2 )/(-3.2) 0 0 Suponemos los valores iniciales x2 = x3 = 0 y calculamos x11 : x11 = 3.72 - 1.6(0) - 0.9(0) = 1.207792208 3.08 Este valor, junto con el de x3 = 0, se utilizará para obtener x2 x21 = 3.16 +0.7(1.207792208)- 0.9(0) = 0.741750841 5.4 La primera iteración se completa sustituyendo los valores de x1 y x2 calculados obteniendo: x31 = 43.78 - 1.5(1.207792208)- 1.1(0.741750841) = -12.86012055 -3.2 En la segunda iteración, se repite el mismo procedimiento: 3.72 - 1.6(0.741750841)- 0.9(-12.86012055) = 4.580294529 3.08 3.16 +0.7(4.580294529)- 1.6(-12.86012055) x22 = = 4.989333158 5.4 43.78 - 1.5(4.580294529)- 1.1(4.989333158) x32 = = -9.819153667 -3.2 x12 = Comparando los valores calculados entre la primera y la segunda iteración tenemos: 57 x12 - x11 = 4.580294529 - 1.207792208 = 3.372502321 x22 - x21 = 4.989333258 - 0.741750841 = 4.247582417 x32 - x31 = -9.819153667 - (-12.86012055) = 3.040966883 Como podemos observar, el error es grande en esta iteración. Tomamos los valores modificados en la última iteración e iniciamos el procedimiento nuevamente para la siguiente iteración. x13 = 3.72 - 1.6(4.9893332158) - 0.9(-9.819153667) = 1.485164041 3.08 x23 = 3.16 +0.7(1.485164041) - 1.6(-9.819153667) = 3.687085314 5.4 x33 = 43.78 - 1.5(1.485164041) - 1.1(3.687085314) = -11.71764378 -3.2 Comparamos de nuevo los valores obtenidos: x13 - x12 = 1.485164041- 4.580294529 = 3.0951305 x23 - x22 = 3.687085314 - 4.989333158 = 1.302247844 x33 - x32 = -11.71764378 - (-9.819153667) = 1.898490113 Aún se observa un error muy grande para 58 xi3 - xi2 para i = 1,2,3 Así continuamos con otras iteraciones, hasta que se cumpla la condición que pretendemos y lograr una respuesta satisfactoria. Enseguida la tabla 3.3 muestra alguna de las iteraciones realizadas n x1n x2n x3n 0 1 2 3 4 5 6 … 10 20 30 33 34 0 1.207792208 4.580294529 1.485164041 2.716410032 2.100100702 2.385651978 0 0.741750841 4.989333158 3.687085314 4.409206865 4.084759109 4.240419139 0 -12.86012055 -9.819153667 -11.71764378 -10.89226794 -11.29269185 -11.10533156 2.297993952 2.293429378 2.293426871 2.293426869 2.293426869 4.193279854 4.190812895 4.19081154 4.190811539 4.190811539 -11.16262539 -11.16561305 -11.16561469 -11.16561469 -11.16561469 Tabla 3.3 Como se puede evidenciar no se tiene un número exacto de iteraciones para encontrar una solución. En este ejemplo, se hicieron 2 iteraciones, para mostrar el método, pero se requiere un máximo de entre 34 iteraciones para la convergencia. 3.7 Solución de Sistemas de ecuaciones no Lineales Un sistema de ecuaciones 59 f1 (x1 ,x2 , , xn ) = 0 f 2 (x1 ,x2 , , xn ) = 0 (3.7.1) f n (x1 ,x2 , , xn ) = 0 es no lineal, si al menos una de las funciones f1, f2, …,fn , es no lineal. La solución de 3.7.1 consiste en un conjunto de valores xi que simultáneamente sean el resultado de todas las fi(x1,x2,…,xn) para i=1,2,…,n. Algunos de estos sistemas de ecuaciones no lineales podemos resolverlos echando mano de métodos como el de Newton-Raphson o bien de GaussSeidel, efectuando arreglos algebraicos, como se expone en el capítulo 2, en las ecuaciones de tal manera que tomen la forma de ecuaciones como punto fijo. El conjunto de ecuaciones 2.1.2 f(x) = ex y g(x) = 4 – x2 , se resolvió en el ejemplo 2.6.1 arrojando una solución por el método de Newton Raphson de 1.058006401 y -1.964635597 . Estas ecuaciones puede expresarse como y = ex, y y = 4 – x2 y tomar la forma de un sistema de ecuaciones no lineales, como se muestra enseguida. y – 4 + x2 =0 y–ex =0 (3.7.2) Ejemplo 3.7.1 Resuelva 3.7.2 Utilizando el método de Gauss-Seidel efectuando los despejes y = 4 – x2 x = ln y Solución: Si iniciamos con x = 0, y = 0 obtenemos la tabla 3.4 n 0 1 2 3 60 y 0 4 2.078187944 3.464913114 x 0 1.386294361 0.731496333 1.242687557 4 2.455727636 5 3.192835922 ….. …. 50 2.880622164 60 2.880622442 70 2.880622455 Tabla 3.4 0.898423106 1.160909526 …. 1.0580063 1.058006396 1.058006401 La cual es una de las soluciones de este sistema de ecuaciones no lineales. Ejemplo 3.7.2 Resuelva 3.7.2 Utilizando el método de Gauss-Seidel efectuando los despejes: y = ex x = - (4 - y) Solución: Inicializamos en x=0 y y = 0 obteniendo los valores que se muestran en la tabla 3.5 n 0 1 2 3 4 5 6 7 8 9 y = ex 0 1 0.176921206 0.141526331 0.140254059 0.140208649 0.140207029 0.140206971 0.140206969 0.140206969 x= - (4 - y) 0 -1.732050808 -1.955269494 -1.964299791 -1.964623613 -1.96463517 -1.964635582 -1.964635597 -1.964635597 -1.964635597 Tabla 3.5 En la tabla 3.5 encontramos otra de las soluciones del sistema de ecuaciones no lineales, en la cual podemos observar que no existe un número fijo de iteraciones para obtener una solución. Al buscar la solución en un método iterado ya sea el método de punto fijo o el de Gauss-Seidel, podemos observar que este proceso puede realizarse de muchas maneras, pero la más sencilla en comparación es el método de punto 61 fijo, haciendo F(x) = x + f(x), para construir una sucesión de vectores, partiendo de un vector inicial x0 , de la siguiente manera xn 1 F ( xn ) x1n 1 F ( x1n , xn2 , 2 1 2 xn 1 F ( xn , xn , xnk1 F ( x1n , xn2 , , xnk ) , xnk ) (3.7.3) , xnk ) como se puede ver en (3.7.3) y (3.7.4), podemos escribirlos x = F(x) x x= 0 y0 x = lny F(x) = 2 y=4 - x (3.7.4) Si x es una solución de la ecuación y xn+1 es una aproximación, se tiene que la sucesión x0, x1,…,xn,… converge a la única raíz de x =F(x) en algún intervalo dado, debido a la teoría de punto fijo de la sección 2.1. Si f(x,y) y g(x,y) son funciones de dos variables, y (α, β) el punto fijo donde se cruzan ambas ecuaciones al dar un valor p0 para y, y sustituirlo en las dos ecuaciones obtenemos nuevas ecuaciones f(x,p0) = f(x) = 0 g(x,p0) = g(x) = 0 las cuales pueden resolverse por el método de Newton-Raphson arrojando valores iniciales a1(0) , a2(0) , los cuales nos definen dos puntos (a1(0) , p0 ) y (a2(0) , p0 ) que se encuentran sobre las curvas f(x,y) y g(x,y) respectivamente, de donde si utilizamos las pendientes f '(a1(0) ) y g '(a2(0) ) podemos construir ecuaciones tangentes a f(x,y) y g(x,y) como: f '(a1(0) ) x y p0 a1(0) f '(a1(0) ) y (3.7.5) g '(a2(0) ) x y p0 a2(0) f '(a2(0) ) convirtiéndose en un sistema de ecuaciones lineales que podemos resolver por algún método, para obtener así la primer aproximación (x1,y1), y repitiendo el proceso iterativamente, llegar a la convergencia (α, β). 62 O bien si (α, β) es una raíz y las dos funciones son desarrolladas en series de Taylor, alrededor del punto (x0, y0), en términos de α – x0 , β – y0 , (x0, y0) cercano a la raíz: f ( , ) 0 f ( x0 , y0 ) f x ( x0 , y0 )( x0 ) f y ( x0 , y0 )( y0 ) ... g ( , ) 0 g ( x0 , y0 ) g x ( x0 , y0 )( x0 ) g y ( x0 , y0 )( y0 ) .. si truncamos la expansión considerando que los demás términos son pequeños y (x0,y0) esta cercano a (α, β), obtenemos el siguiente sistema de ecuaciones lineales f x ( x0 , y0 )( x0 ) f y ( x0 , y0 )( y0 ) f ( x0 , y0 ) (3.7.6) g x ( x0 , y0 )( x0 ) g y ( x0 , y0 )( y0 ) g ( x0 , y0 ) El cual resolviendo mediante ( x0 ) y ( y0 ) se tiene, ( x0 ) la regla f ( x0 , y0 ) f y ( x0 , y0 ) g ( x0 , y0 ) g y ( x0 , y0 ) f x ( x0 , y0 ) f y ( x0 , y0 ) g x ( x0 , y0 ) g y ( x0 , y0 ) de Cramer para (3.7.7) f x ( x0 , y0 ) f ( x0 , y0 ) ( y0 ) g x ( x0 , y0 ) g ( x0 , y0 ) f x ( x0 , y0 ) f y ( x0 , y0 ) (3.7.7) g x ( x0 , y0 ) g y ( x0 , y0 ) Si α = xn+1 β = yn+1 escrito recursivamente tenemos que 63 ( xn 1 xn ) f ( xn , yn ) f y ( xn , yn ) g ( xn , yn ) g y ( xn , yn ) f x ( xn , yn ) f y ( xn , yn ) n g x ( xn , yn ) g y ( xn , yn ) y (3.7.8) f x ( xn , yn ) f ( xn , yn ) ( yn 1 yn ) g x ( xn , yn ) g ( xn , yn ) n f x ( xn , yn ) f y ( xn , yn ) g x ( xn , yn ) g y ( xn , yn ) Esto es xn+1 = xn+ Өn yn+1 = yn + λn Ejemplo 3.7.3 Resuelva utilizando el método de Newton-Raphson para varias variables el sistema de ecuaciones 3.7.2 Solución: Las ecuaciones 3.7.2. son y – 4 + x2 =0 siguientes funciones en dos variables f = x2 + y – 4 y y – e x = 0, construyendo las g = ex – y y obteniendo las derivadas parciales respecto que se indican en 3.7.8 fx = 2x, gx=ex , fy = 1 , gy = –1 , e iniciando en (1 , 1) obtenemos la tabla 3.6 64 x1 = x0 + -f(x0 , y0 ) f y (x0 , y0 ) -g(x0 , y0 ) g y (x0 , y0 ) f x (x0 , y0 ) f y (x0 , y0 ) g x (x0 , y0 ) g y (x0 , y0 ) f x (x0 , y0 ) -f(x0 , y0 ) -(-2) = 1+ 1 -(e - 1) -1 = 1.059707788 2 1 e -1 y y1 = y0 + 2 -(-2) g x (x0 , y0 ) -g(x0 , y0 ) e -(e - 1) = 1+ = 2.880584424 f x (x0 , y0 ) f y (x0 , y0 ) 2 1 g x (x0 , y0 ) g y (x0 , y0 ) e -1 iterando con estos nuevos valores obtenemos la tabla 3.6 n 0 1 2 3 4 xn yn 1 1.059707788 1.058007813 1.058006401 1.058006401 1 2.880584424 2.880622357 2.880622455 2.880622455 Tabla 3.6 El cual converge en 4 iteraciones. Si inicializamos en (– 1, – 1) obtenemos la tabla 3.7 n 0 1 2 3 4 5 6 xn -1 -2.612699837 -2.049908486 -1.966588005 -1.964636673 -1.964635597 -1.934635597 yn -1 -0.225399673 0.114609304 0.13947392 0.140206551 0.140206969 0.140206969 Tabla 3.7 El cual converge en 6 iteraciones. Si los valores iniciales no se encuentran cerca de la posible solución o raíz, la sucesión de valores que obtengamos, diverge a menudo, con esto 65 podemos decir que, para obtener una solución, los valores iniciales podemos cambiarlos para, a prueba y error, obtener una solución, si el problema corresponde a un modelo físico, el comportamiento y condiciones nos pueden dar una idea para iniciar con ciertos valores, o bien si podemos graficar este tipo de ecuaciones fácilmente podemos encontrar un vector de inicio para que el método pueda converger. Este método puede generalizarse para resolver n ecuaciones simultáneas, utilizando las siguientes ecuaciones f1 ( x0 , y0 , z0 ,...) f1 ( x0 , y0 , z0 ,...) x f ( x , y , z ,...) ( y0 ) 2 0 0 0 f 2 ( x0 , y0 , z0 ,...) y f ( x , y , z ,...) ( z0 ) 3 0 0 0 f3 ( x0 , y0 , z0 ,...) z ( x0 ) PROBLEMAS CAPÍTULO III 1.- Por el método de Gauss con pivoteo parcial resuelva los siguientes sistemas de ecuaciones lineales. a) 0.3736 x1 – 0.2674 x2 + 0.1327 x3 = – 1.7411 – 0.0720 x1 + 0.2997 x2 – 0.0103 x3 = 1.7667 – 0.5008 x1 – 0.1226 x2 – 0.1254 x3 = – 0.6046 b) 1.8 x1 + 2.6 x2 + 0.93 x3 = 3.52 – 2.8 x1 + 3.4 x2 – 3.6 x3 = 3.16 1.7 x1 + 0.1 x2 – 3.2 x3 = 13.58 c) d) 3.2 x1 + 1.16 x2 + 2.72 x3 = 1.25 – 1.17 x1 + 3.24 x2 – 2.12 x3 =1.21 2.3 x1 + 0.2 x2 – 2.5 x3 = 1.8 e) 66 0.6 x1 – 2.4 x2 + 3.7 x3 = – 1.7 – 0.7 x1 + 0.3 x2 – 1.3 x3 = 0.7 – 0.5 x1 – 0.1 x2 – 0.2 x3 = – 0.6 9.96 x1 – 3.445 x2 + 2.67 x3 = – 11.77 1.73 x1 + 0.253 x2 – 2.53 x3 = 0.5674 1.4 x1 – 0.32 x2 + 0.52 x3 = 5.674 2.- Por el método de Jacobi y de Gauss-Seidel resuelva el siguiente conjunto de ecuaciones lineales con diagonal estrictamente dominante a) b) 0.87 x1 – 0.26 x2 + 0.27 x3 = – 1.7411 – 0.17 x1 + 0.49 x2 – 0.23 x3 = 1.7667 – 0.58 x1 – 0.12 x2 – 0.76 x3 = – 0.6046 4.8 x1 + 2.6 x2 + 0.93 x3 = 3.52 – 0.8 x1 + 5.4 x2 – 1.6 x3 = 3.16 1.7 x1 + 0.1 x2 – 3.2 x3 = 13.58 d) 5.2 x1 + 1.16 x2 + 2.72 x3 = 1.25 – 1.17 x1 + 4.24 x2 – 2.12 x3 =1.21 2.3 x1 + 0.2 x2 – 2.6 x3 = 1.8 c) e) 8.6 x1 – 2.4 x2 + 3.7 x3 = – 1.7 – 0.1 x1 + 1.3 x2 – 0.3 x3 = 0.7 – 0.05 x1 – 0.1 x2 – 0.2 x3 = – 0.6 9.96 x1 – 5.452 x2 + 2.67 x3 = – 11.77 1.73 x1 + 5.253 x2 – 2.53 x3 = 0.5674 0.4 x1 – 0.32 x2 + 1.52 x3 = 5.67 3.- Reordene las siguientes ecuaciones para que la mayoría de ellas sea de diagonal estrictamente dominante y resuelva por el método de Gauss-Seidel a) 1.8 x1 + 2.6 x2 + 0.53 x3 = 0.99 –8.3 x1 – 5.4 x2 – 1.3 x3 = 2.61 1.7 x1 + 0.1 x2 – 3.2 x3 = 13.58 b) 1.6 x1 – 2.4 x2 + 5.7 x3 = – 1.2 – 3.1 x1 + 1.3 x2 – 0.3 x3 = 3.7 – 0.05 x1 – 0.9 x2 – 0.2 x3 = – 1.6 c) d) 5.2 x1 + 4.16 x2 + 2.72 x3 = 1.55 – 1.17 x1 + 2.24 x2 – 5.12 x3 =1.29 5.3 x1 + 0.2 x2 – 1.6 x3 = 1.9 9.96 x1 – 5.452 x2 + 2.67 x3 = – 1.77 1.73 x1 + 0.253 x2 – 2.53 x3 = 0.568 0.4 x1 – 2.32 x2 + 0.52 x3 = 2.69 4.- Resuelva los siguientes sistemas de ecuaciones no lineales, por el método de Newton-Raphson o el de Gauss-Seidel. a) x2 – 3xy – y =1 x2 + 4y2 = 9 b) y2 – 3xy – x = 1 4x2 + y 2 = 9 c) ex – y = 0 xy – 1 = 0 d) x2 – xy – y 2 = 11 x2 + xy + y 2 = 7 e) y – ln x = 0 x+ y – 2 = 0 f) y 2 – x2 = 16 2y 2 – 4 xy + 3x 2 = 17 67 Capítulo 4 Ajuste de funciones Cualquiera que hayamos tenido la experiencia, en cierta ocasión, de observar tablas de valores en la cual se describa alguna función en particular o algún comportamiento en los datos, tomados de un experimento, hemos tratado de adivinar o sugerir uno o mas valores dentro de un par de datos. Ese deseo de pronosticar o interpolar, probablemente en algunas situaciones como método de "adivinando entre datos" no es muy acertado que digamos. Para muchos propósitos, es deseable encontrar una fórmula que pueda expresarse, explícitamente, en términos de dos o más variables, lo que nos permitiría considerar el efecto más directamente, con el fin de obtener información posterior. En este capitulo utilizaremos la información de los datos clasificados, tratando de establecer una fórmula, que explique el comportamiento de estos, en su totalidad, si es posible. Es claro que será necesario, además de los datos cuantitativos, alguna información adicional cualitativa, para el caso de tomar una decisión, evitando en lo posible, cometer un error involuntario. Uno de los primeros métodos que podríamos utilizar, es el descrito en el capítulo II, fórmula de la interpolación, la cual posee ventajas en ciertas situaciones, pero no es del todo preferible ya que se encuentra que estas ventajas sólo se logran descartando otras. La fórmula fue expresada explícitamente en términos de las ordenadas, las cuales dependían de otras para obtener un valor único en un intervalo. Analizaremos las fórmulas de Newton, para datos igualmente espaciados, Lagrange, para datos desigualmente espaciados, Mínimos cuadrados, para una gran cantidad de datos, así como aproximaciones de Taylor como polinomio de colocación o de aproximación. 68 4.1 Polinomios de colocación Taylor El efectuar cálculos con funciones trascendentes, en ocasiones no queda claro la precisión que debemos tomar para su uso. Un problema básico, por años, fue el de aproximar las funciones por polinomios, ya que el manejo de estos es sencillo debido a que son continuos en su dominio, pueden derivarse e integrarse fácilmente y su resultado es un polinomio. Por otra parte, cualesquier polinomio P(x) = anxn + an-1xn-1 + … +a2x2 + a1x + a0 con coeficientes an, an-1 ,…, a2, a1, a0 es fácil de evaluar. Si f es una función trascendente y deseamos obtener una evaluación en x0, nos bastaría con encontrar un polinomio P(x) y que al ambas graficas se encuentren cercanas al compararse, para que el valor especifico f(x0) pueda ser sustituido por el aproximado P(x0). Las primeras aproximaciones de funciones aparecen del la utilización de la definición de derivada. Sea y = f(x), una función definida en un intervalo I [x0 , x1], continua y diferenciable en dicho intervalo cuya longitud es h = x1 – x0,. Entonces, el incremento Δy del valor de f(x) cuando x varía de x0 a x1, es la diferencia entre el valor nuevo y el valor inicial, esto es: Δy = f(x1 ) - f(x0 ) (4.1.1) si dicha función continúa con la misma razón de cambio f’(x0) en el intervalo dado, el cambio en x = x0 podemos expresarlo de la siguiente manera: f '( x0 )( x1 x0 ) f '( x)h (4.1.2) de donde obtenemos una aproximación para la variación en y: Δy = f '(x0 )h (4.1.3) 69 Si comparamos el incremento en Δy con la variación que ocurriría en y, cuando esta varíe a razón fija f’(x), al variar x de x0 a x1 se obtiene lo que en cálculo se llama diferencial de y: (4.1.4) dy = f '(x0 )h de lo anterior podríamos escribir una primer aproximación lineal para una función en términos de la primer derivada como sigue: Si x1 = x0 + h, f(x0) = y0 , f ( x1 ) f(x0 h) y0 Δy y1 yo dy esto es: (4.1.5) f(x0 h) f(x0 ) f '( x0 )h De esta manera podríamos expandir a una función f(x) mediante una aproximación lineal como muestra (4.1.5). Una expansión, en términos de derivadas, podríamos justificarla si observamos, por ejemplo, que sucede con la variación de f(x) = x7, cuando x varía de, x a x+ h , como se describe enseguida: f ( x h) ( x h)7 ó (4.1.6) x 7 7 x 6h 21x5h 2 35x 4h3 35x 3h 4 21x 2h5 7 xh 6 h 7 f(x) = x7 f iv (x) = 840x 3 f i (x) = 7x6 f v (x) = 2520x 2 f ii (x) = 42x 5 f vi (x) = 5040x f iii (x) = 210x 4 f vii (x) = 5040 (4.1.7) de esta forma podemos encontrar una relación entre los términos de 4.1.6 y las derivadas en 4.1.7, como mostraremos enseguida: f + f i h+ f ii 2 f iii 3 f iv 4 fv 5 f vi 6 f vii h + h + h + h + h + h7 2 6 24 120 720 5040 o bien: f(x + h) = f + f i h+ 70 f ii 2 f iii 3 f iv 4 f v 5 f vi 6 f vii 7 h + h + h + h + h + h 2 3! 4! 5! 6! 7! de aquí que, una expansión en series de Taylor, pueda ser expresada en una serie infinita. Si f(x) es una función continua en I [x0, x1] y supongamos que existen la n primera derivadas para x = x0, una expansión en serie de Taylor puede expresarse como: f ii ( x0 ) 2 f ( n ) ( x0 ) n (4.1.8) f ( x) f ( x0 ) f i ( x0 )h h ... h 2 n! o bien, si x0 = 0 y h = x en el segundo miembro de 4.1.8 obtenemos una serie de potencias que nos proporcionara un instrumento para aproximar funciones: f ii (0) 2 f ( n ) (0) n f ( x) f (0) f i (0) x x ... x Rn ( x) (4.1.9) 2 n! donde: f ( n1) (c) ( n1) Rn ( x) x 0c x c (n 1)! es llamado residuo de la serie, el cual tiende a cero si n tiende a infinito. Este caso particular de la serie de Taylor, suele llamarse serie de Mclaurin**. La demostración de dichas series la encontraremos en libros de Cálculo con Geometría Analítica tradicionales. Es así como aproximaremos funciones trascendentes como: ex, sen x, cos x, etc. y a partir de estas, formaremos nuevas series que son útiles al relacionarlas con alguna aplicación. Ejemplo 4.1.1 Encuentre el polinomio de Taylor de grado n para f(x) = ex Solución: Si f(x) = ex, f’(x) = ex , f’’(x) = ex ,…,f (k)(x) = ex , para todo k≥0. Por lo que si evaluamos todas las derivadas en x=0, f (k)(0) = e0 =1, y entonces sustituyendo esta información en 4.1.9, el polinomio que buscamos es: e x P(x) = 1+ x + ¥ x2 x3 xn xn + + ...+ = 2! 3! n! n=0 n! (4.1.10) 71 Ejemplo 4.1.2 Encuentre el polinomio de Taylor de grado n para f(x) = sen x. Solución: Si f(x)=sen x, f’(x)=cos x, f’’(x) = –sen x, f’’’(x)= –cos x, f iv(x) = sen x,… Evaluando en x = 0, f(0) = 0, f’(0) =1, f’’(0) =0, f’’’(0) =-1, f iv(0)=0, repitiéndose las evaluaciones nuevamente a partir de f iv(0), sustituyendo esta información en 4.1.9, el polinomio buscado será: x3 x5 (-1)n x 2n+1 (-1)n x 2n+1 senx P( x) x - + - ...+ 3! 5! (2n +1)! n0 (2n +1)! (4.1.11) De la misma manera, un polinomio para el coseno estará dado por: cosx P(x)= 1- x 2 x4 (-1)n x 2n (-1)n x 2n + - ...+ 2! 4! (2n)! n 0 (2n)! (4.1.12) con estas series, lograríamos encontrar otras que son utilizadas en diferentes áreas, como control de calidad, funciones de error en electrónica y diversas aplicaciones en física, química, etcétera. Ejemplo 4.1.3 Encontrar expresiones para e x , e senx , 2 senx 1 - cosx , x x Solución: 2 Para desarrollar e x partimos de la expresión 4.1.10 y sustituimos en ella el valor –x2: 2 (-x 2 )2 (-x 2 )3 (-x 2 )n e-x 1+(-x 2 )+ + + ...+ = 2! 3! n! x 4 x6 (-x 2 )n (-1)n x 2n = 1 - x 2 + - + ...+ = 2! 3! n! n! n=0 72 Para desarrollar la función senx x x- senx partimos de 4.1.11. x x3 x5 (-1)n x 2n+1 + - ...+ x2 x4 (-1)n x 2n 3! 5! (2n+1)! 1- + - ...+ x 3! 5! (2n+1)! (-1)n x 2n n 0 (2n+1)! Para desarrollar 1 - cosx partimos de 4.1.12. x x2 x4 (-1)n x 2n+1 1- 1- + - ...+ 2! 4! (2n)! x x 3 1- cosx (-1)n x 2n-1 = - + ...+ x x 2! 4! (2n)! (-1)n x 2n+1 = (2n)! n=0 ¥ Y por último para e senx sustituimos 4.1.11 en 4.1.10, esto es: e senx x3 x5 x + 3! 5! x3 x5 1+ x - + - + 3! 5! 2! 2 x3 x5 - x- + 3! 5! + 3! 3 - + ... de donde simplificando obtenemos: e senx 1+ x+ x2 +...para toda x 2! Ejemplo 4.1.4 Del desarrollo de ex en series, compare el resultado al evaluarse en x=1, tomando 7 términos de la serie y calculando el error absoluto y relativo. Solución: 73 e1 = 2.71828182846 a once cifras decimales, el desarrollo de ex con siete términos es: e x 1+ x + x 2 x 3 x 4 x 5 x6 + + + + 2! 3! 4! 5! 6! evaluando en x=1 obtenemos la siguiente aproximación e1 =2.718055556 de donde: Ea = 2.718281828 - 2.718055556 = 0.000226272 ER = 2.71828182846 - 2.71825396825 2.71828182846 = 0.0008324081693 % 4.2 Polinomio de Newton El problema básico consiste en encontrar un función para una serie de datos (x0 ,y0), (x1 ,y1),…, (xn ,yn) tal que g(xi) = yi , 1 ≤ i ≤ n mediante un polinomio P(x), tal que P(xi) = yi para 1 ≤ i ≤ n Por estos puntos pasa un polinomio de la forma: P(x) = anxn + an-1xn-1 + … +a2x2 + a1x + a0 el cual es único, gracias al Teorema Fundamental del Álgebra y sustituyendo los puntos en el, estableceremos un sistema de ecuaciones con los cuales podemos calcular los coeficiente an, an-1 ,…,a2 , a1, a0 esto es: an x0n an 1 x0n 1 ... a2 x02 a1 x0 a0 y0 an x1n an 1 x1n 1 ... a2 x12 a1 x1 a0 y1 (4.2.1) an xnn an 1 xnn 1 ... a2 xn2 a1 xn a0 yn Es evidente que si el número de datos es grande el sistema de ecuaciones que se genera, también lo es, ya que depende del número de datos, por lo cual trataremos de encontrar otros métodos mas prácticos. 74 Ejemplo 4.2.1 Encontrar el polinomio que pasa por (-1, 2), (1,1) y (2, 3) Solución: Dado P(x) = a2x2 + a1x + a0 (polinomio de grado 2), al sustituir los datos en el obtenemos: (-1, 2) ( 1, 1) (2, 3) P(-1) = 2 P(1) = 1 P(2) = 3 a2 – a1 + a0 = 2 a2 + a1 + a0 = 1 4a2 + 2a1 + a0 = 3 en donde se presenta un sistema de tres ecuaciones lineales con tres incógnitas, cuya respuesta por algún método matricial, o numérico si es necesario, es a2 = 5/6 a1 = -1/2 a0 =2/3 de esta manera el polinomio que buscamos es: P(x ) =(5/6) x2 + (-1/2)x + (2/3) 2 y0 (y0 ) ( y1 y0 ) y1 y0 (y2 - y1 ) - (y1 - y0 ) y2 - 2y1 + y0 (4.2.22) 3 y0 ( 2 y0 ) (y2 - 2y1 + y0 ) y2 2y1 y0 (y3 - y2 ) - 2(y2 - y1 )+(y1 - y0 ) y3 - 3y2 + 3y1 - y0 (4.2.23) Lo anterior sugiere la fórmula llamada de Newton, el polinomio de grado n, que pasa por el conjunto de n datos igualmente espaciados en los valores de las xi , estará dado por: Pn ( x) y0 y0 2 y n y ( x x0 ) + 20 (x - x0 )(x - x1 ) ... n0 (x - x0 )(x - x1 )...( x xn1 ) (4.2.26) h 2!h n !h cuya demostración puede desarrollarse por inducción matemática. 75 Una manera práctica para obtener las diferencias se muestra en la tabla 4.1 x0 y0 y0 2 y0 x1 y1 y1 3 y0 2 y1 x2 y2 4 y0 y2 3 y1 2 y2 x3 y3 5 y0 4 y1 y3 3 y2 2 y3 x4 y4 y4 x5 y5 Tabla 4.1 Se observa rápidamente que: y0 y1 y0 , 2 y0 y1 y0 , 3 y0 2 y1 2 y0 etc. . Para muchos propósitos es deseable una fórmula para la interpolación, que pueda ser expresada explícitamente en términos de las ordenadas. Estas fórmulas, permiten una consideración más inmediata sobre el efecto del resultado final de un cambio o error, en una o más de las ordenadas Ejemplo 4.2.1 Encontrar el polinomio de colocación para el siguiente conjunto de parejas ordenadas. x y 2 1 4 -1 6 1 8 -1 10 1 Solución: Utilizando la forma de la tabla 4.1 ordenamos para obtener la tabla 4.2. 76 n 0 x 2 y 1 Δyk Δ 2 yk Δ 3 yk Δ 4 yk -2 1 4 -1 4 2 2 6 1 3 8 -1 4 10 1 -8 -4 16 -2 8 4 2 Tabla 4.2 El valor de h, lo obtendremos restando las componentes xn – xn-1 esto es: h = 4 – 0 = 6 – 4 = 8 – 6 = 10 – 8 = 2 y de la fórmula 4.2.26 obtenemos: (-2) 4 (x - 2)+ (x - 2)(x - 4)+ (2) 2!(2)2 (-8) (16) (x - 2)(x - 4)(x - 6)+ (x - 2)(x - 4)(x - 6)(x - 8) 3 3!(2) 4!(2)4 Pn (x)= 1+ o bien: 1 Pn (x)= 1- (x - 2)+ (x - 2)(x - 4) 2 1 1 - (x - 2)(x - 4)(x - 6)+ (x - 2)(x - 4)(x - 6)(x - 8) 6 24 cuya simplificación es un polinomio satisface los valores dados: 1 4 3 25 2 Pn (x)= x - x + x - 28x+31 24 3 Ejemplo 4.2.2 Encontrar el polinomio de colocación para el siguiente conjunto de parejas ordenadas. x y 1.4 0.5 1.5 0.2 1.6 0.04 1.7 -0.18 1.8 -0.6 77 Solución: Utilizando la forma de la tabla 4.1 ordenamos para obtener la tabla 4.2. n 0 x 1.4 y 0.5 1 1.5 0.2 2 1.6 0.04 Δyk Δ 2 yk Δ 3 yk Δ 4 yk -0.3 0.14 -0.16 -0.2 -0.06 -0.22 3 1.7 -0.18 0.06 -0.14 -0.2 -0.42 4 1.8 -0.6 Tabla 4.2 En este caso, el valor de h = 0.1 y de la fórmula 4.2.26 se tiene: (-0.3) (0.14 ) (x - 1.4)+ (x - 1.4)(x - 1.5)+ 1!(0.1) 2!(.1)2 (-0.2) (0.06) (x - 1.4)(x - 1.5)(x - 1.6)+ (x - 1.4)(x - 1.5)(x - 1.6)(x - 1.7) 3 3!(0.1) 4!(0.1)4 Pn (x)= 0.5 + o bien: 1 - 3(x - 1.4)+7(x - 1.4)(x - 1.5) 2 100 (x - 1.4)(x - 1.5)(x - 1.6)+ 25(x - 1.4)(x - 1.5)(x - 1.6)(x - 1.7) 3 Pn (x) = simplificando obtenemos un polinomio de cuarto grado que satisface completamente los valores dados: 565 3 2067 2 7421 1371 x + x x+ 3 4 12 5 Un polinomio de colocación P(x) para argumentos desigualmente espaciados x0, x1, ..., xn, es también de mucha importancia y puede hallarse de diversas formas, una de ellas se mostrara en el método que veremos en la siguiente sección. Pn (x)= 25x 4 - 78 4.3 Polinomio de Lagrange La forma del polinomio P(x) de grado n, el cual toma los mismos valores que f(x) para las n + 1 abscisas desigualmente espaciadas x0, x1, ..., xn, difiere de la fórmala de Newton derivada anteriormente. Como una primer aproximación, podríamos escribir y(x) en la forma: n P(x) = anxn + an-1xn-1 + … +a2x2 + a1x + a0 ak x k (4.3.1) k 0 donde ak para k = 0,1,…,n, se determinan de tal forma que P(xk) ≈ f(xk). Estos valores se obtienen al resolver las n + 1 ecuaciones lineales que se presentan, al sustituir las abscisas en el polinomio de aproximación, esto es: an x0 n + an-1x0 n-1 + … +a2 x0 2 + a1x0 + a0 = f(x0) an x1 n + an-1x1 n-1 + … +a2 x1 2 + a1x1 + a0 = f(x1) ………………………………………………………… an xn n + an-1xn n-1 + … +a2 xn 2 + a1xn + a0 = f(xn) (4.3.2) Las ecuaciones anteriores, pueden ser resueltas por algún método conocido, pero el más eficiente, aunque laborioso, es la regla de Cramer. Conlleva una gran cantidad de operaciones que hacen gravoso el poder determinar estos valores. En las siguientes aproximaciones, podemos formar el polinomio de colocación para el caso de dos y tres ordenadas. P(x)= a0 +a1x+a2 x2 (4.3.8) Si sustituimos los puntos dados, se presenta el siguiente sistema de ecuaciones lineales: 79 a0 + a1 x0 + a2 x02 = f(x0) a0 + a1 x1 + a2 x12 = f(x1) a0 + a1 x2 + a2 x22 = f(x2) (4.3.9) cuya solución por el método de Cramer Li ( x) ( x x0 )( x x1 ) ( xi x0 )( xi x1 ) ( x xk 1 )( x xk 1 ) ( x xn ) ( xi xk 1 )( xi xk 1 ) ( xi xn ) (4.3.11) el polinomio de colocación puede escribirse: n P( x) Li ( x) f ( xi ) (4.3.12) i 0 expresión mas compacta de los multiplicadores de Lagrange. La expresión 4.3.11 para encontrar Li(x), es la más útil en consideraciones de cálculos reales de la función multiplicadora de Lagrange, mientras que la expresión 4.3.16 es útil, solo en consideraciones teóricas. Ejemplo 4.3.1 Encontrar el polinomio de colocación para el siguiente conjunto de parejas ordenadas. x y 0 1 1 1 2 2 4 5 Solución: x - 1 x - 2 (x - 4) 0 - 1 0 - 2 (0 - 4) x - 0 x - 1 (x - 4) L2 = 2 - 0 2 - 1 (2 - 4) L0 = de donde: 80 x - 0 x - 2 (x - 4) 1 - 0 1 - 2 (1 - 4) x - 0 x - 1 (x - 2) L3 = 4 - 0 4 - 1 (4 - 2) L1 = (1) (1) (x - 1)(x - 2)(x - 4)+ (x)(x - 2)(x - 4) (-8) (3) (2) (5) + (x)(x - 1)(x - 4)+ (x)(x - 1)(x - 2) (-4) 24 P(x) = simplificando obtenemos el siguiente polinomio de grado tres: P(x)= - 1 3 3 2 2 x + x - x +1 12 4 3 Ejemplo 4.3.2 Encontrar el polinomio de colocación para el siguiente conjunto de parejas ordenadas. x y 1.1 0.11 1.3 0.21 Solución: x - 1.3 x - 1.7 (x - 1.9) 1.1- 1.31.1- 1.7 (1.1- 1.9) x - 1.1 x - 1.3 (x - 1.9) L2 = 1.7 - 1.11.7 - 1.3 (1.7 - 1.9) L0 = 1.7 0.42 1.9 0.51 x - 1.1 x - 1.7 (x - 1.9) 1.3 - 1.11.3 - 1.7 (1.3 - 1.9) x - 1.1 x - 1.3 (x - 1.7) L3 = 1.9 - 1.11.9 - 1.3 (1.9 - 1.7) L1 = de donde: P(x)= + 0.11 - 12 125 0.42 - 6 125 x - 1.3 x - 1.7 (x - 1.9)+ x - 1.1 x - 1.3 (x - 1.9)+ 0.21 6 125 0.51 12 125 x - 1.1 x - 1.7 (x - 1.9) x - 1.1 x - 1.3 (x - 1.7) simplificando obtenemos el siguiente polinomio de grado tres: P(x) = - 5 3 43 2 359 121 x + x x+ 24 48 480 960 el cual ajusta completamente cada uno de los valores. 81 4.4 Regresión de Mínimos Cuadrados En innumerables experimentos encontramos relaciones entre dos o más variables las cuales es posible describirlas mediante funciones, polinomiales, como en las secciones 4.2 y 4.3 ajustables a un pequeño número de datos, ya sea igual o desigualmente espaciados, según el método. En esta sección consideraremos el problema de "ajustar" una función a un número grande de datos que contienen virtualmente un cierto grado de error. El ajustar un polinomio o interpolar datos resulta inapropiado, cuando buscamos una función que en cierto sentido ajuste a nuestros datos, ya que si deseamos encontrar un valor intermedio, quizá no concuerde con un valor real que hayamos tomado. Para esto trataremos de suavizar la incertidumbre en los datos y a la ves que prevalezcan las características de estos. En el método de mínimos cuadrados, se desea minimizar la suma de los cuadrados de las diferencias entre los datos y la función para aproximarlos, con ciertos criterios al ajustarlos. En cada caso debemos encontrar una función que aproxime el comportamiento de los datos o bien, si conocemos las relaciones que existen entre las variables, encontrar la ecuación que las relacione mediante el método de mínimos cuadrados. Supongamos que al desarrollar cierto experimento, hemos obtenido un conjunto de datos (x0, y0), (x1, y1),…,(xn, yn), que al realizar los diagramas de dispersión, nos “sugieren” cierto comportamiento con el que podemos 82 proponer una función que se adecue a ellos, escribiendo su estimación ye, con funciones como las que se muestra en la tabla 4.3: Lineal Cuadrática Cúbica Polinomial Exponencial ye = a0 + a1 x ye = a0 + a1 x + a2 x2 ye = a0 + a1 x + a2 x2+ a3 x3 ye = a0 + a1 x + a2 x2+ a3 x3+…+anxn ye ab x Geométrica ye axb Gompertz Hiperbólica ye pqb x 1 a0 a1 x ye Tabla 4.3 Recta de Mínimos Cuadrados El modelo más sencillo de aproximación, para el conjunto de datos (x0, y0), (x1, y1),…,(xn, yn), es el modelo Lineal o línea recta que representaremos de la siguiente manera: ye = a0 + a1 x + d (4.4.1) donde a0 es la ordenada al origen, a1 la pendiente y d es el error entre el los datos observados y el modelo. El problema consiste es determinar los valores a0 y a1 de manera que la recta que obtengamos sea lo más próxima a los datos y que las distancias del valor real a la recta de ajuste sea en general lo más pequeña posible, como lo muestra la grafica 4.1. 83 f(xi) di yi xi Graf. 4.1 La medida de la desviación del conjunto de valores calculados{f(x0), f(x1),…,f(xn)} y de los datos {y0, y1,…,yn} medidos, es el promedio de las desviaciones cuadráticas: d02= (f(x0) – y0 )2, d12= (f(x1) – y1)2,…, dn2= (f(xn) – yn)2 el cual estará dado por: n n M d di2 yi a0 a1 xi i 0 2 (4.4.2) i 0 para determinar los valores a0 y a1 , derivamos la ecuación 4.4.2 respecto a cada uno de los coeficientes: 84 n M d 2 yi a0 a1 xi a0 i 0 (4.4.3) n M d 2 yi a0 a1 xi xi a1 i 0 (4.4.4) Como M(a0 , a1 ) ≥ 0, obtendremos la mejor aproximaron cuando M(a0 , a1 ) sea mínimo, siendo necesario igualar las parciales a cero para encontrar los valores que hacen mínima la función, de esto obtenemos: n n n i 0 i 0 yi a0 a1 xi 0 i 0 n n n i 0 i 0 i 0 yi xi a0 xi a1 xi2 0 n dado que: a i 1 0 na0 (4.4.5) podemos escribir las ecuaciones 4.4.5 como un conjunto de dos ecuaciones lineales con dos incógnitas de esta manera: n n na0 xi a1 yi i 0 i 0 n n n 2 x a x a i 0 i 1 yi xi i 0 i 0 i 0 (4.4.6) A las ecuaciones 4.4.6 se les da el nombre de ecuaciones normales, que al resolver, por algún método de solución, nos arroja: n n 2 n n yi xi xi xi yi a0 i0 i0 i0 2i0 n n n xi2 xi i 0 i 0 n n n n xi yi xi yi i 0 i 0 a1 i 0 2 n n 2 n xi xi i 0 i 0 Una manera sencilla de obtener las ecuaciones normales apartir del modelo lineal, ye = a0 + a1 x , es aplicar sumatoria en ambos lados de esta, así obtenemos la primer ecuación normal, luego multiplicamos por x a la ecuación modelo y nuevamente aplicamos sumatorias, con esto obtenemos el sistema 4.4.5, del cual se desprende la solución obtenida de a0 y a1 . 85 Por lo regular x siempre es la variable independiente. De no ser así, esto es, de que x sea la variable dependiente, escribiremos x = b0 + b1 y , los resultados anteriores son validos, pero intercambiando x e y, esto es: n n 2 n n xi yi yi yi xi b0 i0 i0 i0 2i0 n n n yi2 yi i 0 i 0 n n n n yi xi yi xi i 0 i 0 b1 i 0 2 n 2 n n yi yi i 0 i 0 Ejemplo 4.4.1 Ajuste el siguiente conjunto de datos a una recta de mínimos cuadrados. x y 1.3 15.1 1.4 16.2 1.7 15.9 1.8 18.4 1.9 17.5 2.1 20.1 Solución: Para encontrar la recta de mínimos cuadrados efectuaremos las operaciones necesarias en la tabla 4.4. ∑ x 1.3 1.4 1.7 1.8 1.9 2.1 10.2 y 15.1 16.2 15.9 18.4 17.5 20.1 103.2 x2 1.69 1.96 2.89 3.24 3.61 4.41 17.8 xy y2 19.63 228.01 22.68 262.44 27.03 252.81 33.12 338.56 33.25 306.25 42.21 404.01 177.92 1792.08 Tabla 4.4 Sustituyendo en las ecuaciones normales 4.4.6 obtenemos: 6 a0 + 10.2 a1 = 103.2 10.2 a0 + 17.8 a1 = 177.92 cuya solución es: a0 = 8.034782609 a1 = 5.391304348 86 ye 15.0435 15.5826 17.2000 17.7391 18.2783 19.3565 de donde la recta de mejor ajuste será: ye = 8.034782609 + 5.391304348 x Parábola de Mínimos Cuadrados Si al efectuar la distribución de los datos gráficamente observamos que estos tienen un comportamiento cuadrático, el modelo a ajustar será la ecuación ye = a0 + a1 x + a2 x2 + d (4.4.7) Ahora el problema consiste es determinar los valores a0 , a1 y a2 de manera que la parábola que obtengamos sea la de mejor ajuste en general. para determinar los valores a0, a1 y a2 , resolveremos: n n n 2 na0 xi a1 xi a2 yi i 0 i 0 i 0 n n n 2 n 3 x a x a x a i 0 i 1 i 2 yi xi i 0 i 0 i 0 i 0 n n 2 n 3 n 4 2 xi a0 xi a1 xi a2 yi xi i 0 i 0 i 0 i 0 (4.4.8) que son tres ecuaciones con tres incógnitas, los cuales pueden ser resueltos por cualquier método conocido. Ejemplo 4.4.2 Ajuste el siguiente conjunto de datos a una recta de mínimos cuadrados. x y 6 8 3.8 3.7 10 4 12 14 3.9 4.3 16 4.2 18 20 22 24 4.2 4.4 4.5 4.5 Solución: Para encontrar la recta de mínimos cuadrados efectuaremos las operaciones necesarias en la tabla 4.5. 87 x y 6 3.8 8 3.7 10 4 12 3.9 14 4.3 16 4.2 18 4.2 20 4.4 22 4.5 24 4.5 ∑ 150 41.5 x2 36 64 100 144 196 256 324 400 484 526 2580 x3 216 512 1000 1728 2744 4096 5832 8000 10648 13824 48600 x4 1296 4096 10000 20736 38416 65536 104976 160000 234000 331776 971088 xy 22.8 29.6 40 46.8 60.2 67.2 75.6 88 99 108 637.2 x2y 136.8 236.8 400 561.6 842.6 1075.2 1360.8 1760 2178 2592 11144 y2 14.44 13.69 16 15.21 18.49 17.64 17.64 19.36 20.25 20.25 172.97 ye 3.7263 3.8306 3.9311 4.0277 4.1206 4.2097 4.2950 4.3765 4.4542 4.5282 Tabla 4.5 Sustituyendo en las ecuaciones normales 4.4.10 obtenemos: 10 a0 + 150 a1 + 2580 a2 = 41.5 150 a0 + 2580 a1 + 48600 a2 = 637.2 2580 a0 + 48600 a1 + 971088 a2 = 11144 cuya solución es: a0 = 3.390909091 a1 = 0.05875 a2 = -0.0004734848 de donde la parábola de mejor ajuste será: ye = 3.390909091+ 0.05875x – 0.0004734848x2 Si se ajustan los datos a la ecuación ye = a0 + a1 x +a2 x2 + a3 x3+ d las ecuaciones normales que se deben resolver para obtener los coeficientes a0, a1, a2, a3, son: 88 n n n n na0 xi a1 xi2 a2 xi3 a3 yi i 0 i 0 i 0 i 0 n n n 2 n 3 n 4 x a x a x a x a yi xi i 0 i 1 i 2 i 3 i 0 i 0 i 0 i 0 i 0 n n 2 n 3 n 4 n 5 2 x a x a x a x a i 0 i 1 i 2 i 3 yi xi i 0 i 0 i 0 i 0 i 0 n n 3 n 5 n 6 n 7 x a x a x a x a yi xi3 (4.4.11) i 0 i 1 i 2 i 3 i 0 i 0 i 0 i 0 i 0 Regresión exponencial Si deseamos encontrar una aproximación ya sea por conocimiento del experimento o por el comportamiento de los datos, del tipo: ye = cbx (4.4.12) podemos transformar 4.4.12, aplicando logaritmos base 10, a cada extremo de la ecuación, así mismo utilizando propiedades le los logaritmos como: Log(AB) = Log(A) + Log(B) obtenemos: Log(AM ) = MLog(A) Log ye = Log (cbx)=Log c + x Log b (4.4.13) Si hacemos a0 =Log c, a1 = Log b y y = Log ye , la ecuación 4.4.13 se puede expresar como una ecuación lineal del tipo 4.4.1 en donde las ecuaciones normales estarán dadas por 4.4.6, de esta manera para encontrar los valores de c y b podemos obtenerlos utilizando antilogaritmo base 10, esto es: c = 10 a0 y b = 10 a1 Entre algunos experimentos donde se puede establecer una relación exponencial se encuentran, explosión demográfica, desintegración atómica, comportamiento de voltajes, vibraciones, temperatura, presión, crecimiento de bacterias, etc. etc. . 89 Regresión Hiperbólica En el caso de obtener datos con comportamientos asintóticos, del tipo hiperbólico como: ye 1/(a0 a1 x) ó 1/ ye a0 a1 x , las ecuaciones normales que tendrán que resolverse para encontrar los coeficientes a0 y a1 son: n 1 n na0 xi a1 i 0 yi i 0 n xi n n 2 x a x a i 0 i 1 y i 0 i i 0 i 0 Una vez que ya hemos encontrado la ecuación estimada ye ,es importante hablar del error en esta estimación, lo que denominamos en la sección 1.3 error típico. Si ye (y estimada o aproximada) es el valor de y para los valores dados de x, la medida de su dispersión o error típico, lo estableceremos como: n ey ,x y y 2 e i 0 (4.4.14) n la cual puede escribirse como: ey2, x n n n i 0 i 0 i 0 y 2 a0 y a1 xy (4.4.15) n que podemos utilizar de acuerdo con las tablas de operaciones que hemos descrito anteriormente facilitándonos el cálculo el error. En estadística es importante encontrar una buena relación entre las variables, de esta manera se puede decir que el modelo que se propone explica el experimento en buena medida. Para esto es necesario encontrar la media de y y definir la variación total como: 90 n y y 2 (4.4.16) i 0 donde y es la media de y. Esta ultima expresión, al manipularse algebraicamente, proporciona información sobre el modelo. Así podemos escribir que: variación total = variación explicada + variación no explicada El coeficiente de determinación se define como la razón entre la variación explicada y la variación total, conocido también en estadística como coeficiente de correlación, dado por: n r2 = variación explicada variación total y i 0 n e y y y 2 (4.4.19) 2 i 0 En esta ultima relación observamos que si el cociente es cero, toda la variación es no explicada o bien la variación explicada es cero. Si la variación no explicada es cero, podemos explicar mediante el modelo, el experimento en su totalidad y el cociente es igual a 1. En cualesquier otro caso dicho coeficiente estará en el intervalo de (0, 1). En el caso de querer encontrar la correlación lineal podemos utilizar la siguiente fórmula: r n n n n xy x y i 0 i0 i0 (4.4.20) n 2 n 2 n 2 n 2 n x x n y y i0 i0 i0 i0 91 En caso de querer obtener la correlación de otro modelo se acudirá a la fórmula 4.4.19. El valor r mide el grado de relación entre las variables y el modelo que adoptamos. Por lo regular su variación esta en el intervalo de (-1, 1), siendo utilizado el signo + o – , como correlación positivas o negativas respectivamente. Si el valor de r es cero o próximo a cero, significa que no existe correlación alguna entre las variables. Un coeficiente de correlación cercano al ± 1 no indica una dependencia directa entre las variables, ya que el experimento puede carecer de sentido. Ejemplo 4.4.3 Encuentre el coeficiente de correlación para el ejercicios 4.4.1 utilizando la fórmula 4.4.20 Solución: Para encontrar el coeficiente de correlación del ejercicio 4.4.1 utilizaremos la información de la tabla 4.4 ∑ x 10.2 y 103.2 x2 17.8 xy 177.92 y2 1792.08 Sustituyendo estos valores en la ecuación 4.4.20 obtenemos r= 6(177.92) - 10.2 103.2 6 17.8 - 10.2 2 6 1792.08 - 103.2 2 = 0.885804 el experimento puede ser explicado por el modelo en un 88.6 %. Ejemplo 4.4.4 Encuentre el coeficiente de correlación para el ejercicios 4.4.2 utilizando la fórmula 4.4.19 Solución: En este caso utilizaremos parte de la tabla 4.5 agregado las columnas ( ye y ) 2 y ( y y )2 , como muestra la tabla 4.6, para esto primero calcularemos la media de y : 92 y x y 6 3.8 8 3.7 10 4 12 3.9 14 4.3 16 4.2 18 4.2 20 4.4 22 4.5 24 4.5 ∑ 150 41.5 y 41.5 = 4.15 n 10 ( ye y ) 2 ye 3.7263 3.8306 3.9311 4.0277 4.1206 4.2097 4.2950 4.3765 4.4542 4.5282 0.1794 0.1020 0.0479 0.0140 0.0009 0.0036 0.0210 0.0513 0.0925 0.1430 0.6566 ( y y )2 0.1225 0.2025 0.0225 0.0625 0.0225 0.0025 0.0025 0.0625 0.1225 0.1225 0.7450 Tabla 4.6 r 2 ( y y) ( y y) 2 e 2 0.6566 = 0.88134 0.745 de donde r = 0.9388. Con esto, podemos decir que, el experimento, al cual correspondan estos valores, puede explicarse por el modelo en un 93.88%. 93 4.5 Aplicaciones El problema de ajuste a una ecuación con un conjunto de puntos por el momento tiene dos interpretaciones de aproximación. La primera fue buscar la ecuación de una curva que pasó exactamente por cada uno de los puntos del conjunto de datos, generando así una ecuación polinomial ya fuese con datos igualmente espaciados o no, como fueron los métodos de Newton y Lagrange. La otra es la Regresión Lineal, en donde aplicamos ecuaciones, llamadas normales, que quizá no son tan rígidas, donde solo buscamos curvas que dependen del comportamiento de los datos o de la experiencia, con ecuaciones que relacionen fenómenos con un número reducido de parámetros, de tal suerte que, sin pasar exactamente por cada punto dado, nos aproximemos lo más posible a ellos. El segundo método es el más utilizado para aplicaciones en pronósticos o predicciones numéricas, ya que es un modelo estadístico que involucra un error minimizado, partiendo de un conjunto de datos observados. Ejemplo 4.5.1 La tabla 4.7 muestra la cuenta de un inversionista el cual al cabo de 6 años duplico su capital inicial. t(años) P(Capital) en millones Tabla 4.7 0 1 2 3 4 5 6 1 1.13 1.26 1.42 1.59 1.78 2 Si se sabe que en la cuenta se compone al interés continuamente, ajuste estos datos a este tipo de ecuación. Solución: Sea P = cantidad depositada, t = número de años, A = balance al final de esos años, i = tasa de interés anual, la fórmula correspondiente para el balance A, utilizando interés compuesto estará dada por la función de crecimiento exponencial: A = P e it 94 Pero dado que P = 1 millón de pesos, inicialmente, entonces, A = e i t de donde aplicando logaritmos a ambos miembro de esta ecuación obtenemos: ó Ln A = Ln e i t Generando así la ecuación normal Ln A = i t n n i 1 i 1 LnA i t para obtener despejando i, n i LnA i 1 n t i 1 el interés. Para esto utilizaremos la tabla 4.8 t(años) 0 1 2 3 4 5 6 ∑ 21 A(balance) 1 1.13 1.26 1.42 1.59 1.78 2 10.18 t2 0 1 4 9 16 25 36 91 LnA 0 0.1222176 0.2311117 0.3506569 0.4637340 0.5766134 0.6931472 2.4374808 tLnA 0 0.1222176 0.4622234 1.0519707 1.854936 2.883067 4.1588832 10.5332979 Aest 1 1.12 1.26 1.42 1.59 1.79 2.01 Tabla 4.8 i= 2.4374808 = 0.116070514 = 11.60% 21 de donde, A = e 0.1160705 t. En la tabla 4.8 se muestran los valores estimados del balance en la última columna Aest. 95 Ejemplo 4.5.2 Al ser lanzado un objeto desde un punto A, a un punto B en el mismo nivel, se describió su movimiento casi parabólico, el cual al ser medido mediante fotografías de video a escala se estableció la siguiente relación, entre X = distancia horizontal e Y = distancia vertical, ambas en metros(m). X Y 0 1.2 4 2.1 8 3.2 12 4.3 16 5.6 20 5.5 24 4.2 28 3.1 32 2.2 36 1.1 Ajuste estos datos a una ecuación cuadrática. Solución: La tabla 4.9 muestra los valores necesarios para ser sustituidos en las ecuaciones normales del modelo cuadrático. x 0 4 8 12 16 20 24 28 32 36 ∑ 180 y 1.2 2.1 3.2 4.3 5.6 5.5 4.2 3.1 2.2 1.1 32.5 x2 x3 x4 xy x2y 0 16 64 144 256 400 576 784 1024 1296 4560 0 64 512 1728 4096 8000 13824 21952 32768 46656 129600 0 256 4096 20736 65536 160000 331776 614656 1048576 1679616 3925248 0 8.4 25.6 51.6 89.6 110 100.8 86.8 70.4 39.6 582.8 0 33.6 204.8 619.2 1433.6 2200 2419.2 2430.4 2252.8 1425.6 13019.2 yest 0.8 2.5 3.7 4.5 4.9 4.9 4.5 3.6 2.4 0.8 Tabla 4.9 Sustituyendo en las ecuaciones normales 4.4.10 obtenemos: 10 a0 + 180 a1 + 4560 a2 = 32.5 180 a0 + 4560 a1 + 129600 a2 = 582.8 4560 a0 + 129600 a1 + 3925248 a2 = 13019.2 cuya solución es: a0 = 0.834545454, a1 = 0.4568560, a2 = – 0.012736742 de donde la parábola de mejor ajuste será: yest = 0.834545454+ 0.456856606x – 0.012736742x2 96 Ejemplo 4.5.3 Personal del departamento de Epidemiología analizo una muestra del crecimiento de cierto mosquito, en una laguna cercana al área metropolitana registrando los siguientes datos: t(días) 1 2 3 4 P(población) 52 93 203 312 Si se sabe que el crecimiento aumenta de acuerdo con la ley de crecimiento exponencial, ajuste estos datos a la ecuación P = C ekt. Solución: Dada la ecuación P = C ekt , efectuaremos una transformación utilizando logaritmos como se menciono en la sección 4.4, para obtener: LnP LnC kt de la cual podemos obtener las siguientes ecuaciones normales: n n nLnC t k LnP i 0 i 0 n n 2 n t LnC t k tLnP i 0 i 0 i 0 Enseguida se muestra en la tabla 4.10 las operaciones necesarias para obtener las ecuaciones normales para poder resolverlas. t 1 2 3 4 ∑ 10 P 52 93 203 312 660 t2 1 4 9 16 30 LnP 3.951243719 4.532599493 5.313205979 5.743003188 19.54005238 tLnP 3.951243719 9.065198986 15.939661794 22.97201275 51.9280734 Pest 53 98 180 334 Tabla 4.10 De donde obtenemos las siguientes ecuaciones: 4 LnC 10k 19.54005238 10 LnC 30k 51.9280734 97 al resolver, mediante algún método LnC = 3.34604187 de donde C = 28.3901391 ecuación exponencial estará dada por: conocido, obtenemos y k = 0.61558849. La Pest = 28.39 e0.6155t Ejemplo 4.5.4 La temperatura de cierto alimento, en las primeras cuatro horas de ser sometido a enfriamiento se muestra enseguida: t(horas) 1 2 3 4 T(0C) 23 14 10 8 Si se sabe que la temperatura disminuye asintóticamente hasta llegar a la temperatura del medio ambiente que conserva el enfriador. Ajuste estos datos a una ecuación del tipo Hiperbólico y 1/(a0 a1 x) . Solución: Las ecuaciones normales para encontrar los coeficientes a0 y a1 son: n 1 n na0 ti a1 i 0 Ti i 0 n ti n n 2 t a t a i 0 i 1 T i 0 i i 0 i 0 y para obtener el sistema de ecuaciones lineales generamos la tabla 4.11: t 1 2 3 4 ∑ 10 T 23 14 10 8 55 t2 1 4 9 16 30 1/T 0.04347826 0.071428571 0.1 0.125 0.339906831 t/T 0.04347826 0.142857142 0.3 0.5 0.986335402 Test 22.7 14.02 10.13 7.94 Tabla 4.11 Obteniendo así el siguiente conjunto de ecuaciones lineales: 4a0 + 10a1 = 0.339906831 98 10a0 + 30a1 = 0.986335402 que al resolver, mediante algún método conocido, se obtiene a0=0.016692545 y a1 = 0.027313664 con los cuales se obtiene la ecuación pedida: y 1/(0.0166925 0.0273136 x) . PROBLEMAS CAPÍTULO IV 1.- A partir de la expansión en series de Taylor, encuentre una expresión para cada una de las siguientes funciones: a) sen x 2 d) b) cos x e) c) e x - e -x 2 f) e x + e -x 2 x e - e -x x 1 - cosx x2 2.- Si yn yn1 yn , encuentre esta diferencia para cada una de las siguientes funciones: a) yn = c , c = constante c) yn = n(n-1)(n-2)(n-3) b) yn = n(n-1) d) yn = n(n-1)(n-2)(n-3)…(n – k+1) c) yn = n(n-1)(n-2) 3.- En cada caso construya el polinomio de Newton, utilizando la tabla de diferencias finitas, para los datos que se presentan. a) b) x -2 -1 0 1 2 y 4 6 9 3 8 x 0 2 4 6 8 y 1 -1 1 1 -1 c) d) x 0 1.5 3 3.5 4 y 1.6 3.7 7.9 11.8 16.7 x 0 3 6 9 y 1.01 2.17 3.45 4.63 99 4.- Construya un polinomio, utilizando la fórmula de Lagrange, en cada uno de los siguientes conjuntos de datos: x 0 1 3 a) y 1 1 5 x c) 0 2 x 0 1 3 4 b) 3 5 y 1 5 4 6 x 0 d) y -1 1 -1 1 1 4 y 0 16 5 88 620 5.- Para el siguiente conjunto de datos encuentre una aproximación lineal, por el método de mínimos cuadrados. a) x 0 1 2 3 b) x 63 67 68 70 72 67 68 4 y 65 68 67 71 68 69 70 y 3.94 4.06 5.42 9.89 11.43 6.- Encuentre un ajuste de mínimos cuadrados cuadrático para el siguiente conjunto de datos. x 10 20 30 40 50 60 70 y 15 60 90 140 200 280 400 7.- El número de bacterias que se desarrollan en un cultivo por unidad de volumen en t horas, se muestra enseguida: t(hrs.) 0 1 2 3 4 5 y bacterias por 40 52 70 110 150 215 unidad de volumen Ajuste estos datos a: a) Una curva de mínimos cuadrados de la forma y = ex b) Una curva de mínimos cuadrados de la forma y = abx c) Cual de las dos ecuaciones arroja mejores resultados de aproximación. d) Estime el número de bacterias para, t = 6, t = 7. 100 Capítulo 5 Diferenciación e Integración numérica En el estudio del Cálculo, se encuentran dos de los procesos al límite fundamentales, la derivada e integral de funciones, definidas dentro de un intervalo I(a,b). Es ahí donde aprendimos diferentes reglas para derivar e integrar, siempre que pudiesen expresarse en términos de funciones elementales. Lamentablemente, en la práctica al incrementar o decremantar una de las variables, se desarrollan cálculos en donde las definiciones originales son de gran utilidad, ya que no existe manera de encontrar la derivada o la integral mediante técnicas aprendidas en el cálculo. Dos ejemplos simples son: a) Al fabricar un disco compacto, su volumen estará dado por V (rM rm )h donde rM y rm son respectivamente radio mayor y radio menor del disco. Si se cambia las dos o tres variables en una cantidad pequeña (ya sea que aumenta o disminuya) el cálculo del volumen, para obtener la cantidad de material en su fabricación, puede complicarse. b) Al querer obtener el volumen de un tanque de transportación de líquidos el cual tiene una gran cantidad de remaches en su fabricación que disminuyen en el interior el volumen, con técnicas de integración seria imposible obtenerlo. Este tipo de problemas es el causante de retomar las definiciones, tanto la derivada como la integral, que son de gran utilidad para el cálculo de estos problemas. 101 5.1 Diferenciación numérica La definición de derivada de una función como un límite lleva implícito un método de aproximación numérica o infinitesimal, ya que se desarrolla a partir de: f '( x) f ( x h) f ( x ) h (5.1.1) el proceso al límite es lo que produce la derivada de una función cuando la longitud del intervalo o de paso h tiende a ser pequeña. Podemos hablar de la definición de derivada hacia delante h > 0: f '( x) lim h0 f ( x h) f ( x ) h (5.1.2) o bien de la definición de derivada hacia atrás h < 0: f '( x) lim h0 f ( x h) f ( x ) f ( x ) f ( x h) lim h0 h h (5.1.3) ambos casos son definiciones útiles para encontrar la derivada de una función. Otra expresión para f’(x) podemos obtenerla promediando las derivadas hacia delante y hacia atrás de la siguiente manera: f '( x) 1 f ( x h) f ( x ) f ( x ) f ( x h) lim lim h0 2 h0 h h de donde: f '( x) lim h0 f ( x h) f ( x h) 2h de esta manera, podemos derivar una función numéricamente. 102 (5.1.4) El siguiente ejemplo muestra el comportamiento de las derivadas una ves que se ha seleccionado un tamaño de paso pequeño no nulo h, para calcular f’(x). Ejemplo 5.1.1 Calcular la derivada numérica de f(x) = x2 utilizando 5.1.2, 5.1.3, 5.1.4 Solución: Utilizando la fórmula 5.1.2: f ( x h) f ( x ) (x + h)2 - x 2 x 2 + 2xh + h 2 - x 2 lim lim h0 h0 h0 h h h h 2x h lim lim 2 x h 2 x h0 h0 h f '( x) lim Utilizando la fórmula 5.1.3: f ( x ) f ( x h) x 2 - (x - h)2 x 2 - (x 2 - 2xh+ h 2 ) lim lim h0 h0 h0 h h h h 2x - h lim lim 2x - h = 2x h0 h0 h f '( x) lim Utilizando la fórmula 5.1.4: x + h - (x - h)2 f(x + h) - f(x - h) f '( x) lim lim = h 0 h 0 2h 2h (x 2 + 2xh + h 2 ) - (x 2 - 2xh + h 2 ) 4xh lim lim lim 2x = 2x h 0 h0 2h h 0 2h 2 En el caso de que h no sea lo suficientemente pequeño, esto es, que no tienda a cero, la derivada de f(x) = x2 será f‘(x) = 2x+ h, f‘(x) = 2x – h o f‘(x) = 2x, que son las derivadas numéricas de f con longitud de paso h. Puede observarse que en el caso de la derivada promedio el error desaparece obteniendo así la derivada exacta de f(x) mientras que en las derivadas hacia adelante o atrás aparece un error proporcional a h. 103 Geométricamente la derivada de f(x) es la pendiente de la recta tangente a la curva en un punto (c, f(c)) como se muestra en la figura 5.1. Las derivadas hacia delante y hacia atrás se muestran con la misma pendiente, mientras que la derivada promedio da una aproximación central de las dos. Pendiente f (c h ) f (c ) h Pendiente f’(c) exacta Pendiente f (c h ) f (c h ) 2h c+h c c-h Fig. 5.1 El lector puede demostrar cualquier fórmula de derivación numérica del siguiente listado, siguiendo el procedimiento de los ejercicios anteriores: Primeras y segundas derivadas hacia atrás: f '( x) f ( x ) f ( x h) h f '( x) 3f(x) - 4f(x - h)+ f(x - 2h) 2h f ''( x) f(x) - 2f(x - h)+ f(x - 2h) h2 f ''( x) 2f(x) - 5f(x - h)+ 4f(x - 2h) - f(x - 3h) h2 Primeras y segundas derivadas centradas: f '( x) 104 f ( x h) f ( x h) 2h f '( x) -f(x + 2h)+ 8f(x + h) - 8f(x - h)+ f(x - 2h) 12h f ''( x) f ''( x) f(x + h) - 2f(x)+ f(x - h) h2 -f(x + 2h)+16f(x + h) - 30f(x)+16f(x - h) - f(x - 2h) 12h 2 Primeras y segundas derivadas hacia delante: f '( x) f '( x) f ( x h) f ( x ) h -f(x + 2h)+ 4f(x + h) - 3f(x) 2h f ''( x) f(x + 2h) - 2f(x + h)+ f(x) h2 -f(x + 3h)+ 4f(x + 2h) - 5f(x + h)+ 2f(x) h2 Es importante mencionar que la estabilidad, de las derivadas numéricas, depende del tamaño de h o longitud de paso, tal es el caso del siguiente ejemplo: f ''( x) Ejemplo 5.1.5 Calcule la derivada de ex con 5.1.1. y con la fórmula simplificada del ejercicio 5.1.3, en el punto x = 1 Solución: Si f(x) = ex de 5.1.1 se tiene: f1'(x) = eh - 1 e x+h - e x en x = 1 f 1'(1) = e h h De 5.1.3 se tiene: 105 f(x + h) - f(x - h) eh e h f 2 '( x) en x 1 f 2 '(1) 2h h para diferentes valores de h, obtenemos la tabla 5.1: h eh 1 f1 '(1) e h f1’(1) – e = E1 10-1 10-2 10-3 10-4 10-5 10-6 10-7 10-8 2.85884195487 2.7319186558 2.71964142251 2.71841774799 2.71829541987 2.7182831876 2.71828182846 2.71828182846 0.140560126414 0.013636827337 0.001359594052 1.35919520 10-4 1.35914091 10-5 1.35914091 10-6 0 0 eh e h h f2’(1) – e = E2 2.722814564 2.718327132 2.718282263 2.718281828 2.718275169 2.718281828 0.00453273535 0.00004530383 4.3492 10-7 0 6.6598 10-6 0 f 2 '(1) Tabla 5.2 Como se puede observar en la tabla 5.2, no solo depende del tamaño de h sino también del tipo de fórmula utilizada. Diremos que las fórmulas centradas son las de mejor aproximación a la derivada numérica. También existen fórmulas de derivación para datos desigualmente espaciados, o tablas de datos con comportamientos observables del que deseemos la derivada de estos sin tener la función,.en estos caso acudiremos a las fórmulas de interpolación de Lagrange . 106 5.2 Integración numérica En esta sección estudiaremos métodos para el cálculo numérico de integrales de la forma: b I ( f ) f ( x)dx F ( x) a F (b) F (a) b a (5.2.1) en donde f(x) es una función expresada analíticamente en término de funciones; polinomiales, trigonométricas, exponenciales, logarítmicas, o combinaciones de estas. Pero incluso entre este tipo de funciones, llamadas elementales, existen algunas que no es posible encontrar su antiderivada. Tal es el caso de: x e dx 2 la cual no tiene antiderivada y no podríamos utilizar el teorema fundamental del cálculo para evaluarla. También podemos tener cierta información en forma tabulada y querer integrarla, para obtener así una respuesta a algún experimento desarrollado. En cualesquier caso, la integración numérica nos proporcionara un resultado muy cercano a la solución real. En el desarrollo del cálculo se habla de aproximaciones del área mediante rectángulos, los cuales estiman o subestiman el área dependiendo del crecimiento o decrecimiento de la función. Del promedio de estas estimaciones o subestimaciones aparece el método conocido como método de Trapecios o aproximación trapezoidal. Método del Trapecio Iniciaremos el análisis de este método dividiendo el intervalo I(a;b) en n partes iguales construyendo trapecios cuyas alturas son h = (b – a)/n, y las bases paralelas con longitud f(x0), f(x1),…,f(xn) como muestra la figura 5.2. 107 f(x) A1 A2 An … .. x0 =a x1 x2 xn-1 xn=b Fig. 5.2 De esta manera el área de los trapecios A1, A2,…, An, serán respectivamente: f(x1 )+ f(x0 ) f(x2 )+ f(x1 ) A1 = h, A2 = h,...., 2 2 f(xn-2 )+ f(xn-1 ) f(xn-1 )+ f(xn ) An-1 = h, An = h, 2 2 Sumando estas áreas para obtener una aproximación del área total igual a: n ATrapecios Ai i 0 f(x )+ f(x0 ) f(x )+ f(x1 ) Atrapecios = 1 h+ 2 h+ ... 2 2 f(x )+ f(xn-1 ) f(x )+ f(xn ) + n-2 h+ n-1 h 2 2 obteniendo la siguiente fórmula simplificada: h ATrapecios = f(x0 )+ 2f(x1 )+ ...+ 2f(xn-1 )+ f(xn ) 2 (5.2.2) Método de Simpson Este es otro método muy útil para resolver integrales, analizado por el matemático Thomas Simpson (1710-1761) el cual aproximo las áreas con ecuaciones cuadráticas como muestra la figura 5.3. 108 f(x) A1 An … .. x0 =a x1 x2 xn-1 xn=b Fig. 5.3 Utilizaremos el polinomio de colocación cuadrático 4.3.10: P( x) x x1 x x2 f ( x ) ( x x0 ) x x2 f ( x ) ( x x0 ) x x1 f ( x ) x0 x1 x0 x2 0 x1 x0 x1 x2 1 x2 x0 x2 x1 2 en los intervalos de x0 a x2 , x2 a x4 ,… ,xn-2 a xn , e integrar directamente: A1 x x1 x x2 ( x x0 ) x x2 ( x x0 ) x x1 f ( x0 ) f ( x1 ) f ( x2 ) dx x1 x0 x1 x2 x2 x0 x2 x1 x0 x1 x0 x2 x2 x0 dado que x0 – x1 = - h y x0 – x2 = - 2 h tenemos: A1 1 2h 2 x1 x0 x x1 x x2 f ( x0 ) ( x x0 ) x x2 f ( x1 ) ( x x0 ) x x1 f ( x2 ) dx I II III resolviendo primero I y efectuando cambio de variable u = x – x0, tenemos u – (-x0) = x de donde u – (x1 – x0 )= x – x1 o bien u – h = x – x1, de la misma forma, podemos obtener u – 2h = x – b, de esta manera: I x2 x0 x x1 x x2 f ( x0 )dx 0 x h x 2h f ( x0 )dx 2h 2 3 h 3 109 los resultados de II y III se obtienen de manera similar dando los siguientes resultados: x2 2 I x x0 x x1 f ( x2 )dx h 3 x0 3 x2 4 II x x0 x x2 f ( x1 )dx h 3 x0 3 de donde: A1 = h 1 2h3 4h3 2h3 f(x )+ f(x )+ f(x2 ) = (f(x0 )+ 4f(x1 )+ f(x2 )) 0 1 2 3 3 2h 3 3 las siguientes áreas estarían dadas por: h (f(x2 )+ 2f(x3 )+ f(x4 )) , 3 h An-1 = (f(xn-4 )+ 2f(xn-2 )+ f(xn-1 )) 3 A2 h A3 = (f(x4 )+ 2f(x5 )+ f(x6 )) ,…. 3 h An = (f(xn-2 )+ 2f(xn-1 )+ f(xn )) 3 de tal manera que al sumar todas las áreas se obtiene la fórmula siguiente: As h f(x0 )+ 4f(x1 )+ 2f(x2 )+ 4f(x3 )+ ...+ 2f(xn-2 )+ 4f(xn-1 )+ f(xn ) (5.2.3) 3 conocida como la aproximación o fórmula de Simpson. Es importante resaltar que en el método del trapecio no importa si el número de subintervalos es par o no, mientras que en el método de Simpson el número de subintervalos debe ser par, de tal manera que: hTrapecio = ( b – a ) / 2n Ejemplo 5.2.1 Resolver la siguiente integral, 1 x 1 - xdx 0 utilizando el método de Trapecio n = 6 y Simpson 2n=6. 110 Solución: La longitud de paso en ambos casos es: ht b a 1 0 1 n 6 6 hs b a 1 0 1 2n 6 6 De esta manera podemos obtener la siguiente tabla: f ( x) x 1 x 0 0.37267799624997 0.47140452079103 0.5 0.47140452079103 0.37267799624997 0 n xn 0 1 2 3 4 5 6 ∑ 0 1/6 1/3 1/2 2/3 5/6 1 Trapecio Simpson f(x0) 2f(x1) 2f(x2) 2f(x3) 2f(x4) 2f(x5) f(x6) 4.37633000681639 f(x0) 4f(x1) 2f(x2) 4f(x3) 2f(x4) 4f(x5) f(x6) 6.8670420531638 Tabla 5.3 de tal manera que podemos utilizar la tabla 5.3 para encontrar la aproximación de la integral al sustituir los datos en 5.2.2 y 5.2.3 At = As = 1/6 (4.3763300681639) = 0.364694172347 2 1/6 (6.8670420531638) = 0.38150233628688 3 La solución exacta de la integral es: 1 0 x 1 - xdx = 1 (2x - 1) x 1 - x + sen -1 x 4 1 = 0.392699081699 0 de esta manera podemos establecer que el error en la aproximación por el método de trapecios y el método de Simpson es el siguiente: Et = 0.02800490935172 Es = 0.01119674541183 Et % = 7.1313916066668 Es % = 2.8512278061348 Esto demuestra que el método de Simpson es más aproximado a la solución real de la integral. 111 La tabla 5.4 muestra áreas para diferente número de iteraciones del Ej. 5.2.1: Trapecio Simpson n =10 ∑ =7.592622072209 At =0.37963110361045 E =0.01306797808827 E%=3.3277332943436 n =20 ∑ =15.522591631241 At =0.38806479078103 E =0.00463429091769 E%=1.180112491642 n =50 ∑ =39.152453886286 At =0.39152453886286 E =0.00117454283586 E%=0.29909487712047 n =100 ∑ =78.456712777462 At =0.39228356388731 E =0.00041551781141 E%=0.10581074180581 n =200 ∑ =157.02085158899 At =0.39255212897248 E =0.0001469527262 E%=0.037421204451082 n =10 ∑ =11.625652350191 As =0.38752174500636 E =0.00517733669236 E%=1.3183979626242 n =20 ∑ =23.452561190274 As =0.39087601983791 E =0.00182306186081 E%=0.46423889073636 n =50 ∑ =58.835856281057 As =0.39223904187372 E =0.000460039825 E%=0.11714817946861 n =100 ∑ =117.76097166862 As =0.39253657222873 E =0.00016250946999 E%=0.041382696717044 n =200 ∑ =235.58499040047 As =0.39264165066746 E =0.00005743103126 E%=0.014624692019031 Tabla 5.4 Ejemplo 5.2.2 Resolver la siguiente integral, / 4 senx 0 cosx dx utilizando el método de Trapecio n = 6 y Simpson 2n=6. 112 Solución: La longitud de paso en ambos casos es: ht b a / 4 0 n 6 24 hs b a / 4 0 2n 6 24 De esta manera podemos obtener la siguiente tabla: n xn 0 1 2 3 4 5 6 ∑ 0 π/24 π/12 π/8 π/6 5π/24 π/4 f ( x) senx / cos x Trapecio Simpson 0 0.36440159412298 0.52668910799832 0.66958310101733 0.81649658092775 0.9834604724508 1.1892071150028 f(x0) 2f(x1) 2f(x2) 2f(x3) 2f(x4) 2f(x5) f(x6) 7.9104688280372 f(x0) 4f(x1) 2f(x2) 4f(x3) 2f(x4) 4f(x5) f(x6) 11.94535916322 Tabla 5.5 de tal manera que podemos utilizar la tabla 5.5 para encontrar la aproximación de la integral al sustituir los datos en 5.2.2 y 5.2.3 At = 24 (7.9104688280372) = 0.51773897409612 2 As = 24 (11.94535916322) = 0.52121461932868 3 La solución exacta de la integral es: 1 0 senx 1 dx = ln cos x 2 /4 senx + 1 -1 senx - 2tan senx - 1 0 = 0.392699081699 de esta manera podemos establecer que el error en la aproximación por el método de trapecios y el método de Simpson es el siguiente: Et = 0.00730208520183 Es = 0.00382643996927 Et % = 1.3907646025996 Es % = 0.72878871118889 Lo cual demuestra por segunda ocasión que el método de Simpson es más aproximado a la solución real de la integral. 113 La tabla 5.6 muestra áreas para diferente número de iteraciones del Ej.5.2.2: Trapecio Simpson n =10 ∑ =13.27688092198 At =0.52138189458849 E =0.00365916470946 E%=0.69692924861015 n =20 ∑ =26.669403866861 At =0.52365252039846 E =0.00138853889949 E%=0.26446291673772 n =50 ∑ =66.802864629131 At =0.52466847189408 E =0.00037258740387 E%=0.070963479383536 n =100 ∑ =133.66609600687 At =0.52490553156152 E =0.0001355277364 E%=0.025812788167695 n =200 ∑ =267.37632855409 At =0.52499219345586 E =0.00004886584209 E%=0.0093070515580896 n =10 ∑ =19.986920937988 As =0.52325636655553 E =0.00178469274242 E%=0.33991489061948 n =20 ∑ =40.061926811741 As =0.52440939566843 E =0.00063166362952 E%=0.12030747278406 n =50 ∑ =100.24493120871 As =0.52488123240816 E =0.00015982688979 E%=0.030440836380246 n =100 ∑ =200.52932738459 As =0.52498455145061 E =0.00005650784734 E%=0.010762557773207 n =200 ∑ =401.08656110135 As =0.52502108075402 E =0.00001997854393 E%=0.0038051393459997 Tabla 5.6 Método de Simpson 3/8 Utilizando un polinomio de colocación de Lagrange de tercer grado, como: ( x x0 ) x x2 x x3 x x1 x x2 ( x x3 ) f ( x0 ) f (x ) x0 x1 x0 x2 x0 x3 x1 x0 x1 x2 x1 x3 1 ( x x0 ) x x1 x x3 ( x x0 ) x x1 x x2 f ( x2 ) f (x ) x2 x0 x2 x1 x2 x3 x3 x0 x3 x1 x3 x2 3 P( x) 114 podemos encontrar una fórmula para integración conocida como Integración de Simpson 3/8. Las áreas que obtendríamos en las diferentes subdivisiones son: h A1 = (f(x0 )+ 3f(x1 )+ 3f(x2 )+ f(x3 ) 8 h A2 = (f(x3 )+ 3f(x4 )+ 3f(x5 )+ f(x6 ) 8 ….. h h An = (f(xn-3 )+ 3f(xn-2 )+ 3f(xn-1 )+ f(xn ) An-1 = (f(xn-6 )+3f(xn-5 )+3f(xn-4 )+ f(xn-3 ) 8 8 de donde sumando para obtener el área total se tiene: As3/8 = h f(x0 )+ 3f(x1 )+ 3f(x2 )+ 2f(x3 )+ 3f(x4 )+ 3f(x5 )+ 2f(x6 8 .....+ 2f(xn-3 )+ 3f(xn-2 )+ 3f(xn-1 )+ f(xn ) ) o bien: As 3 / 8 n2 n 3 (b a) f ( x0 ) 3 f ( xn ) 2 f ( xn ) f ( xn ) (5.2.4) 8n n 1,2,4,5 n 3,6 El nombre de 3/8, se debe a que, para encontrar el área debemos particionar los subintervalos en tres y el área obtenida deberá multiplicarse por 1/8. Los métodos de Simpson 1/3 y Simpson 3/8, deberán utilizarse siempre que el número de subintervalos se seleccione apropiadamente, de no ser así podríamos utilizar alternativas como aplicar Trapecio y Simpson a la vez, en un intervalo, si es que este tiene un número impar de subintervalos.. Ejemplo 5.2.3 Resolver la siguiente integral del ejemplo 5.2.2 mediante la regla de Simpson 3/8, para n = 2 y n =3 Solución: Para n = 2, se formaran los intervalos [ 0 , π/8 ] y [ π/8 , π/4 ] de tal manera que al partirse en tres estos, obtenemos la siguiente tabla: 115 n xn 0 1 2 3 4 5 6 ∑ 0 π/24 π/12 π/8 π/6 5π/24 π/4 f ( x) senx / cos x Simpson 0 0.36440159412298 0.52668910799832 0.66958310101733 0.81649658092775 0.9834604724508 1.1892071150028 f(x0) 3f(x1) 3f(x2) 2f(x3) 3f(x4) 3f(x5) f(x6) 10.601516583537 Tabla 5.7 para encontrar la aproximación de la integral al sustituir los datos de la tabla b - a /4 - 0 = = 5.7 en 5.2.4., con hs3/8 = para obtener n 2 8 As3 / 8 = 4 (10.601516583537) = 0.520400728371 8(2) Para n = 3, se forman los intervalos [ 0 , π/12 ], [ π/12 , π/6 ] y [ π/6 , π/4 ], cada uno de los cuales se dividirá en tres para efectuar la operación: As3/ 8 = 4 f (0) 3 f ( / 36) 3 f ( /18) 2 f ( /12) 3 f ( / 9) 8(3) 3 f (5 / 36) 2 f ( / 6) 3 f (7 / 36) 3 f (2 / 9) f ( / 4) obteniendo el siguiente resultado: As3/8 = 96 (15.966453644231) = 0.52250097383651 Integración de Taylor En la sección 4.1 se abordo el tema de polinomios de colocación mediante aproximación polinomial de Taylor, obteniéndose resultados que son importantes en diferentes ramas de la ingeniería. Ahora los utilizaremos para resolver algunas integrales numéricas. Ejemplo 5.2.5 116 Utilizando 6 términos de la serie de Taylor 4.1.11 resuelva la siguiente integral: 1 0 senx dx x solución: De la fórmula 4.1.11, senx = x - x 3 x 5 x7 x 9 x11 , de tal manera que: + - + 3! 5! 7! 9! 11! x 3 x 5 x7 x 9 x11 + - + 1 1x3! 5! 7! 9! 11! senx dx = dx x x 0 0 = 1 0 x 2 x 4 x6 x 8 x10 1 - + - + dx 3! 5! 7! 9! 11! 1 x3 x5 x7 x9 x11 =x+ + 3* 3! 5* 5! 7 * 7! 9* 9! 11* 11! 0 1 1 1 1 1 = 1 + + - 0 3* 3! 5* 5! 7 * 7! 9* 9! 11* 11! = 0.946083070355 Ejemplo 5.2.6 Utilizando 6 términos de la serie de Taylor 4.1.11 resuelva la siguiente integral: sen 1 xdx 0 Solución: De la fórmula 4.1.11, x + x - x + x - x 3 sen x = x 3! 5 5! 7 7! 9 9! 11 11! de tal manera que: 117 sen 1 xdx = 0 0 x + x - x + x - x 3 x 1 5 3! 7 5! dx 11! 9 7! 11 9! 1 x 3 2 x 5 2 x7 2 x 9 2 x11 2 dx = x 2 + + 3! 5! 7! 9! 11! 0 1 5 7 9 13 11 2 3 2x 2 2x 2 2x 2 2x 2 2x 2 = x 2+ + 3 5* 3! 7 * 5! 9* 7! 11* 9! 13* 11! = 0.60233735785848 Ejemplo 5.2.7 Utilizando 6 términos de la serie de Taylor 4.1.12 resuelva la siguiente 1 1 - cosx 2 dx integral: 0 x Solución: De la fórmula 4.1.12: x 2 x 4 x6 x 8 x10 1 - 1 + + 2! 4! 6! 8! 10! 1 - cosx x x 3 x 5 x7 x9 = + + x x 2! 4! 6! 8! 10! 1 2 0 1 x 1 - cosx x 3 x 5 x7 x9 dx = 2 + + dx 0 x 2! 4! 6! 8! 10! 1 2 x2 x4 x6 x8 x10 = + + 2* 2! 4* 4! 6 * 6! 8* 8! 10* 10! 0 12 - 12 + 12 - 12 2 4 6 8 2* 2! 4* 4! = 0.061852563 6 * 6! 8* 8! 12 + 10 12 - 12 10* 10! 12* 12! Ejemplo 5.2.8 Utilizando 6 términos de la serie de Taylor 4.1.10 resuelva la siguiente integral: Solución: 118 1 0 2 e x dx 2 De la fórmula 4.1.10: e -x 2 = 1+ -x 2 -x + -x + -x + -x + 2 2 2 3 2! 3! 2 4 4! 2 5 5! de lo cual se desprende: 1 0 2 -x 2 e dxe -x 2 = 1 0 2 x 4 x6 x 8 x10 2 + 1 - x + dx 2! 3! 4! 5! 1/2 x3 x5 x7 x9 x11 =x+ + 3 5* 2! 7 * 3! 9 * 4! 11* 5! 0 = 0.461281006806 5.3 Integración múltiple Para la solución de integrales dobles o triples, podemos hacer uso de los métodos anteriores, resolviendo integral por integral. Enseguida veremos con dos ejemplos el cálculo de este tipo de integrales. Ejemplo 5.3.1 Resolver la siguiente integral: 1 0 1 y2 1 x dzdxdy 0 Solución: Utilizaremos el método de Trapecio 1/3 para resolver esta integral iterada. Dividimos el intervalo [a;b] = [0; 1 – x], que son los limites de la primer integral, en n = 6 subintervalos, con longitud de cada uno igual a h1 = [(1-x)-0]/6, aplicando la fórmula de Simpson, manteniendo constantes las variables x e y , integrando respecto a z con función a evaluar f(z) = 1, para obtener así la siguiente tabla: 119 z 0 (1-x)/6 (1-x)/3 (1-x)/2 2(1-x)/3 5(1-x)/6 (1-x) f(z)=! 1 1 1 1 1 1 1 Método de Simpson 1/3 *1 *4 *2 *4 *2 *4 *1 ∑=18 Tabla 5.10 Utilizando la fórmula 5.2.3 y la sumatoria de la tabla 5.10 obtenemos el resultado de la primera integración: A= (1 - x)/6 18 = 1 - x 3 De donde: 1 0 1 y2 1 x (1 x)dxdy 1 dzdxdy 0 0 1 y2 La segunda integral, la integramos respecto a x, mantenemos y constante, tomamos la función f(x) = 1 – x para evaluar. Partimos nuevamente en n = 6 el intervalo de [y2 ; 1], donde la amplitud de cada subintervalo será h2 = [1 – y2 ]/6, obteniendo la siguiente tabla: x y2 (5/6)y2+1/6 (2/3)y2+1/3 (1/2)y2+1/2 (1/3)y2+2/3 (1/6)y2+5/6 1 Tabla 5.11 120 f(x) = 1 – x 1 – y2 5/6 – (5/6)y2 2/3 – (2/3)y2 1/2 – (1/2)y2 1/3 – (1/3)y2 1/6 – (1/6)y2 0 Método de Simpson 1/3 *1 *4 *2 *4 *2 *4 *1 ∑ = 9 – 9 y2 Utilizando nuevamente la fórmula 5.2.3, y el resultado de la tabla 5.11 obtenemos la segunda integral: A= 2 (1 - y 2 )/6 1 9 - 9y 2 = 1 - y 2 3 2 Esto es: 1 0 1 (1 - x)dxdy = y 2 1 0 1 1 (1 - y 2 )2 dy = 2 2 (1 - y 1 2 )2 dy 0 Integrando por ultimo respecto a y, con función a evaluar f(y) = (1 – y2)2, partimos el intervalo de [0 ; 1] en n = 8, y la magnitud de cada subintervalos será h3 = [1 – 0 ]/8 = 1/8, obteniendo así la siguiente tabla: y 0 1/8 1/4 3/8 1/2 5/8 3/4 7/8 1 f(y) = (1 – y2)2 1 3969/4096 225/256 3025/4096 9/16 1521/4096 49/256 225/4096 0 Método de Simpson 1/3 *1 *4 *2 *4 *2 *4 *2 *4 *1 ∑=3277/256 Tabla 5.12 Utilizando nuevamente la fórmula 5.2.3, obtenemos la tercera integral: 1 2 1 0 (1 - y 2 )2 dy = 1 1/8 3277 = 0.26668294270834 2 3 256 De donde: 121 1 0 1 y2 1 x dzdxdy 0.26668294270834 0 Ejemplo 5.2.10 Resolver la siguiente integral: 1 y 2 1 0 sen( x 2 y 2 )dxdy 0 Solución: También utilizaremos el método de Trapecio 1/3 para resolver esta integral iterada. Dividimos el intervalo [a;b] = [0; 1 y 2 ], en n = 6 subintervalos 1 y2 , aplicaremos la fórmula de Simpson 6 manteniendo constante la variable y , integrando respecto a x, con función a evaluar f(x)= sen( x2+ y2) , obteniendo la siguiente tabla: iguales, con longitud de h1 y 0 Sen( y2 ) Método de Simpson 1/3 *1 (1/6) 1 - y 2 Sen((35/36)y2+1/36) *4 (1/3) 1 - y 2 Sen((8/9)y2+1/9) *2 (1/2) 1 - y 2 Sen((3/4)y2+1/4) *4 (2/3) 1 - y 2 Sen((5/9)y2+4/9) *2 (5/6) 1 - y 2 Sen((11/36)y2+25/36) *4 1 *1 f(x)=Sen(x2+y2) 1 - y2 Tabla 5.13 Utilizando la fórmula 5.2.3, y los resultados de la tabla 5.13, la primera integral será: 122 sen (35/36)y 2 +1/36 + sen (3/4)y 2 +1/4 + 2 1 - y 2 sen(y )+ 4 sen (11/36)y 2 + 25/36 A( y ) = 18 + 2 sen((8/9)y 2 +1/9)+ sen((5/9)y 2 + 4/9) +1 de donde: 1 0 1- y 2 2 2 sen(x + y )dxdy = 0 1 A(y)dy 0 Resolviendo la última integral con función a evaluar f(x) = A(y), partimos el intervalo de [0 ; 1] en n = 8, de donde la magnitud de cada subintervalo será h2 = [1 – 0 ]/8 = 1/8 , para obtener la siguiente tabla 5.14: y 0 1/8 1/4 3/8 1/2 5/8 3/4 7/8 1 A(y) 0.31901251226031 0.32640826843467 0.34739751101453 0.37816787719979 0.41161165252641 0.43602218362047 0.43236201884557 0.36507651934579 0 Método de Simpson 1/3 *1 *4 *2 *4 *2 *4 *2 *4 *1 Tabla 5.14 De donde: Area = 1 1/8 12.80078125 = 0.26668294270834 2 3 Por lo tanto el resultado de la integración es: 1 0 1 y 2 sen( x 2 y 2 )dxdy 0.26668294270834 0 123 5.4 Aplicaciones Existe una gran variedad de problemas que mediante el cálculo tradicional no podemos resolver, tratándose de Áreas bajo la curva ya que el tipo de integrales que se presentan no puede expresarse de manera explicita. Es de esto que el método numérico tome un papel importante es la solución de estos. Enseguida daremos algunos ejemplos donde las técnicas numéricas dan solución a algunos de estos problemas. Ejemplo 5.4.1 La tabla muestra la velocidad registrada por los jueces en una carrera determinada de bicicletas. Se desea calcular la distancia recorrida por cierto corredor, desde el inicio hasta transcurridas 5 horas. t(horas) 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 v(Km./h) 43 25 50 53 55 62 28 52 53 51 47 Tabla 5.15 Solución: La distancia total recorrida desde el inicio hasta transcurridas 5 horas la obtenemos de d b v(t )dt . En este caso utilizaremos el método de a Trapecio, ya que no podremos utilizar el método de Simpson 1/3 debido al número de subintervalos que es necesario por la fórmula 5.2.3. Para encontrar una aproximación desde t = 0 a t = 5, la tabla 5.15 define el valor de h = 0.5 . At = 0.5 43 + 2(25 + 50 + 53 + 55 +62 + 28 + 52 + 53 + 51)+ 47 = 237km 2 As = 0.5 43 + 4(25 + 53 +62 + 52 + 51)+ 2(50 + 55 + 28 + 53)+ 47 = 239km 3 los dos resultados podemos reducirlos a que el total de kilómetros recorridos en ese periodo de tiempo es entre 237 Km. y 239 Km. 124 Ejemplo5.4.2 Calcular el volumen de la región limitada por el cilindro parabólico x = y2 y los planos z = 0 y x + z = 1. Solución: El volumen se obtiene resolviendo la siguiente integral: 1 2 0 1 y2 1 x dzdxdy 0 y del ejemplo 5.2.9 se obtuvo: 1 1 y2 0 1 x dzdxdy 0.26668294270834 0 por lo tanto 1 2 1 0 y 2 1-x dzdxdy = 0.533365885417 u 3 0 Ejemplo 5.4.3 La tabla 5.16 muestra la medida de la razón de crecimiento de peces (peces por mes) de un lago de cultivo de peces, en un periodo de 6 meses. Estime la cantidad total de peces que habrá en el lago en ese periodo. t 0 1 2 3 4 5 6 p(peces) 10 10 11 11 12 12 13 Tabla 5.16 Solución: La población total acumulada desde el inicio hasta transcurridas 6 meses la obtenemos de Pt b Pdt . En este caso utilizaremos los métodos Trapecio, a Simpson 1/3, y Simpson 3/8 ya que el número de intervalos nos permite utilizar las tres fórmulas, para encontrar una aproximación desde t = 0 a t = 6. La tabla define el valor de h = 1 125 1 10 + 2(10 + 11+ 11+ 12 + 12)+ 13 = 67.5 2 1 As = 10 + 4(10 +11+12)+ 2(11+12)+13 = 67 3 para Simpson 3/8, n = 2, de tal manera que si a = 0 y b = 6, h = (6-0)/2 = 3 se tiene: 3 As3/8 = 10 + 3(10 + 11+ 12 + 12)+ 2(11)+ 13 = 67.5 8 los tres resultados podemos reducirlos a que el total de peces acumulados en el cultivo en los seis meses es entre 67 y 68 peces. At = Ejemplo 5.4.4 La función de probabilidad de la distribución Normal, esta dada por P 0; a 1 a e x 2 2 dx 2 0 Mediante la utilización de tablas de esta distribución podemos encontrar que el área de [0 ; 1] = 0.341344. Utilizando la regla de Trapecio, Simpson 1/3 y Simpson 3/8, estime el área de esta función de probabilidad. Solución: La función a evaluar en es f ( x) e x 2 2 en los tres casos, ya encontrada el área de [0;1] la multiplicaremos por el factor 1/ 2 . h = (1 – 0)/6 = 1 / 6, la tabla 5.17 muestra los valores que utilizaremos para encontrar la integral: x 0 1/6 1/3 1/2 2/3 5/6 1 x 2 f ( x) e 2 1 0.9862071 0.9459595 0.8824969 0.8007374 0.7066482 0.6065306 Tabla 5.17 El área por el método de trapecio y Simpson 3/8 será: 126 1 1+ 2(0.9862071+ 0.9459595 + 0.8824969 + 0.8007374 + 0.70664829)+ 0.6065306 2 2 = 0.34078411 1 At As = 1 1+ 4(0.9862071+ 0.8824969 + 0.70664829) + 2(0.9459595 + 0.8007374)+ 0.6065306 2 = 0.85562964 1 2 (0.85562964) = 0.3413468 Para Simpson 3/8, n = 2, se tiene: As3/8 = As 3 / 8 1 1+ 3(0.9862071+ 0.9459595 + 0.8007374 + 0.70664829) + 2(0.8824969+)+ 0.6065306 8(2) 1 2 0.85563633 = 0.34134951 PROBLEMAS CAPÍTULO V 1.- Calcule la derivada de x3 , con 5.1.1. y con la fórmula simplificada del ejercicio 5.1.3, en el punto x = 1. 2.- Calcule la derivada de x2 , con la fórmula simplificada del ejemplo 5.1.4, en el punto x = 2. 3.- Encuentre el área de las siguientes integrales, utilice el método de Trapecios, en cada inciso se da el número de subintervalos para su aproximación. 1 a) x 1 - xdx n = 4 d) 0 c) 0 senx dx n = 5 0 b) 2 senx dx x n 4 1 - cosx dx n = 5 x2 e) 2 1.2 2 e-x dx n= 5 1 dx 2 1 1 x n8 0 1 f) 127 4.- Por el método de Simpson 1/3 encuentre el área de cada una de las siguientes integrales, el número de subintervalos se da en cada caso. 1 a) x 1 - xdx n = 4 d) 0 b) 0 2 senx dx x 0 c) 2 0 n 4 e) 1 dx n = 6 1+ x 3 1 1 - x 3 dx n = 6 0 1 - cosx dx n = 6 x2 f) 1 1 dx 2 1+ x -1 n= 8 5.- Por el método de Simpson 3/8, evalué las siguientes integrales, tome n=4 a) 1 senx dx x 0 c) 1 dx 2 4 x 1/ 2 1 dx x 1 1 b) 2 d) senx 4 cos x 0 dx 6.- Tomando cinco términos de la aproximación en series de Taylor, de la función necesaria, encuentre las siguientes integrales. e dx 1 e x dx 1 x a) d) 0 1 b) 0 1 x e) 0 c) /2 0 128 1 - cosx dx x2 sen x dx e e 2 dx e e 2 dx 1 x x 0 1 f) 0 x x Capítulo 6 Solución de Ecuaciones diferenciales Las ecuaciones diferenciales, son expresiones matemáticas que se presentan en muchos problemas científicos y de ingeniería, así como también al tratar de explicar los fenómenos naturales que inciden en nuestra vida diaria. Estas se basan en los conceptos del cálculo, formulados y desarrollados por Newton, Leibniz y otros en el siglo XVII. Donde estén involucradas razones de cambio de una función desconocida ó varias funciones desconocidas con respecto a una ó varias de sus derivadas en un punto, podremos establecer una ecuación en términos de derivadas. Estas expresiones pueden formularse desde algo simple, donde se desea encontrar solución a una ecuación diferencial, dada una función, hasta las más complejas donde aparecen varias funciones. Por lo regular, en un curso de ecuaciones diferenciales, los tipos de problemas que se presentan, se resuelven por diferentes métodos y en algunos casos es complicado, difícil e imposible, el dar una respuesta a estos. Es aquí donde los métodos de solución aproximada, serán una alternativa para dar solución a estos de una manera simple y precisa. Antes de iniciar expondremos algunos fundamentos básicos de las expresiones denominadas ecuaciones diferenciales, con la finalidad de recordar algunos de estos conceptos. 129 6.1 Fundamentos matemáticos La ley de enfriamiento de Newton o las leyes mecánicas que rigen el movimiento de los cuerpos, al expresarse en términos matemáticos dan lugar a ecuaciones diferenciales. Estas ecuaciones se acompañan de condiciones adicionales las cuales especifican el estado del sistema, en un tiempo o posición inicial, lo que llamamos “condiciones iniciales del sistema” que en conjunto con la ecuación diferencial, denominaremos el “problema de valor inicial”. Definición 6.1.1 Una ECUACIÓN DIFERENCIAL ORDINARIA DE PRIMER ORDEN, es aquella que contiene a lo más, a la primera derivada de una función desconocida. Si y es la función desconocida y esta se encuentra en términos de x, entonces la ecuación diferencial de primer orden se escribe: dy f ( x, y ) dx (6.1.1) Donde f(x,y) es una función de dos variables x y y. Si esta toma un valor prescrito y0 cuando x = x0 , esto es y(x0) = y0 decimos que es una ecuación diferencial sujeta a condiciones iniciales, con la cual obtendremos una solución particular al problema. Esta última condición, será de vital importancia para analizar la solución de las ecuaciones por métodos numéricos. Por lo general en un curso de ecuaciones diferenciales, primero se analiza el problema de la existencia de una solución y además, que esta solución sea única antes de pensar en el problema de condiciones iniciales, para encontrar una solución particular del problema. El siguiente teorema debido a E. Picard* provee condiciones suficientes de existencia y unicidad para ecuaciones diferenciales ordinarias del tipo 6.1.1. 130 Teorema 6.1.1 Sea R una región rectangular en el plano xy, la cual esta definida de la siguiente manera, a ≤ x ≤ b, c ≤ y ≤ d, donde el punto P(x0, y0) esta contenido. Si f(x, y) y f / y , son continuas en R, entonces existe un intervalo I(a, b), con centro en x0 y una única función y(x) definida en I(a, b) que satisface el problema de valor inicial. El teorema 6.1.1, solo es suficiente más no necesario, ya que si f(x,y) y f / y son continuas en R, la solución existe y es única. De no suceder esto, la ecuación diferencial tendrá, una, más de una o ninguna solución. Si nuestro deseo es el de resolver la ecuación diferencial, encontrando una solución aproximada y a la unicidad le restamos interés, el trabajar solo con la continuidad de f(x,y) será suficiente para garantizar la existencia de, al menos, una solución de 6.1.1 para cada punto P(x0, y0) dentro del rectángulo*. Algunos ejemplos de ecuaciones diferenciales que contienen derivadas son: a) b) dy x2 7 dx d2y dy k 3 y x2 7 2 dx dx c) y ' 4 y cos x d) y ''' 2 y '' y ' y e cos x x e) ( y '')3 ( y ') 2 ny xe x cos x f) u u x y g) 2u 2u y xy x 2 h) 2u 2u u x 2 y 2 En las ecuaciones a), b), c), d), e) y f) aparece solamente una variable independiente con derivadas ordinarias, a este tipo de ecuación las denominaremos ecuaciones diferenciales ordinarias. En los casos f), g) y h) aparecen más de dos variables independientes y como las derivadas que intervienen son derivadas parciales, les denominaremos ecuaciones diferenciales parciales. 131 Las ecuaciones diferenciales ordinarias, se clasifican según el orden. El orden de la más alta derivada que interviene en una ecuación diferencial, será el orden de la ecuación. Las ecuaciones a), c) y f) son ecuaciones de primer orden, b), e), g) y h), son de segundo orden y d), es de tercer orden. En ocasiones las ecuaciones diferenciales se representan: dy d 2 y dn y F x, y, , 2 ,..., n 0 dx dx dx (6.1.2) Una ecuación diferencial tiene la forma: an ( x) dn y d n 1 y dy a ( x ) ... a1 ( x) a0 ( x) f ( x) n 1 n n 1 dx dx dx (6.1.3) La variable independiente, en conjunto con todas sus derivadas, son de primer grado, además, cada coeficiente depende únicamente de x. Definición 6.1.2 Decimos que una función f, definida dentro del intervalo I(a;b), es solución de una ecuación diferencial, si al ser sustituida en la ecuación nos genera una identidad. De hecho, al resolver una ecuación diferencial de orden n como 6.1.2 o bien 6.1.3 se obtiene una familia de soluciones con n-parámetros que dependen del orden de la ecuación. En nuestro caso será necesario tener las condiciones iniciales, para obtener una solución particular, de otro modo no podemos hacer uso de los algoritmos numéricos. Resolveremos ecuaciones diferenciales de primer orden o mayor, sujetas a condiciones iniciales. Estas no necesariamente tienen solución por los métodos que se discuten en un curso de ecuaciones diferenciales y en algunos casos, aún cuando existe una solución, no podremos expresarla en términos de funciones elementales. Esto, justifica el obtener una aproximación de la solución, mediante una sucesión de aproximaciones en el intervalo discretizado, donde observaremos el comportamiento de la solución. 132 Los métodos que enseguida expondremos serán de gran apoyo para encontrar dicha solución. 6.2 Métodos de un paso Uno de los métodos numéricos más simples y conocidos para resolver una ecuación diferencial es el método de Euler, también conocido como método de las tangentes. Se desea resolver numéricamente una ecuación diferencial del tipo 6.1.1 sujeta a condiciones iniciales y(x0) = y0 . Método de Euler Al resolver 6.1.1 como una ecuación diferencial de variables separables, en un pequeño subintervalo (x0 ; x1) donde x1 – x0 = h, la función f(x,y), la consideraremos una función constante en el, mientras más cercano este x1 de x0, de esta manera integrando la ecuación 6.1.1 en ese intervalo obtenemos: y1 dy y0 x1 f ( x, y )dx o bien: x0 y1 dy f ( x, y ) y0 x1 dx x0 de donde: y x y y1 = f(x0 , y0 )x x1 0 0 obteniendo: y1 - y0 = f(x0 , y0 )(x1 - x0 ) Dado que x1 – x0 = h, al despejar y1, obtenemos: y1 = y0 + f(x0 , y0 )h Aquí y1 es una aproximación futura en términos de la condición inicial y de la longitud de paso h = x1 – x0. Si suponemos que h tiene un valor uniforme en cada uno de los siguientes subintervalos, en donde deseamos obtener una aproximación de la solución a la ecuación, obtendremos una sucesión de puntos (x1, y1), (x2, y2) ,…, (xn, yn), como aproximaciones de (x1, f(x1)), (x2, f(x2)),…, (xn, f(xn)) y en n pasos: 133 yn+1 = yn + f(xn , yn )h (6.2.1) A 6.2.1 se denomina Método de Euler. La exactitud de las aproximaciones, dependerá de elegir una longitud de paso h, lo suficientemente pequeño y constante en cada intervalo. 6.2.1 se deduce también, a partir 4.1.5, ya que en el Cálculo con frecuencia se aproxima la grafica de una función, diferenciable, f(x) cercana a un punto x = x0 por una línea tangente a ese punto, a saber: Todos los algoritmos numéricos, para resolver una ecuación diferencial de primer orden: dy f ( x, y ) dx sujeta a y ( x0 ) y0 (6.2.4) Inician en un punto (x0, y0), con pendiente de la recta tangente a la curva solución en el punto dado, igual a f(x0,y0). La expresión 6.2.1 se utiliza como fórmula de recurrencia para dar una solución aproximada de la ecuación diferencial. La interpretación geométrica de 6.2.1 se muestra en la figura 6.1. El valor exacto de f(x) para x = x0+ h es y1, que aproximadamente es, y0 + f(x0 ,y0) h. f(x) Pendiente= f ’(x0) y1 y1+f’(x0)h f ’(x0)h y0 134 h x0 x0+h Fig.6.1 Ejemplo 6.2.1 Resolver, por el método de Euler, la siguiente ecuación diferencial: dy y (1 x 2 y 4 ) dx x(1 x 2 y 4 ) Sujeta a, y(1) = 1, en el intervalo 1 ≤ x ≤ 3, con h = 0.2 Solución: Tomemos a: yn (1 xn yn ) 2 f ( xn , yn ) 4 xn (1 xn yn ) 2 4 , (x0,y0) = (1,1) y h =0.2 el valor futuro de yn+1 , se obtiene mediante la siguiente fórmula recursiva: yn (1 xn yn ) 2 yn1 yn h 4 xn (1 xn yn ) 2 4 La cual se obtiene a partir de 6.2.1. Para mostrar la utilización de la fórmula recursiva, efectuaremos dos iteraciones. Iteración 1 2 y1 = y0 + h 4 y0 (1 - x0 y0 ) 2 4 x0 (1+ x0 y0 ) = 1+(0.2) 1(1 - (1)2 (1)2 ) =1 1(1+(1)2 (1)4 ) Iteración 2 135 2 y2 = y1 + h 4 y1 (1 - x1 y1 ) 2 4 x1 (1+ x1 y1 ) = 1+(0.2) 1(1 - (1.2)2 (1)2 ) = 0.96994536 (1.2)(1+(1.2)2 (1)4 ) De esta manera se obtiene la tabla 6.1: n 0 1 2 3 4 5 6 7 8 9 10 xn 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 yn 1 1 0.96994536 0.93271601 0.89550708 0.86054108 0.82837951 0.79900398 0.77220063 0.74770454 0.72525438 yn+1 = yn+f(xn,yn)h 1 0.96994536 0.93271601 0.89550708 0.86054108 0.82837951 0.79900398 0.77220063 0.74770454 0.72525438 Tabla 6.1 Ejemplo 6.2.2 Resolver, por el método de Euler, la siguiente ecuación diferencial: 1 dy xy 3 dx Sujeta a, y(0) = 2, en el intervalo 0 ≤ x ≤ 1, con h = 0.1 Solución: 1 Sea, f ( xn , yn ) xn yn 3 y (x0,y0) = (0,2) con h = 0.1, de donde a partir de la fórmula recursiva de Euler 6.2.1, se obtiene: 1 yn 1 yn h( xn yn 3 ) Enseguida se muestran 2 iteraciones del método. Iteración 1 136 1 1 y1 = y0 + hx0 y0 3 = 2+(0.1)(0)(2) 3 = 2 Iteración 2 1 1 y2 = y1 + hx1 y1 3 = 2 +(0.1)(0.1)(2) 3 = 2.01259921 De esta manera se obtiene la tabla 6.2: n 0 1 2 3 4 5 6 7 8 9 10 xn 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 yn 2 2 2.01259921 2.037850434 2.07588502 2.12691136 2.191212667 2.269144118 2.361129483 2.467657355 2.589277111 yn+1 = yn+f(xn,yn)h 2 2.01259921 2.037850434 2.07588502 2.12691136 2.191212667 2.269144118 2.361129483 2.467657355 2.589277111 Tabla 6.2 6.3 Métodos de pasos múltiples Los métodos de solución de un paso, son aquellos donde es utilizado la información en un solo punto xi para producir un valor de la variable independiente yi+1 en un punto futuro de xi+1 como se mostró en la sección anterior. Los métodos multipaso utilizan estas aproximaciones nuevas de yi+1 en conjunto con la información inicial para encontrar una solución más aproximada. Método de Euler Mejorado A partir del método de Euler, mejoraremos la aproximación a la solución. Si partimos del punto P(x0 , y0), encontramos, Q(x0+h , y0+hf(x0 , y0)), esto 137 es, al evaluar a la función en el punto Q, obtenemos una pendiente en ese punto, de tal manera que si consideramos un promedio de pendientes entre estos valores establecemos una relación en el intervalo de x0 a x0 + h, escribiendo la nueva aproximación de la ordenada como: f ( x0 , y0 ) f ( x1 , y1* ) y1* y0 f ( x0 , y0 ) 2 La cual es una pendiente más aproximada a la solución, así después de n pasos establecemos la siguiente fórmula recursiva: y1 y0 h yn 1 f ( xn , yn ) f ( xn1 , yn*1 ) yn h 2 yn*1 yn f ( xn , yn ) (6.3.1) Conocida como Método de Euler-Modificado. 6.3.1, aproxima la pendiente de la curva solución con respecto al punto extremo derecho (x1 , f(x1, y1)), mediante la pendiente de la curva solución con respecto al punto (x0+h , y0+hf(x0 , y0)) . En este proceso, utilizamos la pendiente inicial para predecir el valor y1 por el método de Euler y luego utilizamos la nueva pendiente para corregir la predicción. Es de esto que también el método se conoce como Método Predictor-Corrector para resolver un problema de valor inicial numéricamente. El error en esta fórmula podemos encontrarlo si retenemos en el desarrollo de la serie de Taylor un término más que en 6.2.2. y mostrar que el método de Euler, posee un error en la aproximación de: en y '''( ) 3 h 6 xn xn 1 De aquí que el error local del método de Euler mejorado es de orden h3, con error global de orden h2. Con esto podemos concluir que el método de Euler mejorado es más exacto que el método de Euler. Este método requiere de más evaluaciones en cada paso, pero es más eficiente, ya que se obtiene una mayor exactitud. Ejemplo 6.3.1 Resolver el ejemplo 6.2.1 por el método de Euler Mejorado. 138 Solución: yn (1 xn yn ) 2 Sea, f ( xn , yn ) 4 xn (1 xn yn ) 2 4 y (x0,y0) = (1,1) con h = 0.2, sustituyendo esto en la fórmula de Euler Mejorado, fórmula 6.3.1, se obtiene la siguiente expresión: 4 2 4 y*n 1 (1 xn21 yn*1 ) yn (1 xn yn ) * yn 1 yn h y n 1 yn h 4 2 4 xn (1 xn yn ) xn 1 (1 xn21 yn*1 ) Iteración 1 Primero debemos calcular y1* para después encontrar el valor futuro de y1, esto es: 2 * y 1 = y0 + h 4 y0 (1 - x0 y0 ) 2 4 x0 (1+ x0 y0 ) = 1+(0.2) (1)(1 - (1)2 (1)4 ) =1 (1)(1+(1)2 (2)4 ) Luego predecimos el valor de y1: h y0 (1 - x02 y0* ) y* 1 (1 - x12 y1* y1 = y0 + + 2 x0 (1+ x02 y0 4 ) x1 (1+ x12 y1* 4 4 4 ) ) (0.2) (1)(1 - (1)2 (1)4 ) (1)(1 - (1.2)2 (1)4 ) = 1+ + = 0.98497268 2 (1)(1+(1)2 (1)4 ) (1.2)(1+(1.2)2 (1)4 ) Prosiguiendo como se muestra en la primera iteración, obtenemos los resultados que se muestran en la tabla 6.3. n xn yn 0 1 2 3 4 1 1.2 1.4 1.6 1.8 1 0.98497268 0.95545218 0.92176882 0.88807292 yn1 yn h f ( xn , yn ) f ( xn1 , yn*1 ) 2 0.98497268 0.95545218 0.92176882 0.88807292 0.85597645 139 5 6 7 8 9 10 2 2.2 2.4 2.6 2.8 3 0.85597645 0.82602877 0.79832739 0.77278087 0.74922550 0.72747782 0.82602877 0.79832739 0.77278087 0.74922550 0.72747782 Tabla 6.3 Es importante resaltar que un error en el calculo de y*n+1 significativo ya que no encontraríamos las solución buscada. es muy Ejemplo 6.3.2 Resolver el ejemplo 6.2.2 por el método de Euler Mejorado. Solución: 1 dy xy 3 ; sujeta a, y(0) = 2, en el intervalo dx 0 ≤ x ≤ 1, con h = 0.1. Utilizando 6.3.1, la fórmula recursiva que nos ayudará para obtener los valores futuros de yn+1 es: La ecuación a resolver es 1 yn1 yn hxn1 y*n31 1 y*n1 yn hxn yn31 con Iteración 1 Primero debemos calcular y1* para después encontrar el valor futuro de y1, esto es: 1 1 y* 1 = y0 + hx0 y0 3 = 2+(0.1)(0)(1) 3 = 2 y1 = y0 + 1 h 0.1 f(x0 , y0 )+ f(x1 , y1* ) = 2 + 0 +(0.1)(2) 3 = 2.006299605 2 2 Los demás valores se muestran en la tabla 6.4. n 0 1 2 3 4 140 xn yn 0 0.1 0.2 0.3 0.4 2 2.00629961 2.02524462 2.05695333 2.10162153 yn1 yn h f ( xn , yn ) f ( xn1 , yn*1 ) 2 2.00629961 2.02524462 2.05695333 2.10162153 2.15952057 5 6 7 8 9 10 0.5 0.6 0.7 0.8 0.9 1 2.15952057 2.23099468 2.31645784 2.41639007 2.53133347 2.66188804 2.23099468 2.31645784 2.41639007 2.53133347 2.66188804 Tabla 6.3 Método de Runge-Kutta Los métodos de Euler y Euler-Mejorado tienen una convergencia lenta, además de que su estabilidad no es suficiente. Esto nos lleva a pensar en otros métodos de mayor convergencia. El método que analizaremos enseguida, amplia la idea geométrica de las aproximaciones, al utilizar varias derivadas o tangentes intermedias, en lugar de una sola, obteniendo así una mejor aproximación. Es así como se genera el método más conocido de Runge-Kutta también denominado Kutta-Simpson o Kutta-trapezoidal, por la forma semejante a integración por trapecios que tiene la fórmula recursiva. 1 yn 1 yn (k0 2k1 2k2 k3 ) 6 (6.3.5) donde k0 = hf(x,y), k1 = hf(x+½h , y+½k0), k2 = hf(x+½h , y+½k1), k3 = hf(x+h , y+k2). Ejemplo 6.3.3 Resolver el problema 6.2.2 por el método de Runge-Kutta. Compare los resultados de los métodos anteriores. Calcule el error del Método RungeKutta con respecto a la solución exacta. Solución: La ecuación a resolver es 1 dy xy 3 , sujeta a, dx y(0) = 2 , en el intervalo 0 ≤ x ≤ 1, con h = 0.1 141 De la fórmula 6.3.5 de Runge-Kutta, calcularemos k0, k1, k2, k3, para sustituir en la fórmula recursiva que nos ayudará para obtener los valores futuros de yn+1 : Iteración 1 1 k0 = hf ( x0 , y0 ) h( x0 y0 3 ) k1 = hf(x0 +½h , y0 +½k0 ) h( x0 0.5h)( y0 0.5k 0 ) 1 k2 = hf(x0 +½h , y0 +½k1 ) h( x0 0.5h)( y0 0.5k1 ) 1 k3 = hf(x0 + h , y0 + k2 ) h( x0 h)( y0 k 2 ) 1 3 3 3 Con x0 = 0, y0 = 2, h = 0.1 se tiene: k0 = (0.1) (0)(2) 1 3 =0 1 k1 = (0.1)(0 + 0.05)(2 + 0.5(0)) 3 = 0.006299605249 1 k2 = (0.1)(0 + 0.05)(2 + 0.5(0.006299605249)) 3 = 0.0063029106 1 k3 = (0.1)(0 + 0.1)(2 + 0.0063029106) 3 = 0.012612431 De donde el valor futuro de y1 es: 1 0 + 2(0.0062996052)+ 2(0.0063029106)+0.012612431 6 = 2.00630291 Continuando con este proceso, obtendremos la tabla 6.5. y1 = 2 + xn yn Runge-Kutta yn Euler 0 0.1 0.2 0.3 0.4 0.5 2 2.00630291 2.02525126 2.05696348 2.10163561 2.15953931 2 2 2.01259921 2.037850434 2.07588502 2.12691136 142 yn Euler-Mej 2 2.00629961 2.02524462 2.05695333 2.10162153 2.15952057 Solución exacta 2 2.00630291 2.02525126 2.05696348 2.10163562 2.15953932 Error Runge-Kutta 0 6e-10 2.3e-9 5.1e-9 9e-9 1.4e-8 0.6 0.7 0.8 0.9 2.23101923 2.31648977 2.41643145 2.53138687 1 2.66195653 2.191212667 2.269144118 2.361129483 2.467657355 2.589277111 2.23099468 2.31645784 2.41639007 2.53133347 2.66188804 2.23101925 2.3164898 2.41643149 2.53138691 2e-8 2.6e-8 3.4e-8 4.2e-8 2.66195656 5.1e-8 Tabla 6.5 Al resolver el sistema de ecuaciones 6.2.6 y asignar otros valores de p o bien de m y n, surgen diferentes métodos para resolver una ecuación diferencial. Entre algunos de estos métodos de Runge-Kutta, denominados de orden superior para resolver ecuaciones diferenciales, se encuentran los siguientes: Métodos de Heun a) yn 1 yn h f ( xn , yn ) 3 f 4 k k b) yn 1 yn 0 1 2 2 2 2 xn h, yn hf ( xn , yn ) 3 3 con k0 hf ( xn , yn ) y k1 hf ( xn h, yn k0 ) aquí k0 es la pendiente al inicio del intervalo y k1 es la pendiente al final del intervalo. Método de punto medio k h con k0 hf ( xn , yn ) y k1 hf xn , yn 0 2 2 Método de Ralston yn 1 yn k1 2k k yn 1 yn 0 1 3 3 3k 3h con k0 hf ( xn , yn ) y k1 hf xn , yn 0 4 4 Estos métodos son de orden dos y se obtienen similarmente como se obtuvo el método de Runge-Kutta que demostramos. Método de Runge-Kutta-Simpson(tercer orden) 143 k 1 h k0 + 4k1 + k2 con k0 = hf(xn , yn ) y k1 = hf(xn + , yn + 0 ) y 6 2 2 k2 = hf(xn + h, yn - k0 + 2k1 ) yn+1 = yn + El método que se demostró en esta sección es de orden cuatro: 1 yn+1 = yn + (k0 + 2k1 + 2k2 + k3 ) 6 k0 =hf(x,y), k1 =hf(x+½h ,y+½k0), k2=hf(x+½h,y+½k1), k3=hf(x+h , y+k2), Método de Runge-Kutta de orden superior Runge-Kutta-Fehlberg 1408 2197 1 25 k0 + k2 + k3 - k4 a) yn+1 = yn + 2565 4104 5 216 k0 = hf(xn , yn ) k h k1 = hf xn + , yn + 0 4 4 3k 9k 3h k2 = hf xn + , yn + 0 + 1 8 32 32 1932k0 7200k1 7296k2 12h k3 = hf xn + , yn + + 13 2197 2197 2197 439k0 3680k2 845k3 k4 = hf xn + h, yn + - 8k1 + 216 513 4104 8k 3544k2 1859k3 11k4 h k5 = hf xn + , yn - 0 + 2k1 + 2 27 2565 4104 40 b) 144 donde: 250 125 512 37 yn+1 = yn + k0 + k2 + k3 + k5 621 594 1771 378 k0 = hf(xn , yn ) k h k1 = hf xn + , yn + 0 5 5 3k 9k 3h k2 = hf xn + , yn + 0 + 1 10 40 40 3k 9k 6k 3h k3 = hf xn + , yn + 0 - 1 + 2 5 10 10 5 11k0 35k3 5k 70k2 k4 = hf xn + h, yn + 1 + 54 2 27 27 1631k0 175k1 44275k3 253k4 575k 2 7h k5 = hf xn + , yn + + + + + 8 55296 512 13824 110592 4096 Método de Butcher 1 7k0 + 32k2 + 12k3 + 32k4 +7k5 90 k h k0 = hf(xn , yn ) k1 = hf xn + , yn + 0 k2 = hf 4 4 yn+1 = yn + k0 k1 xn + 4, yn + 8 + 8 k h k3 = hf xn + , yn - 1 + k2 2 2 3k 9k 3h k4 = hf xn + , yn + 0 + 3 4 16 16 3k 2k 12k2 12k3 8k4 k5 = hf xn + h, yn - 0 + 1 + + 7 7 7 7 7 Un problema que presentan los métodos de aproximación es el hecho de poder seleccionar un tamaño de paso adecuado para la obtención de la solución numérica, ya que si h es muy grande, el error por truncamiento es excesivo y los errores acumulados hace que el resultado sea de poca exactitud. Pero si h es pequeño, el método consume tiempo innecesario y los errores cometidos son muy significativos. Por lo general es conveniente 145 mantener un error local por iteración menor que un valor fijo predeterminado. 6.4 Sistema de ecuaciones diferenciales ordinarias En esta sección se tocarán y ampliaran las técnicas desarrolladas en las secciones anteriores para resolver ecuaciones diferenciales de primer orden a más de una ecuación de primer orden, esto es, un sistema de ecuaciones de primer orden. Definición 6.4.1 Sean f1(x,y,z), f2(x,y,z),…,fn(x,y,z) funciones que dependen de x, y y de z. Al conjunto de ecuaciones diferenciales del tipo: dy1 dx f1 ( x, y1 , y2 ,... yn ) dy2 f ( x, y , y ,... y ) 2 1 2 n dx dyn f ( x, y , y ,... y ) n 1 2 n dx (6.4.1) se les denomina sistema de ecuaciones diferenciales de primer orden. Se requiere que 6.4.1 este sujeto a condiciones iniciales y que estas se conozcan para dar iniciar una solución numerica del mismo. La solución numérica de las ecuaciones diferenciales ordinarias nos revela una aproximación a la solución de estas, dado que su solución explicita es en ocasiones imposible, de la misma manera es conveniente utilizar y ampliar estas aproximaciones a la solución de sistemas de ecuaciones ordinarias. 146 Cualquiera de los métodos vistos hasta ahora, pueden hacerse extensivos a los sistemas de ecuaciones diferenciales aplicándolo a cada una de las ecuaciones como se muestra enseguida. Ejemplo 6.4.1 Resolver el siguiente sistema de ecuaciones diferenciales lineales, utilizando el método de Euler. dx x 2 xy, dt dy x 2 y 2 sujeto a x(1) 1, y (1) 2, h 0.1 dt Solución: De la fórmula de Euler 6.2.1 podemos escribir: 2 xn+1 = xn +(xn - xn yn )h y 2 2 yn+1 = yn +(xn - yn )h obteniendo, al sustituir las condiciones iniciales, la primera iteración y con esta la siguiente y así sucesivamente como se muestra en la tabla los resultados: dx = x 2 - xy, dt dy = x 2 - y 2 sujeto a x(1) = 1, y(1) = 2, h = 0.1 dt iteración 1 Con x0 =1 , y0 =1 y h = 0.1 x1 = x0 + ( x0 x0 y0 )h x1 = 1+((1)2 - (1)(1))(0.1) x1 = 1 2 y1 = y0 + ( x0 y0 )h y1 = 1+((1)2 - (1)2 )(0.1) y1 = 1 2 2 iteración 2 Con x1 = x0 + h =1.1 , y1 = y0 + h =1.1 x1 = x0 + ( x0 x0 y0 )h 2 y1 = y0 + ( x0 y0 )h 2 2 Con x1 = x0 + h = 1.1 y = 1 Con x = 1, y1 = y0 + h = 1.1 x1 = 1.1+((1.1)2 - (1.1)(1))(0.1) y1 = 1.1+((1)2 - (1.1)2 )(0.1) x1 = 1.111 y1 = 1 147 continuamos, sucesivamente hasta obtener los resultados de la tabla 6.6. n 0 1 2 3 4 5 6 7 8 9 10 t 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 x 1 1 1.111 1.2365521 1.381534042 1.552874949 1.760787014 2.020961144 2.358712647 2.81736817 3.476735056 y 1 1 1.079 1.163428 1.256709078 1.363506757 1.490463615 1.647543255 1.850580907 2.126456854 2.524502182 Tabla 6.6 6.5Aplicaciones La solución de ecuaciones diferenciales por métodos numéricos no se limita solo a cierto tipo, ya que la relación que aparece en cada iteración, no es una relación funcional sino solo una tabulación, con valores de una variable independiente la cual se produce con una condición inicial, para obtener un valor futuro de la variable dependiente. Es claro que si la condición inicial cambia, debemos de iniciar nuevamente los cálculos del problema, con lo que podemos decir que estos métodos se amplían, lo que no sucede con técnicas analíticas. Hasta el momento, solo hemos tratado ecuaciones diferenciales de primer orden, pero en ingeniería suelen presentarse ecuaciones diferenciales de mayor orden. Por ejemplo: m d2x dx kx F (t ) 2 dt dt (6.5.1) Corresponde a un sistema, donde cierta masa, m, esta adherida a un resorte flexible, que se encuentra fijo a en un punto O, con libertad de desplazarse sobre un plano PQ, como muestra la figura 6.2. x(t) denota el 148 desplazamiento instantáneo de la masa, en el tiempo t desde su posición de reposo. Sobre m actúan varias fuerzas, como son: una fuerza recuperadora – kx, donde k es una constante que depende del resorte, una fuerza amortiguadora proporcional a la velocidad instantánea de la masa y una fuerza externa F(t) que actúa sobre la masa, la cual depende del tiempo. Posición de equilibrio O m P Q O m P Fig 6.2 Q x En esta ecuación no se examino el rozamiento de la superficie, al contemplar esta variable, resta velocidad al movimiento y por ende la fuerza es proporcional a la velocidad que es igual a – j x, con lo cual la ecuación diferencial quedaría expresada: m d2x dx (k j ) x F (t ) 2 dt dt (6.5.2) sin provocar cambio en la forma de la ecuación diferencial. La siguiente ecuación diferencial: L d 2q dq q R E (t ) 2 dt C dt (6.5.3) corresponde a una expresión, donde se involucra los siguientes elementos: a) Un generador o batería que produce una fuerza electromotriz f.e.m. E medida en voltios. b) Una resistencia R medida en homios. c) Un inductor con inductancia L medido en henrys. d) Un capacitor con capacitancía C, medido en faradios. 149 Como se muestran simbólicamente en la figura 6.3 Fig. 6.3 Cuando el circuito se cierra mediante el interruptor K, fluye una carga Q (medida en culombios) a las placas del condensador (C). A la variaron de dQ carga respecto al tiempo se denomina corriente y esta dada por i cuya dt unidad de media se define como amperios cuando t se mide en segundos. En cada uno de los elementos se define la caída de voltaje a través del circuito de la siguiente manera: dQ a) caída de voltaje a través de una resistencia: RI R dt 2 dI d Q b) caída de voltaje a través del inductor: L L 2 dt dt Q c) caída de voltaje a través de un capacitor: C d) caída de voltaje a través de una f.e.m.: – E La ecuación diferencial se forma a partir de las leyes de Kirchhoff, en las cuales se establece: a) La suma algebraica de las corrientes que fluyen por un punto de unión es igual a cero. b) La suma algebraica de las caídas de voltaje alrededor de la maya es igual cero. 150 De estas dos leyes, la primera solo se aplica cuando se tienen, circuitos eléctricos más complicados, que el mostrado en la figura 6.3. Las ecuaciones que se generan, como puede observarse en los dos ejemplos, son de segundo orden y si se aplica la primera ley de Kirchhoff a un circuito más complicado aparece un sistema de ecuaciones lineales. Por lo regular este tipo de ecuaciones diferenciales, suelen resolverse por diversos métodos, pero en nuestro caso los resolveremos mediante un método numérico. La ecuación diferencial: dn y n 1 f ( x, y, y ', y '',..., y ) n dx donde: y' dy d2 y d ( n1) y , y '' 2 , ...., y ( n 1) ( n1) dx dx dx puede reducirse a un sistema de ecuaciones lineales simultaneas de primer orden, efectuando los siguientes cambios de variables: y1 y, y2 y ', y3 y '', y4 y ''',..., yn y ( n 1) derivando miembro a miembro la primera y sustituyendo en la segunda, obteniendo: dy3 dyn1 dyn d n y dy1 dy2 y2 , y3 , y4 ...., yn , n f ( x, y, y1 , y2 ,..., yn ) dx dx dx dx dx dx Si se dan las condiciones iniciales x = x0, y = y0, y’ = (y1)0, y’’ = (y2)0,…, y(n-1)=(yn-1)0 , con lo cual podemos hacer extensivo los métodos anteriores, ampliándolos a las ecuaciones de orden mayor que uno. Ejemplo 6.5.1 151 Escribir el sistema de ecuaciones simultaneas de primer orden equivalente a la ecuación de segundo orden: d2 y dy 4x 8 y 0 2 dx dx Solución: dy d 2 y dw Si , de tal manera que al efectuar la w entonces dx dx dx 2 sustitución en la ecuación diferencial obtenemos: dw 4 xw 8 y 0 dx generando las siguientes ecuaciones lineales: dy dw w f ( x, y, w) , -4xw+ 8y = g(x, y,w) dx dx Estas ecuaciones diferenciales simultaneas se pueden resolver por cualquier métodos observado en la sección 6.4, generalizándolos para el sistema de ecuaciones diferenciales, de la siguiente manera: k0 = hf ( x0 , y0 , w0 ) h( w0 ) c0 hg ( x0 , y0 , w0 ) h( 4 x0 w0 8 y0 ) k1 = hf(x0 +½h , y0 +½k0 , w0 ½c0 ) h(w0 ½c0 ) c1 = hg(x0 +½h , y0 +½k0 , w0 ½c0 ) h(4( x0 +½h)(w0 ½c0 ) 8( y0 +½k0 )) k2 = hf(x0 +½h , y0 +½k1 , w0 ½c1 ) h(w0 ½c1 ) c2 hg(x0 +½h , y0 +½k1 , w0 ½c1 ) h(4( x0 +½h)( w0 ½c1 ) 8( y0 +½k1 )) k3 = hf(x0 + h , y0 + k2 , w0 c2 ) h( w0 c2 ) c3 = hg(x0 + h , y0 + k2 , w0 c2 ) h(4( x0 + h )( w0 c2 ) 8( y0 + k 2 )) donde: 1 y1 = y0 + (k0 + 2k1 + 2k2 + k3 ), 6 152 1 w1 = w0 + (c0 + 2c1 + 2c2 + c3 ) 6 Ejemplo 6.5.2 Una batería de 100 sen3t voltios se conecta a un circuito simple en el cual el inductor es de 2 henrys, la resistencia es de 16 ohmios y el condensador de 0.02 faradios. Determinar el valor de la carga después de cerrado el circuito en t =1 segundo, si inicialmente, tanto la corriente como la carga son cero. Solución: De acuerdo al modelo de ecuación 6.5.3 la ecuación que se desprende es: 2 d 2q dq q 16 100sen3t 2 dt 0.02 dt o d 2q dq 8 25q 50sen3t 2 dt dt dq d 2 q dw dw Haciendo w, 2 , entonces 8w 25q 50sen3t dt dt dt dt Generando el siguiente sistema de ecuaciones lineales: dq dw w, 50sen3t 25q 8w dt dt las cuales resolveremos como en el ejemplo 6.5.1: k0 = hf (t0 , q0 , w0 ) h( w0 ) c0 hg (t0 , q0 , w0 ) h(50sen3t0 25q0 8w0 ) k1 = hf(t0 +½h , q0 +½k0 , w0 ½c0 ) h(w0 ½c0 ) c1 = hg(t0 +½h , q0 +½k0 , w0 ½c0 ) h(50sen3 t0 ½h 25 q0 +½k0 8(w0 ½c0 )) k2 = hf(t0 +½h , q0 +½k1 , w0 ½c1 ) h(w0 ½c1 ) c2 hg(t0 +½h , q0 +½k1 , w0 ½c1 ) h(50sen3 t0 ½h 25 q0 +½k1 8(w0 ½c1 )) k3 = hf(t0 + h , q0 + k2 , w0 c2 ) h(w0 c2 ) c3 = hg(t0 + h , q0 + k2 , w0 c2 ) h(50sen3 t0 h 25 q0 + k3 8(w0 c3 )) encontrando el valor futuro de w y de q mediante la fórmula recurrente: 1 1 q1 = q0 + (k0 + 2k1 + 2k2 + k3 ), w1 = w0 + (c0 + 2c1 + 2c2 + c3 ) 6 6 las condiciones iniciales que se dan son: 153 i (0) dq(0) 0, q(0) 0, o bien q(0) 0, w(0) 0 dt esto es con los valores iniciales, t0 = 0, q0 = 0, w0 = 0 iniciamos las iteraciones. Las primeras tres aproximaciones de la carga son: k0 = 0 k0 = 0.05694268 k0 = 0.168274214 c0 0 c0 0.972246882 c0 1.150040301 k1 = 0 k1 = 0.105555024 k1 = 0.225776229 c1 = 0.747190662 c1 = 1.209393417 c1 = 1.064662845 k2 = 0.037359533 k2 = 0.1174125 k2 = 0.221507357 c2 0.448314397 c2 1.053771173 c2 1.026936309 k3 = 0.044831439 k3 = 0.162319797 k3 = 0.270967845 c3 = 1.025550683 c3 = 1.181310026 c3 = 0.868145042 q1 0.019925084 q1 0.130791338 q1 0.353092877 w0 0.5694268 w0 1.682742148 w0 2.71630609 Continuando con las iteraciones, obtenemos la tabla 6.7: n 0 1 2 3 4 5 6 7 8 9 10 t q qreal error 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.019925084 0.130791338 0.353092877 0.659845643 1.000875354 1.319763128 1.565018727 1.696936172 1.691274973 1.540584492 0 0.020365760 0.131365446 0.353541803 0.660015436 1.000716644 1.319306994 1.564346879 1.696154262 1.690492094 1.539898979 0 4.40676 e-4 5.74108 e-4 4.48926 e-4 1.69793 e-4 1.5871 e-4 4.56134 e-4 6.71848 e-4 7.8191 e-4 7.82879 e-4 6.85513 e-4 Tabla 6.7 154 PROBLEMAS CAPÍTULO VI 1.- Resolver cada una de las siguientes ecuaciones diferenciales por el método de i) Euler, ii)Euler mejorado, iii)Runge-Kutta Fórmula 6.3.5. a) b) c) d) e) f) dy y2 y (0) 1 0 x 1 h = 0.2 dx dy xy 2 y (2) 1 2 x 4 h = 0.5 dx dy x 2 y 2 y (1) 2 1 x 2 h = 0.2 dx dy x y y (1) 1 1 x 2 h = 0.2 dx x y dy y xy 2 y (1) 1 1 x 2 h = 0.2 dx x dy xy y y (0) 1 0 x 1 h = 0.1 dx 155 2.- Resolver los siguientes sistemas de ecuaciones diferenciales mediante el método de Runge-Kutta mostrado en 6.5.1. d2 y dy + 4x - 8y = 0 y(0) = 1 y'(0) = 2 h = 0.2 2 dx dx d2 y dy b) +x +y=0 y(0) = 1 y'(0) = 2 h = 0.2 2 dx dx d2 y a) - (4x + 1)y = 0 y(0) = 1 y'(0) = 2 h = 0.2 dx 2 a) Capítulo 7 Ecuaciones diferenciales Parciales Las ecuaciones en derivadas parciales, tienen un campo muy importante de aplicación, tanto en matemáticas aplicadas como matemática pura. Las ecuaciones de este tipo aparecen en estudios de métodos matemáticos de la física o física matemática. Plantearemos algunas ecuaciones diferenciales parciales ya que, el conocimiento de estas ecuaciones, es primordial para el entendimiento de sistemas más complejos. La intención de resolverlo por técnicas numéricas es debido, como ya hemos mencionado en casi todos los capítulos, a que la mayoría de estos problemas no es sencillo el resolver por métodos analíticos, incluso aun cuando se conoce la solución, el análisis numérico nos auxilia para obtener una solución más rápida. Existen diferentes métodos para resolver una ecuación diferencial parcial, desde el punto de vista numérico. En este capitulo hablaremos solo de la 156 solución de ecuaciones diferenciales parciales por diferencias finitas, ya que se ha probado que es el más útil, fácil de utilizar en un computador y en algunos casos, prácticamente, el único que funciona. Por lo general, en los problemas de valor límite, tratamos de encontrar una relación o fórmula matemática que podamos adoptar para lograr una aproximación. Posteriormente necesitamos resolverlas en términos de las variables que establezcamos. Por ultimo, nos será muy útil el hecho de darle una interpretación, ya que esto nos conduce a nuevos conocimientos. 7.1 Algunos conocimientos útiles Sea z = f(x,y) una función de dos variables independientes x,y, tomamos un punto (x0 ,y0) dentro de una vecindad de puntos (x,y), si y = y0 , entonces z se vuelve una función de una variable a saber z = f(x,y0). Si esta función se deriva con respecto a x, la derivada es llamada, derivada parcial de f(x,y) con respecto a x para y = y0, lo cual podemos expresar mediante límite, si existe y es finito, de la siguiente manera: z f ( x h, y ) f ( x. y ) lim f x ( x, y ) x h0 h (7.1.1) Ahora bien, si x = x0 entonces z se vuelve una función de una variable a saber z = f(x0,y). Si derivamos esta función con respecto a y, la derivada es llamada, derivada parcial de f(x,y) con respecto a y para x = x0, que como el caso anterior podemos expresar: z f ( x, y h) f ( x. y ) lim f y ( x, y) y h0 h (7.1.2) Las notaciones más comunes para las derivadas parciales de z = f(x,y), con respecto a x son: z , x zx , fx , y f x 157 Si la ecuación z = f(x,y) es una función de dos variables independientes, la interpretación geométrica de las derivadas parciales zx , zy la podemos observar al graficar z como una superficie, según muestra la figura 7.1: Fig 7.1 Podemos decir que 7.1.1, es la pendiente, en algún punto, de una recta que pasa por CD en el plano constante y = yo, donde z = f(x, y0), mientras que 7.1.2, es la pendiente, en algún punto, de una recta que pasa por AB en el plano constante x = x0 , donde z = f(x0, y). Las derivadas parciales f x1 , f x2 ,..., f xn de una función f(x1 ,x2 ,…,xn), son funciones de x1, x2 ,…,xn y pueden tener derivadas parciales respecto a una o todas las variables. Una segunda derivada parcial para una función de dos variables independientes f(x,y) se obtiene derivando por segunda ocasión a f(x,y) respecto a las variables independientes, por ejemplo: f 2 f f xx x x x 2 f 2 f f yy y y y 2 f 2 f f xy x y xy f 2 f f yx y x yx (7.1.3) Ejemplo 7.1.1 Encuentre fx , fy , fxy , fyx , fxx , fyy para la función f(x,y) = x3 y2 Solución: De acuerdo con 7.1.1, 7.1.2 y las reglas de derivación tenemos: 158 f ( x3 y 2 ) 3x 2 y 2 x x f ( x3 y 2 ) 2 x3 y y y f ( x 3 y 2 ) 3x 2 y 2 6 xy 2 xx x x x f ( x3 y 2 ) 2 x3 y 2 x3 yy y y y f ( x3 y 2 ) 2 x3 y 6 x 2 y xy x y x f ( x3 y 2 ) 3x 2 y 2 6 x 2 y yx y x y En este ejemplo podemos observar que fxy = fyx , esto es valido cuando las derivadas son continuas en el punto en cuestión. Definición 7.1.1: Una ECUACIÓN DIFERENCIAL PARCIAL, es aquella que contiene una función desconocida de dos o más variables y sus derivadas parciales con respecto a esas variables. Ejemplo 7.1.2 Las siguientes expresiones son ecuaciones diferenciales parciales: a) 3 z z 4 x y 2 z b) 4x 3y xy c) d) z 2 z t x 2 3 2 z 3 z e) 4 2 z xy 2 x 2 z 2 z z3 x 2 y 2 El orden de la ecuación diferencial parcial, es el orden de la derivada más alta que se presente en ella. En el ejemplo 7.1.2 el orden de las ecuaciones diferenciales parciales es: a) de primer orden, b), c) y d) de segundo orden y e) de tercer orden. 159 La solución de la ecuación diferencial parcial es aquella que satisfaga la ecuación idénticamente. Se dice que una ecuación diferencial parcial es lineal, si es lineal en la función desconocida y en todas sus derivadas, en donde sus coeficientes dependen solamente de variables independientes. La solución general, de una ecuación diferencial parcial, es aquella que contiene un número de funciones independientes arbitrarias iguales al orden de la ecuación. La solución particular, es obtenida de la solución general, al tener funciones arbitrarias particulares. 7.2 Clasificación de las ecuaciones diferenciales parciales Una ecuación diferencial parcial lineal, de segundo orden, en dos variables independientes tiene la forma: A 2u 2u 2u u u B C D E Fu G 2 2 xy x y x y (7.2.1) donde A, B, C, D, E, F, G pueden depender de x o de y pero no de u. Una ecuación diferencial parcial, que no tiene la forma 7.2.1 le llamaremos ecuación diferencial parcial no lineal. Si G =0, 7.2.1 se dice que es homogénea, si G 0 es no homogénea. La expresión 7.2.1 frecuentemente es clasificada como una ecuación diferencial parcial en cualquiera de las siguientes clases: parabólica, elíptica o hiperbólica, debido a la naturaleza de la solución de la expresión 160 B2 – 4AC, sea igual cero, menor o mayor respectivamente como se muestra en la tabla 7.1. Ecuación u 2u a) 4 2 y x b) c) B2 – 4AC =0 Clase Parabólica A = 4 , B=0, C = 0 2 2u 2 u c 0 x 2 y 2 2 2u 2 u a 0 t 2 x 2 <0 Elíptica A = 1 , B=0, C = c2 >0 Hiperbólica A=1, B=0, C=-1/c2 Tabla 7.1 Clasificación útil, ya que estas se asocian a algunos experimentos específicos en ingeniería y por otra parte cada caso se resuelve de manera diferente. El inciso c) de la tabla 7.1 es llamada ecuación de la cuerda vibrante. La forma de presentarla es: 2 2u 2 u a t 2 x 2 a2 (7.2.2) donde x y t son variables independientes y a una constante. Esta ecuación es hiperbólica y describe una gran variedad de fenómenos físicos que involucran propagación de ondas, vibraciones de una cuerda elástica, las oscilaciones de una barra, transmisión de señales acústicas y eléctricas etc... El ejemplo más simple de la ecuación de onda es el movimiento vibratorio de una cuerda de longitud L, de masa (por unidad de longitud) y tensión T, que está extendida entre dos soportes y sujeta en los extremos. La posición de equilibrio esta en el intervalo [0,L]. La incógnita que se presenta en este problema es el desplazamiento transversal de la cuerda, u(x,t) nos da el desplazamiento de cualquier punto x de la cuerda en un tiempo t. La ecuación de movimiento se encuentra, considerando una porción de la cuerda con sus extremos en x y x+ Δx a la cual se aplica la segunda ley de 161 Newton, Se asumiendo que la cuerda es perfectamente flexible y no ofrece resistencia al doblarse. El análisis de fuerzas se muestra en la figura 7.2. T2 T1 y(x+Δx,t) ,t) y(x,t) x x+Δx L Fig. 7.2 En cierto instante, por ejemplo t = 0, el movimiento se propaga de un punto a otro como muestra la figura 7.2. con la cual aparecen las condiciones que especifican el valor de la función y/o sus derivadas en cierto instante. A estas condiciones se les llama condición de frontera. La ecuación 7.2.2 puede generalizarse para más dimensiones, por ejemplo en dos dimensiones tendríamos la membrana de tambor, cuya ecuación es: 2 2u 2u 2 u a 2 t2 y2 x a2 (7.2.3) La ecuación 7.2.2, también se le interpreta como el movimiento de una viga con vibraciones pequeñas. El desplazamiento longitudinal, partiendo desde el equilibrio de una sección transversal en x es u(x,t) . En este caso la constante a2 = E / , siendo E la magnitud de la elasticidad la cual depende del tipo de viga (fatiga por deformación), es la masa por unidad de volumen. Otros tipos de ecuaciones diferenciales parciales se presentan al relacionar el operador diferencial nabla el cual se define en el análisis vectorial como: 162 ˆ ˆ ˆ i j k x y x Al efectuar la siguiente operación vectorial: ˆ ˆ ˆ ˆ ˆ 2 2 2 iˆ j k i j k 2 2 2 y x x y x x y x x y sabiendo que cos00 2 se obtiene la ecuación 7.2.4: 2 2 2 2 x 2 y 2 x 2 (7.2.4) llamado operador Laplaciano. Este operador al aplicarse a una función u(x,y,z,t) nos proporcionara la temperatura en la posición (x,y,z) de cierto sólido en un tiempo t, con una conductividad térmica C, calor especifico y masa ρ (por unidad de volumen), que son constantes. Así obtenemos la siguiente expresión, denominada ecuación de conducción de calor: u C (7.2.5) 2 u conductividad térmica dt Si u 0 7.2.5 se transforma en: dt 2 u 0 ó 2u 2u 2u 0 x 2 y 2 x 2 (7.2.6) Conocida como ecuación de Laplace. En la teoría, de Electricidad o Gravitacional, u representa el potencial eléctrico y el potencial gravitacional respectivamente. En la teoría de conducción de calor u representa la temperatura en condiciones estables después de cierto tiempo. Los problemas de calor unidimensional por lo regular se pueden expresar como: 163 u 2u 2 t t (7.2.7) cuya interpretación física es: una barra de longitud L cuya superficie lateral se encuentra bajo ciertas condiciones especificas, en esta ecuación, es la difusividad térmica de la barra. Un modelo para el área de economía, se presenta cuando, deseamos saber las opciones de compra de cierto activo S con vencimiento es un periodo T encentrándose este a un precio de ejercicio P. Esto lo podemos representar utilizando 7.2.7 si S = Pex , t = T – 2 /2, y el valor de compra V(T,S) = e-1/3( - 1)x-1/5(+1) u(x,), = 2r/2, cuya ecuación final es: 2 u u x 2 t x u ( x, 0) max(e 1 ( 1) x 5( 1) 3 , 0) Así podríamos continuar enumerando diferentes modelos de ecuaciones diferenciales parciales. Enseguida veremos un método para resolver estas, desde un punto de vista numérico. 7.3 Método de diferencias finitas Para resolver los diferentes tipos de ecuaciones diferenciales parciales, es necesario un método conveniente con el cual podamos garantizar una solución aproximada, que sea consistente, en donde las pequeñas variaciones no alteren los resultados de salida grandemente. La solución de los diferentes tipos de ecuaciones anteriormente expuestas, implican el conocimiento de una función u(x,y) ó u(x,t) que es nuestra incógnita. El método de diferencias finitas discretiza el problema, encontrando solución solo en algunos puntos. Para esto, en una región, de acuerdo con las condiciones iniciales, se divide el plano en una malla de puntos, solo en la cual encontraremos la solución. Estableceremos una relación equidistante entre ellos, por lo que pueden ser representados en la forma: h 164 ba n k d c m Los intervalos a, b y c, d se particionan en, n partes iguales de longitud h, y m partes de longitud k respectivamente, asociando así una red al rectángulo R, a ≤ x ≤ b, c ≤ y ≤ d, como se muestra en la figura 7.3, donde: xi = a + ih para i=0,1,2,…,n y y y x yi = c+jk para j = 0,1,2,…,m h ... ... ... ... ... ... ... x k ... x Fig.7.3 Calcularemos la solución solo en los puntos de la malla u(nh, mk), para lo cual haremos uso de las derivadas numéricas, centradas, hacia adelante y hacia atrás, que analizamos en el capítulo V, adecuándolas para derivación parcial de la siguiente manera: a) u ( xi , y j ) x u ( xi h, y j ) u ( xi , y j ) h 2 h u (i , y j ) i ( xi1 , xi1 ) 2 x 2 2 b) u ( xi , y j ) u ( xi , y j k ) u ( xi , y j ) h u ( xi , j ) y h 2 x 2 j ( y j 1 , y j 1 ) 2 2 4 c) u( xi , y j ) u(xi + h, y j ) - 2u(xi , y j )+u(xi - h, y j ) h u (i , y j ) x 2 h2 12 x 4 2 2 4 d) u ( xi , y j ) u(xi , y j k) - 2u(xi , y j )+u(xi , y j k) h u ( xi , j ) y 2 h2 12 x 4 i xi1 , xi1 j y j 1 , y j 1 165 Tabla 7.2 Dado que la malla estará igualmente espaciada tanto en una variable como en la otra, aprovecharemos la situación y rescribiremos las ecuaciones de la tabla 7.2, con la siguiente notación: 2 a) u ( xi , y j ) u ( xi1 , y j ) u ( xi , y j ) h u (i , y j ) ( x , x ) i i 1 i 1 x h 2 x 2 2 b) u ( xi , y j ) u ( xi , y j 1 ) u ( xi , y j ) h u ( xi , j ) y h 2 x 2 j ( y j 1 , y j 1 ) 2 2 4 c) u( xi , y j ) u(xi1 , y j ) - 2u(xi , y j )+u(xi1 , y j ) h u (i , y j ) x 2 h2 12 x 4 2 4 2 d) u ( xi , y j ) u(xi , y j 1 ) - 2u(xi , y j )+u(xi , y j 1 ) h u ( xi , j ) y 2 h2 12 x 4 i xi1 , xi1 j y j 1 , y j 1 Tabla 7.3 Al efectuar la sustitución, de las fórmulas de la tabla 7.3, obtendremos una ecuación en diferencias, la cual, dependiendo de las condiciones de frontera, nos proporcionara un sistema de ecuaciones lineales, cuya solución la obtendremos por alguna método numérico como el de Gauss-Seidel o algún otro método. Las fórmulas de la tabla 7.3, las codificaremos, para un mejor manejo de los subíndices. Para esto, el punto Pi,j = (xi ,yj), luego vi,j = u(xi,,y j). Además el segundo término de las fórmulas solo los consideramos para el análisis de error, con lo que la tabla 7.3 se transforma en: u ( xi , y j ) x u ( xi , y j ) y 166 vi1 , j vi , j (7.3.1) h vi , j 1 vi , j h (7.3.2) 2u ( xi , y j ) x 2 vi1 , j -2vi , j +vi1 , j vi , j 1 -2vi , j +vi , j 1 2u ( xi , y j ) y 2 h (7.3.3) 2 h (7.3.4) 2 Estos métodos nos permitirán valorar opciones de solución que implican una reducción de los cálculos matemáticos que en ocasiones arrojan soluciones que no es posible expresar explícitamente, además podemos calcular la solución en todo los puntos del mallado permitiéndonos así determinar temperaturas, movimientos, desplazamientos, sin más que calcular derivadas numéricamente con los resultados obtenidos. Para observar el método, veamos el siguiente ejemplo. Ejemplo 7.3.1 Resolver la siguiente ecuación diferencial parcial: 2u 2u 0 x 2 y 2 (7.3.5) sujeta a las siguientes condiciones: 0 < x < 0.8, 0 < y < 0.8, u(x , 0) = 00, u(0 , y) =1000, u(x,0.8) = 1600, u(0.8,y )=(200 y) 0. Solución: Dividiremos la región 0 < x < 0.8, subintervalos de mismo tamaño. 0 < y < 0.8 en n = m = 4 u(x,0.8)=160 3,1 3, 2 3,3 1000 2,1 2, 2 2,3 1,1 1, 2 u(0.8,y)=200y 1,3 167 00 Fig. 7.4 Sustituiremos en 7.3.5 las fórmulas 7.3.3 y 7.3.4, para igualar ambas: vi1 , j -2vi , j +vi1 , j h 2 vi , j 1 -2vi , j +vi , j 1 h2 de esta obtenemos: vi1 , j vi1 , j vi , j 1 vi , j 1 4vi , j 0 (7.3.6) la cual es una ecuación en diferencias, que en este caso particular recibe el nombre de ecuación en diferencias de Laplace. En este caso se debe señalar que cuando el material esta constituido por una sustancia porosa o similar, con poros o espacios libres relativamente pequeños y distribuidos en la masa del material uniformemente, la ecuación sigue siendo valida, pero el valor de la conductividad térmica tomará un valor ficticio equivalente a la temperatura en análisis. De esta manera al sustituir i =1,2,3 j=1,2,3 que generan los puntos (1,1), (1,2),…., (3,3), obtendremos el siguiente conjunto de ecuaciones lineales. (1,1) v21 v01 v12 v10 4v11 0 4v11 v21 v12 100 (2,1) v31 v11 v22 v20 4v21 0 v11 4v21 v31 v22 0 (3,1) v41 v21 v32 v30 4v31 0 v21 4v31 v32 40 (1, 2) v22 v02 v13 v11 4v12 0 v11 4v12 v22 v13 100 (2, 2) v32 v12 v23 v21 4v22 0 v21 v12 4v22 v32 v23 0 (3, 2) v42 v22 v33 v31 4v32 0 (1,3) v23 v03 v14 v12 4v13 0 v31 v22 4v32 v33 80 v12 4v13 v23 260 (2,3) v33 v13 v24 v22 4v23 0 v22 v13 4v23 v23 160 (3,3) v43 v23 v34 v32 4v33 0 v32 v23 4v33 280 (7.3.7) las ecuaciones de la izquierda se obtuvieron al sustituir los valores: 168 v01 = v02 = v03 = 100, v10 = v20 = v 30 = 0, v14 = v24 = v34 =160 , v41 =200(0.2)=40, v42 =200(0.4)=80, v43 =200(0.6)=120. Si escribimos el sistema 7.3.7 de la siguiente forma: 4v11 v 11 v11 v21 v12 4v21 v31 v21 4v31 v21 v22 v32 4v12 v22 v12 4v22 v32 v22 4v32 v31 v13 v23 v33 v12 v22 4v13 v23 v13 4v23 v33 v23 4v33 v32 100 0 40 100 0 80 260 160 (7.3.8) 280 El sistema de ecuaciones es dominante y al utilizar el método de GaussSeidel, encontramos la siguiente solución: v11 59.2857 v12 46.6071 v13 42.1429 v21 90.5357 v22 85 v23 81.9643 v31 117.8571 v32 120.8929 v33 120.7143 Este método se conoce con el nombre de método de Liebmann. Es el más empleado para resolver, iterativamente, los sistemas de ecuaciones lineales como 7.3.8. el cual se deduce de 7.3.6, al despejar vi , j , como se muestra enseguida: vi , j = vi+1 , j +vi-1 , j +vi , j+1 +vi , j-1 4 Si deseamos encontrar la dirección del flujo de calor, la variable principal será la temperatura, de tal manera que la ecuación que relaciona el flujo y la 169 temperatura esta dada por la Ley de Fourier de conducción de calor, representada por: q k C T (7.3.9) donde qθ es el flujo de calor en la dirección θ con unidades en cal/(cm2-s), k es el coeficiente de difusividad térmica cuyas unidades son cm2/s, ρ es la densidad del material en g/cm3 , C la capacidad térmica del material, cuyas unidades son cal/g-0C y T es la temperatura dada en 0C. Si utilizamos las ecuaciones en diferencias para derivadas centradas del capitulo V, como: f '( x) f ( x h) f ( x h) ó 2h u ( xi , y j ) x vi1 , j vi1 , j 2x podemos escribir 7.3.9 de la siguiente forma: qx k C vi 1 , j vi 1 , j q y k C vi , j 1 vi , j 1 (7.3.10) 2x 2y para calcular el flujo de calor resultante y el ángulo que forma en cada punto de la siguiente manera: qr qx q y 2 2 y y 1 q y tan qx tan 1 q y qx qx 0 qx 0 (7.3.11) Ejemplo 7.3.2 Utilizando los valores del ejemplo 7.3.1 determine la distribución de flujo de calor en los puntos a) i=j=1, b) i=j=2, para la placa de aluminio de cal 80x80 cm., como muestra la figura 7.4. Tome κρC = 0.37 s cm 0 C Solución: 170 Para i = j = 1 tenemos De acuerdo a 7.3.10 se tiene, para i = j = 1: qx = -0.37 cal (90.5357 - 100)0 C = 0.087545 cal/(cm2 s) 2(20cm) s cm 0 C q y 0.37 cal (46.6071 0)0 C 0.431116 cal /(cm2 s) 0 2(20cm) s cm C El flujo resultante y el ángulo serán, de acuerdo a 7.3.11: qr (0.087545) 2 (0.431116) 2 0.439915 y como qx > 0, tenemos: 0.431116 78.5210 1.370454 0 180 0.087545 b) Para el nodo i = j = 2, tenemos: tan 1 qx = -0.37 cal (120.8929 - 46.6071)0 C = -0.68714 cal/(cm2 × s) 0 2(20cm) s× cm× C cal (81.9643 - 90.5357)0 C q y = -0.37 = 0.079285 cal/(cm2 × s) 0 2(20cm) s× cm× C El flujo resultante y el ángulo serán, de acuerdo a 7.3.11: qr (0.68714) 2 (0.079285) 2 0.691699 y como qx < 0 tenemos: 0.079285 173.420 0.042692 0 180 0.68714 tan 1 171 A medida que se analizan más las condiciones de frontera de este tipo de problemas podemos encontrar dificultades que pueden irse resolviendo. Tal es el caso de que la placa se encuentre aislada en uno de sus extremos, en cuyo caso la derivada es cero, por lo que 7.3.9 refleja este resultado dándonos un gradiente igual a cero. Para los puntos (0, j) de la placa calentada de acuerdo a 7.3.6 se tiene: v1 , j v1 , j v0 , j1 v0 , j1 4v0 , j 0 (7.3.12) lo cual resulta problemático, ya que necesitamos temperaturas que se encuentran fuera de la placa, y esto no tendría sentido en la aplicación de la fórmula. La solución alternativa se presenta si expresamos la derivada parcial mediante la siguiente fórmula de diferencia finita: v v1, j v1, j x 2x de donde : v1, j v1, j 2x v x (7.3.13) que al sustituir en 7.3.12 nos provee la ecuación en diferencias 7.3.14: v (7.3.14) 2v1, j 2x v0 , j 1 v0 , j 1 4v0 , j 0 x Ejemplo 7.3.3 Resuelva el ejemplo 7.3.1 si la placa tiene el extremo inferior aislado. Solución: Dado que la placa esta aislada la derivada es cero en la dirección y = 0. Así la ecuación 7.3.14 se reduce a: 2vi,1 +v1+1 ,0 +vi-1 ,0 -4vi ,0 = 0 ó bien 4vi ,0 - v1+1 ,0 - vi-1 ,0 -2vi,1 = 0 De esta manera al sistema 7.3.7 se le incorporan tres nuevas ecuaciones, generando así el siguiente sistema: 172 -2v11 4v10 -v20 -v 4v -v30 -2v21 20 10 -v20 4v30 -2v31 4v11 -v21 -v10 -v20 -v11 4v21 -v31 -v30 -v21 4v31 -v11 -v21 -v31 -v12 -v22 -v32 4v12 -v22 -v13 -v12 4v22 -v32 -v22 4v32 -v12 -v23 -v33 4v13 -v23 -v22 -v13 4v23 -v33 -v32 -v23 4v33 100 0 0 100 0 40 100 0 80 260 160 280 Cuya solución es: v10 = 93.8495 v11 = 97.0608 v12 = 106.3084 v13 = 123.7047 v20 = 81.2766 v21 = 88.0851 v22 = 104.4681 v23 = 128.5106 v30 = 55.0866 v31 = 69.5350 v32 = 94.9682 v33 = 125.8697 Otro de los problemas que se experimentan es el de tener fronteras irregulares como en la figura 7.5 1y 2 x 2 y 1x Fig 7.5 Las derivadas aproximadas en las direcciones de x e y se expresan: 173 vi , j vi 1, j v 2 x x i , j 1 vi , j vi 1, j v 1 x x i 1, j y (7.3.15) de las cuales al obtener las segundas derivadas: v v v v dx i , j 1 dx i 1, j 1 x 2 x x 2 x x 2 y sustituir en 7.3.15 y 7.3.16 obtenemos: 2 vi 1, j vi , j 2v 2 x 2 (7.3.16) vi 1, j vi , j 1 x 2 x 1 x 2 x 2 x 2 vi 1, j vi , j vi 1, j vi , j (7.3.17) 1 (1 2 ) 2 (1 2 ) de la misma manera podemos encontrar una relación similar para y: vi 1, j vi , j 2v 2 vi 1, j vi , j y 2 y 2 1 ( 1 2 ) 2 ( 1 2 ) Si sustituimos 7.3.17 y 7.3.18 en 7.3.5 se tiene: 2 x 2 vi 1, j vi , j vi 1, j vi , j 2 2 1 (1 2 ) 2 (1 2 ) y (7.3.18) vi 1, j vi , j vi 1, j vi , j 0 1 ( 1 2 ) 2 ( 1 2 ) la cual es nuevamente una ecuación en diferencias que al aplicarse a los puntos, de la región de análisis, nos proporcionara un sistema de ecuaciones lineales que al resolver, nos da la solución en los valores determinados. Para hacer uso de esta fórmula, necesitaremos los valores de x, y, 1 , 2 , 1 , 2 como se muestra en la figura 7.5. Hasta el momento no hemos resuelto ecuaciones diferenciales en donde intervenga el tiempo. Cuando interviene la variable tiempo, se presentan un tipo especial de ecuaciones diferenciales parciales, entre ellas se encuentran; la ecuación de la cuerda vibrante, la ecuación de conducción de calor y 174 otras, que caen dentro de la clasificación de ecuaciones diferenciales parciales parabólicas. Este tipo de ecuaciones parabólicas, se resuelve de igual manera que las ecuaciones elípticas, que son los casos que hemos analizado, sustituyendo las ecuaciones en diferencias para las derivadas parciales las cuales involucran nuevas variantes en el problema. La siguiente ecuación parabólica, conocida como ecuación de conducción de calor, la cual se expresa: T 2T k 2 t x (7.3.19) Podemos rescribirla, de acuerdo a las expresiones 7.3.1 y 7.3.3 así: Ti 1, j Ti , j t k Ti , j 1 2Ti , j Ti , j 1 Si despejamos Ti+1,j y hacemos (x)2 k t x 2 (7.3.20) obtenemos: Ti 1, j Ti , j Ti , j 1 2Ti , j Ti , j 1 (7.3.21) la cual es una ecuación en diferencias que proporciona la temperatura en los puntos dentro de la malla, utilizando valores vecinos. De hecho si conocemos la distribución inicial de la temperatura, podemos calcular esta, en un tiempo posterior, ya que la ecuación 7.3.21 se presenta de esa manera, incluso podríamos relacionarla, por su forma, con la ecuación del método de Euler para solución de ecuaciones diferenciales ordinarias. Al tipo de ecuación 7.3.21 se le conoce como fórmula o método explicito al hacer el siguiente acomodo: Ti 1, j Ti , j 1 (1 2 )Ti , j Ti , j 1 (7.3.22) donde los coeficientes de 7.3.22 pueden interpretarse como probabilidades 1 en el caso de que 0 ya que suman 1 y su valor esta entre 0 y 1. 2 175 De la ecuación 7.3.20 o 7.3.21 se desprende otro método de solución denominado método implícito. Aquí se realiza una interpolación lineal de la solucion de los puntos vecinos del mallado donde la solucion en los puntos no dependen exclusivamente de la solución lograda en el instante inmediato anterior, sino que obedece de la solución de los otros puntos en el mismo tiempo, con estas condiciones se requiere de la resolución de un sistema lineal de ecuaciones. El método implícito consiste en despejar vi,j de 7.3.22 vi 1, j 1 (1 2 )vi 1 vi 1, j 1 vi , j (7.3.23) donde se tiene que resolver el siguiente sistema de ecuaciones lineales: vi 1, jmin 0 0 0 vi 1, jmin 1 vi , jmin 1 1 2 v 0 0 i 1, jmin 2 vi , jmin 2 0 1 2 0 0 1 2 0 0 vi 1, jmin 3 vi , jmin 3 0 vi 1, jmin 2 v 0 0 0 1 2 i , jmin 2 vi 1, j 0 0 1 2 vi 1, jmin 1 vi , jmin 1 0 min cuya solucion es única ya que la matriz del sistema anterior es dominante e invertible. También podemos obtener otros métodos semi-implícitos con la combinación del método implícito y explicito, por ejemplo vi 1, j vi , j t vi 1, j 1 2vi 1, j vi 1, j 1 x 2 (1 ) vi , j 1 2vi , j vi , j 1 x 2 (7.3.24) donde λ es un valor de ponderación, ya que si λ = 0 obtenemos el modelo explicito y si λ = 1 obtenemos el modelo implícito. 176 Un caso especial es cuando el valor de λ = ½ , el cual proporciona un esquema implícito alterno que es exacto tanto en espacio como en tiempo. Este método se conoce con el nombre de Crank-Nicoloson Si se realiza un mallado variable, esto nos permitirá efectuar un refinado en las zonas donde se quiere reducir el error de aproximación, mientras que se puede mantener una malla más gruesa en zonas donde el error de aproximación es pequeño. Si realizamos una elección de mallado de manera inteligente tendremos un método de valoración eficiente y preciso. PROBLEMAS CAPÍTULO VII 1.- Resolver la siguiente ecuación diferencial parcial: 2u 2u 0 x 2 y 2 sujeta a las siguientes condiciones: 0 < x < 1, 0 < y < 1, u(x , 0) = 00, u(0 , y) =1000, u(x,1) = 1500, u(1,y )=(150 y) 0. 2.- Resolver la siguiente ecuación diferencial parcial: 177 2u 2u 0 x 2 y 2 sujeta a las siguientes condiciones: 0 < x < 0.5, 0 < y < 0.5, u(x , 0) = 00, u(0 , y) =1000, u(x,1) = 1500, u(1,y )=100 0. 3.- Resolver el problema 2 si la placa tiene el extremo inferior aislado. 4.- Utilizando los valores del problema 2 determine la distribución de flujo de calor en los puntos a) i=j=1, b) i=j=2, para la placa de aluminio de cal 50x50 cm., como muestra la figura 7.4. Tome κρC = 0.49 s cm 0 C 178