Subido por Emi Kaulitz

LIBRO NUMERICO 2020

Anuncio
Capítulo 1
1.1 Teoría de Errores
La obtención de información, la utilización de las herramientas
computacionales y un criterio importante de cómo seleccionar un método
particular para resolver un problema dado, es importante en múltiples
ocasiones, es aquí donde es propicio el discutir la Teoría de Errores y
observar como perturban los cálculos, afectando la exactitud de nuestros
resultados por lo cual es preciso dar un seguimiento primordial, con la
finalidad de poder estimar el grado de aproximación de una posible
solución. Enseguida mostraremos el tema de Teoría de Errores y su
propagación.
Tipos de error
Errores Indeterministicos, aleatorios o de ruido: Son el resultado de la
contribución de numerosas fuentes no controladas que se desplazan al azar
(en ambos sentidos, esto es, a favor o en contra), o bien son el valor de la
medida aproximada, respecto a su valor real.
Esto puede ser debido a variables como; presiones, vibraciones,
iluminación, señales de interferencia, en donde no aparece una ley
constante, estas no se pueden evitar y para reducir su influencia se recurre a
la repetición de las medidas en variadas ocasiones.
Errores Determinísticos: Se deben a la presencia de factores que se
encuentran dentro de la naturaleza y que no se tienen en cuenta, pero,
pueden determinarse mediante leyes, éstos, alteran significativamente el
resultado de las observaciones y/o medidas.
Entre estos están:
Errores sistemáticos, o de escala: Se presentan en diferentes sistemas de
medición y no se pueden obviar, en ellos se observa, por una parte errores
de precisión debido a la escala de los aparatos y por otra parte, al efectuar la
1
medida, la incertidumbre experimental asociada a un dato o valor de una
magnitud.
Toda herramienta de medida presenta una limitación en cuanto a la
precisión, X*, con la cual podemos obtener una determinada magnitud. La
propia escala del instrumento hace imposible apreciar pequeñas variaciones
en la medida de un determinado valor.
Ejemplo1.1.1: Al medir con una regla de 30 cm. Observamos que las
marcas no empiezan inmediatamente en el extremo de ella, limitándonos la
precisión con la que pudiésemos verificar la medida. Y si la regla esta mal
graduada, obtendremos un valor erróneo en las medidas (ya sea menor que
el real o mayor). Este puede descubrirse utilizando otra regla y así
comprobar que las mediciones no coinciden.
Si queremos medir un tiempo con un cronómetro de agujas y el segundero
no esta en el cero de su escala, antes de tomar la medida, podemos atrasar o
adelantar una medida sin desearlo.
Errores de observación: Debido a la actuación del observador y/o
experimentador. Se presentan por no observar bien, el medio ambiente que
rodea a un experimento, los instrumentos, ángulos de visión, calibración,
etc.
Errores algorítmicos: Estos se presentan al manipular los datos con
herramientas computacionales.
Aquí podemos encontrar una subclasificación como son:
Léxicos: Un identificador, palabra reservada u operador mal escrito.
Sintácticos: Un programa que no compensa la condiciones del lenguaje de
máquina.
Ejemplo1.1.2: Expresión aritmética con paréntesis no balanceados, un punto
y coma faltante.
Semánticos: Un error que requiere información sensible al argumento para
ser identificado.
Ejemplo1.1.3: Un operador aplicado a un tipo incompatible de operando,
accesar una variable no declarada.
2
Lógicos: Aparecen en la ejecución de un algoritmo.
Ejemplos1.1.4: Recursión infinita, accesar un arreglo fuera de los límites.
Entre estos están los errores de:
a)Truncamiento: Los que se deben a la necesidad de dar término a un
algoritmo después de un número finito de pasos.
b) Redondeo: Que acontecen al querer presentar los resultados en forma
finita, generalmente con un número determinado de decimales.
En cada uno de los casos anteriores la intención es eliminar este tipo de
errores en la medida de lo posible.
En los laboratorios, se trabajan con valores numéricos o magnitudes físicas
provenientes de diversas fuentes como son:
Medidas directas: Valores que se obtienen al efectuar medidas una sola vez,
como: medida del Volumen con un vaso de precipitados: 80 mml., o que se
repiten varias veces; segundos que transcurren: 51, 49, 50, 50, 49.
Medidas indirectas: Son el resultado de operaciones desarrolladas con
medidas directas, como, sustancia vertida en una mezcla, distancia
recorrida de un objeto con velocidad constante , etc..
En resumen, al realizan medidas u obtención de datos de tablas gráficas o de
otra fuente, estos se verán afectados de cierta incertidumbre con una mayor
o menor exactitud limitada por los instrumentos de medición, la observación
del experimentador. Estos al ser manipulados con una calculadora o
computadora, nos proporcionaran, resultados de salida que quizá no
coincidan con lo que esperamos.
Es de todo esto que, debemos tener mucho cuidado con los errores antes
mencionados y de poder elegir un buen algoritmo donde tengamos un
procedimiento, paso a paso, que nos proporcione un resultado deseado en un
número finito de pasos, como respuesta del modelo matemático planteado a
nuestro problema. Es aquí donde podemos efectuar la utilización de los
métodos numéricos, que nos darán una buena solución, la que llamaremos,
solución numérica a nuestro problema.
3
1.2 Propagación de Errores
Si “X ” es el valor real de una medida y “ X* ” el valor aproximado a
esta, entonces X – X* o X* – X es una comparación entre ambos. A estas
diferencias les llamaremos error. Utilizando la definición de valor absoluto
podemos escribir estas expresiones en una sola y si su diferencia es,
digamos, E estaremos en posición de definir lo siguiente:
Definición 1.2.1
Si “ X ” es el valor real de una medida y “X* ” el valor aproximado, se
definimos el error absoluto como:
X  X   X   X  EA
(1.2.1)
Definición 1.2.2
Si el error absoluto es dividido entre el absoluto del valor real X, esto es:
X  X
(1.2.2)
X
el resultado se define como error relativo (ER).
Es así como logramos establecer la siguiente relación entre ambos errores:
ER 
EA
X
X 0
(1.2.3)
Lo cual expresa que, el error relativo, es una fracción del error absoluto.
Dado esto podemos expresarlo de una forma porcentual y definir con esto el
error porcentual como:
4
EP = 100× ER
Error Porcentual
(1.2.4)
Ilustremos estas tres definiciones con el siguiente ejemplo.
Ejemplo1.2.1
Se sabe que X = 1.414213562, es el valor real y X* = 1.4142, un valor
aproximado o truncado de X, entonces:
EA = 1.414213562 - 1.4142 = 1.4142 - 1.414213562 = 0.000013562
ER =
EP =
1.414213562 - 1.4142
1.414213562
1.414213562 - 1.4142
1.414213562
=
1.4142 - 1.414213562
×100 =
1.414213562
1.4142 - 1.414213562
1.414213562
= 0.0000095897802
×100 = 0.000958978217%
Ejemplo1.2.2
Sea X ≈ X* y Y ≈ Y* , si E1 y E2 son los errores respectivos al medir X e Y
entonces el error al efectuar las operaciones de suma, producto, cociente
entre ambos será:
1.2.2A) (X ± Y) - (X * ± Y * ) = E1 ± E2
1.2.2B) XY - X * Y * = X * E2 + Y * E1 + E1 E2
1.2.2C)
X * + E1 X *
X X*
- * = *
Y Y
Y + E2 Y *
Demostración:
1.2.2 A) Si X  X * y Y  Y *entonces X  X *  E1
y Y  Y *  E2
sumando directamente tenemos
X  Y   X *  E1   Y *  E2 
ya que lo real menos lo medido marca el error , al despejar , X *  Y *obtenemos :
 X  Y    X *  Y *   E1  E2
error en la suma o resta
5
1.2.2 B) Si X  X * y Y  Y *entonces X  X *  E1 y Y  Y *  E2
multiplicando directamente tenemos
XY  X *Y *  X * E2  Y * E1  E1 E2
ya que lo real menos lo medido marca el error , al despejar , X *Y *obtenemos :
 XY    X *Y *   X * E2  Y * E1  E1E2  X * E2  Y * E1
error en el producto si E1E2  0
1.2.2C ) Si X  X * y Y  Y *entonces X  X *  E1 y Y  Y *  E2
dividiendo directamente tenemos :
X
X *  E1
 *
Y
Y  E2
el esquema, de que, lo real menos lo medido marca el error , al restar
X*
obtenemos :
Y*
*
*
*
Y * E1  X * E2 Y * E1  X * E2
 X   X  X  E1 X







  * 
*
E2 
Y * Y * Y *  E2 
* 2
 Y   Y  Y  E2
Y  1 * 
Y 

*
*
Y E1  X E2
E2
error en el cociente si
0
*2
Y
Y*
a ambos lados
Ejemplo1.2.3:
Si X ≈ X* y Y ≈ Y* además E1 y E2 son los errores respectivos al medir X e
Y , encuentre el error al efectuar las siguientes operaciones:
1.2.3A)
1.23X  +  3.41Y 
1.2.3C)
1.2.3.B)
1.23X ×  3.41Y 
1.2.4D)
Solución:
6
1.23X 
 3.41Y 
 3.41Y 
1.2.3 A) Si X  X * y Y  Y *entonces X  X *  E1 y
de esto 1.23X = 1.23X * +1.23E1
Y  Y *  E2
y 3.41Y = 3.41Y * + 3.41E2
sumando directamente tenemos
1.23X + 3.41Y = 1.23X * +1.23E1 + 3.41Y * + 3.41E2
como, lo real menos lo medido marca el error al despejar
1.23X * + 3.41Y * obtenemos :
1.23X + 3.41Y  - 1.23X * + 3.41Y *  = 1.23E1 + 3.41E2
el resultado final , es el error en la suma.
1.2.3B) Si X  X * y Y  Y *entonces X  X *  E1 y Y  Y *  E2
de esto 1.23X = 1.23X * +1.23E1
y 3.41Y = 3.41Y * + 3.41E2
multiplicando directamente tenemos :
1.23X  3.41Y  = 1.23X *  3.41Y *  + 1.23X *   3.41E2 
  1.23E1   3.41Y *  +  1.23E1  3.41E2 
si lo real menos lo medido marca el error , despejamos
1.23X  3.41Y 
*
*
para obtener :
1.23X  3.41Y  - 1.23X *  3.41Y *  = 1.23X *   3.41E2  + 1.23E1   3.41Y * 
+  1.23E1  3.41E2 
el segundo miembro, es el error en el producto.
7
1.2.3C ) Si X  X * y Y  Y * entonces X  X *  E1 y Y  Y *  E2
de esto 1.23X = 1.23X * + 1.23E1
y 3.41Y = 3.41Y * + 3.41E2
dividiendo miembro a miembro tenemos :
 1.23X 
=
 3.41Y 
1.23 X * + E1 
3.41 Y * + E2 
1.23X
siguiendo el esquema anterior al restar
 3.41Y
 1.23X  1.23X  1.23 X + E  1.23X
=
 3.41Y   3.41Y  3.41 Y + E   3.41Y
*
*
*
*
*
1
*
*
*
2
 de ambos lados obtenemos :

  error en el cociente

1.2.3D) Y  Y * entonces Y = Y * + E2
de esto
3.41Y = 3.41Y * +3.41E2
aplicando raiz a ambos lados directamente tenemos
 3.41Y  =
 3.41Y
*
+3.41E2 
al restar , a ambos miembros
 3.41Y  -
 3.41Y  ,
 3.41Y  =  3.41Y
*
*
*
obtenemos :
+3.41E2  -
3.41Y  = error en la operación
*
Estas reglas son parecidas a las reglas de derivación en el cálculo diferencial
y se deben a lo siguiente.
Si podemos expresar a f como una función de una sola variable real x,
entonces diremos que y = f(x).
Si esta es derivable en un intervalo I(a;b), de acuerdo al teorema de Taylor,
podríamos obtener una expansión de esta en dicho intervalo, desarrollándola
de la siguiente manera:
f ( x  x)  f ( x) 
f ( I ) ( x)
f ( II ) ( x) 2
x 
x 
1!
2!
con x suficientemente pequeño.
8

f ( N ) ( x) N
x
N!
(1.2.5)
Enseguida se presentaran algunos errores de propagación para
distintas funciones, como lo muestra la tabla 1.
FUNCION
ERROR ABSOLUTO
ERROR RELATIVO
X
 E1
E1
X*
 X  Y
 E1   E2
cXY
c Y * E1  X * E2 
E1 E2

X * Y*
E1 E2

X * Y*
NE1
X*
XN
X
LnX
cos  X 
NX *
N 1
E1
 E1 


*
2 X 
E1
X*
E1 sen  X * 
(1.2.7)
E1
2 X*
E1
X LnX *
E1Tan  X * 
*
Tabla 1.1
1.3 Algunos conceptos de Estadística
Los errores sistemáticos se pueden hacer desaparecer, pero no así los
accidentales. En algunas ocasiones será necesario llevar un control
estadístico basado en la teoría de probabilidad, el cual nos demuestra que al
llevar a cabo una serie de mediciones, estas estarán muy cerca del valor
deseado, de esta manera si aumentamos el número de mediciones estaremos
más cerca del valor real al utilizar la media aritmética de estas
observaciones, esto implica ciertas supuestos como son.
1) Si algún proceso está en funcionamiento en condiciones normales, con
reglas ya establecidas, la variación de los resultados en las mediciones de
cierta característica se debe sólo a un sistema de Causas Aleatorias, las
cuales son inherentes a cada proceso en particular y el número de
mediciones tendrá una distribución normal.
9
2) De no ser así y si aparece por alguna otra causa no asignable una
desviación en las mediciones diremos que el proceso no es normal o bien
que se encuentra fuera de control
En cualesquier tipo de control estadístico, estos dos supuestos se consideran
permanentemente, de tal manera que si se presentan uno o más resultados
que contradigan a los mismos, siempre se dice que el proceso esta fuera de
control y el proceso deberá detenerse, para llevar a cabo las correcciones
necesarias del mismo. Después de esto se tomaran las mediciones necesarias
con las cuales calcularemos el promedio y variación con las formulas
conocidas de la teoría de probabilidad:
X
X
i
N
s
 X  X 
2
i
N
(1.3.1)
Es decir, al tener una serie de mediciones con magnitudes, X1, X2, X3,…,XN
el valor promedio (más probable) será:
N
Xi
X 1  X 2  X 3  .....  X N 
i 1
X

N
N
(1.3.2)
El cual no coincidirá con e1 valor real, ni con la mayoría de las mediciones
hechas.
A la diferencia entre cada una de las medidas observadas y el valor más
probable se le llama "desviación", la cual podrá ser mayor, igual o menor
que cero:
di  Xi  X  X  Xi
(1.3.3)
también se define a la desviación media, como la media aritmética de los
valores absolutos de las desviaciones respecto a la media aritmética de la
siguiente manera:
DM 
 di
N

X
i
X
(1.3.4)
N
dado que una de las propiedades de la desviación es que la suma total de
estas siempre es cero, por lo regular se utiliza la suma de los cuadrados de
10
las desviaciones en promedio, a esto se le conoce como desviación típica,
obteniendo la siguiente fórmula:
s
d 2
N
(1.3.5)
en donde d, es la diferencia entre los valores obtenidos y el verdadero.
Esta ecuación tiene algunos inconvenientes cuando el número de
mediciones es pequeño (menor de 30 según la teoría de pequeñas muestras),
y si el número de mediciones es solo una, llega incluso a un absurdo. Es de
esto que en algunas situaciones se aplique la fórmula siguiente:
s
d 2
N 1
(1.3.6)
Ejemplo1.3.1
Una muestra de cinco medidas de diámetros de CD para computadora
fabricados por cierta empresa son los siguientes:
12.01 cm., 11.98 cm., 11.99 cm., 12.02 cm., 11.99 cm.
Encuentre la media, desviación media y desviación típica de estos datos.
Valores
∑
12.01
11.98
11.99
12.02
11.99
59.99
Media
11.998
d=Xi-Media
d
d2
0.012
-0.018
-0.008
0.022
-0.008
0
0.012
0.018
0.008
0.022
0.008
0.068
0.000144
0.000324
0.000064
0.000484
0.000064
0.00108
Tabla 1.2
X = (12.01+11.98 +11.99 +12.02+11.99)/5 = 59.99/5 = 11.998
DM = 0.068/5 = 0.0136 cm.
s=
(12.01- 11.998) +(11.98 - 11.998) +...+(11.99 - 11.998)  /(5 - 1) =
2
2
2
= 0.00108/4 = 0.016431676 cm.
11
PROBLEMAS CAPITULO I
1.-Si X  1.37 e Y 4.02 encuentre el error, al efectuar las siguientes
operaciones. Sea E1 el error al medir X, y E2 el error al medir Y.
a) 0.1 X + 0.3 Y
b) 0.1X  0.3Y
c) (0.1X) (0.3Y)
d) e0.1X
2.- En cada caso encuentre el error que se pide si E1 , E2 , E3 es el error en
las medidas aproximadas de X , Y , Z .
X  1.25 Y  0.33
Z  2.34 encuentre el error al efectuar:
a) 2.23 X + 1.01Y
b) (2.23X)/(1.01Y)
c) (1.01X) ( 1.23Y)
d) (2.23X)(1.01 Y)
e) 1.01X + 1.23Y + 2.35Z
f) (1.23X)½
3.- Si X  1.07 e Y 2.05 encuentre el error al efectuar las siguientes
operaciones, si E1=0.01 es el error al medir X, E2=0.02 el error al medir Y.
a) 0.3 X + 1.1 Y
b) 0.3 X  0.1Y
c) (0.3X)  (0.1Y)
d) e0.3X
4.- Una expansión en series de Taylor para aproximar ex es la siguiente serie
infinita
x2 x3
xn
x
e  1+ x+ + +...+
2! 3!
n!
si el valor de e2 ≈ 7.3891 calcule el valor de e2 si:
a) Se toman tres términos de la serie
b) Se toman cuatro términos de la serie
Encuentre además el error absoluto y relativo en cada caso.
5.- Una expansión en series de Taylor para aproximar sen x es la siguiente
serie infinita
x3 x5 x7
x 2n+1
senx  x - + - +...+
para n  1, 2,3,...
3! 5! 7!
(2n+1)!
12
si el valor de sen(/4) ≈ 0.70711 calcule el valor de sen(0.7854) si:
a) Se toman tres términos de la serie
b) Se toman cuatro términos de la serie
Encuentre además el error absoluto y relativo en cada caso.
6.- Utilizando las aproximaciones de e2 y sen(0.7854) y las expansiones del
ejercicio 4 y 5 efectúe el cálculo de:
e2
sen(0.7854)
a) Si se toman tres términos de las series
b) Si se toman cuatro términos de las series
Encuentre además el error absoluto y relativo en cada caso.
3.218x + 0.1543
obtenga f(1) y f(1.01), además encuentre
0.6995x + 0.0129
el error absoluto y relativo entre ambas evaluaciones.
7.- Sea f(x) =
8.- El Volumen de un cilindro circular recto es
construir uno, con r = 4 m h = 8 m. El costo por
32.50 dólares, con el espesor especificado para
entregarse, las dimensiones de este fueron r = 4.01 m
cantidad vario el Volumen respecto al original y
porcentual del costo, en la fabricación.
Vc   r 2h . Se desea
metro cuadrado es de
su construcción. Al
y h = 7.99 m. En que
cual fue la variación
9.- Efectúe las siguientes operaciones
a) 3.41 + 0.2792
b) 0.2792 × 216
c) ( 314 + 0.7826) – (137 + 4.2887) d) (0.0189 – 1) × (0.0189 + 1)
i) exactamente
ii) truncando el número y trabajando a 2 decimales
iii) redondeando a 3 decimales.
Además determine en cada caso el error absoluto y relativo.
10.- Si f(x) = sen x – x + x3 evalúe f(0) y f( 0.001) encontrando el error
absoluto y relativo.
13
Capítulo 2
Solución de Ecuaciones Algebraicas
2.1 Teoría de un Método Iterativo
Un evento importante en nuestros días es el avance que ha tenido la ciencia
y tecnología, en particular, el surgimiento de herramientas como son los
ordenadores computacionales ha facilitado la solución de problemas
provenientes de fenómenos físicos, planteados mediante modelos
matemáticos.
Dentro de los problemas que se presentan con mayor frecuencia, es el tratar
de resolver una ecuación de la forma
f(x) = 0
(2.1.1)
es decir, calcular el(los) valor(es) de x para el(los) cual(es) se verifica f(x)=0
siendo f una función continua, la cual puede ser una expresión polinomial o
algebraica de grado “n” o bien una función polinomial combinada con una
14
trascendente. El hallar la solución de la ecuación (2.1) puede transformarse
en el de hallar la solución de una ecuación de la forma F(x) = x.
Esta última ecuación se obtendrá reajustando o transformando, de alguna
manera, la ecuación original, por ejemplo si f(x) = 2 ½ la transformamos
en f(x)2 = 2 de donde f(x)2 – 2 = 0, construyendo así F(x) = x2 - 2 , la
cual es una expresión equivalente. Una buena transformación de una
función nos puede garantizar la existencia del valor buscado y a su vez nos
proporcionara un método de aproximación a la solución.
En este capitulo estudiaremos diferentes procedimientos para tratar de
encontrar solución a este tipo de problemas, los analizaremos y trataremos
de elegir el mas eficiente y de esta manera lograr nuestro objetivo.
Definición 2.1.1
Al procedimiento sistemático, para solucionar un problema de manera
eficaz, utilizando una serie de reglas lógicas que nos permitan alcanzar
nuestro objetivo le llamaremos Algoritmo.
El hablar de eficiencia no es simple, ya que en un algoritmo, tratar de
especificar un número finito de instrucciones bien definidas, que provoquen
una solución concreta a un problema en muchas ocasiones no es fácil, ya
que estas se deben elaborar, sin dar lugar a equivocaciones o errores en su
ejecución.
Un algoritmo debe ser:
Sistemático: para definir de manera precisa todos los posibles casos
presentes dentro del problema.
Prescriptivo: para asegurar que este terminará, en un número finito de pasos.
Bien Condicionado y Efectivo: para llegar a la solución que nos satisfaga
en un periodo de tiempo finito.
Por lo general los algoritmos que exhibiremos en este libro son de carácter
numérico, con procedimientos detallados, concretos y de cierto modo
demostrados de una manera práctica, en algunos casos. Tendremos en cada
caso datos de entrada, instrucciones matemáticas que ejecutar, mediante un
cálculo numérico, resultados básicos de salida, los cuales presentaran cierto
tipo de sucesiones, que en algunos casos son recurrentes y en otros no, en
15
donde al evaluarse de manera repetitiva pueden o no aproximarse a un valor
determinado.
En muchas ocasiones la solución no es solo un valor numérico o cantidad
sino una función o una correspondencia entre valores numéricos, debido a
que la solución no dependerá de una fórmula ya que con esta, logramos una
solución exacta.
La razón del método numérico radica en dar solución al tipo de problemas
en los que se conoce con precisión las leyes que gobiernan los procesos,
pero que al querer solucionar el modelo matemático que se presenta en esas
situaciones es de difícil acceso para las matemáticas tradicionales. Tal es el
caso de querer encontrar el área entre dos curvas como
f(x) = ex
y
g(x) = 4 – x2
(2.1.2)
ya que encontrar los valores del intervalo de integración no es sencillo, es
así como utilizaremos algún método numérico para poder obtener una
solución aproximada a la solución real.
Si las variables o incógnitas que intervienen en una ecuación, al tomar
valores determinados y ser sustituidos en ella provocan que la expresión
del lado izquierdo del signo de igual sea el mismo que el del lado derecho
del signo de igual, decimos que la ecuación ha quedado satisfecha, o bien
que esos valores son solución de esta.
Una ecuación entera racional tiene la forma:
anxn + an-1xn-1 + … +a2x2 + a1x1 + a0 = 0
(2.1.10)
donde coeficientes an, an-1, …, a2, a1, a0 son constantes, y “n” entero
positivo. Al mayor exponente de la variable que interviene en la ecuación,
le llamaremos grado de la ecuación. Cuando el exponente “n” es 1, 2, 3 se
conoce a las ecuaciones como: de primer grado o lineales, de segundo grado
o cuadráticas, de tercer grado o cúbicas, respectivamente.
Un polinomio de grado positivo “n” en la variable “x” es una función de
“x” que expresaremos como:
f(x) = anxn + an-1xn-1 + … +a2x2 + a1x + a0
16
(2.1.11)
donde coeficientes an, an-1, …, a2, a1, a0 son constantes, “n” entero. De esta
manera decimos que f(x) = 0 es una ecuación racional entera de grado
“n” en la variable “x”.
El valor x que anule f(x) recibirá el nombre de raíz de la ecuación f(x)= 0.
Si f(x) = 4 - x2, dos raíces serian: x  2 , ya que, f(± 2) = 0
Otros tipos de expresiones se muestran el la tabla 2.2
Expresiones
x  3  x 1  x  2
sen2 x + 3sen x = 1
2x + x2 = 1
3log x + 4(log x)2 = 7
Nombre
Algebraica
Trigonométrica
Exponencial
Logarítmica o Logística
Tabla 2.2
Teorema 2.1.2 (Teorema del Residuo o Resto)
Si “r” es una constante independiente de “x” y el polinomio f(x) es dividido
por (x-r), el residuo que se obtiene es igual a f(r).
Ejemplo 2.1.2
Sea f(x) = x3 – 2x2 +2 x + 2 y dividámoslo por (x-1), donde r = 1
f(1) = (1)3 - 2(1) + 2(1) + 2 = 3
de aquí que:
(x3 - 2 x 2 + 2x + 2)/(x - 1) = P(x) + 3/(x - 1)
con P(x) es un polinomio de grado n-1.
Teorema 2.1.3 (Teorema del factor o divisor)
Si r es una raíz de la ecuación f(x) = 0, es decir f(r) = 0, el binomio (x-r)
es un factor de f(x). Recíprocamente, si (x-r) es un divisor de f(x) el
número r es una raíz de la ecuación f(x) = 0, esto es , f(r) = 0.
Si f(x) = x3 – 4x2 + x + 6
observamos que r = 2, -1, 3 son raíces ya que:
f(2 )= f( –1) = f(3) = 0
17
por consiguiente (x – 2), (x + 1) y (x – 3) son factores o divisores de
f(x) = x3 – 4x2 + x + 6 .
Teorema 2.1.4.(Teorema fundamental del álgebra)
Toda ecuación racional entera f(x)=0 admite al menos una raíz, ya sea real
o compleja.
Teorema 2.1.5.
Toda ecuación racional entera f(x) = 0, de grado “n”, tiene exactamente
“ n” raíces.
Teorema 2.1.6
Si a + bi es raíz de una ecuación entera f(x) = 0, entonces su conjugado
a – b i, también es raíz de la ecuación.
Corolario 2.1.1
Si f(x) es una ecuación racional entera, con coeficientes reales y de grado
impar, esta debe tener al menos una raíz real.
Teorema 2.1.7
Si a + b es raíz irracional de una ecuación entera f(x)=0, entonces su
conjugado irracional a  b , también es raíz de la ecuación.
Al ordenar los términos de f(x) en potencias decrecientes de x, diremos
que se originó una variación de signos cuando dos términos consecutivos
sean de signo opuesto. Para saber el número de raíces positivas o
negativas se emplea la siguiente regla:
Teorema 2.1.8 (Regla de los signos de Descartes)
El número de raíces positivas será el número de variaciones de signo de
f(x) o bien este número, menos un entero par. El número de variaciones de
signo de f(-x) nos dará el número de raíces negativas de f(x) o bien este
menos un entero par.
Ejemplo 2.1.3
18
Dado el grado del siguiente polinomio, este debe tener 7 raíces y
analizándolo con la regla de los signos de Descartes tenemos:
f(x) = x7 – 3x6 + 5x5 – 3x4–2x3 – x2 + 5x + 4
f(-x) = – x7 – 3x6 – 5x5 – 3x4+ 2x3 – x2 – 5x + 4
dándonos como posibilidad de raíces, lo que se muestra en la tabla 2. 3.
Positivas
4
2
0
4
2
0
Negativas
3
3
3
1
1
1
Complejas
0
2
4
2
4
6
Tabla 2.3
Si f es una función continua en el intervalo I[a;b], encontrar los valores
de x tales que f(x) = 0, consiste en hallar las intersección de y = f(x)
con el eje x, en ente caso encontrar r1, r2, r3,….. Un hecho fundamental
en este tema es de que si f(a) y f(b) son de signo contrario, f(x) = 0 tiene
por lo menos una raíz, en este intervalo, como lo muestra la figura 2.1.
a
r1
r2
b
r3
Fig. 2.1
En genaral, el problema consiste en aislar las raices (si existen), examinando
subintervalos [a1,b1], [a2,b2]...., en los que existe una y sola una raíz. Una
19
vez que logremos esto, trataremos de aproximarla con una cierta precisión,
la cual fijaremos, dependiendo de nuestro propósito.
2.2 Método de Bisección
El primer procedimiento numérico que estudiaremos es el de dividir el
intervalo en mitades, conocido como método de bisección, de Bolzano,
bipartición, o dicotomía. Para esto, debemos conocer los valores de x0 y x1
tales que f(x0) y f(x1) tienen signos opuestos, o bien, f(x0) f(x1)<0, la cual
será una condición fundamental en este y otros algoritmos para encontrar
raíces en un intervalo..
Por al teorema de valor intermedio, se tiene que f(x) = 0 tendrá una
solución en I[x0 ; x1] si f(x0) f(x1)<0. De esta manera obtenemos el punto
medio de este intervalo, como se muestra enseguida:
x x
x2  1 0
(2.2.1)
2
evaluaremos a f(x) en x = x2 , de la siguiente manera:
x x 
f ( x2 )  f  1 0 
 2 
Si al evaluar f(x2) , f(x) se anula, esto es f(x2) = 0, x2 será raíz de f(x) y
habremos terminado el proceso. Si esto no sucede, continuamos
particionando el intervalo inicial en dos, estimando una raíz hasta un nivel
de precisión previamente especificado, evaluando así una sucesión de
valores f(xn+1 ) , donde:
xn  xn 1
con f ( xn ) f ( xn 1 )  0
2
La figura 2.2 muestra el inicio del algoritmo.
xn 1 
20
(2.2.2)
f
x2
x0
x1
r
Fig. 2.2
Considérese siguiente ecuación f(x) = x3 – x2 – 3 x – 3 = 0.
Si x = 2 f(2)= –5, si x = 3, f(3)= +6. Aquí la condición f(2)f(3)<0 se
cumple y como la función es continua, el cambio de signo de la función
entre x = 2 y x = 3 garantiza al menos una raíz en el intervalo (2, 3).
Si ahora se evalúa la función en el punto medio, esto es f( 2.5) = –1.125 y se
compara el resultado de esta evaluación con las evaluaciones en x = 2 y
x = 3. Observamos que hay un cambio de signo entre f(2.5) y f(3).
Puesto que la función cambia de signo entre x = 2.5 y x = 3, una raíz cae
dentro de estos valores. Se puede, indiscutiblemente, continuar este proceso,
obteniendo mitades de intervalos para determinar intervalos cada vez más
pequeños dentro de los cuales se encuentra la raíz. La figura 2.3 muestra la
grafica de esta función.
y
x
Fig. 2.3
21
Ejemplo 2.2.1
Aplicando el método de bisección a f(x) = x3 – x2 – 3 x – 3 para encontrar
una de sus raíces en el intervalo de [2 ; 3] obteniendo así la tabla 2 4:
n
xn-1
xn
xn+1
f(xn+1)
1
2
3
4
5
6
7
8
…
15
30
31
2
2.5
2.5
2.5
2.5625
2.59375
2.59375
2.59375
…
2.598632813
2.598674506
2.598674507
3
3
2.75
2.625
2.625
2.625
2.609375
2.6015625
…
2.598693849
2.598674508
2.598674508
2.5
2.75
2.625
2.5625
2.59375
2.609375
2.6015625
2.59765625
…
2.598663331
2.598674507
2.5986745075
–1.125
1.984375
0.322265625
–0.4274902344
–0.0592346191
0.1298484802
0.0348916054
–0.0122751594
…
–0.0001348145
–0.0000000106
–0.0000000046
Tabla 2.4
Obsérvese que, si la función es discontinua, f(x) puede cambiar de signo, y
no tener raíz en el intervalo. Las funciones desconocidas deben de
analizarse y comprobar su continuidad antes de hacer uso de este u otro
método. Este método, no solo se limita a polinomios como veremos
enseguida.
Ejemplo 2.2.2
Aplicando el método de bisección a f(x) = 4x + 5 senx - e2x para encontrar
una de sus muchas raíces en el intervalo de [0 ; 1] obtenemos la tabla 2.5:
n
1
2
3
4
5
6
7
8
…
15
22
xn-1
0
0
0
0.125
0.125
0.125
0.140625
0.14844375
xn
1
0.5
0.250
0.250
0.1875
0.15625
0.15625
0.15625
0.150390625 0.15045166
xn+1
0.5
0.250
0.125
0.1875
0.15625
0.140625
0.1484375
0.15234375
f(xn+1)
1.678845865
0.5882985256
–0.1606517490
0.2270250692
0.0362370227
–0.061474897
–0.124321037
0.119496367
0.150421142
–0.0000390218
30 0.150427393 0.150427395 0.150427394
0.0000000002
31 0.150427393 0.150427394 0.1504273935 –0.0000000029
Tabla 2.4
Después de 30 iteraciones xn+1 = 0.150427394 se aproxima a la raíz de la
función con un error estimado de:
xn+1 - x30 < x31 - x30 = 0.150427393 - 0.150427394 = 0.000000001
x31 - x30
x30
=
0.150427393 - 0.150427394
0.150427394
= 6.64772534715× 10 -9
esto quiere decir que la aproximación es correcta a 8 cifras significativas
dándonos el valor de la raíz con nueve cifras significativas de
xn+1 = 0.1504273935.
2.3 Método de Interpolación Lineal
El método de bisección es analíticamente llano, sin embargo, no es muy
eficaz para la mayoría de las funciones, pero se puede optimizar la rapidez o
razón de convergencia del valor buscado mediante otros procedimientos.
Uno de estos métodos, es el de interpolación lineal, también llamado
método de falsa posición, o regula falsi. Supóngase que la función es lineal
sobre el intervalo I[x0, x1] en donde f(x0) f(x1)<0 esto es f(x0) y f(x1) son de
signo opuesto. Si x0 , x1 son utilizados como aproximaciones al cero que
buscamos, esperamos que una mejor aproximación sea la intersección de la
recta que pasa por los puntos (x0, f(x0)) y (x1, f(x1)) con el eje X. El valor de
la abscisa podemos encontrarlo como lo muestra la figura 2.4
R
Q
C=xr
O
A=x0
B=x1
P
23
Fig.2.4
Por semejanza de triángulos tenemos que:
RQP  CBP de esto se tiene:
PQ PB

RQ CB
de donde:
RQ  PB
así una aproximación de la raíz será OC  OB  CB
PQ
si OC  xr OB  x1 RQ  x1  x0 PB  f ( x1 ) PQ  f ( x1 )  f ( x0 )
CB 
xr  x1 
( x1  x0 )
f ( x1 )
f ( x1 )  f ( x0 )
(2.3.1)
simplificando tenemos
x0 f ( x1 )  x1 f ( x0 )
(2.3.2)
f ( x1 )  f ( x0 )
a (2.3.2) se le llama fórmula de interpolación lineal y a xr interpolación
dentro del intervalo [x0,x1]
xr 
Ejemplo 2.3.1
Aplicado el método de interpolación halle, en el intervalo [2;3], la raíz de
f(x) = x3 – x2 – 3 x – 3.
Con x0=2 , f(x0) = -5, x1 = 3 y f(x1) = 6 obtenemos la tabla 2.6:
n
0
1
2
3
4
5
…
11
12
13
14
Tabla 2.6
24
xr
2.454545455
2.569395018
2.592960407
2.59756836
2.598460715
2.598633199
…
2.598674506
2.598674507
2.598674508
2.598674508
f(xr)
-1.600300526
-0.347367530
-0.068701647
-0.013334016
-0.00257845038
-0.0004982507
…
-0.00000002626
-0.00000000535
-0.00000000127
-0.00000000038
Ejemplo 2.3.2
Aplicado el método de interpolación encuentre, en el intervalo [0;1], la raíz
de f(x) = 4x + 5 senx - e2x
Con x0 =0 , f(x0) = -1, x1 =1, f(x1) = 0.8182988251, iniciamos obteniendo
así la tabla 2.7.
n
0
1
2
3
4
5
6
7
8
9
xr
0.549964607
0.195773352
0.153373031
0.150608098
0.150438438
0.150428068
0.150427435
0.150427396
0.150427394
0.150427394
f(xr)
1.809190327
0.276452257
0.018358461
0.0012776893
0.00006893584
0.00000421249
0.00000025738
0.00000001573
0.00000000095
0.00000000006
Tabla 2.7
Si confrontamos las dos tablas anteriores, se puede observar una diferencia
en el número de iteraciones para la convergencia del método de la
interpolación.
Si f(x) posee una curvatura pronunciada entre x0 y x1, provocará una
velocidad de convergencia diferente para aproximarse a la raíz.
Si en lugar de requerir que la función tenga signos opuestos en los dos
valores utilizados para la interpolación, escogemos los dos valores más
cercanos a la raíz, e interpolamos o extrapolamos a partir de estos.
De primera mano los valores más próximos a la raíz serán los dos últimos
valores calculados.
A este método se le da el calificativo de Método de la Secante.
25
2.4 Método de la Secante
Proveniente del método de Interpolación o Regula Falsi. Su diferencia
reside en la no exigencia de localizar en cada paso a la raíz en uno de los
dos subintervalos. Inicia con los valores de x0 y x1 y vamos construyendo
una sucesión de valores aproximados a la raíz, utilizando para esto la
siguiente fórmula recursiva:
xn+1 =
xn-1 f(xn ) - xn f(xn-1 )
f(xn ) - f(xn-1 )
para n  1, 2,3,...
(2.4.1)
los cuales dan los sucesivos puntos de corte de las secantes que pasan por
los puntos (x0, f(x0)) y (x1, f(x1)),…, (xn-1,f(xn-1), y (xn , f(xn)) , sin
preocuparnos si en los subintervalos [x0, x1],…, [xn-1, xn] , esta, o no, la raíz
buscada. Este método es sencillo de utilizar, aunque a veces no converge.
Ejemplo 2.4.1
Aplicando el método de la secante encuentre, en el intervalo [2;3], la raíz de
f(x) = x3 – x2 – 3 x – 3.
Si damos inicio al algoritmo con los siguientes valores: x0 = 2, f(x0) = -5,
x1 = 3 y f(x1) = 6 , obtenemos la tabla 2.8:
n
x0
x1
xr
f(xr)
0
1
2
3
4
5
6
2
3
2.454545455
2.569395018
2.601236313
2.598631772
5.298674446
3
2.454545455
2.569395018
2.601236313
2.598631772
5.298674446
5.598674508
2.454545455 -1.600300521
2.569395018 -0.347367529
2.601236313
0.030945056
2.598631772 -0.0005154671
5.298674446 -0.0000007466
5.598674508 0.0000000012
2.598674508 -0.00000000014
Tabla 2.8
Ejemplo 2.4.2
Aplicado el método de la secante encuentre, en el intervalo [0;1], la raíz
de f(x) = 4x + 5 senx – e2x
26
Con x0=0, f(x0) = –1 , x1=1 y f(x1) = 0.8182988251 obtenemos la tabla 2.9
n
0
1
2
3
4
5
6
7
8
9
10
11
x0
0
1
0.549964607
1.371648594
0.763567854
0.927868619
1.294537306
1.031798408
1.068707818
1.086990751
1.085238359
1.085288829
x1
1
0.549964607
1.371648594
0.763567854
0.927868619
1.294537306
1.031798408
1.068707818
1.086990751
1.085238359
1.085288829
1.085288981
xr
0.549964607
1.371648594
0.763567854
0.927868619
1.294537306
1.031798408
1.068707818
1.086990751
1.085238359
1.085288829
1.085288981
1.085288981
f(xr)
1.809190325
-5.150360791
1.906819293
1.31678183
-3.328880116
0.544069782
0.180227745
-0.019105831
0.00056657906
0.00000169715
-0.00000000312
0.00000000012
Tabla 2.9
En esta última tabla se observa que el método converge fuera del intervalo
señalado, encontrando así, otra raíz de f(x) , pero si cambiamos el intervalo
de inicio, digamos [0 ; 0.5] podemos encontrar la raíz deseada en 7
iteraciones, lo cual dejaremos que el lector ejecute.
2.5 Método de Newton-Raphson
Como ya se ha explicado, el problema de encontrar la solución de la
ecuación f(x) = 0 en un intervalo I[a, b] puede transformarse en el de hallar
el único punto fijo de una aplicación contractiva F. Esta función F puede
elegirse de distintas formas.
Suponiendo que la función f continua en I[x0, x1] y continuamente
diferenciable en dos ocasiones en dicho intervalo, esto es,
f  C 2  x0 , x1 . Sea x*   x0 , x1  una aproximación de la raíz tal que
27
f’(x*)  0 cuando x  x*  0 . Es decir, f(x0) y f(x1) es derivable, una
condición suficiente, para que la aplicación F sea contractiva en el intervalo
[x0, x1] es que, |F’| ≤ c < 1 en el mismo intervalo.
Si consideramos una expansión en series de Taylor para f(x) alrededor de
xn, tenemos:
(x - xn )2
f ( x)  f ( xn )  ( x  xn ) f ´( xn ) 
f ´´( ( x)), con xn   ( x)  x
2
dado que f(x) =0 y si x = xn+1 , tenemos:
0  f ( xn )  ( xn1  xn ) f ´( xn ) 
(xn+1 - xn )2
f ´´( ( xn1 )), con xn   ( x)  xn1
2
si consideramos que el término, ( x  x* )2  0 , de esto obtenemos que:
0  f ( xn )  ( xn1  xn ) f ´( xn )
y despejando xn+1 , se consigue:
xn1  xn 
f ( xn )
f ´( xn )
(2.5.1)
a esta fórmula recursiva la llamaremos Método de Newton Raphson
l método de Newton-Raphson, consiste en iniciar con un valor x0 próximo a
la solución (una solución aproximada) y mejorar su aproximación por medio
de la fórmula recursiva (2.5.1), deteniendo el proceso cuando, en dos de los
valores consecutivos no se diste una diferencia.
Comenzando a partir de una estimación inicial que esta lejos de la raíz, x0,
se extrapola a los largo de la tangente hasta su intersección con el eje x, y se
le toma esa como la siguiente aproximación. Esto se continúa hasta que los
valores sucesivos de x están lo suficientemente cercanos, o el valor de la
función sea lo suficientemente próximo a 0. El algoritmo de Newton se
utiliza ampliamente debido a que, al menos en la vecindad cercana a la de la
28
raíz, converge más rápidamente que cualquiera de los métodos anteriores.
Este método es cuadraticamente convergente, es decir, que el error en cada
paso se aproxima proporcionalmente al cuadrado del error del paso anterior.
Ejemplo 2.5.1
Aplicado el método de Newton Raphson halle, en el intervalo [2;3], la raíz
de f(x) = x3 – x2 – 3 x – 3. Inicie con a) x0 = 2 , b) x0 = 5,
Sol: La fórmula recursiva quedaría de la siguiente forma
xn3  xn2  3xn  3
xn+1 = xn 
3xn2  2xn  3
con la cual generamos la tabla 2.10:
a)
n
0
1
2
3
4
5
6
xn+1
2
3
2.6666 6666 7
2.6011 3960 1
2.5986 7792 5
2.5986 7450 8
2.5986 7450 8
b)
n
0
1
2
3
4
5
6
xn+1
5
3.6774 1935 5
2.9435 0256 1
2.6507 0976 2
2.6001 3671 5
2.5986 7571 1
2.5986 7450 8
Tabla 2.10
Ejemplo 2.5.2
Aplicado el método de la Newton Raphson encuentre, en el intervalo [0;1],
la raíz de f(x) = 4x+ 5 senx - e2x inicie en a) x0=0 , b) x0 = 1, c) x0 = -3
Con los valores dados y la fórmula recursiva
4xn + 5senxn - e 2xn
obtenemos la siguiente tabla 2.11:
xn+1 = xn 4 + 5cosxn - 2e2xn
a) n
0
1
2
3
4
5
xn+1
b) n
xn+1
c) n
xn+1
0
0
1
0
-3
0.142857142
1 1.101317232
1 -16.30800377
0.150399712
2 1.08572591
2 -509.4085048
0.150427393
3 1.085289317
3 -268.1919809
0.150427394
4 1.085288981
4 269.1940722
0.150427394
5 1.085288981
5
Over flow
Tabla 2.11
29
Cotejando estos resultados, vemos que el método de Newton en a) converge
más rápidamente que los métodos anteriores, pero si iniciamos con otros
valores, como en el inciso b), obtuvimos otra raíz o incluso el método puede
no converger como lo muestra el inciso c).
Si f(xn) es una función algo rara y el cálculo de f’(x n), se hace complicado,
f ( x0  h)  f ( x0 )
podemos hacer f’(xn)f’(x0), o bien hacer uso de f ´( x0 ) 
h
con h lo suficientemente pequeño.
2.6 Aplicaciones
En la actualidad podemos acudir a la utilización de diferentes herramientas
matemáticas para obtener con lujo de detalles las raíces de ecuaciones
polinomiales y no polinomiales mediante diferentes tipos de software para
computadoras y calculadoras programables.
Herramientas como el Maple, Matlab, Matemática, Derive, Winplot entre
otros nos pueden auxiliar al tratar de encontrar raíces de este tipo de
ecuaciones.
El algoritmo de Newton Raphson y los teoremas antes mencionados son de
gran ventaja para encontrar raíces de ecuaciones racionales enteras f(x)=0 y
no racionales .
Enseguida presentaremos algunos ejemplos para este algoritmo y haremos
uso de los teoremas antes mencionados para analizarlos.
30
Ejemplo 2.6.1
Estimar el o los puntos de intersección de las ecuaciones (2.1.2).
Sol: Las ecuaciones 2.1.2 son f(x) = ex y g(x) = 4 – x2 . Si deseamos
encontrar los puntos de intersección hacemos f(x)=g(x), esto es, ex = 4 – x2
para construir la función 4 – x2 – ex = 0 = F(x). Haciendo uso del método
de Newton Raspón, escribimos la siguiente fórmula recursiva
2
4  xn  e xn
xn 1  xn 
para obtener la tabla 2.12
e xn  2 xn
n
0
1
2
3
4
xn+1
1
1.059707788
1.058007813
1.058006401
1.058006401
n
0
1
2
3
4
5
6
xn+1
-1
-2.612699837
-2.049908486
-1.966588005
-1.964636673
-1.964635597
-1.964635597
Tabla 2.12
Ejemplo 2.6.2
Encontrar el área entre las dos curvas del ejemplo 2.6.1
Solución: Graficando estas ecuaciones como la muestra la figura 2.5
y
x
Fig. 2.5
encontrar el área entre las dos curvas, es calcular la siguiente integral
  g(x) - f(x) dx = 
b
b
a
a
(4 - x 2 ) - e x  dx
31
con a = -1.964635597 y b = 1.058006401 obteniendo como respuesta
6.42768737646 u2.
Ejemplo 2.6.3
Analicemos el Ejemplo 2.1.3 f(x) = x7 – 3x6 + 5x5 – 3x4–2x3 – x2 + 5x + 4
La grafica se muestra en la figura 2.5
y
x
Tal como se puede
observar, la gráfica tiene un solo corte en el eje x, lo
Fig. 2.5
cual verifica el Corolario 2.1.1 por ser de grado impar, esto quiere decir que
las 6 raíces restantes, son complejas y si encontramos una raíz irracional o
una compleja sus conjugados también lo serán.
Con el método de Newton Raphson encontraremos sus raíces inicializando
con diversos valores y utilizando la siguiente fórmula recursiva.
7
xn+1 = xn -
6
5
4
3
2
xn - 3xn + 5xn - 3xn - 2xn - xn + 5xn + 4
6
5
4
3
2
7xn - 18xn + 25xn - 12xn - 6xn - 2xn + 5
Iniciando con x0 = 1 + i obteniendo así la tabla 2.13
n
0
1
2
3
4
xn-1
1+ i
0.800000000000
1.36621111928
1.17732052917
1.22515891306
9 1.44878699485
10 1.44878699485
32
+ 0.400000000000 i
- 1.03970609846 i
- 0.759671966446 i
- 0.378076991412 i
- 0.50206536019 i
- 0.50206536019 i
Tabla 2.13
De donde 1.44878699485 + 0.50206536019 i también es raíz.
Iniciando con x0 = i obtenemos la siguiente tabla 2.14
n
0
1
2
3
4
xn-1
i
-0.062983425414
-0.451994829394
-0.475382417798
1.10631496995
+
+
-
0.603314917127 i
0.293260379514 i
0.398677368133 i
0.048577055275 i
29 0.847433463453 + 1.72630174167 i
30 0.847433463453 + 1.72630174167 i
Tabla 2.14
De donde 0.847433463453 - 1.72630174167 i también es raíz.
Iniciando con x0 = – 1 – i obtenemos la tabla 2.15
n
0
1
2
3
4
-1- i
-0.811626331671
-0.661381033387
-0.547822892126
-0.491084105873
xn-1
7
8
-0.490880755114 - 0.715799194375 i
-0.490880755114 - 0.715799194375 i
-
0.854362953384 i
0.747465098359 i
0.695948073145 i
0.706221115956 i
Tabla 2.15
De donde – 0.490880755114 + 0.715799194375 i , también es raíz.
Por último si iniciamos con x0 = 1 obtenemos la última raíz, la raíz real
–0.616079406381, la cual dejamos para ser comprobada por el lector.
La convergencia del método de Newton Raphson, podemos dilucidarla
como un método de búsqueda de punto fijo, es decir, un medio iterativo
que consiste en transformar algebraicamente la ecuación que se presenta
como f(x) = 0, de la cual se desea hallar una solución, llevándonos a una
ecuación semejante de la forma F(x) = x, como se ilustro en el ejemplo
2.6.1.
33
PROBLEMAS CAPITULO II
1.-Por los métodos de bisección, interpolación encuentre la raíz aproximada
de cada una de las siguientes ecuaciones en el intervalo que se especifica y
resuelva por el método de Newton-Raphson inicializando, cada uno de ellos
en el extremo izquierdo del intervalo dado.
1) ƒ(x) = ex – x2 – 3
(1 ; 2)
8) ƒ(x) = x2 sen x – cos x
(0 ; 1)
2) ƒ(x) = (x – 2)ex – 3
(2 ; 3)
9) ƒ(x) = x5 + x2 - 9
(1 ; 2)
3) ƒ(x) = x3 – 5x + 1
(0; 1)
10) ƒ(x) = x5 – 75
(2 ; 3)
4) ƒ(x) = x4/3 – 3
(2 ; 3)
11) ƒ(x) = x3 – 3x – 3
(2 ; 3)
5) ƒ(x) = x3 – 3x – 1
(-2 ; -1 )
12) ƒ(x) = x6 + 7x2 – 4
(0;1)
6) ƒ(x) = 2x – cos x
(0 ; -1 )
l3) ƒ(x) = x2 + sen x
(-1 ; -0.5)
7) ƒ(x) = sen x – 2x + 2 (1 ; 2)
14) ƒ(x) = 5x - cos x + 5
( -1 ; 0 )
15) ƒ(x) = x – 5x + 1
(2; 3)
17) ƒ(x) = x – 5x + 1
(-3; -2)
16) ƒ(x) = x3 – 3x – 1
(-1 ; 0)
18) ƒ(x) = x3 – 3x – 1
3
3
(1 ; 2 )
2.-Por el método de Newton Raphson encuentre seis raíces de la ecuación
ƒ(x) = x6 +7x2 – 4 , cuatro complejas y dos reales, las reales se encuentran
en los intervalos (-1,0) y (0,1).
3.- Por el método de Newton Raphson encuentre las raíces de la ecuación
f(x)= x4 – 6x3 +12x2 – 7x – 12 ( 2 reales y 2 complejas)
4.- Para encontrar 3 7 efectuamos la siguiente transformación
3
7 = x, 7 = x 3 , de donde f(x) = x 3 -7 o bien g(x) = 7 - x 3
encuentre
dicha raíz por el método de Newton-Raphson, inicie x=2.
5.- Encuentre 5 65 efectuando una transformación similar a la del problema
anterior e inicie en x = 1.5
6.- Por el método de Newton-Raphson encuentre la raíz de:
a) f(x) = x – 0.2 cos x – 0.5
x
b) f ( x )  cos  x 
2
34
inicie en x = 0.5
inicie en x = 1
Capítulo 3
Solución de Sistemas de Ecuaciones
Algebraicas Lineales y no Lineales
Las ecuaciones lineales juegan un papel esencial, no solo en las
matemáticas, sino también en otras áreas en las que estas se manejan. Los
sistemas de ecuaciones lineales y no lineales, se han hallado en textos de
más de 2000 años de antigüedad, algunos con aplicación real y otros con la
finalidad de transmitir un procedimiento para resolverlas. Si se estudian
circuitos eléctricos, vibraciones elásticas o mecánicas, resistencia de
materiales, dinámica, estática, estadística, etc., el modelo Matemático de
muchas de sus Leyes o Proposiciones, nos conducen a ecuaciones lineales o
no lineales y en alguna parte del problema surgirá el darle solución a estas.
Existen diversos métodos para dar solución a estos problemas. Método de
Igualación, Sustitución, Simultaneas, Regla de Cramer, Gauss, GaussJordan, Método de la Inversa, son algunos métodos, de los cuales se espera
que el alumno haya adquirido generalidades en cursos básicos relacionados
con el Álgebra Lineal. En nuestro caso la finalidad será el de proporcionar
solución mediante un algoritmo Numérico.
La razón de esto es que, ciertos sistemas de ecuaciones lineales se pueden
resolver con facilidad mediante técnicas simples, pero si el número de
ecuaciones y de incógnitas crece, las operaciones que debemos efectuar es
mayor, convirtiéndose en una técnica laboriosa y tediosa, en estos casos los
algoritmos para computadora nos harán consumir menos tiempo y serán más
prácticos.
Un elemento que nos ayudará para estudiar estos sistemas de ecuaciones
son: las Matrices *. Su simbología describe el problema de manera práctica
y operando con ellas, nos conducirán de manera casi inmediata a la
solución. En este capítulo describiremos brevemente las propiedades
elementales del Álgebra Matricial.
* James Joseph Silvestre introduce el concepto de matriz en 1850, William Rowan Hamilton
desarrollo de la teoría de matrices 1853. Arthur Cayley expone el simbolismo matricial
abreviando así el sistema de m ecuaciones lineales con n incógnitas en 1858.
35
3.1 Álgebra Matricial
Una buena parte del Álgebra Lineal implica encontrar soluciones a un
sistema de ecuaciones lineales, del siguiente tipo:
5x – 3 y = 9
2x – y = 4
(3.1.1)
Resolver este tipo de sistemas con métodos como los de Gauss y de GaussJordan* es práctico, cuando el número de ecuaciones y el número de
incógnitas no es muy grande como ya se mencionó.
Ignorando las variables y los signos de igual de (3.1.1), el resultado final es
un ordenamiento de números que dominan una posición, a este tipo de
ordenamientos se le conoce, usualmente, como Matriz. Esta se representa
simbólicamente de la siguiente forma:
 5 -3

 2 -1
9

4
Definición 3.1.1
Una Matriz es un acomodo rectangular ordenado de números, por lo regular
encerrado entre paréntesis o corchetes. Al conjunto horizontal de elementos
se le llamara renglón o fila y al conjunto vertical de elementos le
llamaremos columna. Las letras mayúsculas indicaran Matrices y a los
elementos los representaremos por aij donde i indicará la pertenencia a
la fila y j, la pertenencia a la columna, por ejemplo:
 a11

 a21


 am1
a12
a13
a22
a23
am2
am3
a1n 

a2n 


amn 
*Karl Friederich Gauss(1777-1855) y Camille Jordan(1838-1922) ambos matemáticos, el primero
alemán, el segundo francés.
36
El elemento a21 indica que este se encuentra situado en la fila 2 columna 1,
el elemento am3 indica que el elemento se encuentra colocado en la fila m
columna 3 , de esta manera, la matriz anterior, contiene m filas y n
columnas, por lo que diremos que tiene una dimensión o tamaño de m  n .
Al arreglo rectangular, cuando m = n, le llamamos, arreglo cuadrado o
matriz cuadrada. En lo siguiente escribiremos, en algunos casos, a la matriz
A = (aij)
Ejemplo 3.1.1
Las siguientes matrices son de dimensión m  n , mostrando en subíndice los
valores de m y n respectivamente:
 1 -2 7 
1


0
5
-1
 B =  -6
A= 

1 4 6 
7

 5 8 5 

4×3
8
8 1 6 
 1 -1 



4  C = 3 5 7  D = 

1 5 2×2




-1 3×2
 4 9 2 3×3
En el ejemplo anterior las matrices C y D son cuadradas.
Existen matrices especiales que solo tienen una fila o una columna, a estas
se les llama vector fila o vector columna, respectivamente, o estrictamente
vectores, los cuales se representaran con letras minúsculas resaltadas en
negrita. A los elementos de este tipo de matriz se les llama componentes.
Su dimensión es de 1  n o m  1
Ejemplo 3.1.2
Dados el siguiente Conjunto de vectores
u   5,7,8 
0
 
2
 -1 
v   w 
3
3
 
 -1 
y   y1 , y2 
 x1 
 
x   x2 
x 
 3
u, y son vectores fila, el primero con 3 componentes y el segundo con 2,
mientras que v, w y x son vectores columna con, 4, 2 y 3 componentes
respectivamente.
37
Definición 3.1.2
Dos matrices A = (aij) y B = (bij), son iguales si y sólo si son de igual
dimensión y si para todo i y j, aij = bij.
Si A = (aij) es una matriz cuadrada, a los elementos a11, a22, a33,…, los
designaremos como, diagonal principal de la matriz.
Otros tipos de matrices cuadradas muy particulares son:
Matriz traspuesta: Si A = (aij), At = (bij) , tal que, bij = aji , para todo ij
por ejemplo:
 1 2 2
1 4 7
Si A =  4 5 6  la traspuesta de A es AT =  2 5 8 


7 8 9 
3 6 9




Matriz nula: Es tal que aij = 0 para todo ij , por ejemplo
0


0

0


0 
Matriz diagonal: aij = 0 para todo i  j, sólo tiene elementos distintos de
cero las aii .
 a11

 0


 0
0
a22
0
0 

0 


ann 
Matriz escalar: Es una matriz diagonal en donde sus elementos son todos
iguales.
k 0

0 k

 0 0

38
0

0


k 
Matriz unidad: Es una matriz escalar tal que, aij = 0, para todo i  j y si
i = j , aii = 1 .
0
1 0


0
0 1




1 
0 0
Matriz simétrica: Es aquella matriz que coincide con su traspuesta.
Tiene iguales los elementos simétricos respecto a la diagonal.
A es simétrica si y solo si aij = aji o A = At , por ejemplo,
 1 2 1


2 5 4
1 4 9


Matriz triangular superior: Es aquella en la que todos los elementos por
debajo de la diagonal principal son cero, esto es aij = 0 para todo i<j.
 a11 a12 a13 a14 


 0 a22 a23 a24 
 0
0 a33 a34 


0
0 a44 
 0
Matriz triangular inferior: Es aquella en la que todos los elementos por
arriba de la diagonal principal son cero, estoes aij =0 para todo i>j.
 a11

 a21
 a31

 a41
0
0
a22
0
a32
a33
a42
a43
0 

0 
0 

a44 
Dadas las matrices A = (aij), B =(bij) de la misma dimensión, la suma de
ambas, es otra matriz, C = (cij) de la misma dimensión que los sumandos y
39
con término genérico cij = aij + bij. De esta manera, para poder sumar dos
matrices, estas han de tener la misma dimensión. La suma será denotada
por A + B.
A la diferencia de matrices, la representaremos por A – B y esta se obtiene
de la siguiente manera : A – B = A + (–B)
3 + 3  7 6 
 2 3   5 3  2+ 5

+
=
=

 4 -1  -1 2   4 +(-1) -1+ 2   3 1 
El producto de una matriz A = (aij) por un número real k es otra matriz
B = (bij) con el mismo tamaño que A, donde cada elemento bij de B , se
obtiene multiplicando los elementos aij por k, es decir, bij = kaij.
El producto de la matriz A, por el número real k, se designa por kA, ejemplo:.
 2 3   (3)(2) (3)(3)   6 9 
3
= 
=

 4 -1  (3)(4) (3)(-1)   12 -3 
Dadas dos matrices A = (aij) y B = (bij), su producto es otra matriz C=(cij)
cuyos elementos se obtienen efectuando el producto interno de las filas de
A por las columnas de B.
cij 
n
a
k 1
ik
 bkj
desarrollando esto obtenemos
cij = ai1 b1j + ai2 b2j +
 ain bnj
De esta manera, para poder consumar el producto de dos matrices, es
necesario que el número de columnas de A coincida con el número de filas
de B. Es decir, si A tiene dimensión m × n y B dimensión n × p, la matriz C
será de orden m × p.
Al producto lo denotaremos por AB.
 (1)(2)+(3)(-1) (1)(4)+(3)(0) (1)(6)+(3)(8)
 1 3
 2 4 6




* 
= 
 5 7  2×2  -1 0 8  2×3  (5)(2)+(7)(-1) (5)(4)+(7)(0) (5)(6)+(7)(8) 2×3
 -1
4 30 

3
20
86


= 
40
3.2 Inversión de Matrices
Sea A una matriz cuadrada no singular, es decir, su determinante es
diferente de cero, denotado por A  0 . Por definición de matriz inversa
decimos que A1 es la inversa de A sí: A  A1  I .
Haciendo x = A-1 y sustituyendo en la ecuación anterior, se obtiene: Ax  I
Esta última expresión representa un sistema de ecuaciones simultáneas, en
donde no hay un solo vector de términos independientes ni de incógnitas,
sino “n”, los cuales forman la matriz unitaria I.
De lo anterior, podemos determinar la inversa de una matriz utilizando el
método de Gauss-Jordán. Empleando operaciones elementales a los
renglones de la matriz ampliada y de este modo transformar A en I.
Ejemplo 3.2.1
Invertir
la
matriz
 1 3 -2  n
 a11 a12
n


2
2 x
A=  2 5 -3   X i  ( X i  X )
 a21 a22

i

1
i

1
 -3 2 -4 
a


 31 a32
a13 
 2  2
a23  lim 2
 x 0 v
u 2

a33 
Solución:
Primero escribamos la matriz A en forma de matriz ampliada, esto es
 1 3 -2

 2 5 -3
 -3 2 -4

1 0 0

0 1 0
0 0 1 
Usando a11 como pivote, el 1er renglón se utilizará para eliminar los
coeficientes an1 para n = 2,3 de este sistema, mediante múltiplos (inversos
aditivos de estos coeficientes) de la primera ecuación y los sumaremos a
cada uno de los otros renglones, esto es:
41
 1 3 -2

 2 5 -3
 -3 2 -4

1 0 0  (2) (3)  1 3 -2


0 1 0       0 -1 1
0 0 1      0 11 -10
1 0 0 

-2 1 0  (3)(11)
3 0 1    
Ahora, se utiliza a22 como pivote y se eliminan de los otros renglones a12
y a32, después de esto, cambiamos el signo de todos los elementos del 20
renglón, para obtener una nueva matriz, de la cual utilizaremos el
coeficiente a33 para eliminar a13 y a23 para obtener así la matriz inversa, la
cual aparecerá en el lado derecho del sistema ampliado.
1 0 1

 0 1 -1
0 0 1

3 0

2 -1 0  
-19 11 1  ( 1 )(-1)
-5
 14 -8 -1 


Por lo tanto, la inversa de A es: A =  -17 10 1 
 -19 11 1 


-1
Con este método conseguimos satisfacer también a los sistemas de
ecuaciones lineales, ya que si, Ax = b, entonces , x =A-1 b
Es evidente que el método de inversión de matrices, se torna tedioso para
alcanzar la solución de un conjunto amplio de ecuaciones lineales y esto se
debe a la cantidad de operaciones aritméticas que se desarrollarán con los
renglones de la matriz.
42
3.3 Métodos de solución de sistemas de
ecuaciones lineales
Como ya hemos citado, en muchas ramas de la ingeniería se plantean
problemas donde es ineludible resolver algún sistema de ecuaciones, con un
gran número de ecuaciones y de incógnitas y resolverlo manualmente es
tedioso, por lo que describiremos algunos métodos directos e iterativos
fáciles de programar, en alguna calculadora programable o computador.
Uno de los objetivos de este capítulo, es el de comprender y aplicar diversos
métodos para resolver un sistema de ecuaciones lineales. Explicaremos
brevemente los algoritmos conocidos como Métodos directos o finitos,
como, eliminación Gaussiana y de Métodos iterativos o infinitos, como son
los métodos de Jacobi y Gauss-Seidel, estableciendo ventajas y desventajas
de cada uno estos.
Definición 3.3.1
Una combinación de coeficientes y variables en donde estas aparecen
únicamente elevadas a la primera potencia. Por ejemplo:
a11 x1 + a12 x2 + a13 x3 + ...+ a1n xn = b1
(3.3.1)
le llamamos ecuación algebraica lineal en las variables x1, x2, x3,..., xn.
En esta ecuación los coeficientes a11, a12, a13,..., a1n y el término b1,
llamado termino independiente, son constantes reales, aunque en algunos
casos pueden ser constantes complejas, pero aquí solo analizaremos
sistemas de ecuaciones lineales con coeficientes reales.
El conjunto de ecuaciones algebraicas lineales que deseamos resolver de
manera simultanea, es de la forma:
43
a11 x1 + a12 x2 + a13 x3 + ...+ a1n xn = b1
a21 x1 + a22 x2 + a23 x3 + ...+ a2n xn = b2
(3.3.2)
an1 x1 + an2 x2 + an3 x3 + ...+ ann xn = bn
Aplicando la definición de producto entre matrices, este sistema de n
ecuaciones algebraicas lineales con n incógnitas (3.3.2) podemos
representarlo matricialmente, de la siguiente manera,
 a11
a
 21
 ...

 an1
a12
a22
...
an1
... a1n 
... a2 n 
... 

... ann 
 x1   b1 
 x  b 
 2   2
 ...   ... 
   
 xn  bn 
(3.3.3)
Este sistema de ecuaciones, puede abreviarse simbólicamente como,
Ax = b
(3.3.4)
Aquí a A se le conoce con el nombre de Matriz de coeficientes del Sistema,
x es el vector columna solución y b es el vector columna de términos
independientes.
A la representación
 a11

 a21
 ...

 an1
a12
a22
...
an1
a1n b1 

... a2 n b2 
... ... ... 

... ann bn 
...
(3.3.5)
que es la matriz A, con el vector de términos independiente agregado, se le
llamara: Matriz Ampliada del Sistema.
Al los valores de las incógnitas que verifican simultáneamente a todas y
cada una de las ecuaciones del sistema (3.3.2) le llamaremos, vector
solución del sistema de ecuaciones lineales.
44
De acuerdo a la solución, los sistemas pueden clasificarse en:
a) Consistentes: Si admiten solución;
b) Inconsistente o Incompatible: Si no admiten solución .
Los sistemas Consistentes a su vez podemos clasificarlos como:
a)Determinados: Si la solución es única
b)Indeterminado: Si la solución no es única.
En este último existirá una infinidad de soluciones.
Los métodos llamados directos, nos proporcionarán una solución exacta, si
la hay, en un número finito de pasos, despreciando, en la mayoría de los
casos, los errores por el redondeo, mientras que los métodos indirectos o
infinitos, solo de nombre, ya que habitualmente no lo son, originarán una
solución aproximada, si esta existe, en un número amplio de operaciones
aritméticas, y en muchas ocasiones, con errores por truncamiento, pero a
pesar de esto, los métodos indirectos son necesarios, e incluso en ocasiones,
más deseables que los directos ya que en el, los errores por redondeo no son
acumulables.
3.4 Método de eliminación
PIVOTEO
de GAUSS
El primer método que se presenta usualmente en álgebra lineal, el cual es un
método numérico fundamental para la solución de ecuaciones algébricas
lineales simultáneas, es aquel en el que se eliminan las incógnitas mediante
la combinación de las ecuaciones. Este método se conoce como Método de
Eliminación o Eliminación Gaussiana, el cual es práctico cuando él número
de ecuaciones y él número de incógnitas no es muy grande.
45
Utilizando el método de Gauss, un conjunto de n ecuaciones con n
incógnitas se reduce a un sistema triangular equivalente (un sistema
equivalente es un sistema que tiene iguales valores de la solución), el cual se
resuelve fácilmente por "sustitución inversa" como describiremos
posteriormente.
El método de Gauss inicia al ir reduciendo un conjunto de ecuaciones
simultáneas, del tipo (3.3.2), a un sistema triangular equivalente como:
a11 x1 + a12 x2 + a13 x3 + a14 x4 + ... + a1n xn = b1
1
1
1
1
a22
x2 + a23
x3 + a24
x4 + ... + a2n
xn = b21
2
2
2
a33
x3 + a34
x4 + ... + a3n
xn = b32
(n-2)
(n-1)(n-1) (n-1)
a
x
n-2
(n-1)n
+a
(3.4.1)
n-2
n-1
xn = b
n-1
ann
xn = bnn-1
en donde los superíndices indican los nuevos coeficientes que se crean en el
proceso de reducción. La reducción se va efectuando de la siguiente manera:
Dado el sistema de ecuaciones lineales (3.3.2) se selecciona de la primer
columna, la componente con el mayor valor absoluto, reordenado las
ecuaciones y estableciendo como primer ecuación a la que cumpla esta
condición, se divide entre el coeficiente de x1, esto es, entre a11, llamado
pivote (diferente de cero) para obtener:
x1 +
a
a
a12
b
x 2 + 13 x 3+....+ 1n x n= 1
a11
a11
a11
a11
(3.4.2)
La primera ecuación se multiplica por el inverso aditivo del coeficiente de x1
de la segunda ecuación y la ecuación obtenida se suma de la misma,
eliminando así x1. La primera ecuación también se multiplica por el inverso
aditivo del coeficiente de x1 de la tercera ecuación, y la ecuación obtenida se
suma de la misma para eliminar x1 de esa ecuación. Así sucesivamente, x1 se
elimina de todas las ecuaciones del conjunto excepto la primera, de manera
que el sistema toma la siguiente forma,
46
a11 x1 + a12 x2 + a13 x3 + a24 x4
...+ a1n xn = b1
1
1
1
1
a22
x2 + a23
x3 + a24
x4 + ...+ a2n
xn = b21
(3.4.3)
1
1
1
1
an2
x2 + an3
x3 + an4
x4 + ...+ ann
xn = bn1
La ecuación utilizada para eliminar las incógnitas en las ecuaciones que la
siguen se denomina Ecuación Pivote. En la ecuación pivote, el coeficiente
de la incógnita que se va a eliminar de las ecuaciones que la siguen se
denomina el Coeficiente Pivote.
Con el subsistema después de la primer ecuación, se repiten los pasos
anteriores, se busca el segundo pivote para eliminar x2 de todas las
ecuaciones que siguen a esta ecuación pivote.
a11 x1 + a12 x2 + a13 x3 + a24 x4 + ...+ a1n xn = b1
1
1
1
1
a22
x2 + a23
x3 + a24
x4 + ... + a2n
xn = b21
a332 x3 + a342 x4 + ... + a3n2 xn = b32
(3.4.4)
+ annn xn = bnn
Enseguida se utiliza la tercera ecuación como ecuación pivote, y se usa el
procedimiento descrito para eliminar x3 de todas las ecuaciones que siguen a
la tercera ecuación. Este procedimiento, se continúa hasta que el conjunto
original de ecuaciones ha sido reducido a una matriz triangular.
Ya obtenido el conjunto triangular de ecuaciones, la última ecuación
proporciona directamente el valor de xn. Este valor se sustituye en la
antepenúltima ecuación para obtener un valor de xn-1, que a su vez se utiliza
junto con el valor de xn en la penúltima ecuación para obtener un valor xn-2 y
así sucesivamente.
Al procedimiento anterior se le conoce como sustitución inversa.
Ejemplo 3.4.1
Resolver el siguiente sistema de ecuaciones lineales por el método de Gauss
con pivoteo.
47
2.1x1 + 4.3x2 - x3 + 3 x4 = 1
2.5x1 + 3.2x2 - 4x3 + x4 = 2
(3.4.5)
x1 + x2 - 4.3 x3 + x4 = 1.2
2 x1 - x2 + 4.3 x3 - x4 = 0
Solución: Primero escribamos (3.4.5) en forma de matriz ampliada, esto es:
 2.1 4.3 -1 3

 2.5 3.2 -4 1
 1
1 -4.3 1

-1 4.3 -1
 2
Primer
pivote
1 

2 
1.2 

0 
de la primer columna 2.5 es el mayor en valor absoluto, este será el primer
pivote (a11=2.5), dividimos todos los elementos del renglón entre el,
reordenamos los renglones y así obtenemos un sistema equivalente,
posteriormente eliminaremos los coeficientes an1 para n=2, 3,4 de este
sistema, mediante múltiplos (inversos aditivos de estos coeficientes) de la
primer ecuación y los sumaremos a cada uno de los otros renglones, esto es:
 1 1.28 -1.6 0.4

-4
1
 2.1 3.2
 1
1
-4.3 1

-1
4.3 -1
 2
0.8  (2.1) (-1) (-2)

2    
1.2     

0  
 
obteniendo el siguiente sistema equivalente.
Segundo
pivote
48
 1 1.28 -1.6

 0 1.612 2.36
 0 -0.28 -2.7

 0 -3.56 7.5
0.4
2.16
0.6
-1.8
0.8 

-0.68 
0.4 

-1.6 
Seguimos el mismo procedimiento con el sistema equivalente, de tal manera
que el nuevo pivote es –3.56, ya que este es el número de mayor valor
absoluto de la segunda columna.
Dividimos todos los elementos del renglón donde se encuentra el 20 pivote
entre él y reordenamos las ecuaciones, después eliminaremos a32, a42,
mediante múltiplos de la segunda ecuación sumándolos de cada uno de
estas, esto es:
-1.6
0.4
 1 1.28

1
-2.1067416 0.5056180
0
 0 -0.28
-2.7
0.6

2.36
2.16
 0 1.612


0.4494382  (0.28 ) (1.612)
0.4   


-0.68  

0.8
para obtener:
Tercer
pivote
-1.6
0.4
 1 1.28

 0 1 -2.1067416 0.5056180
 0 0 -3.2898876 0.7415730

5.7560675 1.3449438
0 0


0.4494382 
0.5258427 

-1.4044944 
0.8
Continuando el proceso con el nuevo sistema equivalente, el siguiente
pivote es 5.7560675, ya que es el de mayor valor absoluto entre el y
–3.2898876, dividimos el renglón entre el 3er pivote y reordenamos las
ecuaciones y a continuación eliminar a43, mediante múltiplos (inversos
aditivos) de la tercera ecuación y la sumamos de esta, así:
-1.6
0.4
 1 1.28

 0 1 -2.1067416 0.5056180
0 0
1
0.2336567

 0 0 -3.2898876 0.7415730


0.4494382 
-0.2440024  (3.2898876 )

0.5258427 

0.8
para obtener, asimismo, el último sistema equivalente de matriz ampliada el
cual utilizaremos para realizar las sustituciones de manera regresiva.
49
-1.6
0.4
 1 1.28

1
-2.1067416 0.5056180
0
0
0
1
0.2336567
 0
0
0
1.5102773



0.4494382 
-0.2440024 

-0.2768978 
0.8
el último renglón de este sistema ampliado, se interpreta:
1.5102773 x4 = –0.27688978 de donde x4 = –0.183342357
El tercer renglón es la abreviación de la siguiente ecuación:
x3 + 0.2336567x4 = –0.2440024
y dado que ya obtuvimos el valor de x4 podemos obtener, despejando de
ella, el valor de x3 , así:
x3 = (–0.2336567)x4 –0.2440024 = (–0.2336567)( –0.183342357)-0.2440024
de donde
x3 = –0.201163229
El segundo renglón se interpreta del siguiente modo:
x2 – 2.1067416 x3 + 0.50561180 x4 = 0.4494382
de donde despejando x2 y sustituyendo los valores de x3 y x4 obtenidos
anteriormente, tenemos:
x2 = 2.1067416 x3 – 0.50561180 x4 + 0.4494382
x2=(2.1067416)( –0.201163229) – (0.50561180)( –0.183342357)+0.4494382
obteniendo el valor: x2=0.1183393
De la misma forma el primer renglón expresa lo siguiente:
x1 +1.28x2 – 1.6x3 +0.4x4 = 0.8
despejando x1 tenemos:
50
x1 = –1.28x2 + 1.6x3 – 0.4x4 + 0.8
Sustituyendo los valores de x2 , x3 , x4
anteriores, obtenemos el valor de:
x1 = 0.40000147
La tabla 3.1 muestra los resultados finales del sistema de ecuaciones lineales, así
como, el error relativo y absoluto.
x1
x2
x3
x4
solución
gauss pivoteo
0.40000147
0.1183393
–0.201163229
–0.183342357
solución real
0.4
0.118340442032
-0.201163241567
-0.183342380768
Error absoluto
Error
relativo %
0.00000147
0.0003675
0.000001142032 0.000965
0.000000012567 0.0000062
0.000000023768 0.0000129
Tabla 3.1
Otra de las variantes del método de Gauss es el método del pivoteo total que
consiste en elegir como pivote el elemento de mayor valor absoluto de la
fila y columna con la que estamos trabajando, este es más efectivo que el
pivoteo parcial en la propagación del error, solo que la búsqueda de el
máximo valor es mucho más costosa que el pivoteo parcial, por lo que
prácticamente se prefiere el pivoteo parcial, más aún, la diferencia entre
ambos métodos no es muy significativa en términos de la propagación del
error.
3.6 Solución de sistemas de
ecuaciones lineales
por métodos iterativos
Como se mencionó al inicio de la sección 3.2 ahora estudiaremos los
métodos de solución de ecuaciones lineales no directos, esto es, los métodos
iterativos o infinitos. El término infinito, en este caso, así como en otros
casos de las matemáticas, es muy relativo, ya que las iteraciones que se
desarrollarán, para que los algoritmos converjan, están bien determinadas y
no son muy grandes.
51
Por lo regular podemos encontrar dos técnicas para dar solución a los
sistemas de ecuaciones lineales A x = b: El método de Jacobi y el método
de Gauss Seidel. La convergencia de estos métodos no puede asegurarse si
desarrollamos el algoritmo sin un análisis previo de la matriz principal, con
esto queremos decir que estos métodos se utilizan bajo ciertas condiciones
para asegurar su convergencia.
Estos métodos, son aplicables a los sistemas consistentes, que contengan
una solución única, donde además, la matriz principal no debe tener ceros en
la diagonal principal.
Si el sistema de ecuaciones lineales A x = b es un sistema consistente con
solución única y si el determinante de A es diferente de cero (detA  0),
podemos asegurar que ninguna columna o renglón esta formada por ceros,
en cuyo caso podemos intercambiar renglones o columnas y de esta manera
obtener un sistema equivalente, en donde la matriz principal se encuentre sin
ceros en la diagonal principal.
En pocas palabras una condición suficiente para que estos dos métodos
converjan, es que la matriz A sea de diagonal estrictamente dominante.
3.6.1 Método de Jacobi
Este método iterativo, desarrollado por Carl Gustav Jacob Jacobi
matemático alemán (1804-1851), es un procedimiento que consiste en
efectuar despejes de la diagonal principal del sistema de ecuaciones A x =b ,
partiendo de un vector arbitrario y efectuando sustituciones en cada una de
las ecuaciones, para obtener un nuevo vector de salida, el cual nuevamente
se sustituirá en todas las ecuaciones y así de manera repetitiva o recurrente,
hasta que la diferencia entre dos vectores consecutivos sea menor que la
tolerancia prefijada, y así detener el proceso.
Supongamos que el sistema:
52
a11 x1 + a12 x2 + a13 x3 + ...+ a1n xn = b1
a21 x1 + a22 x2 + a23 x3 + ...+ a2n xn = b2
(3.6.1)
an1 x1 + an2 x2 + an3 x3 + ...+ ann xn = bn
es tal que A= ( aij ) , es de diagonal estrictamente dominante, el método de
Jacobi consiste en resolver la i-ésima ecuación i =1,2,…,n para xi y de esta
manera el sistema toma la siguiente forma:
x1k 1 
b1 a12 k a13 k

x2 
x3
a11 a11
a11

a1n k
xn
a11
x2k 1 
b2 a21 k a23 k

x1 
x2
a22 a22
a11

a1n k
xn
a22
xnk 1 
bn an1 k an 2 k

x1 
x2
ann ann
ann

an ( n 1)
ann
(3.6.2)
xnk1
Enseguida se dan valores arbitrarios iniciales x1(0) , x2(0) ,..., xn(0) , se sustituyen
las aproximaciones en todas y cada una de las ecuaciones, para obtener una
nueva aproximación x1(1) , x2(1) ,..., xn(1) volviendo al primer paso, utilizando los
nuevos valores, generando así sucesiones
x
(k )
1
, x2( k ) ,..., xn( k )  , las cuales
eventualmente convergerán a x1 , x2 ,..., xn ó, de no ser así, detendremos el
proceso hasta que:
x1( n 1)  x1( n )  E1 , x2( n 1)  x2( n )  E2 ,..., xn( n 1)  xn( n )  En
(3.6.3)
Ejemplo 3.6.1.1
Por el método de Jacobi resuelva el siguiente sistema de ecuaciones lineales
1.5 x1 + 1.1x2 – 3.2 x3 = 43.78
-0.7 x1 + 5.4x2 +1.6 x3 = 3.16
3.08 x1 + 1.6x2 +0.9 x3 = 3.72
53
Primero efectuaremos un acomodo en las filas para que el sistema tome la
forma con diagonal estrictamente dominante, aunque se mencionó que es
una condición necesaria, en algunas ocasiones el método converge sin llevar
a cabo un ordenamiento
3.08 x1 + 1.6x2 +0.9 x3 = 3.72
-0.7 x1 + 5.4x2 +1.6 x3 = 3.16
1.5 x1 + 1.1x2 – 3.2 x3 = 43.78
despejamos de la primera ecuación x1, x2 de la segunda, y por último x3 , de
la tercera, con lo cual obtenemos,
x1 = (3.72 - 1.6x2 - 0.9x3 )/3.08
x2 = (3.16 +0.7x1 - 1.6x3 )/5.4
(3.6.4)
x3 = (43.78 - 1.5x1 - 1.1x2 )/(-3.2)
Inicialicemos el algoritmo con un vector arbitrario, por lo general
xi(0)  0, i = 1,2,...,n , así la primer iteración
x10 = (3.72 - 1.6(0) - 0.9(0)) / 3.08 = 1.207792208
x20 = (3.16 +0.7(0) - 1.6(0)) / 5.4 = 0.585185185
x30 = (43.78 - 1.5(0) - 1.1(0)) / (-3.2)= -13.68125
En la segunda iteración, se repite el mismo procedimiento pero ahora
sustituyendo los nuevos valores de x1  x1(0) , x2  x2(0) , x3  x3(0) :
3.72 - 1.6(0.585185185) - 0.9(-13.68125)
= 4.901567761
3.08
3.16 +0.7(1.207792208) - 1.6(-13.68125)
x22 =
= 4.795454545
5.4
43.78 - 1.5(1.207792208) - 1.1(0.585185185)
x32 =
= -12.913940
-3.2
x12 =
54
este procedimiento se continúa hasta que la sucesión de valores converja (si
converge). Enseguida se presenta en la tabla 3.2 los valores obtenidos en las
iteraciones.
n
x1n
x2n
x3n
0
1
2
3
4
5
6
…
10
15
20
25
30
35
40
45
46
0
1.207792208
4.901567761
2.490200884
1.430714431
2.387399072
2.569193736
0
0.585185185
4.795454545
5.04692619
3.792493481
3.964451858
4.363383725
0
-13.68125
-12.913940
-9.735202612
-10.77908746
-11.70693298
-11.19937636
2.312857636
2.291259625
2.293538997
2.293426115
2.293426451
2.293426911
2.293426867
2.293426869
2.293426869
4.213790939
4.189708358
4.190811759
4.190816311
4.190811105
4.190811557
4.190811539
4.190811539
4.190811539
-11.14782874
-11.1648733
-11.16575918
-11.16560481
-11.16561496
-11.16561471
-11.16561469
-11.16561469
-11.16561469
Tabla 3.2
a ocho decimales podríamos decir que la iteración 46 es la solución del
sistema de ecuaciones lineales. Una solución, con once cifras decimales es:
x1 = 2.29342686929
x2 = 4.19081153891
x3 = – 11.1656146885
3.6.2 Método de Gauss Seidel
Este método iterativo, desarrollado por Gauss y Philipp Ludwig Von
Seidel(1821-1896), matemático alemán, es parecido al de Jacobi, solo que
más refinado y por lo general (pero no siempre) converge rápidamente.
Realiza los mismos despejes de la diagonal principal del sistema de
ecuaciones A x = b , también inicializa con un vector arbitrario a partir del
55
cual, mediante una técnica sistemática, se obtiene una mejor aproximación
al vector solución.
La diferencia reside en que este método utiliza la información más
actualizada, ya que, se efectúa la sustitución en la primer ecuación para
obtener un valor de la primer variable, el vector inicial modifica su primer
componente y es sustituido en la segunda ecuación para obtenemos un valor
de la segunda variable, mismo que modificará nuevamente el vector, al
asignarse como segunda componente, el proceso se continua para obtener xi
y de esta manera regresar a la primer ecuación y repetir el proceso anterior
hasta observar la convergencia, si es posible.
La expresión anterior puede quedar descrita de la siguiente manera:
x1k 1 
b1 a12 k a13 k
x2 x3
a11 a11
a11
x2k+1 =
b2 a21 k+1 a23 k
x1 x2
a22 a22
a11
xnk+1 =
bn an1 k+1 an2 k+1
x1 x2
ann ann
ann

a1n k
xn
a11
a1n k
xn
a22


an(n-1)
ann
k+1
xn-1
En el algoritmo podemos definir una tolerancia para efectuar la comparación
entre xi( n ) y xi( n 1) , de tal manera que si elegimos una tolerancia pequeña,
mayor será la precisión de la solución.
Ejemplo 3.6.2.1
Resolver el ejemplo 3.6.1.1 por el método Gauss-Seidel
Solución:
Iniciamos con las ecuaciones 3.6.4, ya despejadas:
56
x1 = (3.72 - 1.6x2 - 0.9x3 )/3.08
x2 = (3.16 +0.7x1 - 1.6x3 )/5.4
x3 = (43.78 - 1.5x1 - 1.1x2 )/(-3.2)
0
0
Suponemos los valores iniciales x2 = x3 = 0 y calculamos x11 :
x11 =
3.72 - 1.6(0) - 0.9(0)
= 1.207792208
3.08
Este valor, junto con el de x3 = 0, se utilizará para obtener x2
x21 =
3.16 +0.7(1.207792208)- 0.9(0)
= 0.741750841
5.4
La primera iteración se completa sustituyendo los valores de x1 y x2
calculados obteniendo:
x31 =
43.78 - 1.5(1.207792208)- 1.1(0.741750841)
= -12.86012055
-3.2
En la segunda iteración, se repite el mismo procedimiento:
3.72 - 1.6(0.741750841)- 0.9(-12.86012055)
= 4.580294529
3.08
3.16 +0.7(4.580294529)- 1.6(-12.86012055)
x22 =
= 4.989333158
5.4
43.78 - 1.5(4.580294529)- 1.1(4.989333158)
x32 =
= -9.819153667
-3.2
x12 =
Comparando los valores calculados entre la primera y la segunda iteración
tenemos:
57
x12 - x11 = 4.580294529 - 1.207792208 = 3.372502321
x22 - x21 = 4.989333258 - 0.741750841 = 4.247582417
x32 - x31 = -9.819153667 - (-12.86012055) = 3.040966883
Como podemos observar, el error es grande en esta iteración.
Tomamos los valores modificados en la última iteración e iniciamos el
procedimiento nuevamente para la siguiente iteración.
x13 =
3.72 - 1.6(4.9893332158) - 0.9(-9.819153667)
= 1.485164041
3.08
x23 =
3.16 +0.7(1.485164041) - 1.6(-9.819153667)
= 3.687085314
5.4
x33 =
43.78 - 1.5(1.485164041) - 1.1(3.687085314)
= -11.71764378
-3.2
Comparamos de nuevo los valores obtenidos:
x13 - x12 = 1.485164041- 4.580294529 = 3.0951305
x23 - x22 = 3.687085314 - 4.989333158 = 1.302247844
x33 - x32 = -11.71764378 - (-9.819153667) = 1.898490113
Aún se observa un error muy grande para
58
xi3 - xi2  
para i = 1,2,3
Así continuamos con otras iteraciones, hasta que se cumpla la condición que
pretendemos y lograr una respuesta satisfactoria.
Enseguida la tabla 3.3 muestra alguna de las iteraciones realizadas
n
x1n
x2n
x3n
0
1
2
3
4
5
6
…
10
20
30
33
34
0
1.207792208
4.580294529
1.485164041
2.716410032
2.100100702
2.385651978
0
0.741750841
4.989333158
3.687085314
4.409206865
4.084759109
4.240419139
0
-12.86012055
-9.819153667
-11.71764378
-10.89226794
-11.29269185
-11.10533156
2.297993952
2.293429378
2.293426871
2.293426869
2.293426869
4.193279854
4.190812895
4.19081154
4.190811539
4.190811539
-11.16262539
-11.16561305
-11.16561469
-11.16561469
-11.16561469
Tabla 3.3
Como se puede evidenciar no se tiene un número exacto de iteraciones para
encontrar una solución.
En este ejemplo, se hicieron 2 iteraciones, para mostrar el método, pero se
requiere un máximo de entre 34 iteraciones para la convergencia.
3.7 Solución de
Sistemas de ecuaciones no Lineales
Un sistema de ecuaciones
59
f1 (x1 ,x2 ,
, xn ) = 0
f 2 (x1 ,x2 ,
, xn ) = 0
(3.7.1)
f n (x1 ,x2 , , xn ) = 0
es no lineal, si al menos una de las funciones f1, f2, …,fn , es no lineal.
La solución de 3.7.1 consiste en un conjunto de valores xi que
simultáneamente sean el resultado de todas las fi(x1,x2,…,xn) para i=1,2,…,n.
Algunos de estos sistemas de ecuaciones no lineales podemos resolverlos
echando mano de métodos como el de Newton-Raphson o bien de GaussSeidel, efectuando arreglos algebraicos, como se expone en el capítulo 2, en
las ecuaciones de tal manera que tomen la forma de ecuaciones como punto
fijo.
El conjunto de ecuaciones 2.1.2 f(x) = ex y g(x) = 4 – x2 , se resolvió en
el ejemplo 2.6.1 arrojando una solución por el método de Newton Raphson
de 1.058006401 y -1.964635597 . Estas ecuaciones puede expresarse como
y = ex, y y = 4 – x2 y tomar la forma de un sistema de ecuaciones no
lineales, como se muestra enseguida.
y – 4 + x2 =0
y–ex =0
(3.7.2)
Ejemplo 3.7.1
Resuelva 3.7.2 Utilizando el método de Gauss-Seidel efectuando los
despejes
y = 4 – x2
x = ln y
Solución:
Si iniciamos con x = 0, y = 0 obtenemos la tabla 3.4
n
0
1
2
3
60
y
0
4
2.078187944
3.464913114
x
0
1.386294361
0.731496333
1.242687557
4
2.455727636
5
3.192835922
….. ….
50
2.880622164
60
2.880622442
70
2.880622455
Tabla 3.4
0.898423106
1.160909526
….
1.0580063
1.058006396
1.058006401
La cual es una de las soluciones de este sistema de ecuaciones no lineales.
Ejemplo 3.7.2
Resuelva 3.7.2 Utilizando el método de Gauss-Seidel efectuando los
despejes:
y = ex
x = - (4 - y)
Solución:
Inicializamos en x=0 y y = 0 obteniendo los valores que se muestran en la
tabla 3.5
n
0
1
2
3
4
5
6
7
8
9
y = ex
0
1
0.176921206
0.141526331
0.140254059
0.140208649
0.140207029
0.140206971
0.140206969
0.140206969
x= -
(4 - y)
0
-1.732050808
-1.955269494
-1.964299791
-1.964623613
-1.96463517
-1.964635582
-1.964635597
-1.964635597
-1.964635597
Tabla 3.5
En la tabla 3.5 encontramos otra de las soluciones del sistema de ecuaciones
no lineales, en la cual podemos observar que no existe un número fijo de
iteraciones para obtener una solución.
Al buscar la solución en un método iterado ya sea el método de punto fijo o
el de Gauss-Seidel, podemos observar que este proceso puede realizarse de
muchas maneras, pero la más sencilla en comparación es el método de punto
61
fijo, haciendo F(x) = x + f(x), para construir una sucesión de vectores,
partiendo de un vector inicial x0 , de la siguiente manera
xn 1  F ( xn )
 x1n 1  F ( x1n , xn2 ,
 2
1
2
 xn 1  F ( xn , xn ,


 xnk1  F ( x1n , xn2 ,
, xnk )
, xnk )
(3.7.3)
, xnk )
como se puede ver en (3.7.3) y (3.7.4), podemos escribirlos
x = F(x)

x 
x= 0 

 y0 




x = lny 
 F(x) = 
2 

 y=4 - x 
(3.7.4)
Si x es una solución de la ecuación y xn+1 es una aproximación, se tiene
que la sucesión x0, x1,…,xn,… converge a la única raíz de x =F(x) en algún
intervalo dado, debido a la teoría de punto fijo de la sección 2.1.
Si f(x,y) y g(x,y) son funciones de dos variables, y (α, β) el punto fijo donde
se cruzan ambas ecuaciones al dar un valor p0 para y, y sustituirlo en las dos
ecuaciones obtenemos nuevas ecuaciones f(x,p0) = f(x) = 0
g(x,p0) =
g(x) = 0 las cuales pueden resolverse por el método de Newton-Raphson
arrojando valores iniciales a1(0) , a2(0) , los cuales nos definen dos puntos
(a1(0) , p0 ) y (a2(0) , p0 ) que se encuentran sobre las curvas f(x,y) y g(x,y)
respectivamente, de donde si utilizamos las pendientes f '(a1(0) ) y g '(a2(0) )
podemos construir ecuaciones tangentes a f(x,y) y g(x,y) como:
f '(a1(0) ) x  y  p0  a1(0) f '(a1(0) ) y
(3.7.5)
g '(a2(0) ) x  y  p0  a2(0) f '(a2(0) )
convirtiéndose en un sistema de ecuaciones lineales que podemos resolver
por algún método, para obtener así la primer aproximación (x1,y1), y
repitiendo el proceso iterativamente, llegar a la convergencia (α, β).
62
O bien si (α, β) es una raíz y las dos funciones son desarrolladas en series de
Taylor, alrededor del punto (x0, y0), en términos de α – x0 , β – y0 , (x0, y0)
cercano a la raíz:
f ( ,  )  0  f ( x0 , y0 )  f x ( x0 , y0 )(  x0 )  f y ( x0 , y0 )(   y0 )  ...
g ( ,  )  0  g ( x0 , y0 )  g x ( x0 , y0 )(  x0 )  g y ( x0 , y0 )(   y0 )  ..
si truncamos la expansión considerando que los demás términos son
pequeños y (x0,y0) esta cercano a (α, β), obtenemos el siguiente sistema de
ecuaciones lineales
f x ( x0 , y0 )(  x0 )  f y ( x0 , y0 )(   y0 )   f ( x0 , y0 )
(3.7.6)
g x ( x0 , y0 )(  x0 )  g y ( x0 , y0 )(   y0 )   g ( x0 , y0 )
El cual resolviendo mediante
(  x0 ) y (   y0 ) se tiene,
(  x0 ) 
la
regla
 f ( x0 , y0 )
f y ( x0 , y0 )
 g ( x0 , y0 )
g y ( x0 , y0 )
f x ( x0 , y0 )
f y ( x0 , y0 )
g x ( x0 , y0 )
g y ( x0 , y0 )
de
Cramer
para
(3.7.7)
f x ( x0 , y0 )  f ( x0 , y0 )
(   y0 ) 
g x ( x0 , y0 )  g ( x0 , y0 )
f x ( x0 , y0 ) f y ( x0 , y0 )
(3.7.7)
g x ( x0 , y0 ) g y ( x0 , y0 )
Si α = xn+1 β = yn+1 escrito recursivamente tenemos que
63
( xn 1  xn ) 
 f ( xn , yn )
f y ( xn , yn )
 g ( xn , yn )
g y ( xn , yn )
f x ( xn , yn )
f y ( xn , yn )
 n
g x ( xn , yn ) g y ( xn , yn )
y
(3.7.8)
f x ( xn , yn )  f ( xn , yn )
( yn 1  yn ) 
g x ( xn , yn )  g ( xn , yn )
 n
f x ( xn , yn ) f y ( xn , yn )
g x ( xn , yn ) g y ( xn , yn )
Esto es xn+1 = xn+ Өn
yn+1 = yn + λn
Ejemplo 3.7.3
Resuelva utilizando el método de Newton-Raphson para varias variables el
sistema de ecuaciones 3.7.2
Solución:
Las ecuaciones 3.7.2. son y – 4 + x2 =0
siguientes funciones en dos variables
f = x2 + y – 4
y
y – e x = 0, construyendo las
g = ex – y
y obteniendo las derivadas parciales respecto que se indican en 3.7.8
fx = 2x, gx=ex , fy = 1 , gy = –1 ,
e iniciando en (1 , 1) obtenemos la tabla 3.6
64
x1 = x0 +
-f(x0 , y0 )
f y (x0 , y0 )
-g(x0 , y0 )
g y (x0 , y0 )
f x (x0 , y0 )
f y (x0 , y0 )
g x (x0 , y0 )
g y (x0 , y0 )
f x (x0 , y0 )
-f(x0 , y0 )
-(-2)
= 1+
1
-(e - 1) -1
= 1.059707788
2 1
e
-1
y
y1 = y0 +
2
-(-2)
g x (x0 , y0 ) -g(x0 , y0 )
e -(e - 1)
= 1+
= 2.880584424
f x (x0 , y0 ) f y (x0 , y0 )
2 1
g x (x0 , y0 )
g y (x0 , y0 )
e
-1
iterando con estos nuevos valores obtenemos la tabla 3.6
n
0
1
2
3
4
xn
yn
1
1.059707788
1.058007813
1.058006401
1.058006401
1
2.880584424
2.880622357
2.880622455
2.880622455
Tabla 3.6
El cual converge en 4 iteraciones.
Si inicializamos en (– 1, – 1) obtenemos la tabla 3.7
n
0
1
2
3
4
5
6
xn
-1
-2.612699837
-2.049908486
-1.966588005
-1.964636673
-1.964635597
-1.934635597
yn
-1
-0.225399673
0.114609304
0.13947392
0.140206551
0.140206969
0.140206969
Tabla 3.7
El cual converge en 6 iteraciones.
Si los valores iniciales no se encuentran cerca de la posible solución o raíz,
la sucesión de valores que obtengamos, diverge a menudo, con esto
65
podemos decir que, para obtener una solución, los valores iniciales podemos
cambiarlos para, a prueba y error, obtener una solución, si el problema
corresponde a un modelo físico, el comportamiento y condiciones nos
pueden dar una idea para iniciar con ciertos valores, o bien si podemos
graficar este tipo de ecuaciones fácilmente podemos encontrar un vector de
inicio para que el método pueda converger.
Este método puede generalizarse para resolver n ecuaciones simultáneas,
utilizando las siguientes ecuaciones
f1 ( x0 , y0 , z0 ,...)
f1
( x0 , y0 , z0 ,...)
x
f ( x , y , z ,...)
(   y0 )   2 0 0 0
f 2
( x0 , y0 , z0 ,...)
y
f ( x , y , z ,...)
(  z0 )   3 0 0 0
f3
( x0 , y0 , z0 ,...)
z
(  x0 )  
PROBLEMAS CAPÍTULO III
1.- Por el método de Gauss con pivoteo parcial resuelva los siguientes
sistemas de ecuaciones lineales.
a)
0.3736 x1 – 0.2674 x2 + 0.1327 x3 = – 1.7411
– 0.0720 x1 + 0.2997 x2 – 0.0103 x3 = 1.7667
– 0.5008 x1 – 0.1226 x2 – 0.1254 x3 = – 0.6046
b) 1.8 x1 + 2.6 x2 + 0.93 x3 = 3.52
– 2.8 x1 + 3.4 x2 – 3.6 x3 = 3.16
1.7 x1 + 0.1 x2 – 3.2 x3 = 13.58
c)
d) 3.2 x1 + 1.16 x2 + 2.72 x3 = 1.25
– 1.17 x1 + 3.24 x2 – 2.12 x3 =1.21
2.3 x1 + 0.2 x2 – 2.5 x3 = 1.8
e)
66
0.6 x1 – 2.4 x2 + 3.7 x3 = – 1.7
– 0.7 x1 + 0.3 x2 – 1.3 x3 = 0.7
– 0.5 x1 – 0.1 x2 – 0.2 x3 = – 0.6
9.96 x1 – 3.445 x2 + 2.67 x3 = – 11.77
1.73 x1 + 0.253 x2 – 2.53 x3 = 0.5674
1.4 x1 – 0.32 x2 + 0.52 x3 = 5.674
2.- Por el método de Jacobi y de Gauss-Seidel resuelva el siguiente
conjunto de ecuaciones lineales con diagonal estrictamente dominante
a)
b)
0.87 x1 – 0.26 x2 + 0.27 x3 = – 1.7411
– 0.17 x1 + 0.49 x2 – 0.23 x3 = 1.7667
– 0.58 x1 – 0.12 x2 – 0.76 x3 = – 0.6046
4.8 x1 + 2.6 x2 + 0.93 x3 = 3.52
– 0.8 x1 + 5.4 x2 – 1.6 x3 = 3.16
1.7 x1 + 0.1 x2 – 3.2 x3 = 13.58
d) 5.2 x1 + 1.16 x2 + 2.72 x3 = 1.25
– 1.17 x1 + 4.24 x2 – 2.12 x3 =1.21
2.3 x1 + 0.2 x2 – 2.6 x3 = 1.8
c)
e)
8.6 x1 – 2.4 x2 + 3.7 x3 = – 1.7
– 0.1 x1 + 1.3 x2 – 0.3 x3 = 0.7
– 0.05 x1 – 0.1 x2 – 0.2 x3 = – 0.6
9.96 x1 – 5.452 x2 + 2.67 x3 = – 11.77
1.73 x1 + 5.253 x2 – 2.53 x3 = 0.5674
0.4 x1 – 0.32 x2 + 1.52 x3 = 5.67
3.- Reordene las siguientes ecuaciones para que la mayoría de ellas sea de
diagonal estrictamente dominante y resuelva por el método de Gauss-Seidel
a) 1.8 x1 + 2.6 x2 + 0.53 x3 = 0.99
–8.3 x1 – 5.4 x2 – 1.3 x3 = 2.61
1.7 x1 + 0.1 x2 – 3.2 x3 = 13.58
b) 1.6 x1 – 2.4 x2 + 5.7 x3 = – 1.2
– 3.1 x1 + 1.3 x2 – 0.3 x3 = 3.7
– 0.05 x1 – 0.9 x2 – 0.2 x3 = – 1.6
c)
d)
5.2 x1 + 4.16 x2 + 2.72 x3 = 1.55
– 1.17 x1 + 2.24 x2 – 5.12 x3 =1.29
5.3 x1 + 0.2 x2 – 1.6 x3 = 1.9
9.96 x1 – 5.452 x2 + 2.67 x3 = – 1.77
1.73 x1 + 0.253 x2 – 2.53 x3 = 0.568
0.4 x1 – 2.32 x2 + 0.52 x3 = 2.69
4.- Resuelva los siguientes sistemas de ecuaciones no lineales, por el
método de Newton-Raphson o el de Gauss-Seidel.
a) x2 – 3xy – y =1
x2 + 4y2 = 9
b)
y2 – 3xy – x = 1
4x2 + y 2 = 9
c) ex – y = 0
xy – 1 = 0
d) x2 – xy – y 2 = 11
x2 + xy + y 2 = 7
e) y – ln x = 0
x+ y – 2 = 0
f) y 2 – x2 = 16
2y 2 – 4 xy + 3x 2 = 17
67
Capítulo 4
Ajuste de funciones
Cualquiera que hayamos tenido la experiencia, en cierta ocasión, de
observar tablas de valores en la cual se describa alguna función en particular
o algún comportamiento en los datos, tomados de un experimento, hemos
tratado de adivinar o sugerir uno o mas valores dentro de un par de datos.
Ese deseo de pronosticar o interpolar, probablemente en algunas situaciones
como método de "adivinando entre datos" no es muy acertado que digamos.
Para muchos propósitos, es deseable encontrar una fórmula que pueda
expresarse, explícitamente, en términos de dos o más variables, lo que nos
permitiría considerar el efecto más directamente, con el fin de obtener
información posterior.
En este capitulo utilizaremos la información de los datos clasificados,
tratando de establecer una fórmula, que explique el comportamiento de
estos, en su totalidad, si es posible. Es claro que será necesario, además de
los datos cuantitativos, alguna información adicional cualitativa, para el
caso de tomar una decisión, evitando en lo posible, cometer un error
involuntario.
Uno de los primeros métodos que podríamos utilizar, es el descrito en el
capítulo II, fórmula de la interpolación, la cual posee ventajas en ciertas
situaciones, pero no es del todo preferible ya que se encuentra que estas
ventajas sólo se logran descartando otras. La fórmula fue expresada
explícitamente en términos de las ordenadas, las cuales dependían de otras
para obtener un valor único en un intervalo.
Analizaremos las fórmulas de Newton, para datos igualmente espaciados,
Lagrange, para datos desigualmente espaciados, Mínimos cuadrados, para
una gran cantidad de datos, así como aproximaciones de Taylor como
polinomio de colocación o de aproximación.
68
4.1 Polinomios de colocación Taylor
El efectuar cálculos con funciones trascendentes, en ocasiones no queda
claro la precisión que debemos tomar para su uso. Un problema básico, por
años, fue el de aproximar las funciones por polinomios, ya que el manejo de
estos es sencillo debido a que son continuos en su dominio, pueden
derivarse e integrarse fácilmente y su resultado es un polinomio.
Por otra parte, cualesquier polinomio
P(x) = anxn + an-1xn-1 + … +a2x2 + a1x + a0
con coeficientes an, an-1 ,…, a2, a1, a0 es fácil de evaluar. Si f es una
función trascendente y deseamos obtener una evaluación en x0, nos bastaría
con encontrar un polinomio P(x) y que al ambas graficas se encuentren
cercanas al compararse, para que el valor especifico f(x0) pueda ser
sustituido por el aproximado P(x0).
Las primeras aproximaciones de funciones aparecen del la utilización de la
definición de derivada.
Sea y = f(x), una función definida en un intervalo I [x0 , x1], continua y
diferenciable en dicho intervalo cuya longitud es h = x1 – x0,. Entonces, el
incremento Δy del valor de f(x) cuando x varía de x0 a x1, es la
diferencia entre el valor nuevo y el valor inicial, esto es:
Δy = f(x1 ) - f(x0 )
(4.1.1)
si dicha función continúa con la misma razón de cambio f’(x0) en el
intervalo dado, el cambio en x = x0 podemos expresarlo de la siguiente
manera:
f '( x0 )( x1  x0 )  f '( x)h
(4.1.2)
de donde obtenemos una aproximación para la variación en y:
Δy = f '(x0 )h
(4.1.3)
69
Si comparamos el incremento en Δy con la variación que ocurriría en y,
cuando esta varíe a razón fija f’(x), al variar x de x0 a x1 se obtiene lo
que en cálculo se llama diferencial de y:
(4.1.4)
dy = f '(x0 )h
de lo anterior podríamos escribir una primer aproximación lineal para una
función en términos de la primer derivada como sigue:
Si x1 = x0 + h, f(x0) = y0 , f ( x1 )  f(x0  h)  y0  Δy  y1  yo  dy esto
es:
(4.1.5)
f(x0  h)  f(x0 )  f '( x0 )h
De esta manera podríamos expandir a una función f(x) mediante una
aproximación lineal como muestra (4.1.5).
Una expansión, en términos de derivadas, podríamos justificarla si
observamos, por ejemplo, que sucede con la variación de f(x) = x7, cuando x
varía de, x a x+ h , como se describe enseguida:
f ( x  h)  ( x  h)7
ó
(4.1.6)
x 7  7 x 6h  21x5h 2  35x 4h3  35x 3h 4  21x 2h5  7 xh 6  h 7
f(x) = x7
f iv (x) = 840x 3
f i (x) = 7x6
f v (x) = 2520x 2
f ii (x) = 42x 5
f vi (x) = 5040x
f iii (x) = 210x 4
f vii (x) = 5040
(4.1.7)
de esta forma podemos encontrar una relación entre los términos de 4.1.6 y
las derivadas en 4.1.7, como mostraremos enseguida:
f + f i h+
f ii 2
f iii 3
f iv 4
fv 5
f vi 6
f vii
h +
h +
h +
h +
h +
h7
2
6
24
120
720
5040
o bien:
f(x + h) = f + f i h+
70
f ii 2 f iii 3 f iv 4 f v 5 f vi 6
f vii 7
h +
h +
h +
h +
h +
h
2
3!
4!
5!
6!
7!
de aquí que, una expansión en series de Taylor, pueda ser expresada en una
serie infinita.
Si f(x) es una función continua en I [x0, x1] y supongamos que existen la n
primera derivadas para x = x0, una expansión en serie de Taylor puede
expresarse como:
f ii ( x0 ) 2
f ( n ) ( x0 ) n
(4.1.8)
f ( x)  f ( x0 )  f i ( x0 )h 
h  ... 
h
2
n!
o bien, si x0 = 0 y h = x en el segundo miembro de 4.1.8 obtenemos una
serie de potencias que nos proporcionara un instrumento para aproximar
funciones:
f ii (0) 2
f ( n ) (0) n
f ( x)  f (0)  f i (0) x 
x  ... 
x  Rn ( x) (4.1.9)
2
n!
donde:
f ( n1) (c) ( n1)
Rn ( x) 
x
0c x
c
(n  1)!
es llamado residuo de la serie, el cual tiende a cero si n tiende a infinito.
Este caso particular de la serie de Taylor, suele llamarse serie de Mclaurin**.
La demostración de dichas series la encontraremos en libros de Cálculo con
Geometría Analítica tradicionales.
Es así como aproximaremos funciones trascendentes como: ex, sen x, cos x,
etc. y a partir de estas, formaremos nuevas series que son útiles al
relacionarlas con alguna aplicación.
Ejemplo 4.1.1
Encuentre el polinomio de Taylor de grado n para f(x) = ex
Solución:
Si f(x) = ex, f’(x) = ex , f’’(x) = ex ,…,f (k)(x) = ex , para todo k≥0. Por lo que
si evaluamos todas las derivadas en x=0, f (k)(0) = e0 =1, y entonces
sustituyendo esta información en 4.1.9, el polinomio que buscamos es:
e x  P(x) = 1+ x +
¥
x2 x3
xn
xn
+ + ...+ = 
2! 3!
n! n=0 n!
(4.1.10)
71
Ejemplo 4.1.2
Encuentre el polinomio de Taylor de grado n para f(x) = sen x.
Solución:
Si f(x)=sen x, f’(x)=cos x, f’’(x) = –sen x, f’’’(x)= –cos x, f iv(x) = sen x,…
Evaluando en x = 0, f(0) = 0, f’(0) =1, f’’(0) =0, f’’’(0) =-1, f iv(0)=0,
repitiéndose las evaluaciones nuevamente a partir de f iv(0), sustituyendo
esta información en 4.1.9, el polinomio buscado será:

x3 x5
(-1)n x 2n+1
(-1)n x 2n+1
senx  P( x)  x - + - ...+

3! 5!
(2n +1)! n0 (2n +1)!
(4.1.11)
De la misma manera, un polinomio para el coseno estará dado por:
cosx  P(x)= 1-
x 2 x4
(-1)n x 2n  (-1)n x 2n
+ - ...+

2! 4!
(2n)!
n 0 (2n)!
(4.1.12)
con estas series, lograríamos encontrar otras que son utilizadas en diferentes
áreas, como control de calidad, funciones de error en electrónica y diversas
aplicaciones en física, química, etcétera.
Ejemplo 4.1.3
Encontrar expresiones para e  x , e senx ,
2
senx 1 - cosx
,
x
x
Solución:
2
Para desarrollar e  x partimos de la expresión 4.1.10 y sustituimos en ella
el valor –x2:
2
(-x 2 )2 (-x 2 )3
(-x 2 )n
e-x  1+(-x 2 )+
+
+ ...+
=
2!
3!
n!

x 4 x6
(-x 2 )n
(-1)n x 2n
= 1 - x 2 + - + ...+
=
2! 3!
n!
n!
n=0
72
Para desarrollar la función
senx

x
x-
senx
partimos de 4.1.11.
x
x3 x5
(-1)n x 2n+1
+ - ...+
x2 x4
(-1)n x 2n
3! 5!
(2n+1)!
 1- + - ...+
x
3! 5!
(2n+1)!

(-1)n x 2n

n  0 (2n+1)!
Para desarrollar
1 - cosx
partimos de 4.1.12.
x
 x2 x4
(-1)n x 2n+1 
1-  1- + - ...+

2! 4!
(2n)!  x x 3
1- cosx
(-1)n x 2n-1
 
= - + ...+
x
x
2! 4!
(2n)!
(-1)n x 2n+1
=
(2n)!
n=0
¥
Y por último para e senx sustituimos 4.1.11 en 4.1.10, esto es:
e senx

x3 x5
x
+

3! 5!

x3 x5  
 1+  x - + -  +
3! 5! 
2!

2


x3 x5
-
x- +
3! 5!
 +
3!
3

-
 + ...
de donde simplificando obtenemos:
e senx  1+ x+
x2
+...para toda x
2!
Ejemplo 4.1.4
Del desarrollo de ex en series, compare el resultado al evaluarse en x=1,
tomando 7 términos de la serie y calculando el error absoluto y relativo.
Solución:
73
e1 = 2.71828182846 a once cifras decimales, el desarrollo de ex con siete
términos es:
e x  1+ x +
x 2 x 3 x 4 x 5 x6
+ + + +
2! 3! 4! 5! 6!
evaluando en x=1 obtenemos la siguiente aproximación e1 =2.718055556
de donde:
Ea = 2.718281828 - 2.718055556 = 0.000226272
ER =
2.71828182846 - 2.71825396825
2.71828182846
= 0.0008324081693 %
4.2 Polinomio de Newton
El problema básico consiste en encontrar un función para una serie de datos
(x0 ,y0), (x1 ,y1),…, (xn ,yn) tal que g(xi) = yi , 1 ≤ i ≤ n mediante un
polinomio P(x), tal que P(xi) = yi para 1 ≤ i ≤ n
Por estos puntos pasa un polinomio de la forma:
P(x) = anxn + an-1xn-1 + … +a2x2 + a1x + a0
el cual es único, gracias al Teorema Fundamental del Álgebra y
sustituyendo los puntos en el, estableceremos un sistema de ecuaciones con
los cuales podemos calcular los coeficiente an, an-1 ,…,a2 , a1, a0 esto es:
an x0n  an 1 x0n 1  ...  a2 x02  a1 x0  a0  y0
an x1n  an 1 x1n 1  ...  a2 x12  a1 x1  a0  y1
(4.2.1)
an xnn  an 1 xnn 1  ...  a2 xn2  a1 xn  a0  yn
Es evidente que si el número de datos es grande el sistema de ecuaciones
que se genera, también lo es, ya que depende del número de datos, por lo
cual trataremos de encontrar otros métodos mas prácticos.
74
Ejemplo 4.2.1
Encontrar el polinomio que pasa por (-1, 2), (1,1) y (2, 3)
Solución:
Dado P(x) = a2x2 + a1x + a0 (polinomio de grado 2), al sustituir los datos en
el obtenemos:
(-1, 2)
( 1, 1)
(2, 3)
P(-1) = 2
P(1) = 1
P(2) = 3
a2 – a1 + a0 = 2
a2 + a1 + a0 = 1
4a2 + 2a1 + a0 = 3
en donde se presenta un sistema de tres ecuaciones lineales con tres
incógnitas, cuya respuesta por algún método matricial, o numérico si es
necesario, es
a2 = 5/6
a1 = -1/2
a0 =2/3
de esta manera el polinomio que buscamos es:
P(x ) =(5/6) x2 + (-1/2)x + (2/3)
 2 y0  (y0 )   ( y1  y0 )  y1  y0  (y2 - y1 ) - (y1 - y0 )
 y2 - 2y1 + y0
(4.2.22)
 3 y0  (  2 y0 )  (y2 - 2y1 + y0 )  y2  2y1  y0
 (y3 - y2 ) - 2(y2 - y1 )+(y1 - y0 )  y3 - 3y2 + 3y1 - y0
(4.2.23)
Lo anterior sugiere la fórmula llamada de Newton, el polinomio de grado n,
que pasa por el conjunto de n datos igualmente espaciados en los valores de
las xi , estará dado por:
Pn ( x)  y0 
y0
2 y
n y
( x  x0 ) + 20 (x - x0 )(x - x1 )  ...  n0 (x - x0 )(x - x1 )...( x  xn1 ) (4.2.26)
h
2!h
n !h
cuya demostración puede desarrollarse por inducción matemática.
75
Una manera práctica para obtener las diferencias se muestra en la tabla 4.1
x0 y0
y0
 2 y0
x1 y1
y1
 3 y0
 2 y1
x2 y2
 4 y0
y2
 3 y1
 2 y2
x3 y3
 5 y0
 4 y1
y3
 3 y2
 2 y3
x4 y4
y4
x5 y5
Tabla 4.1
Se observa rápidamente que:
y0  y1  y0 ,  2 y0  y1  y0 ,  3 y0   2 y1   2 y0 etc. .
Para muchos propósitos es deseable una fórmula para la interpolación, que
pueda ser expresada explícitamente en términos de las ordenadas. Estas
fórmulas, permiten una consideración más inmediata sobre el efecto del
resultado final de un cambio o error, en una o más de las ordenadas
Ejemplo 4.2.1
Encontrar el polinomio de colocación para el siguiente conjunto de parejas
ordenadas.
x
y
2
1
4
-1
6
1
8
-1
10
1
Solución:
Utilizando la forma de la tabla 4.1 ordenamos para obtener la tabla 4.2.
76
n
0
x
2
y
1
Δyk
Δ 2 yk
Δ 3 yk
Δ 4 yk
-2
1
4
-1
4
2
2
6
1
3
8
-1
4
10
1
-8
-4
16
-2
8
4
2
Tabla 4.2
El valor de h, lo obtendremos restando las componentes xn – xn-1 esto es:
h = 4 – 0 = 6 – 4 = 8 – 6 = 10 – 8 = 2
y de la fórmula 4.2.26 obtenemos:
(-2)
4
(x - 2)+
(x - 2)(x - 4)+
(2)
2!(2)2
(-8)
(16)
(x - 2)(x - 4)(x - 6)+
(x - 2)(x - 4)(x - 6)(x - 8)
3
3!(2)
4!(2)4
Pn (x)= 1+
o bien:
1
Pn (x)= 1- (x - 2)+ (x - 2)(x - 4)
2
1
1
- (x - 2)(x - 4)(x - 6)+ (x - 2)(x - 4)(x - 6)(x - 8)
6
24
cuya simplificación es un polinomio satisface los valores dados:
1 4 3 25 2
Pn (x)=
x - x + x - 28x+31
24
3
Ejemplo 4.2.2
Encontrar el polinomio de colocación para el siguiente conjunto de parejas
ordenadas.
x
y
1.4
0.5
1.5
0.2
1.6
0.04
1.7
-0.18
1.8
-0.6
77
Solución:
Utilizando la forma de la tabla 4.1 ordenamos para obtener la tabla 4.2.
n
0
x
1.4
y
0.5
1
1.5
0.2
2
1.6
0.04
Δyk
Δ 2 yk
Δ 3 yk
Δ 4 yk
-0.3
0.14
-0.16
-0.2
-0.06
-0.22
3
1.7
-0.18
0.06
-0.14
-0.2
-0.42
4
1.8
-0.6
Tabla 4.2
En este caso, el valor de h = 0.1 y de la fórmula 4.2.26 se tiene:
(-0.3)
(0.14 )
(x - 1.4)+
(x - 1.4)(x - 1.5)+
1!(0.1)
2!(.1)2
(-0.2)
(0.06)
(x - 1.4)(x - 1.5)(x - 1.6)+
(x - 1.4)(x - 1.5)(x - 1.6)(x - 1.7)
3
3!(0.1)
4!(0.1)4
Pn (x)= 0.5 +
o bien:
1
- 3(x - 1.4)+7(x - 1.4)(x - 1.5)
2
100
(x - 1.4)(x - 1.5)(x - 1.6)+ 25(x - 1.4)(x - 1.5)(x - 1.6)(x - 1.7)
3
Pn (x) =
simplificando obtenemos un polinomio de cuarto grado que satisface
completamente los valores dados:
565 3 2067 2 7421
1371
x +
x x+
3
4
12
5
Un polinomio de colocación P(x) para argumentos desigualmente
espaciados x0, x1, ..., xn, es también de mucha importancia y puede hallarse
de diversas formas, una de ellas se mostrara en el método que veremos en la
siguiente sección.
Pn (x)= 25x 4 -
78
4.3 Polinomio de Lagrange
La forma del polinomio P(x) de grado n, el cual toma los mismos valores
que f(x) para las n + 1 abscisas desigualmente espaciadas x0, x1, ..., xn,
difiere de la fórmala de Newton derivada anteriormente.
Como una primer aproximación, podríamos escribir y(x) en la forma:
n
P(x) = anxn + an-1xn-1 + … +a2x2 + a1x + a0   ak x k
(4.3.1)
k 0
donde ak para k = 0,1,…,n, se determinan de tal forma que P(xk) ≈ f(xk).
Estos valores se obtienen al resolver las n + 1 ecuaciones lineales que se
presentan, al sustituir las abscisas en el polinomio de aproximación, esto es:
an x0 n + an-1x0 n-1 + … +a2 x0 2 + a1x0 + a0 = f(x0)
an x1 n + an-1x1 n-1 + … +a2 x1 2 + a1x1 + a0 = f(x1)
…………………………………………………………
an xn n + an-1xn n-1 + … +a2 xn 2 + a1xn + a0 = f(xn)
(4.3.2)
Las ecuaciones anteriores, pueden ser resueltas por algún método conocido,
pero el más eficiente, aunque laborioso, es la regla de Cramer. Conlleva una
gran cantidad de operaciones que hacen gravoso el poder determinar estos
valores.
En las siguientes aproximaciones, podemos formar el polinomio de
colocación para el caso de dos y tres ordenadas.
P(x)= a0 +a1x+a2 x2
(4.3.8)
Si sustituimos los puntos dados, se presenta el siguiente sistema de
ecuaciones lineales:
79
a0 + a1 x0 + a2 x02 = f(x0)
a0 + a1 x1 + a2 x12 = f(x1)
a0 + a1 x2 + a2 x22 = f(x2)
(4.3.9)
cuya solución por el método de Cramer
Li ( x) 
( x  x0 )( x  x1 )
( xi  x0 )( xi  x1 )
( x  xk 1 )( x  xk 1 ) ( x  xn )
( xi  xk 1 )( xi  xk 1 ) ( xi  xn )
(4.3.11)
el polinomio de colocación puede escribirse:
n
P( x)   Li ( x) f ( xi )
(4.3.12)
i 0
expresión mas compacta de los multiplicadores de Lagrange.
La expresión 4.3.11 para encontrar Li(x), es la más útil en consideraciones
de cálculos reales de la función multiplicadora de Lagrange, mientras que la
expresión 4.3.16 es útil, solo en consideraciones teóricas.
Ejemplo 4.3.1
Encontrar el polinomio de colocación para el siguiente conjunto de parejas
ordenadas.
x
y
0
1
1
1
2
2
4
5
Solución:
 x - 1 x - 2  (x - 4)
 0 - 1 0 - 2  (0 - 4)
 x - 0  x - 1 (x - 4)
L2 =
 2 - 0  2 - 1 (2 - 4)
L0 =
de donde:
80
 x - 0  x - 2  (x - 4)
1 - 0 1 - 2  (1 - 4)
 x - 0  x - 1 (x - 2)
L3 =
 4 - 0  4 - 1 (4 - 2)
L1 =
(1)
(1)
(x - 1)(x - 2)(x - 4)+
(x)(x - 2)(x - 4)
(-8)
(3)
(2)
(5)
+
(x)(x - 1)(x - 4)+
(x)(x - 1)(x - 2)
(-4)
24
P(x) =
simplificando obtenemos el siguiente polinomio de grado tres:
P(x)= -
1 3 3 2 2
x + x - x +1
12
4
3
Ejemplo 4.3.2
Encontrar el polinomio de colocación para el siguiente conjunto de parejas
ordenadas.
x
y
1.1
0.11
1.3
0.21
Solución:
 x - 1.3 x - 1.7  (x - 1.9)
1.1- 1.31.1- 1.7  (1.1- 1.9)
 x - 1.1 x - 1.3  (x - 1.9)
L2 =
1.7 - 1.11.7 - 1.3  (1.7 - 1.9)
L0 =
1.7
0.42
1.9
0.51
 x - 1.1 x - 1.7 (x - 1.9)
1.3 - 1.11.3 - 1.7 (1.3 - 1.9)
 x - 1.1 x - 1.3 (x - 1.7)
L3 =
1.9 - 1.11.9 - 1.3 (1.9 - 1.7)
L1 =
de donde:
P(x)=
+
 0.11
 - 12 125 
 0.42 
 - 6 125 
 x - 1.3  x - 1.7  (x - 1.9)+
 x - 1.1 x - 1.3  (x - 1.9)+
0.21
6 125 
0.51
12 125 
 x - 1.1 x - 1.7 (x - 1.9)
 x - 1.1 x - 1.3  (x - 1.7)
simplificando obtenemos el siguiente polinomio de grado tres:
P(x) = -
5 3
43 2 359
121
x +
x x+
24
48
480
960
el cual ajusta completamente cada uno de los valores.
81
4.4 Regresión de Mínimos Cuadrados
En innumerables experimentos encontramos relaciones entre dos o más
variables las cuales es posible describirlas mediante funciones,
polinomiales, como en las secciones 4.2 y 4.3 ajustables a un pequeño
número de datos, ya sea igual o desigualmente espaciados, según el método.
En esta sección consideraremos el problema de "ajustar" una función a un
número grande de datos que contienen virtualmente un cierto grado de error.
El ajustar un polinomio o interpolar datos resulta inapropiado, cuando
buscamos una función que en cierto sentido ajuste a nuestros datos, ya que
si deseamos encontrar un valor intermedio, quizá no concuerde con un valor
real que hayamos tomado. Para esto trataremos de suavizar la incertidumbre
en los datos y a la ves que prevalezcan las características de estos. En el
método de mínimos cuadrados, se desea minimizar la suma de los cuadrados
de las diferencias entre los datos y la función para aproximarlos, con ciertos
criterios al ajustarlos.
En cada caso debemos encontrar una función que aproxime el
comportamiento de los datos o bien, si conocemos las relaciones que existen
entre las variables, encontrar la ecuación que las relacione mediante el
método de mínimos cuadrados.
Supongamos que al desarrollar cierto experimento, hemos obtenido un
conjunto de datos (x0, y0), (x1, y1),…,(xn, yn), que al realizar los diagramas de
dispersión, nos “sugieren” cierto comportamiento con el que podemos
82
proponer una función que se adecue a ellos, escribiendo su estimación ye,
con funciones como las que se muestra en la tabla 4.3:
Lineal
Cuadrática
Cúbica
Polinomial
Exponencial
ye = a0 + a1 x
ye = a0 + a1 x + a2 x2
ye = a0 + a1 x + a2 x2+ a3 x3
ye = a0 + a1 x + a2 x2+ a3 x3+…+anxn
ye  ab x
Geométrica
ye  axb
Gompertz
Hiperbólica
ye  pqb
x
1
 a0  a1 x
ye
Tabla 4.3
Recta de Mínimos Cuadrados
El modelo más sencillo de aproximación, para el conjunto de datos (x0, y0),
(x1, y1),…,(xn, yn), es el modelo Lineal o línea recta que representaremos de
la siguiente manera:
ye = a0 + a1 x + d
(4.4.1)
donde a0 es la ordenada al origen, a1 la pendiente y d es el error entre el
los datos observados y el modelo.
El problema consiste es determinar los valores a0 y a1 de manera que la
recta que obtengamos sea lo más próxima a los datos y que las distancias del
valor real a la recta de ajuste sea en general lo más pequeña posible, como lo
muestra la grafica 4.1.
83
f(xi)
di
yi
xi
Graf. 4.1
La medida de la desviación del conjunto de valores calculados{f(x0),
f(x1),…,f(xn)} y de los datos {y0, y1,…,yn} medidos, es el promedio de las
desviaciones cuadráticas:
d02= (f(x0) – y0 )2, d12= (f(x1) – y1)2,…, dn2= (f(xn) – yn)2
el cual estará dado por:
n
n
M d   di2    yi  a0  a1 xi 
i 0
2
(4.4.2)
i 0
para determinar los valores a0 y a1 , derivamos la ecuación 4.4.2 respecto a
cada uno de los coeficientes:
84
n
M d
 2  yi  a0  a1 xi 
a0
i 0
(4.4.3)
n
M d
 2  yi  a0  a1 xi   xi
a1
i 0
(4.4.4)
Como M(a0 , a1 ) ≥ 0, obtendremos la mejor aproximaron
cuando
M(a0 , a1 ) sea mínimo, siendo necesario igualar las parciales a cero para
encontrar los valores que hacen mínima la función, de esto obtenemos:
n
n
n
i 0
i 0
 yi  a0  a1 xi  0
i 0
n
n
n
i 0
i 0
i 0
 yi xi  a0 xi  a1 xi2  0
n
dado que:
a
i 1
0
 na0
(4.4.5)
podemos escribir las ecuaciones 4.4.5 como un
conjunto de dos ecuaciones lineales con dos incógnitas de esta manera:
n
 n 
na0    xi  a1   yi
i 0
 i 0 
n
 n 
 n 2
x
a

x
a

  i  0   i  1  yi xi
i 0
 i 0 
 i 0 
(4.4.6)
A las ecuaciones 4.4.6 se les da el nombre de ecuaciones normales, que al
resolver, por algún método de solución, nos arroja:
 n  n 2   n  n

  yi   xi     xi   xi yi 

a0   i0  i0   i0 2i0
n
n

 

n   xi2     xi 
 i 0   i 0 
 n
  n  n 
n   xi yi     xi   yi 
  i 0  i 0 
a1   i 0
2
n

 n 
2
n   xi     xi 
 i 0   i 0 
Una manera sencilla de obtener las ecuaciones normales apartir del modelo
lineal, ye = a0 + a1 x , es aplicar sumatoria en ambos lados de esta, así
obtenemos la primer ecuación normal, luego multiplicamos por x a la
ecuación modelo y nuevamente aplicamos sumatorias, con esto obtenemos
el sistema 4.4.5, del cual se desprende la solución obtenida de a0 y a1 .
85
Por lo regular x siempre es la variable independiente. De no ser así, esto es,
de que x sea la variable dependiente, escribiremos x = b0 + b1 y , los
resultados anteriores son validos, pero intercambiando x e y, esto es:
 n  n 2   n  n

  xi   yi     yi   yi xi 

b0   i0  i0   i0  2i0
 n   n 
n   yi2     yi 
 i 0   i 0 
 n
  n  n 
n   yi xi     yi   xi 
  i 0  i 0 
b1   i 0
2
 n 2  n 
n   yi     yi 
 i 0   i 0 
Ejemplo 4.4.1
Ajuste el siguiente conjunto de datos a una recta de mínimos cuadrados.
x
y
1.3
15.1
1.4
16.2
1.7
15.9
1.8
18.4
1.9
17.5
2.1
20.1
Solución:
Para encontrar la recta de mínimos cuadrados efectuaremos las operaciones
necesarias en la tabla 4.4.
∑
x
1.3
1.4
1.7
1.8
1.9
2.1
10.2
y
15.1
16.2
15.9
18.4
17.5
20.1
103.2
x2
1.69
1.96
2.89
3.24
3.61
4.41
17.8
xy
y2
19.63 228.01
22.68 262.44
27.03 252.81
33.12 338.56
33.25 306.25
42.21 404.01
177.92 1792.08
Tabla 4.4
Sustituyendo en las ecuaciones normales 4.4.6 obtenemos:
6 a0 + 10.2 a1 = 103.2
10.2 a0 + 17.8 a1 = 177.92
cuya solución es:
a0 = 8.034782609
a1 = 5.391304348
86
ye
15.0435
15.5826
17.2000
17.7391
18.2783
19.3565
de donde la recta de mejor ajuste será:
ye = 8.034782609 + 5.391304348 x
Parábola de Mínimos Cuadrados
Si al efectuar la distribución de los datos gráficamente observamos que estos
tienen un comportamiento cuadrático, el modelo a ajustar será la ecuación
ye = a0 + a1 x + a2 x2 + d
(4.4.7)
Ahora el problema consiste es determinar los valores a0 , a1 y a2 de
manera que la parábola que obtengamos sea la de mejor ajuste en general.
para determinar los valores a0, a1 y a2 , resolveremos:
n
 n 
 n 2
na0    xi  a1    xi  a2   yi
i 0
 i 0 
 i 0 
n
 n 
 n 2
 n 3
x
a

x
a

x
a

  i  0   i  1   i  2  yi xi
i 0
 i 0 
 i 0 
 i 0 
n
 n 2
 n 3
 n 4
2
  xi  a0    xi  a1    xi  a2   yi xi
i 0
 i 0 
 i 0 
 i 0 
(4.4.8)
que son tres ecuaciones con tres incógnitas, los cuales pueden ser resueltos
por cualquier método conocido.
Ejemplo 4.4.2
Ajuste el siguiente conjunto de datos a una recta de mínimos cuadrados.
x
y
6
8
3.8 3.7
10
4
12 14
3.9 4.3
16
4.2
18 20 22 24
4.2 4.4 4.5 4.5
Solución:
Para encontrar la recta de mínimos cuadrados efectuaremos las operaciones
necesarias en la tabla 4.5.
87
x
y
6
3.8
8
3.7
10 4
12 3.9
14 4.3
16 4.2
18 4.2
20 4.4
22 4.5
24 4.5
∑ 150 41.5
x2
36
64
100
144
196
256
324
400
484
526
2580
x3
216
512
1000
1728
2744
4096
5832
8000
10648
13824
48600
x4
1296
4096
10000
20736
38416
65536
104976
160000
234000
331776
971088
xy
22.8
29.6
40
46.8
60.2
67.2
75.6
88
99
108
637.2
x2y
136.8
236.8
400
561.6
842.6
1075.2
1360.8
1760
2178
2592
11144
y2
14.44
13.69
16
15.21
18.49
17.64
17.64
19.36
20.25
20.25
172.97
ye
3.7263
3.8306
3.9311
4.0277
4.1206
4.2097
4.2950
4.3765
4.4542
4.5282
Tabla 4.5
Sustituyendo en las ecuaciones normales 4.4.10 obtenemos:
10 a0 + 150 a1 + 2580 a2 = 41.5
150 a0 + 2580 a1 + 48600 a2 = 637.2
2580 a0 + 48600 a1 + 971088 a2 = 11144
cuya solución es:
a0 = 3.390909091
a1 = 0.05875
a2 = -0.0004734848
de donde la parábola de mejor ajuste será:
ye = 3.390909091+ 0.05875x – 0.0004734848x2
Si se ajustan los datos a la ecuación ye = a0 + a1 x +a2 x2 + a3 x3+ d las
ecuaciones normales que se deben resolver para obtener los coeficientes a0,
a1, a2, a3, son:
88
n
 n

 n

 n

na0    xi  a1    xi2  a2    xi3  a3   yi
i 0
 i 0 
 i 0 
 i 0 
n
 n

 n 2
 n 3
 n 4
x
a

x
a

x
a

x
a

yi xi





i
0
i
1
i
2
i
3








i 0
 i 0 
 i 0 
 i 0 
 i 0 
n
 n 2
 n 3
 n 4
 n 5
2
x
a

x
a

x
a

x
a

  i  0   i  1   i  2   i  3  yi xi
i 0
 i 0 
 i 0 
 i 0 
 i 0 
n
 n 3
 n 5
 n 6
 n 7
x
a

x
a

x
a

x
a

yi xi3 (4.4.11)





i  0
i  1
i  2
i  3




i 0
 i 0 
 i 0 
 i 0 
 i 0 
Regresión exponencial
Si deseamos encontrar una aproximación ya sea por conocimiento del
experimento o por el comportamiento de los datos, del tipo:
ye = cbx
(4.4.12)
podemos transformar 4.4.12, aplicando logaritmos base 10, a cada extremo
de la ecuación, así mismo utilizando propiedades le los logaritmos como:
Log(AB) = Log(A) + Log(B)
obtenemos:
Log(AM ) = MLog(A)
Log ye = Log (cbx)=Log c + x Log b
(4.4.13)
Si hacemos a0 =Log c, a1 = Log b y y = Log ye , la ecuación 4.4.13 se
puede expresar como una ecuación lineal del tipo 4.4.1 en donde las
ecuaciones normales estarán dadas por 4.4.6, de esta manera para encontrar
los valores de c y b podemos obtenerlos utilizando antilogaritmo base 10,
esto es:
c = 10 a0
y b = 10 a1
Entre algunos experimentos donde se puede establecer una relación
exponencial se encuentran, explosión demográfica, desintegración atómica,
comportamiento de voltajes, vibraciones, temperatura, presión, crecimiento
de bacterias, etc. etc. .
89
Regresión Hiperbólica
En el caso de obtener datos con comportamientos asintóticos, del tipo
hiperbólico como: ye  1/(a0  a1 x)
ó 1/ ye  a0  a1 x , las ecuaciones
normales que tendrán que resolverse para encontrar los coeficientes a0 y a1
son:
n
1
 n 
na0    xi  a1  
i 0 yi
 i 0 
n
xi
 n 
 n 2
x
a

x
a

 i  0  i  1  y
i 0 i
 i 0 
 i 0 
Una vez que ya hemos encontrado la ecuación estimada ye ,es importante
hablar del error en esta estimación, lo que denominamos en la sección 1.3
error típico.
Si ye (y estimada o aproximada) es el valor de y para los valores dados de
x, la medida de su dispersión o error típico, lo estableceremos como:
n
ey ,x 
 y  y 
2
e
i 0
(4.4.14)
n
la cual puede escribirse como:
ey2, x 
n
n
n
i 0
i 0
i 0
 y 2  a0  y  a1  xy
(4.4.15)
n
que podemos utilizar de acuerdo con las tablas de operaciones que hemos
descrito anteriormente facilitándonos el cálculo el error.
En estadística es importante encontrar una buena relación entre las
variables, de esta manera se puede decir que el modelo que se propone
explica el experimento en buena medida. Para esto es necesario encontrar la
media de y y definir la variación total como:
90
n
 y  y 
2
(4.4.16)
i 0
donde y es la media de y.
Esta ultima expresión, al manipularse algebraicamente, proporciona
información sobre el modelo.
Así podemos escribir que:
variación total = variación explicada + variación no explicada
El coeficiente de determinación se define como la razón entre la variación
explicada y la variación total, conocido también en estadística como
coeficiente de correlación, dado por:
n
r2 =
variación explicada

variación total
 y
i 0
n
e
 y
 y  y 
2
(4.4.19)
2
i 0
En esta ultima relación observamos que si el cociente es cero, toda la
variación es no explicada o bien la variación explicada es cero.
Si la variación no explicada es cero, podemos explicar mediante el modelo,
el experimento en su totalidad y el cociente es igual a 1. En cualesquier otro
caso dicho coeficiente estará en el intervalo de (0, 1).
En el caso de querer encontrar la correlación lineal podemos utilizar la
siguiente fórmula:
r
n
 n  n 
n xy    x   y 
i 0
 i0  i0 
(4.4.20)
  n 2   n 2    n 2   n 2 
n   x     x   n   y     y  
  i0   i0     i0   i0  
91
En caso de querer obtener la correlación de otro modelo se acudirá a la
fórmula 4.4.19.
El valor r mide el grado de relación entre las variables y el modelo que
adoptamos. Por lo regular su variación esta en el intervalo de (-1, 1), siendo
utilizado el signo + o – , como correlación positivas o negativas
respectivamente. Si el valor de r es cero o próximo a cero, significa que no
existe correlación alguna entre las variables. Un coeficiente de correlación
cercano al ± 1 no indica una dependencia directa entre las variables, ya que
el experimento puede carecer de sentido.
Ejemplo 4.4.3
Encuentre el coeficiente de correlación para el ejercicios 4.4.1 utilizando la
fórmula 4.4.20
Solución:
Para encontrar el coeficiente de correlación del ejercicio 4.4.1 utilizaremos
la información de la tabla 4.4
∑
x
10.2
y
103.2
x2
17.8
xy
177.92
y2
1792.08
Sustituyendo estos valores en la ecuación 4.4.20 obtenemos
r=
6(177.92) - 10.2 103.2 
6  17.8  -  10.2 2  6 1792.08  - 103.2 2 



= 0.885804
el experimento puede ser explicado por el modelo en un 88.6 %.
Ejemplo 4.4.4
Encuentre el coeficiente de correlación para el ejercicios 4.4.2 utilizando la
fórmula 4.4.19
Solución:
En este caso utilizaremos parte de la tabla 4.5 agregado las columnas
( ye  y ) 2 y ( y  y )2 , como muestra la tabla 4.6, para esto primero
calcularemos la media de y :
92
y
x
y
6
3.8
8
3.7
10 4
12 3.9
14 4.3
16 4.2
18 4.2
20 4.4
22 4.5
24 4.5
∑ 150 41.5
 y  41.5 = 4.15
n
10
( ye  y ) 2
ye
3.7263
3.8306
3.9311
4.0277
4.1206
4.2097
4.2950
4.3765
4.4542
4.5282
0.1794
0.1020
0.0479
0.0140
0.0009
0.0036
0.0210
0.0513
0.0925
0.1430
0.6566
( y  y )2
0.1225
0.2025
0.0225
0.0625
0.0225
0.0025
0.0025
0.0625
0.1225
0.1225
0.7450
Tabla 4.6
r
2
( y  y)

( y  y)
2
e
2

0.6566
= 0.88134
0.745
de donde r = 0.9388. Con esto, podemos decir que, el experimento, al cual
correspondan estos valores, puede explicarse por el modelo en un 93.88%.
93
4.5 Aplicaciones
El problema de ajuste a una ecuación con un conjunto de puntos por el
momento tiene dos interpretaciones de aproximación. La primera fue buscar
la ecuación de una curva que pasó exactamente por cada uno de los puntos
del conjunto de datos, generando así una ecuación polinomial ya fuese con
datos igualmente espaciados o no, como fueron los métodos de Newton y
Lagrange. La otra es la Regresión Lineal, en donde aplicamos ecuaciones,
llamadas normales, que quizá no son tan rígidas, donde solo buscamos
curvas que dependen del comportamiento de los datos o de la experiencia,
con ecuaciones que relacionen fenómenos con un número reducido de
parámetros, de tal suerte que, sin pasar exactamente por cada punto dado,
nos aproximemos lo más posible a ellos.
El segundo método es el más utilizado para aplicaciones en pronósticos o
predicciones numéricas, ya que es un modelo estadístico que involucra un
error minimizado, partiendo de un conjunto de datos observados.
Ejemplo 4.5.1
La tabla 4.7 muestra la cuenta de un inversionista el cual al cabo de 6 años
duplico su capital inicial.
t(años)
P(Capital)
en millones
Tabla 4.7
0
1
2
3
4
5
6
1
1.13
1.26
1.42
1.59
1.78
2
Si se sabe que en la cuenta se compone al interés continuamente, ajuste
estos datos a este tipo de ecuación.
Solución:
Sea P = cantidad depositada, t = número de años, A = balance al final de
esos años, i = tasa de interés anual, la fórmula correspondiente para el
balance A, utilizando interés compuesto estará dada por la función de
crecimiento exponencial:
A = P e it
94
Pero dado que P = 1 millón de pesos, inicialmente, entonces, A = e i t de
donde aplicando logaritmos a ambos miembro de esta ecuación obtenemos:
ó
Ln A = Ln e i t
Generando así la ecuación normal
Ln A = i t
n
n
i 1
i 1
 LnA  i t para obtener despejando i,
n
i
 LnA
i 1
n
t
i 1
el interés. Para esto utilizaremos la tabla 4.8
t(años)
0
1
2
3
4
5
6
∑ 21
A(balance)
1
1.13
1.26
1.42
1.59
1.78
2
10.18
t2
0
1
4
9
16
25
36
91
LnA
0
0.1222176
0.2311117
0.3506569
0.4637340
0.5766134
0.6931472
2.4374808
tLnA
0
0.1222176
0.4622234
1.0519707
1.854936
2.883067
4.1588832
10.5332979
Aest
1
1.12
1.26
1.42
1.59
1.79
2.01
Tabla 4.8
i=
2.4374808
= 0.116070514 = 11.60%
21
de donde, A = e 0.1160705 t.
En la tabla 4.8 se muestran los valores estimados del balance en la última
columna Aest.
95
Ejemplo 4.5.2
Al ser lanzado un objeto desde un punto A, a un punto B en el mismo nivel,
se describió su movimiento casi parabólico, el cual al ser medido mediante
fotografías de video a escala se estableció la siguiente relación, entre
X = distancia horizontal e Y = distancia vertical, ambas en metros(m).
X
Y
0
1.2
4
2.1
8
3.2
12
4.3
16
5.6
20
5.5
24
4.2
28
3.1
32
2.2
36
1.1
Ajuste estos datos a una ecuación cuadrática.
Solución:
La tabla 4.9 muestra los valores necesarios para ser sustituidos en las
ecuaciones normales del modelo cuadrático.
x
0
4
8
12
16
20
24
28
32
36
∑ 180
y
1.2
2.1
3.2
4.3
5.6
5.5
4.2
3.1
2.2
1.1
32.5
x2
x3
x4
xy
x2y
0
16
64
144
256
400
576
784
1024
1296
4560
0
64
512
1728
4096
8000
13824
21952
32768
46656
129600
0
256
4096
20736
65536
160000
331776
614656
1048576
1679616
3925248
0
8.4
25.6
51.6
89.6
110
100.8
86.8
70.4
39.6
582.8
0
33.6
204.8
619.2
1433.6
2200
2419.2
2430.4
2252.8
1425.6
13019.2
yest
0.8
2.5
3.7
4.5
4.9
4.9
4.5
3.6
2.4
0.8
Tabla 4.9
Sustituyendo en las ecuaciones normales 4.4.10 obtenemos:
10 a0 +
180 a1 +
4560 a2 = 32.5
180 a0 + 4560 a1 + 129600 a2 = 582.8
4560 a0 + 129600 a1 + 3925248 a2 = 13019.2
cuya solución es: a0 = 0.834545454, a1 = 0.4568560, a2 = – 0.012736742
de donde la parábola de mejor ajuste será:
yest = 0.834545454+ 0.456856606x – 0.012736742x2
96
Ejemplo 4.5.3
Personal del departamento de Epidemiología analizo una muestra del
crecimiento de cierto mosquito, en una laguna cercana al área metropolitana
registrando los siguientes datos:
t(días)
1 2 3
4
P(población) 52 93 203 312
Si se sabe que el crecimiento aumenta de acuerdo con la ley de crecimiento
exponencial, ajuste estos datos a la ecuación P = C ekt.
Solución:
Dada la ecuación P = C ekt , efectuaremos una transformación utilizando
logaritmos como se menciono en la sección 4.4, para obtener:
LnP  LnC  kt
de la cual podemos obtener las siguientes ecuaciones normales:
n
 n 
nLnC    t  k   LnP
i 0
 i 0 
 n 
 n 2
 n

t
LnC

t
k

 
 
  tLnP 
 i 0 
 i 0 
 i 0

Enseguida se muestra en la tabla 4.10 las operaciones necesarias para
obtener las ecuaciones normales para poder resolverlas.
t
1
2
3
4
∑ 10
P
52
93
203
312
660
t2
1
4
9
16
30
LnP
3.951243719
4.532599493
5.313205979
5.743003188
19.54005238
tLnP
3.951243719
9.065198986
15.939661794
22.97201275
51.9280734
Pest
53
98
180
334
Tabla 4.10
De donde obtenemos las siguientes ecuaciones:
4 LnC  10k  19.54005238
10 LnC  30k  51.9280734
97
al
resolver,
mediante
algún
método
LnC = 3.34604187 de donde C = 28.3901391
ecuación exponencial estará dada por:
conocido,
obtenemos
y k = 0.61558849. La
Pest = 28.39 e0.6155t
Ejemplo 4.5.4
La temperatura de cierto alimento, en las primeras cuatro horas de ser
sometido a enfriamiento se muestra enseguida:
t(horas) 1 2 3 4
T(0C)
23 14 10 8
Si se sabe que la temperatura disminuye asintóticamente hasta llegar a la
temperatura del medio ambiente que conserva el enfriador. Ajuste estos
datos a una ecuación del tipo Hiperbólico y  1/(a0  a1 x) .
Solución:
Las ecuaciones normales para encontrar los coeficientes a0 y a1 son:
n
1
 n 
na0    ti  a1  
i 0 Ti
 i 0 
n
ti
 n 
 n 2
t
a

t
a

 i  0  i  1 T
i 0 i
 i 0 
 i 0 
y
para obtener el sistema de ecuaciones lineales generamos la tabla 4.11:
t
1
2
3
4
∑ 10
T
23
14
10
8
55
t2
1
4
9
16
30
1/T
0.04347826
0.071428571
0.1
0.125
0.339906831
t/T
0.04347826
0.142857142
0.3
0.5
0.986335402
Test
22.7
14.02
10.13
7.94
Tabla 4.11
Obteniendo así el siguiente conjunto de ecuaciones lineales:
4a0 + 10a1 = 0.339906831
98
10a0 + 30a1 = 0.986335402
que al resolver, mediante algún método conocido, se obtiene
a0=0.016692545
y a1 = 0.027313664 con los cuales se obtiene la
ecuación pedida: y  1/(0.0166925  0.0273136 x) .
PROBLEMAS CAPÍTULO IV
1.- A partir de la expansión en series de Taylor, encuentre una expresión
para cada una de las siguientes funciones:
a)
sen x 2
d)
b)
cos
x
e)
c)
e x - e -x
2
f)
e x + e -x
2
x
e - e -x
x
1 - cosx
x2
2.- Si yn  yn1  yn , encuentre esta diferencia para cada una de las
siguientes funciones:
a) yn = c , c = constante
c) yn = n(n-1)(n-2)(n-3)
b) yn = n(n-1)
d) yn = n(n-1)(n-2)(n-3)…(n – k+1)
c) yn = n(n-1)(n-2)
3.- En cada caso construya el polinomio de Newton, utilizando la tabla de
diferencias finitas, para los datos que se presentan.
a)
b)
x -2 -1 0 1 2
y
4
6
9 3 8
x 0
2
4 6
8
y 1 -1 1 1 -1
c)
d)
x
0
1.5
3
3.5
4
y 1.6 3.7 7.9 11.8 16.7
x
0
3
6
9
y 1.01 2.17 3.45 4.63
99
4.- Construya un polinomio, utilizando la fórmula de Lagrange, en cada uno
de los siguientes conjuntos de datos:
x 0 1 3
a)
y 1 1 5
x
c)
0
2
x 0 1 3 4
b)
3
5
y 1 5 4 6
x 0
d)
y -1 1 -1 1
1
4
y 0 16
5
88 620
5.- Para el siguiente conjunto de datos encuentre una aproximación lineal,
por el método de mínimos cuadrados.
a) x
0
1
2
3
b) x 63 67 68 70 72 67 68
4
y 65 68 67 71 68 69 70
y 3.94 4.06 5.42 9.89 11.43
6.- Encuentre un ajuste de mínimos cuadrados cuadrático para el siguiente
conjunto de datos.
x 10 20 30
40
50
60
70
y 15 60 90 140 200 280 400
7.- El número de bacterias que se desarrollan en un cultivo por unidad de
volumen en t horas, se muestra enseguida:
t(hrs.)
0
1
2
3
4
5
y
bacterias por
40 52 70 110 150 215
unidad de volumen
Ajuste estos datos a:
a) Una curva de mínimos cuadrados de la forma y = ex
b) Una curva de mínimos cuadrados de la forma y = abx
c) Cual de las dos ecuaciones arroja mejores resultados de aproximación.
d) Estime el número de bacterias para, t = 6, t = 7.
100
Capítulo 5
Diferenciación e
Integración numérica
En el estudio del Cálculo, se encuentran dos de los procesos al límite
fundamentales, la derivada e integral de funciones, definidas dentro de un
intervalo I(a,b). Es ahí donde aprendimos diferentes reglas para derivar e
integrar, siempre que pudiesen expresarse en términos de funciones
elementales.
Lamentablemente, en la práctica al incrementar o decremantar una de las
variables, se desarrollan cálculos en donde las definiciones originales son de
gran utilidad, ya que no existe manera de encontrar la derivada o la integral
mediante técnicas aprendidas en el cálculo.
Dos ejemplos simples son:
a) Al fabricar un disco compacto, su volumen estará dado por
V   (rM  rm )h
donde rM y rm son respectivamente radio mayor y radio menor del disco.
Si se cambia las dos o tres variables en una cantidad pequeña (ya sea que
aumenta o disminuya) el cálculo del volumen, para obtener la cantidad de
material en su fabricación, puede complicarse.
b) Al querer obtener el volumen de un tanque de transportación de líquidos
el cual tiene una gran cantidad de remaches en su fabricación que
disminuyen en el interior el volumen, con técnicas de integración seria
imposible obtenerlo.
Este tipo de problemas es el causante de retomar las definiciones, tanto la
derivada como la integral, que son de gran utilidad para el cálculo de estos
problemas.
101
5.1 Diferenciación numérica
La definición de derivada de una función como un límite lleva implícito un
método de aproximación numérica o infinitesimal, ya que se desarrolla a
partir de:
f '( x) 
f ( x  h)  f ( x )
h
(5.1.1)
el proceso al límite es lo que produce la derivada de una función cuando la
longitud del intervalo o de paso h tiende a ser pequeña.
Podemos hablar de la definición de derivada hacia delante h > 0:
f '( x)  lim
h0
f ( x  h)  f ( x )
h
(5.1.2)
o bien de la definición de derivada hacia atrás h < 0:
f '( x)  lim
h0
f ( x  h)  f ( x )
f ( x )  f ( x  h)
 lim
h0
h
h
(5.1.3)
ambos casos son definiciones útiles para encontrar la derivada de una
función.
Otra expresión para f’(x) podemos obtenerla promediando las derivadas
hacia delante y hacia atrás de la siguiente manera:
f '( x) 
1
f ( x  h)  f ( x )
f ( x )  f ( x  h) 
lim
 lim


h0
2  h0
h
h

de donde:
f '( x)  lim
h0
f ( x  h)  f ( x  h)
2h
de esta manera, podemos derivar una función numéricamente.
102
(5.1.4)
El siguiente ejemplo muestra el comportamiento de las derivadas una ves
que se ha seleccionado un tamaño de paso pequeño no nulo h, para calcular
f’(x).
Ejemplo 5.1.1
Calcular la derivada numérica de f(x) = x2 utilizando 5.1.2, 5.1.3, 5.1.4
Solución:
Utilizando la fórmula 5.1.2:
f ( x  h)  f ( x )
(x + h)2 - x 2
x 2 + 2xh + h 2 - x 2
 lim
 lim
h0
h0
h0
h
h
h
h  2x  h
 lim
 lim  2 x  h   2 x
h0
h0
h
f '( x)  lim
Utilizando la fórmula 5.1.3:
f ( x )  f ( x  h)
x 2 - (x - h)2
x 2 - (x 2 - 2xh+ h 2 )
 lim
 lim
h0
h0
h0
h
h
h
h  2x - h 
 lim
 lim  2x - h  = 2x
h0
h0
h
f '( x)  lim
Utilizando la fórmula 5.1.4:
 x + h  - (x - h)2
f(x + h) - f(x - h)
f '( x)  lim
 lim
=
h 0
h 0
2h
2h
(x 2 + 2xh + h 2 ) - (x 2 - 2xh + h 2 )
4xh
 lim
 lim
 lim  2x  = 2x
h 0
h0 2h
h 0
2h
2
En el caso de que h no sea lo suficientemente pequeño, esto es, que no
tienda a cero, la derivada de f(x) = x2 será f‘(x) = 2x+ h, f‘(x) = 2x – h o
f‘(x) = 2x, que son las derivadas numéricas de f con longitud de paso h.
Puede observarse que en el caso de la derivada promedio el error desaparece
obteniendo así la derivada exacta de f(x) mientras que en las derivadas hacia
adelante o atrás aparece un error proporcional a h.
103
Geométricamente la derivada de f(x) es la pendiente de la recta tangente a la
curva en un punto (c, f(c)) como se muestra en la figura 5.1. Las derivadas
hacia delante y hacia atrás se muestran con la misma pendiente, mientras
que la derivada promedio da una aproximación central de las dos.
Pendiente
f (c  h )  f (c )
h
Pendiente
f’(c)
exacta
Pendiente
f (c  h )  f (c  h )
2h
c+h
c
c-h
Fig. 5.1
El lector puede demostrar cualquier fórmula de derivación numérica del
siguiente listado, siguiendo el procedimiento de los ejercicios anteriores:
Primeras y segundas derivadas hacia atrás:
f '( x) 
f ( x )  f ( x  h)
h
f '( x) 
3f(x) - 4f(x - h)+ f(x - 2h)
2h
f ''( x) 
f(x) - 2f(x - h)+ f(x - 2h)
h2
f ''( x) 
2f(x) - 5f(x - h)+ 4f(x - 2h) - f(x - 3h)
h2
Primeras y segundas derivadas centradas:
f '( x) 
104
f ( x  h)  f ( x  h)
2h
f '( x) 
-f(x + 2h)+ 8f(x + h) - 8f(x - h)+ f(x - 2h)
12h
f ''( x) 
f ''( x) 
f(x + h) - 2f(x)+ f(x - h)
h2
-f(x + 2h)+16f(x + h) - 30f(x)+16f(x - h) - f(x - 2h)
12h 2
Primeras y segundas derivadas hacia delante:
f '( x) 
f '( x) 
f ( x  h)  f ( x )
h
-f(x + 2h)+ 4f(x + h) - 3f(x)
2h
f ''( x) 
f(x + 2h) - 2f(x + h)+ f(x)
h2
-f(x + 3h)+ 4f(x + 2h) - 5f(x + h)+ 2f(x)
h2
Es importante mencionar que la estabilidad, de las derivadas numéricas,
depende del tamaño de h o longitud de paso, tal es el caso del siguiente
ejemplo:
f ''( x) 
Ejemplo 5.1.5
Calcule la derivada de ex con 5.1.1. y con la fórmula simplificada del
ejercicio 5.1.3, en el punto x = 1
Solución:
Si f(x) = ex de 5.1.1 se tiene:
f1'(x) =
 eh - 1 
e x+h - e x
en x = 1 f 1'(1) = e 

h
 h 
De 5.1.3 se tiene:
105
f(x + h) - f(x - h)
eh  e h
f 2 '( x) 
en x  1 f 2 '(1) 
2h
h
para diferentes valores de h, obtenemos la tabla 5.1:
h
 eh  1 
f1 '(1)  e 

 h 
f1’(1) – e = E1
10-1
10-2
10-3
10-4
10-5
10-6
10-7
10-8
2.85884195487
2.7319186558
2.71964142251
2.71841774799
2.71829541987
2.7182831876
2.71828182846
2.71828182846
0.140560126414
0.013636827337
0.001359594052
1.35919520 10-4
1.35914091 10-5
1.35914091 10-6
0
0
eh  e h
h
f2’(1) – e = E2
2.722814564
2.718327132
2.718282263
2.718281828
2.718275169
2.718281828
0.00453273535
0.00004530383
4.3492 10-7
0
6.6598 10-6
0
f 2 '(1) 
Tabla 5.2
Como se puede observar en la tabla 5.2, no solo depende del tamaño de h
sino también del tipo de fórmula utilizada. Diremos que las fórmulas
centradas son las de mejor aproximación a la derivada numérica.
También existen fórmulas de derivación para datos desigualmente
espaciados, o tablas de datos con comportamientos observables del que
deseemos la derivada de estos sin tener la función,.en estos caso acudiremos
a las fórmulas de interpolación de Lagrange .
106
5.2 Integración numérica
En esta sección estudiaremos métodos para el cálculo numérico de
integrales de la forma:
b
I ( f )   f ( x)dx  F ( x) a  F (b)  F (a)
b
a
(5.2.1)
en donde f(x) es una función expresada analíticamente en término de
funciones; polinomiales, trigonométricas, exponenciales, logarítmicas, o
combinaciones de estas. Pero incluso entre este tipo de funciones, llamadas
elementales, existen algunas que no es posible encontrar su antiderivada. Tal
es el caso de:
x
 e dx
2
la cual no tiene antiderivada y no podríamos utilizar el teorema fundamental
del cálculo para evaluarla.
También podemos tener cierta información en forma tabulada y querer
integrarla, para obtener así una respuesta a algún experimento desarrollado.
En cualesquier caso, la integración numérica nos proporcionara un resultado
muy cercano a la solución real.
En el desarrollo del cálculo se habla de aproximaciones del área mediante
rectángulos, los cuales estiman o subestiman el área dependiendo del
crecimiento o decrecimiento de la función. Del promedio de estas
estimaciones o subestimaciones aparece el método conocido como método
de Trapecios o aproximación trapezoidal.
Método del Trapecio
Iniciaremos el análisis de este método dividiendo el intervalo I(a;b) en n
partes iguales construyendo trapecios cuyas alturas son h = (b – a)/n, y las
bases paralelas con longitud f(x0), f(x1),…,f(xn) como muestra la figura 5.2.
107
f(x)
A1
A2
An
…
..
x0 =a
x1
x2
xn-1
xn=b
Fig. 5.2
De esta manera el área de los trapecios A1, A2,…, An, serán respectivamente:
f(x1 )+ f(x0 )
f(x2 )+ f(x1 )
A1 =
h,
A2 =
h,....,
2
2
f(xn-2 )+ f(xn-1 )
f(xn-1 )+ f(xn )
An-1 =
h, An =
h,
2
2
Sumando estas áreas para obtener una aproximación del área total igual a:
n
ATrapecios   Ai
i 0
f(x )+ f(x0 )
f(x )+ f(x1 )
Atrapecios = 1
h+ 2
h+ ...
2
2
f(x )+ f(xn-1 )
f(x )+ f(xn )
+ n-2
h+ n-1
h
2
2
obteniendo la siguiente fórmula simplificada:
h
ATrapecios =  f(x0 )+ 2f(x1 )+ ...+ 2f(xn-1 )+ f(xn ) 
2
(5.2.2)
Método de Simpson
Este es otro método muy útil para resolver integrales, analizado por el
matemático Thomas Simpson (1710-1761) el cual aproximo las áreas con
ecuaciones cuadráticas como muestra la figura 5.3.
108
f(x)
A1
An
…
..
x0 =a
x1
x2
xn-1
xn=b
Fig. 5.3
Utilizaremos el polinomio de colocación cuadrático 4.3.10:
P( x) 
 x  x1  x  x2  f ( x )  ( x  x0 )  x  x2  f ( x )  ( x  x0 )  x  x1  f ( x )
 x0  x1  x0  x2  0  x1  x0  x1  x2  1  x2  x0  x2  x1  2
en los intervalos de x0 a x2 , x2 a x4 ,… ,xn-2 a xn , e integrar directamente:
A1 

  x  x1  x  x2 

( x  x0 )  x  x2 
( x  x0 )  x  x1 
f ( x0 ) 
f ( x1 ) 
f ( x2 )  dx

 x1  x0  x1  x2 
 x2  x0  x2  x1 
  x0  x1  x0  x2 

x2
x0
dado que x0 – x1 = - h y x0 – x2 = - 2 h tenemos:
A1 
1
2h 2

x1
x0


 x  x1  x  x2  f ( x0 )  ( x  x0 )  x  x2  f ( x1 )  ( x  x0 )  x  x1  f ( x2 ) dx



I
II
III

resolviendo primero I y efectuando cambio de variable u = x – x0, tenemos
u – (-x0) = x de donde u – (x1 – x0 )= x – x1 o bien u – h = x – x1, de la
misma forma, podemos obtener u – 2h = x – b, de esta manera:
I 
x2
x0
 x  x1  x  x2  f ( x0 )dx  0  x  h  x  2h  f ( x0 )dx 
2h
2 3
h
3
109
los resultados de II y III se obtienen de manera similar dando los siguientes
resultados:
x2
2
I    x  x0  x  x1  f ( x2 )dx  h 3
x0
3
x2
4
II    x  x0  x  x2  f ( x1 )dx  h 3
x0
3
de donde:
A1 =
 h
1  2h3
4h3
2h3
f(x
)+
f(x
)+
f(x2 ) = (f(x0 )+ 4f(x1 )+ f(x2 ))
0
1
2 
3
3
2h  3
 3
las siguientes áreas estarían dadas por:
h
(f(x2 )+ 2f(x3 )+ f(x4 )) ,
3
h
An-1 = (f(xn-4 )+ 2f(xn-2 )+ f(xn-1 ))
3
A2 
h
A3 = (f(x4 )+ 2f(x5 )+ f(x6 )) ,….
3
h
An = (f(xn-2 )+ 2f(xn-1 )+ f(xn ))
3
de tal manera que al sumar todas las áreas se obtiene la fórmula siguiente:
As 
h
 f(x0 )+ 4f(x1 )+ 2f(x2 )+ 4f(x3 )+ ...+ 2f(xn-2 )+ 4f(xn-1 )+ f(xn ) (5.2.3)
3
conocida como la aproximación o fórmula de Simpson.
Es importante resaltar que en el método del trapecio no importa si el número
de subintervalos es par o no, mientras que en el método de Simpson el
número de subintervalos debe ser par, de tal manera que:
hTrapecio = ( b – a ) / 2n
Ejemplo 5.2.1
Resolver la siguiente integral,

1
x 1 - xdx
0
utilizando el método de Trapecio n = 6 y Simpson 2n=6.
110
Solución:
La longitud de paso en ambos casos es:
ht 
b  a 1 0 1


n
6
6
hs 
b  a 1 0 1


2n
6
6
De esta manera podemos obtener la siguiente tabla:
f ( x)  x 1  x
0
0.37267799624997
0.47140452079103
0.5
0.47140452079103
0.37267799624997
0
n xn
0
1
2
3
4
5
6
∑
0
1/6
1/3
1/2
2/3
5/6
1
Trapecio
Simpson
f(x0)
2f(x1)
2f(x2)
2f(x3)
2f(x4)
2f(x5)
f(x6)
4.37633000681639
f(x0)
4f(x1)
2f(x2)
4f(x3)
2f(x4)
4f(x5)
f(x6)
6.8670420531638
Tabla 5.3
de tal manera que podemos utilizar la tabla 5.3 para encontrar la
aproximación de la integral al sustituir los datos en 5.2.2 y 5.2.3
At =
As =
1/6
(4.3763300681639) = 0.364694172347
2
1/6
(6.8670420531638) = 0.38150233628688
3
La solución exacta de la integral es:

1
0
x 1 - xdx =

1
(2x - 1) x 1 - x + sen -1 x
4

1
= 0.392699081699
0
de esta manera podemos establecer que el error en la aproximación por el
método de trapecios y el método de Simpson es el siguiente:
Et = 0.02800490935172
Es = 0.01119674541183
Et % = 7.1313916066668
Es % = 2.8512278061348
Esto demuestra que el método de Simpson es más aproximado a la solución
real de la integral.
111
La tabla 5.4 muestra áreas para diferente número de iteraciones del Ej. 5.2.1:
Trapecio
Simpson
n =10
∑ =7.592622072209
At =0.37963110361045
E =0.01306797808827
E%=3.3277332943436
n =20
∑ =15.522591631241
At =0.38806479078103
E =0.00463429091769
E%=1.180112491642
n =50
∑ =39.152453886286
At =0.39152453886286
E =0.00117454283586
E%=0.29909487712047
n =100
∑ =78.456712777462
At =0.39228356388731
E =0.00041551781141
E%=0.10581074180581
n =200
∑ =157.02085158899
At =0.39255212897248
E =0.0001469527262
E%=0.037421204451082
n =10
∑ =11.625652350191
As =0.38752174500636
E =0.00517733669236
E%=1.3183979626242
n =20
∑ =23.452561190274
As =0.39087601983791
E =0.00182306186081
E%=0.46423889073636
n =50
∑ =58.835856281057
As =0.39223904187372
E =0.000460039825
E%=0.11714817946861
n =100
∑ =117.76097166862
As =0.39253657222873
E =0.00016250946999
E%=0.041382696717044
n =200
∑ =235.58499040047
As =0.39264165066746
E =0.00005743103126
E%=0.014624692019031
Tabla 5.4
Ejemplo 5.2.2
Resolver la siguiente integral,

 / 4 senx
0
cosx
dx
utilizando el método de Trapecio n = 6 y Simpson 2n=6.
112
Solución:
La longitud de paso en ambos casos es:
ht 
b  a  / 4   0 


n
6
24
hs 
b  a  / 4   0 


2n
6
24
De esta manera podemos obtener la siguiente tabla:
n xn
0
1
2
3
4
5
6
∑
0
π/24
π/12
π/8
π/6
5π/24
π/4
f ( x)  senx / cos x
Trapecio
Simpson
0
0.36440159412298
0.52668910799832
0.66958310101733
0.81649658092775
0.9834604724508
1.1892071150028
f(x0)
2f(x1)
2f(x2)
2f(x3)
2f(x4)
2f(x5)
f(x6)
7.9104688280372
f(x0)
4f(x1)
2f(x2)
4f(x3)
2f(x4)
4f(x5)
f(x6)
11.94535916322
Tabla 5.5
de tal manera que podemos utilizar la tabla 5.5 para encontrar la
aproximación de la integral al sustituir los datos en 5.2.2 y 5.2.3

At =
24 (7.9104688280372) = 0.51773897409612
2

As =
24 (11.94535916322) = 0.52121461932868
3
La solución exacta de la integral es:

1
0
senx
1 
dx =  ln 
cos x
2  
 /4

senx + 1 
-1
senx 
 - 2tan


senx - 1 
0
= 0.392699081699
de esta manera podemos establecer que el error en la aproximación por el
método de trapecios y el método de Simpson es el siguiente:
Et = 0.00730208520183
Es = 0.00382643996927
Et % = 1.3907646025996
Es % = 0.72878871118889
Lo cual demuestra por segunda ocasión que el método de Simpson es más
aproximado a la solución real de la integral.
113
La tabla 5.6 muestra áreas para diferente número de iteraciones del Ej.5.2.2:
Trapecio
Simpson
n =10
∑ =13.27688092198
At =0.52138189458849
E =0.00365916470946
E%=0.69692924861015
n =20
∑ =26.669403866861
At =0.52365252039846
E =0.00138853889949
E%=0.26446291673772
n =50
∑ =66.802864629131
At =0.52466847189408
E =0.00037258740387
E%=0.070963479383536
n =100
∑ =133.66609600687
At =0.52490553156152
E =0.0001355277364
E%=0.025812788167695
n =200
∑ =267.37632855409
At =0.52499219345586
E =0.00004886584209
E%=0.0093070515580896
n =10
∑ =19.986920937988
As =0.52325636655553
E =0.00178469274242
E%=0.33991489061948
n =20
∑ =40.061926811741
As =0.52440939566843
E =0.00063166362952
E%=0.12030747278406
n =50
∑ =100.24493120871
As =0.52488123240816
E =0.00015982688979
E%=0.030440836380246
n =100
∑ =200.52932738459
As =0.52498455145061
E =0.00005650784734
E%=0.010762557773207
n =200
∑ =401.08656110135
As =0.52502108075402
E =0.00001997854393
E%=0.0038051393459997
Tabla 5.6
Método de Simpson 3/8
Utilizando un polinomio de colocación de Lagrange de tercer grado, como:
( x  x0 )  x  x2  x  x3 
 x  x1  x  x2  ( x  x3 )
f ( x0 ) 
f (x )
 x0  x1  x0  x2  x0  x3 
 x1  x0  x1  x2  x1  x3  1
( x  x0 )  x  x1  x  x3 
( x  x0 )  x  x1  x  x2 

f ( x2 ) 
f (x )
 x2  x0  x2  x1  x2  x3 
 x3  x0  x3  x1  x3  x2  3
P( x) 
114
podemos encontrar una fórmula para integración conocida como Integración
de Simpson 3/8. Las áreas que obtendríamos en las diferentes subdivisiones
son:
h
A1 = (f(x0 )+ 3f(x1 )+ 3f(x2 )+ f(x3 )
8
h
A2 = (f(x3 )+ 3f(x4 )+ 3f(x5 )+ f(x6 )
8
…..
h
h
An = (f(xn-3 )+ 3f(xn-2 )+ 3f(xn-1 )+ f(xn )
An-1 = (f(xn-6 )+3f(xn-5 )+3f(xn-4 )+ f(xn-3 )
8
8
de donde sumando para obtener el área total se tiene:
As3/8 =
h  f(x0 )+ 3f(x1 )+ 3f(x2 )+ 2f(x3 )+ 3f(x4 )+ 3f(x5 )+ 2f(x6

8  .....+ 2f(xn-3 )+ 3f(xn-2 )+ 3f(xn-1 )+ f(xn )
)


o bien:
As 3 / 8 
n2
n 3

(b  a) 
 f ( x0 )  3  f ( xn )  2  f ( xn )  f ( xn )  (5.2.4)
8n 
n 1,2,4,5
n 3,6

El nombre de 3/8, se debe a que, para encontrar el área debemos particionar
los subintervalos en tres y el área obtenida deberá multiplicarse por 1/8.
Los métodos de Simpson 1/3 y Simpson 3/8, deberán utilizarse siempre que
el número de subintervalos se seleccione apropiadamente, de no ser así
podríamos utilizar alternativas como aplicar Trapecio y Simpson a la vez, en
un intervalo, si es que este tiene un número impar de subintervalos..
Ejemplo 5.2.3
Resolver la siguiente integral del ejemplo 5.2.2 mediante la regla de
Simpson 3/8, para n = 2 y n =3
Solución:
Para n = 2, se formaran los intervalos [ 0 , π/8 ] y [ π/8 , π/4 ] de tal manera
que al partirse en tres estos, obtenemos la siguiente tabla:
115
n xn
0
1
2
3
4
5
6
∑
0
π/24
π/12
π/8
π/6
5π/24
π/4
f ( x)  senx / cos x
Simpson
0
0.36440159412298
0.52668910799832
0.66958310101733
0.81649658092775
0.9834604724508
1.1892071150028
f(x0)
3f(x1)
3f(x2)
2f(x3)
3f(x4)
3f(x5)
f(x6)
10.601516583537
Tabla 5.7
para encontrar la aproximación de la integral al sustituir los datos de la tabla
b - a  /4  - 0 
=
=
5.7 en 5.2.4., con hs3/8 =
para obtener
n
2
8

As3 / 8 =
4 (10.601516583537) = 0.520400728371
8(2)
Para n = 3, se forman los intervalos [ 0 , π/12 ], [ π/12 , π/6 ] y [ π/6 , π/4 ],
cada uno de los cuales se dividirá en tres para efectuar la operación:

As3/ 8 =

4  f (0)  3 f ( / 36)  3 f ( /18)  2 f ( /12)  3 f ( / 9)

8(3)   3 f (5 / 36)  2 f ( / 6)  3 f (7 / 36)  3 f (2 / 9)  f ( / 4) 
obteniendo el siguiente resultado:
As3/8 =

96
(15.966453644231) = 0.52250097383651
Integración de Taylor
En la sección 4.1 se abordo el tema de polinomios de colocación mediante
aproximación polinomial de Taylor, obteniéndose resultados que son
importantes en diferentes ramas de la ingeniería. Ahora los utilizaremos
para resolver algunas integrales numéricas.
Ejemplo 5.2.5
116
Utilizando 6 términos de la serie de Taylor 4.1.11 resuelva la siguiente
integral:

1
0
senx
dx
x
solución:
De la fórmula 4.1.11, senx = x -
x 3 x 5 x7 x 9 x11
, de tal manera que:
+ - + 3! 5! 7! 9! 11!
 x 3 x 5 x7 x 9 x11 
+ - + 
1
1x3! 5! 7! 9! 11! 
senx

dx =
dx
x
x
0
0

=


1
0
 x 2 x 4 x6 x 8 x10 
1 - + - +  dx
 3! 5! 7! 9! 11! 
1

x3
x5
x7
x9
x11 
=x+
+

 3* 3! 5* 5! 7 * 7! 9* 9! 11* 11!  0
1
1
1
1
1 

= 1 +
+
 - 0 
 3* 3! 5* 5! 7 * 7! 9* 9! 11* 11! 
= 0.946083070355
Ejemplo 5.2.6
Utilizando 6 términos de la serie de Taylor 4.1.11 resuelva la siguiente
integral:
 sen
1
xdx
0
Solución:
De la fórmula 4.1.11,
 x + x -  x +  x -  x
3
sen x =
 x
3!
5
5!
7
7!
9
9!
11
11!
de tal manera que:
117
 sen
1
xdx =
0




0
 x +  x -  x +  x -  x
3
  x
1
5
3!
7
5!

dx
11! 

9
7!
11
9!
 1 x 3 2 x 5 2 x7 2 x 9 2 x11 2 
dx
= x 2 +
+
3!
5! 7!
9! 11! 
0 



1
5
7
9
13
11
2 3
2x 2
2x 2 2x 2
2x 2
2x 2
= x 2+
+
3
5* 3! 7 * 5! 9* 7! 11* 9! 13* 11!
= 0.60233735785848
Ejemplo 5.2.7
Utilizando 6 términos de la serie de Taylor 4.1.12 resuelva la siguiente
1 1 - cosx
2
dx
integral: 
0
x
Solución:
De la fórmula 4.1.12:
 x 2 x 4 x6 x 8 x10 
1 - 1 +
+


2! 4! 6! 8! 10! 
1 - cosx
x x 3 x 5 x7
x9


=
+
+
x
x
2! 4! 6! 8! 10!

1
2
0
1  x
1 - cosx
x 3 x 5 x7
x9 
dx =  2  +
+
dx
0
x
 2! 4! 6! 8! 10! 
1
2
 x2
x4
x6
x8
x10 
=
+
+

 2* 2! 4* 4! 6 * 6! 8* 8! 10* 10!  0
 12  -  12  +  12  -  12 

2
4
6
8
2* 2! 4* 4!
= 0.061852563
6 * 6!
8* 8!
 12 
+
10
 12 
-
12
10* 10! 12* 12!
Ejemplo 5.2.8
Utilizando 6 términos de la serie de Taylor 4.1.10 resuelva la siguiente
integral:
Solución:
118

1
0
2
e  x dx
2
De la fórmula 4.1.10:
e
-x 2
= 1+  -x
2

 -x  +  -x  +  -x  +  -x 
+
2 2
2 3
2!
3!
2 4
4!
2 5
5!
de lo cual se desprende:

1
0
2
-x 2
e dxe
-x 2
=
1
0
2

x 4 x6 x 8 x10 
2
+
1 - x +
dx
2! 3! 4! 5! 

1/2

x3
x5
x7
x9
x11 
=x+
+

3 5* 2! 7 * 3! 9 * 4! 11* 5!  0

= 0.461281006806
5.3 Integración múltiple
Para la solución de integrales dobles o triples, podemos hacer uso de los
métodos anteriores, resolviendo integral por integral. Enseguida veremos
con dos ejemplos el cálculo de este tipo de integrales.
Ejemplo 5.3.1
Resolver la siguiente integral:
 
1
0
1
y2
1 x
dzdxdy
0
Solución:
Utilizaremos el método de Trapecio 1/3 para resolver esta integral iterada.
Dividimos el intervalo [a;b] = [0; 1 – x], que son los limites de la primer
integral, en n = 6 subintervalos, con longitud de cada uno igual a
h1 = [(1-x)-0]/6, aplicando la fórmula de Simpson, manteniendo constantes
las variables x e y , integrando respecto a z con función a evaluar f(z) = 1,
para obtener así la siguiente tabla:
119
z
0
(1-x)/6
(1-x)/3
(1-x)/2
2(1-x)/3
5(1-x)/6
(1-x)
f(z)=!
1
1
1
1
1
1
1
Método de Simpson 1/3
*1
*4
*2
*4
*2
*4
*1
∑=18
Tabla 5.10
Utilizando la fórmula 5.2.3 y la sumatoria de la tabla 5.10 obtenemos el
resultado de la primera integración:
A=
(1 - x)/6
18  = 1 - x
3
De donde:
 
1
0
1
y2
1 x
  (1  x)dxdy
1
dzdxdy 
0
0
1
y2
La segunda integral, la integramos respecto a x, mantenemos y constante,
tomamos la función f(x) = 1 – x para evaluar. Partimos nuevamente en
n = 6 el intervalo de [y2 ; 1], donde la amplitud de cada subintervalo será
h2 = [1 – y2 ]/6, obteniendo la siguiente tabla:
x
y2
(5/6)y2+1/6
(2/3)y2+1/3
(1/2)y2+1/2
(1/3)y2+2/3
(1/6)y2+5/6
1
Tabla 5.11
120
f(x) = 1 – x
1 – y2
5/6 – (5/6)y2
2/3 – (2/3)y2
1/2 – (1/2)y2
1/3 – (1/3)y2
1/6 – (1/6)y2
0
Método de Simpson 1/3
*1
*4
*2
*4
*2
*4
*1
∑ = 9 – 9 y2
Utilizando nuevamente la fórmula 5.2.3, y el resultado de la tabla 5.11
obtenemos la segunda integral:
A=
2
(1 - y 2 )/6
1
9 - 9y 2  = 1 - y 2 

3
2
Esto es:

1
0
1
(1 - x)dxdy =
y
2

1
0
1
1
(1 - y 2 )2 dy =
2
2
 (1 - y
1
2
)2 dy
0
Integrando por ultimo respecto a y, con función a evaluar f(y) = (1 – y2)2,
partimos el intervalo de [0 ; 1] en n = 8, y la magnitud de cada
subintervalos será h3 = [1 – 0 ]/8 = 1/8, obteniendo así la siguiente tabla:
y
0
1/8
1/4
3/8
1/2
5/8
3/4
7/8
1
f(y) = (1 – y2)2
1
3969/4096
225/256
3025/4096
9/16
1521/4096
49/256
225/4096
0
Método de Simpson 1/3
*1
*4
*2
*4
*2
*4
*2
*4
*1
∑=3277/256
Tabla 5.12
Utilizando nuevamente la fórmula 5.2.3, obtenemos la tercera integral:
1
2

1
0
(1 - y 2 )2 dy =
1 1/8  3277 
= 0.26668294270834
2 3  256 
De donde:
121
 
1
0
1
y2
1 x
dzdxdy  0.26668294270834
0
Ejemplo 5.2.10
Resolver la siguiente integral:

1 y 2
1
0
sen( x 2  y 2 )dxdy
0
Solución:
También utilizaremos el método de Trapecio 1/3 para resolver esta integral
iterada. Dividimos el intervalo [a;b] = [0; 1  y 2 ], en n = 6 subintervalos
1  y2
, aplicaremos la fórmula de Simpson
6
manteniendo constante la variable y , integrando respecto a x, con función a
evaluar f(x)= sen( x2+ y2) , obteniendo la siguiente tabla:
iguales, con longitud de h1 
y
0
Sen( y2 )
Método
de Simpson 1/3
*1
(1/6) 1 - y 2
Sen((35/36)y2+1/36)
*4
(1/3) 1 - y 2
Sen((8/9)y2+1/9)
*2
(1/2) 1 - y 2
Sen((3/4)y2+1/4)
*4
(2/3) 1 - y 2
Sen((5/9)y2+4/9)
*2
(5/6) 1 - y 2
Sen((11/36)y2+25/36)
*4
1
*1
f(x)=Sen(x2+y2)
1 - y2
Tabla 5.13
Utilizando la fórmula 5.2.3, y los resultados de la tabla 5.13, la primera
integral será:
122

 sen  (35/36)y 2 +1/36  + sen (3/4)y 2 +1/4  +
2
1 - y 2  sen(y )+ 4 
 sen (11/36)y 2 + 25/36 
A( y ) =

18 

+ 2  sen((8/9)y 2 +1/9)+ sen((5/9)y 2 + 4/9) +1

de donde:

1
0
1- y 2
2
2
sen(x + y )dxdy =
0

1
A(y)dy
0
Resolviendo la última integral con función a evaluar f(x) = A(y), partimos el
intervalo de [0 ; 1] en n = 8, de donde la magnitud de cada subintervalo
será h2 = [1 – 0 ]/8 = 1/8 , para obtener la siguiente tabla 5.14:
y
0
1/8
1/4
3/8
1/2
5/8
3/4
7/8
1
A(y)
0.31901251226031
0.32640826843467
0.34739751101453
0.37816787719979
0.41161165252641
0.43602218362047
0.43236201884557
0.36507651934579
0
Método de Simpson 1/3
*1
*4
*2
*4
*2
*4
*2
*4
*1
Tabla 5.14
De donde:
Area =
1 1/8
12.80078125  = 0.26668294270834
2 3
Por lo tanto el resultado de la integración es:

1
0
1 y 2
sen( x 2  y 2 )dxdy  0.26668294270834
0
123






5.4 Aplicaciones
Existe una gran variedad de problemas que mediante el cálculo tradicional
no podemos resolver, tratándose de Áreas bajo la curva ya que el tipo de
integrales que se presentan no puede expresarse de manera explicita. Es de
esto que el método numérico tome un papel importante es la solución de
estos.
Enseguida daremos algunos ejemplos donde las técnicas numéricas dan
solución a algunos de estos problemas.
Ejemplo 5.4.1
La tabla muestra la velocidad registrada por los jueces en una carrera
determinada de bicicletas. Se desea calcular la distancia recorrida por cierto
corredor, desde el inicio hasta transcurridas 5 horas.
t(horas) 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
v(Km./h) 43 25 50 53 55 62 28 52 53 51 47
Tabla 5.15
Solución:
La distancia total recorrida desde el inicio hasta transcurridas 5 horas la
obtenemos de d 

b
v(t )dt . En este caso utilizaremos el método de
a
Trapecio, ya que no podremos utilizar el método de Simpson 1/3 debido al
número de subintervalos que es necesario por la fórmula 5.2.3. Para
encontrar una aproximación desde t = 0 a t = 5, la tabla 5.15 define el
valor de h = 0.5 .
At =
0.5
 43 + 2(25 + 50 + 53 + 55 +62 + 28 + 52 + 53 + 51)+ 47  = 237km
2
As =
0.5
 43 + 4(25 + 53 +62 + 52 + 51)+ 2(50 + 55 + 28 + 53)+ 47  = 239km
3
los dos resultados podemos reducirlos a que el total de kilómetros recorridos
en ese periodo de tiempo es entre 237 Km. y 239 Km.
124
Ejemplo5.4.2
Calcular el volumen de la región limitada por el cilindro parabólico x = y2
y los planos z = 0 y x + z = 1.
Solución:
El volumen se obtiene resolviendo la siguiente integral:
 
1
2
0
1
y2
1 x
dzdxdy
0
y del ejemplo 5.2.9 se obtuvo:
 
1
1
y2
0
1 x
dzdxdy  0.26668294270834
0
por lo tanto

1
2
1
0
y
2
1-x
dzdxdy = 0.533365885417 u 3
0
Ejemplo 5.4.3
La tabla 5.16 muestra la medida de la razón de crecimiento de peces (peces
por mes) de un lago de cultivo de peces, en un periodo de 6 meses. Estime
la cantidad total de peces que habrá en el lago en ese periodo.
t
0 1 2 3 4 5 6
p(peces) 10 10 11 11 12 12 13
Tabla 5.16
Solución:
La población total acumulada desde el inicio hasta transcurridas 6 meses la
obtenemos de Pt 

b
Pdt . En este caso utilizaremos los métodos Trapecio,
a
Simpson 1/3, y Simpson 3/8 ya que el número de intervalos nos permite
utilizar las tres fórmulas, para encontrar una aproximación desde t = 0 a
t = 6. La tabla define el valor de h = 1
125
1
10 + 2(10 + 11+ 11+ 12 + 12)+ 13  = 67.5
2
1
As =  10 + 4(10 +11+12)+ 2(11+12)+13  = 67
3
para Simpson 3/8, n = 2, de tal manera que si a = 0 y b = 6, h = (6-0)/2 = 3
se tiene:
3
As3/8 =  10 + 3(10 + 11+ 12 + 12)+ 2(11)+ 13  = 67.5
8
los tres resultados podemos reducirlos a que el total de peces acumulados en
el cultivo en los seis meses es entre 67 y 68 peces.
At =
Ejemplo 5.4.4
La función de probabilidad de la distribución Normal, esta dada por
P 0; a  
 
1
a
e
x
2
2
dx
2
0
Mediante la utilización de tablas de esta distribución podemos encontrar que
el área de [0 ; 1] = 0.341344. Utilizando la regla de Trapecio, Simpson 1/3 y
Simpson 3/8, estime el área de esta función de probabilidad.
Solución:
La función a evaluar en es f ( x)  e
x
2
2
en los tres casos, ya encontrada el
área de [0;1] la multiplicaremos por el factor 1/ 2 . h = (1 – 0)/6 = 1 / 6,
la tabla 5.17 muestra los valores que utilizaremos para encontrar la integral:
x
0
1/6
1/3
1/2
2/3
5/6
1
x
2
f ( x)  e 2
1
0.9862071
0.9459595
0.8824969
0.8007374
0.7066482
0.6065306
Tabla 5.17
El área por el método de trapecio y Simpson 3/8 será:
126

1  1+ 2(0.9862071+ 0.9459595 + 0.8824969


+ 0.8007374 + 0.70664829)+ 0.6065306 
2 2 
= 0.34078411
1
At 
As =

1  1+ 4(0.9862071+ 0.8824969 + 0.70664829)


+
2(0.9459595
+
0.8007374)+
0.6065306
2

= 0.85562964

1
2
(0.85562964) = 0.3413468
Para Simpson 3/8, n = 2, se tiene:
As3/8 =
As 3 / 8 
1  1+ 3(0.9862071+ 0.9459595 + 0.8007374 + 0.70664829) 


+ 2(0.8824969+)+ 0.6065306
8(2) 

1
2
 0.85563633  = 0.34134951
PROBLEMAS CAPÍTULO V
1.- Calcule la derivada de x3 , con 5.1.1. y con la fórmula simplificada del
ejercicio 5.1.3, en el punto x = 1.
2.- Calcule la derivada de x2 , con la fórmula simplificada del ejemplo 5.1.4,
en el punto x = 2.
3.- Encuentre el área de las siguientes integrales, utilice el método de
Trapecios, en cada inciso se da el número de subintervalos para su
aproximación.



1
a)
x 1 - xdx n = 4
d)

0

c)
0
senx dx n = 5

0
b)




2
senx
dx
x
n 4
1 - cosx
dx n = 5
x2
e)
2
1.2
2
e-x dx
n= 5
1
dx
2
1 1  x
n8
0
1
f)
127
4.- Por el método de Simpson 1/3 encuentre el área de cada una de las
siguientes integrales, el número de subintervalos se da en cada caso.



1
a)
x 1 - xdx n = 4
d)
0
b)
0

2
senx
dx
x
0

c)



2
0
n 4
e)
1
dx n = 6
1+ x 3
1
1 - x 3 dx n = 6
0
1 - cosx
dx n = 6
x2
f)
1
1
dx
2
1+
x
-1
n= 8
5.- Por el método de Simpson 3/8, evalué las siguientes integrales, tome n=4
a)


1
senx
dx
x
0

c)
1
dx
2
4

x
1/ 2
1
dx
x
1

1
b)
2
d)

senx
4
cos x
0
dx
6.- Tomando cinco términos de la aproximación en series de Taylor, de la
función necesaria, encuentre las siguientes integrales.
 e dx
1 e
 x dx
1
x
a)
d)
0
1
b)
0
1
x
e)
0
c)

 /2
0
128
1 - cosx
dx
x2
 sen x dx
e e
 2 dx
e e
 2 dx
1
x
x
0
1
f)
0
x
x
Capítulo 6
Solución de
Ecuaciones diferenciales
Las ecuaciones diferenciales, son expresiones matemáticas que se presentan
en muchos problemas científicos y de ingeniería, así como también al tratar
de explicar los fenómenos naturales que inciden en nuestra vida diaria. Estas
se basan en los conceptos del cálculo, formulados y desarrollados por
Newton, Leibniz y otros en el siglo XVII.
Donde estén involucradas razones de cambio de una función desconocida ó
varias funciones desconocidas con respecto a una ó varias de sus derivadas
en un punto, podremos establecer una ecuación en términos de derivadas.
Estas expresiones pueden formularse desde algo simple, donde se desea
encontrar solución a una ecuación diferencial, dada una función, hasta las
más complejas donde aparecen varias funciones.
Por lo regular, en un curso de ecuaciones diferenciales, los tipos de
problemas que se presentan, se resuelven por diferentes métodos y en
algunos casos es complicado, difícil e imposible, el dar una respuesta a
estos. Es aquí donde los métodos de solución aproximada, serán una
alternativa para dar solución a estos de una manera simple y precisa.
Antes de iniciar expondremos algunos fundamentos básicos de las
expresiones denominadas ecuaciones diferenciales, con la finalidad de
recordar algunos de estos conceptos.
129
6.1 Fundamentos matemáticos
La ley de enfriamiento de Newton o las leyes mecánicas que rigen el
movimiento de los cuerpos, al expresarse en términos matemáticos dan
lugar a ecuaciones diferenciales. Estas ecuaciones se acompañan de
condiciones adicionales las cuales especifican el estado del sistema, en un
tiempo o posición inicial, lo que llamamos “condiciones iniciales del
sistema” que en conjunto con la ecuación diferencial, denominaremos el
“problema de valor inicial”.
Definición 6.1.1
Una ECUACIÓN DIFERENCIAL ORDINARIA DE PRIMER ORDEN, es aquella
que contiene a lo más, a la primera derivada de una función desconocida. Si
y es la función desconocida y esta se encuentra en términos de x, entonces la
ecuación diferencial de primer orden se escribe:
dy
 f ( x, y )
dx
(6.1.1)
Donde f(x,y) es una función de dos variables x y y.
Si esta toma un valor prescrito y0 cuando x = x0 , esto es y(x0) = y0 decimos
que es una ecuación diferencial sujeta a condiciones iniciales, con la cual
obtendremos una solución particular al problema.
Esta última condición, será de vital importancia para analizar la solución de
las ecuaciones por métodos numéricos.
Por lo general en un curso de ecuaciones diferenciales, primero se analiza el
problema de la existencia de una solución y además, que esta solución sea
única antes de pensar en el problema de condiciones iniciales, para
encontrar una solución particular del problema.
El siguiente teorema debido a E. Picard* provee condiciones suficientes de
existencia y unicidad para ecuaciones diferenciales ordinarias del tipo 6.1.1.
130
Teorema 6.1.1
Sea R una región rectangular en el plano xy, la cual esta definida de la
siguiente manera, a ≤ x ≤ b, c ≤ y ≤ d, donde el punto P(x0, y0) esta
contenido. Si f(x, y) y f / y , son continuas en R, entonces existe un
intervalo I(a, b), con centro en x0 y una única función y(x) definida en I(a, b)
que satisface el problema de valor inicial.
El teorema 6.1.1, solo es suficiente más no necesario, ya que si f(x,y) y
f / y son continuas en R, la solución existe y es única. De no suceder esto,
la ecuación diferencial tendrá, una, más de una o ninguna solución.
Si nuestro deseo es el de resolver la ecuación diferencial, encontrando una
solución aproximada y a la unicidad le restamos interés, el trabajar solo con
la continuidad de f(x,y) será suficiente para garantizar la existencia de, al
menos, una solución de 6.1.1 para cada punto P(x0, y0) dentro del
rectángulo*.
Algunos ejemplos de ecuaciones diferenciales que contienen derivadas son:
a)
b)
dy
 x2  7
dx
d2y
dy
 k  3 y  x2  7
2
dx
dx
c)
y ' 4 y  cos x
d)
y ''' 2 y '' y ' y  e cos x
x
e)
( y '')3  ( y ') 2  ny  xe x cos x
f)
u
u

x
y
g)
2u 2u

y
xy x 2
h)
2u 2u

u
x 2 y 2
En las ecuaciones a), b), c), d), e) y f) aparece solamente una variable
independiente con derivadas ordinarias, a este tipo de ecuación las
denominaremos ecuaciones diferenciales ordinarias.
En los casos f), g) y h) aparecen más de dos variables independientes y
como las derivadas que intervienen son derivadas parciales, les
denominaremos ecuaciones diferenciales parciales.
131
Las ecuaciones diferenciales ordinarias, se clasifican según el orden. El
orden de la más alta derivada que interviene en una ecuación diferencial,
será el orden de la ecuación. Las ecuaciones a), c) y f) son ecuaciones de
primer orden, b), e), g) y h), son de segundo orden y d), es de tercer orden.
En ocasiones las ecuaciones diferenciales se representan:

dy d 2 y
dn y 
F  x, y,
, 2 ,..., n   0
dx dx
dx 

(6.1.2)
Una ecuación diferencial tiene la forma:
an ( x)
dn y
d n 1 y
dy

a
(
x
)
 ...  a1 ( x)
 a0 ( x)  f ( x)
n 1
n
n 1
dx
dx
dx
(6.1.3)
La variable independiente, en conjunto con todas sus derivadas, son de
primer grado, además, cada coeficiente depende únicamente de x.
Definición 6.1.2
Decimos que una función f, definida dentro del intervalo I(a;b), es solución
de una ecuación diferencial, si al ser sustituida en la ecuación nos genera
una identidad.
De hecho, al resolver una ecuación diferencial de orden n como 6.1.2 o bien
6.1.3 se obtiene una familia de soluciones con n-parámetros que dependen
del orden de la ecuación. En nuestro caso será necesario tener las
condiciones iniciales, para obtener una solución particular, de otro modo no
podemos hacer uso de los algoritmos numéricos.
Resolveremos ecuaciones diferenciales de primer orden o mayor, sujetas a
condiciones iniciales. Estas no necesariamente tienen solución por los
métodos que se discuten en un curso de ecuaciones diferenciales y en
algunos casos, aún cuando existe una solución, no podremos expresarla en
términos de funciones elementales. Esto, justifica el obtener una
aproximación de la solución, mediante una sucesión de aproximaciones en
el intervalo discretizado, donde observaremos el comportamiento de la
solución.
132
Los métodos que enseguida expondremos serán de gran apoyo para
encontrar dicha solución.
6.2 Métodos de un paso
Uno de los métodos numéricos más simples y conocidos para resolver una
ecuación diferencial es el método de Euler, también conocido como método
de las tangentes.
Se desea resolver numéricamente una ecuación diferencial del tipo 6.1.1
sujeta a condiciones iniciales y(x0) = y0 .
Método de Euler
Al resolver 6.1.1 como una ecuación diferencial de variables separables, en
un pequeño subintervalo (x0 ; x1) donde x1 – x0 = h, la función f(x,y), la
consideraremos una función constante en el, mientras más cercano este x1 de
x0, de esta manera integrando la ecuación 6.1.1 en ese intervalo obtenemos:

y1
dy 
y0


x1
f ( x, y )dx
o bien:
x0
y1
dy  f ( x, y )
y0

x1
dx
x0
de donde:
y
x
y y1 = f(x0 , y0 )x x1
0
0
obteniendo:
y1 - y0 = f(x0 , y0 )(x1 - x0 )
Dado que x1 – x0 = h, al despejar y1, obtenemos:
y1 = y0 + f(x0 , y0 )h
Aquí y1 es una aproximación futura en términos de la condición inicial y de
la longitud de paso h = x1 – x0.
Si suponemos que h tiene un valor uniforme en cada uno de los siguientes
subintervalos, en donde deseamos obtener una aproximación de la solución
a la ecuación, obtendremos una sucesión de puntos (x1, y1), (x2, y2) ,…,
(xn, yn), como aproximaciones de (x1, f(x1)), (x2, f(x2)),…, (xn, f(xn)) y en n
pasos:
133
yn+1 = yn + f(xn , yn )h
(6.2.1)
A 6.2.1 se denomina Método de Euler.
La exactitud de las aproximaciones, dependerá de elegir una longitud de
paso h, lo suficientemente pequeño y constante en cada intervalo.
6.2.1 se deduce también, a partir 4.1.5, ya que en el Cálculo con frecuencia
se aproxima la grafica de una función, diferenciable, f(x) cercana a un punto
x = x0 por una línea tangente a ese punto, a saber:
Todos los algoritmos numéricos, para resolver una ecuación diferencial de
primer orden:
dy
 f ( x, y )
dx
sujeta a y ( x0 )  y0
(6.2.4)
Inician en un punto (x0, y0), con pendiente de la recta tangente a la curva
solución en el punto dado, igual a f(x0,y0). La expresión 6.2.1 se utiliza
como fórmula de recurrencia para dar una solución aproximada de la
ecuación diferencial.
La interpretación geométrica de 6.2.1 se muestra en la figura 6.1.
El valor exacto de f(x) para x = x0+ h es y1, que aproximadamente es,
y0 + f(x0 ,y0) h.
f(x)
Pendiente= f ’(x0)
y1
y1+f’(x0)h
f ’(x0)h
y0
134
h
x0
x0+h
Fig.6.1
Ejemplo 6.2.1
Resolver, por el método de Euler, la siguiente ecuación diferencial:
dy y (1  x 2 y 4 )

dx x(1  x 2 y 4 )
Sujeta a, y(1) = 1, en el intervalo 1 ≤ x ≤ 3, con h = 0.2
Solución:
Tomemos a:
yn (1  xn yn )
2
f ( xn , yn ) 
4
xn (1  xn yn )
2
4
, (x0,y0) = (1,1) y h =0.2
el valor futuro de yn+1 , se obtiene mediante la siguiente fórmula recursiva:
yn (1  xn yn )
2
yn1  yn  h
4
xn (1  xn yn )
2
4
La cual se obtiene a partir de 6.2.1.
Para mostrar la utilización de la fórmula recursiva, efectuaremos dos
iteraciones.
Iteración 1
2
y1 = y0 + h
4
y0 (1 - x0 y0 )
2
4
x0 (1+ x0 y0 )
= 1+(0.2)
1(1 - (1)2 (1)2 )
=1
1(1+(1)2 (1)4 )
Iteración 2
135
2
y2 = y1 + h
4
y1 (1 - x1 y1 )
2
4
x1 (1+ x1 y1 )
= 1+(0.2)
1(1 - (1.2)2 (1)2 )
= 0.96994536
(1.2)(1+(1.2)2 (1)4 )
De esta manera se obtiene la tabla 6.1:
n
0
1
2
3
4
5
6
7
8
9
10
xn
1
1.2
1.4
1.6
1.8
2
2.2
2.4
2.6
2.8
3
yn
1
1
0.96994536
0.93271601
0.89550708
0.86054108
0.82837951
0.79900398
0.77220063
0.74770454
0.72525438
yn+1 = yn+f(xn,yn)h
1
0.96994536
0.93271601
0.89550708
0.86054108
0.82837951
0.79900398
0.77220063
0.74770454
0.72525438
Tabla 6.1
Ejemplo 6.2.2
Resolver, por el método de Euler, la siguiente ecuación diferencial:
1
dy
 xy 3
dx
Sujeta a, y(0) = 2, en el intervalo 0 ≤ x ≤ 1, con h = 0.1
Solución:
1
Sea, f ( xn , yn )  xn yn 3 y (x0,y0) = (0,2) con h = 0.1, de donde a partir de la
fórmula recursiva de Euler 6.2.1, se obtiene:
1
yn 1  yn  h( xn yn 3 )
Enseguida se muestran 2 iteraciones del método.
Iteración 1
136
1
1
y1 = y0 + hx0 y0 3 = 2+(0.1)(0)(2) 3 = 2
Iteración 2
1
1
y2 = y1 + hx1 y1 3 = 2 +(0.1)(0.1)(2) 3 = 2.01259921
De esta manera se obtiene la tabla 6.2:
n
0
1
2
3
4
5
6
7
8
9
10
xn
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
yn
2
2
2.01259921
2.037850434
2.07588502
2.12691136
2.191212667
2.269144118
2.361129483
2.467657355
2.589277111
yn+1 = yn+f(xn,yn)h
2
2.01259921
2.037850434
2.07588502
2.12691136
2.191212667
2.269144118
2.361129483
2.467657355
2.589277111
Tabla 6.2
6.3 Métodos de pasos múltiples
Los métodos de solución de un paso, son aquellos donde es utilizado la
información en un solo punto xi para producir un valor de la variable
independiente yi+1 en un punto futuro de xi+1 como se mostró en la sección
anterior. Los métodos multipaso utilizan estas aproximaciones nuevas de
yi+1 en conjunto con la información inicial para encontrar una solución más
aproximada.
Método de Euler Mejorado
A partir del método de Euler, mejoraremos la aproximación a la solución.
Si partimos del punto P(x0 , y0), encontramos, Q(x0+h , y0+hf(x0 , y0)), esto
137
es, al evaluar a la función en el punto Q, obtenemos una pendiente en ese
punto, de tal manera que si consideramos un promedio de pendientes entre
estos valores establecemos una relación en el intervalo de x0 a x0 + h,
escribiendo la nueva aproximación de la ordenada como:
f ( x0 , y0 )  f ( x1 , y1* )
y1*  y0  f ( x0 , y0 )
2
La cual es una pendiente más aproximada a la solución, así después de n
pasos establecemos la siguiente fórmula recursiva:
y1  y0  h
yn 1
f ( xn , yn )  f ( xn1 , yn*1 )
 yn  h
2
yn*1  yn  f ( xn , yn )
(6.3.1)
Conocida como Método de Euler-Modificado.
6.3.1, aproxima la pendiente de la curva solución con respecto al punto
extremo derecho (x1 , f(x1, y1)), mediante la pendiente de la curva solución
con respecto al punto (x0+h , y0+hf(x0 , y0)) . En este proceso, utilizamos la
pendiente inicial para predecir el valor y1 por el método de Euler y luego
utilizamos la nueva pendiente para corregir la predicción. Es de esto que
también el método se conoce como Método Predictor-Corrector para
resolver un problema de valor inicial numéricamente.
El error en esta fórmula podemos encontrarlo si retenemos en el desarrollo
de la serie de Taylor un término más que en 6.2.2. y mostrar que el método
de Euler, posee un error en la aproximación de:
en 
y '''( ) 3
h
6
xn    xn 1
De aquí que el error local del método de Euler mejorado es de orden h3, con
error global de orden h2. Con esto podemos concluir que el método de Euler
mejorado es más exacto que el método de Euler. Este método requiere de
más evaluaciones en cada paso, pero es más eficiente, ya que se obtiene una
mayor exactitud.
Ejemplo 6.3.1
Resolver el ejemplo 6.2.1 por el método de Euler Mejorado.
138
Solución:
yn (1  xn yn )
2
Sea, f ( xn , yn ) 
4
xn (1  xn yn )
2
4
y (x0,y0) = (1,1) con h = 0.2, sustituyendo
esto en la fórmula de Euler Mejorado, fórmula 6.3.1, se obtiene la siguiente
expresión:
4
2
4
y*n 1 (1  xn21 yn*1 )
yn (1  xn yn )
*
yn 1  yn  h
y n 1  yn  h
4
2
4
xn (1  xn yn )
xn 1 (1  xn21 yn*1 )
Iteración 1
Primero debemos calcular y1* para después encontrar el valor futuro de y1,
esto es:
2
*
y 1 = y0 + h
4
y0 (1 - x0 y0 )
2
4
x0 (1+ x0 y0 )
= 1+(0.2)
(1)(1 - (1)2 (1)4 )
=1
(1)(1+(1)2 (2)4 )
Luego predecimos el valor de y1:
h  y0 (1 - x02 y0* ) y* 1 (1 - x12 y1*
y1 = y0 + 
+
2  x0 (1+ x02 y0 4 ) x1 (1+ x12 y1* 4
4
4
)

) 
(0.2)  (1)(1 - (1)2 (1)4 )
(1)(1 - (1.2)2 (1)4 ) 
= 1+
+

 = 0.98497268
2  (1)(1+(1)2 (1)4 ) (1.2)(1+(1.2)2 (1)4 ) 
Prosiguiendo como se muestra en la primera iteración, obtenemos los
resultados que se muestran en la tabla 6.3.
n
xn
yn
0
1
2
3
4
1
1.2
1.4
1.6
1.8
1
0.98497268
0.95545218
0.92176882
0.88807292
yn1  yn  h
f ( xn , yn )  f ( xn1 , yn*1 )
2
0.98497268
0.95545218
0.92176882
0.88807292
0.85597645
139
5
6
7
8
9
10
2
2.2
2.4
2.6
2.8
3
0.85597645
0.82602877
0.79832739
0.77278087
0.74922550
0.72747782
0.82602877
0.79832739
0.77278087
0.74922550
0.72747782
Tabla 6.3
Es importante resaltar que un error en el calculo de y*n+1
significativo ya que no encontraríamos las solución buscada.
es muy
Ejemplo 6.3.2
Resolver el ejemplo 6.2.2 por el método de Euler Mejorado.
Solución:
1
dy
 xy 3 ; sujeta a, y(0) = 2, en el intervalo
dx
0 ≤ x ≤ 1, con h = 0.1. Utilizando 6.3.1, la fórmula recursiva que nos
ayudará para obtener los valores futuros de yn+1 es:
La ecuación a resolver es
1
yn1  yn  hxn1 y*n31
1
y*n1  yn  hxn yn31
con
Iteración 1
Primero debemos calcular y1* para después encontrar el valor futuro de y1,
esto es:
1
1
y* 1 = y0 + hx0 y0 3 = 2+(0.1)(0)(1) 3 = 2
y1 = y0 +


1
h
0.1
f(x0 , y0 )+ f(x1 , y1* ) = 2 +
0 +(0.1)(2) 3 = 2.006299605

2
2
Los demás valores se muestran en la tabla 6.4.
n
0
1
2
3
4
140
xn
yn
0
0.1
0.2
0.3
0.4
2
2.00629961
2.02524462
2.05695333
2.10162153
yn1  yn  h
f ( xn , yn )  f ( xn1 , yn*1 )
2
2.00629961
2.02524462
2.05695333
2.10162153
2.15952057
5
6
7
8
9
10
0.5
0.6
0.7
0.8
0.9
1
2.15952057
2.23099468
2.31645784
2.41639007
2.53133347
2.66188804
2.23099468
2.31645784
2.41639007
2.53133347
2.66188804
Tabla 6.3
Método de Runge-Kutta
Los métodos de Euler y Euler-Mejorado tienen una convergencia lenta,
además de que su estabilidad no es suficiente. Esto nos lleva a pensar en
otros métodos de mayor convergencia. El método que analizaremos
enseguida, amplia la idea geométrica de las aproximaciones, al utilizar
varias derivadas o tangentes intermedias, en lugar de una sola, obteniendo
así una mejor aproximación.
Es así como se genera el método más conocido de Runge-Kutta también
denominado Kutta-Simpson o Kutta-trapezoidal, por la forma semejante a
integración por trapecios que tiene la fórmula recursiva.
1
yn 1  yn  (k0  2k1  2k2  k3 )
6
(6.3.5)
donde k0 = hf(x,y), k1 = hf(x+½h , y+½k0), k2 = hf(x+½h , y+½k1),
k3 = hf(x+h , y+k2).
Ejemplo 6.3.3
Resolver el problema 6.2.2 por el método de Runge-Kutta. Compare los
resultados de los métodos anteriores. Calcule el error del Método RungeKutta con respecto a la solución exacta.
Solución:
La ecuación a resolver es
1
dy
 xy 3 , sujeta a,
dx
y(0) = 2 , en el intervalo
0 ≤ x ≤ 1, con h = 0.1
141
De la fórmula 6.3.5 de Runge-Kutta, calcularemos k0, k1, k2, k3, para
sustituir en la fórmula recursiva que nos ayudará para obtener los valores
futuros de yn+1 :
Iteración 1
1
k0 = hf ( x0 , y0 )  h( x0 y0 3 )
k1 = hf(x0 +½h , y0 +½k0 )  h( x0  0.5h)( y0  0.5k 0 )
1
k2 = hf(x0 +½h , y0 +½k1 )  h( x0  0.5h)( y0  0.5k1 )
1
k3 = hf(x0 + h , y0 + k2 )  h( x0  h)( y0  k 2 )
1
3
3
3
Con x0 = 0, y0 = 2, h = 0.1 se tiene:

k0 = (0.1) (0)(2)
1
3
=0
1
k1 = (0.1)(0 + 0.05)(2 + 0.5(0)) 3 = 0.006299605249
1
k2 = (0.1)(0 + 0.05)(2 + 0.5(0.006299605249)) 3 = 0.0063029106
1
k3 = (0.1)(0 + 0.1)(2 + 0.0063029106) 3 = 0.012612431
De donde el valor futuro de y1 es:
1
0 + 2(0.0062996052)+ 2(0.0063029106)+0.012612431
6
= 2.00630291
Continuando con este proceso, obtendremos la tabla 6.5.
y1 = 2 +
xn
yn
Runge-Kutta
yn
Euler
0
0.1
0.2
0.3
0.4
0.5
2
2.00630291
2.02525126
2.05696348
2.10163561
2.15953931
2
2
2.01259921
2.037850434
2.07588502
2.12691136
142
yn
Euler-Mej
2
2.00629961
2.02524462
2.05695333
2.10162153
2.15952057
Solución
exacta
2
2.00630291
2.02525126
2.05696348
2.10163562
2.15953932
Error
Runge-Kutta
0
6e-10
2.3e-9
5.1e-9
9e-9
1.4e-8
0.6
0.7
0.8
0.9
2.23101923
2.31648977
2.41643145
2.53138687
1
2.66195653
2.191212667
2.269144118
2.361129483
2.467657355
2.589277111
2.23099468
2.31645784
2.41639007
2.53133347
2.66188804
2.23101925
2.3164898
2.41643149
2.53138691
2e-8
2.6e-8
3.4e-8
4.2e-8
2.66195656
5.1e-8
Tabla 6.5
Al resolver el sistema de ecuaciones 6.2.6 y asignar otros valores de p o
bien de m y n, surgen diferentes métodos para resolver una ecuación
diferencial. Entre algunos de estos métodos de Runge-Kutta, denominados
de orden superior para resolver ecuaciones diferenciales, se encuentran los
siguientes:
Métodos de Heun
a)
yn 1  yn 
h
f ( xn , yn )  3 f
4 
k 
k
b) yn 1  yn   0  1 
 2 2
2
2


 xn  h, yn  hf ( xn , yn )  
3
3


con k0  hf ( xn , yn ) y k1  hf ( xn  h, yn  k0 )
aquí k0 es la pendiente al inicio del intervalo y k1 es la pendiente al final del
intervalo.
Método de punto medio
k 
h

con k0  hf ( xn , yn ) y k1  hf  xn  , yn  0 
2
2

Método de Ralston
yn 1  yn  k1
2k 
k
yn 1  yn   0  1 
3 
 3
3k 
3h

con k0  hf ( xn , yn ) y k1  hf  xn  , yn  0 
4
4 

Estos métodos son de orden dos y se obtienen similarmente como se obtuvo
el método de Runge-Kutta que demostramos.
Método de Runge-Kutta-Simpson(tercer orden)
143
k
1
h
 k0 + 4k1 + k2  con k0 = hf(xn , yn ) y k1 = hf(xn + , yn + 0 ) y
6
2
2
k2 = hf(xn + h, yn - k0 + 2k1 )
yn+1 = yn +
El método que se demostró en esta sección es de orden cuatro:
1
yn+1 = yn + (k0 + 2k1 + 2k2 + k3 )
6
k0 =hf(x,y), k1 =hf(x+½h ,y+½k0), k2=hf(x+½h,y+½k1), k3=hf(x+h , y+k2),
Método de Runge-Kutta de orden superior
Runge-Kutta-Fehlberg
1408
2197
1 
 25
k0 +
k2 +
k3 - k4 
a) yn+1 = yn + 
2565
4104
5 
 216
k0 = hf(xn , yn )
k 
h

k1 = hf  xn + , yn + 0 
4
4

3k 9k 
3h

k2 = hf  xn + , yn + 0 + 1 
8
32 32 

1932k0 7200k1 7296k2 
12h

k3 = hf  xn +
, yn +
+
13
2197
2197
2197 

439k0
3680k2 845k3 

k4 = hf  xn + h, yn +
- 8k1 +
216
513
4104 

8k
3544k2 1859k3 11k4 
h

k5 = hf  xn + , yn - 0 + 2k1 +
2
27
2565
4104
40 

b)
144
donde:
250
125
512
 37

yn+1 = yn + 
k0 +
k2 +
k3 +
k5 
621
594
1771 
 378
k0 = hf(xn , yn )
k 
h

k1 = hf  xn + , yn + 0 
5
5 

3k
9k 
3h

k2 = hf  xn +
, yn + 0 + 1 
10
40
40 

3k
9k
6k 
3h

k3 = hf  xn +
, yn + 0 - 1 + 2 
5
10 10
5 

11k0
35k3 
5k 70k2

k4 = hf  xn + h, yn + 1 +
54
2
27
27 

1631k0 175k1
44275k3
253k4 
575k 2
7h

k5 = hf  xn +
, yn +
+
+
+
+
8
55296
512
13824
110592
4096 

Método de Butcher
1
7k0 + 32k2 + 12k3 + 32k4 +7k5 
90
k 
h

k0 = hf(xn , yn )
k1 = hf  xn + , yn + 0 
k2 = hf
4
4

yn+1 = yn +
k0 k1 

 xn + 4, yn + 8 + 8 


k
h


k3 = hf  xn + , yn - 1 + k2 
2
2


3k
9k 
3h

k4 = hf  xn + , yn + 0 + 3 
4
16 16 

3k
2k 12k2 12k3 8k4 

k5 = hf  xn + h, yn - 0 + 1 +
+
7
7
7
7
7 

Un problema que presentan los métodos de aproximación es el hecho de
poder seleccionar un tamaño de paso adecuado para la obtención de la
solución numérica, ya que si h es muy grande, el error por truncamiento es
excesivo y los errores acumulados hace que el resultado sea de poca
exactitud. Pero si h es pequeño, el método consume tiempo innecesario y los
errores cometidos son muy significativos. Por lo general es conveniente
145
mantener un error local por iteración menor que un valor fijo
predeterminado.
6.4 Sistema de ecuaciones
diferenciales ordinarias
En esta sección se tocarán y ampliaran las técnicas desarrolladas en las
secciones anteriores para resolver ecuaciones diferenciales de primer orden
a más de una ecuación de primer orden, esto es, un sistema de ecuaciones de
primer orden.
Definición 6.4.1
Sean f1(x,y,z), f2(x,y,z),…,fn(x,y,z) funciones que dependen de x, y y de z.
Al conjunto de ecuaciones diferenciales del tipo:
 dy1
 dx  f1 ( x, y1 , y2 ,... yn )

 dy2  f ( x, y , y ,... y )

2
1
2
n
 dx


 dyn  f ( x, y , y ,... y )
n
1
2
n
 dx
(6.4.1)
se les denomina sistema de ecuaciones diferenciales de primer orden.
Se requiere que 6.4.1 este sujeto a condiciones iniciales y que estas se
conozcan para dar iniciar una solución numerica del mismo.
La solución numérica de las ecuaciones diferenciales ordinarias nos revela
una aproximación a la solución de estas, dado que su solución explicita es
en ocasiones imposible, de la misma manera es conveniente utilizar y
ampliar estas aproximaciones a la solución de sistemas de ecuaciones
ordinarias.
146
Cualquiera de los métodos vistos hasta ahora, pueden hacerse extensivos a
los sistemas de ecuaciones diferenciales aplicándolo a cada una de las
ecuaciones como se muestra enseguida.
Ejemplo 6.4.1
Resolver el siguiente sistema de ecuaciones diferenciales lineales, utilizando
el método de Euler.
dx
 x 2  xy,
dt
dy
 x 2  y 2 sujeto a x(1)  1, y (1)  2, h  0.1
dt
Solución:
De la fórmula de Euler 6.2.1 podemos escribir:
2
xn+1 = xn +(xn - xn yn )h
y
2
2
yn+1 = yn +(xn - yn )h
obteniendo, al sustituir las condiciones iniciales, la primera iteración y con
esta la siguiente y así sucesivamente como se muestra en la tabla los
resultados:
dx
= x 2 - xy,
dt
dy
= x 2 - y 2 sujeto a x(1) = 1, y(1) = 2, h = 0.1
dt
iteración 1
Con x0 =1 , y0 =1 y h = 0.1
x1 = x0 + ( x0  x0 y0 )h
x1 = 1+((1)2 - (1)(1))(0.1)
x1 = 1
2
y1 = y0 + ( x0  y0 )h
y1 = 1+((1)2 - (1)2 )(0.1)
y1 = 1
2
2
iteración 2 Con x1 = x0 + h =1.1 , y1 = y0 + h =1.1
x1 = x0 + ( x0  x0 y0 )h
2
y1 = y0 + ( x0  y0 )h
2
2
Con x1 = x0 + h = 1.1 y = 1
Con x = 1, y1 = y0 + h = 1.1
x1 = 1.1+((1.1)2 - (1.1)(1))(0.1)
y1 = 1.1+((1)2 - (1.1)2 )(0.1)
x1 = 1.111
y1 = 1
147
continuamos, sucesivamente hasta obtener los resultados de la tabla 6.6.
n
0
1
2
3
4
5
6
7
8
9
10
t
1
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2
x
1
1
1.111
1.2365521
1.381534042
1.552874949
1.760787014
2.020961144
2.358712647
2.81736817
3.476735056
y
1
1
1.079
1.163428
1.256709078
1.363506757
1.490463615
1.647543255
1.850580907
2.126456854
2.524502182
Tabla 6.6
6.5Aplicaciones
La solución de ecuaciones diferenciales por métodos numéricos no se limita
solo a cierto tipo, ya que la relación que aparece en cada iteración, no es una
relación funcional sino solo una tabulación, con valores de una variable
independiente la cual se produce con una condición inicial, para obtener un
valor futuro de la variable dependiente. Es claro que si la condición inicial
cambia, debemos de iniciar nuevamente los cálculos del problema, con lo
que podemos decir que estos métodos se amplían, lo que no sucede con
técnicas analíticas.
Hasta el momento, solo hemos tratado ecuaciones diferenciales de primer
orden, pero en ingeniería suelen presentarse ecuaciones diferenciales de
mayor orden. Por ejemplo:
m
d2x
dx

 kx  F (t )
2
dt
dt
(6.5.1)
Corresponde a un sistema, donde cierta masa, m, esta adherida a un resorte
flexible, que se encuentra fijo a en un punto O, con libertad de desplazarse
sobre un plano PQ, como muestra la figura 6.2. x(t) denota el
148
desplazamiento instantáneo de la masa, en el tiempo t desde su posición de
reposo. Sobre m actúan varias fuerzas, como son: una fuerza recuperadora –
kx, donde k es una constante que depende del resorte, una fuerza
amortiguadora proporcional a la velocidad instantánea de la masa y una
fuerza externa F(t) que actúa sobre la masa, la cual depende del tiempo.
Posición de equilibrio
O
m
P
Q
O
m
P
Fig 6.2
Q
x
En esta ecuación no se examino el rozamiento de la superficie, al
contemplar esta variable, resta velocidad al movimiento y por ende la fuerza
es proporcional a la velocidad que es igual a – j x, con lo cual la ecuación
diferencial quedaría expresada:
m
d2x
dx

 (k  j ) x  F (t )
2
dt
dt
(6.5.2)
sin provocar cambio en la forma de la ecuación diferencial.
La siguiente ecuación diferencial:
L
d 2q
dq q
R
  E (t )
2
dt C
dt
(6.5.3)
corresponde a una expresión, donde se involucra los siguientes elementos:
a) Un generador o batería que produce una fuerza electromotriz f.e.m.
E medida en voltios.
b) Una resistencia R medida en homios.
c) Un inductor con inductancia L medido en henrys.
d) Un capacitor con capacitancía C, medido en faradios.
149
Como se muestran simbólicamente en la figura 6.3
Fig. 6.3
Cuando el circuito se cierra mediante el interruptor K, fluye una carga Q
(medida en culombios) a las placas del condensador (C). A la variaron de
dQ
carga respecto al tiempo se denomina corriente y esta dada por i 
cuya
dt
unidad de media se define como amperios cuando t se mide en segundos.
En cada uno de los elementos se define la caída de voltaje a través del
circuito de la siguiente manera:
dQ
a) caída de voltaje a través de una resistencia: RI  R
dt
2
dI
d Q
b) caída de voltaje a través del inductor: L  L 2
dt
dt
Q
c) caída de voltaje a través de un capacitor:
C
d) caída de voltaje a través de una f.e.m.: – E
La ecuación diferencial se forma a partir de las leyes de Kirchhoff, en las
cuales se establece:
a) La suma algebraica de las corrientes que fluyen por un punto de
unión es igual a cero.
b) La suma algebraica de las caídas de voltaje alrededor de la maya es
igual cero.
150
De estas dos leyes, la primera solo se aplica cuando se tienen, circuitos
eléctricos más complicados, que el mostrado en la figura 6.3.
Las ecuaciones que se generan, como puede observarse en los dos ejemplos,
son de segundo orden y si se aplica la primera ley de Kirchhoff a un circuito
más complicado aparece un sistema de ecuaciones lineales.
Por lo regular este tipo de ecuaciones diferenciales, suelen resolverse por
diversos métodos, pero en nuestro caso los resolveremos mediante un
método numérico.
La ecuación diferencial:
dn y
n 1
 f ( x, y, y ', y '',..., y   )
n
dx
donde:
y' 
dy
d2 y
d ( n1) y
, y ''  2 , ...., y ( n 1)  ( n1)
dx
dx
dx
puede reducirse a un sistema de ecuaciones lineales simultaneas de primer
orden, efectuando los siguientes cambios de variables:
y1  y, y2  y ', y3  y '', y4  y ''',..., yn  y ( n 1)
derivando miembro a miembro la primera y sustituyendo en la segunda,
obteniendo:
dy3
dyn1
dyn d n y
dy1
dy2
 y2 ,
 y3 ,
 y4 ....,
 yn ,
 n  f ( x, y, y1 , y2 ,..., yn )
dx
dx
dx
dx
dx
dx
Si se dan las condiciones iniciales x = x0, y = y0, y’ = (y1)0, y’’ = (y2)0,…,
y(n-1)=(yn-1)0 , con lo cual podemos hacer extensivo los métodos anteriores,
ampliándolos a las ecuaciones de orden mayor que uno.
Ejemplo 6.5.1
151
Escribir el sistema de ecuaciones simultaneas de primer orden equivalente a
la ecuación de segundo orden:
d2 y
dy
 4x  8 y  0
2
dx
dx
Solución:
dy
d 2 y dw
Si
, de tal manera que al efectuar la
 w entonces

dx
dx
dx 2
sustitución en la ecuación diferencial obtenemos:
dw
 4 xw  8 y  0
dx
generando las siguientes ecuaciones lineales:
dy
dw
 w  f ( x, y, w) ,
 -4xw+ 8y = g(x, y,w)
dx
dx
Estas ecuaciones diferenciales simultaneas se pueden resolver por cualquier
métodos observado en la sección 6.4, generalizándolos para el sistema de
ecuaciones diferenciales, de la siguiente manera:
k0 = hf ( x0 , y0 , w0 )  h( w0 )
c0  hg ( x0 , y0 , w0 )  h( 4 x0 w0  8 y0 )
k1 = hf(x0 +½h , y0 +½k0 , w0  ½c0 )  h(w0  ½c0 )
c1 = hg(x0 +½h , y0 +½k0 , w0  ½c0 )  h(4( x0 +½h)(w0  ½c0 )  8( y0 +½k0 ))
k2 = hf(x0 +½h , y0 +½k1 , w0  ½c1 )  h(w0  ½c1 )
c2  hg(x0 +½h , y0 +½k1 , w0  ½c1 )  h(4( x0 +½h)( w0  ½c1 )  8( y0 +½k1 ))
k3 = hf(x0 + h , y0 + k2 , w0  c2 )  h( w0  c2 )
c3 = hg(x0 + h , y0 + k2 , w0  c2 )  h(4( x0 + h )( w0  c2 )  8( y0 + k 2 ))
donde:
1
y1 = y0 + (k0 + 2k1 + 2k2 + k3 ),
6
152
1
w1 = w0 + (c0 + 2c1 + 2c2 + c3 )
6
Ejemplo 6.5.2
Una batería de 100 sen3t voltios se conecta a un circuito simple en el cual el
inductor es de 2 henrys, la resistencia es de 16 ohmios y el condensador de
0.02 faradios. Determinar el valor de la carga después de cerrado el circuito
en t =1 segundo, si inicialmente, tanto la corriente como la carga son cero.
Solución:
De acuerdo al modelo de ecuación 6.5.3 la ecuación que se desprende es:
2
d 2q
dq
q
 16 
 100sen3t
2
dt 0.02
dt
o
d 2q
dq
 8  25q  50sen3t
2
dt
dt
dq
d 2 q dw
dw
Haciendo
 w, 2 
, entonces
 8w  25q  50sen3t
dt
dt
dt
dt
Generando el siguiente sistema de ecuaciones lineales:
dq
dw
 w,
 50sen3t  25q  8w
dt
dt
las cuales resolveremos como en el ejemplo 6.5.1:
k0 = hf (t0 , q0 , w0 )  h( w0 )
c0  hg (t0 , q0 , w0 )  h(50sen3t0  25q0  8w0 )
k1 = hf(t0 +½h , q0 +½k0 , w0  ½c0 )  h(w0  ½c0 )
c1 = hg(t0 +½h , q0 +½k0 , w0  ½c0 )  h(50sen3  t0  ½h   25  q0 +½k0   8(w0  ½c0 ))
k2 = hf(t0 +½h , q0 +½k1 , w0  ½c1 )  h(w0  ½c1 )
c2  hg(t0 +½h , q0 +½k1 , w0  ½c1 )  h(50sen3  t0  ½h   25  q0 +½k1   8(w0  ½c1 ))
k3 = hf(t0 + h , q0 + k2 , w0  c2 )  h(w0  c2 )
c3 = hg(t0 + h , q0 + k2 , w0  c2 )  h(50sen3  t0  h   25  q0 + k3   8(w0  c3 ))
encontrando el valor futuro de w y de q mediante la fórmula recurrente:
1
1
q1 = q0 + (k0 + 2k1 + 2k2 + k3 ),
w1 = w0 + (c0 + 2c1 + 2c2 + c3 )
6
6
las condiciones iniciales que se dan son:
153
i (0) 
dq(0)
 0, q(0)  0, o bien q(0)  0, w(0)  0
dt
esto es con los valores iniciales, t0 = 0, q0 = 0, w0 = 0 iniciamos las
iteraciones. Las primeras tres aproximaciones de la carga son:
k0 = 0
k0 = 0.05694268
k0 = 0.168274214
c0  0
c0  0.972246882
c0  1.150040301
k1 = 0
k1 = 0.105555024
k1 = 0.225776229
c1 = 0.747190662
c1 = 1.209393417
c1 = 1.064662845
k2 = 0.037359533
k2 = 0.1174125
k2 = 0.221507357
c2  0.448314397
c2  1.053771173
c2  1.026936309
k3 = 0.044831439
k3 = 0.162319797
k3 = 0.270967845
c3 = 1.025550683
c3 = 1.181310026
c3 = 0.868145042
q1  0.019925084
q1  0.130791338
q1  0.353092877
w0  0.5694268
w0  1.682742148
w0  2.71630609
Continuando con las iteraciones, obtenemos la tabla 6.7:
n
0
1
2
3
4
5
6
7
8
9
10
t
q
qreal
error
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0
0.019925084
0.130791338
0.353092877
0.659845643
1.000875354
1.319763128
1.565018727
1.696936172
1.691274973
1.540584492
0
0.020365760
0.131365446
0.353541803
0.660015436
1.000716644
1.319306994
1.564346879
1.696154262
1.690492094
1.539898979
0
4.40676 e-4
5.74108 e-4
4.48926 e-4
1.69793 e-4
1.5871 e-4
4.56134 e-4
6.71848 e-4
7.8191 e-4
7.82879 e-4
6.85513 e-4
Tabla 6.7
154
PROBLEMAS CAPÍTULO VI
1.- Resolver cada una de las siguientes ecuaciones diferenciales por el
método de i) Euler, ii)Euler mejorado, iii)Runge-Kutta Fórmula 6.3.5.
a)
b)
c)
d)
e)
f)
dy
  y2
y (0)  1 0  x  1 h = 0.2
dx
dy
  xy 2
y (2)  1 2  x  4 h = 0.5
dx
dy
 x 2  y 2 y (1)  2 1  x  2 h = 0.2
dx
dy x  y

y (1)  1 1  x  2 h = 0.2
dx x  y
dy
y
 xy 2 
y (1)  1 1  x  2 h = 0.2
dx
x
dy
 xy  y y (0)  1 0  x  1 h = 0.1
dx
155
2.- Resolver los siguientes sistemas de ecuaciones diferenciales mediante el
método de Runge-Kutta mostrado en 6.5.1.
d2 y
dy
+ 4x - 8y = 0
y(0) = 1 y'(0) = 2 h = 0.2
2
dx
dx
d2 y
dy
b)
+x +y=0
y(0) = 1 y'(0) = 2 h = 0.2
2
dx
dx
d2 y
a)
- (4x + 1)y = 0
y(0) = 1 y'(0) = 2 h = 0.2
dx 2
a)
Capítulo 7
Ecuaciones diferenciales
Parciales
Las ecuaciones en derivadas parciales, tienen un campo muy importante de
aplicación, tanto en matemáticas aplicadas como matemática pura. Las
ecuaciones de este tipo aparecen en estudios de métodos matemáticos de la
física o física matemática.
Plantearemos algunas ecuaciones diferenciales parciales ya que, el
conocimiento de estas ecuaciones, es primordial para el entendimiento de
sistemas más complejos.
La intención de resolverlo por técnicas numéricas es debido, como ya hemos
mencionado en casi todos los capítulos, a que la mayoría de estos problemas
no es sencillo el resolver por métodos analíticos, incluso aun cuando se
conoce la solución, el análisis numérico nos auxilia para obtener una
solución más rápida.
Existen diferentes métodos para resolver una ecuación diferencial parcial,
desde el punto de vista numérico. En este capitulo hablaremos solo de la
156
solución de ecuaciones diferenciales parciales por diferencias finitas, ya que
se ha probado que es el más útil, fácil de utilizar en un computador y en
algunos casos, prácticamente, el único que funciona.
Por lo general, en los problemas de valor límite, tratamos de encontrar una
relación o fórmula matemática que podamos adoptar para lograr una
aproximación. Posteriormente necesitamos resolverlas en términos de las
variables que establezcamos. Por ultimo, nos será muy útil el hecho de darle
una interpretación, ya que esto nos conduce a nuevos conocimientos.
7.1 Algunos conocimientos útiles
Sea z = f(x,y) una función de dos variables independientes x,y, tomamos un
punto (x0 ,y0) dentro de una vecindad de puntos (x,y), si y = y0 , entonces z
se vuelve una función de una variable a saber z = f(x,y0). Si esta función se
deriva con respecto a x, la derivada es llamada, derivada parcial de f(x,y)
con respecto a x para y = y0, lo cual podemos expresar mediante límite, si
existe y es finito, de la siguiente manera:
z
f ( x  h, y )  f ( x. y )
 lim
 f x ( x, y )
x h0
h
(7.1.1)
Ahora bien, si x = x0 entonces z se vuelve una función de una variable a
saber z = f(x0,y). Si derivamos esta función con respecto a y, la derivada es
llamada, derivada parcial de f(x,y) con respecto a y para x = x0, que como
el caso anterior podemos expresar:
z
f ( x, y  h)  f ( x. y )
 lim
 f y ( x, y)
y h0
h
(7.1.2)
Las notaciones más comunes para las derivadas parciales de z = f(x,y), con
respecto a x son:
z
,
x
zx ,
fx ,
y
f
x
157
Si la ecuación z = f(x,y) es una función de dos variables independientes, la
interpretación geométrica de las derivadas parciales zx , zy la podemos
observar al graficar z como una superficie, según muestra la figura 7.1:
Fig 7.1
Podemos decir que 7.1.1, es la pendiente, en algún punto, de una recta que
pasa por CD en el plano constante y = yo, donde z = f(x, y0), mientras que
7.1.2, es la pendiente, en algún punto, de una recta que pasa por AB en el
plano constante x = x0 , donde z = f(x0, y).
Las derivadas parciales f x1 , f x2 ,..., f xn de una función f(x1 ,x2 ,…,xn), son
funciones de x1, x2 ,…,xn y pueden tener derivadas parciales respecto a una
o todas las variables.
Una segunda derivada parcial para una función de dos variables
independientes f(x,y) se obtiene derivando por segunda ocasión a f(x,y)
respecto a las variables independientes, por ejemplo:
  f   2 f
 f xx
 
x  x  x 2
  f   2 f
 f yy
 
y  y  y 2
  f   2 f
 f xy
 
x  y  xy
  f   2 f
 f yx
 
y  x  yx
(7.1.3)
Ejemplo 7.1.1
Encuentre fx , fy , fxy , fyx , fxx , fyy para la función f(x,y) = x3 y2
Solución:
De acuerdo con 7.1.1, 7.1.2 y las reglas de derivación tenemos:
158
f

 ( x3 y 2 )  3x 2 y 2
x x
f

 ( x3 y 2 )  2 x3 y
y y
f
  
 
  ( x 3 y 2 )    3x 2 y 2   6 xy 2
xx x  x
 x
 
f
  
  ( x3 y 2 )    2 x3 y   2 x3
yy y  y
 y
 
f
  
  ( x3 y 2 )    2 x3 y   6 x 2 y
xy x  y
 x
f
  
 
  ( x3 y 2 )    3x 2 y 2   6 x 2 y
yx y  x
 y
En este ejemplo podemos observar que fxy = fyx , esto es valido cuando las
derivadas son continuas en el punto en cuestión.
Definición 7.1.1: Una ECUACIÓN DIFERENCIAL PARCIAL, es aquella que
contiene una función desconocida de dos o más variables y sus derivadas
parciales con respecto a esas variables.
Ejemplo 7.1.2
Las siguientes expresiones son ecuaciones diferenciales parciales:
a) 3
z
z
4
x
y
2 z
b)
 4x  3y
xy
c)
d)
z
2 z

t
x 2
3
 2 z 
3 z
e)

4
 2 z
xy 2
 x 
2 z 2 z

 z3
x 2
y 2
El orden de la ecuación diferencial parcial, es el orden de la derivada más
alta que se presente en ella.
En el ejemplo 7.1.2 el orden de las ecuaciones diferenciales parciales es: a)
de primer orden, b), c) y d) de segundo orden y e) de tercer orden.
159
La solución de la ecuación diferencial parcial es aquella que satisfaga la
ecuación idénticamente. Se dice que una ecuación diferencial parcial es
lineal, si es lineal en la función desconocida y en todas sus derivadas, en
donde sus coeficientes dependen solamente de variables independientes.
La solución general, de una ecuación diferencial parcial, es aquella que
contiene un número de funciones independientes arbitrarias iguales al orden
de la ecuación.
La solución particular, es obtenida de la solución general, al tener funciones
arbitrarias particulares.
7.2 Clasificación de las
ecuaciones diferenciales parciales
Una ecuación diferencial parcial lineal, de segundo orden, en dos variables
independientes tiene la forma:
A
2u
2u
2u
u
u

B

C
D E
 Fu  G
2
2
xy
x
y
x
y
(7.2.1)
donde A, B, C, D, E, F, G pueden depender de x o de y pero no de u. Una
ecuación diferencial parcial, que no tiene la forma 7.2.1 le llamaremos
ecuación diferencial parcial no lineal.
Si G =0, 7.2.1 se dice que es homogénea, si G 0 es no homogénea.
La expresión 7.2.1 frecuentemente es clasificada como una ecuación
diferencial parcial en cualquiera de las siguientes clases: parabólica, elíptica
o hiperbólica, debido a la naturaleza de la solución de la expresión
160
B2 – 4AC, sea igual cero, menor o mayor respectivamente como se muestra
en la tabla 7.1.
Ecuación
u
2u
a)
4 2
y
x
b)
c)
B2 – 4AC
=0
Clase
Parabólica
A = 4 , B=0, C = 0
2
2u
2  u

c
0
x 2
y 2
2
2u
2  u

a
0
t 2
x 2
<0
Elíptica
A = 1 , B=0, C = c2
>0
Hiperbólica
A=1, B=0, C=-1/c2
Tabla 7.1
Clasificación útil, ya que estas se asocian a algunos experimentos
específicos en ingeniería y por otra parte cada caso se resuelve de manera
diferente.
El inciso c) de la tabla 7.1 es llamada ecuación de la cuerda vibrante. La
forma de presentarla es:
2
2u
2  u
a
t 2
x 2
a2  

(7.2.2)
donde x y t son variables independientes y a una constante. Esta ecuación
es hiperbólica y describe una gran variedad de fenómenos físicos que
involucran propagación de ondas, vibraciones de una cuerda elástica, las
oscilaciones de una barra, transmisión de señales acústicas y eléctricas etc...
El ejemplo más simple de la ecuación de onda es el movimiento vibratorio
de una cuerda de longitud L, de masa  (por unidad de longitud) y tensión
T, que está extendida entre dos soportes y sujeta en los extremos. La
posición de equilibrio esta en el intervalo [0,L]. La incógnita que se presenta
en este problema es el desplazamiento transversal de la cuerda, u(x,t) nos da
el desplazamiento de cualquier punto x de la cuerda en un tiempo t.
La ecuación de movimiento se encuentra, considerando una porción de la
cuerda con sus extremos en x y x+ Δx a la cual se aplica la segunda ley de
161
Newton, Se asumiendo que la cuerda es perfectamente flexible y no ofrece
resistencia al doblarse. El análisis de fuerzas se muestra en la figura 7.2.
T2
T1
y(x+Δx,t)
,t)
y(x,t)
x
x+Δx
L
Fig. 7.2
En cierto instante, por ejemplo t = 0, el movimiento se propaga de un punto
a otro como muestra la figura 7.2. con la cual aparecen las condiciones que
especifican el valor de la función y/o sus derivadas en cierto instante. A
estas condiciones se les llama condición de frontera.
La ecuación 7.2.2 puede generalizarse para más dimensiones, por ejemplo
en dos dimensiones tendríamos la membrana de tambor, cuya ecuación es:
2
2u
2u 
2  u

a

 2

 t2
 y2 
x
a2  

(7.2.3)
La ecuación 7.2.2, también se le interpreta como el movimiento de una viga
con vibraciones pequeñas. El desplazamiento longitudinal, partiendo desde
el equilibrio de una sección transversal en x es u(x,t) . En este caso la
constante a2 = E /  , siendo E la magnitud de la elasticidad la cual depende
del tipo de viga (fatiga por deformación),  es la masa por unidad de
volumen.
Otros tipos de ecuaciones diferenciales parciales se presentan al relacionar
el operador diferencial nabla el cual se define en el análisis vectorial como:

162
 ˆ  ˆ  ˆ
i
j k
x
y
x
Al efectuar la siguiente operación vectorial:
 
 ˆ  ˆ    ˆ  ˆ  ˆ  2
2
2
     iˆ 
j  k i 
j  k  2  2  2
y
x   x
y
x  x
y
x
 x
y sabiendo que       cos00  2 se obtiene la ecuación 7.2.4:
2 
2
2
2


x 2 y 2 x 2
(7.2.4)
llamado operador Laplaciano.
Este operador al aplicarse a una función u(x,y,z,t) nos proporcionara la
temperatura en la posición (x,y,z) de cierto sólido en un tiempo t, con una
conductividad térmica C, calor especifico  y masa ρ (por unidad de
volumen), que son constantes. Así obtenemos la siguiente expresión,
denominada ecuación de conducción de calor:
u
C
(7.2.5)
  2 u  
conductividad térmica
dt

Si
u
 0 7.2.5 se transforma en:
dt
2 u  0 ó
2u 2u 2u


0
x 2 y 2 x 2
(7.2.6)
Conocida como ecuación de Laplace.
En la teoría, de Electricidad o Gravitacional, u representa el potencial
eléctrico y el potencial gravitacional respectivamente. En la teoría de
conducción de calor u representa la temperatura en condiciones estables
después de cierto tiempo.
Los problemas de calor unidimensional por lo regular se pueden expresar
como:
163
u
2u
 2
t
t
(7.2.7)
cuya interpretación física es: una barra de longitud L cuya superficie lateral
se encuentra bajo ciertas condiciones especificas, en esta ecuación,  es la
difusividad térmica de la barra.
Un modelo para el área de economía, se presenta cuando, deseamos saber
las opciones de compra de cierto activo S con vencimiento es un periodo T
encentrándose este a un precio de ejercicio P. Esto lo podemos representar
utilizando 7.2.7 si S = Pex ,
t = T – 2 /2, y el valor de compra
V(T,S) = e-1/3( - 1)x-1/5(+1) u(x,),  = 2r/2, cuya ecuación final es:
 2 u u

x 2 t
x 
u ( x, 0)  max(e
1
 ( 1) x 5( 1)
3
, 0)
Así podríamos continuar enumerando diferentes modelos de ecuaciones
diferenciales parciales. Enseguida veremos un método para resolver estas,
desde un punto de vista numérico.
7.3 Método de diferencias finitas
Para resolver los diferentes tipos de ecuaciones diferenciales parciales, es
necesario un método conveniente con el cual podamos garantizar una
solución aproximada, que sea consistente, en donde las pequeñas
variaciones no alteren los resultados de salida grandemente. La solución de
los diferentes tipos de ecuaciones anteriormente expuestas, implican el
conocimiento de una función u(x,y) ó u(x,t) que es nuestra incógnita.
El método de diferencias finitas discretiza el problema, encontrando
solución solo en algunos puntos. Para esto, en una región, de acuerdo con
las condiciones iniciales, se divide el plano en una malla de puntos, solo en
la cual encontraremos la solución. Estableceremos una relación equidistante
entre ellos, por lo que pueden ser representados en la forma:
h
164
ba
n
k
d c
m
Los intervalos a, b y c, d  se particionan en, n partes iguales de longitud h,
y m partes de longitud k respectivamente, asociando así una red al
rectángulo R, a ≤ x ≤ b, c ≤ y ≤ d, como se muestra en la figura 7.3, donde:
xi = a + ih
para i=0,1,2,…,n
y
y
y
x
yi = c+jk para j = 0,1,2,…,m
h
...
...

...
...
...
...
...
x
k

...
x
Fig.7.3
Calcularemos la solución solo en los puntos de la malla u(nh, mk), para lo
cual haremos uso de las derivadas numéricas, centradas, hacia adelante y
hacia atrás, que analizamos en el capítulo V, adecuándolas para derivación
parcial de la siguiente manera:
a)
u ( xi , y j )
x

u ( xi  h, y j )  u ( xi , y j )
h
2
h  u (i , y j )

i  ( xi1 , xi1 )
2
x 2
2
b) u ( xi , y j )  u ( xi , y j  k )  u ( xi , y j )  h  u ( xi ,  j )
y
h
2
x 2
 j  ( y j 1 , y j 1 )
2
2 4
c)  u( xi , y j )  u(xi + h, y j ) - 2u(xi , y j )+u(xi - h, y j )  h  u (i , y j )
x 2
h2
12
x 4
2
2 4
d)  u ( xi , y j )  u(xi , y j  k) - 2u(xi , y j )+u(xi , y j  k)  h  u ( xi ,  j )
y 2
h2
12
x 4
i   xi1 , xi1 
 j   y j 1 , y j 1 
165
Tabla 7.2
Dado que la malla estará igualmente espaciada tanto en una variable como
en la otra, aprovecharemos la situación y rescribiremos las ecuaciones de la
tabla 7.2, con la siguiente notación:
2
a) u ( xi , y j )  u ( xi1 , y j )  u ( xi , y j )  h  u (i , y j )   ( x , x )
i
i 1
i 1
x
h
2
x 2
2
b) u ( xi , y j )  u ( xi , y j 1 )  u ( xi , y j )  h  u ( xi ,  j )
y
h
2
x 2
 j  ( y j 1 , y j 1 )
2
2 4
c)  u( xi , y j )  u(xi1 , y j ) - 2u(xi , y j )+u(xi1 , y j )  h  u (i , y j )
x 2
h2
12
x 4
2
4
2
d)  u ( xi , y j )  u(xi , y j 1 ) - 2u(xi , y j )+u(xi , y j 1 )  h  u ( xi ,  j )
y 2
h2
12
x 4
i   xi1 , xi1 
 j   y j 1 , y j 1 
Tabla 7.3
Al efectuar la sustitución, de las fórmulas de la tabla 7.3, obtendremos una
ecuación en diferencias, la cual, dependiendo de las condiciones de frontera,
nos proporcionara un sistema de ecuaciones lineales, cuya solución la
obtendremos por alguna método numérico como el de Gauss-Seidel o algún
otro método.
Las fórmulas de la tabla 7.3, las codificaremos, para un mejor manejo de los
subíndices. Para esto, el punto Pi,j = (xi ,yj), luego vi,j = u(xi,,y j). Además el
segundo término de las fórmulas solo los consideramos para el análisis de
error, con lo que la tabla 7.3 se transforma en:
u ( xi , y j )
x
u ( xi , y j )
y
166


vi1 , j vi , j
(7.3.1)
h
vi , j 1 vi , j
h
(7.3.2)
 2u ( xi , y j )
x
2

vi1 , j -2vi , j +vi1 , j

vi , j 1 -2vi , j +vi , j 1
 2u ( xi , y j )
y
2
h
(7.3.3)
2
h
(7.3.4)
2
Estos métodos nos permitirán valorar opciones de solución que implican
una reducción de los cálculos matemáticos que en ocasiones arrojan
soluciones que no es posible expresar explícitamente, además podemos
calcular la solución en todo los puntos del mallado permitiéndonos así
determinar temperaturas, movimientos, desplazamientos, sin más que
calcular derivadas numéricamente con los resultados obtenidos.
Para observar el método, veamos el siguiente ejemplo.
Ejemplo 7.3.1
Resolver la siguiente ecuación diferencial parcial:
2u 2u

0
x 2 y 2
(7.3.5)
sujeta a las siguientes condiciones:
0 < x < 0.8, 0 < y < 0.8, u(x , 0) = 00, u(0 , y) =1000, u(x,0.8) = 1600,
u(0.8,y )=(200 y) 0.
Solución:
Dividiremos la región 0 < x < 0.8,
subintervalos de mismo tamaño.
0 < y < 0.8
en n = m = 4
u(x,0.8)=160
3,1 3, 2 3,3

1000


2,1 2, 2 2,3


1,1 1, 2



u(0.8,y)=200y
1,3

167
00
Fig. 7.4
Sustituiremos en 7.3.5 las fórmulas 7.3.3 y 7.3.4, para igualar ambas:
vi1 , j -2vi , j +vi1 , j
h
2

vi , j 1 -2vi , j +vi , j 1
h2
de esta obtenemos:
vi1 , j vi1 , j vi , j 1 vi , j 1 4vi , j  0
(7.3.6)
la cual es una ecuación en diferencias, que en este caso particular recibe el
nombre de ecuación en diferencias de Laplace.
En este caso se debe señalar que cuando el material esta constituido por una
sustancia porosa o similar, con poros o espacios libres relativamente
pequeños y distribuidos en la masa del material uniformemente, la ecuación
sigue siendo valida, pero el valor de la conductividad térmica tomará un
valor ficticio equivalente a la temperatura en análisis.
De esta manera al sustituir i =1,2,3 j=1,2,3 que generan los puntos (1,1),
(1,2),…., (3,3), obtendremos el siguiente conjunto de ecuaciones lineales.
(1,1)
v21  v01  v12  v10  4v11  0
4v11  v21  v12  100
(2,1)
v31  v11  v22  v20  4v21  0
v11  4v21  v31  v22  0
(3,1)
v41  v21  v32  v30  4v31  0
v21  4v31  v32  40
(1, 2)
v22  v02  v13  v11  4v12  0
v11  4v12  v22  v13  100
(2, 2) v32  v12  v23  v21  4v22  0 v21  v12  4v22  v32  v23  0
(3, 2) v42  v22  v33  v31  4v32  0
(1,3)
v23  v03  v14  v12  4v13  0
v31  v22  4v32  v33  80
v12  4v13  v23  260
(2,3) v33  v13  v24  v22  4v23  0
v22  v13  4v23  v23  160
(3,3) v43  v23  v34  v32  4v33  0
v32  v23  4v33  280
(7.3.7)
las ecuaciones de la izquierda se obtuvieron al sustituir los valores:
168
v01 = v02 = v03 = 100, v10 = v20 = v 30 = 0, v14 = v24 = v34 =160 ,
v41 =200(0.2)=40, v42 =200(0.4)=80, v43 =200(0.6)=120.
Si escribimos el sistema 7.3.7 de la siguiente forma:
 4v11
 v
 11


 v11








v21
v12
4v21
v31
v21
4v31
v21
v22
v32
4v12
v22
v12
4v22
v32
v22
4v32
v31
v13
v23
v33
v12
v22
4v13
v23
v13
4v23
v33
v23
4v33
v32
100 
0 
40 

100 
0 

80 
260 

160 
(7.3.8)
280 
El sistema de ecuaciones es dominante y al utilizar el método de GaussSeidel, encontramos la siguiente solución:
v11  59.2857
v12  46.6071
v13  42.1429
v21  90.5357
v22  85
v23  81.9643
v31  117.8571 v32  120.8929 v33  120.7143
Este método se conoce con el nombre de método de Liebmann. Es el más
empleado para resolver, iterativamente, los sistemas de ecuaciones lineales
como 7.3.8. el cual se deduce de 7.3.6, al despejar vi , j , como se muestra
enseguida:
vi , j =
vi+1 , j +vi-1 , j +vi , j+1 +vi , j-1
4
Si deseamos encontrar la dirección del flujo de calor, la variable principal
será la temperatura, de tal manera que la ecuación que relaciona el flujo y la
169
temperatura esta dada por la Ley de Fourier de conducción de calor,
representada por:
q   k  C
T

(7.3.9)
donde qθ es el flujo de calor en la dirección θ con unidades en cal/(cm2-s),
k es el coeficiente de difusividad térmica cuyas unidades son cm2/s, ρ es la
densidad del material en g/cm3 , C la capacidad térmica del material, cuyas
unidades son cal/g-0C y T es la temperatura dada en 0C.
Si utilizamos las ecuaciones en diferencias para derivadas centradas del
capitulo V, como:
f '( x) 
f ( x  h)  f ( x  h) ó
2h
u ( xi , y j )
x

vi1 , j vi1 , j
2x
podemos escribir 7.3.9 de la siguiente forma:
qx   k  C
vi 1 , j vi 1 , j
q y  k  C
vi , j 1 vi , j 1
(7.3.10)
2x
2y
para calcular el flujo de calor resultante y el ángulo que forma en cada punto
de la siguiente manera:
qr  qx  q y
2
2
y
y
 1  q y
 tan 

 qx
 
 tan 1  q y


 qx




qx  0

 

qx  0
(7.3.11)
Ejemplo 7.3.2
Utilizando los valores del ejemplo 7.3.1 determine la distribución de flujo
de calor en los puntos a) i=j=1, b) i=j=2, para la placa de aluminio de
cal
80x80 cm., como muestra la figura 7.4. Tome κρC = 0.37
s  cm 0 C
Solución:
170
Para i = j = 1 tenemos
De acuerdo a 7.3.10 se tiene, para i = j = 1:
qx = -0.37
cal
(90.5357 - 100)0 C
= 0.087545 cal/(cm2  s)
2(20cm)
s  cm 0 C
q y  0.37
cal
(46.6071  0)0 C
 0.431116 cal /(cm2  s)
0
2(20cm)
s  cm  C
El flujo resultante y el ángulo serán, de acuerdo a 7.3.11:
qr  (0.087545) 2  (0.431116) 2  0.439915
y como qx > 0, tenemos:

 0.431116 
 78.5210
  1.370454 
0
180
 0.087545 
b) Para el nodo i = j = 2, tenemos:
  tan 1 
qx = -0.37
cal
(120.8929 - 46.6071)0 C
= -0.68714 cal/(cm2 × s)
0
2(20cm)
s× cm× C
cal
(81.9643 - 90.5357)0 C
q y = -0.37
= 0.079285 cal/(cm2 × s)
0
2(20cm)
s× cm× C
El flujo resultante y el ángulo serán, de acuerdo a 7.3.11:
qr  (0.68714) 2  (0.079285) 2  0.691699
y como qx < 0 tenemos:

 0.079285 
 173.420
     0.042692    
0
180
 0.68714 
  tan 1 
171
A medida que se analizan más las condiciones de frontera de este tipo de
problemas podemos encontrar dificultades que pueden irse resolviendo. Tal
es el caso de que la placa se encuentre aislada en uno de sus extremos, en
cuyo caso la derivada es cero, por lo que 7.3.9 refleja este resultado
dándonos un gradiente igual a cero.
Para los puntos (0, j) de la placa calentada de acuerdo a 7.3.6 se tiene:
v1 , j v1 , j v0 , j1 v0 , j1 4v0 , j  0
(7.3.12)
lo cual resulta problemático, ya que necesitamos temperaturas que se
encuentran fuera de la placa, y esto no tendría sentido en la aplicación de la
fórmula. La solución alternativa se presenta si expresamos la derivada
parcial mediante la siguiente fórmula de diferencia finita:
v v1, j  v1, j

x
2x
de donde :
v1, j  v1, j  2x
v
x
(7.3.13)
que al sustituir en 7.3.12 nos provee la ecuación en diferencias 7.3.14:
v
(7.3.14)
2v1, j  2x  v0 , j 1 v0 , j 1 4v0 , j  0
x
Ejemplo 7.3.3
Resuelva el ejemplo 7.3.1 si la placa tiene el extremo inferior aislado.
Solución:
Dado que la placa esta aislada la derivada es cero en la dirección y = 0. Así
la ecuación 7.3.14 se reduce a:
2vi,1 +v1+1 ,0 +vi-1 ,0 -4vi ,0 = 0
ó bien
4vi ,0 - v1+1 ,0 - vi-1 ,0 -2vi,1 = 0
De esta manera al sistema 7.3.7 se le incorporan tres nuevas ecuaciones,
generando así el siguiente sistema:
172
-2v11
4v10 -v20
 -v 4v
-v30
-2v21
20
 10

-v20 4v30
-2v31

4v11 -v21
 -v10

-v20
-v11 4v21 -v31

-v30
-v21 4v31


-v11

-v21


-v31





-v12
-v22
-v32
4v12
-v22
-v13
-v12
4v22
-v32
-v22
4v32
-v12
-v23
-v33
4v13 -v23
-v22
-v13 4v23 -v33
-v32
-v23 4v33
100 
0 
0 

100 
0 

40 
100 

0 
80 

260 

160 
280 
Cuya solución es:
v10 = 93.8495 v11 = 97.0608 v12 = 106.3084 v13 = 123.7047
v20 = 81.2766
v21 = 88.0851 v22 = 104.4681 v23 = 128.5106
v30 = 55.0866 v31 = 69.5350 v32 = 94.9682 v33 = 125.8697
Otro de los problemas que se experimentan es el de tener fronteras
irregulares como en la figura 7.5
1y
2 x
 2 y
1x
Fig 7.5
Las derivadas aproximadas en las direcciones de x e y se expresan:
173
vi , j  vi 1, j
 v 

 
 2 x
 x i , j 1
vi , j  vi 1, j
 v 

 
1 x
 x i 1, j
y
(7.3.15)
de las cuales al obtener las segundas derivadas:
 v 
 v 
 
 
 v   v   dx i , j 1  dx i 1, j
  
1 x   2 x
x 2 x  x 
2
y sustituir en 7.3.15 y 7.3.16 obtenemos:
2
vi 1, j  vi , j
2v
2
x 2

(7.3.16)
vi 1, j  vi , j
1 x
 2 x
1 x   2 x

2
x 2
vi 1, j  vi , j 
 vi 1, j  vi , j


 (7.3.17)
1 (1   2 )  2 (1   2 ) 
de la misma manera podemos encontrar una relación similar para y:
vi 1, j  vi , j 
2v
2  vi 1, j  vi , j




y 2
y 2  1 ( 1   2 )  2 ( 1   2 ) 
Si sustituimos 7.3.17 y 7.3.18 en 7.3.5 se tiene:
2
x 2
vi 1, j  vi , j 
 vi 1, j  vi , j
2


 2
1 (1   2 )  2 (1   2 )  y
(7.3.18)
vi 1, j  vi , j 
 vi 1, j  vi , j


0
 1 ( 1   2 )  2 ( 1   2 ) 
la cual es nuevamente una ecuación en diferencias que al aplicarse a los
puntos, de la región de análisis, nos proporcionara un sistema de ecuaciones
lineales que al resolver, nos da la solución en los valores determinados.
Para hacer uso de esta fórmula, necesitaremos los valores de
x, y, 1 , 2 , 1 , 2 como se muestra en la figura 7.5.
Hasta el momento no hemos resuelto ecuaciones diferenciales en donde
intervenga el tiempo. Cuando interviene la variable tiempo, se presentan un
tipo especial de ecuaciones diferenciales parciales, entre ellas se encuentran;
la ecuación de la cuerda vibrante, la ecuación de conducción de calor y
174
otras, que caen dentro de la clasificación de ecuaciones diferenciales
parciales parabólicas.
Este tipo de ecuaciones parabólicas, se resuelve de igual manera que las
ecuaciones elípticas, que son los casos que hemos analizado, sustituyendo
las ecuaciones en diferencias para las derivadas parciales las cuales
involucran nuevas variantes en el problema.
La siguiente ecuación parabólica, conocida como ecuación de conducción
de calor, la cual se expresa:
T
 2T
k 2
t
x
(7.3.19)
Podemos rescribirla, de acuerdo a las expresiones 7.3.1 y 7.3.3 así:
Ti 1, j  Ti , j
t
k
Ti , j 1  2Ti , j  Ti , j 1
Si despejamos Ti+1,j y hacemos
(x)2
k t
 x 
2
(7.3.20)
  obtenemos:
Ti 1, j  Ti , j   Ti , j 1  2Ti , j  Ti , j 1 
(7.3.21)
la cual es una ecuación en diferencias que proporciona la temperatura en los
puntos dentro de la malla, utilizando valores vecinos. De hecho si
conocemos la distribución inicial de la temperatura, podemos calcular esta,
en un tiempo posterior, ya que la ecuación 7.3.21 se presenta de esa
manera, incluso podríamos relacionarla, por su forma, con la ecuación del
método de Euler para solución de ecuaciones diferenciales ordinarias.
Al tipo de ecuación 7.3.21 se le conoce como fórmula o método explicito al
hacer el siguiente acomodo:
Ti 1, j   Ti , j 1  (1  2 )Ti , j   Ti , j 1
(7.3.22)
donde los coeficientes de 7.3.22 pueden interpretarse como probabilidades
1
en el caso de que 0   
ya que suman 1 y su valor esta entre 0 y 1.
2
175
De la ecuación 7.3.20 o 7.3.21 se desprende otro método de solución
denominado método implícito.
Aquí se realiza una interpolación lineal de la solucion de los puntos vecinos
del mallado donde la solucion en los puntos no dependen exclusivamente de
la solución lograda en el instante inmediato anterior, sino que obedece de la
solución de los otros puntos en el mismo tiempo, con estas condiciones se
requiere de la resolución de un sistema lineal de ecuaciones.
El método implícito consiste en despejar vi,j de 7.3.22
 vi 1, j 1  (1  2 )vi 1   vi 1, j 1  vi , j
(7.3.23)
donde se tiene que resolver el siguiente sistema de ecuaciones lineales:
 vi 1, jmin 
0
0
0   vi 1, jmin 1   vi , jmin 1 
1  2 
 




v
0
0   i 1, jmin  2   vi , jmin  2 
 0 
  1  2 
 0 
 0
 1  2
0
0   vi 1, jmin 3   vi , jmin 3 
























 0

vi 1, jmin  2
v
0 
0
0
1  2 
  i , jmin 2 



 
 vi 1, j 
0
0
 1  2   vi 1, jmin 1   vi , jmin 1 
 0

min 
cuya solucion es única ya que la matriz del sistema anterior es dominante e
invertible.
También podemos obtener otros métodos semi-implícitos con la
combinación del método implícito y explicito, por ejemplo
vi 1, j  vi , j
t

vi 1, j 1  2vi 1, j  vi 1, j 1
 x 
2
 (1   )
vi , j 1  2vi , j  vi , j 1
 x 
2
(7.3.24)
donde λ es un valor de ponderación, ya que si λ = 0 obtenemos el modelo
explicito y si λ = 1 obtenemos el modelo implícito.
176
Un caso especial es cuando el valor de λ = ½ , el cual proporciona un
esquema implícito alterno que es exacto tanto en espacio como en tiempo.
Este método se conoce con el nombre de Crank-Nicoloson
Si se realiza un mallado variable, esto nos permitirá efectuar un refinado en
las zonas donde se quiere reducir el error de aproximación, mientras que se
puede mantener una malla más gruesa en zonas donde el error de
aproximación es pequeño. Si realizamos una elección de mallado de manera
inteligente tendremos un método de valoración eficiente y preciso.
PROBLEMAS CAPÍTULO VII
1.- Resolver la siguiente ecuación diferencial parcial:
2u 2u

0
x 2 y 2
sujeta a las siguientes condiciones:
0 < x < 1, 0 < y < 1, u(x , 0) = 00, u(0 , y) =1000, u(x,1) = 1500,
u(1,y )=(150 y) 0.
2.- Resolver la siguiente ecuación diferencial parcial:
177
2u 2u

0
x 2 y 2
sujeta a las siguientes condiciones:
0 < x < 0.5, 0 < y < 0.5, u(x , 0) = 00, u(0 , y) =1000, u(x,1) = 1500,
u(1,y )=100 0.
3.- Resolver el problema 2 si la placa tiene el extremo inferior aislado.
4.- Utilizando los valores del problema 2 determine la distribución de flujo
de calor en los puntos a) i=j=1, b) i=j=2, para la placa de aluminio de
cal
50x50 cm., como muestra la figura 7.4. Tome κρC = 0.49
s  cm 0 C
178
Descargar