Método de Newton

Anuncio
1
CAPÍTULO 5
ECUACIONES NO LINEALES
Evaluación de funciones.
Métodos de evaluación de funciones:
Método de bisección
Regula Falsi
Punto fijo
Newton–Rapson
Secante
a) polinómicas,
b) series,
c) exponenciales,
d) logarítmicas,
e) trigonométricas,
f) hiperbólicas,
g) funciones arco, etc.
Estimación de errores en la evaluación.
Resolución numérica de ecuaciones.
2
CAPÍTULO 5
ECUACIONES NO LINEALES
INTRODUCCION
Uno de los problemas que frecuentemente ocurren en los trabajos científicos es calcular
las raíces de una determinada ecuación de la forma 𝑓(𝑥) = 0. Donde 𝑓(𝑥) puede ser un
polinomio en 𝑥 o una función trascendente.
En algunos casos es posible hallar la raíz exacta de 𝑓(𝑥) = 0, esto ocurre con los
polinomios factorables.
Por medio de métodos numéricos es posible obtener una solución aproximada, en algunos
casos, tan próxima como se desee de la solución exacta.
La mayoría de los procedimientos numéricos generan una secuencia de aproximaciones,
algunas con mayor precisión que otras, algunas aproximándose con mayor rapidez a la
solución buscada, de tal forma que la repetición de procedimientos produce una
aproximación al valor verdadero definido por una tolerancia prefijada.
Estos procedimientos son semejantes al concepto de límite del análisis matemático, pues
normalmente el resultado obtenido de una operación por medio de métodos numéricos se
acerca tanto como se desee al valor verdadero, sin llegar casi nunca al valor exacto.
Para el inicio del estudio de las funciones o ecuaciones no lineales es importante contar
con algunas herramientas fundamentales para el estudio de las funciones no lineales.
Una característica principal de los métodos numéricos es que casi nunca arrojan
resultados exactos, por lo tanto, en la mayoría de los casos, si no en todos, se obtienen
resultados aproximados, que siempre dependerán de la precisión que se desee.
Teorema 5.1.
Si una función continua 𝑓(𝑥) asume valores de signos opuestos en los puntos extremos del
intervalo [𝑎, 𝑏], esto es, si 𝑓(𝑎) × 𝑓(𝑏) < 0, entonces existe por lo menos un punto 𝑥 ∗ ∈
[𝑎, 𝑏], tal que 𝑓(𝑥 ∗ ) = 0.
Este teorema se presenta sin demostración.1
Teorema 5.2. Teorema de Descartes
El numero de raíces positivas de una ecuación 𝑓(𝑥) = 0 es menor o igual que el numero de
variaciones de signo en 𝑓(𝑥). El numero de raíces negativas es menor o igual que el
numero de variaciones de signo en 𝑓(−𝑥). (Cada raíz se cuenta tantas veces como indica
su orden de multiplicidad).
Este teorema se presenta sin demostración.2
1- La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007.
Análisis Numérico, Notas de clase. Colombia. Pág. 28
2. La demostración de este teorema en: Bernis, Francisco. Malet, Antonio. Molinas, Cesar. 1983.
Matemáticas. Editorial Noger S.A. Madrid, España. Pág. 468.
3
Teorema 5.2. Teorema de Bolzano
Sean 𝑎 < 𝑏 y sea 𝑓(𝑎) × 𝑓(𝑏) < 0 (𝑓(𝑎) 𝑦 𝑓(𝑏) tienen signos opuestos). Entonces 𝑓
tiene en [𝑎, 𝑏] un número impar de raíces. Si 𝑓(𝑎) × 𝑓(𝑏) > 0, entonces 𝑓 tiene un numero
par de raíces en [𝑎, 𝑏] (y en particular puede tener cero). Cada raíz se cuenta tantas veces
como indica su orden de multiplicidad.
Este teorema se presenta sin demostración.3
Teorema 5.2. Teorema de Fermat
Si 𝑓(𝑐) es un punto extremo de una función 𝑓 en un intervalo [𝑎, 𝑏], 𝑐 está en el interior de
[𝑎, 𝑏] y 𝑓(𝑐) existe, entonces 𝑓 ′ (𝑐) = 0.
Este teorema se presenta sin demostración.4
Teorema 5.3.
Si 𝑓 es continua en un intervalo cerrado [𝑎, 𝑏]; entonces existe un punto 𝑥0 ∈ [𝑎, 𝑏] para el
cual 𝑓(𝑥0 ) ≥ 𝑓(𝑥) ∀𝑥 ∈ [𝑎, 𝑏].
La demostración de este teorema se deja como ejercicio al lector.
Teorema 5.4.
Si 𝑓 es continua en un intervalo cerrado [𝑎, 𝑏]; entonces existe un punto 𝑥′0 ∈ [𝑎, 𝑏] para
el cual 𝑓(𝑥′0 ) ≤ 𝑓(𝑥) ∀𝑥 ∈ [𝑎, 𝑏].
Teorema 5.5. Teorema de Rolle
Si 𝑓 es continua en un intervalo cerrado [𝑎, 𝑏]; diferenciable en el intervalo abierto (𝑎, 𝑏) y
𝑓(𝑎) = 𝑓(𝑏), entonces existe un número 𝑐 ∈ (𝑎, 𝑏), tal que 𝑓 ′ (𝑐) = 0
Este teorema se presenta sin demostración.5
Teorema 5.5’. Teorema de Rolle
Entre dos raíces consecutivas de una ecuación algebraica 𝑓(𝑥) = 0, existe un numnero
impar de ceros de la derivada 𝑓′, contando cada uno de ellos tantas veces como indique su
orden de multiplicidad.
Corolario
Entre dos raíces consecutivas de la derivada no pueden existir dos raíces distintas de
𝑓(𝑥) = 0, porque si existieran, 𝑓′ tendría una raíz intermedia.
Teorema 5.6. Teorema del Valor Medio
Si 𝑓 es continua en un intervalo cerrado [𝑎, 𝑏] y diferenciable en el intervalo abierto (𝑎, 𝑏)
existe un número 𝑐 ∈ (𝑎, 𝑏), tal que 𝑓(𝑏) − 𝑓(𝑎) = 𝑓 ′ (𝑐)(𝑏 − 𝑎)
3. La demostración de este teorema en: Bernis, Francisco. Malet, Antonio. Molinas, Cesar. 1983.
Matemáticas. Editorial Noger S.A. Madrid, España. Pág. 469.
4. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007.
Análisis Numérico, Notas de clase. Colombia. Pág. 28.
5. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007.
Análisis Numérico, Notas de clase. Colombia. Pág. 29.
4
Este teorema se presenta sin demostración.6
Teorema 5.7. Teorema del valor Intermedio
Si 𝑓 es continua en un intervalo cerrado [𝑎, 𝑏], 𝑓(𝑏) ≠ 𝑓(𝑎) y 𝑘 un numero cualquiera
entre 𝑓(𝑎) y 𝑓(𝑏), entonces existe un numero 𝑐 ∈ (𝑎, 𝑏), tal que 𝑓(𝑐) = 𝑘
Este teorema se presenta sin demostración.7
Preguntas siguientes:
1. >Cómo se elige la aproximación inicial x0?
2. >Cómo se construye la sucesión fxk
g de aproximaciones?
3. >Cómo se decide si xk es una aproximación suficientemente buena a x_?
Estas preguntas se responden a lo largo del capítulo. De momento, y para terminar este
apartado de introducción, se presentan dos ejemplos de la ecuaci_on 5.1.
5
Definición 5.1.
Si 𝑓: [𝑎, 𝑏] → ℝ es una función dad, un punto 𝑥 ∗ ∈ [𝑎, 𝑏] es un cero (o raíz) de 𝑓 si 𝑓(𝑥 ∗ ) =
0
Grafica de funciones, un método para hallar intervalos.
Las graficas ayudan enormemente en la búsqueda de los ceros o raíces de una función,
pues si no se conoce el intervalo que contiene la raíz de dicha función, es difícil iniciar
cualquier proceso en búsqueda de solución.
Seguidamente se presentan algunas graficas y las explicaciones que necesarias para
adentrarse a la solución de ecuaciones no lineales.
Ejemplo 5.1.
Hallar el intervalo que contiene una raíz de la función 𝑓(𝑥) = 𝑒 −𝑥 − cos 𝑥
Solución 1
Se grafica la función 𝑓(𝑥) = 𝑒 −𝑥 − cos 𝑥
6. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007.
Análisis Numérico, Notas de clase. Colombia. Pág. 29.
7. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007.
Análisis Numérico, Notas de clase. Colombia. Pág. 30.
5
y
1.5
1
0.5
x
-1
-0.5
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
-0.5
-1
Fig. 5.1.
-1.5
Según la grafica de la función, se tiene una raíz en el intervalo [1; 1.5] y otra raíz en
[4.5; 5].
Observación: Al ser cos 𝑥 una función periódica, esta ecuación tiene infinitas soluciones.
Solución 2
Sea la función 𝑓(𝑥) = 𝑒 −𝑥 − cos 𝑥 = 0, implica que 𝑒 −𝑥 − cos 𝑥 = 0,
Si 𝑒 −𝑥 − cos 𝑥 = 0,
⟹
𝑒 −𝑥 = cos 𝑥,
si 𝑦1 = 𝑦2
−𝑥
𝑦1 = 𝑒
y
𝑦2 = 𝑐𝑜𝑠 𝑥. Se grafican en un mismo plano, se tiene la fig. 5.1.
2
y
𝒚𝟏 = 𝒆−𝒙
1.5
𝒚𝟐 = 𝒄𝒐𝒔 𝒙.
1
0.5
x
0.5
1
1.5
2
2.5
-0.5
La intersección de las dos curvas es un cero de la función sobre 𝑥, lo cual indica que uan
raíz se encuentra en el intervalo [1; 1.5], como en el caso anterior.
Comentarios
Si se realiza la grafica a escala y ésta está bien definida (una grafica muy bien hecha), se
puede estimar un intervalo más reducido como [1.2; 1.4], con esto se aceleraría
notablemente el proceso de llegar a la aproximación más deseada, pues se usaría menos
iteraciones, o sea, se resolvería el ejercicio en menor paso.
Gráficamente, los ceros de una función son los puntos de intersección de la grafica 𝑦 =
𝑓(𝑥) con el eje de las 𝑥.
6
5.1.1. Métodos cerrados
Los métodos numéricos que en cada paso dan un intervalo cerrado donde se encuentra la
raíz buscada, son llamados métodos cerrados. Entre los más conocidos se encuentran el
método de bisección y el método de la falsa posición o Regula Falsi.
5.1. Método de bisección
Definición 5.1.
Sea f una función continua en un intervalo [𝑎, 𝑏] y 𝑓(𝑎) × 𝑓(𝑏) < 0. Entonces, por el
teorema del valor intermedio para funciones continuas, existe al menos un 𝛼 ∈ (𝑎, 𝑏) tal
que 𝑓(𝛼) = 0.
El método de la bisección es un algoritmo de búsqueda de raíces que aplicando la función
𝑓 para aproximar la raíz 𝛼 ∈ [𝑎, 𝑏] consiste en dividir sucesivamente al intervalo a la
mitad y seleccionando el sub-intervalo que tiene la raíz. Es un método de búsqueda
incremental que divide el intervalo siempre en 2.
Si la función cambia de signo sobre un intervalo, se evalúa el valor de la función en el
punto medio. La posición de la raíz se determina situándola en el punto medio del subintervalo donde exista cambio de signo, basándose en el teorema de Bolzano. El proceso se
repite hasta mejorar la aproximación.
Supóngase que se desea resolver la ecuación 𝑓(𝑥) = 0, donde f es una función continua.
Dados dos puntos a y b tal que f(a) y f(b) tengan signos distintos, es sabido por el Teorema
de Bolzano que f debe tener, al menos, una raíz en el intervalo [a, b]. El método de
bisección divide el intervalo en dos, usando un tercer punto c = (a+b) / 2. En este
momento, existen dos posibilidades: f(a) y f(c), ó f(c) y f(b) tienen distinto signo. El
algoritmo de bisección se aplica al sub-intervalo donde el cambio de signo ocurre.
El método de bisección no es muy eficiente, pero es mucho más seguro que otros métodos
de aproximación de raíces, pues siempre converge hacia el valor buscado.
Si f es una función continua en el intervalo [a, b] yf(a)f(b) < 0, entonces este
método converge a la raíz de f. De hecho, una cota del error absoluto es:
|𝑏−𝑎|
2𝑛

Encontrar dos números a y b con a  b en los cuales el polinomio P toma valores
cuyos signos son distintos.

Considerando que x1 
ab
es el punto medio del intervalo [a, b].
2
Si P(x1) = 0, x1 es la raíz buscada, si P(x1)  0 entonces:


Se elige uno de los intervalos [a, x1] o [x1, b] de tal manera que los extremos del
intervalo del polinomio tome valores cuyos signos sean distintos.
Se repite el procedimiento en el intervalo elegido.
Observaciones:

La longitud del intervalo es una estimación del error cometido al aproximar la raíz.
7

La única restricción para elegir a y b es que los valores P(a) y P(b) tengan signos
distintos, en general, entre más pequeña sea la longitud del intervalo, en menor
número de pasos se encontrará la aproximación deseada.

Este método se aplica en la busca de raíces tanto racionales como irracionales.
Teorema 5.7. Teorema de Weierstrass
Una sucesión creciente y acotada superiormente tiende a un límite, y una sucesión
decreciente y acotada inferiormente tiende a un límite.
Teorema 5.8. Teorema de convergencia
Sea 𝑓 ∈ [𝑎, 𝑏] 𝑦 𝑓(𝑎)𝑓(𝑏) < 0. Sea {𝑐𝑛 }∞
𝑛=0 la sucesión de puntos medios generada por el
método de búsqueda binaria (método de bisección). Existe 𝑟 ∈ [𝑎, 𝑏], tal que 𝑓(𝑟) = 0 y
además:
𝑏−𝑎
|𝑟 − 𝑐𝑛 | ≤ 𝑛+1 ,
en particular {𝑐𝑛 }∞
𝑛=0 coverge a 𝑟
2
Este teorema se presenta sin demostración.8
Ejemplo 5.1.
Aproximar con al menos una cifra exacta la raíz del polinomio 𝑃(𝑥) = −6𝑥 3 + 𝑥 − 6.
Solución:
Para encontrar el intervalo que contiene una raíz de la función, la forma más simple es
graficando dicha función. Fig. 5.1.
y
2
1
x
-2.5
-2
-1.5
-1
-0.5
0.5
1
1.5
2
2.5
-1
-2
-3
-4
-5
-6
8. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007.
Análisis Numérico, Notas de clase. Colombia. Pág. 39.
8
Fig. 5.1.
Según la grafica, una raíz de la ecuación se encuentra en el intervalo [– 2, – 1].
Se inicia la búsqueda de la raíz de este polinomio en el intervalo [– 2, – 1].
Sea el polinomio 𝑃(𝑥) = −6𝑥 3 + 𝑥 − 6
Evaluando en 𝑃(−2) = −6(−2)3 + (−2) − 6 = 40 > 0
𝑃(−1) = −6(−1)3 + (−1) − 6 = −1 < 0
𝑃(−2) 𝑃(−1)
+
−
Así:
El punto medio del intervalo [– 2, – 1] es
x1 
 2 1
3
  = – 1,5
2
2
Evaluando en 𝑃(−1,5) = −6(−1,5)3 + (−1,5) − 6 = 20,25 − 1,5 − 6 = 12,75 > 0
𝑃(−2)
𝑃(−1,5)
+
+
𝑃(−1)
−
La raíz se encuentra en el intervalo [−1,5; −1]. La longitud del intervalo es: −1 + 1,5 = 0,5
El punto medio del nuevo intervalo es: x2 
 1,5  1
2,5

= – 1,25
2
2
Evaluando en P(–1,25) = – 6 (– 1,25)3 + (–1,25) – 6 = 11,719 – 1,25 – 6 = 4,469  0
P(– 1,5) P(– 1,25) P(– 1)
+
+
–
La raíz se encuentra en [– 1,25; – 1]. La longitud del intervalo es: – 1 + 1,25 = 0,25
Se repite el procedimiento: x3 
 1,25  1
2,25

= – 1,125
2
2
Evaluando en P(–1,125) = – 6 (– 1,125)3 + (–1,125) – 6 = 8,543 – 1,125 – 6 = 1,418  0
P(– 1,25) P(– 1,125) P(– 1)
+
+
–
La raíz se encuentra en el intervalo [– 1,125; – 1]. La longitud del intervalo es: 0,125
De manera análoga x4 
 1,125  1
2,125

= – 1,0625
2
2
9
Evaluando P(–1,0625) = – 6(– 1,0625)3 + (–1,0625) – 6 = 7,1968 – 1,0625 – 6 = 0,1343 
0
P(– 1,025) P(– 1,0625) P(– 1)
+
+
–
La raíz se encuentra en el intervalo [– 1,0625; – 1]. La longitud del intervalo es: 0,0625
Repitiendo un paso más el mismo procedimiento, se obtiene la siguiente tabla:
Intervalo
[– 2; – 1].
[– 1,5; – 1].
[– 1,25; – 1].
[– 1,125; – 1].
[– 1,0625; – 1].
[– 1,0625; – 1,0313].
Punto medio xn
– 1,5
– 1,25
– 1,125
– 1,0625
– 1,0313
– 1,0468
P(xn)
12,75
4,46
1,418
0,134
– 0,45008
– 0,16436
signo
+
+
+
+
–
–
Error
1
0,5
0,25
0,125
0,0625
0,03125
Como −1,0625 y − 1,0313 tienen un 0 en la primera cifra decimal, cualquier punto
intermedio lo tiene, es decir, la primera cifra decimal de la raíz buscada es cero, lo cual
asegura que la aproximación obtenida tiene una cifra decimal exacta.
Comentario
Una desventaja es que en general la convergencia es muy lenta, la bisección necesita, para
obtener una buena aproximación, muchos más pasos que cualquiera de los otros métodos
que veremos después. Pero estos métodos, para converger, necesitan que la primera
aproximación que se toma, c1, esté cerca de la solución exacta de la ecuación. En
consecuencia, el procedimiento usual es éste: se usan unos pocos pasos de la bisección
para acercarse a c y a partir de allí se usa cualquiera de los otros métodos de convergencia
rápida.
Método de Regula Falsi o Falsa Posición
Este método de aproximación de raíces es similar al método de bisección en el sentido de
que se generan sub-intervalos [𝑎𝑛 , 𝑏𝑛 ] que encierran a la raíz 𝛼, pero esta vez, 𝑥𝑛 no es el
punto medio de [𝑎𝑛 , 𝑏𝑛 ], sino el punto de intersección de la recta que pasa por los puntos
(𝑎𝑛 , 𝑓(𝑎𝑛 )); (𝑏𝑛 , 𝑓(𝑏𝑛 )) con el eje 𝑥.
10
Al reemplazar la curva por una recta se obtiene una posición falsa de la raíz, de ahí el
nombre el método. Este método también se conoce como método de interpolación lineal
inversa.
En la figura 5.1 se grafica el método
(b, 𝑓(𝑏))
𝑦 = 𝑓(𝑥)
a=a1
x1 =c
x2
𝛼
b=b1
Fig. 5.1
(𝑎, 𝑓(𝑎))
Sea 𝑓(𝑎)𝑓(𝑏) < 0 y considerando la recta que une los puntos (𝑎, 𝑓(𝑎)), (b, 𝑓(𝑏)) cuya
𝑓(𝑏)−𝑓(𝑎)
,
𝑏−𝑎
𝑎−𝑓(𝑏)
también 𝑚 = 𝑐−𝑎 ,
pendiente es 𝑚 =
pero si (c, 0) es el punto de intersección de la recta X,
entonces
luego:
𝑓(𝑏) − 𝑓(𝑎) 0 − 𝑓(𝑏)
=
,
𝑏−𝑎
𝑐−𝑏
𝐴𝑠𝑖: 𝑐 =
o sea
𝑐−𝑏 =
−𝑓(𝑏)(𝑏 − 𝑎)
𝑓(𝑏)(𝑏 − 𝑎)
,⟹ 𝑐 = 𝑏 −
𝑓(𝑏) − 𝑓(𝑎)
𝑓(𝑏) − 𝑓(𝑎)
𝑏𝑓(𝑏) − 𝑏𝑓(𝑎) − 𝑏𝑓(𝑏) + 𝑎𝑓(𝑏)
𝑎𝑓(𝑏) − 𝑏𝑓(𝑎)
, 𝑜: 𝑐 =
𝑓(𝑏) − 𝑓(𝑎)
𝑓(𝑏) − 𝑓(𝑎)
Así como el método de bisección, este método de falsa posición, también tienen tres
posibilidades: 𝑓(𝑐) = 0, 𝑓(𝑎)𝑓(𝑐) < 0, 𝑓(𝑏)𝑓(𝑐) < 0
a) Si 𝑓(𝑐) = 0, entonces c es un cero de 𝑓.
b) Si 𝑓(𝑎)𝑓(𝑐) < 0, entonces existe un cero de 𝑓 en [𝑎, 𝑐].
c) Si 𝑓(𝑐)𝑓(𝑏) < 0, entonces existe un cero de 𝑓 en [𝑐, 𝑏].
De todo esto se desprende un proceso iterativo que se concreta generalizándolo en la
siguiente expresión matemática.
𝑐𝑛 =
𝑎𝑛 𝑓(𝑏𝑛 ) − 𝑏𝑛 𝑓(𝑎𝑛 )
, 𝑛 = 0, 1, 2, 3, …
𝑓(𝑏𝑛 ) − 𝑓(𝑎𝑛 )
Ejemplo 5.2.
Aplicar el método de falsa posición para encontrar un cero de 𝑓(𝑥) = ln 𝑥 + 𝑥, en el
intervalo [0.5; 1]
Solución
Sea la función 𝑓(𝑥) = ln 𝑥 + 𝑥,
11
Inicio: Se construye una tabla por mejor organización de los datos.
𝑓(𝑎)
𝑎
𝑏 𝑓(𝑏)
0.5 −0.1931472 1 1
𝑐𝑛 =
𝑎𝑛 𝑓(𝑏𝑛 ) − 𝑏𝑛 𝑓(𝑎𝑛 )
𝑓(𝑏𝑛 ) − 𝑓(𝑎𝑛 )
𝑐1 =
0.5 × 1 − 1 × (−0.1931472) 0.5 + 0.1931472 0.6931472
=
=
= 𝟎. 𝟓𝟖𝟎𝟗𝟒
1 − (−0.1931472)
1.1931472
1.1931472
⟹ 𝑐1 =
𝑎𝑓(𝑏) − 𝑏𝑓(𝑎)
𝑓(𝑏) − 𝑓(𝑎)
Iteración 1: Reorganizando los datos en una segunda tabla se tiene:
𝑓(𝑎)
𝑓(𝑐1 )
𝑎
𝑏 𝑓(𝑏) 𝑐1
0.5 −0.1931472 1 1
0.58 0.0352728
Para esta siguiente operación, se toma el intervalo cerrado [𝑎, 𝑐1 ], pues poseen signos
contrarios uno respecto del otro y se cumple el teorema de Bolzano 𝑓(𝑐1 )𝑓(𝑎) < 0
𝑐2 =
𝑎𝑓(𝑐1 ) − 𝑐1 𝑓(𝑎) 0.5 × 0.0352728 − 0.58 × (−0.1931472)
=
𝑓(𝑐1 ) − 𝑓(𝑎)
0.0352728 − (−0.1931472)
𝑐2 =
0.0189975 + 0.112025 0.1310225
=
= 𝟎. 𝟓𝟕𝟑𝟔
0.22842
0.22842
Iteración 2: Una nueva reorganización de los datos obtenidos permite la siguiente tabla:
𝑓(𝑎)
𝑓(𝑐1 )
𝑓(𝑐2 )
𝑎
𝑐1
𝑐2
0.5 −0.1931472 0.58 0.0352728 0.5736 0.017777
Se toma el intervalo [𝑎, 𝑐2 ], pues poseen signos opuestos, o sea, 𝑓(𝑐2 )𝑓(𝑎) < 0
𝑐3 =
𝑎𝑓(𝑐2 ) − 𝑐2 𝑓(𝑎) 0.5 × 0.017777 − 0.5736 × (−0.1931472)
=
𝑓(𝑐2 ) − 𝑓(𝑎)
0.017777 − (−0.1931472)
𝑐3 =
0.0088885 + 0.110789 0.1196775
=
= 𝟎. 𝟓𝟔𝟕𝟒𝟔𝟎𝟖𝟖
0.2109
0.2109
Iteración 3: Se construye de nuevo la tabla y se tiene:
𝑓(𝑎)
𝑓(𝑐2 )
𝑓(𝑐3 )
𝑎
𝑐2
𝑐3
0.5 −0.1931472 0.5736 0.017777 0.5674608 0.00087498
Realizando un análisis del error del ejercicio se tiene:
El valor exacto de 𝑥 para 𝑓(𝑥) = 𝑙𝑛 𝑥 + 𝑥 , es: 𝟎. 𝟓𝟔𝟕𝟏𝟒𝟑𝟐𝟗
12
𝐸 = 𝑉𝑣 − 𝑉𝑎 = 0.56714329 − 0.5674608 = 𝟎. 𝟎𝟎𝟎𝟑𝟏𝟕𝟓 = 𝟑. 𝟏𝟕𝟓 × 𝟏𝟎−𝟒
𝐸𝑟 =
𝐸 𝑉𝑣 − 𝑉𝑎
0.0003175
=
=
= 𝟎. 𝟎𝟎𝟎𝟓𝟓𝟗𝟖𝟒 = 𝟓. 𝟓𝟗𝟖𝟒 × 𝟏𝟎−𝟒
𝑉𝑣
𝑉𝑣
0.56714329
𝑉𝑣 − 𝑉𝑎
(%) = 100 × 𝟓. 𝟓𝟗𝟖𝟒 × 𝟏𝟎−𝟒 (%) = 𝟎. 𝟎𝟓𝟓𝟗𝟖%
𝑉𝑣
Este ejercicio tiene una precisión de tres decimales, o sea los primeros tres decimales
corresponden al valor exacto o valor verdadero.
𝐸% = 100 ×𝐸𝑟 (%) = 100 ×
Ejemplo 5.2.
Aplicar el método de falsa posición para encontrar un cero de 𝑓(𝑥) = 𝑥 4 − 2𝑥 3 − 4𝑥 2 +
4𝑥 + 4, en el intervalo [1, 2]
Solución
𝑓(𝑥) = 𝑥 4 − 2𝑥 3 − 4𝑥 2 + 4𝑥 + 4
Sean: 𝑎 = 1 y 𝑏 = 2
𝑐 =𝑏−
𝑎𝑓(𝑏) − 𝑏𝑓(𝑎)
1𝑓(2) − 2𝑓(1)
=𝑐=𝑏−
=
𝑓(𝑏) − 𝑓(𝑎)
𝑓(2) − 𝑓(1)
Método de Punto fijo
MÉTODOS ABIERTOS
A diferencia de los métodos cerrados que requieren de un intervalo que encierre la raíz
buscada, los métodos abiertos que se verán a continuación requieren de un solo valor o
dos valores iniciales o valores de arranque, que no necesariamente encierran a la raíz,
esto hace que algunas veces las sucesiones generadas por estos métodos sean divergentes
o se alejen de la raíz de interés, pero tiene la ventaja que cuando convergen lo hacen más
rápidamente que las sucesiones generadas por los métodos cerrados.
Método de Newton
Uno de los métodos más atractivos y populares para la búsqueda de los ceros de una
función no lineal es el método de Newton, debido a la rápida convergencia del método, ya
que en general es q-cuadrático.
Existe varias maneras de deducir el método de Newton, el método a ser presentado se
base en el método de iteración lineal.
Éste es, sin duda, uno de los métodos más importantes y útiles para el cálculo de raíces.
Dada una aproximación inicial de la raíz 𝑥0 , se busca, a partir de 𝑥0 , una aproximación
mejor 𝑥1 de la raíz, de la siguiente forma: Se sustituye la función 𝑓(𝑥) por el valor de su
desarrollo de Taylor centrado en 𝑥0 hasta el orden 1, es decir: 𝑓(𝑥) = 𝑓(𝑥0 ) + 𝑓 ′ (𝑥0 )(𝑥 −
13
𝑥0 ) que corresponde a un polinomio de grado 1, y a continuación se calcula 𝑥1 como el cero
de este polinomio, es decir:
𝑓(𝑥0 )
𝑓 ′ (𝑥0 )
y por tanto, de forma general, se obtiene, a partir de 𝑥0 una secuencia 𝑥𝑛 de valores que van
𝑥1 = 𝑥0 −
aproximando la raíz, definidos por
𝑥𝑛+1 = 𝑥𝑛 −
𝑓(𝑥𝑛 )
𝑓 ′ (𝑥𝑛 )
Definición.
Dada una ecuación 𝑓(𝑥) = 0. Un número 𝛼 se dice una raíz de multiplicidad m (m un
entero positivo) de la ecuación 𝑓(𝑥) = 0, si 𝑓(𝛼) = 0. Si m = 1, la raíz se dice simple.
Teorema
Sea que una función 𝑓 tiene sus dos primeras derivadas continuas en un intervalo [𝑎, 𝑏]
que contiene a un número 𝛼. Entonces 𝛼 es una raíz simple de la ecuación 𝑓(𝑥) = 0 si y
solo si 𝑓(𝛼) = 0 𝑦 𝑓′(𝛼) ≠ 0.
Este teorema se presenta sin demostración.9
Teorema
Sea que la función 𝑓 tiene sus primeras 𝑚 + 1 derivadas continuas en un intervalo [𝑎, 𝑏]
que contiene a un número 𝛼. Entonces 𝛼 es una raíz de multiplicidad m de la ecuación
𝑓(𝑥) = 0 si y solo si
Sea 𝑓 ∈ 𝐶 𝑚+1 [𝑎, 𝑏], una función diferenciable en [𝑎, 𝑏] y sea 𝑥0 ∈ [𝑎, 𝑏], entonces para todo
𝑥 ∈ (𝑎, 𝑏), se sabe por el Teorema de Taylor que 𝑓 se puede escribir de la forma:
𝑓 ′′ (𝑥0 )(𝑥 − 𝑥0 )2 𝑓 ′′ ′(𝑥0 )(𝑥 − 𝑥0 )3
+
+⋯
2!
3!
Sea 𝑓(𝑥) = 0 una ecuación y 𝑥0 un primer valor aproximado a una raíz 𝜑 de una ecuación.
Este método consiste en obtener una aproximación a 𝜑 calculando el punto en que la
tangente de la curva en (𝑥0 ; 𝑓(𝑥0 )) corta al eje X. Gráficamente se ve en la fig. 5.7.
𝑓(𝑥) = 𝑓(𝑥0 ) + 𝑓 ′ (𝑥0 )(𝑥 − 𝑥0 ) +
2
y
1.5
9. La demostración de este teorema en: Velázquez Zapateiro, Jorge y Obeso Fernández, B. 2007.
Análisis Numérico, Notas de clase. Colombia. Pág. 57.
1
0.5
x
0.5
1
1.5
2
2.5
3
3.5
14
Fig. 5.7
EJERCICIOS DE FIJACIÓN
E) Encuentra las raíces racionales del polinomio en cada caso.
1)
24x3 – 26x2 + 9x – 1
2)
24x3 – 22x2 – 5x + 6
3)
x3 + 5x2 – 8x + 3
4)
3x5 – 4x4 – 2
5)
5x5 – 2x2 – 6x – 5
6)
x5 – 6x3 – 5x + 5
7)
16x4 + 16x3 – 64x2 – 4x + 15
15
8)
27x4 + 63x3 – 57x2 – 7x + 6
9)
7x4 – 4x3 + 3x2 – 20x – 9
10) 40x4 + 202x3 + 3x2 – 34x + 5
11) 30x4 – 67x3 + 7x2 + 16x – 4
12) –5x5 + 4x3 – 11x2 + 17
13) 2x4 – 13x3 – 83x2 + 442x + 240
14) 36x5 – 12x4 – 95x3 – 50x2 – x + 2
15) 19x7 + 21x6 – 34x4 + 42x3 – 13x2 – 27x + 71
16) 64x5 – 56x4 – 242x3 + 223x2 – 56x + 4
17) 25x6 + 153x4 + 20x5 + 120x3 + 143x2 + 100x + 15
18) 18x6 + 111x5 + 17x4 – 114x3 – 666x2 – 102x + 36
19) 32x7 – 16x6 – 10x5 + 3x4 – 64x3 + 32x2 + 20x – 6
20) 25x6 + 14x5 – 12x4 + 34x3 – 8x2 + 63x – 21
21) x7 – 7x6 – 9x5 + 63x4 + x3 – 7x2 – 9x + 63
22) 24x8 – 10x7 – 3x6 + x5 + 24x3 – 10x2 – 3x + 1
23) 49x8 – 344x6 + 56x4 – 344x2 + 7
24) 16x8 + 12x7 + 12x6 + 73x5 + 44x4 + 45x3 + 36x2 – 16x – 12
25) 48x7 – 2x6 + 157x5 – 8x4 + 4x3 – 6x2 – 105x
26) x7 + 4x6 – 14x5 – 56x4 + 49x3 + 196x2 – 36x – 144
27) 54x7 + 9x6 – 294x5 – 49x4 + 444x3 + 74x2 – 144x – 24
28) 35x9 + 16x8 + 15x7 – 8x6 – 18x5 + 23x4 – 42x3 – 39x2 + 28x – 5
29) 15x9 + 8x8 – 74x7 – 40x6 – 5x5 + 45x4 + 24x3 – 222x2 – 120x – 15
16
F) Evalúa cada polinomio en el punto indicado utilizando la calculadora
30) 6x6 + 2x5 – 12x4 + 5x3 – 4x2 + 10x – 3
en x = – 3
31) X8 – 3x7 + 14x6 – 21x5 – 8x4 – 9x3 + 15x2 + 2x + 6 en x = 2
32) 9x7 + 4x5 + 20x4 – 12x3 + 17x2 – 23x + 35
en x = 4
33) 12x4 – 24x3 + 8x2 – 3x + 26
en x = 1,5
34) 7x9 + 2x4 – 8x – 19
en x = – 1,25
35) Prueba que
36) Prueba que
6 es un número irracional.
3
 4 es un numero irracional
G) Determina el número de raíces positivas y negativas de cada uno de los polinomios
siguientes:
37) P(x) = 2x4 + 3x3 – 7x2 – 12x – 4
38)
P(x) = 9x6 – x4 + 9x2 – 1
39) P(x) = – x3 + 9x2 – 15x – 25
40) P(x) = – x5 + 4x3 – x2 + 4
41) P(x) = 6x7 – 23x6 – 5x5 + 4x4 + 6x3 – 23
42) P(x) = 5x7 – 7x6 + 25x – 35
43) P(x) = 3x5 – 2x4 – 15x3 + 10x2 + 12x – 8
44) P(x) = 3x5 + 7x4 – 7x3 – 27x2 – 20x – 4
45) P(x) = 2x6 – 5x5 – 11x4 + 28x3 + 16x2 – 32x – 16
46) P(x) = 16x5 + 52x4 + 68x3 – 11x2 – 41x – 12
47) P(x) = 10x6 – 71x5 + 237x4 – 473x3 + 525x2 – 248x + 20
48) P(x) = 8x5 – 46x4 + 73x3 – 8x2 – 45x + 18
49) P(x) = 16x5 – 277x3 – 5x2 + 336x + 80
17
50) P(x) = 9x5 – 12x4 – 47x3 + 58x2 + 44x – 40
51) P(x) = 36x5 + 60x4 – 35x3 – 80x2 – x + 20
52) P(x) = 64x6 + 88x5 – 306x4 – 253x3 + 356x2 – 84x
53) P(x) = 75x7 + 70x6 + 21x5 + 2x4 + 75x3 + 70x2 + 21x + 2
54) P(x) = 54x7 – 63x6 + 21x5 – 2x4 – 54x3 + 63x2 – 21x + 2
55) P(x) = 125x7 – 150x6 + 55x5 – 6x4 + 250x3 – 300x2 + 110x – 12
56) P(x) = – 49x7 – 378x6 – 251x5 – 42x4 – 49x3 – 378x2 – 251x – 42
H) Mostrar que A es una cota inferior y B es una cota superior para las raíces del
polinomio dado y encontrar todas las raíces reales.
57) P(x) = 3x4 – 10x3 – 27x2 + 82x – 24;
A = – 4,
B=6
58) P(x) = 33x4 – 72x3 + 47x2 – 12x + 1
A = – 1,
B=3
59) P(x) = 3x5 – 22x4 + 22x3 + 16x2 – 25x + 6;
A = – 2,
B=8
60) P(x) = 10x5 + 63x4 – 328x3 + 403x2 – 168x + 20;
A = – 11,
B=4
61) P(x) = 4x3 – 56x2 + 259x – 396;
A = – 1,
B = 14
62) P(x) = x4 + 18x3 + 111x2 + 278x + 240;
A = – 18,
B=1
63) P(x) = x5 + 10x4 + 19x3 + 26x2 + 17x + 8;
A = – 10,
B=2
64) P(x) = x5 + 7x4 – 3x3 – 21x2 – 4x – 28;
A = – 8,
B=4
I) Encontrar en cada caso, un número entero que sea cota inferior y uno que sea cota
superior de las raíces del polinomio dado.
65) P(x) = x5 + 6x4 – 6x3 – 64x2 – 27x + 90
66) P(x) = x4 – 2x3 – 13x2 + 38x – 24
67) P(x) = x5 + 9x4 + 21x3 + 21x2 + 20x + 12
68) P(x) = x7 + 6x6 + 5x5 + 30x4 + 4x3 + 24x2
69) P(x) = 54x6 + 117x5 + 120x4 + 110x3 + 56x2 – 7x – 10
18
70) P(x) = 44x4 – 532x3 + 543x2 – 166x + 11
71) P(x) = 2x5 + 25x4 – 22x3 – 113x2 + 56x + 52
72) P(x) = 2x5 + 5x4 – 33x3 – 23x2 + 79x – 30
J) Usando el método de bisección, halla las raíces de los siguientes polinomios, en el
intervalo indicado, de tal forma que el error cometido sea menor a 0,01.
73) 4x3 – 5x2 + 4x – 5
en [1, 2]
74) 50x3 + 89x2 – 278x + 378
en [3, 4]
75) x4 – 30x3 + 81
en [5, 6]
76) 10x3 – 17x2 – 9x + 39
en [–2, –1]
77) x4 – 2x2 – 3
en [–2, –1]
78) x3 + 3x + 6
en [–2, –1]
79) x3 – 4x + 5
en [–3, –2]
80) x4 – 4x2 – 5
en [2, 3]
81) x3 + 5x – 1
en [0, 1]
82) 4x4 – 39x3 – 10
83) x5 + x3 – 50x2 – 50
84) x4 – 4x3 – 2x2 – 6x – 3
en [–4, –3]
en [3, 4]
en [–1, 0]
K) Encuentra las raíces de los siguientes polinomios usando el método de Newton,
tomando como primera aproximación el punto indicado. El error cometido debe ser
menor que 0,01.
85) – 6x6 + x5 – 4x2 – 2x + 8
si x1 = 1
86) x8 – 10x6 + 35x4 – 50x2 + 24
si x1 = – 1,8
87) x8 – x7 – 2x6 + 4x4 – 7x3 – 13x2 + 14x + 16
si x1 = 1
19
88) 4x6 + 4x5 – 15x4 – 4x2 – 4x + 15
si x1 = – 2
89) 8x6 – 8x5 + 72x4 – 71x3 – x2 + 9x – 9
si x1 = – 1
90) 2x5 – 25x4 + 80x3 – 110x2 + 70x – 17
si x1 = 9
91) x5 + 7x4 – 6x3 – 29x2 + 5x – 30
si x1 = – 2
92) x6 + 7x5 – 12x4 – 77x3 + 10x2 + 11
si x1 = – 3
93) 2x6 + 2x5 – 61x4 – 53x3 + 86x2 – 145x + 29
si x1 = 5
L) Encontrar en cada caso un polinomio con coeficientes enteros que satisfaga las
condiciones dadas.
94) Grado 3; raíces r1 = 2, r2 = (3 + i)
95) Grado 3; raíces r1 = 3, r2 = (6 – i)
96) Grado 4; raíces r1 = i, r2 = (2 +
2 i)
97) Grado 4; raíces r1 = 1 11 i, r2 = ( 1 11 i )
98) Grado 3; raíces r1 = – i, r2 = 7/3
99) Grado 3; raíces r1 = 3/5, r2 =
7 i
5 i, r2 =  5 i, r3 = i/6
100)
Grado 4; raíces r1 =
101)
Grado 6; raíces r1 = i, r2 = (1 + i), r3 = (2 + i)
102)
Grado 5; raíces r1 = (6 – 3i), r2 = (i + 7), r3 = 12
M) Encontrar las raíces del polinomio utilizando la raíz dada, en cada caso.
103)
x4 – x2 – 2
si
r1 = i
104)
x4 + 2x2 + 1
si
r1 = – i
105)
x4 – 6x3 + 15x2 – 18x + 10
si
r1 = (1 + i)
106)
x4 – 4x3 – 15x2 + 80x – 100
si
r1 = (2 – i)
107)
x4 – 2x3 – 2x2 + 12x – 24
si
r1 = 1 3i


20
108)
8x4 – 49x3 + 87x2 – x – 105
si
r1 = – 7/8
109)
x4 + 2x2 – 1
si
r1 =  i 1  2 
110)
x4 – 2x3 + 24x2 – 50x – 25
si
r1 = 5i
N) Encuentra las raíces del polinomio
111)
x3 – 1
112)
x3 + 6x – 7
113)
x3 + 2x + 3
114)
4x4 + 4x3 + x2 – 18x – 9
115)
9x3 – 5x2 + 27x – 15
116)
5x3 + x2 + 40x + 8
117)
36x3 – 32x2 + 257x + 29
118)
3x3 + 7x2 + 80x + 26
119)
4x3 + 9x2 + 10x + 2
120)
3x3 + x2 + 3x + 1
121)
122)
2x3 – 7x2 + 30x + 17
x5 – x3 – x2 + 1
123)
x3 – 2x2 + 1
124)
x4 + x2 – 2
125)
x5 – 2x4 + 8x3 – 16x2 – 9x + 18
126)
3x5 + x4 + 72x3 + 24x2 – 75x – 25
127)
128)
129)
130)
131)
x7 – x6 – x5 – x4 – x3 – x2 – x – 1 en [ – 1, – 1 ]


21
PORTAPAPELES UTILES
P(x) = x7 – x6 – x5 – x4 – x3 – x2 – x – 1; A = – 1,
B=–1
P( x)  2x 4  3x 3  7 x 2 12x  4
Bibliografía:
Oteyza de Oteyza, Emma Lam Osnaya. Hernández Garciadiego, Carlos. Carrillo Hoyo, Ängel
Manuel. Temas Selectos de Matemáticas. Prentice Hall. México 1998.
Bernis, Francisco. Malet, Antonio. Molinas, Cesar. Curso de Orientación Universitaria
Matemáticas. Editorial Noguer. Madrid – España. 1983.
Método de Newton
De Wikipedia, la enciclopedia libre
El método de Newton, conocido también como el método de Newton-Raphson o el
método de Newton-Fourier es un algoritmo eficiente para encontrar aproximaciones de
los ceros o raíces de una función real. También puede ser usado para encontrar el
máximo o mínimo de una función, encontrando los ceros de su primera derivada.
Tabla de contenidos
[ocultar]







1 Descripción del método
2 Obtención del Algoritmo
3 Convergencia del Método
4 Ejemplo
5 Historia
6 Referencias
7 Enlaces externos
Descripción del método
22
La idea de este método es la siguiente: se comienza con un valor razonablemente
cercano al cero, denominado punto de arranque, entonces se reemplaza la función por la
recta tangente en ese valor, se iguala a cero y se despeja fácilmente, por ser una
ecuación lineal. Este cero será, generalmente, una aproximación mejor a la raíz de la
función. Luego, se aplican tantas iteraciones como se deseen.
Supóngase 𝑓: [𝑎, 𝑏] → ℝ función derivable definida en el intervalo real [a, b]. Se inicia
con un valor inicial x0 y se define para cada número natural 𝑘
𝑥𝑘+1 = 𝑥𝑘 −
𝑓(𝑥𝑘 )
𝑓 ′ (𝑥𝑘 )
Obtención del Algoritmo
Tres son las formas principales por las que tradicionalmente se ha obtenido el algoritmo
de Newton.
La primera de ellas es una simple interpretación geométrica. En efecto, atendiendo al
desarrollo geométrico del método de la secante, podría pensarse en que si los puntos de
iteración están lo suficientemente cerca (a una distancia infinitesimal), entonces la
secante se sustituye por la tangente a la curva en el punto. Así pues, si por un punto de
iteración trazamos la tangente a la curva, por extensión con el método de la secante, el
nuevo punto de iteración se tomará como la abscisa en el origen de la tangente (punto de
corte de la tangente con el eje X). Esto es equivalente a linealizar la función, es decir, f
se reemplaza por una recta tal que contiene al punto (x0, f (x0)) y cuya pendiente
coincide con la derivada de la función en el punto, f'(x0). La nueva aproximación a la
raíz, x1, se logra la intersección de la función linear con el eje X de ordenadas.
Matemáticamente:
23
Ilustración de una iteración del método de Newton (la función f se demuestra en azul y
la línea de la tangente está en rojo). Vemos que xn + 1 es una aproximación mejor que xn
para la raíz x de la función f.
En la ilustración adjunta del método de Newton se puede ver que xn + 1 es una mejor
aproximación que xn para el cero (x) de la función f.
Una forma alternativa de obtener el algoritmo es desarrollando la función f(x) en serie
de Taylor, para un entorno del punto xn:
Entonces, si se trunca el desarrollo a partir del término de grado 2, y evaluamos en xn + 1:
f(xn + 1) = f(xn) + f'(xn)(xn + 1 − xn)
Si además se acepta que xn + 1 tiende a la raíz, se ha de cumplir que f(xn + 1) = 0, luego,
sustituyendo en la expresión anterior, obtenemos el algoritmo.
Finalmente, hay que indicar que el método de Newton-Raphson puede interpretarse
como un método de iteración de punto fijo. Así, dada la ecuación f(x) = 0, se puede
considerar el siguiente método de iteración de punto fijo:
g(x) = x + h(x)f(x)
Se escoge h(x) de manera que g'(r)=0 (r es la raíz buscada). Dado que g'(r) es:
g'(r) = 1 + h'(r)f(r) + h(r)f'(r) = 1 + h(r)f'(r)
Entonces:
24
Como h8x) no tiene que ser única, se escoge de la forma más sencilla:
Por tanto, imponiendo subíndices:
Expresión que coincide con la del algoritmo de Newton-Raphson
Convergencia del Método
El radio de convergencia de este método es, por lo menos, cuadrático. Sin embargo, si la
raíz buscada es de multiplicidad algebraica mayor a uno (i.e, una raíz doble, triple,...), el
método de Newton-Raphson pierde su convergencia cuadrática y pasa a ser lineal de
constante asintótica de convergencia 1-1/m, con m la multiplicidad de la raíz.
Existen numerosas formas de evitar este problema, como pudieran ser los métodos de
aceleración de la convergencia tipo Δ² de Aitken o el método de Steffensen. Derivados
de Newton-Raphson destacan el método de Ralsta-Ravinovitz, que restaura la
convergencia cuadrática sin más que modificar el algoritmo a:
Evidentemente, este método exige conocer de antemano la multiplicidad de la raíz, lo
cual no siempre es posible. Por ello también se puede modificar el algoritmo tomando
una función auxiliar g(x)=f(x)/f'(x), resultando:
Su principal inconveniente en este caso sería lo costoso que pudiera ser hallar g(x) y
g'(x) si f(x) no es fácilmente derivable.
Por otro lado, la convergencia del método se demuestra cuadrática para el caso más
habitual en base a tratar el método como uno de punto fijo: si g'(r)=0, y g(r) es distinto
de 0, entonces la convergencia es cuadrática. Sin embargo, está sujeto a las
particularidades de éstos métodos.
25
Ejemplo
Consideremos el problema de encontrar un número positivo x tal que cos(x) = x3.
Podríamos tratar de encontrar el cero de f(x) = cos(x) - x3.
Sabemos que f '(x) = -sin(x) - 3x2. Ya que cos(x) ≤ 1 para todo x y x3 > 1 para x>1,
deducimos que nuestro cero está entre 0 y 1. Comenzaremos probando con el valor
inicial x0 = 0.5
Los dígitos correctos están subrayados. En particular, x6 es correcto para el número de
decimales pedidos. Podemos ver que el número de dígitos correctos después de la coma
se incrementa desde 2 (para x3) a 5 y 10, ilustando la convergencia cuadrática.
En pseudocódigo, esto es:
function newtonIterationFunction(x) {
return x - (cos(x) - x^3) / (-sin(x) - 3*x^2)
}
var x := 0.5
for i from 0 to 99 {
print "Iteraciones: " + i
print "Valor aproximado: " + x
xold := x
x := newtonIterationFunction(x)
if x = xold {
print "Solución encontrada!"
break
}
}
Historia [editar]
El método de Newton fue descrito por Isaac Newton en De analysi per aequationes
numero terminorum infinitas (escrito en 1669, publicado en 1711 por William Jones) y
en De metodis fluxionum et serierum infinitarum (escrito en 1671, traducido y publicado
como Método de fluxiones en 1736 por John Colson). Sin embargo, su descripción
difiere en forma sustancial de la descripción moderna presentada más arriba: Newton
aplica el método solo a polinomios. Él no computa las aproximaciones sucesivas xn,
26
sino que computa una secuencia de polinomios y recién al final llega a la aproximación
de la raíz x. Finalmente, Newton ve el método como puramente algebraico y falla al no
ver la conexión con el cálculo. Isaac Newton probablemente deriva su método de forma
similar aunque menos precisa del método de François Viète. La esencia del método de
Viète puede encontrarse en el trabajo del matemático persa Sharaf al-Din al-Tusi.
Referencias [editar]







Tjalling J. Ypma, Historical development of the Newton-Raphson method,
SIAM Review 37 (4), 531–551, 1995.
P. Deuflhard, Newton Methods for Nonlinear Problems. Affine Invariance and
Adaptive Algorithms. Springer Series in Computational Mathematics, Vol. 35.
Springer, Berlin, 2004. ISBN 3-540-21099-7.
C. T. Kelley, Solving Nonlinear Equations with Newton's Method, no 1 in
Fundamentals of Algorithms, SIAM, 2003. ISBN 0-89871-546-6.
J. M. Ortega, W. C. Rheinboldt, Iterative Solution of Nonlinear Equations in
Several Variables. Classics in Applied Mathematics, SIAM, 2000. ISBN 089871-461-3.
W. H. Press, B. P. Flannery, S. A. Teukolsky, W. T. Vetterling, Numerical
Recipes in C: The Art of Scientific Computing, Cambridge University Press,
1992. ISBN 0-521-43108-5. (online, with code samples: [1])
W. H. Press, B. P. Flannery, S. A. Teukolsky, W. T. Vetterling, Numerical
Recipes in Fortran, Cambridge University Press, 1992. ISBN 0-521-43064-X
(online, with code samples: [2])
Endre Süli and David Mayers, An Introduction to Numerical Analysis,
Cambridge University Press, 2003. ISBN 0-521-00794-1.
no mames brandon deja de mamarme el ganso! ahh pinche brandon.. le dire a los demas
de fcfm... tmb es jotiiio el cepi
Enlaces externos [editar]



Método de Newton aplicado al cálculo de la raíz cuadrada de un número
El método de Newton en Mathcad Application Server (con animación)
Método de Newton-Raphson: Notas, PPT, Mathcad, Maple, Matlab,
Mathematica
Obtenido de "http://es.wikipedia.org/wiki/Método_de_Newton"
Categorías: Wikipedia:Artículos buenos en w:de | Análisis numérico
Presentación
Bajo el nombre de Cálculo Numérico, Análisis Numérico, o Métodos Numéricos
(las tres expresiones serán tomadas como sinónimos) se engloba el conjunto de
27
técnicas que sirven para resolver, mediante el uso de cálculos mecánicos (o
algoritmos), problemas matemáticos bien determinados. Cabe aclarar que en el
Cálculo Numérico no sólo interesa saber que existe una solución para un
problema, sino que se buscan métodos para resolver los problemas de manera
efectiva y concreta, aunque en general la solución que se obtiene sea
aproximada.
Normalmente se considera “Cálculo Numérico” como sinónimo de “Cálculo
mediante computadoras” y, en efecto, en la práctica los cálculos mecánicos de
los que hablábamos en el párrafo anterior suelen ser realizados por una
computadora. Sin embargo, es interesante observar que la mayoría de los
métodos numéricos que se estudian en los libros de texto han sido creados
siglos antes que las computadoras, por lo que la computadora debe ser
considerado un elemento accesorio y no esencial en este tema.
La filosofía general de este curso será, en la medida de lo posible, motivar los
temas que se traten mediante la introducción previa de problemas concretos.
Así por ejemplo, los libros de texto de Cálculo Numérico suelen comenzar
explicando “la aritmética de la máquina”, es decir, la forma en que las
computadoras operan y guardan en la memoria números reales. En este curso,
en cambio, trataremos ese tema cuando su necesidad haya sido
convenientemente introducida.
Cada clase cierra con ejercicios y problemas. Los ejercicios sirven para practicar
o profundizar los temas estudiados en la clase de marras o en clases anteriores.
Para resolver los problemas, en cambio, no basta con los conocimientos
estudiados hasta ese momento. Los problemas implican un desafío mayor y
tienen como objetivo introducir o motivar temas que se verán después en el
curso. Se recomienda a los alumnos la resolución de estos ejercicios y problemas
antes de seguir adelante.
Problema 1.1: Imagine que tiene una calculadora que sólo permite sumar
restar multiplicar y dividir ¿cómo podría usarla para hallar una aproximación,
con dos cifras decimales exactas, de la raíz cuadrada de 28? (Use los métodos
que sea capaz de imaginar, no consulte por ahora libros ni las otras clases de
este curso, utilice su ingenio.)
28
Problema 1.2: En el dibujo, el ángulo alfa es tal que el área pintada de
amarillo representa la cuarta parte del área total del círculo.
a) Halle alguna ecuación de la cual alfa sea solución.
b) Halle una solución aproximada de esa ecuación. (Como antes, use los
métodos que sea capaz de imaginar, no consulte por ahora libros ni las otras
clases de este curso, utilice su ingenio.)
Problema 1.3: Enumere todos los métodos que conoce para calcular las raíces
de un polinomio (por ejemplo, el método de Gauss). Aplique esos métodos para
hallar todas las raíces de los siguientes polinomios:
a) f(x) = x^5 + x^2 + 6
b) f(x) = x^4 – 7x^3 + 1
(A la clase 2)
POSTED BY GUSTAVO PIÑEIRO AT 4:21 PM
Clase 2
(A la clase 1 - A la clase 3)
Método de la bisección
En esta clase comenzaremos a estudiar distintos métodos para hallar soluciones
aproximadas de ecuaciones con una incógnita, especialmente aquellas
ecuaciones que sean difíciles de despejar. Todos los métodos que veremos
tienen en común la siguiente característica: se comienza con una primera
aproximación a la solución, digamos c1, a partir de ella se calcula una segunda
aproximación c2 y así sucesivamente. Diremos que el método en cuestión
converge si la sucesión numérica c1, c2, c3,... tiene como límite una solución
exacta de la ecuación.
29
El método que veremos en esta clase se basa en el siguiente teorema del Cálculo:
Teorema de Bolzano: Si f : [a,b] -> R es una función continua tal que f(a) y
f(b) tienen distinto signo entonces existe algún c en (a,b) tal que f(c) = 0.
Supongamos entonces que queremos resolver una ecuación de la forma f(x) = 0,
donde f es una función continua en algún intervalo [a,b] y supongamos además
que f(a) y f(b) tienen distinto signo. Bajo estas condiciones, el teorema anterior
nos asegura que en (a,b) hay, al menos, una solución de la ecuación, llamémosla
c.
Sea, a modo de ejemplo, la ecuación x^3 + 2x - 1 = 0 (en todos los casos, el
símbolo ^ significa "elevado a"), donde f(x) = x^3 + 2x - 1, que es continua en
todo R. Para comenzar necesitamos dos números a y b tales que f(a) y f(b)
tengan distinto signo. No existe un método estándar para hallar estos a y b, en
nuestro ejemplo tras un rápido tanteo obtenemos que f(0) = -1 y que f(1) = 2.
Primera aproximación: sabemos entonces que hay una raíz entre 0 y 1, como
primera aproximación a esa solución tomamos el punto medio del intervalo
[0,1], c1 = 0,5. No sabemos cuál es la solución exacta c, pero es seguro que su
distancia a c1 no puede ser mayor a la mitad de la longitud del intervalo. En el
caso general, la primera aproximación a la solución será el punto medio del
intervalo [a,b], c1 = (a + b)/2. La distancia entre c1 y el valor exacto de c (el
error de la aproximación) no puede ser mayor a la semilongitud de [a,b]:
Segunda aproximación: Sigamos con nuestro ejemplo, el intervalo [0,1] ha
quedado dividido en dos partes [0; 0,5] y [0,5; 1]. De ambas, debemos elegir
aquella mitad en la que se sigan cumpliendo las condiciones del Teorema de
Bolzano. Calculamos f(0,5) = 0,25, como f(0) y f(0,5) tienen distinto signo, nos
quedamos con [0; 0,25], donde es seguro que existe una solución. La siguiente
30
aproximación es el punto medio de ese intervalo: c2 = 0,125. En el caso general,
tras el primer paso, el intervalo [a,b] habrá quedado partido en dos mitades: [a,
c1] y [c1, b]. Calculamos f(c1) y nos quedamos con el semiintervalo en el que f
cambia de signo. El error en esta aproximación no puede ser mayor a (b - a)/4
¿Por qué?
Generalización: El procedimiento sigue de la misma forma. En cada paso
tendremos un intevalo que cumple para f las condiciones de Bolzano (f tiene
distinto signo en sus extremos). Tomamos como aproximación el punto medio
de ese intervalo, el cual queda dividido en dos partes iguales. Calculamos f en
ese punto medio y, según sea su signo, elegimos de los dos semiintervalos aquél
que siga cumpliendo las condiciones de Bolzano. Y así sucesivamente.
El error cometido en el paso n-ésimo, es decir, la diferencia entre el valor exacto
c y la aproximación cn no puede ser mayor a (b - a)/2^n ¿Por qué? Y como (b a)/2^n tiende a 0, deducimos que cn converge a c. En otras palabras, a la larga
nos iremos aproximando a una solución exacta de la ecuación.
Resumen del método:
1) Buscamos un intervalo [a,b] tal que f(a) y f(b) tengan distinto signo.
2) Tomamos c1 = (a + b)/2.
3) Si f(a) y f(c1) tienen distinto signo, redefinimos b = c1. Si f(c1) y f(b) tienen
distinto signo, redefinimos a = c1.
4) Tomamos c2 = (a + b)/2.
5) Si f(a) y f(c2) tienen distinto signo, redefinimos b = c2. Si f(c2) y f(b) tienen
distinto signo, redefinimos a = c2.
6) Tomamos c3 = (a + b)/2.
Y así sucesivamente. La diferencia entre cn y un número c tal que f(c) = 0 es
menor que (b - a)/2^n, por lo que la sucesión c1, c2, c3,... convergerá a una
solución de f(x) = 0. (Pueden verse ejemplos en los enlaces indicados más
abajo.)
31
¿Cuándo nos detenemos? Nos estamos preguntando por lo que se llama
ténicamente el criterio de detención del algoritmo (1) En otras palabras
¿cuántas aproximaciones debemos calcular? Hay dos criterios posibles, uno de
ellos prescribe detenerse cuando (b - a)/2^n es más pequeño que cierta
cantidad establecida de antemano. La otra opción es que en cada paso se calcule
el valor de f(cn) para detenerse en el momento en que el resultado obtenido sea,
en valor absoluto, menor que cierta cantidad establecida de antemano. Por los
motivos que veremos en la respuesta a la siguiente pregunta, esta cuestión no es
en realidad muy importante.
¿Es útil este método? Una virtud que tiene este método (de la que carecen los
otros que estudiaremos) es que siempre converge (una vez que se ha obtenido el
intervalo [a,b] inicial). Una desventaja es que en general la convergencia es muy
lenta, la bisección necesita, para obtener una buena aproximaxión, muchos más
pasos que cualquiera de los otros métodos que veremos después. Pero estos
métodos, para converger, necesitan que la primera aproximación que se toma,
c1, esté cerca de la solución exacta de la ecuación. En consecuencia, el
procedimiento usual es éste: se usan unos pocos pasos de la bisección para
acercarse a c y a partir de allí se usa cualquiera de los otros métodos de
convergencia rápida.
Ejercicio 2.1: escriba cada una de estas ecuaciones en la forma f(x) = 0, halle
un intevalo [a,b] que cumpla las condiciones del Teorema de Bolzano y calcule
las aproximaciones c1, c2 y c3 del método de la bisección:
a) x = exp(-x)
(Donde exp(x) es la función exponencial e^x.)
b) x = sen(x)
c) x = tg(x), con x > 0.
Problema 2.2: Sea la ecuación f(x) = 0, donde f es una función continua tal
que f(a) es negativo y f(b) es positivo, para ciertos números a y b. Supongamos
además que la ecuación tiene una única solución c en (a,b). Sea c1, c2, c3,... la
sucesión que obtenemos por aplicación del método de la bisección ¿Es
necesariamente cierto que la distancia entre cn y c disminuye a medida que n
32
crece? En otras palabras ¿es cierto que cada aproximación de c que obtenemos
es mejor que la anterior? ¿Cómo justificaría su respuesta?
Problema 2.3:
a) Suponga que tiene una calculadora que sólo puede sumar, restar, multiplicar
y dividir. ¿Cómo usaría el método de la bisección para calcular una
aproximación de la raíz cuadrada de 28?
b) Cuando decimos que c1, c2, c3,... converge a c ¿esto quiere decir que
podemos calcular c con tanta exactitud como queramos? Usando la calculadora
del punto anterior ¿puede calcular la raíz cuadrada de 28 con tanta precisión
como quiera? Por ejemplo ¿puede aproximarla con 12.000 cifras decimales
exactas? ¿Y si hace los cálculos con lápiz y papel?
Enlaces en los que se habla de este tema: 1, 2, 3.
Nota:
(1) Un algoritmo es una receta mecánica para realizar un cálcul0 o cualquier
otra operación (matemática o no). El método de la bisección describe un
algoritmo.
(A la clase 1 - A la clase 3)
POSTED BY GUSTAVO PIÑEIRO AT 3:51 PM
Clase 3
(A la clase 2 - A la clase 4)
Introducción a la "aritmética de la máquina"
La raíz cuadrada de 2 es 1,41421356237309504... donde los puntos suspensivos
esconden una cantidad infinita de dígitos. Imaginemos dada una ecuación cuya
solución sea la raíz de 2. Supongamos además que, usando el método de la
bisección, calculamos sucesivas aproximaciones de esa solución: c1, c2, c3,... La
teoría que vimos en la clase anterior dice que la sucesión c1, c2, c3,... converge a
la raíz de 2, es decir, tomando n suficientemente grande cn se aproximará a la
raíz de 2 tanto como queramos. Pero ¿es así en la práctica?
33
Normalmente haremos nuestros cálculos mediante el auxilio de una
computadora (o una calculadora, que es también un tipo de computadora). No
nos interesan aquí los detalles técnicos acerca de cómo una computadora
almacena los números en su memoria (el lector interesado podrá encontrar esos
detalles en los enlaces indicados más abajo). Sí nos interesa el siguiente hecho
básico: cualquier computadora dispone de una cantidad finita y fija de memoria
para almacenar los números con los que trabaja, así como de un espacio finito y
fijo para mostrar esos números al usuario. No importa si los números
almacenados son escritos usando punto fijo, punto flotante o cualquier otro
método concebible, el hecho esencial es la limitación de memoria.
Una consecuencia de este hecho básico es que cualquier computadorasólo es
capaz de conocer una cantidad finita de números. Es decir, aunque en teoría hay
una cantidad infinita de números reales, el conjunto de todos los números que
una computadora es capaz de entender o mencionar es finito.
Para poner un ejemplo, supongamos que la computadora almacenara los
números de la siguiente forma:
donde cada cuadrado es ocupado por un dígito
entre 0 y 9, excepto el cuadrado que está a la izquierda de la coma, que no podrá
contener un cero. El número 200 se almacenaría como +2,0000000 x 10^+02,
el número 3 se almacenaría como +3,0000000 x 10^+00. El 0 se almacena
aparte. La cantidad total de números que esta computadora puede comprender
es 2 x 9 x 10^7 x (2 x 99 + 1) + 1 = 35.820.000.001 ¿Por qué?
En particular, no importa cómo los números se almacenen, habrá un número,
llamado el épsilon de la máquina, que será el menor número positivo que la
computadora es capaz de almacenar. Cualquier número que ese épsilon será
interpretado como igual a cero. En el ejemplo explicado más arriba el épsilon de
la máquina es 10^(–99) ¿Por qué? La computadora no puede acercarse a 0
más que épsilon.
El número más cercano a raíz de 2 que esta computadora es capaz de escribir es
1,4142136. Si usamos la computadora para calcular una sucesión c1, c2, c3,...
34
que, en teoría, se aproxime a raíz de 2 tanto como se quiera, en realidad se
detendrá en 1,4142135 o 1,4142136 y allí se estabilizará, incapaz de acercarse
más.
Problema 3.1: ¿Cuánto es 10^99 + 10^(–99) – 10^99? ¿Cuánto es 10^99 –
10^99 + 10^(–99)? ¿Y si realiza los cálculos con una calculadora?
Problema 3.2: En el algoritmo del método de la bisección, estudiado en la
clase anterior, conviene definir cn = a + 0,5(b – a) en lugar de cn = (a + b)/2. Al
hacerlo así se sigue la estrategia general de que, al efectuar cálculos numéricos
es mejor calcular una cantidad añadiendo un pequeño término de corrección a
una aproximación obtenida anteriormente. Le proponemos que halle un
ejemplo tal que en su calculadora los resultados de calcular a + 0,5(b – a) y (a +
b)/2 sean diferentes.
Enlaces en los que se habla de este tema: 1, 2, 3, 4.
(A la clase 2 - A la clase 4)
POSTED BY GUSTAVO PIÑEIRO AT 4:44 PM
Clase 4
(A la clase 3 - A la clase 5)
35
Punto fijo
Es otro de los métodos de los métodos para hallar soluciones aproximadas de ecuaciones
de una variable. Para ello necesitamos desarrollar previamente algunos conceptos.
Definición: Sea 𝑔: ℝ ⟶ ℝ una función cualquiera, se dice que un número 𝑎 es punto fijo
de 𝑔 si 𝑔(𝛼) = 𝛼
Por ejemplo si 𝑔(𝑥) = 2𝑥 2 − 6 entonces 2 es un punto fijo de 𝑔, pues 𝑔(2) = 2. Por
definición, 𝛼 es un punto fijo de 𝑔 si y sólo si es solución de la ecuación 𝑔(𝑥) = 𝑥. Así por
ejemplo, todos los puntos fijos de 𝑔(𝑥) = 2𝑥 2 − 6 resultan de resolver la ecuación 2𝑥 2 −
6 = 𝑥. Las dos soluciones de esta ecuación son 2 y − 1,5, que son exactamente los dos
puntos fijos de 𝑔.
Definición: A la ecuación 𝑔(𝑥) = 𝑥 se le llama ecuación de punto fijo de g.
La ecuación 𝑔(𝑥) = 𝑥
es también la ecuación que permite hallar la intersección entre el
gráfico de 𝑔(𝑥) y la recta 𝑦 = 𝑥.
Gráficamente, los puntos fijos de 𝑔 corresponden a esos puntos de intersección:
y
3
2
1
x
-4
-3
-2
-1
1
-1
-2
-3
-4
-5
-6
2
3
36
El concepto de punto fijo se utiliza para hallar soluciones aproximadas de una ecuación de
la forma 𝑓(𝑥) = 0. Para lograr esto, el primer paso será transformar la ecuación dada en
otra equivalente que sea de la forma 𝑔(𝑥) = 𝑥.
Por ejemplo, si la ecuación es 𝑥 3 + 2𝑥 − 1 = 0, entonces esto puede hacerse de distintas
maneras:
𝑥=
1 − 𝑥3
,
2
𝑥 = 1 − 𝑥 − 𝑥3,
3
𝑥 = √1 − 2𝑥 = (1 − 2𝑥)1/3
Si tuviéramos un modo de hallar en forma aproximada un punto fijo de una función g
entonces tendríamos un modo para hallar una solución de f(x) = 0. Pero ¿cómo puede
hallarse un punto fijo de g, sin despejar la ecuación correspondiente? Estudiaremos la
respuesta a esta pregunta en las próximas clases.
Para hallar una solución aproximada por el metodo de punto fijo, es necesario
transformar la ecuación en otra que sea de punto fijo, pudiendo lograrse esto de
muchas maneras diferentes.
Ejemplo:
Se desea transformar la ecuación 𝑒 𝑥 + 𝑥 = 6,
La transformación a punto fijo puede lograrse las siguientes formas:
𝑥 = 6 − 𝑒𝑥;
𝑥 = ln(6 − 𝑥) ;
Por medio de ecuaciones equivalentes de la ecuación original se tiene la forma
apropiada para hallar un punto fijo.
En el primer caso de la función 𝑔(𝑥) = 6 − 𝑒 𝑥 y en el segundo, de la función
ℎ(𝑥) = ln(6 − 𝑥)
Definición: La sucesión 𝛼, 𝑔(𝛼), 𝑔2 (𝛼), 𝑔3 (𝛼), … se llama la órbita de 𝛼.
Teorema: Si 𝑔(𝑥) es una función continua y la sucesión 𝛼, 𝑔(𝛼), 𝑔(𝑔(𝛼)),
𝑔(𝑔(𝑔(𝛼))), …
es convergente entonces su límite es un punto fijo de 𝑔.
37
El teorema presenta una forma de hallar un punto fijo de 𝑔, basta realizar las
iteraciones de la función partiendo de un número 𝛼, si la órbita es convergente
las sucesivas iteraciones acercarán cada vez más a un punto fijo de 𝑔. Sin
embargo, hay que tomar en cuenta que el teorema dice que si la órbita es
convergente entonces su límite es un punto fijo de 𝑔. Se sabe que la órbita no
siempre es convergente.
Sea g: R -> R una función y sea a un número cualquiera. Apliquemos la función
g al número a, luego apliquemos g al resultado, volvamos a aplicar g al nuevo
resultado obtenido y así sucesivamente. A este proceso se le llama iterar la
función g. Al iterar construimos la sucesión a, g(a), g(g(a)), g(g(g(a))),... que
indicaremos como a, g(a), g2(a), g3(a),...
Definición: La sucesión a, g(a), g2(a), g3(a),... se llama la órbita de a por g o,
más brevemente, la órbita de a.
Una manera clásica de visualizar las órbitas es la siguiente:
38
En el dibujo vemos el gráfico de
una función g y la recta y = x (recuérdese que la intersección de ambos
representa el punto fijo de g). Comenzamos con el punto a y nos movemos hacia
la curva para visualizar (en el eje vertical) el valor de g(a). Para visualizar
g(g(a)) debemos proyectar el valor g(a) hasta el eje x. El dibujo muestra cómo
hacerlo usando la recta y = x como espejo. Desde g(a) (ahora en el eje x) vamos
de nuevo hacia la curva y así obtenemos g(g(a)). En resumen, el movimiento es:
comenzamos en a, vamos verticalmente hacia la curva, luego horizontalmente
hacia la recta, verticalmente hacia la curva, horizontalmente hacia la recta, etc.
Los puntos que quedan marcados sobre la curva van graficando la órbita de a.
En el dibujo que acabamos de hacer, la órbita va convergiendo al punto fijo de g
(es decir, los puntos de la órbita se van acercando cada vez más a la intersección
de la recta y la curva). El siguiente teorema generaliza esta situación:
Teorema: Si g(x) es una función continua y la sucesión a, g(a), g(g(a)),
g(g(g(a))),... es convergente entonces su límite es un punto fijo de g.
El teorema nos da entonces una forma de hallar un punto fijo de g, basta iterar
la función partiendo de un número a, si la órbita es convergente las sucesivas
iteraciones nos irán acercando cada vez más a un punto fijo de g. Sin embargo,
hay que tomar en cuenta que el teorema dice que si la órbita es convergente
entonces su límite es un punto fijo de g. Pero ¿la órbita es siempre
convergente?
Consideremos a modo de ejemplo la función h(x) = ln(6 – x) [recuérdese que
proviene de la ecuación x + exp(x) = 6] y calculemos la órbita correspondiente a
39
a = 3:
3
1,098612289
1,589518371
1,483983896
1,507630212
1,502380355
1,503548289
1,503288577
1,503346335
1,503333490
1,503336347
1,503335711
1,503335853
1,503335821
1,503335828
1,503335827
1,503335827
1,503335827
1,503335827
La órbita se estabiliza en 1,503335827, que es (aproximadamente) el punto fijo
de h y a la vez solución (aproximada) de la ecuación x + exp(x) = 6. [La
inevitabilidad de trabajar con aproximaciones fue estudiada en la clase 3.]
Consideremos ahora la función g(x) = 6 – exp(x). Nótese que los puntos fijos de
g(x) y de h(x) = ln(6 – x) son los mismos pues en ambos casos son las soluciones
de x + exp(x) = 6. Veamos la órbita de a = 1,5 con respecto a g(x) = 6 – exp(x):
a = 1,5
1,518310930
1,435491095
1,798292060
–0,039323848
5,038560702
40
-148,2478466
6
-397,4287935
6
-397,4287935
6
A partir de este punto (si se hacen los cálculos con 10 dígitos) la órbita se
estabiliza en el ciclo 6; -397,4287935; 6; -397,4287935; 6,... Si se trabaja con
más decimales ese número 6 se ve así:
5,9999999999999999999999999999999999
999999999999999999999999999999999999
999999999999999999999999999999999999
999999999999999999999999999999999999
999999999999999999999999999999749465
212979943827764688882...
Nótese que, aunque el valor de a estaba muy cerca del punto fijo, la órbita no
convergió a él, sino que se alejó de él.
En la próxima clase seguiremos estudiando el comportamiento de las órbitas,
especialmente en relación con los puntos fijos.
Problema 5.1: Tomemos una calculadora en modo DEG e iteremos la tecla
COS. Al poco tiempo la máquina se estabilizará en el número
0,9998477415310881129598107686798... ¿Qué ecuación satisface este número?
(Nótese que este número no es un punto fijo de la función cos(x) ¿por qué?)
Ejercicio 5.2: Estudie el comportamiento de las órbitas de f(x) = 2x^2 – 1,
para distintos valores de a. ¿Alguna de esas órbitas converge?
Puede verse aquí un comentario, relacionado con esta clase, acerca de la teoría
del caos.
(A la clase 4 - A la clase 6)
41
POSTED BY GUSTAVO PIÑEIRO AT 11:13 PM
Clase 6
(A la clase 5 - A la clase 7)
Atractivos y repulsivos
Consideremos la función g(x) = (1/9)*(x – 2)^2 – 2 (donde * indica la
multiplicación y ^ es “elevado a”). Resolviendo la ecuación (1/9)*(x – 2)^2 = x
llegamos a la conclusión de que g tiene dos puntos fijos: – 1 y 14. Recordemos
que si una órbita cualquiera de g es convergente entonces convergerá a uno de
estos dos números, pero ¿son convergentes todas las órbitas? Analicemos el
comportamiento de algunas de ellas. Veamos primero la órbita que comienza
con a = –0, 5:
a = –0, 5
–1,305555556
–0,785922497
–1,137626205
–0,906144644
–1,061591479
–0,958517513
–1,027463792
–0,981606999
–1,012224412
–0,991833788
–1,005436732
–0,996372228
–1,002417052
–0,998387983
–1,001074389
–0,999283613
–1,000477534
–0,999681619
–1,000212243
El valor inicial está cerca de –1 y, en efecto, se ve que la órbita se va acercando a
42
ese número. ¿Qué sucede si tomamos valores iniciales cada vez más lejanos de –
1? Veamos distintos valores iniciales, que se vayan alejando de –1:
a = –2
–0.222222222
–1.451303155
–0.676500726
–1.204038207
–0.859348797
–1.091569384
–0.938022083
–1.040891805
–0.972553003
–1.018214294
–0.987820275
–1.008103334
–0.994590481
–1.003603095
–0.997596494
–1.001601696
–0.998931918
–1.000711928
–0.999525325
También se va acercando a –1. Lo mismo sucederá si tomamos como valor
inicial el número –3 0 el número –4. Alejémonos un poco más y tomemos a = –
11:
a = –11
16,77777778
22,26474623
43,62888220
190,5515370
3948,186901
1,730263673 x 10^6
1,3326450507 x 10^12
43
1,229474775 x 10^22
La órbita diverge (su límite es infinito). Vemos entonces que si tomamos valores
iniciales cercanos a –1 la órbita converge a ese número, pero si los valores
iniciales se van alejando llegamos finalmente a una zona en la que los valores
iniciales dan órbitas divergentes. ¿Qué sucede con el otro punto fijo?
a = 13
11,44444444
7,910836752
1,881999012
–1,998452863
–0,223597189
–1,450623949
–0,677021596
–1,203728375
–0,859569389
–1,091429212
–0,938118381
–1,040828931
–0,972595490
–1,018186228
–0,987839099
–1,008090835
–0,994598837
–1,003597534
–0,997600206
La órbita comienza cerca de 14, pero ¡se acerca al otro punto fijo! Intentemos
con a = 15:
a = 15
16,77777778
22,26474623
43,62888220
190,5515370
44
3948,186901
1,730263673 x 10^6
3,326450507 x 10^11
1,229474775 x 10^22
La órbita diverge. En realidad, ninguna órbita converge a 14 no importa qué tan
cerca de ese número comencemos. La única forma de que una órbita converja a
14 es que, por casualidad, caiga exactamente en ese número, por ejemplo:
a = –10
14
14
14
Pero esta situación (el que una órbita caiga justo en el punto fijo) en la práctica
será virtualmente imposible. Los ejemplos anteriores motivan las siguientes
definiciones:
Definición: Un punto fijo c de una función g(x) es atractivo si para cualquier
valor inicial cercano a c la órbita correspondiente convergerá siempre a c. Con
más precisión, un punto fijo c es atractivo si existe un número positivo delta tal
que si la distancia entre a y c es menor que delta entonces la órbita de a
converge a c.
Definición: Un punto fijo c de una función g(x) es repulsivo si es imposible
hallar una órbita que converja a él (a menos que, por coincidencia, caiga
justamente en el número c). Con más precisión, un punto fijo c es repulsivo si
existe un número positivo delta tal que si la distancia entre c y algún número r
de la órbita es menor que delta entonces el valor siguiente de la órbita (que es
g(r)) está más lejos de c que lo que estaba r (la órbita tiende a alejarse de c).
Es claro que en el ejemplo anterior, en relación a los puntos fijos de g(x) =
(1/9)*(x – 2)^2 – 2, el número –1 es un punto fijo atractivo, mientras que 14 es
repulsivo.
En la clase anterior proponíamos como método para hallar los puntos fijos de g
45
calcular una órbita cualquiera y confiar en que ésta vaya convergiendo, ya que
necesariamente convergerá a un punto fijo. Vemos ahora que la órbita sólo
convergerá (es decir el método sólo funcionará) si el punto fijo en cuestión es
atractivo y si el valor inicial de la órbita está suficientemente cerca de él.
¿Cómo podemos saber, a priori, si un punto fijo es atractivo o repulsivo? Eso es
lo que estudiaremos en la próxima clase.
Problema 6.1: La función g(x) = 2x^2 –1 tiene dos puntos fijos, –1/2 y 1.
Tome órbitas cercanas a cada uno de ellos y trate de determinar cuál de ambos
(si es que hay alguno) que sea repulsivo y cuál de ambos (si es que hay alguno)
que sea atractivo. ¿Qué sucede si toma a = –0,5?
Problema 6.2: Analice el comportamiento de las órbitas de g(x) = ln(7 – cos x)
que comienzan con números que están “lejos” de 2.
(A la clase 5 - A la clase 7)
POSTED BY GUSTAVO PIÑEIRO AT 11:57 AM
Clase 7
(A la clase 6 - A la clase 8)
Más sobre atractivos y repulsivos
En la clase anterior estudiábamos la diferencia entre puntos fijos atractivos y
puntos fijos repulsivos. Recordemos que si una órbita comienza cerca de un
punto fijo atractivo entonces convergerá a él, mientras que es imposible
encontrar una órbita que converja a un punto fijo repulsivo, no importa qué tan
cerca de él comience.
Por otra parte, a menos que la ecuación g(x) = x con la que estemos trabajando
sea realmente muy sencilla (en cuyo caso no necesitaríamos métodos numéricos
para resolverla), la única forma efectiva de hallar puntos fijos de g(x) es iterar la
función confiando en que la órbita converja. Por lo tanto los únicos puntos fijos
que seremos capaces de encontrar serán los puntos atractivos. La pregunta es
¿podemos saber a priori si un punto fijo es atractivo o repulsivo? El siguiente
resultado nos dará buena parte de la respuesta.
46
Teorema: Sea g(x) una función derivable con derivada continua y sea c un
punto fijo de g(x). Si g’(c) es menor que 1 entonces c es un punto fijo atractivo.
Si g’(c) es mayor que 1 entonces c es un punto fijo repulsivo.
Expliquemos la idea que está detrás del teorema. Sea c un punto fijo de g(x),
desarrollemos el polinomio de Taylor de orden 1 de g(x) en x = c.
Si x está cerca de c: g(x) # g(c) + g’(c)(x – c). (Donde # debe tomarse aquí como
el signo de “aproximadamente igual”, es inevitable usar símbolos extraños, ya
que el blog es avaro en símbolos matemáticos.)
Como g(c) = c entonces:
g(x) # c + g’(c)(x – c)
g(x) – c # g’(c)(x – c)
g(x) – c # g’(c)x – c
(Recuérdese que si a y b son números reales entonces a – b es la distancia entre
a y b.)
Sea x0 el primer número de una órbita, que supondremos que está lo
suficientemente cerca de c como para que valga la aproximación dada por el
polinomio de Taylor. Notemos que g(x0) = x1, el siguiente valor de la órbita. Por
lo tanto:
x1 – c # g’(c)x0 – c
Si g’(c) es menor que 1 entonces g’(c)x0 – c es menor que x0 – c, luego x1 – c es
menor que x0 – c. Es decir, x1 está más cerca de c que lo que estaba x0.
Aplicando el mismo razonamiento, x2 está más cerca que x1, x3 está más cerca
que x2 y asís sucesivamente. De hecho puede probarse que la distancia entre xn
y c tiende a cero. Es decir, para cualquier x0 suficientemente cerca de c sucede
que la órbita converge a c.
47
Por lo tanto si g’(c) es menor que 1 entonces el punto fijo es atractivo.
Por otra parte, si g’(c) > 1, un razonamiento similar anterior prueba que la
distancia entre x1 y c es mayor que la distancia entre x0 y c, por lo que la órbita
tiende a alejarse de c.
Ejercicio 7.1: Halle (en forma aproximada, desde luego) todas las soluciones
de la ecuación x^x = 0,7.
Ejercicio 7.2: Halle en forma aproximada todas las raíces de los polinomios
indicados.
a) f(x) = x^5 + x^3 – 6x + 2
b) f(x) = x^3 + 2x – 7
Enlaces donde se tratan los temas estudiados en las clases 4 a 7: 1, 2,
3.
(A la clase 6 - A la clase 8)
POSTED BY GUSTAVO PIÑEIRO AT 9:09 AM
Clase 8
(A la clase 7 - A la clase 9)
El método de Newton
El método de Newton (llamado en algunos textos método de Newton–Raphson)
es otro de los métodos para resolver una ecuación de modo aproximado. Tal
como sucede con los otros que hemos estudiado anteriormente, este método
procede por aproximaciones sucesivas. Se comienza con un número x0 que se
elige más o menos arbitrariamente, a partir de x0 se calcula un nuevo número
x1; a partir de x1 se calcula un número x2 y así sucesivamente. Con suerte, los
números x0, x1, x2,... se irán acercando cada vez más a una solución de la
ecuación.
La forma en que se calculas los sucesivos números x1, x2, x3,... se basa en una
48
idea gráfica muy sencilla y convincente. Sea f(x) = 0 la ecuación que queremos
resolver y llamemos c a una solución de la ecuación.
Tomemos como x0, la primera aproximación, cualquier número. Trazamos la
recta tangente al gráfico de f en x0 (para que esto sea posible, suponemos que f
es derivable en todo punto) y tomamos x1 como la raíz de esa recta tangente. A
partir de aquí se repite el mismo procedimiento: trazamos la recta tangente al
gráfico de f en x1 y tomamos x2 cmo la raíz de esta recta tangente, y así
sucesivamente.
Si tenemos suerte, x0, x1, x2,...
convergerá a c, sin embargo, al menos en algunos casos, si x0 no es elegido de
modo conveniente entonces puede suceder que la sucesión x0, x1, x2,... no
converja. Un ejemplo de esta situación se da con la función f(x) = arctga(x) cuya
única raíz es c = 0. Si x0 se elige suficientemente cerca de 0 entonces la sucesión
x0, x1, x2,... converge a la raíz, pero si x0 es elegido lejos de 0, entonces la
sucesión diverge:
Como se ve en el gráfico, la sucesión x0, x1, x2,... se va alejando de c.
49
Las preguntas que surgen son: ¿si x0 se elige suficientemente cerca de c
entonces la sucesión x1, x2, x3,... converge siempre a c? ¿Dado x0, cómo se
calculan x1, x2, x3,...? Respondamos primero a la segunda pregunta.
Recordemos que la ecuación de la recta tangente al gráfico de f en x = a es la
siguiente:
y = f(a) + f’(a)(x – a)
Dado x0, calculamos la reca tangente al gráfico de f en x = x0:
y = f(x0) + f’(x0)(x – x0)
El número x1 es la raíz de la recta:
0 = f(x0) + f’(x0)(x1 – x0)
Despejando:
–f(x0) = f’(x0)(x1 – x0)
–f(x0)/f’(x0) = x1 – x0
Entonces: x1 = x0 – f(x0)/f’(x0)
Con el mismo razonamiento:
x2 = x1 – f(x1)/f’(x1)
x3 = x2 – f(x2)/f’(x2)
Generalizando: x(n + 1) = xn – f(xn)/f’(xn)
Por supuesto, estas fórmulas tienen sentido si f’(x0), f’(x1), f’(x2),... son todos
distintos de cero. Suponemos entonces que f’ nunca se anula, al menos en las
cercanías de c.
50
Observemos que el método de Newton es en realidad un caso particular del
método del punto fijo, ya que x1, x2, x3,... se calculan a partir de x0 iterando la
función:
g(x) = x – f(x)/f’(x)
Un ejemplo: aproximemos una raíz de f(x) = x^3 + x + 1. La fórmula que
tenemos que iterar es g(x) = x – (x^3 + x + 1)/(3x^2 + 1).
x – (x^3 + x + 1)/(3x^2 + 1) = (3x^3 + x – x^3 – x – 1)/(3x^2 + 1) = (2x^3 –
1)/(3x^2 + 1)
Por otra parte, el teorema de Bolzano nos dice que hay una raíz entre –1 y 0.
Elijamos entonces x0 = 0,5. Los valores que se obtienen son:
–0,714285
–0,683179
–0,682328
–0,6823278
–0,6823278
La sucesión se estabiliza. Una raíz aproximada es –0,6823278.
Para ver que la sucesión que se obtiene iterando g converge siempre a una raíz
de f (si x0 se elige suficientemente de esa raíz) tenemos que probar que:
1) Un número c es punto fijo de g(x) = x – f(x)/f’(x) si y sólo si f(c) = 0.
(Suponiendo que f’ no se anula en c.)
2) Todo punto fijo de g(x) = x – f(x)/f’(x) es atractivo. (Suponiendo también que
f’ no se anula en ese punto fijo.)
El punto 2) dice que la sucesión x0, x1, x2,... converge siempre a un punto fijo de
g si x0 está suficientemente cerca de él y 1) dice que ese punto fijo es una raíz de
f. Es decir, si x0 se elige convenientemente el método siempre converge a una
raíz de f. Tenemos entonces el siguiente teorema.
51
Teorema: si x0 se elige suficientemente cerca de una raíz de f entonces y f’ no
se anula en un entorno de esa raíz entonces el método de Newton converge a esa
raíz de f.
La demostración de los puntos 1) y 2) se deja como ejercicio para los lectores.
Hay que observar (la demostración requiere un análisis más fino, que aquí no
haremos) que el método de Newton no sólo converge, sino que además converge
muy rápidamente.
Ejercicio 8.1: Usando el método de Newton, halle en forma aproximada, todas
las soluciones de la ecuación x^x = 0,7. Compare la velocidad de convergencia
(es decir la cantidad de pasos necesaria para lograr una buena aproximación)
con el método usado en el ejercicio 7.1.
Ejercicio 8.2: Usando el método de Newton, halle en forma aproximada, todas
las raíces de los polinomios indicados.
a) f(x) = x^5 + x^3 – 6x + 2
b) f(x) = x^3 + 2x – 7
Compare la velocidad de convergencia (es decir la cantidad de pasos necesaria
para lograr una buena aproximación) con el método usado en el ejercicio 7.1.
Problema 8.3: Demuestre que un número c es punto fijo de g(x) = x –
f(x)/f’(x) si y sólo si f(c) = 0. (Suponiendo que f’ no se anula en un entorno de c.)
Ejercicio 8.4: Demuestre que todo punto fijo de g(x) = x – f(x)/f’(x) es
atractivo. (Suponiendo también que f’ no se anula en ese punto fijo.)
(A la clase 7 - A la clase 9)
POSTED BY GUSTAVO PIÑEIRO AT 2:04 PM
52
Problema 4.1: Muestre un ejemplo de una función que no tenga ningún punto fijo.
Problema 4.2: Demuestre que si f : R -> R es una función continua tal que f(0) es mayor
que 0 y f(1) es menor que 1 entonces f tiene al menos un punto fijo en [0,1].
Problema 4.3: Tome una calculadora y marque en ella cualquier número positivo. Oprima
reiteradamente la tecla “raíz cuadrada” ¿qué sucede a la larga? ¿Depende del número
inicial elegido? ¿Cómo se relaciona su conclusión con lo estudiado en la clase anterior?
Repita el problema con otras teclas de la calculadora.
Ejercicio 4.4: Transforme cada una de las siguientes ecuaciones en al menos dos
ecuaciones punto fijo diferentes.
a) 3x^3 + 1 = 0
b) sen(x + 2) = 2 + x
c) x^2 = tg(x)
(A la clase 3 - A la clase 5)
P O S T ED B Y G U S T A V O P I Ñ E I R O AT 9 : 2 8 PM
(A la clase 4 - A la clase 6)
Clase 5
Problemas
Ejercicio 2.1: escriba cada una de estas ecuaciones en la forma f(x) = 0, halle
un intevalo [a,b] que cumpla las condiciones del Teorema de Bolzano y calcule
las aproximaciones c1, c2 y c3 del método de la bisección:
53
a)
x
=
exp(-x)
(Donde exp(x) es la función exponencial e^x.)
b) x = sen(x)
c)
x
=
tg(x),
con
x
>
0.
Problema 2.2: Sea la ecuación f(x) = 0, donde f es una función continua tal
que f(a) es negativo y f(b) es positivo, para ciertos números a y b. Supongamos
además que la ecuación tiene una única solución c en (a,b). Sea c1, c2, c3,... la
sucesión que obtenemos por aplicación del método de la bisección ¿Es
necesariamente cierto que la distancia entre cn y c disminuye a medida que n
crece? En otras palabras ¿es cierto que cada aproximación de c que obtenemos
es mejor que la anterior? ¿Cómo justificaría su respuesta?
Problema 2.3:
a) Suponga que tiene una calculadora que sólo puede sumar, restar, multiplicar
y dividir. ¿Cómo usaría el método de la bisección para calcular una
aproximación de la raíz cuadrada de 28?
b) Cuando decimos que c1, c2, c3,... converge a c ¿esto quiere decir que
podemos calcular c con tanta exactitud como queramos? Usando la calculadora
del punto anterior ¿puede calcular la raíz cuadrada de 28 con tanta precisión
como quiera? Por ejemplo ¿puede aproximarla con 12.000 cifras decimales
exactas? ¿Y si hace los cálculos con lápiz y papel?
Descargar