ECUACIONES LINEALES SIMULTANEAS HOMOGENEAS

Anuncio
ECUACIONES LINEALES SIMULTANEAS
HOMOGENEAS
Métodos Numéricos /Análisis Numérico/ Cálculo Numérico
Objetivo: Resolución de sistemas de ecuaciones lineales
homogéneas por métodos aproximados.
SISTEMAS DE ECUACIONES HOMOGÉNEAS
Se considerará la solución de ecuaciones algebraicas lineales
simultáneas HOMOGÉNEAS, que tienen la forma:
 a11 x1 +a12 x2 + ... +a1m xm =0
 a x +a x + ... +a x =0
 21 1 22 2
2m m

..........
..........
..........
.............

 an1 x1 +an 2 x2 + ... +anm xm =0
(6.20)
El sistema puede ser escrito en notación matricial:
A.X=0
(6.21)
1
Generalidades
Un conjunto de ecuaciones homogéneas como el (6.20) tiene
siempre una solución, ya que la matriz ampliada y la del sistema
presentan, el mismo rango.
Si el rango r de la matriz de los coeficientes del conjunto de
ecuaciones es igual al orden n, el sistema tiene una única solución,
que es la denominada SOLUCIÓN TRIVIAL (x1 = x2 = ... = xn = 0).
Para este conjunto de ecuaciones, todas las ecuaciones del sistema
son linealmente independientes -> Det A ≠ 0.
Generalidades (2)
Existen soluciones NO TRIVIALES si, y solo si, r < n.
Entonces Det A = 0,
r : nro de ec. Linealmente independientes
n-r: Ec. Linealmente dependientes
Para este tipo de soluciones, no se encuentran valores únicos para
las incógnitas. Se establecen relaciones entre las incógnitas.
Cualquier combinación de valores de x que satisface estas
relaciones constituye una solución.
Los problemas más importantes que se plantean en la aplicación de
ecuaciones homogéneas son aquellos denominados de VALORES
CARACTERÍSTICOS
2
Generalidades (3)
Las ecuaciones pueden escribirse, de manera cartesiana, en la forma:
 (a11 −λ )x1 + a12 x2 +Κ + a1n xn =0
 a x +(a −λ )x +Κ + a x =0
 21 1 22
2
2n n

 ΛΛΛΛΛΛΛΛΛΛΛ
 an1 x1 + an 2 xn 2 +Κ +(ann −λ )xn =0
(6.22)
donde, los aij son reales, las xi son las variables del sistema y lambda es un
parámetro particular del sistema que tiene valores, en general, desconocidos.
En la notación matricial
( A - λI ) X = 0
(6.23)
Generalidades (4)
Donde al incorporar la matriz identidad I, se puede utilizar a
( A - λ I ) como matriz de coeficientes.
La matriz columna X recibe el nombre de VECTOR
CARACTERÍSTICO ó AUTOVECTOR ó EIGENVECTOR;
siendo las xi las componentes de dicho vector característico.
Los valores que se obtienen para lambda se conocen como
VALORES CARACTERÍSTICOS ó AUTOVALORES ó
EIGENVALORES de la matriz A.
3
Generalidades (5)
Dado que lambda aparece como incógnita, es posible, hacer que el
determinante de dicha matriz sea igual a cero y, llamando D a este,
resulta:
(6.24) D = A - λI = 0
[
]
y encontrando valores para lambda que hagan D = 0, se tendrá la
solución.
El desarrollo algebraico del determinante D produce un polinomio de
grado n, de la forma:
(6.25)
λn + p1λn −1 +Κ + pn −1λ + pn =0
Generalidades (6)
•Este polinomio recibe el nombre de POLINOMIO
CARACTERÍSTICO ó ECUACIÓN CARACTERÍSTICA
•Es necesario resolver el POLINOMIO y obtener los lambda λ que
hacen D=0.
•Las n raíces reciben el nombre AUTOVALORES o VALORES
CARACTERISTICOS.
•Los valores característicos, se sustituyen, uno a la vez, en el conjunto
original de ecuaciones para obtener un sistema correspondiente de
relaciones entre las incógnitas x para cada sustitución.
4
Generalidades (7)
•
•
•
Las relaciones dependerán del r de la matriz ( A - λ I ).
Si es r = n - 1, las relaciones serán tales que la hipótesis de
un valor para una incógnita, producirá un valor
correspondiente para c/u de las ecuaciones restantes;
si r = n - 2, las relaciones serán tales que se tendrán que
suponer los valores de dos incógnitas para poder obtener
un valor correspondiente a c/u de las incógnitas restantes.
Generalidades (8)
Cuando n es relativamente pequeño (2 ó 3), el desarrollo de
determinantes por menores para obtener el polinomio característico es
sencillo; y la posterior determinación de raíces no presenta grandes
dificultades.
•Para calcular el determinante de una matriz de n * n, se requieren de
o (n!) multiplicaciones/divisiones y sumas/restas. Incluso con valores de
n relativamente pequeños, la cantidad de cálculos se torna inmanejable.
•Cuando n es grande ésta determinación se vuelve muy difícil, sino
imposible y se debe apelar, a algún procedimiento numérico tal como
alguno de los estudiados en el capítulo correspondiente.
5
Método de FADDEEV-LEVERRIER
Este método constituye una técnica eficiente para generar los
coeficientes pi del polinomio característico (6.25), tanto, cuando la
matriz A de los coeficientes es simétrica, como cuando no lo es.
Tiene la ventaja adicional de que se obtiene automáticamente, al
finalizar el proceso, la matriz inversa del sistema A-1 .
TRAZA de una matriz:
La traza de una matriz, que será designada mediante " tr A " es:
(6.26)
tr A = a11 + a22 + ... + ann
Método de FADEEV-LEVERRIER (1)
Genera en su procedimiento, una sucesión de matrices B1 ; B2 ; ...;
Bn de las que se obtienen una serie de valores, que se denominarán
bk (k = 1; 2;...;n) que sustituidos en el POLINOMIO DE
FADDEEV-LEVERRIER:
( )n (
(6.27)
−1 λn −b1λn −1 −Κ −bn −1λ −bn
dan como resultado los coeficientes pk
)=0
El factor (-1)n se utiliza para dar a los términos los signos que tendría
el polinomio característico si hubiese sido generado desarrollando el
determinante correspondiente.
6
Método de FADDEEV-LEVERRIER (2)
Los valores de bk se obtienen así:
B1 = A
;
b1 = tr B1
B 2 = A ( B 1 - b1 I ) ;
b2 = 1/2 tr B2 (6.28)
……………………………………………………..
Bn = A ( Bn-1 - bn-1 I ) ;
bn = 1/n tr Bn
Puede demostrarse que la inversa de la matriz A, cuyos valores
característicos se desea hallar, se determinan a partir de la ecuación:
(6.29)
A-1 = 1/bn ( Bn-1 - bn-1 I )
Método de FADDEEV-LEVERRIER (3)
Ejemplo: supóngase que se ha obtenido, como
modelo matemático de algún problema determinado,
el siguiente sistema lineal homogéneo de ecuaciones:
(3 − λ ) x1

 2 x1
 4x
1

+
+
4 x3
=0
+ ( 0 − λ ) x2
+
2 x3
=0
+
+ (3 − λ ) x3
2 x2
2 x2
=0
7
Método de FADDEEV-LEVERRIER (4)
Se debe generar las matrices Bk a partir de la matriz
A del sistema. Siendo:
3 2 4
A = 2 0 2
4 2 3
Entonces:
 3 2 4
B1 = 2 0 2 ⇒ b1 ≅ trB1 = 3 + 0 + 3 = 6
4 2 3
Método de FADDEEV-LEVERRIER (5)
De la misma manera
3 2 4 3 2 4 6 0 0  11 2 4 


B2 = A * ( B1 − b1 * I ) = 2 0 2 * 2 0 2 − 0 6 0  =  2 8 2  ⇒
4 2 3 4 2 3 0 0 6   4 2 11
1
1
⇒ b2 ≅ * trB2 = (11 + 8 + 11) = 15
2
2
8
Método de FADDEEV-LEVERRIER (6)
3 2 4 11 2 4  15 0 0  8 0 0


B3 = A* (B2 − b2 * I ) = 2 0 2 *  2 8 2  −  0 15 0  = 0 8 0 ⇒
4 2 3  4 2 11  0 0 15 0 0 8
1
1
⇒ b3 ≅ *trB3 = (8 + 8 + 8) = 8
3
3
Sustituyendo los valores de los bk en el polinomio de
FADDEEV-LEVERRIER, se obtiene:
(−1) 3 * (λ3 − 6λ2 − 15λ − 8) = 0
Método de FADDEEV-LEVERRIER (7)
Del cual resulta:
− λ3 + 6λ2 + 15λ + 8 = 0
O, multiplicando por -1
λ3 − 6λ2 − 15λ − 8 = 0
Que es el polinomio característico. Obteniendo la raíces
de la ecuación dada mediante cualquier método,
resultan los valores propios.
λ = 8;
1
λ2 = −1;
λ3 = −1
9
Método de FADDEEV-LEVERRIER (8)
Los que, sustituidos de uno por vez en el sistema,
permite el calculo de las componentes xj (j=1; 2; 3)
de los vectores característicos o autovectores.
Finalmente, para hallar la matriz inversa del sistema,
se debe hacer
4 
 4 2
−

8 
11 2 4 
1 0 0   8 8
1 
2
7 2 


A−1 = *  2 8 2  − 15 * 0 1 0  = 
−
8 
8
8
8


0 0 1   4
2
4
 4 2 11
− 
 8
8
8
Método de las POTENCIAS
El método de las POTENCIAS es un método iterativo.
Utilizado en aquellos casos en que solamente se desea conocer el
autovalor más pequeño y/o más grande, juntamente con sus
autovectores asociados.
Una ventaja adicional de este método es que los autovalores se
obtienen simultáneamente con sus respectivos autovectores.
10
Método de las POTENCIAS (2)
Para determinar el autovalor más grande, supóngase que tanto los
elementos de la matriz como del autovalor son reales. Sea el sistema:
(A − λI )X = 0
(6.38)
donde, realizando el producto indicado por el paréntesis, se obtiene:
AX − λ IX = AX − λ X = 0
y transponiendo términos:
AX = λ X
(6.39)
Método de las POTENCIAS (3)
Haciendo uso sistemático de esta última ecuación (6.39) y realizando
los siguientes pasos:
I.- Asignar valores arbitrarios a las componentes de X, y
designándolo con X0 se sustituye en el 1er. Miembro de A X= λX ,
con lo cual se obtiene λla primera aproximación del 2do. miembro. En
general, resulta satisfactorio tomar los valores para xi = 1; 2; ... ;n.
AX 0 = λ X 1
II.- Dividir los elementos del vector λ X 1 por
primera componente se reduzca a la unidad.
λ x 1 , para que la
11
Método de las POTENCIAS (4)
III.- Se utilizan las componentes del vector obtenido como valores
mejorados de X, sustituyéndolos en el primer miembro de (6.39) para
volver a obtener así, una mejor aproximación en un siguiente paso.
IV.- Se repiten los pasos II y III hasta que la expresión (6.39) quede
esencialmente satisfecha. Es decir se cumpla con la cantidad E fijada
de antemano.
Al iterar se conforma una sucesión:
A X0 ; A 2 X0 ; ... ; A k X0 ,
X0: vector arbitrario supuesto inicialmente. Las potencias de la matriz
A que componen la sucesión, son las que le dan el nombre al método.
Método de las POTENCIAS (5)
Como determinar el autovalor más pequeño y su autovector asociado.?
Es necesario premultiplicar por la inversa de A, resultando:
AX = λ X
A-1 A X = A-1
X = A-1
X
X
12
Método de las POTENCIAS (6)
Dividiendo esta última expresión por el valor de λ, y permutando
ambos miembros, resulta:
A−1 X =
1
λ
X
(6.36)
La que producirá una convergencia al valor más pequeño del
autovalor lambda.
Método de las POTENCIAS (7)
CONCLUSIONES
Convergencia puede resultar lenta: Si los autovalores máximo e
inmediatamente menor tienen valores similares; o, si otro tanto ocurre
con el mínimo e inmediatamente mayor.
La convergencia es hacia el autovalor máximo: Si el autovalor
máximo tiene multiplicidad dos, pero, las componentes del autovector
convergen a cualquiera de los dos que están asociados a aquel;
dependiendo esto, del vector X supuesto inicialmente.
13
Método de las POTENCIAS (8)
En caso que el vector supuesto inicialmente sea ortogonal con el
autovector asociado al autovalor máximo de la matriz traspuesta,
convergirá al autovalor que le sigue en magnitud en lugar de hacerlo al
máximo.
Como los autovalores son cantidades que hacen que el determinante
de la matriz de coeficientes (A - λ I) sea cero, el rango r de la matriz
de los coeficientes debe ser necesariamente menor que el orden n de la
matriz
Método de las POTENCIAS (9)
Si el rango de la matriz de coeficientes es una unidad menor que el
orden, el sistema de ecuaciones homogéneas que se va a resolver
contiene n-1 ecuaciones independientes para determinar los n
componentes de los autovectores.
14
Método de las POTENCIAS (10)
Si el rango de la matriz de coeficientes es dos unidades menor que
el orden, es necesario suponer valores para dos componentes del
autovector para hallar valores para otras componentes. Habrá solo
n-2 ecuaciones independientes en el sistema. Se dice que el espacio
de soluciones es bidimensional.
Si n-r = 3, se deben suponer tres componentes del autovector, y el
espacio de soluciones será tridimensional. El razonamiento es idéntico
cuando el grado de indeterminación es mayor.
ECUACIONES LINEALES SIMULTÁNEAS
ORTOGONALES
Se presentan métodos especiales destinados específicamente a la
resolución de ECUACIONES LINEALES SIMULTÁNEAS
ORTOGONALES.
Importancia: facilidad y rapidez con que estos sistemas pueden ser
resueltos.
Posibilidad de convertir un sistema cualquiera en ortogonal.
15
Introducción
Un sistema de ecuaciones lineales simultáneas de la forma:
(6.43)
AX=C
;
A = [ aij]
donde, A es una matriz cuadrada de orden nxn, que recibe la
denominación de ORTOGONAL si satisface la condición:
n
∑a
(6.44)
ij
a jr =0;∀ j≠i
r =1
Si la suma de los productos de coeficientes homólogos de dos filas
diferentes del sistema, es nulo. La expresión anterior recibe el nombre
de CONDICIÓN DE ORTOGONALIDAD.
Introducción (2)
Considerando los n coeficientes de cada fila de la matriz A como
componentes de un vector Ai , la condición de ortogonalidad de estos
vectores es precisamente la ecuación (6.44). En general:
(A ;A )=∑ a
i
j
ir
a jr =0;∀i≠ j
(6.45)
r
lo que expresa que, si el producto escalar de dos vectores A i ; A j es
nulo, estos son ortogonales.
16
El Método ANALITICO
El sistema representado por A X = C, puede ser escrito en forma
cartesiana:
 a11 x1 +a12 x2 +Λ +a1n xn =c1
 a x +a x +Λ +a x =c
 21 1 22 2
2n n
2

Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ
 an1 x1 +an 2 x2 +Λ +ann xn =cn
(6.46)
La solución de este sistema, puede encontrarse fácilmente evitando la
aplicación de métodos extensos y complejos
Método ANALITICO (2)
Se transforman las incógnitas x 1 ; x 2 ;...; x n , en otras z 1 ; z 2 ;...; z n
,mediante la relación:
X = AT Z
que, en forma cartesiana se expresa:
 x1 =a11 z1 +a21 z2 +Λ +an1 z n
 x =a z +a z +Λ +a z
 2 12 1 22 2
n2 n

Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
Λ
ΛΛ

 xn =a1n z1+a2 n z 2 +Λ +ann z n
(6.47)
17
Método ANALITICO (3)
Estos valores de x i reemplazados en la expresión (6.46), dan como
resultado:
a11(a11 z1 +a21 z 2 +Λ +an1 zn )+a12 (a12 z1 +a22 z2 +Λ +an 2 z n )+Λ +
 +a (a z +a z +Λ +a z )=c
nn n
1
 1n 1n 1 2 n 2
a21(a11 z1 +a21 z 2 +Λ +an1 zn )+a22 (a12 z1 +a22 z 2 +Λ +an 2 zn )+Λ +

 +a2 n (a1n z1 +a2 n z 2 +Λ +ann z n )=c2
Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ

an1(a11 z1 +a21 z 2 +Λ +an1 z n )+an 22 (a12 z1 +a22 z 2 +Λ +an 2 z n )+Λ +

 +ann (a1n z1 +a2 n z2 +Λ +ann z n )=cn
Método ANALITICO (4)
Estas últimas expresiones se pueden ordenar en función de las
incógnitas definidas zi, resultando
(
)
 a112 +a122 +Κ +a12n z1 +(a11 a21 +a12 a22 +Κ +a1n a2 n )z 2 +Κ +

 +(a11 an1 +a12 an 2 +Κ +a1n ann )z n =c1
2
2
(a21 a11 +a22 a12 +Κ +a2 n a1n )z1 + a21
+a22
+Κ +a22n z 2 +Κ +

 +(a21 an1 +a22 an 2 +Κ +a2 n ann )z n =c2
Λ Λ Λ Λ Λ Λ Λ Λ Λ

(an1 a11 +an 2 a12 +Κ +ann a1n )z1 +(an1 a21 +an 2 a22 +Κ +ann a2 n )z2 +Κ +

2
2
2
 + an1 +an 2 +Κ +ann z n =cn
(
(
)
)
18
Método ANALITICO (5)
n
ai j a jr =0;∀ j≠i se aprecia
Considerando la condición de ortogonalidad ∑
r =1
que, los paréntesis que encierran sumas de productos se anulan,
quedando solamente aquellos que encierran sumas de cuadrados, así:
(
(
)
)
(
)
 a112 +a122 +Κ +a12n z1 =c1
 2 2
2
 a21 +a22 +Κ +a2 n z2 =c2

Λ Λ Λ Λ
2
 an21 +an22 +Κ +ann
z n =cn
(6.48)
Método ANALITICO (6)
Mediante estas últimas expresiones es posible obtener, de manera
directa, todos los valores de las z i luego, haciendo uso de las
ecuaciones (6.47), se calculan los valores de las x i.
En el caso que la precisión alcanzada no fuera satisfactoria, los
resultados obtenidos son susceptibles de ser refinados mediante el
método de las ecuaciones de error.
19
EJEMPLO
Dado el siguientes sistema, verificar su condición de
ortogonalidad y resolver apropiadamente.
y + 2w = −11
x −

y − 4w
=1
7 x −
4 x + 12 y + 4w = −100

EJEMPLO
Solución: Para verificar la condición de ortogonalidad,
se deben realizar los productos escalares entre
ecuaciones, resultando de esta manera:
(A1 ; A2)=1*7+(-1)*(-1)+2*(-4)=7+1-8=0
(A1 ; A3)=1*4+(-1)*12+2*4=4-12+8=0
(A2 ; A3)=7*4+(-1)*12+(-4)*4=28-12-16=0
20
EJEMPLO
Aplicando al sistema dado, la formula resolvente de
la expresión
(
(
)
)
(
)
 a112 +a122 +Κ +a12n z1 =c1
 2 2
2
 a21 +a22 +Κ +a2 n z2 =c2

Λ Λ Λ Λ
2
 an21 +an22 +Κ +ann
z n =cn
(6.48)
Se obtiene:
6*z1=-11 ; 66*z2=1 ; 176*z3=-100
EJEMPLO
Vale decir:
z1=-11/6 ; z2=1/66 ; z3=-100/176.
Y finalmente reemplazando estos valores en las
expresiones, resulta
X=-4
;
y=-5
;
w=-6
21
Descargar