ECUACIONES LINEALES SIMULTANEAS HOMOGENEAS Métodos Numéricos /Análisis Numérico/ Cálculo Numérico Objetivo: Resolución de sistemas de ecuaciones lineales homogéneas por métodos aproximados. SISTEMAS DE ECUACIONES HOMOGÉNEAS Se considerará la solución de ecuaciones algebraicas lineales simultáneas HOMOGÉNEAS, que tienen la forma: a11 x1 +a12 x2 + ... +a1m xm =0 a x +a x + ... +a x =0 21 1 22 2 2m m .......... .......... .......... ............. an1 x1 +an 2 x2 + ... +anm xm =0 (6.20) El sistema puede ser escrito en notación matricial: A.X=0 (6.21) 1 Generalidades Un conjunto de ecuaciones homogéneas como el (6.20) tiene siempre una solución, ya que la matriz ampliada y la del sistema presentan, el mismo rango. Si el rango r de la matriz de los coeficientes del conjunto de ecuaciones es igual al orden n, el sistema tiene una única solución, que es la denominada SOLUCIÓN TRIVIAL (x1 = x2 = ... = xn = 0). Para este conjunto de ecuaciones, todas las ecuaciones del sistema son linealmente independientes -> Det A ≠ 0. Generalidades (2) Existen soluciones NO TRIVIALES si, y solo si, r < n. Entonces Det A = 0, r : nro de ec. Linealmente independientes n-r: Ec. Linealmente dependientes Para este tipo de soluciones, no se encuentran valores únicos para las incógnitas. Se establecen relaciones entre las incógnitas. Cualquier combinación de valores de x que satisface estas relaciones constituye una solución. Los problemas más importantes que se plantean en la aplicación de ecuaciones homogéneas son aquellos denominados de VALORES CARACTERÍSTICOS 2 Generalidades (3) Las ecuaciones pueden escribirse, de manera cartesiana, en la forma: (a11 −λ )x1 + a12 x2 +Κ + a1n xn =0 a x +(a −λ )x +Κ + a x =0 21 1 22 2 2n n ΛΛΛΛΛΛΛΛΛΛΛ an1 x1 + an 2 xn 2 +Κ +(ann −λ )xn =0 (6.22) donde, los aij son reales, las xi son las variables del sistema y lambda es un parámetro particular del sistema que tiene valores, en general, desconocidos. En la notación matricial ( A - λI ) X = 0 (6.23) Generalidades (4) Donde al incorporar la matriz identidad I, se puede utilizar a ( A - λ I ) como matriz de coeficientes. La matriz columna X recibe el nombre de VECTOR CARACTERÍSTICO ó AUTOVECTOR ó EIGENVECTOR; siendo las xi las componentes de dicho vector característico. Los valores que se obtienen para lambda se conocen como VALORES CARACTERÍSTICOS ó AUTOVALORES ó EIGENVALORES de la matriz A. 3 Generalidades (5) Dado que lambda aparece como incógnita, es posible, hacer que el determinante de dicha matriz sea igual a cero y, llamando D a este, resulta: (6.24) D = A - λI = 0 [ ] y encontrando valores para lambda que hagan D = 0, se tendrá la solución. El desarrollo algebraico del determinante D produce un polinomio de grado n, de la forma: (6.25) λn + p1λn −1 +Κ + pn −1λ + pn =0 Generalidades (6) •Este polinomio recibe el nombre de POLINOMIO CARACTERÍSTICO ó ECUACIÓN CARACTERÍSTICA •Es necesario resolver el POLINOMIO y obtener los lambda λ que hacen D=0. •Las n raíces reciben el nombre AUTOVALORES o VALORES CARACTERISTICOS. •Los valores característicos, se sustituyen, uno a la vez, en el conjunto original de ecuaciones para obtener un sistema correspondiente de relaciones entre las incógnitas x para cada sustitución. 4 Generalidades (7) • • • Las relaciones dependerán del r de la matriz ( A - λ I ). Si es r = n - 1, las relaciones serán tales que la hipótesis de un valor para una incógnita, producirá un valor correspondiente para c/u de las ecuaciones restantes; si r = n - 2, las relaciones serán tales que se tendrán que suponer los valores de dos incógnitas para poder obtener un valor correspondiente a c/u de las incógnitas restantes. Generalidades (8) Cuando n es relativamente pequeño (2 ó 3), el desarrollo de determinantes por menores para obtener el polinomio característico es sencillo; y la posterior determinación de raíces no presenta grandes dificultades. •Para calcular el determinante de una matriz de n * n, se requieren de o (n!) multiplicaciones/divisiones y sumas/restas. Incluso con valores de n relativamente pequeños, la cantidad de cálculos se torna inmanejable. •Cuando n es grande ésta determinación se vuelve muy difícil, sino imposible y se debe apelar, a algún procedimiento numérico tal como alguno de los estudiados en el capítulo correspondiente. 5 Método de FADDEEV-LEVERRIER Este método constituye una técnica eficiente para generar los coeficientes pi del polinomio característico (6.25), tanto, cuando la matriz A de los coeficientes es simétrica, como cuando no lo es. Tiene la ventaja adicional de que se obtiene automáticamente, al finalizar el proceso, la matriz inversa del sistema A-1 . TRAZA de una matriz: La traza de una matriz, que será designada mediante " tr A " es: (6.26) tr A = a11 + a22 + ... + ann Método de FADEEV-LEVERRIER (1) Genera en su procedimiento, una sucesión de matrices B1 ; B2 ; ...; Bn de las que se obtienen una serie de valores, que se denominarán bk (k = 1; 2;...;n) que sustituidos en el POLINOMIO DE FADDEEV-LEVERRIER: ( )n ( (6.27) −1 λn −b1λn −1 −Κ −bn −1λ −bn dan como resultado los coeficientes pk )=0 El factor (-1)n se utiliza para dar a los términos los signos que tendría el polinomio característico si hubiese sido generado desarrollando el determinante correspondiente. 6 Método de FADDEEV-LEVERRIER (2) Los valores de bk se obtienen así: B1 = A ; b1 = tr B1 B 2 = A ( B 1 - b1 I ) ; b2 = 1/2 tr B2 (6.28) …………………………………………………….. Bn = A ( Bn-1 - bn-1 I ) ; bn = 1/n tr Bn Puede demostrarse que la inversa de la matriz A, cuyos valores característicos se desea hallar, se determinan a partir de la ecuación: (6.29) A-1 = 1/bn ( Bn-1 - bn-1 I ) Método de FADDEEV-LEVERRIER (3) Ejemplo: supóngase que se ha obtenido, como modelo matemático de algún problema determinado, el siguiente sistema lineal homogéneo de ecuaciones: (3 − λ ) x1 2 x1 4x 1 + + 4 x3 =0 + ( 0 − λ ) x2 + 2 x3 =0 + + (3 − λ ) x3 2 x2 2 x2 =0 7 Método de FADDEEV-LEVERRIER (4) Se debe generar las matrices Bk a partir de la matriz A del sistema. Siendo: 3 2 4 A = 2 0 2 4 2 3 Entonces: 3 2 4 B1 = 2 0 2 ⇒ b1 ≅ trB1 = 3 + 0 + 3 = 6 4 2 3 Método de FADDEEV-LEVERRIER (5) De la misma manera 3 2 4 3 2 4 6 0 0 11 2 4 B2 = A * ( B1 − b1 * I ) = 2 0 2 * 2 0 2 − 0 6 0 = 2 8 2 ⇒ 4 2 3 4 2 3 0 0 6 4 2 11 1 1 ⇒ b2 ≅ * trB2 = (11 + 8 + 11) = 15 2 2 8 Método de FADDEEV-LEVERRIER (6) 3 2 4 11 2 4 15 0 0 8 0 0 B3 = A* (B2 − b2 * I ) = 2 0 2 * 2 8 2 − 0 15 0 = 0 8 0 ⇒ 4 2 3 4 2 11 0 0 15 0 0 8 1 1 ⇒ b3 ≅ *trB3 = (8 + 8 + 8) = 8 3 3 Sustituyendo los valores de los bk en el polinomio de FADDEEV-LEVERRIER, se obtiene: (−1) 3 * (λ3 − 6λ2 − 15λ − 8) = 0 Método de FADDEEV-LEVERRIER (7) Del cual resulta: − λ3 + 6λ2 + 15λ + 8 = 0 O, multiplicando por -1 λ3 − 6λ2 − 15λ − 8 = 0 Que es el polinomio característico. Obteniendo la raíces de la ecuación dada mediante cualquier método, resultan los valores propios. λ = 8; 1 λ2 = −1; λ3 = −1 9 Método de FADDEEV-LEVERRIER (8) Los que, sustituidos de uno por vez en el sistema, permite el calculo de las componentes xj (j=1; 2; 3) de los vectores característicos o autovectores. Finalmente, para hallar la matriz inversa del sistema, se debe hacer 4 4 2 − 8 11 2 4 1 0 0 8 8 1 2 7 2 A−1 = * 2 8 2 − 15 * 0 1 0 = − 8 8 8 8 0 0 1 4 2 4 4 2 11 − 8 8 8 Método de las POTENCIAS El método de las POTENCIAS es un método iterativo. Utilizado en aquellos casos en que solamente se desea conocer el autovalor más pequeño y/o más grande, juntamente con sus autovectores asociados. Una ventaja adicional de este método es que los autovalores se obtienen simultáneamente con sus respectivos autovectores. 10 Método de las POTENCIAS (2) Para determinar el autovalor más grande, supóngase que tanto los elementos de la matriz como del autovalor son reales. Sea el sistema: (A − λI )X = 0 (6.38) donde, realizando el producto indicado por el paréntesis, se obtiene: AX − λ IX = AX − λ X = 0 y transponiendo términos: AX = λ X (6.39) Método de las POTENCIAS (3) Haciendo uso sistemático de esta última ecuación (6.39) y realizando los siguientes pasos: I.- Asignar valores arbitrarios a las componentes de X, y designándolo con X0 se sustituye en el 1er. Miembro de A X= λX , con lo cual se obtiene λla primera aproximación del 2do. miembro. En general, resulta satisfactorio tomar los valores para xi = 1; 2; ... ;n. AX 0 = λ X 1 II.- Dividir los elementos del vector λ X 1 por primera componente se reduzca a la unidad. λ x 1 , para que la 11 Método de las POTENCIAS (4) III.- Se utilizan las componentes del vector obtenido como valores mejorados de X, sustituyéndolos en el primer miembro de (6.39) para volver a obtener así, una mejor aproximación en un siguiente paso. IV.- Se repiten los pasos II y III hasta que la expresión (6.39) quede esencialmente satisfecha. Es decir se cumpla con la cantidad E fijada de antemano. Al iterar se conforma una sucesión: A X0 ; A 2 X0 ; ... ; A k X0 , X0: vector arbitrario supuesto inicialmente. Las potencias de la matriz A que componen la sucesión, son las que le dan el nombre al método. Método de las POTENCIAS (5) Como determinar el autovalor más pequeño y su autovector asociado.? Es necesario premultiplicar por la inversa de A, resultando: AX = λ X A-1 A X = A-1 X = A-1 X X 12 Método de las POTENCIAS (6) Dividiendo esta última expresión por el valor de λ, y permutando ambos miembros, resulta: A−1 X = 1 λ X (6.36) La que producirá una convergencia al valor más pequeño del autovalor lambda. Método de las POTENCIAS (7) CONCLUSIONES Convergencia puede resultar lenta: Si los autovalores máximo e inmediatamente menor tienen valores similares; o, si otro tanto ocurre con el mínimo e inmediatamente mayor. La convergencia es hacia el autovalor máximo: Si el autovalor máximo tiene multiplicidad dos, pero, las componentes del autovector convergen a cualquiera de los dos que están asociados a aquel; dependiendo esto, del vector X supuesto inicialmente. 13 Método de las POTENCIAS (8) En caso que el vector supuesto inicialmente sea ortogonal con el autovector asociado al autovalor máximo de la matriz traspuesta, convergirá al autovalor que le sigue en magnitud en lugar de hacerlo al máximo. Como los autovalores son cantidades que hacen que el determinante de la matriz de coeficientes (A - λ I) sea cero, el rango r de la matriz de los coeficientes debe ser necesariamente menor que el orden n de la matriz Método de las POTENCIAS (9) Si el rango de la matriz de coeficientes es una unidad menor que el orden, el sistema de ecuaciones homogéneas que se va a resolver contiene n-1 ecuaciones independientes para determinar los n componentes de los autovectores. 14 Método de las POTENCIAS (10) Si el rango de la matriz de coeficientes es dos unidades menor que el orden, es necesario suponer valores para dos componentes del autovector para hallar valores para otras componentes. Habrá solo n-2 ecuaciones independientes en el sistema. Se dice que el espacio de soluciones es bidimensional. Si n-r = 3, se deben suponer tres componentes del autovector, y el espacio de soluciones será tridimensional. El razonamiento es idéntico cuando el grado de indeterminación es mayor. ECUACIONES LINEALES SIMULTÁNEAS ORTOGONALES Se presentan métodos especiales destinados específicamente a la resolución de ECUACIONES LINEALES SIMULTÁNEAS ORTOGONALES. Importancia: facilidad y rapidez con que estos sistemas pueden ser resueltos. Posibilidad de convertir un sistema cualquiera en ortogonal. 15 Introducción Un sistema de ecuaciones lineales simultáneas de la forma: (6.43) AX=C ; A = [ aij] donde, A es una matriz cuadrada de orden nxn, que recibe la denominación de ORTOGONAL si satisface la condición: n ∑a (6.44) ij a jr =0;∀ j≠i r =1 Si la suma de los productos de coeficientes homólogos de dos filas diferentes del sistema, es nulo. La expresión anterior recibe el nombre de CONDICIÓN DE ORTOGONALIDAD. Introducción (2) Considerando los n coeficientes de cada fila de la matriz A como componentes de un vector Ai , la condición de ortogonalidad de estos vectores es precisamente la ecuación (6.44). En general: (A ;A )=∑ a i j ir a jr =0;∀i≠ j (6.45) r lo que expresa que, si el producto escalar de dos vectores A i ; A j es nulo, estos son ortogonales. 16 El Método ANALITICO El sistema representado por A X = C, puede ser escrito en forma cartesiana: a11 x1 +a12 x2 +Λ +a1n xn =c1 a x +a x +Λ +a x =c 21 1 22 2 2n n 2 Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ an1 x1 +an 2 x2 +Λ +ann xn =cn (6.46) La solución de este sistema, puede encontrarse fácilmente evitando la aplicación de métodos extensos y complejos Método ANALITICO (2) Se transforman las incógnitas x 1 ; x 2 ;...; x n , en otras z 1 ; z 2 ;...; z n ,mediante la relación: X = AT Z que, en forma cartesiana se expresa: x1 =a11 z1 +a21 z2 +Λ +an1 z n x =a z +a z +Λ +a z 2 12 1 22 2 n2 n Λ Λ Λ Λ Λ Λ Λ Λ Λ ΛΛ xn =a1n z1+a2 n z 2 +Λ +ann z n (6.47) 17 Método ANALITICO (3) Estos valores de x i reemplazados en la expresión (6.46), dan como resultado: a11(a11 z1 +a21 z 2 +Λ +an1 zn )+a12 (a12 z1 +a22 z2 +Λ +an 2 z n )+Λ + +a (a z +a z +Λ +a z )=c nn n 1 1n 1n 1 2 n 2 a21(a11 z1 +a21 z 2 +Λ +an1 zn )+a22 (a12 z1 +a22 z 2 +Λ +an 2 zn )+Λ + +a2 n (a1n z1 +a2 n z 2 +Λ +ann z n )=c2 Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ an1(a11 z1 +a21 z 2 +Λ +an1 z n )+an 22 (a12 z1 +a22 z 2 +Λ +an 2 z n )+Λ + +ann (a1n z1 +a2 n z2 +Λ +ann z n )=cn Método ANALITICO (4) Estas últimas expresiones se pueden ordenar en función de las incógnitas definidas zi, resultando ( ) a112 +a122 +Κ +a12n z1 +(a11 a21 +a12 a22 +Κ +a1n a2 n )z 2 +Κ + +(a11 an1 +a12 an 2 +Κ +a1n ann )z n =c1 2 2 (a21 a11 +a22 a12 +Κ +a2 n a1n )z1 + a21 +a22 +Κ +a22n z 2 +Κ + +(a21 an1 +a22 an 2 +Κ +a2 n ann )z n =c2 Λ Λ Λ Λ Λ Λ Λ Λ Λ (an1 a11 +an 2 a12 +Κ +ann a1n )z1 +(an1 a21 +an 2 a22 +Κ +ann a2 n )z2 +Κ + 2 2 2 + an1 +an 2 +Κ +ann z n =cn ( ( ) ) 18 Método ANALITICO (5) n ai j a jr =0;∀ j≠i se aprecia Considerando la condición de ortogonalidad ∑ r =1 que, los paréntesis que encierran sumas de productos se anulan, quedando solamente aquellos que encierran sumas de cuadrados, así: ( ( ) ) ( ) a112 +a122 +Κ +a12n z1 =c1 2 2 2 a21 +a22 +Κ +a2 n z2 =c2 Λ Λ Λ Λ 2 an21 +an22 +Κ +ann z n =cn (6.48) Método ANALITICO (6) Mediante estas últimas expresiones es posible obtener, de manera directa, todos los valores de las z i luego, haciendo uso de las ecuaciones (6.47), se calculan los valores de las x i. En el caso que la precisión alcanzada no fuera satisfactoria, los resultados obtenidos son susceptibles de ser refinados mediante el método de las ecuaciones de error. 19 EJEMPLO Dado el siguientes sistema, verificar su condición de ortogonalidad y resolver apropiadamente. y + 2w = −11 x − y − 4w =1 7 x − 4 x + 12 y + 4w = −100 EJEMPLO Solución: Para verificar la condición de ortogonalidad, se deben realizar los productos escalares entre ecuaciones, resultando de esta manera: (A1 ; A2)=1*7+(-1)*(-1)+2*(-4)=7+1-8=0 (A1 ; A3)=1*4+(-1)*12+2*4=4-12+8=0 (A2 ; A3)=7*4+(-1)*12+(-4)*4=28-12-16=0 20 EJEMPLO Aplicando al sistema dado, la formula resolvente de la expresión ( ( ) ) ( ) a112 +a122 +Κ +a12n z1 =c1 2 2 2 a21 +a22 +Κ +a2 n z2 =c2 Λ Λ Λ Λ 2 an21 +an22 +Κ +ann z n =cn (6.48) Se obtiene: 6*z1=-11 ; 66*z2=1 ; 176*z3=-100 EJEMPLO Vale decir: z1=-11/6 ; z2=1/66 ; z3=-100/176. Y finalmente reemplazando estos valores en las expresiones, resulta X=-4 ; y=-5 ; w=-6 21