Determinación Numérica de Eigenvalores y Eigenvectores. José Marı́a Rico Martı́nez Departamento de Ingenierı́a Mecánica. Universidad de Guanajuato, F. I. M. E. E. Calle Tampico No. 912, Col. Bellavista. CP 36730, Salamanca, Gto., México Tel. +52-464-6480911, Fax: +52-464-6472400. E-mail: [email protected] 1 Introducción Estas notas tienen como objetivo presentar los conceptos fundamentales de la teorı́a de Eigenvalores y Eigenvectores, también conocidos como valores y vectores caraterı́sticos o como valores y vectores propios, de una matriz cuadrada, ası́ como una revisión somera de los métodos numéricos empleados para su determinación. 2 Establecimiento del problema y definiciones. Considere una matriz A ∈ n×n dada por ⎡ ⎢ ⎢ ⎢ A=⎢ ⎢ ⎣ a11 a21 a31 .. . a12 a22 a32 .. . a13 a23 a33 .. . ... ... ... .. . a1n a2n a3n .. . an1 an2 an3 . . . ann ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ (1) Definición: Eigenvalor y Eigenvector. Un vector b ∈ n , tal que b = 0, se dice que es un eigenvector, vector propio o vector caracterı́stico, de la matriz A si y sólo si1 Ab = λb, donde λ ∈ C. (2) Además, se dice que el escalar λ es el eigenvalor, valor propio o valor characteristico de la matriz A asociado al eigenvector b; de manera recı́proca, se dice que b es un eigenvector de A asociado al eigenvalor λ. Debe notarse que, aún cuando la matriz A es real, los eigenvalores asociados a la matriz pueden ser números complejos. Teorema I. El conjunto de todos los eigenvectores b asociados al eigenvalor λ constituyen un subespacio vectorial de n , concido como el eigenespacio asociado al eigenvalor λ. Prueba: Es suficiente mostrar que el conjunto de vectores E = {b ∈ n | Ab = λ b} está cerrado respecto a la adición de vectores y la multiplicación por escalar. 1 Debe notarse que la ecuación (2) requiere necesariamente que la matriz deba ser cuadrada. 1 1. Sean b1 , b2 ∈ E, por lo tanto Ab1 = λ b1 y Ab2 = λ b2 Puesto que la multiplicación de matrices es una operación lineal, se tiene que A b1 + b2 = Ab1 + Ab2 = λb1 + λb2 = λ b1 + b2 por lo tanto, el conjunto está cerrado respecto de la adición. 2. Sea b1 ∈ E y μ ∈ , por lo tanto Ab1 = λ b1 . Puesto que la multiplicación de matrices es una operación lineal, se tiene que A μ b1 = μAb1 = μλb1 = λμb1 = λ μb1 . por lo tanto, el conjunto está cerrado respecto a la multiplicación por escalar. Estas dos pruebas parciales verifican que el conjunto de todos los eigenvectores b asociados al eigenvalor λ constituyen un subespacio vectorial de n Considere ahora la ecuación (2), que puede reescribirse de la siguiente forma Ab = λb, o Ab = In λb, o [A − λIn ] b = 0 (3) donde In es la matriz identidad de orden n. Puesto que, por definición, b = 0, la única posibilidad para que la ecuación (3) se satisfaga es que, la matriz [A − λIn ] sea singular y que b sea un elemento del espacio nulo o kernel de la matriz. Una condición necesaria y suficiente para que la matriz [A − λIn ] sea singular es que su determinante sea cero; es decir p(λ) =| A − λIn |= 0. (4) Expandiendo el determinante de la ecuación (4), se obtiene una ecuación polinomial real de n-ésimo orden en λ. Esta ecuación se denomina la ecuación caracterı́stica de la matriz A. Las raices de la ecuación caracterı́stica son los eigenvalores de la matriz y los vectores que satisfacen la ecuación (3) son los eigenvectores asociados a los eigenvalores respectivos. Es importante señalar que si la matriz A es real, la ecuación caracterı́stica de orden n es real. Del teorema fundamental del algebra, se sabe que la ecuación (4) tiene n raices cuando se analiza en el campo de los números complejos, tomando en cuenta la multiplicidad de una raiz; es decir, cuantas veces aparece como repetida una raiz. Además, si la ecuación (4) tiene una raiz compleja o imaginaria, el complejo conjugado de esa raiz, también es raiz de la ecuación. En otras palabras, las raices complejas o imaginarias de una ecuación polinomial real siempre aparecen como pares conjugados. 3 Método directo de determinación de los eigenvalores y eigenvectores de una matriz. Las observaciones indicadas al término de la sección 2, constituyen las bases de la determinación de eigenvalores y eigenvectores por el método directo. Los pasos necesarios para esta determinación se indican a continuación. 1. Determine la ecuación caracterı́stica de la matriz; es decir determine p(λ) =| A − λIn |= 0. 2. Encuentre las n raices de la ecuación caracterı́stica. Estas raices son los eigenvalores de la matriz. 2 3. Para cada uno de los eigenvalores determine el subespacio solución de la ecuación [A − λIn ] b = 0. Estos subespacios solución constituyen el eigenespacio asociado al eigenvalor λ. 3.1 Ejemplo 1. Considere la matriz dada por ⎡ 8 2 4 ⎢ ⎢ 2 6 ⎢ A=⎢ ⎢ 4 3 ⎣ −2 3 ⎤ 1 ⎥ −2 1 ⎥ ⎥ ⎥ −8 0 ⎥ ⎦ 4 5 La ecuación caracterı́stica de la matriz A está dada por 0 =| A − λI4 |= p(λ) = −1636 + 756 λ − 49 λ2 − 11 λ3 + λ4 La figura 1 muestra la gráfica de la ecuación caracterı́stica, es evidente, de la figura que existen 4 raices reales Las raices de la ecuación caracterı́stica y, por lo tanto, los eigenvalores de la matriz A están dadas por 2,000 1,000 lambda −8 −6 −4 −2 0 2 4 6 8 10 0 −1,000 −2,000 −3,000 −4,000 Figure 1: Gráfica de la Ecuación Caracterı́stica de la Matriz A. λ1 = −8.382430513, λ2 = 3.094656787, λ3 = 6.339424118, λ4 = 9.948349608. Para la determinación de los eigenvectores asociados a λ1 = −8.382430513, se tienen que realizar los siguientes cálculos. 1. Determinar la matriz A − λ1 I4 , dada por ⎡ 16.38243051 2 4 ⎢ ⎢ 2 14.38243051 −2 ⎢ A − λ1 I4 = ⎢ ⎢ 4 3 0.382430513 ⎣ −2 3 3 4 1 1 0 13.38243051 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ 2. Obtener la forma escalonada reducida de la matriz A − λ1 I4 , dada por ⎡ 16.38243051 2.0 4.0 1.0 ⎢ ⎢ 0 14.13826650 −2.488328029 0.8779179928 ⎢ ⎢ ⎢ 0 0 5.059299318 13.30306562 ⎣ 0 0 0 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ 0.0000000009 Este resultado parece contradictorio, si los cálculos se hubieran realizado de manera exacta, la matriz A − λ1 I4 debe ser singular, y el término (4, 4) de la forma escalonada reducida deberı́a ser igual a 0. La diferencia es el resultado de no realizar los cálculos de manera exacta. 3. Despreciando el error indicado en el punto anterior, el eigenvector asociado al eigenvalor λ1 está dado por la solución del sistema ⎡ ⎤ ⎤⎡ ⎡ ⎤ 16.38243051 2.0 4.0 1.0 x1 0 ⎢ ⎥ ⎢ x2 ⎥ ⎢ ⎥ ⎣ ⎢ ⎦ 0 14.13826650 −2.488328029 0.8779179928 ⎥ ⎣ ⎦ ⎣ x3 ⎦ = 0 0 0 0 5.059299318 13.30306562 x4 La solución está dada por bλ = 1 −0.2453188593 0.1996149746 1 −0.3803107842 T . Es importante señalar que cualquier múltiplo escalar de bλ1 es igualmente un eigenvector de la matriz A asociado al eigenvalor λ1 . Procediendo de manera semejante con los restantes eigenvalores, se tiene que 1. Para λ2 = 3.094656787, se tiene que bλ = 2 0.06478833904 −0.4579574956 −0.1004735120 1 T . 2. Para λ3 = 6.339424118, se tiene que bλ = 3 −0.5802494150 0.2153771052 −0.1168015068 1 T . 3. Para λ4 = 9.948349608, se tiene que bλ = 4 4 1 0.3756429166 0.2856490351 0.05446763308 T . Determinación de Eigenvalores y Eigenvectores de Matrices Simétricas. Esta sección inicia definiendo de manera formal una matriz simétrica. Definición. Una matriz A ∈ n×n se dice que es simétrica, si y sólo si, su transpuesta es igual a la matriz original, es decir: AT = A. Si la matriz cuyos eigenvalores y eigenvectores se desea determinar es simétrica, entonces es posible encontrar interesantes resultados teóricos que simplifican esa determinación. Por ejemplo, en la sección 2, se comentó que 4 los eigenvalores de una matriz real pueden ser reales o complejos, sin embargo, si la matriz es simétrica, puede probarse que todos sus eigenvalores son reales. Sin embargo, para probar estos resultados, es necesario emplear algunos resultados acerca de matrices definidas sobre el campo de los números complejos y de espacios vectoriales complejos. Definición. Considere el espacio vectorial C n , definido sobre el campo de los números complejos, C, es posible definir la siguiente forma cuadrática ∗ q : Cn → q(v ) = v v , donde la barra indica la transpuesta conjugado del vector. Es necesario probar que la imagen de este mapeo es efectivamente un número real T q(v ) = v v = n v j vj = j=1 n (aj + i bj )(aj + i bj ) = j=1 n (a2j + b2j ) ∈ j=1 Teorema II. La forma cuadrática definida en la definición anterior es positiva definida. Prueba: Es evidente que q(v ) ≥ 0 ∀v ∈ C n . En particular, si q(v ) = 0, entonces n (a2j + b2j ) = 0 ⇔ aj = bj = 0 ∀j = 1, 2, . . . , n. j=1 Por lo tanto, q(v ) = 0 ⇔ v = 0. Ahora se analizarán algunas propiedades de matrices complejas. Definición. Considere el álgebra de matrices cuadradas, C n×n , definidas sobre el campo de los números complejos. Una matriz A ∈ C n×n se denomina hermitiana si ∗ A = A. ∗ Donde, A representa la transpuesta conjugada de la matrix A. Es decir, una matriz es hermitiana, si la matriz es igual a su transpuesta conjugada. Puesto que el campo de los números reales es un subcampo de los números complejos, < C, entonces si a ∈ , entonces a = a, y se tiene el siguiente resultado. Teorema III. Una matriz simétrica, real, es una matriz hermitiana. ∗ Prueba: Suponga que A ∈ n×n < C n×n es simétrica, entonces A = AT , y se tiene que ∗ A = AT = A. por lo tanto es hermitiana. Teorema IV. Sea A ∈ C n×n una matriz hermitiana. Entonces ∗ 1. x A x es un número real para todo x ∈ C n , y 2. Todos los eigenvalores de A son reales. Prueba: Para la primera parte, considere el número complejo ∗ ∗ ∗ ∗ ∗ ∗∗ x A x = x A x = x A x 5 puesto que el número complejo satisface la propiedad de que su conjugado es igual al número, entonces el número “complejo” es, en realidad, un número real. Para la segunda parte considere, un eigenvalor λ de la matriz A hermitiana y sea x un eigenvector de A ∗ asociado a λ y con la propiedad que su forma cuadrática q(x) = x x = 1, entonces A x = λ x Además ∗ ∗ ∗ λ = λ x x = x λ x = x A x. Debe notarse que por el primer resultado de este teorema λ es un número real. Debe recordarse que como indica el Teorema III, todas las matrices simétricas son hermitianas, de manera que todos los resultados del Teorema IV son aplicables a todas las matrices simétricas. Puede, además, mostrarse que si la matriz es simétrica los eigenvectores son ortogonales, sin embargo, la prueba de este resultado requiere de conceptos bastante mas complicados. 4.1 Ejemplo 2. Considere la matriz dada por ⎡ 8 2 ⎢ ⎢ 2 6 ⎢ A=⎢ ⎢ 4 −2 ⎣ 1 1 4 1 0 5 ⎤ ⎥ −2 1 ⎥ ⎥ ⎥ −8 0 ⎥ ⎦ La ecuación caracterı́stica de la matriz A está dada por 0 =| A − λI4 |= p(λ) = −2444 + 946 λ − 60 λ2 − 11 λ3 + λ4 La figura 2 muestra la gráfica de la ecuación caracterı́stica, es evidente, de la figura que existen 4 raices reales Las raices de la ecuación caracterı́stica y, por lo tanto, los eigenvalores de la matriz A están dadas por 3,000 2,000 lambda 1,000 −10 −8 −6 −4 −2 0 2 4 6 8 10 0 −1,000 −2,000 −3,000 −4,000 −5,000 −6,000 Figure 2: Gráfica de la Ecuación Caracterı́stica de la Matriz A. 6 λ1 = −9.325502313, λ2 = 4.446795311, λ3 = 5.915205526, λ4 = 9.963501476. Para la determinación de los eigenvectores asociados a λ1 = −9.325502313, se tienen que realizar los siguientes cálculos. 1. Determinar la matriz A − λ1 I4 , dada por ⎡ 17.32550231 2 4 ⎢ ⎢ 2 15.32550231 −2 ⎢ A − λ1 I4 = ⎢ ⎢ 4 −2 1.325502313 ⎣ 1 1 0 ⎤ 1 ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ 1 0 14.32550231 2. Obtener la forma escalonada reducida de la matriz A − λ1 I4 , dada por ⎡ 17.32550231 2.0 4.0 1.0 ⎢ ⎢ 0 15.09462877 −2.461747074 0.8845632315 ⎢ ⎢ ⎢ 0 0 −0.0866122253 14.21594747 ⎣ 0 0 0 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ −0.00000000332 Este resultado parece contradictorio, si los cálculos se hubieran realizado de manera exacta, la matriz A − λ1 I4 debe ser singular, y el término (4, 4) de la forma escalonada reducida deberı́a ser igual a 0. La diferencia es el resultado de no realizar los cálculos de manera exacta. 3. Despreciando el error indicado en el punto anterior, el eigenvector asociado al eigenvalor λ1 está dado por la solución del sistema ⎤ ⎡ ⎤⎡ ⎡ ⎤ 17.32550231 2.0 4.0 1.0 x1 0 ⎢ ⎥ ⎢ x2 ⎥ ⎥ ⎣ ⎢ ⎢ ⎦ 0 15.09462877 −2.461747074 0.8845632315 ⎥ ⎣ ⎦ ⎣ x3 ⎦ = 0 0 x4 0 0 −0.0866122253 14.21594747 La solución está dada por bλ = 1 −0.2500102856 0.1627305853 1 0.006092610111 T . Es importante señalar que cualquier múltiplo escalar de bλ1 es igualmente un eigenvector de la matriz A asociado al eigenvalor λ1 . Procediendo de manera semejante con los restantes eigenvalores, se tiene que 1. Para λ2 = 4.446795311, se tiene que bλ = −0.07156723992 −0.4816374493 0.05439198782 1 T . 2 2. Para λ3 = 5.915205526, se tiene que bλ = −0.5818315235 1 −0.3109782378 0.4569120971 T . 3 3. Para λ4 = 9.963501476, se tiene que bλ = 1 0.4961701156 0.1674317099 0.3014344054 T . 4 7