Anexo A Introducción a las Matrices A.1. Definiciones y teorı́a básicas Los elementos de las matrices que aparecen en este curso son números o funciones. Los designaremos con el apelativo común de escalares. Definición A.1 (Matrices) Una matriz A es un ordenamiento regular de escalares (recordemos, números o funciones): a11 a12 . . . a1n a21 a22 . . . a2n A = .. .. . . am1 am2 . . . amn Si una matriz tiene m filas y n columnas, se dice que su tamaño es m por n (se escribe m × n). Una matriz n × n se llama matriz cuadrada de orden n. El término aij representa el elemento de la i-ésima fila y la j-ésima columna de una matriz A de tamaño m × n; con ello, una matriz A, m × n, se escribe en la forma A = (aij ) m × n, o simplemente A = (aij ). Una matriz A, 1 × 1, es sólo un escalar (un número o una función). 193 194 Introducción a las Matrices Definición A.2 (Igualdad de matrices) Dos matrices m × n, A y B, son iguales si aij = bij para toda i y j. Definición A.3 (Matriz columna) Una matriz columna X es cualquier matriz con n filas y una columna: x11 x21 X = .. = (xi1 ) n × 1 . xn1 Una matriz columna se llama también vector columna o simplemente vector. Definición A.4 (Producto de matrices por escalares) Si k es un escalar y A una matriz m × n, el producto de k por A es una nueva matriz que se define de la siguiente manera: ka11 ka12 . . . ka1n ka21 ka22 . . . ak2n kA = .. = (kaij ) m × n, .. . . kam1 kam2 . . . akmn en donde k es un escalar; es decir, un número o una función. Ejemplo 1. Productos de matrices por escalares 10 −15 2 −3 a) 5 4 −1 = 20 −5 1 6 1 30 6 1 et b) et −2 = −2et 4 4et Es de notar que para toda matriz A, el producto kA es igual al producto Ak, por ejemplo, µ ¶ µ −3t ¶ µ ¶ 2 2 2e −3t = e−3t e = −3t 5e 5 5 Definición A.5 (Suma de matrices) La suma de dos matrices m × n, A y B, se define como la matriz A + B = (aij + bij ) m × n En otras palabras, para sumar dos matrices del mismo tamaño, se suman los elementos correspondientes. A.1 Definiciones y teorı́a básicas 195 Ejemplo 2. Suma de matrices 2 −1 3 4 7 −8 4 6 yB= 9 3 5 es La suma de A = 0 −6 10 −5 1 −1 2 2+4 −1 + 7 3 + (−8) 6 6 −5 4+3 6 + 5 = 9 7 11 A+B = 0+9 −6 + 1 10 + (−1) −5 + 2 −5 9 −3 Ejemplo 3. Matriz expresada en forma de suma de matrices columna 3t2 − 2et La matriz t2 + 7t se puede expresar como la suma de tres vectores columna: 5t 2 3t2 − 2et 3t 0 −2et 3 0 −2 t2 + 7t = t2 + 7t + 0 = 1 t2 + 7 t + 0 et 5t 0 5t 0 0 5 0 La diferencia de dos matrices m × n se define en la forma acostumbrada: A − B = A + (−B), en donde −B = (−1)B. Definición A.6 (Multiplicación de matrices) Sea A una matriz con m filas y n columnas, y B otra con n filas y p columnas. El producto AB se define como la siguiente matriz n X m × p cuyo elemento en la posición (i, j) es aik bkj . Es decir, k=1 AB = a11 a21 .. . a12 a22 . . . a1n . . . a2n .. . am1 am2 . . . amn b11 b12 . . . b1p b21 b22 . . . b2p .. .. . . bn1 bn2 . . . bnp = a11 b11 + a12 b21 + . . . + a1n b1n . . . a11 b1p + a12 b2p + . . . + a1n bnp = a21 b11 + a22 b21 + . . . + a2n bn1 . . . a21 b1p + a22 b2p + . . . + a2n bnp am1 b11 + am2 b21 + . . . + amn bn1 . . . am1 b1p + am2 b2p + . . . + amn bnp à n ! X = (m × p) aik bkj k=1 196 Introducción a las Matrices Obsérvese con detenimiento la Definición A.6. El producto AB = C sólo está definido cuando el número de columnas en la matriz A es igual al número de filas en B. El tamaño del producto se puede determinar con Am×n Bn×p = Cm×p . Se debe observar también que los elementos de la i-ésima fila de la matriz producto AB se forman aplicando la definición del producto escalar de la i-ésima fila de A por cada una de las columnas de B. En efecto, recordemos que dado dos vectores de n componentes: a = (a1 , a2 , . . . , an ) y b = (b1 , b2 , . . . , bn ), el producto escalar de a por b se define como a · b = a1 b1 + a2 b2 + · · · + an bn . Ası́, el elemento de la posición (i, j) de AB es ai · bj , siendo ai la i-ésima fila de A y bj la j-ésima columna de B. Ejemplo 4. Multiplicación de matrices µ a) Si A = 4 7 3 5 ¶ µ yB= µ AB = 9 −2 6 8 ¶ , 4 · 9 + 7 · 6 4 · (−2) + 7 · 8 3 · 9 + 5 · 6 3 · (−2) + 5 · 8 µ 5 8 −4 −3 b) Si A = 1 0 y B = 2 0 2 7 5 · (−4) + 8 · 2 AB = 1 · (−4) + 0 · 2 2 · (−4) + 7 · 2 ¶ µ = 78 48 57 34 ¶ ¶ , 5 · (−3) + 8 · 0 −4 −15 1 · (−3) + 0 · 0 = −4 −3 2 · (−3) + 7 · 0 6 −6 En general, la multiplicación de matrices no esto es, AB 6= BA. En la µ es conmutativa; ¶ 30 53 parte a) del Ejémplo 4 obsérvese que BA = , mientras que en la parte b) el 48 82 producto BA no está definido porque en la Definición A.6 se pide que el número de filas de la primera matriz, en este caso B, sea el mismo número que el número de columnas de la segunda, en este caso A. Cosa que no sucede en el el caso b) del Ejemplo 4. Nos interesa mucho el producto de una matriz cuadrada por un vector columna. Ejemplo 5. Multiplicación de matrices y vectores El producto de una matriz A, m × n, y un vector columna b, n × 1, es un vector ciolumna Ab de tamaño m × 1. Ası́, por ejemplo A.1 Definiciones y teorı́a básicas 197 2 −1 3 −3 2 · (−3) + (−1) · 6 + 3 · 4 0 a) 0 4 5 6 = 0 · (−3) + 4 · 6 + 5 · 4 = 44 1 −7 9 4 1 · (−3) + (−7) · 6 + 9 · 4 −9 µ ¶µ ¶ µ ¶ −4 2 x −4x + 2y = b) 3 8 y 3x + 8y La matriz Identidad. Para un entero 1 0 In = .. . 0 positivo n, la matriz n × n 0 0 ... 0 1 0 ... 0 .. . 0 0 ... 1 es la matriz identidad. Según la Definición A.6, para toda matriz A,n × n, AIn = In A = A También se comprueba con facilidad que si X es una matriz columna n × 1, entonces In X = X. La matriz Cero. Una matriz,m × n, formada cuyos elementos son todos el número cero se llama matriz cero y se representa con 0m×n ; por ejemplo, µ ¶ µ ¶ 0 0 0 0 0 02×1 = , 02×2 = , 03×2 = 0 0 0 0 0 0 0 y ası́ sucesivamente. Cuando el tamaño de la matriz cero se puede deducir por el contexto, o cuando se ha dado explı́ictamente con anterioridad, se suele prescrindir del subı́ndice que indica el tamaño y se ecribe simplemente 0. Por ejemplo, si A y 0 son matrices de m × n, entonces A+0=0+A=A Propiedad asociativa. Aunque no lo demostraremos, la multiplicación matricial es asociativa. Si A es una matriz m × p, B una matriz p × r y C una matriz r × n, entonces A(BC) = (AB)C es una matriz de m×n. El paréntesis indica la prioridad en la operación. Ası́, A(BC) significa que multiplicamos primero B y C y entonces hacemos el producto de A por el resultado obtenido al multiplicar B y C. Nótese que la asociatividad indica que independeinetmente de la prioridad en las operaciones, el resultado es el mismo. 198 Introducción a las Matrices Propiedad distributiva. Si todos los productos están definidos, la multiplicación es distributiva respecto la suma: A(B + C) = AB + AC y (B + C)A = BA + CA Determinante de una matriz. Con toda matriz cuadrada A, hay un número asociado llamado determinante de la matriz que se representa mediante det A. La fórmula general para calcular el determinate de la matriz cuadrada A de orden n es X a1σ(1) a2σ(2) · · · anσ(n σ donde el sumatorio está extendido a las n! permutaciones σ de los números (1, 2, . . . , n). Ası́, si n = 3, las 3! = 6 permutaciones posibles de (1, 2, 3) son: (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2) y (3, 2, 1). Por lo tanto, si A es 3 × 3 entonces det A = a11 a22 a23 + a11 a23 a32 + a12 a21 a33 + a12 a23 a31 + a13 a21 a32 + a13 a22 a31 . Por lo general para matrices cuadradas de tamaño grande el cálculo del determinante es una labor costosa cuando se hace a mano y el uso de ordenadores es aconsejable. Los métodos ideados para el cálculo de determinantes mediante ordenadores (métodos numéricos) no se basan en la definición, sino en ciertas propiedades de las matrices. En este curso sólo habrá que calcular determinantes de matrices de tamaño 3 a lo más. Para ello la fórmula de más arriba es suficiente. No obstante, hay una fórmula que permite reducir el cálculo del determinante de una matriz n × n a la suma de n determinantes de matrices de tamaño (n − 1) × (n − 1). Es la fórmula conocida como desarrollo del determinante por los elementos de una fila y que se debe, aunque con una formulación mucho más general, a Laplace: det A = ai1 Ai1 + ai2 Ai2 + · · · + ain Ain en donde Aij = (−1)i+j det Ãij y Ãij es la matriz que se obtiene de A al quitar la i-ésima fila y la j-esima columna. Ejemplo 6. Determinante de una matriz cuadrada. 3 6 2 Ası́, si A = 2 5 1 , y desarrollamos det A por los elementos de la primera fila: −1 2 4 µ ¶ µ ¶ µ ¶ 3 6 2 5 1 2 1 2 5 2 5 1 det A = det = 3 det − 6 det + 2 det 2 4 −1 4 −1 2 −1 2 4 = 3(20 − 2) − 6(8 + 1) + 2(4 + 5) = 18 Si A tiene uns fila (o columna) con muchos elementos cero, por nuestra comodidad debemos desarrollar ese determinante por los elementos de esa fila (o columna). A.1 Definiciones y teorı́a básicas 199 Definición A.7 (Rango de una matriz) .- Se define el rango de una matriz A, m × n, como el tamaño de la mayor submatriz cuadrada de A con determinante distinto de cero El cálculo del rango de una matriz es una tarea muy costosa cuando se quiere utilizar esta definición. De hecho, casi nunca se utiliza. Veremos que mediante operaciones elementales por filas se obtiene el rango de una matriz de una manera mucho más sencilla. Hay que decir, no obstante, que para matrices muy grandes el cálculo del rango de una matriz es un problema muy complicado, en general. Definición A.8 (Transpuesta de una matriz) La transpuesta de la matriz A = (aij ), m × n, es la matriz AT n × m representada por a11 a21 . . . am1 a12 a22 . . . am2 T A = .. .. . . a1n a2n . . . amn En otras palabras, las filas de A se convierten en las columnas de su traspuesta, AT . Ejemplo 7. Transpuesta de una matriz 3 6 2 3 2 −1 a) La transpuesta de A = 6 5 2 es AT = 6 5 2 . 2 1 4 2 1 4 5 0 , entonces X T = (5 0 3). b) Si X = 3 Definición A.9 (Inversa de una matriz) Sea A una matriz n × n. Si existe una matriz B n × n tal que AB = BA = In , en donde In es la matriz identidad, entonces B es la inversa de A y se representa con B = A−1 . Definición A.10 (Matrices no singulares y singulares) Sea A una matriz n × n. Si det A 6= 0, se dice que A es no singular. Si det A = 0, entonces A es singular. 200 Introducción a las Matrices El siguiente teorema especifica una condición necesaria y suficiente para que una matriz cuadrada de números reales o complejos tenga inversa. Teorema A.11 (La no singularidad implica que A tiene una inversa) Una matriz de números reales o complejos A n × n tiene inversa A−1 si y sólo si A es no singular. El teorema que sigue describe un método para hallar la inversa de una matriz no singular. Teorema A.12 (Fórmula de la inversa de una matriz) Sea A una matriz no singular n × n, y sea, como más arriba, Aij = (−1)i+j Mij , donde Mij es el determinante de la matriz de (n − 1) × (n − 1) obtenido al eliminar la i-ésima fila y la j-ésima columna de A. Entonces A−1 = 1 (Aij )T det A (A.1) Cada Aij en el Teorema A.12 es tan sólo el cofactor (o menor con signo) del elemento aij correspondiente a A. Obsérvese que en la fórmula (A.1) se utilizan las transpuesta. Para una matriz 2 × 2 µ A= a11 a12 a21 a22 ¶ se tiene A11 = a22 , A12 = −a21 , A21 = −a21 y A22 = a11 . Entonces µ ¶T µ ¶ 1 1 a22 −a21 a22 −a12 −1 = . A = det A −a12 a11 det A −a21 a11 Para una matriz no singular 3 × 3 µ A11 = det a22 a23 a32 a33 ¶ , a11 a12 A = a21 a22 a31 a32 µ a21 A12 = − det a31 a13 a23 , a33 ¶ a23 a33 µ , etcétera. Para calcuar la inversa, trasponemos y llegamos a A11 A21 A31 1 A12 A22 A32 A−1 = det A A13 A23 A33 Ejemplo 8. Inversa de una matriz 2 × 2 A13 = det a21 a22 a31 a32 ¶ , A.1 Definiciones y teorı́a básicas 201 µ Vamos a calcular la inversa de A = 1 4 2 10 ¶ En primer lugar det A = 10 − 8 = 2 6= 0, de modo que A es no singular y por el Teorema A.12, A−1 existe. De acuerdo con (A.1), µ ¶ µ ¶ 1 10 −4 5 −2 −1 A = = . −1 12 2 −2 1 µ ¶ 2 2 No toda matriz cuadrada tiene inversa. La matriz A = es singular porque det A = 3 3 0; por consiguiente, A−1 no existe. Ejemplo 9. Inversa de una matriz 3 × 3 2 2 0 Calculemos la inversa de A = −2 1 1 . 3 0 1 Puesto que det A = 12 6= 0, la matriz dada es no singular. Los cofactores correspondientes a los elementos de cada fila de A son µ ¶ µ ¶ µ ¶ 1 1 −2 1 −2 1 A11 = det = 1 A12 = det = 5 A13 = det = −3 0 1 3 1 3 0 µ ¶ µ ¶ µ 2 0 2 0 A21 = det = −2 A22 = det = 2 A23 = det 0 1 3 1 µ ¶ µ ¶ µ 2 0 2 0 A31 = det = 2 A32 = det = −2 A13 = det 0 1 −2 1 2 2 3 0 ¶ 2 2 −2 1 =6 ¶ =6 De acuerdo con (A.1) A−1 1 1 −2 2 − 16 16 12 1 5 1 5 2 −2 = 12 − 61 . = 6 12 1 1 1 −3 6 6 −4 2 2 Se puede, y conviene, comprobar que, en efecto, A−1 A = AA−1 = I3 . Dado que la fórmula (A.1) para hallar la inversa de una matriz se basa en el cálculo de determinantes, para hallar la inversa de matrices no singulares de tamaños grandes no se emplea, en la práctica este método. Hay otros métodos mucho más eficaces, desde el punto de vista del cálculo, que tienen que ver con la factorización de matrices yq eu pueden 202 Introducción a las Matrices encontrarse en cualquier libro de Algebra Lineal Numérica. No los discutiremos aquı́ porque el tamaño de nuestras matrices no será, en la práctica, nunca mayor que 3. Como nuestra meta es utilizar las matrices para la resolución de sistemas de ecuaciones diferenciales lineales de primer orden, necesitaremos otras definiciones adicionales: Definición A.13 (Derivada de una matriz de funciones) Si A(t) = (aij (t)) es una matriz m × n cuyos elementos son funciones diferenciables en un intervalo común, entonces se define la derivada de A(t) como la matriz cuyos elementos son las derivadas de los elementos de A(t). Es decir: µ ¶ dA daij (t) = (t) (m × n). dt dt Definición A.14 (Integral de una matriz de funciones) Si A(t) = (aij (t)) es una matriz m × n cuyos elementos son funciones continuas en un intervalo que contiene a t y a t0 , entonces la integral de A(t) es una matriz cuyos elementos son las integrales de los elementos de A(t). Es decir: µZ t ¶ Z t A(s)ds = aij (s)ds (m × n) t0 t0 En otras palabras, para derivar o integrar una matriz de funciones, tan sólo hay que derivar o integrar cada uno de sus elementos. La derivada de una matriz también se representa con A0(t). Ejemplo 10. Derivada o integral de una matriz Si sen 2t X(t) = e3t 8t − 1 entonces X 0 (t) = Y Z t 0 d (sen 2t) dt d (e3t ) dt d (8t − 1) dt 2 cos 2t = 3e3t . 8 Rt 1 sen 2sds − 2 cos 2t + 0R t 3s 1 3t e − 13 X(x)ds = = e ds 3 Rt 0 4t2 − t (8s − 1)ds 0 1 2 . A.2 Eliminación de Gauss-Jordan A.2. 203 Eliminación de Gauss-Jordan Las matrices son una ayuda insustituible para resolver sistemas algebraicos de ecuaciones lineales. Recordemos que éstos son de la forma: a11 x1 + a12 x2 + · · · + a1n xn = b1 a21 x1 + a22 x2 + · · · + a2n xn = b2 .. . (A.2) am1 x1 + am2 x2 + · · · + amn xn = bm donde m es el número de ecuaciones y n el de incógnitas. Si A representa la matriz de los coeficientes en (A.2), sabemos que se puede usar la regla de Cramer para resolver el sistema, siempre que m = n y det A 6= 0. Sin embargo, seguir esta regla es prácticamente imposible si el tamaño de A es mayor que 3. El procedimiento que describiremos tiene la ventaja de ser no sólo un método eficiente para manejar sistemas grandes, sino también un método para saber si el sistema (A.2) es consistente (es decir, admite alguna solución), y, en su caso, hallar todas las soluciones. Definición A.15 (Matriz aumentada) La matriz aumentada del sistema (A.2) es la matriz de m × (n + 1) a11 a12 . . . a1n b1 a21 a22 . . . a2n b2 .. .. . . an1 an2 . . . ann bn b1 b2 Si B = .. , la matriz aumentada de (A.2) se expresa como (A/B). . bm Operaciones elementales por filas. Si multiplicamos una de las ecuaciones de un sistema algebraico por un número (distinto de cero), o si sumamos a una ecuación otra multiplicada por un número o si intercambiamos el orden en el que aparecen las ecuaciones, las soluciones del sistema obtenido y del original son las mismas. Es decir, los sistemas son equivalentes. Las matrices aumentadas de los sistemas obtenidos al realizar estos tres tipos de operaciones se dice que han sido obtenidas al realizar operaciones elementales por filas sobre la matriz aumentada del sistema original. Ası́, las operaciones elementales por filas son las siguientes: 204 Introducción a las Matrices i) Multiplicación de una fila por una constante distinta de cero. ii) Intercambio de dos filas cualesquiera. iii) Suma de un múltiplo constante, distinto de cero, de una fila a cualquier otra fila. Métodos de eliminación. Uno de los métodos que más utlizamos para resolver sistemas es el llamado método de eliminación (también es famoso el método de sustitución que a veces es útil para sistemas pequeños). El método de eliminación consiste, precisamente, en realizar operaciones elementales por filas eligiendo las constantes con buen tino. Cuando es aplicado directamente sobre la matriz aumentada del sistema se conoce con el nombre de método de eliminación de GaussJordan. Este método consiste en efectuar una sucesión de operaciones elementales por filas hasta llegar a una matriz aumentada que tenga la forma reducida de escalera por filas. Ésta es una matriz que tiene la siguiente forma: i) El primer elemento distinto de cero en cada fila es 1. ii) En las filas consecutivas distintas de cero, el primer elemento 1 en la fila inferior aparece a la derecha del primer 1 en la fila superior. iii) Las filas formadas únicamente por ceros están en la parte inferior de la matriz. iv) Una columna que contiene un primer elemento 1 tiene ceros en todos los demás lugares. Es decir, la forma de una 0 ··· 0 1 0 ··· 0 0 0 ··· 0 0 . .. . . . 0 ··· 0 0 0 ··· 0 0 . .. .. . 0 ··· 0 0 matriz en forma reducida de escalera por filas serı́a como sigue: ∗ ··· ∗ 0 ∗ ··· ∗ 0 ∗ ··· ∗ 0 ∗ ··· ∗ 0 ··· 0 1 ∗ ··· ∗ 0 ∗ ··· ∗ 0 ∗ ··· ∗ 0 ··· 0 0 0 ··· 0 1 ∗ ··· ∗ 0 ∗ ··· ∗ .. .. .. .. . . . . 0 ··· 0 0 0 ··· 0 0 0 ··· 0 1 ∗ ··· ∗ 0 ··· 0 0 0 ··· 0 0 0 ··· 0 0 0 ··· 0 .. .. .. .. . . . . 0 ··· 0 0 0 ··· 0 0 0 ··· 0 0 0 ··· 0 donde los elementos indicados con ∗ pueden ser cero o distintos de cero. El número de filas que son distintas de cero es, precisamente, el rango de la matriz. Ejemplo 11. Forma de escalera por filas A.2 Eliminación de Gauss-Jordan 205 Las matrices aumentadas 1 0 0 2 0 1 0 −1 0 0 0 0 µ y 0 0 1 −6 0 2 0 0 0 0 1 4 ¶ están en la forma escalera por filas. En la eliminación de Gauss-Jordan nos detenemos una vez obtenida una matriz aumentada en su forma de escalera reducida por filas. Cualesquiera que sean las operaciones que realicemos para llegar a la forma de escalera reducida produce siempre la misma forma reducida. Una vez obtenida esta matriz la solución del sistema se obtiene de forma muy sencilla. Los 1’s significativos nos aislan unas cuantas incógnitas (tantas como filas distintas de cero haya en la forma reducida) que pueden despejarse en función de las demás. Enseguida veremos un ejemplo. Para facilitar el trabajo introducimos la siguiente notaciuón: : Sı́mbolo Rij cRi cRi + Rj Significado Intercambio de las filas i y j Multiplicaión de la i-ésima fila por la constante c, distinta de cero Multiplicaión de la i-ésima fila por c y suma del resultado a la j-ésima fila Ejemplo 12. Solución por eliminación Resolvamos el sistema 2x1 + 6x2 + x3 = 7 x1 + 2x2 − x3 = −1 5x1 + 7x2 − 4x3 = 9 eliminación de Gauss-Jordan. SOLUCIÓN Efectuamos operaciones elementales por filas en la matriz aumentada del sistema para obtener −2R1 + R2 2 6 1 1 2 −1 7 −1 1 2 −1 −1 −5R1 + R3 R12 1 2 −1 −1 −→ 0 2 2 6 1 7 3 9 −→ 5 7 −4 9 5 7 −4 9 0 −3 1 14 −1 1 2 −1 −1 1 2 −1 1 2 −1 −1 2 R 3 9 3R2 +R3 9 11 3 9 0 1 32 0 1 23 −→ 0 1 −→ −→ 2 2 2 2 11 55 0 −3 1 14 0 0 2 0 0 1 5 2 1 R 2 2 206 Introducción a las Matrices 4R3 + R1 3 1 0 −4 −10 1 0 0 10 − R + R 2 2 3 9 0 1 3 0 1 0 −3 −→ 2 2 0 0 1 5 0 0 1 5 −2R2 +R1 −→ Esta matriz ya se encuentra en su forma reducida de escalera por filas. El sistema correspondiente es x1 = 10 x2 = −3 , x3 = 5 de forma que la solcuión del sistema es x1 = 10, x2 = −3 y x3 = 5. Ejemplo 13. Eliminación de Gauss-Jordan Resuélvase x + 3y − 2z = −7 4x + y + 3z = 5 2x − 5y + 7z = 19 SOLUCIÓN Resolveremos este sistema con la eliminación de Gauss-Jordan: −4R1 + R2 1 3 −2 −7 1 3 −2 −7 −2R1 + R3 0 −11 11 33 4 1 3 5 −→ 2 −5 7 19 0 −11 11 33 1 − 11 R2 −3R2 + R1 1 1 0 1 1 3 −2 −7 2 − 11 R3 −R2 + R3 0 1 −1 −3 . −→ 0 1 −1 −3 −→ 0 1 −1 −3 0 0 0 0 Esta es la forma reducida. El sistema correspondiente es x+z =2 y − z = −3 Por lo tanto el sistema dado de tres ecuaciones y tres incógnitas equivale a otro de dos ecuaciones y tres incógnitas. La solución general del sistema será x=2−z y = −3 + z Es decir, el sistema es compatible indeterminado, tiene infinitas soluciones y todas las soluciones se obtienen dando a z valores arbitrarios. A.3 El problema de los valores propios 207 Si el sistema original fuera x + 3y − 2z = −7 4x + y + 3z = 5 2x − 5y + 7z = 20 entonces la forma reducida de escalera por filas de la matriz ampliada serı́a: 1 0 1 2 0 1 −1 −3 1 0 0 0 − 11 y el sistema correspondiente x+z =2 y − z = −3 1 0 = − 11 Debido a la tercera ecuación este sistema no tiene solución. Es decir el sistema es incompatible. En conclusión, el método de eliminación de Gauss-Jordan nos proporciona una forma de conocer si un sistema algebraico de ecuaciones lineales tiene o no solución y, en su caso, todas las soluciones del sistema. A.3. El problema de los valores propios La resolución analı́tica de sistemas lineales de ecuaciones diferenciales con coeficientes constantes se basa en la búsqueda de vectores y valores propios de la matriz del sistema. Para sistemas de dimensión pequeña (a lo más 3) la forma más sencilla y rápida de calcular los valores propios es obteniendo las raı́ces del polinomio caracterı́stico de la matriz. Para sistemas de dimensión mayor que 3 (y muy especialmente, por motivos que serı́a largo y complicado de explicar, para sistemas de dimensión 5 o más) el uso de programas apropiados de ordenador puede ser el único modo de calcular los valores propios de una matriz. Una vez obtenidos éstos por el método que sea, la eliminación de Gauss-Jordan sirve para hallar los vectores propios. Definición A.16 (Valores propios y vectores propios) Sea A una matriz n×n. Se dice que un número λ es un valor propio de A si existe un vector solución v, no cero, del sistema lineal Av = λv (A.3) El vector solución v se dice que es un vector propio de A correspondiente al valor propio λ. 208 Introducción a las Matrices El término hı́brı́do eigenvalor se usa como traducción de la palabra alemana eigenwert que significa ”valor propio”. A los valores propios y vectores propios se les llama también valores caracterı́sticos y vectores caracterı́sticos, respectivamente. Ejemplo 14. Vector propio de una matriz 1 Compruébese que v = −1 es un vector propio de la matriz 1 0 −1 −3 3 3 A= 2 −2 1 1 En efecto, al multiplicar Av obtenemos 1 −2 1 0 −1 −3 3 3 −1 = 2 = (−2) −1 = (−2)v. Av = 2 1 −2 1 −2 1 1 Por lo tanto Av = (−2)v con lo que −2 es valor propio de A y v vector propio correspondiente al valor propio −2. Si aplicamos las propiedades del álgebra de matrices, podemos expresar la ecuación (A.3) en la forma alternativa λv − Av = 0 y también (λIn − A)v = 0 (A.4) en donde In es la matriz identidad. Si escribimos v en función de sus componentes: v1 v2 v = .. , . vn la ecuación (A.4) equivale a (λ − a11 ) v1 − a12 v2 − ··· − a1n vn = 0 −a21 v1 + (λ − a22 ) v2 − · · · − a2n vn = 0 .. .. .. .. . . . . −an1 v1 − an2 v2 − · · · + (λ − amn ) vn = 0 (A.5) A.3 El problema de los valores propios 209 Una vez conocido el valor propio λ, el sistema (A.5) es un sistema algebraico lineal homogéneo de n ecuaciones con n incógnitas. Es homogéneo porque los términos independientes son todos iguales a cero (es decir, bi = 0, i = 1, 2, . . . , n en (A.2)), y las incógnitas son las componentes de un vector propio correspondiente al valor propio λ. Por ser un sistema homogéneo hay siempre un solución obvia (o trivial): v1 = v2 = · · · = vn = 0. Pero para que v sea un vector propio, por definición, debe ser distinto de cero. Ası́ pues, la solución trivial no nos sirve. Ahora bien, se sabe que un sistema homogéneo de n ecuaciones lineales con n incógnitas tiene una solución no trivial si y sólo si, el determinante de la matriz de coeficientes es igual a cero. Ası́, para hallar una solución v distinta de cero de la ecuación (A.5) se debe cumplir det (λIn − A) = 0 (A.6) Al examinar (A.6) se ve que el desarrollo del det (λIn − A) por cofactores da un polinomio de grado n en λ. La ecuación (A.6) se llama ecuación caracterı́stica de A. Ası́ los valores propios de A son las raı́ces de la ecuación caracterı́stica. Para hallar un vector propio que corresponda al valor propio λ, se resuelve el sistema de ecuaciones (λIn − A) v = 0, aplicando la eliminación de Gauss-Jordan a la matriz aumentada (λIn − A|0n×1 ). Unos ejemplos pueden servir para clarificar estos conceptos. Ejemplo 15. Valores propios y vectores propios Determı́nense los valores y hállese un vector propio para cada valor propio de 1 2 1 A = 6 −1 0 . −1 −2 −1 SOLUCIÓN. Calculamos el determinante para encontrar la ecuación caracterı́stica (podemos hacerlo, por ejemplo, usamos los cofacotres de la segunda fila): λ − 1 −2 −1 0 = λ3 + λ2 − 12λ = 0 det (λI3 − A) = det −6 λ + 1 1 2 λ+1 Puesto que λ3 + λ2 − 12λ = λ (λ + 4) (λ − 3) = 0, los valores propios son λ1 = 0, λ2 = −4 y λ3 = 3. Para hallar los vectores propios debemos aplicar el algoritmo de Gauss-Jordan a (λI3 − A|0) con cada uno de los tres valores propios calculados. 210 Introducción a las Matrices Para λ1 = 0, −1 −2 −1 0 −1R 0 0 −→1 (0I3 − A|0) = −6 1 1 2 1 0 1 2 1 0 1 − 13 R2 6 0 −→ 0 1 13 0 0 0 0 1 2 1 0 −6 1 0 0 1 2 1 0 1 2 +R1 −2R 0 −→ 0 6R1 + R2 0 1 2 1 −R1 + R3 0 13 6 0 −→ 0 0 0 0 1 0 13 0 6 1 13 0 0 0 0 Ası́, el sistema es compatible (debı́a serlo porque ya hemos visto que det(0I3 − A) = 0) y tiene infinitas soluciones. El método de Gauss-Jordan nos indica que se pueden despejar las incógnitas v1 y v2 en función de v3 . Es decir, las soluciones son: 1 6 v3 y v2 = − v3 . 13 13 La infinitas soluciones del sistema se obtienen dando valores distintos a v3 . Como se nos pide encontrar un vector propio damos a v3 un valor cualquiera. En efecto, cualquier valor de v3 valdrı́a para obtener un vector propio, pero si queremos que las componentes de este vector sean números enteros podemos escoger v3 = −13. Ası́ un vector porpio serı́a: 1 v1 = 6 . −13 v1 = − Procedemos de la misma forma con λ2 = −4, −6R1 + R2 −5 −2 −1 0 1 2 −3 0 −5R1 + R2 R31 −6 −3 0 0 (−4I3 − A|0) = −6 −3 0 0 −→ −→ 1 2 −3 0 −5 −2 −1 0 −2R2 + R1 1 2 −3 0 1 2 −3 0 1 0 1 0 1 −8R + R R 2 3 9 2 0 9 −18 0 −→ 0 1 −2 0 0 1 −2 0 −→ 0 8 −16 0 0 8 −16 0 0 0 0 0 La solución general del sistema será: v1 = −v3 y v2 = 2v3 . Eligiendo v3 = 1 se obtiene un vector propio correspondiente al valor propio λ2 = −4: −1 v2 = 2 1 A.3 El problema de los valores propios 211 Por último, cuando λ3 = 3, la eliminación de Gauss-Jordan da operaciones 2 −2 −1 0 1 0 1 0 por filas 0 1 3 0 0 0 (3I − A|0) = −6 4 −→ 2 1 2 4 0 0 0 0 0 Ası́ 3 v1 = −v3 y v2 = − v3 . 2 Escogiendo v3 = −2 obtenemos un vector propio asociado al valor propio λ = 3: 2 v3 = 3 . −2 Cuando una matriz A de tamaño n × n tiene n valores propios distintos, λ1 , λ2 , . . . , λn , se puede demostrar que se puede obtener un conjunto de n vectores propios linealmente independientes v 1 , v 2 , . . . , v n ; cada uno correspondiente a un valor propio. (Que n vectores v 1 , v 2 , . . . , v n sean linealmente independientes significa que la única forma de que la suma α1 v 1 + α2 v 2 + · · · µ + αn¶ v n sea el vector µ ¶ cero es cuando α1 = α2 = · · · = αn = 0. Por ejemplo, 1 2 los vectores v 1 = y v2 = no son linealmente indepencientes porque además de 2 µ ¶ µ ¶ µ ¶ µ ¶ 1 0 1 0 0 si y v2 = . Sin embargo,v 1 = también −2v 1 + v 2 = 0v 1 + 0v 2 = 1 0 0 0 µ ¶ 0 es que son linealmente independientes porque la única forma en que α1 v 1 + α2 v 2 = 0 α1 = α2 = 0.) Cuando la ecuación caracterı́stica tiene raı́ces repetidas, quizá no sea posible hallar n vectores propios de A linealmente independientes. El siguiente ejemplo muestra esta situación. Ejemplo 16. Valores propios y vectores propios repetidos Determı́nense los valores propios y vectores propios de µ ¶ 3 4 A= . −1 7 SOLUCIÓN 212 Introducción a las Matrices Partimos de la ecuación caracterı́stica µ ¶ λ − 3 −4 det (λI2 − A) = det = λ2 − 10λ + 25 = (λ − 5)2 = 0 1 λ−7 y vemos que λ1 = λ2 = 5 es un valor propio de multiplicidad dos. En el caso de una matriz 2 × 2, no es necesario la eliminación de Gauss-Jordan, se pueden obtener las soluciones mediante inspección directa. En este caso, para determinar un vector propio correspondiente a λ1 = 5, recurriremos al sistema (5I2 − A|0), en su forma equivalente −2v1 + 4v2 = 0 −v1 + 2v2 = 0 De aquı́ se deduce que v1 = 2v2 . De modo que todos los vectores propios correspondientes al valor propio λ = 5 tienen la siguiente forma µ ¶ 2v2 v= v2 con v2 6= 0. Y no podemos encontrar dos vectores propios linealmente independientes. En efecto, si µ ¶ µ 0 ¶ 2v2 2v2 0 v= yv = v2 v20 con v2 6= v20 y ambos distintos de cero, entonces v20 v − v2 v 0 = 0. Es decir, hay números α1 y α2 distintos de cero tales que α1 v + α2 v 0 = 0, lo que significa que v y v 0 no son linealmente independientes. En particular, si escogemos v2 = 1, obtenemos un vector propio: µ ¶ 2 v= 1 El siguiente y último ejemplo nos muestra que también puede suceder que haya dos vectores propios linealmente independientes correspondientes a un valor propio repetido. Ejemplo 17. Valores propios y vectores propios repetidos Hállense los valores propios y vectores propios de 9 1 1 A = 1 9 1 . 1 1 9 A.3 El problema de los valores propios 213 SOLUCIÓN La ecuación caracterı́stica λ − 9 −1 −1 det (λI3 − A) = det −1 λ − 9 −1 = (λ − 11) (λ − 8)2 = 0 −1 −1 λ − 9 indica que λ1 = 11 es un valor propio simple (de multiplicidad 1) y λ2 = λ3 = 8 es un valor propio de multiplicidad dos. Para λ1 = 11, la eliminación de Gauss-Jordan da operaciones 1 0 −1 0 2 −1 −1 0 por filas 0 1 −1 0 . −→ (11I3 − A|0) = −1 2 −1 0 −1 −1 −2 0 0 0 0 0 Por consiguiente, v1 = v3 y v2 = v3 . Si v3 = 1, 1 v1 = 1 1 es un vector propio correspondiente al valor propio λ1 = 11. Cuando λ2 = 8, operaciones −1 −1 −1 0 1 1 1 0 por filas 0 0 0 0 . (8I3 − A|0) = −1 −1 −1 0 −→ −1 −1 −1 0 0 0 0 0 En la ecuación v1 + v2 + v3 = 0 podemos despejar una de las incógnitas en función de las otras dos. Ası́, por ejemplo v1 = −v2 − v3 . Podrı́amos decir que tenemos 2 grados de libertad: dando valores a v2 y v3 podemos conseguir dos vectores solución que sean linealmente independientes. Por ejemplo, si por una parte optamos por v2 = 1 y v3 = 0 y, por otra v2 = 0 y v3 = 1, tenemos que −1 −1 v2 = 1 y v3 = 0 0 1 son vectores linealmente independientes. 214 Introducción a las Matrices