c-inversa o inversa generalizada de Rao Definición.- Sea Am×n. Se dice que una matriz Ac de orden n × m es una c-inversa o inversa generalizada en el sentido de Rao si y sólo si se verifica AAc A = A. Teorema.- Sea Am×n con m ≤ n y rg(A) = r ≤ m. Entonces la c-inversa de A siempre existe y no es única. Demostración Consideremos distintas situaciones: 1. Si rg(A) = m entonces podemos, sin pérdida de generalidad, particionar A en la forma A = (A1 |A2 ) donde A1 es una matriz cuadrada de orden m tal que |A1 | 6= 0. Ası́ es inmediato comprobar que la matriz A−1 1 Ac = 0(n−m)×m es una c-inversa para A. 2. Sea ahora rg(A) = r < m y consideremos la siguiente partición en bloques A11 A12 A= A21 A22 donde A11 es una matriz cuadrada de orden r y no singular. Consideremos −1 A11 0r×(m−r) Ac = . 0(n−r)×r 0(n−r)×(m−r) Entonces AAcA = A11 A12 A21 A21A−1 11 A12 . Ahora bien, como rg(A) = r, entonces debe existir P(m−r)×r tal que (A21|A22) = P(A11|A12), de donde A21 = PA11 ⇒ P = A21A−1 11 A22 = PA12 ⇒ A22 = A21A−1 11 A12 con lo cual AAc A = A y ası́ Ac es c-inversa para A. 3. En el caso general, si A11 es singular, entonces, puesto que el rango de A es r, deben existir matrices de permutación (y por lo tanto ortogonales) R y S tales que B11 B12 RAS = B = B21 B22 y tal que B11 sea no singular. Por el apartado anterior, −1 B11 0r×(m−r) Bc = 0(n−r)×r 0(n−r)×(m−r) es una c-inversa para B. Por lo tanto podemos comprobar que Ac = SBc R es una c-inversa para A. En efecto, como R y S son ortogonales se tiene que A = R0BS0 y con ello AAcA = R0BS0SBcRR0BS0 = R0BBcBS0 = R0BS0 = A . Para comprobar la no unicidad sea Bn×m . Entonces, tomando C = Ac + B − Ac ABAAc se tiene ACA = A(Ac + B − AcABAAc)A = AAc A + ABA − AAc ABAAc A = A + ABA − ABA = A por lo que C también es una c-inversa para A. Además, si C es una c-inversa para A, debe ser necesariamente de la forma anterior con B = C − Ac . En efecto, Ac + C − Ac − AcA(C − Ac)AAc = Ac + C − Ac − Ac ACAAc + Ac AAc AAc = Ac + C − Ac − Ac AAc + Ac AAc = C . El teorema anterior es constructivo en el sentido de que nos proporciona una forma para calcular la c-inversa de Rao. No obstante en la práctica conviene tener algún procedimiento más mecánico que permita un cálculo más sencillo. El siguiente algoritmo (que puede ser consultado en Searle, 1971) puede ser de bastante utilidad. Encontrar en A un menor de orden r, que llamaremos M. Invertir M y transponerla. Reemplazar en A cada elemento de M por el correspondiente de (M−1 )0 . Reemplazar los elementos restantes de A por ceros. Transponer la matriz resultante. Dicha matriz será una c-inversa para A. Ejemplos de cálculo de c-inversas Ejemplo 1 Sea A = se tiene Ac Ac = 0 0 0 0 −1 1 −2 2 . Considerando el menor M = 0 3 ! 1 0 0 −1 0 1 = , mientras que tomando M = 0 0 0 0 0 0 ! 1/2 0 −1/2 1 . 0 0 0 0 1 2 1 0 0 1 1 1 0 1 2 1 0 1 , , Ejemplo 2 Sea N = N1 + · · · + NI y consideremos la matriz (I + 1) × (I + 1)dimensional N N N ... N 1 2 I N1 N1 0 ... 0 X = N2 0 N2 . . . 0 . .. .. .. .. ... . . . . NI 0 0 0 NI Esta matriz es de rango I y por lo tanto singular. El menor de orden I que tomaremos será M= N1 0 .. . 0 0 N2 .. . 0 ... ... ... 0 0 0 .. . NI cuya inversa es M−1 = 1/N1 0 .. . 0 0 1/N2 .. . 0 ... ... ... 0 0 0 .. . 1/NI resultando ası́ Xc = 0 0 0 .. . 0 0 1/N1 0 .. . 0 0 0 1/N2 .. . 0 ... ... ... ... 0 0 0 0 .. . 1/NI g-Inversa o inversa generalizada de Moore-Penrose Definición.- Sea Am×n. Se dice que una matriz Ag de orden n × m es la g-inversa o inversa generalizada de MoorePenrose si y sólo si se verifica AAg A = A, Ag AAg = Ag y además tanto AAg como Ag A son simétricas. Teorema.- Sea Am×n. Entonces la g-inversa existe y es única. Demostración Evidentemente, si A = 0 entonces Ag = 0. En el caso en que rg(A) = r > 0 sabemos que existen dos matrices C1 y C2 de dimensiones respectivas m × r y r × n y de rango r tales que A = C1 C2 . Entonces Ag = C02(C2C02)−1(C01C1)−1C01 es una g-inversa para A (comprobar los cuatro apartados de la definición). Para ver la unicidad supongamos que tenemos dos ginversas, Ag y Bg . Entonces AAg A = A por lo que AAg ABg = ABg y Bg AAg A = Bg A. Ahora bien ABg = (ABg )0 = (AAg ABg )0 = (ABg )0(AAg )0 = ABg AAg = AAg . Bg A = (Bg A)0 = (Bg AAg A)0 = (Ag A)0(Bg A)0 = Ag ABg A = Ag A. Por lo tanto Bg = Bg ABg = Ag ABg = Ag AAg = Ag y ello prueba la unicidad. El resultado siguiente nos proporciona una forma algo más fácil para calcular la g-inversa, sobre todo en algunas situaciones concretas. Teorema.- Sea Am×n. Entonces 1. Si m ≥ n y rg(A) = n, Ag = (A0 A)−1 A0 y Ag A = In. 2. Si m ≤ n y rg(A) = m, Ag = A0 (AA0 )−1 y AAg = Im . 3. Si rg(A) = r ≤ Min{m, n}, Ag = Cg Bg , donde Bg y Cg son las g-inversas de las matrices, de rango r, Bm×r y Cr×n tales que A = BC. Demostración 1. Como rg(A) = n entonces A0 A tiene rango n y existe su inversa. Basta comprobar que Ag verifica las condiciones de g-inversa: AAg A = A(A0A)−1A0A = A. Ag AAg = (A0A)−1A0A(A0A)−1A0 = (A0A)−1A0 = Ag . AAg = A(A0A)−1A0, que es simétrica. Ag A = (A0A)−1A0A = In. 2. Se demuestra de forma similar al apartado anterior. 3. Por los apartados anteriores se tiene Bg = (B0 B)−1 B0 y Cg = C0 (CC0 )−1 y a partir de ahı́ se verifica Ag = C0(CC0)−1(B0B)−1B0. Dicha matriz es la g-inversa de A sin más que tener en cuenta la demostración del teorema anterior. El siguiente resultado facilita el cálculo de la g-inversa en el caso de matrices simétricas. Teorema.- Sea An×n una matriz simétrica de rango r ≤ n. Sea Dr una matriz diagonal de orden r cuyos elementos no nulos son los autovalores de A distintos de cero y sea Pr una matriz de orden n × r cuyas columnas son los autovectores unitarios y ortogonales dos a dos de A correspondientes a sus autovalores no nulos. Entonces 0 Ag = Pr D−1 r Pr . Demostración Por ser A real ysimétrica, existe una matriz P ortogonal Dr 0 tal que A = P P0. Escribamos P = (Pr |Pn−r ), 0 0 de donde A = Pr Dr P0r . Ahora bien 0 0 0 1. AAg A = Pr Dr P0r Pr D−1 r Pr Pr Dr Pr = Pr Dr Pr = A. 0 0 −1 0 −1 0 2. Ag AAg = Pr D−1 r Pr Pr Dr Pr Pr Dr Pr = Pr Dr Pr = Ag . 0 3. AAg = Pr Dr P0r Pr D−1 r Pr = In . 0 0 4. Ag A = Pr D−1 r Pr Pr Dr Pr = In . Ejemplos de cálculo de g-inversas 2 1 0 5 1 Sea C = , de rango 2. CC0 = , 0 1 1 1 2 2 −1 (CC0 )−1 = 91 , de donde se verifica que −1 5 1 4 −2 0 −1 0 1 4 . Cg = C (CC ) = 9 −1 5 2 2 Sea A = 0 1 2 1 A = BC, con B y 1 1 que puede expresarse como 0 C lasmatrices anteriores. Ası́ se 1 2 −8 10 5 7 −2 . verifica Ag = Cg Bg = 27 4 11 −7 0 0 . Los autovalores son λ1 = 0 4. Los autovectores a √ √ asociados 0 nulos son v2 = (1/√2, −1/ √2, 0) 1/ √2 1/√2 √ √ y v3 = (1/ 2, 1/ 2, 0)0 . Pr = −1/ 2 1/ 2 , 0 0 3 −1 0 2 0 0 = 1 −1 3 0 . Dr = . Ası́ Eg = Pr D−1 P r r 0 4 8 0 0 0 3 Sea E = 1 0 0, λ2 = 2, λ3 los autovalores 1 3 0 = no Método basado en el teorema de Cayley-Hamilton La inversa viene dada por Ag = TA0 , donde la matriz T se calcula como sigue (ver Searle, 1971): Consideremos la matriz A0 A que, evidentemente, es cuadrada. Por el Teorema de Cayley-Hamilton debe existir un entero t y unos escalares λ1 , . . . , λt (no todos nulos) tales que λ1 (A0 A) + λ2 (A0 A)2 + . . . + λt(A0 A)t = 0 . Si λr es el primer escalar de la expresión anterior que es no nulo, entonces la matriz T viene dada por 1 0 0 t−r−1 T=− λr+1 In + λr+2 (A A) + . . . + λt(A A) . λr Veamos un ejemplo. Sea la matriz 1 0 2 3 2 4 0 −1 1 0 de donde X X = 2 5 −1 X= −1 0 −2 4 −1 9 1 2 0 El polinomio caracterı́stico asociado a dicha matriz es p(λ) = −λ3 + 17λ2 − 66λ, por lo que, aplicando el Teorema de Cayley-Hamilton se verificará 66(X0 X)−17(X0 X)2 + (X0 X)3 = 0 y con ello la matriz T será 1 14 −2 −4 1 0 −2 12 1 −17I3 + X X = T=− 66 66 −4 1 8 y con ello −2 −6 10 1 6 0 −11 0 22 Xg = TX = 66 12 7 −12 −2 0 Propiedades de las g-inversas Teorema.- Sea Am×n y Ag su g-inversa. Entonces 1. Si k 6= 0 entonces (kA)g = 1k Ag . 2. (Ag )g = A. 3. A = 0 ⇔ Ag = 0. 4. (A0 )g = A0g . 5. Si m = n, Ag = A−1 siempre y cuando A sea no singular. 6. rg(A) = rg(Ag ) = rg(AAg ) = rg(Ag A). 7. Si A es simétrica e idempotente, entonces Ag = A. 8. (A0 A)g = Ag A0g ; (AA0 )g = A0g Ag ; (AAg )g = AAg ; Ag = (A0A)g A0 = A0(AA0)g . 9. Si A es simétrica, entonces (A2 )g = (Ag )2 . 10. Para cualquier Br×s y si Bg es su g-inversa, entonces (A ⊗ B)g = Ag ⊗ Bg . 11. Ag A, AAg , In − Ag A e Im − AAg son simétricas e idempotentes. 12. (Im − AAg )A = 0; (Im − AAg )AAg = AAg (Im − AAg ) = 0; Ag (Im − AAg ) = 0; (In − Ag A)Ag A = Ag A(In − Ag A) = 0. B 0 Bg 0 , con , entonces Ag = 0 C 0 Cg Bg y Cg las g-inversas de B y C respectivamente. 13. Si A = 14. Si A = B C , con BC0 = 0, entonces Ag = (Bg |Cg ). 15. Si A = DE donde D y E son diagonales con g-inversas Dg y Eg , entonces Ag = Eg Dg . 16. Si Pm×m y Qn×n son ortogonales, entonces (PAQ)g = Q0Ag P0. 17. Ag B = 0 ⇔ A0 B = 0. 18. AB = 0 ⇔ Bg Ag = 0. Aplicación a la resolución de sistemas de ecuaciones Teorema.- Sea Am×n y Ax = b un sistema de ecuaciones. 1. Ax = b es compatible si y sólo sı́ AAc b = b, para alguna c-inversa de A. 2. Si Ax = b es compatible, entonces x0 = Ac b + (In − AcA)z es una solución del sistema, ∀z ∈ Rn. Recı́procamente, si x0 es una solución del sistema, entonces existe un vector z ∈ Rn tal que x0 puede escribirse de la forma anterior. 3. Si Ax = b es compatible, entonces la solución es única si y sólo sı́ Ag A = In. Demostración 1. Si AAc b = b, el sistema es compatible con x0 = Ac b. Recı́procamente, si x0 es una solución, Ax0 = b de donde AAc Ax0 = AAc b y con ello Ax0 = b = AAc b. 2. Como el sistema es compatible, entonces AAc b = b. Ahora bien, ∀z ∈ Rn se tiene A [Acb + (In − AcA)z] = AAcb + A(In − AcA)z = AAc b + (A − AAc A)z = AAc b = b . Recı́procamente, si x0 es una solución entonces Ax0 = b, de donde AcAx0 = Acb y con ello x0 = Acb + x0 − AcAx0 = Acb + (In − AcA) x0 y basta tomar z = x0 . 3. Si la solución es única, m ≥ n y rg(A) = n. Por lo tanto Ag = (A0 A)−1 A0 y Ag A = In. Recı́procamente, como el sistema es compatible se tiene, razonando igual que en los dos primeros apartados, x0 = Ag b + (In − Ag A)z, ∀z ∈ Rn y como Ag es única y Ag A = In, entonces la solución es única y es x = Ag b. Ejemplo.- Sea el sistema de ecuaciones Ax = y en forma desarrollada 5 3 1 −4 x1 6 5 2 3 x2 8 8 21 13 5 2 x = 22 . 3 x4 3 2 1 7 2 Por el método de Rao podemos encontrar que una inversa generalizada para A es 5 −3 0 0 −8 5 0 0 Ac = 0 0 0 0 0 0 0 0 con lo que la solución general del sistema es, para z = (z1 , z2 , z3 , z4 )0 arbitrario, 6 −8 = 0 0 x = Acy + (I4 − AcA)z = 1 0 −1 −29 47 0 1 2 + I4 − 0 0 0 0 0 0 0 0 6 + z3 + 29z4 −8 − 2z3 − 47z4 = . z3 z4 z1 z2 z3 z4