Matrices Invertibles y Elementos de´Algebra Matricial

Anuncio
Matrices Invertibles y Elementos de Álgebra Matricial
Departamento de Matemáticas, CSI/ITESM
20 de agosto de 2008
Índice
12.1. Introducción . . . . . . . . . . . . . . . . . .
12.2. Transpuesta . . . . . . . . . . . . . . . . . .
12.3. Propiedades de la transpuesta . . . . . . . .
12.4. Matrices invertibles . . . . . . . . . . . . . .
12.5. Motivación del algoritmo de inversión . . .
12.6. Algoritmo para invertir una matriz . . . . .
12.7. Comentario . . . . . . . . . . . . . . . . . .
12.8. Propiedades de la inversa . . . . . . . . . .
12.9. Ecuaciones con matrices . . . . . . . . . . .
12.10.Complejidad computacional de la inversión
12.1.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
2
2
2
3
4
4
5
8
Introducción
En esta lectura veremos la matriz transpuesta y la matriz inversa a una matriz dada (En caso de que la
matriz inversa a ella exista). Revisaremos las propiedades que tienen el tomar la inversa o la transpuesta de
una matriz ası́ como un método eficiente de inversión. Terminaremos con la aplicación de estos conceptos a la
solución de cierto tipo de ecuaciones matriciales.
12.2.
Transpuesta
Definición 12.1
La matriz transpuesta de una matriz A n × m es una matriz con dimensiones m × n cuyo elemento (i, j) es
precisamente el elemento (j, i) de la matriz A. A esta matriz se le simboliza AT . Una forma fácil de construir
AT es tomar los renglones de A y convertirlos en columnas.
Ejemplo 12.1
Determine AT si
A=
1 2 3
4 5 6
.
Solución
Siguiendo la indicación de tomar los renglones de A como columnas para AT tenemos:


1 4
AT =  2 5  3 6
12.3.
Propiedades de la transpuesta
1. La transpuesta de la transpuesta de una matriz A es otra vez A: AT
T
= A.
2. La transpuesta de una suma es la suma de las transpuestas: (A + B)T = AT + BT .
3. (c A)T = c AT .
4. (A B)T = BT AT .
La transpuesta de un producto es el producto de las transpuestas pero en orden contrario
12.4.
Matrices invertibles
Definición 12.2
Se dice que una matriz A cuadrada n × n es una matriz invertible, o que es una matriz no singular, si existe
una matriz B n × n, que llamaremos la matriz inversa de A, que cumple:
AB = I y BA = I
(1)
Una matriz invertible sólo tiene una inversa, es decir, la inversa es única. La única inversa de una matriz
invertible A se representa por A−1 . Ası́
A A−1 = I = A−1 A
(2)
Como se puede ver 0 C = 0, para cualquier matriz C de dimensiones adecuadas, esto significa que existen
matrices cuadradas que no pueden ser invertibles (La matrix cuadrada 0 es una de ellas) este tipo de matrices
se llama matriz singular o matriz no invertible.
12.5.
Motivación del algoritmo de inversión
Veamos un ejemplo que motivará el algoritmo para obtener la inversa de una matriz.
Ejemplo 12.2
Determine la inversa de
1 −2
A=
3 −5
Suponga que buscamos una matriz B, 2 × 2 tal que A B = I2×2 :
1 0
1 −2
b11 b12
=
0 1
b21 b22
3 −5
Ası́ se debe cumplir:
Para elemento (1,1) del producto: 1 · b11 − 2 · b21 = 1
Para elemento (2,1) del producto: 3 · b11 − 5 · b21 = 0
Para elemento (1,2) del producto: 1 · b12 − 2 · b22 = 0
Para elemento (2,2) del producto: 3 · b12 − 5 · b22 = 1
Esto conduce a dos sistemas de ecuaciones: uno en b11 y b21 y otro b21 y b22 con matrices aumentadas que al
reducirse quedan:
1 −2 1
1 0 −5
→
3 −5 0
0 1 −3
2
y
1 −2 0
3 −5 1
→
1 0 2
0 1 1
Y ası́ b11 = −5, b21 = −3, b21 = 2, y b22 = 1. Quedando la inversa como
−5 2
A−1 = B =
−3 1
Observemos que
Ambas matrices aumentadas tienen la misma matriz de coeficientes: exactamente A.
Teniendo la misma matriz de coeficientes, los sistemas deben reducirse con las mismas operaciones de
renglón.
En cada sistema, la columna de las constantes es una columna de I.
Como las matrices aumentadas tienen las mismas matrices de coeficientes y las operaciones de renglón
para la reducción son las mismas, entonces el proceso se puede llevar a cabo formando la matriz aumentada
[A|I] y reduciendo.
Después del proceso de reducción, la inversa queda exactamente acamodada en la posición donde entró I.
12.6.
Algoritmo para invertir una matriz
Para determinar A−1 , si existe, haga los siguiente:
1. Construya la matriz aumentada [A|I].
Aquı́ I representa la matriz identidad n × n.
2. Reduzca la matriz [A|I]. Digamos que se obtenga [B|C].
3. Si la matriz B es la matriz identidad, entonces A sı́ es invertible y A−1 = C.
4. Si la matriz B no es la identidad, entonces A no es invertible.
Ejemplo 12.3
Invierta las matrices:
A1 =
1
3
−2 −7
y A2 =
1 2
2 4
Solución
Para A1 :
[A1 |I] =
1
3 1 0
−2 −7 0 1
R2 ←R2 +2 R1
1
3 1 0
0 −1 2 1
R2 ←−1 R2
1 3
1
0
0 1 −2 −1
R1 ←R1 −3 R1
1 0
7
3
0 1 −2 −1
−−−−−−−−→
−−−−−−−→
−−−−−−−−→
3
Como en el resultado final B es la matriz identidad, A1 es una matriz invertible y
7
3
−1
A1 =
.
−2 −1
Para A2 :
[A2 |I] =
1 2 1 0
2 4 0 1
R2 ←R2 −2 R1
1 0
1 2
0 0 −2 1
R2 ←− 12 R2
0
1 2 1
0 0 1 −1/2
R1 ←R1 −R2
1 2 0
1/2
0 0 1 −1/2
−−−−−−−−→
−−−−−−−→
−−−−−−−→
= [B|C].
Como en el resultado final B no es la matriz identidad, A2 no es una matriz invertible. Observe con cuidado
que en cálculo para A2 que no hace falta concluir por completo hasta la forma reducida: en el momento
que aparezca un renglón en ceros en la parte correspondiente a B la matriz ya no será invertible 12.7.
Comentario
Recuerde que para una matriz A n × n la matriz inversa de ella se definió como una matriz B n × n que
cumple
A B = In = B A
y en nuestra deducción del algoritmo sólo buscamos que se cumpla A B = I. En los resultados teóricos de
álgebra de matrices se tiene que
Si A es una matriz cuadrada y existe una matriz cuadrada C tal que A C = I, entonces A es invertible.
Es decir, que es suficiente tener inversa lateral derecha para tener inversa por ambos lados.
Si A es una matriz cuadrada invertible y si B es una matriz cuadrada que cumple A B = I, entonces
A−1 = B. Es decir, que la inversa lateral derecha de una matriz cuadrada invertible coincide con la
inversa de la matriz.
Estos resultados teóricos justifican que sólo busquemos la inversa derecha de una matriz para decir si la matriz
es invertible y que la matriz encontrada es precisamente su inversa.
12.8.
Propiedades de la inversa
1 Si la matriz A, n × n, puede invertirse, entonces el sistema A x = b tiene solución única para cada vector
b. Esta solución puede calcularse como
x = A−1 b
2 Sean A y B dos matrices cuadradas n × n invertibles cualquiera entonces AB es invertible y
(A B)−1 = B−1 A−1 .
3 La inversa de una matriz invertible también es una matriz invertible y
A−1
4
−1
= A.
4 Si c es una constante cualquiera, pero diferente de cero, entonces la matriz c A también es invertible y
(c A)−1 =
1 −1
A .
c
5 Si k es un número entero postivo, entonces Ak también es una matriz invertible y
Ak
−1
k
= A−1 .
AT
−1
= A−1
6 La matriz AT también es invertible y
12.9.
T
.
Ecuaciones con matrices
Ahora pondremos en práctica nuestra álgebra con matrices para resolver ecuaciones donde se involucran
incógnitas que representan matrices.
Ejemplo 12.4
Resuelva para X
cX + A = B
Solución
Los pasos que se siguen son muy similares al álgebra básica
sumamos en ambos miembros la matriz −A:
(c X + A) − A = B − A
Como la suma / resta de matrices es asociativa se pueden agrupar los sumando para dejar juntos A y −A:
c X = c X + 0 = c X + (A − A) = B − A Siendo estos cálculos para suma y resta de matrices tan similares a los del álgebra básica usaremos la misma
regla:
Si en una igualdad entre expresiones con matrices aparece sumando o restando una matriz en un
miembro la podemos pasar al otro miembro restando o sumando:
Z+C=D→Z=D−C
(3)
Ahoara debemos despejar X de la expresión
cX = B − A
procedemos a multiplicar por el escalar 1/c:
X = 1X =
1
1
1
c X = (cX) = (B − A)
c
c
c
Siendo estos cálculos para la multiplicación o división con escalares tan similares a los del álgebra básica
usaremos la misma regla:
Si en una igualdad entre expresiones con matrices aparece multiplicando (resp. dividiendo) un
escalar lo podemos pasar al otro miembro dividiendo (resp. multiplicando).
5
cZ = D → Z =
Por tanto, el valor de la incógnita X es
X=
1
D
c
(4)
1
(B − A) c
Ejemplo 12.5
Asumiendo que la matriz A sea invertible, despeje la matriz X de la ecuación:
AX = B
Solución
Este tipo de problemas presenta a los alumnos cierta dificultad en los primeros despejes de ecuaciones matriciales. Se debe tener bien en claro que la matriz A a eliminar está a la izquierda de la incógnita está multiplicando
a la izquierda y que por consiguiente debe de multiplicarse por la izquierda por la matriz inversa de A:
X = I X = A−1 A X = A−1 (A X) = A−1 B
Es equivocado hacer cancelar A pretendiendo multiplicar por la derecha:
X = AXA−1 = BA−1
Y representa un error aún más grave dividir entre A pretendiendo cancelar A:
X=
AX
B
=
A
A
La regla válida para cancelar matrices cuando éstas poseen inversas que multiplican es la siguiente:
A X = B → X = A−1 B
(5)
X A = B → X = B A−1
(6)
Ejemplo 12.6
Suponiendo que A y B son matrices invertibles, despeje X de:
ABX = C
Solución
Otro problema que los alumnos enfrentan en los primeros despejes aparece en este tipo de problemas. Hay
dos formas correctas de pensar el problema. En la primera la ecuación original se debe pensar agrupada de la
siguiente manera:
(A B) X = C
En cuyo caso el despeje de X es directo por las reglas vistas:
X = (A B)−1 C
Otra manera correcta de plantear el problema es:
A (B X) = C
6
De donde el despeje en dos pasos es haciendo primero:
B X = A−1 C
Para después obtener:
X = B−1 A−1 C
Note que ambos resultados sin idénticos en vista de la igualdad:
(A B)−1 = B−1 A−1 Ejemplo 12.7
Despeje x de la ecuación:
XT = A
Solución
T
En este caso se debe tener presente la propiedad XT
= X. Por consiguiente, tomando la transpuesta en
cada miembro:
T
X = XT = AT Ejemplo 12.8
Despeje x de la ecuación:
X−1 = A
Solución
−1
En este caso se debe tener presente la propiedad X−1
= X. Por consiguiente, tomando matriz inversa
en cada miembro:
−1
X = X−1
= A−1
Ejemplo 12.9
Suponiendo que A es invertible y c 6= 0 , despeje X de:
A (c X + B) + C = D
Solución
Procediendo como anteriormente:
A (c X + B)
cX + B
cX
X
= D−C
= A−1 (D − C)
= A−1 (D − C) − B = 1c A−1 (D − C) − B Ejemplo 12.10
Suponiendo matrices invertibles donde se requiera despeje X de:
T
A (BX)−1 + C + D = E
Solución
Este tipo de despejes requiere ser riguroso en el orden: Pasando al segundo miembro D:
T
A (BX)−1 + C = E − D
7
Multiplicando por A−1 por la derecha:
T
(BX)−1 + C = A−1 (E − D)
Tomando la transpuesta en ambos miembros:
T
(BX)−1 + C = A−1 (E − D)
Pasando al segundo miembro C:
T
(BX)−1 = A−1 (E − D) − C
Tomando inversa en ambos miembros:
BX =
−1
T
A−1 (E − D) − C
X = B−1
A−1 (E − D)
Finalmente, eliminando la matriz B:
12.10.
−1
−C
T
Complejidad computacional de la inversión
Supongamos entonces que aplicamos el algoritmo de eliminación gaussiana para invertir una matriz n por
n. Consideraremos primero el trabajo realizado por los pasos 1 al 4 y posteriormente el trabajo realizado en el
paso 5. Es importante notar que el proceso de Gauss avanza dejando la matriz escalonada hasta la columna
de trabajo:

























a1,1
a1,2
···
a1,m−1
a1,m
···
0
.
.
.
a2,2
.
.
.
···
a2,m−1
.
.
.
a2,m
.
.
.
0
0
0
0
···
···
am−1,m−1
0
am−1,m
am,m
···
.
.
.
.
.
.
···
.
.
.
.
.
.
.
..
.
.
.
.
.
.
.
.
.
0
0
···
0
an,m
···
..
.
b1,1
.
.
.
.
.
.
.
.
.
bm,1
...
.
.
.
.
.
.
...
b1,n
.
.
.
.
.
.
.
.
.
bm,n
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.























1 Ciclo del paso 1 al 4
Al asumir que am,m es diferente de cero, pasamos al paso 3. En el paso 3 hay que hacer cero debajo del
elemento (m, m), para cada uno de los m − n renglones inferiores Ri ; para ello habrá que
calcular el factor f = ai,m /am,m por el cual debe multiplicarse el renglón Rm , lo cual implica
realizar una división, y posteriormente
realizar la operación:
Ri ← Ri − f Rm .
En este caso, en el renglón i hay ceros hasta antes de la columna m, en el elemento (i, m) quedará un
1 (el factor f fue calculado para ello), ası́ que los únicos elementos que deberán calcularse son los
elementos del renglón i desde la columna (m + 1) y hasta terminar, es decir, hasta la columna
n + n, es decir, un total de 2 n − m elementos, y para cada uno de ellos habrá que hacer am+1,j ←
am+1,j − f × am,j , es decir para cada uno de ellos habrá que hacer 2 FLOPs, siendo un total de
2 (2 n − m) elementos, el número total de FLOPs que habrá que realizar para hacer la operación
Ri ← Ri − f Rm es, incluyendo la división para calcular f , 2(2 n − m) + 1 = 4 n − 2 m + 1.
8
Como esto habrá que aplicarlo a todos los renglones por debajo del renglón m y hasta el n, entonces
para realizar un ciclo desde el paso 1 hasta el paso 4 deben hacerse (n − m) (4 n − 2m + 1) FLOPS. El
ciclo del paso 1 al paso 4 y su repetición irá avanzando m desde 1 hasta n − 1. Por consiguiente el total
de FLOPs será:
n−1
X
5
3
1
(n − m) (4 n − 2 m + 1) = n3 − n2 − n.
3
2
6
m=1
2 Ciclo del paso 5.
Las operaciones implicadas en el paso 5 serán
1
Rm : n divisiones
Rm ← am,m
Para esto se requiere n divisiones; la del pivote entre si mismo ya sabemos que dará 1 y no se
realizará, simplemente en la posición (m, m) pondremos un 1
Rj ← Rj − aj,m Rm : n multiplcaciones y n restas
Esta operación sólo requiere n multiplicaciones y n restas; estas operaciones sólo tienen que ver
con los términos en la parte aumentada. Los nuevos elementos aj,m serán cero. Como hay m − 1
renglones superiores, el total de operaciones en un ciclo del paso 5 será:
(m − 1) · (2 n) + n
Por consiguiente el total de FLOPs en el paso 5 será:
1
X
(2 n (m − 1) + n) = n3 − 2 n2 + n
m=n
Por consiguiente, en general cuando se aplica en algoritmo de eliminación gaussiana a un sistema n × n el
número de FLOPs es:
8 3 7 2 5
(7)
n − n + n
3
2
6
9
Descargar