Factorización de matrices totalmente no positivas y totalmente

Anuncio
XXI Congreso de Ecuaciones Diferenciales y Aplicaciones
XI Congreso de Matemática Aplicada
Ciudad Real, 21-25 septiembre 2009
(pp. 1–8)
Factorización de matrices totalmente no positivas y
totalmente negativas
R. Cantó1 , B. Ricarte1 , A.M. Urbano1
1
Institut de Matemàtica Multidisciplinar, Universidad Politécnica de Valencia, E-46022 Valencia.
E-mails: [email protected], [email protected], [email protected].
Palabras clave:
Matrices totalmente no positivas, matrices totalmente negativas, factorizaciones
de rango completo, LDU y QR.
Resumen
Una matriz real A de tamaño n × m se dice que es totalmente no positiva (totalmente negativa) si todos sus menores son no positivos (negativos). En este trabajo se
estudia, a partir de la factorización de rango completo en forma escalonada de una
matriz A totalmente no positiva (totalmente negativa), la reducción significativa del
número de menores que se deben estudiar para decidir sobre la total negatividad de
una matriz. Además, en el caso de las matrices cuadradas totalmente no positivas
(totalmente negativas) se obtiene una caracterización a partir de su factorización QR.
1.
Introducción
Una matriz A ∈ Rn×m es totalmente no positiva (totalmente negativa) y se denota
como matriz t.n.p. (t.n.) si todos sus menores son no positivos (negativos). En el caso
de matrices cuadradas totalmente negativas, en [7] se analizan propiedades espectrales y
factorizaciones del tipo LDU y en [10] se obtiene una caracterización en términos de los
parámetros de la eliminación de Neville. Para matrices invertibles totalmente no positivas,
en [2] se estudia su caracterización a partir de la factorización LDU lo que permite, por
una parte, reducir el número de menores a estudiar para saber si una matriz es totalmente
no positiva y, por otra, obtener propiedades similares a las conocidas para las matrices
totalmente positivas, TP, es decir matrices cuyos menores son todos no negativos.
Recordamos que una matriz está en forma escalonada superior si cumple las tres condiciones siguientes:
1. Su primer elemento no nulo situado más a la izquierda en cada fila es un 1 llamado
1 principal de dicha fila.
1
R. Cantó, B. Ricarte, A.M. Urbano
2. Cada 1 principal está situado a la derecha de los 1’s principales de las filas anteriores.
3. Las filas nulas se sitúan debajo, en las últimas filas de la matriz.
Diremos que una matriz está en forma escalonada inferior si su traspuesta está en forma
escalonada superior.
Dada una matriz A ∈ Rn×m con rank(A) = r, se llama factorización de rango completo
en forma escalonada de A a la factorización de rango completo de la forma A = LDU ,
donde L ∈ Rn×r es una matriz en la forma escalonada inferior, D = diag(d1 , d2 , . . . , dr )
es una matriz diagonal e invertible, y U ∈ Rr×m es una matriz en la forma escalonada
superior. Es conocido que no todas las matrices tienen factorizaciones de este tipo, pero si
dicha factorización existe entonces es única [3]. Cuando A tiene rango completo por filas
(columnas) diremos que L (U ) es triangular inferior (superior) unitaria.
En este trabajo, a partir de la caracterización para las matrices rectangulares totalmente no positivas (totalmente negativas) en términos de su factorización de rango completo
[4], obtenemos una reducción significativa del número de menores a estudiar para saber
si una matriz rectangular es totalmente no positiva o totalmente negativa. Estos resultados son análogos a los conocidos para las matrices totalmente positivas, TP, y para las
matrices estrictamente totalmente positivas, STP, matrices cuyos menores son todos positivos. Además, en el caso cuadrado e invertible trasladamos a las matrices t.n.p. y t.n.
una caracterización a partir de su factorización QR similar a la obtenida para matrices
totalmente no negativas y totalmente positivas en [9, Teorema 4.7].
Denotaremos por A[α|β] la submatriz de A formada por las filas de ı́ndices α ⊆
{1, 2, . . . , n} y las columnas de ı́ndices β ⊆ {1, 2, . . . , m}. La submatriz principal A[α|α]
se denota por A[α]. Además, dados k, n ∈ N, 1 ≤ k ≤ n, Qk,n denota el conjunto de
todas las sucesiones crecientes de k números naturales menores o iguales que n. Cuando los números naturales son consecutivos, la secuencia se denota por Q0k,n . Obsérvese que A es una matriz t.n.p. (t.n.) si det A[α|β] ≤ 0 (< 0), para todo α ∈ Qk,n y
β ∈ Qk,m con k = 1, 2 . . . , min{n, m}. Del mismo modo, A es una matriz TP (STP) si
det A[α|β] ≥ 0 (> 0), para todo α ∈ Qk,n y β ∈ Qk,m con k = 1, 2, . . . , min{n, m}.
Diremos que una matriz A en forma escalonada inferior (superior) es 4STP si todos
sus menores no triviales son positivos.
2.
Caracterización de matrices t.n. y t.n.p. por menores
En esta sección obtenemos una caracterización de las matrices totalmente negativas
(t.n.) y de las matrices totalmente no positivas (t.n.p.) a partir del signo de determinados
menores, teniendo en cuenta su factorización de rango completo en forma escalonada.
Resultados similares para matrices STP se pueden encontrar en [8] y para TP en [5]. Los
siguientes Teoremas, cuyas demostraciones pueden seguirse en [4], nos permiten obtener
la factorización de rango completo de las matrices t.n.p. y t.n.
Teorema 1 (Teorema 5 de [4]) Sea A = (aij ) = LDU ∈ Rn×m con anm < 0 y n ≤ m.
A es una matriz t.n. si y sólo si A admite una factorización de rango completo en forma
escalonada A = LDU , donde L ∈ Rn×n es una matriz escalonada inferior 4STP, U ∈
Rn×m es una matriz escalonada superior 4STP y D = diag(−d1 , d2 , . . . , dn ) con di > 0,
i = 1, 2, . . . , n.
2
Factorización de matrices totalmente no positivas y totalmente negativas
Teorema 2 (Teorema 9 de [4]) Sea A = (aij ) ∈ Rn×m con a11 < 0, anm ≤ 0 y
rank(A) = r. A es una matriz t.n.p. si y sólo si A admite una factorización de rango
completo en forma escalonada A = LDU , donde L ∈ Rn×r es una matriz TP escalonada
inferior, U ∈ Rr×m es una matriz TP escalonada superior, rank(L) = rank(U ) = r, todos
los elementos de L y de U que no son nulos por la estructura triangular de las matrices
deben ser necesariamente positivos, y D = diag(−d1 , d2 , . . . , dr ) con di > 0, i = 1, 2, . . . , r.
Definición 1 Dada una matriz A ∈ Rn×m , sus menores det A[α|1, 2, . . . , k] con α ∈ Q0k,n
y k = 1, 2, . . . , mı́n{n, m}, se llaman menores iniciales por columnas de A, y los menores det A[1, . . . , k|β] con β ∈ Q0k,m y k = 1, 2, . . . , mı́n{n, m}, se conocen como menores
iniciales por filas de A.
A partir de los Teoremas 1 y 2 y de la definición anterior damos una caracterización de
las matrices rectangulares totalmente negativas (t.n.) en términos del signo de sus menores
iniciales por filas y por columnas. Esta caracterización es análoga al resultado obtenido
para matrices rectangulares STP en [8].
Teorema 3 Sea A ∈ Rn×m con anm < 0 y n ≤ m. A es una matriz t.n. si y sólo si para
cada k = 1, 2, . . . , n, las siguientes desigualdades se satisfacen:
det A[α|1, 2, . . . , k] < 0,
para todo α ∈ Q0k,n
(1)
det A[1, 2, . . . , k|β] < 0,
Q0k,m
(2)
para todo β ∈
Demostración: Si A es t.n. las desigualdades (1) y (2) se satisfacen. Recı́procamente, a
partir de (1) obtenemos la factorización de rango completo en forma escalonada A = LDU ,
donde L ∈ Rn×n es una matriz triangular inferior unitaria, D = diag(−d1 , d2 , . . . , dn ) con
di > 0, i = 1, 2, . . . , n y U ∈ Rn×m es una matriz escalonada superior con la submatriz
U [1, 2, . . . , n] triangular superior unitaria. Por (1) se tiene que
det L[α|1, 2, . . . , k] > 0 para todo α ∈ Q0k,n ,
k = 1, 2, . . . , n
para todo β ∈ Q0k,m ,
k = 1, 2, . . . , n.
y de (2)
det U [1, 2, . . . , k|β] > 0
Por [8, Teorema 4.1] L es una matriz triangular inferior unitaria 4STP y U es escalonada
superior 4STP. Utilizando el Teorema 1, A es t.n.
¤
El siguiente resultado es la caracterización de las matrices rectangulares totalmente no
positivas con rango completo por columnas, que permite reducir el número de menores que
se deben comprobar para estudiar la no positividad de una matriz. El resultado equivalente
para las matrices totalmente no negativas (TP) viene dado en [5].
Teorema 4 Sea A = (aij ) ∈ Rn×r con rank(A) = r, anr ≤ 0 y el resto de sus elementos
menores que cero. Sea A1 ∈ Rr×r la submatriz invertible de A formada por sus primeras r
filas linealmente independiantes. Entonces, A es t.n.p. si y sólo si para cada k = 1, 2, . . . , r,
las siguientes desigualdades se satisfacen:
det A[α|1, 2, . . . , k] ≤ 0,
para todo α ∈ Qk,n
(3)
det A1 [1, 2, . . . , k|β] ≤ 0,
para todo β ∈ Qk,r
(4)
det A1 [1, 2, . . . , k] < 0.
3
(5)
R. Cantó, B. Ricarte, A.M. Urbano
Demostración: Si A es t.n.p. la desigualdad (3) se satisface. Por otra parte, puesto
que A1 es una matriz t.n.p. invertible, (4) y (5) se obtienen a partir de [2].
Recı́procamente, por (3) para todo α ∈ Qk,r la siguiente desigualdad se satisface
det A1 [α|1, 2, . . . , k] ≤ 0.
(6)
Entonces, por (4), (5), (6) y [2, Teorema 4.1] tenemos que A1 es una matriz t.n.p. invertible.
Por tanto, A1 admite una factorización A1 = LA1 DA1 UA1 , donde LA1 ∈ Rr×r es una
una matriz TP triangular inferior unitaria, DA1 = diag(−d1 , d2 , . . . , dr ) con di > 0, i =
1, 2, . . . , r, y UA1 ∈ Rr×r es una matriz TP triangular superior unitaria.
Puesto que A = F A1 , donde F ∈ Rn×r es una matriz escalonada inferior, se obtiene
que
A = F A1 = F (LA1 DA1 UA1 ) = (F LA1 )DA1 UA1 = LDU,
donde D = DA1 , U = UA1 y L = F LA1 es una matriz escalonada inferior tal que
det A[α|1, 2, . . . , k] = −
k
Y
di det L[α|1, 2, . . . , k] ≤ 0 =⇒ L[α|1, 2, . . . , k] ≥ 0.
i=1
Por [5, Proposición 2] L es TP y por [4] se concluye que A es t.n.p.
¤
Obsérvese que la matriz A1 formada por las r primeras filas linealmente independientes
de A son las r columnas con un 1 principal que se obtienen al calcular la forma escalonada
de AT .
3.
Una caracterización de las matrices t.n. y de las matrices
t.n.p. invertibles a partir de su factorización QR
En [9] los autores introducen los conceptos de lowerly TP (lowerly STP) y de γ-matriz
(γ-matriz estricta) para matrices TP (STP) invertibles, los cuales permiten obtener una
caracterización para este tipo de matrices a partir de su factorización QR. La extensión de
esos conceptos y caracterizaciones a matrices TP singulares o rectangulares viene dada en
[5]. En esta sección damos una caracterización similar para matrices t.n.p. (t.n.) invertibles
utilizando para ello los conceptos de lowerly t.n.p. (lowerly t.n.) y quasi γ-matriz (quasi γmatriz estricta), respectivamente. Representamos por I(−1) a la matriz diag(−1, 1, . . . , 1).
Definición 2 Una matriz invertible A ∈ Rn×n es lowerly t.n.p. (lowerly t.n.) si y sólo si
A se descompone en la forma A = LDU , donde L ∈ Rn×n es triangular inferior unitaria,
D = diag(−d1 , d2 , . . . , dn ) con di > 0, i = 1, 2, . . . , n, U ∈ Rn×n es triangular superior
unitaria y LDI(−1) es una matriz TP (∆STP).
Nótese que si LDI(−1) es una matriz TP, entonces L y DI(−1) = diag(d1 , d2 , . . . , dr ) son
matrices TP. Las siguientes proposiciones dan una caracterización de las matrices lowerly
t.n.p. y lowerly t.n., respectivamente.
Proposición 1 Una matriz invertible A ∈ Rn×n es lowerly t.n.p. si y sólo si para cada
k = 1, 2, . . . , n, se verifican las siguientes desigualdades:
det A[α|1, 2, . . . , k] ≤ 0,
det A[1, 2, . . . , k] < 0.
4
para todo α ∈ Qk,n
(7)
(8)
Factorización de matrices totalmente no positivas y totalmente negativas
Demostración: Por ser A lowerly t.n.p. obtenemos la factorización A = LDU donde,
L ∈ Rn×n es triangular inferior unitaria, D = diag(−d1 , d2 , . . . , dn ) con di > 0, i =
1, 2, . . . , n, U ∈ Rn×n es triangular superior unitaria y LDI(−1) es una matriz TP. Por
tanto
det A[1, 2, . . . , k] < 0, para todo k = 1, 2, . . . , n.
Teniendo en cuenta que L es TP, por la identidad de Binet-Cauchy [1, Eq.(1.23)] obtenemos
que para todo α ∈ Qk,n y k = 1, 2, . . . , n se cumple
à k !
Y
det A[α|1, 2, . . . , k] = −
di det L[α|1, 2, . . . , k] ≤ 0.
i=1
Recı́procamente, por (8) A puede ser descompuesta, aplicando el método de eliminación
de Gauss sin intercambio de filas, en la forma A = LDU , con L (U ) triangular inferior
(superior) unitaria y D = diag(−d1 , d2 , . . . , dn ) con di > 0, i = 1, 2, . . . , n. Por la identidad
de Binet-Cauchy, para todo α ∈ Qk,n y k = 1, 2, . . . , n se verifica
¡
¢
det LDI(−1) [α|1, 2, . . . , k] = − det A[α|1, 2, . . . , k] ≥ 0
Por [1] tenemos que LDI(−1) es TP y, como consecuencia, A es lowerly t.n.p.
¤
Proposición 2 Una matriz invertible A ∈ Rn×n es lowerly t.n. si y sólo si para cada
k = 1, 2, . . . , n, se verifica la siguiente desigualdad:
det A[α|1, 2, . . . , k] < 0,
para todo α ∈ Q0k,n
(9)
Demostración: La demostración es análoga a la anterior pero teniendo en cuenta la
caracterización de matriz ∆STP que podemos encontrar en [6], [7] ó [9], entre otros.
Definición 3 Una matriz invertible A ∈ Rn×n se dice que es una quasi γ-matriz (quasi
γ-matriz estricta) si es lowerly t.n.p. (lowerly t.n.) y en la factorización A = LDU ,
(DU I(−1) )−1 es TP (∆STP).
Ejemplo 1 La matriz


−1 −5
0
1 −2 
A =  −1
−2
2
1
es quasi γ-matriz porque,




1 5
0
−1 0 0
1 0 0
A =  1 1 0   0 6 0   0 1 −1/3  = LDU
0 0
1
0 0 5
2 2 1
siendo

1 0 0
=  1 6 0 ,
2 12 5

LDI(−1)


1 5/6 1/3
¡
¢−1
DU I(−1)
=  0 1/6 1/15 
0 0
1/5
matrices TP triangular inferior y triangular superior, respectivamente.
5
R. Cantó, B. Ricarte, A.M. Urbano
Nota 1 Una condición suficiente para que una matriz invertible A ∈ R2×2 sea quasi γmatriz es que A sea t.n.p. Dicha condición no es necesaria como podemos ver con la
siguiente matriz, la cual es quasi γ-matriz pero no es t.n.p.,
·
¸ ·
¸·
¸·
¸
−2 −2
1 0
−2 0
1 1
A=
=
−1
3
1/2 1
0 4
0 1
Por otra parte, es fácil comprobar que si una matriz invertible A ∈ Rn×n , con n ≥ 3,
es t.n.p. entonces no es una quasi γ-matriz.
La siguiente proposición nos permite dar una caracterización de las quasi γ-matrices.
Este resultado es similar al obtenido en [9, Proposición 4.6].
Proposición 3 Si A y (AT )−1 son matrices lowerly t.n.p., entonces A es quasi γ-matriz.
Demostración: Como A es lowerly t.n.p. tenemos que A = LDU , donde L ∈ Rn×n
(U ∈ Rn×n ) es triangular inferior (superior) unitaria, D = diag(−d1 , d2 , . . . , dn ) con di > 0,
i = 1, 2, . . . , n y LDI(−1) es TP. Sólo nos queda probar que (DU I(−1) )−1 es TP.
Como por hipótesis (AT )−1 es lowerly t.n.p. se verifica que det(AT )−1 [γ|1, 2, . . . , k] ≤ 0
para todo γ ∈ Qk,n y k = 1, 2, . . . , n. Por tanto,
¡
¢
det (DT )−1 (U T )−1 I(−1) [α|1, 2, . . . , k] =
¡
¢
= det (LT )(AT )−1 I(−1) [α|1, 2, . . . , k]
X
¡
¢
=
det LT [α|γ] det (AT )−1 I(−1) [γ|1, 2, . . . , k] ≥ 0.
γ∈Qk,n
De donde obtenemos que
¡
¢−1
¡
¢T
−1
DU I(−1)
= I(−1)
U −1 D−1 = (DT )−1 (U T )−1 I(−1)
es una matriz TP triangular superior y, como consecuencia, A es quasi γ-matriz.
¤
Una caracterización análoga puede obtenerse para las quasi γ-matrices estrictas.
Proposición 4 Si A y (AT )−1 son matrices lowerly t.n., entonces A es quasi γ-matriz
estricta.
Los recı́procos de las Proposiciones 3 y 4 no son ciertos, en general, como muestra el
siguiente ejemplo.
Ejemplo 2 Las matrices


−2 −4 45/7
A1 =  −6 −11 121/7 
−4 −5 55/7

y
6

−2 −4 2
A2 =  −6 −11 8 
−4 −5 15
Factorización de matrices totalmente no positivas y totalmente negativas
son quasi γ-matriz y quasi γ-matriz estricta, respectivamente. Obviamente A1 y A2 son
lowerly t.n.p. y lowerly t.n., sin embargo, las matrices




0 5/14 −11/14
25/2 −29/5 7/5
 y (AT2 )−1 =  −5
2
11/5 −3/5 
(AT1 )−1 =  11 −5
7
−3
1
1
−2/5
1/5
no son lowerly t.n.p. ni lowerly t.n., respectivamente.
Nota 2 Si A es lowerly t.n.p. la condición necesaria y suficiente para que (AT )−1 sea
lowerly t.n.p. es que A verifique las siguientes desigualdades:
• det A[k, k + 1, . . . , n] > 0,
para todo k = 2, 3, . . . , n
Pn−k
• (−1) i=1 αi +((k+1+n)(n−k)/2) det A[α1 , α2 , . . . , αn−k |k + 1, k + 2, . . . , n] ≥ 0, para k =
1, 2, . . . , n − 1 y {α1 , α2 , . . . , αn−k } ∈ Qn−k,n
Si A es lowerly t.n. la condición necesaria y suficiente para que (AT )−1 sea lowerly
t.n. es que A verifique para k = 1, 2, . . . , n − 1 y {α1 , α2 , . . . , αn−k } ∈ Qn−k,n las siguientes
desigualdades:
(−1)
Pn−k
i=1
αi +((k+1+n)(n−k)/2)
det A[α1 , α2 , . . . , αn−k |k + 1, k + 2, . . . , n] > 0.
A partir del concepto de quasi γ-matriz (quasi γ-matriz estricta) vamos a dar la siguiente caracterización para las matrices t.n.p. (t.n.) teniendo en cuenta su factorización
QR.
Teorema 5 Sea A = (aij ) ∈ Rn×n una matriz invertible con ann ≤ 0 y el resto de sus
elementos negativos. Entonces, A es una matriz t.n.p si y sólo si existen dos quasi γmatrices ortogonales Q1 ∈ Rn×n y Q2 ∈ Rn×n , y dos matrices TP triangulares superiores
e invertibles R1 ∈ Rn×n y R2 ∈ Rn×n , tales que A = Q1 R1 y AT = Q2 R2 .
Demostración: Supongamos que A es t.n.p. Por ser A invertible sabemos que admite
una única factorización Q1 R1 , donde Q1 ∈ Rn×n es una matriz ortogonal y R2 ∈ Rn×n es
triangular superior invertible, siendo el factor superior de Cholesky de AT A y por [5] TP.
Por otra parte, como A es una matriz t.n.p. invertible, A verifica las desigualdades (7)
y (8), y por la identidad de Binet-Cauchy tenemos que las matrices Q1 y (QT1 )−1 = Q1
también las verifican. Por tanto, por la Proposición 3, Q1 es quasi γ-matriz ortogonal.
Razonando de manera análoga obtenemos el resultado para AT .
Recı́procamente, supongamos que A = Q1 R1 y AT = Q2 R2 . Como Q1 es quasi γmatriz es, por definición, lowerly t.n.p. y por la Proposición 1 verifica las desigualdades
(7) y (8). De nuevo, por Binet-Cauchy tenemos que para todo k = 1, 2, . . . , n se verifica
que
det A[α|1, 2, . . . , k] ≤ 0,
det A[1, 2, . . . , k] < 0.
7
para todo α ∈ Qk,n
(10)
(11)
R. Cantó, B. Ricarte, A.M. Urbano
Análogamente, Q2 verifica las desigualdades (7) y (8) y, por tanto, para todo k = 1, 2, . . . , n
tenemos que
det AT [α|1, 2, . . . , k] ≤ 0,
para todo α ∈ Qk,n
T
det A [1, 2, . . . , k] < 0.
(12)
(13)
A partir de las desigualdades (10), (11) y (12) y de [2, Teorema 4.1] podemos afirmar que
A es t.n.p.
¤
Teorema 6 Sea A ∈ Rn×n una matriz invertible con todos sus elementos negativos. Entonces, A es una matriz t.n. si y sólo si existen dos quasi γ-matrices estrictas y ortogonales Q1 ∈ Rn×n y Q2 ∈ Rn×n , y dos matrices triangulares superiores ∆STP R1 ∈ Rn×n y
R2 ∈ Rn×n , tales que A = Q1 R1 y AT = Q2 R2 .
Demostración: La demostración es análoga a la del teorema anterior pero teniendo en
cuenta la Proposición 2 y [2, Remark 4.2].
¤
Agradecimientos
Trabajo financiado por el proyecto DGI MTM2007-64477 y por el proyecto de incentivación de la investigación de la Universidad Politécnica de Valencia.
Referencias
[1] T. Ando, Totally positive matrices, Linear Algebra Appl. 90 (1987), 165–219.
[2] R. Cantó, P. Koev, B. Ricarte, A. M. Urbano, LDU -factorization of Nonsingular Totally Nonpositive
Matrices, SIAM J. Matrix Anal. Appl. 30 no 2 (2008), 777-782.
[3] R. Cantó, B. Ricarte, A. M. Urbano, Full rank factorization and Flanders Theorem, Submitted.
[4] R. Cantó, B. Ricarte and A. M. Urbano, Full rank factorization in echelon form of totally nonpositive
(negative) rectangular matrices, Submitted.
[5] R. Cantó, B. Ricarte and A. M. Urbano, Characterizations of rectangular totally and strictly totally
positive matrices, Submitted.
[6] C. W. Cryer, The LU -factorization of Totally Positive Matrices, Linear Algebra Appl. 7 (1973), 83–92.
[7] S. M. Fallat, P. Van Den Driessche, On matrices with all minors negative, Electronic Journal of Linear
Algebra 7 (2000), 92–99.
[8] M. Gasca, J. M. Peña, Total positivity and Neville elimination, Linear Algebra Appl. 44 (1992), 25–44.
[9] M. Gasca, J. M. Peña, Total positivity, QR factorization and Neville elimination, SIAM J. Matrix
Anal. Appl. 4 (1993), 1132–1140.
[10] M. Gasca, J. M. Peña, A test for strict sign-regularity, Linear Algebra Appl. 197/198 (1994), 133–142.
8
Descargar