Formas bilineales y determinantes.

Anuncio
1
CUADERNO VI
FORMAS BILINEALES Y DETERMINANTES
Miguel A. Sainz, Joan Serarols, Anna M. Pérez
Dep. de Informática y Matemática Aplicada
Universidad de Girona
RESUMEN: Como una extensión de las aplicaciones lineales se van a definir las formas
bilineales y sus formas cuadráticas asociadas, fundamentos de importantes conceptos tales
como el producto escalar de vectores, norma de un vector, proyección de un vector sobre un
subespacio y ángulo de dos vectores, conceptos básicos en la aplicación del álgebra lineal a
la geometría. Las formas bilineales se generalizarán a formas multilineales y, en particular,
a los determinantes, cuya definición, propiedades y aplicaciones a la solución de sistema
lineales, cálculo de la matriz inversa,..., etc se desarrollarán con detalle.
VI.1.- FORMAS BILINEALES
Sobre V, e.v.s. K, definimos una forma bilineal como una aplicación
f : V2
(x,y)
K
f(x,y)
lineal en cada componente, es decir, para cualesquiera que sean los vectores x,x',y,y' de V y el
escalar α de K se verifique
f(x+x',y) = f(x,y)+f(x',y) ∧ f( α x,y) = α f(x,y)
f(x,y+y') = f(x,y)+f(x,y') ∧ f(x, α y) = α f(x,y)
La imagen de un par de vectores que son combinación lineal de otros, generalizando por
inducción, viene dada por
f( α 1 x 1 +...+ α m x m , β 1 y 1 +...+ β m y m ) =
∑
α iβ j f(x i,y j)
1≤ i≤ m
1≤ j≤ m
Ejemplo VI.1.1
Sea la aplicación
f : Kn×Kn
(x,y)
K
f(x,y) = Pri(x)·Pr j(y)
2
en la que la imagen de un par de vectores es el producto de la proyección i-ésima del
primer vector por la proyección j-ésima del segundo vector. Tenemos respecto del
primer vector componente
f(x+x',y) = (x i+x 'i )y j = x iy j+x 'i y j = Pri(x)·Pr j(y)+Pr i(x')⋅Pr j(y) = f(x,y)+f(x',y)
f( α x,y) = (α x i)y j = α (x iy j) = α f(x,y)
y respecto del segundo vector componente
f(x,y'+y) = x i(y '+y
j j ) = x i y '+x
j i y j = Pri (x)⋅Pr j (y')+Pr i (x)⋅Pr j (y) = f(x,y)+f(x,y')
f(x,α y) = xi( α y j) = α (x iy j) = α f(x,y)
siendo así una forma bilineal.
Una forma bilineal sobre V diremos que es simétrica si y sólo si
(∀x,y∈V) (f(y,x) = f(x,y))
y diremos que es forma bilineal alternada si y sólo si
(∀x,y∈V) (f(y,x) = –f(x,y))
Si f es alternada (y si en el cuerpo K la suma de un elemento no nulo consigo mismo es distinta
de 0), la imagen de un par de vectores iguales es nula ya que al permutar ambos vectores
f(x,x) = –f(x,x) ⇒ f(x,x) = 0
y recíprocamente si para cualquier vector x es f(x,x) = 0, cualquiera que sea y verifica
0 = f(x+y,x+y) = f(x,x)+f(x,y)+f(y,x)+f(y,y) = f(x,y)+f(y,x) ⇒ f(y,x) = –f(x,y)
es decir, f es alternada.
Ejemplo VI.1.2
La aplicación definida por
f : R 2× R 2
(x,y)
R
x 1 y 2 –x 2 y 1
siendo x = (x1,x2) y = (y1,y2), es una forma bilineal ya que verifica
f(x+x',y) = (x 1 +x 1')y 2 –(x 2 +x 2')y 1 = (x 1 y 2 –x 2 y 1 )+(x 1'y 2 –x 2'y 1 ) = f(x,y)+f(x',y)
demostrándose de forma análoga las otras condiciones de la definición; además es una
forma bilineal no simétrica ya que
3
f(x,y) = x 1 y 2 –x 2 y 1 ≠ y 1 x 2 –y 2 x 1 = f(y,x)
pero sí es alternada pues
f(y,x) = y 1 x 2 –y 2 x 1 = –(y 2 x 1 –y 1 x 2 ) = –f(x,y)
Sea V = Rn, espacio vectorial sobre R y sean los vectores x,y∈V de componentes
respectivos x = (x 1,...,x n) , y = (y 1,...,y n); la aplicación de R n×R n en R dada por la
fórmula
n
f(x,y) =
∑ x iy i
i =1
es bilineal ya que
n
f(x+x',y) =
∑
n
n
n
(x i+x'i)y i = ∑ (x iy i+x'iy i) = ∑ x i y i + ∑ x ' i y i = f(x,y)+f(x',y)
i =1
f( α x,y) =
i =1
i =1
i =1
n
n
n
i =1
i =1
i =1
∑ ( α xi) y i = ∑ α x iy i = α∑ x iy i = αf(x,y)
demostrándose análogamente la linealidad respecto del segundo vector. Además es una
forma bilineal simétrica puesto que
f( y,x) =
n
n
i =1
i =1
∑ y ix i = ∑ x iy i = f(x,y)
Se designa por L2 (V,K) como el conjunto de todas las formas bilineales de V en K ;
análogamente por S2(V,K) designaremos el conjunto de todas las formas bilineales simétricas
de V en K. Se comprueba fácilmente que las formas bilineales L2(V,K) forman un espacio
vectorial sobre K y que S2(V,K) es un subespacio de L2(V,K).
Sea f∈L2(V,K), V un espacio de dimensión finita, (e1 ,...,en) una base de V y x,y∈V, de
forma que
x = x 1 e1 +...+x n en
y = y1e1 +...+y n en
entonces por bilinealidad será
f(x,y) =
∑
x iy j f(e i,e j)
1≤ i≤ n
1≤ j≤ n
por lo que una forma bilineal queda determinada por los escalares
f(ei ,ej)
imágenes de los pares de vectores de la base. Por ello, definimos como matriz de la forma
bilineal la determinada por estos escalares
4
f( e 1 ,e 1 ) f(e 1 ,e 2 ) . . f(e 1 ,e n )
f( e 2 ,e 1 ) f(e 2 ,e 2 ) . . f(e 2 ,e n )
A f = (f(ei ,ej)) = . . . . . . . . . . . . . . . . . . . . . . . .
f( e n ,e 1 ) f(e n ,e 2 ) . . f(e n ,e n )
que será una matriz simétrica si lo es la forma bilineal y hemisimétrica si la forma lineal es
alternada.
Ejemplo VI.1.3
Para la forma bilineal definida por
f : R2×R2
(x,y)
R
x 1 y 2 −x 2 y 1
respecto de la base canónica de R2, como
f((1,0),(1,0))
f((1,0),(0,1))
f((0,1),(1,0))
f((0,1),(0,1))
=
=
=
=
1⋅0−0⋅1 = 0
1⋅1−0⋅0 = 1
0⋅0−1⋅1 = −1
0⋅1−1⋅0 = 0
la matriz de f será
Af =
0 1
–1 0
Si hacemos
f(ei ,ej) = aij
la fórmula de la forma bilineal puede escribirse como el siguiente producto de matrices:
a11 a12 . . a1n
f(x ,y) = x 1 x2 . . xn
a21 a22 . . a2n
..........
an1 an2 . . ann
y1
y2
= x tA f y
..
yn
Ejemplo VI.1.4
En R4, dados los vectores x = (2,3,0,1) y = (4,2,1,0) la imagen del par que forman
en la forma bilineal cuya matriz respecto de la base canónica es
5
1
Af = 0
–1
2
2 –1 –2
0 4 2
1 5 0
1 3 1
será
g(x,y) = x tA fy = 2 3 0 1
1
0
–1
2
2
0
1
1
–1 –2
4 2
5 0
3 1
4
7
2
4
= 2 3 0 1
= 39
1
3
0
13
Y la fórmula de g
g(x,y) = x 1 y 1 +2x 1 y 2 –x 1 y 3 –2x 1 y 4 +4x 2 y 3 +2x 2 y 4 –x 3 y 1 +x 3 y 2 +5x 3 y 3 +2x 4 y 1 +
+x4y2+3x4y3+x4y4
Si V es un espacio vectorial sobre R, de dimensión 3, tal que la matriz de una
aplicación bilineal f respecto de una base (e1 ,e2 ,e3), es
Af =
1 2 0
0 1 0
1 3 1
la imagen por f del par de vectores x = 1e1+2e2+3e3 y y = 2e1−1e2+3e3 será
1 2 0 2
0
f(x,y) = 1 2 3 0 1 0 –1 = 1 2 3 –1 = 4
1 3 1 3
2
La matriz de una forma bilineal vimos que estaba asociada a la base respecto de la cual
referimos el espacio vectorial. Vamos a ver como cambia esta matriz al cambiar la base del
mismo. Sean (e1 ,...,en) y (u 1,...,u n) bases de V con una matriz M de cambio de base. Sean A
y B las matrices de una forma bilineal f sobre V, en las bases (e) y (u), respectivamente y dos
vectores cualesquiera x e y de V, de componentes respecto de ambas bases
x = x 1 e1 +...+x n en = x'1 u 1 +...+x'n u n
y = y 1 e1 +...+y n en = y'1 u 1 +...+y'n u n
Como, según vimos al resolver el problema del cambio de base
x = Mx'
y = My'
tendremos
f(x,y) = x tA y 
 ⇒ x't By' = (Mx')tA(My') ⇒ x't By' = x't M tAMy' ⇒ B = M tA M
t
f(x,y) = x' By' 
6
Ejemplo VI.1.5
Si una forma bilineal f sobre R3 tiene por matriz respecto de una base (e1 ,e2 ,e3)
1 2 0
A= 0 1 0
1 3 1
y (u1,u2,u3) es otra base definida por
u1 = e1
u2 = e1 +e2
u 3 = e1 +e2 +e3
tendremos que
1 1 1
u = eM
siendo
M= 0 1 1
0 0 1
por lo que, según lo anterior, la matriz B de f respecto de esta nueva base será
1 0 0
B = M AM = 1 1 0
1 1 1
t
1 2 0
0 1 0
1 3 1
1 1 1
1 2 0
0 1 1 = 1 3 0
0 0 1
2 6 1
1 1 1
1 3 3
0 1 1 = 1 4 4
0 0 1
2 8 9
Diremos que dos vectores x,y∈V son vectores ortogonales respecto de una forma
bilineal simétrica f sobre V si y sólo si
f(x,y) = 0
Diremos que dos subconjuntos A y B de V son subconjuntos ortogonales respecto de
una forma bilineal simétrica f cuando todo vector de A sea ortogonal a todo vector de B.
Una base (e1 ,e2 ,...,en ) de V es base ortogonal respecto de una forma bilineal
simétrica f sobre V si y sólo si para cualesquiera vectores distintos ei ≠ ej es
f(ei ,ej) = 0
De manera análoga, diremos que el vector x∈V es un vector normalizado respecto de
una forma bilineal simétrica f sobre V si y sólo si
f(x,x) = 1
Una base (e1 ,e2 ,...,en ) de V es base ortonormal respecto de una forma bilineal
simétrica f sobre V si y sólo si
f(ei ,ej) = δij
7
por lo que la matriz de una forma bilineal simétrica f referida a una base que sea ortonormal,
respecto de f, es la matriz unidad.
Como caso particular, si (e1 ,...,en) y (u 1,...,u n) son bases ortonormales de V, respecto de
una forma bilineal simétrica f, la matriz de f respecto a ambas bases es la matriz unidad y de
acuerdo con la relación existente entre las matrices en bases distintas, tendremos
In = MtInM ⇒ In = MtM ⇒ Mt = M-1
es decir, la matriz de cambio de base entre bases ortonormales cumple la propiedad de que su
inversa es igual a su traspuesta. Una matriz con esta propiedad se denomina matriz
ortogonal. Recíprocamente, si (e) es una base ortonormal de un espacio vectorial V sobre K,
y (u) es otra base de V, tales que u = eM, cumpliéndose que
Mt = M-1
entonces (u) es también una base ortonormal ya que si A y B son las matrices de f∈L2(V,K) en
ambas bases, respectivamente
B = MtAM = MtIM = M-1M = I
es decir, una matriz es ortogonal si y sólo si sus vectores columna son ortonormales
Ejemplo VI.1.6
Sea (e1 ,e2 ,e3) una base ortonormal de V, espacio vectorial sobre R; sea la nueva base
u1 = 1/2e1+ 3/2e2
u2 = − 3/2e1+1/2e2
u3 = e3
La matriz del cambio de base es la matriz regular
1/2 – 3/2 0
M=
3/2
0
1/2
0
0
1
Hallando su traspuesta y su inversa se obtiene
1/2
t
M = – 3/2
0
3/2
0
1/2
0
0 = M-1
1
por lo cual, según los resultados previos, (u 1,u 2,u 3) es base ortonormal, lo que se
comprueba fácilmente.
8
Ejercicios
VI.1.- Estudiar si son bilineales o no las aplicaciones
a) f : R2×R2
R 3 definida por f((x,y),(z,t)) = (x+y,z−t,x−y+z+t)
b) g : R3×R3
R definida por g(x,y) = xx'+yy'+3zz'−2xz'−2zx'
c) h : R2×R2
R definida por h((x,y),(z,t)) = xt−yz
d) t : R×R
R 3 definida por t(x,y) = (x2,xy,y2)
VI.2.- Expresar las siguientes formas bilineales como producto de matrices del tipo xtAy :
a) f(x,y) = 2x 1 y 1 +3x 1 y 2 −4x 2 y 1 +x 2 y 2 con x,y∈R 2 .
b) f(x,y) = 5x 1 y 1 −x 2 y 1 +2x 2 y 2 con x,y∈R 2 .
c) f(x,y) = x 1 y 1 +x 1 y 2 −x 1 y 3 +2x 2 y 1 −x 2 y 3 con x,y∈R 3 .
VI.3.- Sea f la forma bilineal sobre R3 cuya matriz asociada en la base canónica es
1 2 3
–1 1 1
1 0 1
a) Hallar dos vectores x,y de R3 tales que f(x,y) ≠ f(y,x).
b) Hallar la matriz asociada a f respecto de la base ((1,1,0),(0,1,0),(1,1,1)) de R3.
VI.4.- En la base B = ((1,0),(1,1)), la matriz asociada a una forma bilineal es A =
para α 1 = , α 2 = , α 3 = y α4 =
bilineal en la base C = ((0,1),(1,2)).
α1 α2
α3 α4
.
. Calcular la matriz asociada a dicha forma
VI.5.- Sea E un espacio vectorial sobre K y sean φ, ψ dos formas lineales de E. Demostrar
que la aplicación f de E×E en K definida por f(x,y) = φ(x)·ψ(y) es una forma bilineal.
VI.6.- Demostrar que, si f, g son dos formas bilineales simétricas sobre V e.v.s.K, tales que
para todo x es f(x,x) = g(x,x) entonces f = g. Probar que el resultado no es cierto
cuando f y g no son simétricas.
VI.2.- FORMAS CUADRATICAS
Dada una forma bilineal f∈ L 2(V,K) se define forma cuadrática fc asociada a f como la
aplicación
9
fc : V
x
K
fc(x) = f(x,x)
La forma cuadrática fc, al estar asociada a la forma bilineal f, viene definida por ella pero
diferentes formas bilineales pueden definir la misma forma cuadrática; por ejemplo, si g es una
forma bilineal alternada y definimos h(x,y) = g (x ,y)+f(x ,y), se verifica h (x ,x ) =
g(x,x)+f(x,x) = 0+f(x,x) = f(x,x), con lo que hc = fc. Sin embargo, entre todas las formas
bilineales asociadas a fc existe una única forma bilineal s que es simétrica (y si en el cuerpo K la
suma de un elemento no nulo consigo mismo es distinta de 0). En efecto, si s es la aplicación de
V2 en K definida por
s(x,y) = (fc(x+y)−fc(x)−fc(y))/2
(siendo 2 el elemento 1+1) es una forma bilineal simétrica ya que al ser f bilineal
s(x,y) = (fc (x+y)−fc (x)−fc (y))/2 = (f(x+y,x+y)−f(x,x)−f(y,y))/2 = (f(x,y)+f(y,x))/2
s(y,x) = (f(y,x)+f(x,y))/2 = s(x,y)
Como
s(x,x) = (fc(2x)−fc(x)−fc(x))/2 = (4fc(x)−fc(x)−fc(x))/2 = fc(x)
resulta que s está asociada a fc . Además es única, pues cualquier otra forma bilineal simétrica g,
asociada a fc verificará
fc(x+y) = g(x+y,x+y) = g(x,x)+2g(x,y)+g(y,y) = fc(x)+2g(x,y)+fc(y) ⇒
⇒ g(x,y) = (fc(x+y)−fc(x)−fc(y))/2 = s(x,y)
A esta única aplicación bilineal simétrica s, asociada a la forma cuadrática fc se le denomina
forma polar de la forma cuadrática. Se define matriz de una forma cuadrática fc, como
la matriz de su forma polar, por lo tanto la matriz de una forma cuadrática siempre es simétrica.
Si V es de dimensión finita, (e1 ,..,en) es una base de V y A = (aij) es la matriz de f en esta
base, entonces
fc(x) = s(x,x) = x tAx =
∑
aij x i x j = a11x21+...+ a nn x 2n+2a 12x 1x 2+...+2a n-1 nx n-1x n
1≤ i≤ n
1≤ j≤ n
es decir, una forma cuadrática es un polinomio en n variables con todos sus términos de
segundo grado. Si V es un espacio vectorial real, diremos que la forma cuadrática fc es
definida positiva si y sólo si
(∀x∈V) (x ≠ 0 ⇒ fc(x) > 0)
es decir, si el polinomio anterior tiene un valor numérico positivo cualesquiera que sean xi y xj ,
no simultáneamente nulos. Análogamente, diremos que la forma cuadrática fc es definida
negativa si y sólo si
(∀x∈V) (x ≠ 0 ⇒ fc(x) < 0)
10
Ejemplo VI.2.1
La forma cuadrática sobre R2, referida a la base canónica , dada por el polinomio
fc(x,y) = x 2 +y 2
tiene por matriz
1 0
0 1
y es definida positiva pues si x e y no son simultáneamente nulos, x2+y2 es mayor que
0. La forma cuadrática definida por el polinomio
fc(x,y) = x 2 +y 2 −6xy
tiene por matriz
1 –3
–3 1
y no es definida ya que
fc(1,1) = −4
fc(0,1) = 1.
Determinar si una forma cuadrática es definida, positiva o negativa, o no lo es, mediante su
fórmula suele ser complicado; más adelante veremos procedimientos prácticos para ello.
Ejercicios
VI.7.- Sea f((x 1,x 2),(y 1,y 2)) = α 1x 1y 1+ α 2x 1y 2+ α 3x 2y 1+ α 4x 2y 2, para α 1 =
= y α4 = .
, α2 =
a) Comprobar que f es una forma bilineal. ¿Es simétrica?. ¿Es alternada?.
b) Determinar su forma cuadrática asociada.
c) Expresar matricialmente f.
VI.8.- Determinar las formas cuadráticas representadas por los siguientes productos:
a) x
b)
x
y
y
1 –3
–3 4
z
x
y
1 –2
–2 4
3 1
3
1
5
x
y
z
, α3
11
VI.9.- Consideremos la forma cuadrática sobre R4 definida por
q(x 1 ,x 2 ,x 3 ,x 4 ) = x12 +x 42 +x 1 x 2 –4x 3 x 4
Hallar la matriz de q en la base canónica de R 4. Siendo f la forma polar de q, hállese
f(x,y) para x = (1,1,1,1) e y = (0,0,−1,−1).
VI.10.- En la base canónica, una forma cuadrática q(x) definida en R 2 tiene la siguiente
expresión:
q(x) = 4x12+3x 22–6x 1x 2
Determinar su nueva expresión cuando se toma como base la formada por los vectores
u1 = (1,1) y u2 = (−1,1).
VI.11.- Probar que las formas cuadráticas
2
2
q 1(x) = x1 +x 2 +8x1x2
q2(y) = y12–14y22 +2y 1 y 2
son equivalentes, haciendo el cambio de variables
x1
1 –3 y 1
=
x2
0 1 y2
VI.12.- Dadas las siguientes formas cuadráticas:
a) x2+y2+z2+4xy+4xz+4yz
b) x2+14yz−8xy
c) x2−y2−3z2+4xy+6xz−8yz
d) 2x2+y2+2z2−4t2+4xy−4xz−4yz+4yt
definidas las tres primeras en R 3 y la última en R 4. Se pide expresarlas en forma
matricial e indicar si están definidas en signo.
VI.13.- En R2(x) se define la forma cuadrática fc(P(x)) = P(–1)2+P(0)2+P(1)2.
a) Calcular fc(a1x2+a2x+a3).
b) Hallar la expresión matricial respecto de la base (x2,x,1) de la forma polar asociada.
c) Demostrar que es definida positiva.
VI.3 .- PRODUCTO ESCALAR Y NORMA.
Sea V un espacio vectorial sobre el cuerpo real R. Daremos el nombre de producto escalar
a una forma bilineal simétrica cuya forma cuadrática asociada sea definida positiva, que
representaremos por
12
<·> : V×V
(x,y)
R
<x,y>
A la matriz de la forma bilineal la denominaremos matriz del producto escalar. Un espacio
vectorial sobre el cuerpo real en el que se ha definido un producto escalar se denomina espacio
euclidiano.
Ejemplo VI.3.1
En el espacio vectorial Rn la aplicación
Rn×Rn
(x,y)
R
<(x 1 ,...,x n ),(y 1 ,...,y n )> = x 1 y 1 +...+x n y n
define un producto escalar, que se denomina producto escalar ordinario de Rn, ya
que verifica las cinco condiciones que implican la definición. En efecto,
1) <(x 1 ,...,x n ),(y 1 ,...,y n )> = <(y 1 ,...,y n ),(x 1 ,...,x n ) >
ya que x 1 y 1 +...+x n y n = y 1 x 1 +...+y n x n
2) <α (x 1 ,...,x n ),(y 1 , ..,y n )> = α <(x 1 ,...,x n ),(y 1 ,...,y n ) >
ya que (α x 1)y 1+...+(α x n)y n = α (x 1y 1+...+x ny n)
3) <(x 1 ,...,x n )+(x 1',...,x n'),(y 1 ,...,y n )> = <(x 1 +x 1',...,x n + x n'),(y 1 ,...,y n )> =
= (x1+x1')y 1 +...+(x n +x n')y n = <(x 1 ,...,x n ),(y 1 ,...,y n )>+<(x 1',...,x n'),(y 1 ,...,y n ) >
4) <(x 1 ,...,x n ),(x 1 ,...,x n )> = x 12 +...+x n2 ≥ 0
5) <(x 1 ,...,x n ),(x 1 ,...,x n )> = 0 ⇔ x 21 +...+x n2 = 0 ⇔ x21 = 0 ∧ ... ∧ x2n = 0
⇔
⇔
x1 = 0 ∧ ... ∧ xn = 0 ⇔ (x1,...,xn) = (0,...,0)
La matriz de este producto escalar respecto de la base canónica es la matriz unidad de
orden n
1 0..0
0 1..0
A f = In=
......
0 0..1
Si V es un espacio euclidiano, al ser el producto escalar sobre V una forma bilineal
simétrica, la imagen del par de vectores x e y viene dada en forma matricial por
< x,y> = x 1 . . xn
y1
<e i,e j> . . = x tA y
yn
siendo A = (<ei ,ej>) la matriz del producto escalar en la base de referencia; está formada por los
13
productos escalares de los pares de vectores de la base y será una matriz simétrica. Si la base de
referencia es ortonormal, la matriz (<ei,ej>) es la matriz unidad In y el producto escalar de los
dos vectores es
< x,y> = x 1 . . xn In
y1
. . = x ty
yn
Mediante el producto escalar se define la norma de un vector, que corresponde a lo que
intuitivamente se denomina longitud o módulo. Sea V un espacio vectorial sobre R en el que se
ha definido un producto escalar, y sea x∈ V; definimos la norma de x, que representaremos
por x , como
 x  = (<x,x>) 1/2
que existe, cualquiera que sea x, pues
<x,x> ≥ 0
Los vectores cuya norma es 1 reciben el nombre de vectores normalizados.
En el Tabla VI.3.1 están las propiedades más importantes de la norma de un vector.
TABLA VI.3.1
____________________________________________________
Propiedades de la norma
1) x  ≥ 0
2) x  = 0 equivale a x = 0
3)  α x  = α x 
  ±1

4) x ≠ 0 implica   x   = 1
 x   
5) <x,y> ≤x · y 
(desigualdad de Schwartz)
6) <x,y> =  x · y  equivale a {x,y} l.d.
7) x+y ≤x + y  (desigualdad triangular)
____________________________________________________
Demostraciones:
1) Obvia, pues por definición la norma es la raíz cuadrada positiva de <x,x>.
14
2) Aplicando propiedades del producto escalar, tenemos
 x  = 0 ⇔ (<x,x>)1/2 = 0 ⇔ <x,x> = 0 ⇔ x = 0
3)   α x  = (<α x,α x>) 1/2 = (α 2<x,x>) 1/2 = (α 2)1/2(<x,x>) 1/2 =  α x 
4) Expresa esta propiedad que si multiplicamos un vector no nulo por el inverso de su norma
se obtiene un vector proporcional a él, obviamente, y normalizado ya que, según 3)
  ±1

1
  x   =  x  = 1
 x   
x 
El proceso, basado en esta propiedad, de obtener a partir de un vector x otro proporcional a
él y normalizado se denomina normalización del vector; existen únicamente dos vectores,
opuestos entre si, como resultado de este proceso de normalización ya que si
x≠0 
1
1
y  = 1  ⇔  α x  = 1 ⇒ αx  = 1 ⇒ α =  ⇒ α = ± 
y = αx 
x 
x 
5) Si u es un vector normalizado cualquiera, como para todo vector x∈V es
<x−<u,x>u , x−<u,x>u> ≥ 0
que equivale a que
<x,x>−<x ,<u,x>u>−<<u,x>u , x>+<<u,x>u ,<u,x>u> ≥ 0 ⇔
⇔ x  2 −<u,x><x,u>−<u,x><u,x>+<u,x> 2  u 2 ≥ 0 ⇔
⇔ x 2−<u,x> 2 ≥ 0 ⇔  x 2 ≥ <u,x> 2 ⇔  x  ≥ <u,x>
Sea ahora un vector y ≠ 0 por lo que, teniendo en cuenta que y/y  es un vector
normalizado, sustituyendo u por y /y  en la desigualdad anterior, podemos escribir
1
1
 x  ≥ < y,x> ⇔  x  ≥  <y,x> ⇔
y 
y 
<x,y> ≤ x · y 
Si y = 0 se verifica la desigualdad pues <x,y> = 0 y y  = 0.
6) Si u es un vector normalizado, de acuerdo con el razonamiento anterior
<u,x> =  x · u  =  x  ⇔ <x−<u,x>u , x−<u,x>u> = 0 ⇔
⇔ x−<u,x>u = 0 ⇔ x = <u,x>u ⇔ x = αu
Para cualquier y ≠ 0, al ser y/y  un vector normalizado, tendremos
1
α
x = α  y =  y ⇔ {x,y} l.d.
y 
y 
Si y = 0, la equivalencia es evidente.
15
7) Como
x+y  2 = <x+y , x+y> = <x,x>+<x,y>+<y,x>+<y,y> =  x  2 +2<x,y>+ y 2 ≤
≤ x  2 +2<x,y>+ y 2 ≤ x 2+2 x · y  + y 2 = ( x + y )2
sacando raíz cuadrada positiva, tenemos la propiedad.
Ejemplo VI.3.2
En Rn con el producto escalar ordinario, la norma de un vector es
 (x 1 ,...x n )  = (x21 +...+x n2 ) 1/2
y, por ejemplo, en R3
 (1,−4,8)  = (12+(−4)2+8 2)1/2 = 9
Si multiplicamos este vector por el inverso de su norma, 1/9 , tendremos el vector
(1/9,−4/9,2/9)
que es normalizado y proporcional a él; lo mismo que el opuesto
(−1/9,4/9,−2/9)
Los vectores de la base canónica de R n con el producto escalar ordinario son
normalizados ya que
 (0,...,0,1,0,...,0)  = (02+...+02+1 2+0 2+...+02)1/2 = 1
Ejercicios
VI.14.- Sea f : R n ×R n
R . Siendo x e y dos vectores de R n , determinar si las
aplicaciones que se dan a continuación son o no productos escalares:
n
a) f(x,y) =
∑ x iy i
i =1
n
n
i =1
j =1
b) f(x,y) = ∑ x i ∑ y j
n
c) f(x,y) = ∑
x i2 +y i2
i =1
n
n
d) f(x,y) = ∑ (x i–y i) –∑
2
i =1
i =1
n
∑ y i2
x i2 –
i =1
16
VI.15.- Demostrar que (R3,⊗) con
(x 1 ,x 2 ,x 3 )⊗(y 1 ,y 2 ,y 3 ) = x 1 y 1 −2x 1 y 2 −2x 2 y 1 +6x 2 y 2 +x 2 y 3 +x 3 y 2 +x 3 y 3
es un espacio vectorial euclidiano.
VI.16.- En R3, para cualquier par de vectores x = (x1,x2,x3) y = (y1,y2,y3) se define
<x,y> = ax 1 y 1 +ax 2 y 2 +x 3 y 3 +x 1 y 2 +x 2 y 1
Hallar la condición que ha de satisfacer el número real a para que sea un producto
escalar.
VI.17.- Sea V un espacio vectorial sobre R de dimensión n y sea (a 1 , a 2 ,..., an) una base de
V. Demostrar que existe un producto escalar en V para el que esta base es ortonormal.
VI.18.- Sea (V,<,>) un espacio vectorial euclidiano, pruébese que, para cualesquiera vectores
x,y,z∈V, se verifica
2
2
2
2
|| x+y+z || = || x || + || y || + || z || +2<x,y>+2<y,z>+2<z,x>
VI.19.- Sea el espacio vectorial de los polinomios de grado dos con coeficientes reales sobre
R, y sea la l.c. sobre este espacio definida por
(a 2x2+a 1x+a 0)·(b2x2+b1x+b0) = (a 2+a 1+a 0)·(b2+b1+b0)
¿Es un producto escalar ?.
VI.20.- Sea R3[x] el espacio vectorial de los polinomios con coeficientes reales sobre R y de
grado menor o igual a tres. Demostrar que el producto
1
P(x)·Q(x) =
P(x)·Q(x) dx
0
es un producto escalar. Determinar la norma del polinomio x2+2x+7.
VI.4.- ORTOGONALIDAD
El concepto de ortogonalidad de vectores respecto de una forma bilineal simétrica en el caso
de un producto escalar tiene aplicaciones geométricas interesantes que se verán en el Capítulo
dedicado a la Geometría. Sea V e.v.s. R euclidiano; dos vectores x,y de V son ortogonales
respecto del producto escalar definido en V, lo que escribiremos
x⊥y
cuando su producto escalar es nulo, es decir
x ⊥ y si y sólo si <x,y> = 0
17
De la definición se deduce inmediatamente
a) Para todo x∈ V es 0 ⊥ x , ya que <0,x> = (0 ... 0) Ax = 0
b) x ⊥ y equivale a y ⊥ x , ya que <x,y> = <y,x> = 0
c) x ⊥ y equivale a αx ⊥ y , ya que <αx,y> = α<x,y> = 0, para cualquier α∈R*
d) x ⊥ y equivale a x+y 2 =  x 2+ y 2 , ya que
 x+y  2 = <x+y,x+y> = <x,x>+2<x,y>+<y,y> =  x 2+ y 2
Un conjunto de vectores A ⊆V es ortogonal si y sólo si todos sus vectores son ortogonales
entre sí; por ejemplo, el conjunto {x1,...,xn}⊆V será ortogonal si y sólo si
(∀x i,x j∈{x 1 ,...,x n }) (i ≠ j ⇒ <x i,x j> = 0)
Un conjunto A ⊆V es ortonormal si es ortogonal y todos sus vectores son normalizados;
por ejemplo, el conjunto {x1,...,xn}⊆V será ortonormal si y sólo si
 0 para i ≠ j
<xi,xj> = 
 1 para i = j
En particular, si un conjunto de vectores ortonormales forma una base de V, hablaremos de
base ortonormal. Una base formada por un vector normalizado se considera ortonornal
En la Tabla VI.4.1 figuran las propiedades más interesantes que se deducen de las
definiciones precedentes.
TABLA VI.4.1
______________________________________________________________
Propiedades de los conjuntos de vectores ortogonales
1) Si {x1,...,xm} ortogonal y ningún xi es nulo, entonces {x1,...,xm} l.i.
2) (e1 ,...,en) base ortonormal de V 
x = x1e1 +...+x n en
 implican <x,y> = x1y1+...+xnyn
y = y1e1 +...+y n en

3) Si V es un espacio vectorial euclidiano de dimensión finita, existe
una base ortonormal de V
______________________________________________________________
Demostraciones:
1) En efecto, si α 1 x 1 +...+ α mxm = 0 multiplicando escalarmente
por x1 : <α 1 x 1 +...+ α m x m , x 1> = <0,x 1> = 0 ⇒ α 1<x1,x1> = 0 ⇒ α 1 = 0
por x2 : <α 1 x 1 +...+ α m x m , x 2> = <0,x 2> = 0 ⇒ α 2<x2,x2> = 0 ⇒ α 2 = 0
.......................................................
18
por xm : <α 1 x 1 +...+ α m x m , x m > = <0,x m > = 0 ⇒ α m <xm ,xm > = 0 ⇒ α m = 0
luego forman un conjunto l.i.
2) Como <ei,ej> es 1 si i = j y 0 si i ≠ j , según hemos obtenido para la imagen de un par de
vectores
<x,y> =
∑
x iy j <e i,e j> = x 1 y 1 +...+x n y n
1 ≤i ≤n
1 ≤j ≤n
Esta propiedad expresa que si el espacio vectorial está referido a una base ortonormal el
producto escalar de dos vectores toma una expresión muy sencilla, análoga a la del producto
escalar ordinario de Rn. Por ello, es conveniente averiguar si en un espacio vectorial V sobre
R de dimensión finita, en el que se ha definido un producto escalar, es posible hallar una
base ortonormal respecto a ese producto. Ello es posible según demuestra la propiedad 3).
3) Si dim (V) = 1 y (e) es una base de V, entonces (e/ e ) es una base ortonormal. Si
dim(V) = n, sea (e1,...,en) una base de V. Construimos los vectores
v1 = e 1
v2 = e2+ α 21 v1 tal que v2 ⊥ v1
. . . . . . . . . . . . . . . . . . . . . . .
vn = en+ α n1 v1 +...+ α n n-1 vn-1 tal que vn ⊥ v1 ∧ ... ∧ vn ⊥ vn-1
que forman un conjunto {v1 ,...,v n} ortogonal, con ningún vector nulo y por tanto l.i., luego
forman base de V. Demostremos por inducción que los vectores vi existen y son únicos. Sea
S = {i∈N  v1 = e 1 , v2 = e2+ α 21 v1 ,..., v i = e i + α i1 v1 +...+ α ii-1 vi-1 no nulos y ortogonales}
que contiene a 2, pues para que v2 ⊥ v1 basta hacer
−<e2,v1>
0 = <v2 ,v1 > = <e 2 ,v1>+ α 21 <v1 ,v1> ⇒ α 21 = 
<e1,e1>
por ser <v1 ,v1> = <e1,e1> ≠ 0. Además es v2 ≠ 0, pues en caso contrario e2+α 21e 1 = 0 y
{e1,e2} sería l.d.
i∈S ⇒ i+1∈S
pues al ser vi+1 = e i+1 + α i+11 v1 +...+ α i+1i vi tendremos que para que sea
v i+1 ⊥ vj (j = 1,...,i) basta hacer
0 = <vi+1,vj> = <e i+1 ,vj>+ α i+11 <v1 ,vj>+...+ α i+1i <vi ,vj> =
−<ei+1,vj>
= <ei+1,vj>+ α i+1j<vj ,vj> ⇒ α i+1j = 
<vj ,vj>
Además vi+1 ≠ 0, pues en caso contrario e i+1+ α i+11 v1 +...+ α i+1 ivi = 0
con lo que ei+1 sería c.l. de v1 ,...,vi y, por ello, de e 1 ,...,e i.
Así hemos construido un conjunto {v1 ,...,vn} que, al ser ortogonal y con todos sus vectores
no nulos, será l.i., por lo que es una base ortogonal de V. La base ortonormal buscada será
19
v1
vn
( ,...,  )
v1  
vn  
Este proceso de obtener una base ortonormal partiendo de una base cualquiera de V se
denomina proceso de ortonormalización de Gram-Schmidt que demuestra que todo
espacio vectorial de dimensión finita posee una tal base.
Ejemplo VI.4.1
Apliquemos el proceso anterior para obtener una base ortonormal a partir de la base
((1,−1,1),(2,0,1),(1,1,1)) de R3 suponiendo que el producto escalar es el ordinario; el
primer vector de la base ortogonal será
v1 = (1,−1,1)
El segundo vector vendrá definido por las condiciones
v2 = (2,0,1)+α 21(1,−1,1) ∧ v2 ⊥ v1
es decir,
0 = <v2 ,v1> = 3+3α 21 ⇒ α 21 = −1 ⇒ v2 = (2,0,1)−(1,−1,1) = (1,1,0)
El tercer vector vendrá dado por
v3 = (1,1,1)+α 31(1,−1,1)+α 32(1,1,0) ∧ v3 ⊥ v1 ∧ v3 ⊥ v2
con lo cual
0 = <v3 ,v1> = 1+3α 3 1 
 ⇒
0 = <v3 ,v2> = 2+2α 3 2 
α 31 = −1/3 
 ⇒ v3 = (−1/3,1/3,2/3)
α 32 = −1

luego una base ortogonal es ((1,−1,1),(1,1,0),(−1,1,2)) y normalizándola obtenemos
(
1
3
,
–1
3
,
1
3
),(
1
,
1
2
, 0) , (
2
–1
6
,
1
6
,
2
)
6
Diremos que un vector x∈V es ortogonal a un subespacio A si x es ortogonal a todo
vector de A; si A es un subespacio de dimensión finita se verifica que
"x ortogonal a A equivale a que x es ortogonal a los vectores de cualquier base de A"
En efecto, sea (u1,...,un) una base de A. Tendremos
x ortogonal a todo vector de A ⇒ x ⊥ u1,...,x ⊥ un
Recíprocamente si
x ⊥ u 1 ,..., x ⊥ u n
20
para todo u∈A será
u = α 1 u 1 +...+ α nu n ⇒ <x,u> = <x,α 1 u 1 +...+ α nun> = α 1 <x,u 1 >+...+ α n<x,u n> = 0
Diremos que A y B son subespacios ortogonales cuando todo vector de A es ortogonal
a todo vector de B; si A y B son de dimensión finita se verifica que
"A ortogonal a B equivale a que los vectores de cualquier base de A son ortogonales a los
vectores de otra base de B"
En efecto, sean (u1,...,up) base de A y (v1 ,...,vr) base de B. Si todo vector de A es ortogonal a
todo vector de B, entonces
u 1 ⊥ v1 ,..., u 1 ⊥ vr ,..., u p ⊥ v1 ,..., u p ⊥ vr
Recíprocamente, si se verifica lo anterior, para dos vectores cualesquiera
u = α 1 u 1 +...+ α pup∈A
v = β1v1 +...+ β r vr∈B
será
<u,v> = α 1 β 1 <u 1 ,v1 >+..+ α 1 β r<u 1 ,vr>+...+ α p β 1 <u p ,v1 >+..+ α p β r<u p ,vr> ⇒ <u,v> = 0
Dado un subconjunto X = {x1,...xm}⊆V el conjunto de vectores ortogonales a ellos forman
un subconjunto que se denota por X⊥ y verifica que es un subespacio de V. En efecto
(∀x∈X⊥ ) (x⊥X) 
 <(α x+ β y),x 1> = α <x,x 1>+ β <y,x 1> = 0 ⇒ (α x+ β y) ⊥ x 1
(∀y∈X⊥ ) (y⊥X)  ⇒ 
. . . . . . . . . . . . . . . . . . . . . . . . . . .
(∀αβ∈R)

 <(α x+ β y),x m > = α <x,x m >+ β <y,x m > = 0 ⇒ (α x+ β y) ⊥ x m
con lo que α x+βy∈X⊥
Dado un subespacio A de V, el conjunto de vectores de V ortogonales a los vectores de A se
denomina subespacio ortogonal asociado al subespacio A y se representa por A ⊥. Si V es
de dimensión finita se verifican las propiedades de la Tabla VI.4.2
TABLA VI.4.2
____________________________________________________________
Propiedades de los subespacios ortogonales
1) A⊕A⊥ = V
2) dim(A)+dim(A⊥) = dim(V)
3) Si B es subespacio ortogonal a A, entonces B ⊆ A⊥
4) Si A y B son subespacios ortogonales, entonces dim(A)+dim(B) ≤ dim(V)
______________________________________________________________
21
Demostraciones:
1) En efecto, por un lado
x∈A∩ A⊥ ⇒ x∈A ∧ x∈A⊥ ⇒ x ⊥ x ⇒ <x,x> = 0 ⇒ x = 0 ⇒ A ∩ A⊥ = {0}
y por otro lado, si (u 1 ,...,u m ) es base de A el proceso de ortonormalización de GramSchmidt asegura la existencia de una base (e1 ,...,em) ortogonal de A, que se puede completar
para hallar una base de V
(e1 ,...,em ,u i m+1 ,...,u i n)
y el proceso de Gram-Schmidt vuelve a asegurar una base ortonormal
(e1 ,...,em ,em +1 ,...,en)
esta vez para V, siendo, entonces (em +1 ,...,en) base de A⊥ pues forman un conjunto l.i. y
x∈A⊥ ⇒ x∈V ⇒ x = α 1 e1 +...+ α m em + α m+1em+1 +...+ α n en
y multiplicando escalarmente por e1 ,...,em llegamos a
α 1 = ... = α m = 0 ⇒ x = α m+1em+1 +...+ α n en
Por tanto
(∀v∈V) (v = (β 1 e1 +...+ β m em )+(β m+1em+1 +...+ β n en) = x 1+x 2) , con x 1∈A y x 2∈A⊥
2) Se deduce inmediatamente de la propiedad anterior.
3) Por definición de subespacio ortogonal.
4) Como B ⊆ A⊥, entonces dim(A)+dim(B) ≤ dim(A)+dim(A⊥) = dim(V).
Ejemplo VI.4.2
Consideremos el subespacio [(1,2,−1)] ⊆ R3 , referido éste a la base canónica.
Definiendo un producto escalar f en R3 por la fórmula
f((x,y,z),(x',y',z')) = xx'+yy'+zz'
el subespacio ortogonal asociado vendrá dado por la condición
A ⊥ = {(x,y,z)∈R 3  f((x,y,z),(1,2,−1)) = 0}
es decir, x+2y−z = 0, resultando ser
x = −2y+z ⇒ [(1,2,−1)]⊥ = [(−2,1,0),(1,0,1)]
Para otro producto escalar g definido por
22
g((x,y,z),(x',y',z')) = xx'+ 2xy'+3xz'+2yx'+yy'−yz'+3zx'−zy'
el subespacio ortogonal asociado al mismo subespacio anterior, vendrá dado por
A ⊥ = {(x,y,z)∈R 3  g((x,y,z),(1,2,−1)) = 0}
es decir, x+4x−3x+2y+2y+y+3z−2z = 0, resultando
z = −2x−5y ⇒
[(1,2,−1)]⊥ = [(1,0,−2),(0,1,−5)]
Vemos que, para un mismo vector el subespacio ortogonal asociado al subespacio
generado por él, es distinto según sea el producto escalar que se defina.
Sea x un vector no nulo y A un subespacio de V. Llamaremos proyección ortogonal de
x sobre A, que denotaremos por prA(x), al vector definido por las condiciones
1) prA(x)∈A
2) (x−prA(x)) ⊥ A
Según esta definición, tenemos que x'∈A es proyección de x sobre A si y sólo si x−x' es
ortogonal a A. Además el vector proyección de x sobre A es único pues si x' y x'' son dos
proyecciones de x sobre A tendremos que x'−x''∈A y además al verificarse que
(∀ v∈ A)(<(x'−x''),v> = <((x−x'')−(x−x')),v> = <(x−x''),v> − <(x−x'),v> = 0)
es x'−x''∈ A⊥, luego, según la propiedad 1) de los subespacios ortogonales:
x'−x'' = 0 ⇒
x' = x''
Si x∈A, entonces prA(x) = x pues prA(x) = x∈A y x−prA(x) = 0 ⊥ A.
En el caso particular de ser A de dimensión 1, es decir, A = [v] tendremos que de
pr v(x)∈[v] ∧ (x−pr v(x)) ⊥ [v]
se deduce
<x,v>
prv(x) = α v ⇒ <(x− α v),v> = 0 ⇒ <x,v>− α <v,v> = 0 ⇒ α = 
<v,v>
luego
<x,v>
prv(x) =  v
<v,v>
que se denomina proyección del vector x sobre el v. Si x ⊥ v , entonces prv(x) = 0.
Ejemplo VI.4.3
Sean en R3 e.v.s. R el vector x = (1,−2,1) y el subespacio
A = [(1,0,2),(−1,−1,1)]
23
Calculemos prA(x)
prA(x)∈A ⇒ prA(x) = α 1(1,0,2)+α 2(−1,−1,1) = (α 1− α 2 ,− α 2 , 2α 1+ α 2)
(x−prA(x)) ⊥ A ⇒
⇒
(x−prA(x)) ⊥ (1,0,2) ∧ (x−prA(x)) ⊥ (−1,−1,1) ⇒
1(1−α 1+ α 2)+0(−2+α 2)+2(1−2α 1− α 2) = 0 
 α 1 = 1/2
 ⇒ 
−1(1−α 1+α 2)+(−1)(−2+α 2)+1(1−2α 1− α 2) = 0 
 α 2 = 1/2
luego prA(x) = (0,−1/2,3/2) . La proyección de x sobre el vector v = (1,2,5) es
1−4+5
prv(x) =  (1,2,5) = (1/15,2/15,5/15)
12+22+52
Ejercicios
VI.21.-En un espacio vectorial euclidiano de dimensión cinco y respecto de una base
ortonormal se consideran los vectores de componentes
a = (1,2,0,−1,0)
b = (0,1,−1,1,0)
c = (0,α 1,α 2,α 3,α 4)
. Descomponer c en suma de dos vectores:
para α1 = , α 2 = , α3 = y α4 =
uno de ellos combinación lineal de a y b, y el otro ortogonal al subespacio [a,b].
VI.22.- En el espacio euclidiano R 4, con el producto escalar ordinario, demostrar que los
vectores v1 = (2,0,−1,−1) y v2 = (2,2,2,2) son ortogonales y hallar otros dos vectores
v3 y v4 que con los anteriores formen un conjunto ortogonal l.i.. Encontrar también un
vector w ortogonal con v 1 , v 2 , y v3 y comprobar que es combinación lineal de v3 y
v4.
VI.23.- Respecto del producto escalar ordinario, ortonormalizar el conjunto que forman los
vectores x = (1,1,0,−1), y = (1,0,0,4) y z = (2,0,1,−1).
VI.24.- En el espacio R4 dotado del producto escalar ordinario, se considera el subespacio
vectorial H engendrado por los vectores v 1 = (1,1,0,0) y v 2 = (0,1,−1,1). Determinar
una base ortonormal de H y completarla hasta obtener una base de R4.
VI.25.- Sea R3 con el producto escalar ordinario. Se pide
a) Averiguar si los vectores v 1 = (1,1,1), v 2 = (1,2,− 3) y v 3 = (5,−4,−1) son
ortogonales. A partir de ellos, hallar una base ortonormal de R3.
b) Hallar los vectores normalizados que son ortogonales a los vectores v 1 −v 2 y
v1+ v3.
c) Hallar los vectores ortogonales a 2v2+v3 y que pertenezcan al subespacio vectorial
engendrado por v1−v2 y v1+v3.
VI.26.- Sea F = {x∈R 4  x 1+x 2 = x3+x4 ; 2x 1−x 2 = x3} un subespacio vectorial de R4 sobre
24
R con el producto escalar ordinario. Se pide
a) Hallar la dimensión y una base de F.
b) Descomponer el vector (1,−1,0,3) en un vector de F y otro de F ⊥.
c) Hallar una base ortonormal de R4, (a, b, c, d) tal que b, y c pertenezcan a F.
VI.27.-En R3 se define el producto escalar
<(x 1 ,x 3 ,x 3 ),(y 1 ,y 2 ,y 3 )> = 4x 1 y 1 +x 2 y 2 +x 2 y 3 +x 3 y 2 +4x 3 y 3
y se considera el subespacio [(1,α1,α2),(1,α3,α4)] para α 1 =
α4 = . Calcular:
, α2 =
, α3 =
y
a) su expresión matricial respecto de la base canónica y la expresión matricial de la
restricción del producto escalar a V en la base ((1,–1,1),(1,1,1)),
b) una base ortonormal de V.
VI.28.- Sea (e1,e2,e3) una base de E, espacio vectorial sobre R, que verifica
 e 1  = 3 ,  e 2  = 2 ,  e 3  = 1 , <e 1,e 2> = 2 , <e 2,e 3> = 0 , <e 1,e 3> = 1
a) Hallar la expresión matricial del producto escalar respecto de la base (e 1,e 2,e 3) y de
la base (e 1,e 1+e 2,e 1+e 2+e 3).
b) Calcular la norma del vector v = 2e1+e2–3e3.
c) Calcular el ángulo que forman los vectores u1 = e1–e2 y u2 = 2e2–e3.
d) Hallar una base ortonormal del subespacio [u1,u2].
VI.29.- Sea f una forma bilineal sobre R3 de matriz respecto de la base canónica
a) Comprobar que f es un producto escalar.
4
0
–1
0 –1
3 0 .
0 4
b) Si F = {(x,y,z)∈R3 | x–y+z = 0 , y+z = 0}, hallar F⊥.
c) Hallar una base ortonormal de R3 respecto de este producto escalar.
VI.30.- Sobre el espacio vectorial de las funciones continuas en el intervalo [−1,1] se define el
siguiente producto escalar:
1
x 2f(x)g(x) dx
<f,g> =
–1
Aplicando el método de ortogonalización de Gram-Schmidt al conjunto de polinomios
{1,x,x2} hallar una base ortonormal para el espacio de polinomios R2[x].
25
VI.31.- En el espacio vectorial de los polinomios de grado menor o igual que dos R2(x) se
1
P(x)Q(x) dx. Se pide
define el producto escalar <P(x),Q(x)> =
–1
a) Hallar su expresión matricial respecto de la base (1,x,x2) y también respecto de la
base (1–x,x+x2,2x–x 2).
b) Hallar una base ortonormal de R2(x) respecto de este producto escalar.
VI.32.-En el espacio vectorial R4, hallar las ecuaciones de la proyección ortogonal sobre el
subespacio engendrado por los vectores (0,α1,α2,1) y ( α 3,α 4,−1,0), para α 1 =
,
α2 = , α3 = y α4 =
.
VI.5.- ANGULO DE DOS VECTORES
Sean dos vectores no nulos x,y∈V; de acuerdo con la desigualdad de Schwartz (que figura
en la Tabla VI.3.1), se verifica que
<x,y>≤  x · y 
cumpliéndose la igualdad cuando {x,y} es l.d., con lo que
<x,y>
−1 ≤  ≤ 1
x · y 
por lo que tiene sentido el llamar ángulo no orientado formado por los vectores x e y, que
representaremos por ∠(x,y), al único número real del intervalo [0,π ] cuyo coseno es
<x,y>
cos ∠(x,y) = 
x · y 
Propiedades interesantes que se deducen de esta definición se enuncian en la Tabla VI.5.1
TABLA VI.5.1
________________________________________________
Propiedades del ángulo no orientado
1) ∠(x,y) = ∠(y,x)
 ∠(x,y)
si α > 0
2) ∠(α x,y) = 
 π −∠(x,y) si α < 0
3) ∠(x,y) = 0
equivale a y = αx , con α > 0
26
∠(x,y) = π
equivale a y = αx , con α < 0
∠(x,y) = π/2 equivale a x ⊥ y
4) <x,y> =  x · y ·cos ∠(x,y)
5) pr y (x)  =  x ·cos ∠(x,y)
6) x ⊥ y equivale a prx(x+y) = x
________________________________________________
Demostraciones:
1) Directamente de la definición de producto escalar
<x,y>
<y,x>
cos ∠(x,y) =  =  = cos ∠(y,x) ⇒ ∠(x,y) = ∠(y,x)
x · y  y · x 
2) Por las propiedades del producto escalar y de la norma tenemos
<αx,y>
α <x,y>
cos ∠(αx,y) =  = 
 α x · y 
α ·x · y 
si α > 0, es igual a
<x,y>
 = cos ∠(x,y) ⇒ ∠(α x,y) = ∠(x,y)
x · y 
y si α < 0, es igual a
<x,y>
−  = − cos ∠(x,y) ⇒ ∠(α x,y) = π −∠(x,y)
x · y 
3) Usando la desigualdad de Schwartz, podemos escribir
<x,y>
∠(x,y) = 0 ⇔  = 1 ⇔
x · y 
⇔
<x,y> =  x ·  y  ∧ {x,y} l.d. ⇔
<x,y> > 0 ∧ y = α x ⇒ <αx,x> > 0 ⇒ α<x,x> > 0 ⇒ α > 0
y análogamente para los otros casos.
4) Se obtiene inmediatamente de la definición de ángulo. Esta propiedad se utiliza en
matemática elemental para definir el producto escalar.
5) De acuerdo con el resultado obtenido para la proyección de un vector sobre otro tenemos:
  <x,y>

<x,y>
<x,y>
<x,y>
27
 pr y (x)  =    y   =  y  =   y  =  =
  <y,y>  
<y,y>
 y 2
y 
<x,y>
= x   = x ·cos ∠ (x,y)
x · y 
6) Si x e y son ortogonales entonces
<x+y,x>
prx(x+y) = x ⇔  x = x ⇔ <x+y,x> = <x,x> ⇔ <x,y> = 0 ⇒ x ⊥ y
<x,x>
Ejercicios
VI.33.- Sea f : R2×R2
R definida por f(x,y) = 2x1y1+x1y2+x2y1+x2y2. Se pide
a) ¿Es un producto escalar en R2 ?.
b) Hallar <x,y>, <x,x>, <y,y> siendo x = (2,−2) y = (4,−3).
c) Comprobar que <x,y> 2 ≤ <x,x>·<y,y>.
d) Comprobar
<x+y,x+y> ≤ <x,x> + <y,y> .
e) Si x = (2,−2) ¿cuál debe ser el vector y para que las desigualdades de los apartados
c) y d) se conviertan en igualdades?.
f) Deducir de la expresión establecida en el apartado c) que −1 ≤ cos (x,y) ≤ 1.
Indicar en que casos el coseno de dos vectores es igual a −1, 0, y 1.
g) Dado x = (2,−2), hallar los vectores normalizados que le son ortogonales.
h) Indicar si la base canónica de R2 es ortonormal para este producto escalar.
VI.34.-Calcular los ángulos y las normas de los vectores que determinan los lados del
triángulo de vértices (1, α 1 ), (3,1) y (1, α2). Lo mismo para el triángulo de vértices
(1,–4,α 3)), (–2,1,α 4) y (5,1,3), para α 1 =
, α2 =
, α3 =
, α4 =
.
VI.6.- FORMAS n–LINEALES Y DETERMINANTES
Sea V e.v.s. K, de característica distinta de 2; una forma n-lineal es una aplicación
f:
Vn
(x 1 ,...,x n )
K
f(x 1 ,...,x n )
tal que sea lineal respecto de todos los vectores componentes de la n-pla, es decir, para todo
subíndice 1 ≤ i ≤ n
28
f(x 1 ,..., α x i ,...,x n ) = α f(x 1 ,...,x i ,...,x n )
∧
f(x 1 ,...,x i + x i' ,...,x n ) = f(x 1 ,...,x i ,...,x n )+ f(x 1 ,...,x'i ,...,x n ) )
Supongamos que V es de dimensión n y (e1 ,...,en) es una base de V; si los vectores xi son
x 1 = x 11 e1 +...+x n1 en
. . . . . . . . . .
x n = x 1n e1 +...+x nn en
aplicando las igualdades que definen a la forma n-lineal es fácil obtener, por inducción, que
∑
f(x 1 ,...,x n ) =
x i 1 1 ...x i n n f(e i 1 ,...,e i n )
1 ≤ i1 ≤ n
. . . .
1 ≤ in ≤ n
Una forma n-lineal es alternada si y sólo si para cualesquiera 1 ≤ i,j ≤ n, i ≠ j se verifica
f(x 1 ,...,x i ,...,x j ,...,x n ) = − f(x 1 ,...,x j ,...,x i ,...,x n )
es decir, es una forma n-lineal tal que aplicada a dos n-plas que se diferencien en una
permutación de un par de vectores, cambia de signo. Las propiedades más interesantes de las
formas n-lineales alternadas se exponen en la Tabla VI.6.1
TABLA VI.6.1
_____________________________________________________________________
Propiedades de las formas n-lineales alternadas
1) Si (i1,...,in) es una permutación de (1,...,n) de signatura s(i)
f(xi 1 ,...,x in) = s(i) f(x1 ,...,x n)
2) f alternada equivale a que (∀i∈[1,n]) (f(x 1,...,x i,...,x i,...,x n) = 0)
3) Si (e1 ,...,en) es una base de V, entonces
f(x 1 ,...,x n ) = (
∑
s(i) x i1 1 ...x in n ) f(e 1 ,...,e n )
(i1,..,i n) permutación de
(1,..,n) de signatura s(i)
4) (e1 ,...,en) base de V
f(e1 ,...,en) = 0

 implican f = 0

5) Si f no es la aplicación nula, entonces f(x1,...,xn) = 0 equivale a {x1,...,xn} l.d.
_____________________________________________________________________
29
Demostraciones:
1) Es inmediata teniendo en cuenta que cada inversión de dos vectores cambia el signo de la
imagen, luego si la permutación (i1,...,in) tiene σ inversiones
σ
f(xi 1 ,...,x in) = (−1) f(x1 ,...,x n) = s(i) f(x1 ,...,x n)
2) Si f es alternada la imagen de cualquier n-pla con dos vectores iguales es 0, ya que si f es
alternada
f(x 1 ,...,x i ,...,x j ,...,x n ) = − f(x 1 ,...,x j ,...,x i ,...,x n )
y si xi = xj , entonces
f(x 1 ,...,x i ,...,x i ,...,x n ) = − f(x 1 ,...,x i ,...,x i ,...,x n )
por lo que f(x 1 ,...,x i,...,x i,...,x n ) = 0.
Recíprocamente, si la imagen de cualquier n-pla con dos vectores iguales es 0, entonces la
forma es alternada
0 = f(x 1 ,...,x i +x j ,...,x j +x i ,...,x n ) =
= f(x 1 ,...,x i ,...,x j ,...,x n )+f(x 1 ,...,x i ,...,x i ,...,x n ) +
+f(x 1 ,...,x j ,...,x j ,...,x n )+f(x 1 ,...,x j ,...,x i ,...,x n ) =
= f(x 1 ,...,x i ,...,x j ,...,x n )+f(x 1 ,...,x j ,...,x i ,...,x n ) ⇒
⇒
f(x 1 ,...,x j ,...,x i ,...,x n ) = −f(x 1 ,...,x i ,...,x j ,...,x n )
3) La expresión general de la imagen de una n-pla en una forma n-lineal, conocidas las
componentes de los vectores, que hemos obtenido antes, es una suma de nn sumandos, cada
uno de ellos formado por un producto de las componentes por la imagen de una n-pla
formada por vectores de la base; en el caso de forma alternada, si en ella existen dos vectores
iguales la imagen es 0, el sumando es 0, quedando n! sumandos no nulos correspondientes a
las n! permutaciones sin repetición de los vectores (e1 ,...,en). El resultado es una suma de n!
sumandos
f(x1 ,...,x n) =
∑
x i 1 1 ...x i n n f(e i 1 ,...,e i n )
(i1,...,i n) permutación de (1,...,n)
extendida a todas las permutaciones de {1,...,n}. Además, según la propiedad 1), tendremos
f(e i1 ,...,e in) = s(i) f(e1,...,e n)
luego
f(x1 ,...,x n) =
∑
s(i) x i 1 1 ...x i n n f(e 1 ,...,e n )
(i1,...,i n) permutación de
(1,...,n) de signatura s(i)
4) A partir de 3), pues si f(e1 ,...,en) = 0, entonces la imagen de cualquier n-pla es 0.
5) Supongamos que f no es la aplicación nula y que
30
f(x 1 ,...,x n ) = 0
Si {x1,...,xn} l.i., entonces (x1,...,xn) es una base de V y según la propiedad anterior f sería
la aplicación nula. Recíprocamente, si {x 1 ,...,x n } l.d. existe un vector x i que será
combinación lineal de los demás
x i = α 1 x 1 +...+ α i-1 x i-1 + α i+1 x i+1 +...+ α n x n
y al ser f n-lineal alternada, tendremos
f(x 1 ,...,x i,...,x n ) = f(x 1 ,..., α 1 x 1 +...+ α i-1 x i-1 + α i+1 x i+1 +...+ α n x n ,...,x n ) =
= α 1 f(x 1 ,...,x 1 ,...,x n )+...+ α i-1 f(x 1 ,...,x i-1 ,x i-1 ,...,x n )
+α i+1 f(x 1 ,...,x i+1 ,x i+1 ,...,x n )+...+ α n f(x 1 ,...,x n ,...,x n ) = 0
Ejemplo VI.6.1
En el espacio vectorial K3 sobre K referido a una base (e1 ,e2 ,e3) sean los vectores
x 1 = x 11 e1 +x 21 e2 +x 31 e3
x 2 = x 12 e1 +x 22 e2 +x 32 e3
x 3 = x 13 e1 +x 23 e2 +x 33 e3
La imagen de la terna (x1,x2,x3) por una forma n-lineal alternada f sobre K3, referida a
la base dada, teniendo en cuenta que las permutaciones de {1,2,3} son
Permutación Inversiones Signatura
1,2,3
0
+1
1,3,2
1
−1
2,1,3
1
−1
2,3,1
2
+1
3,1,2
2
+1
3,2,1
3
−1
será
f(x 1 ,x 2 ,x 3 ) = (+1)x 11 x 22 x 33 f(e1 ,e2 ,e3)+(−1)x 11x 32x 23 f(e1 ,e2 ,e3)+
+(−1)x21x12x33 f(e1 ,e2 ,e3)+(+1)x 21x 32x 13 f(e1 ,e2 ,e3)+
+(+1)x31x12x23 f(e1 ,e2 ,e3)+(−1)x 31x 22x 13 f(e1 ,e2 ,e3) =
= (x 11 x 22 x 33 −x 11 x 32 x 23 −x 21 x 12 x 33 +x 21 x 32 x 13 +x 31 x 12 x 23 −x 31 x 22 x 13 )f(e1 ,e2 ,e3)
Consideremos la forma n-lineal alternada sobre V tal que la imagen de la n-pla de la base
(e1 ,...,en) es igual a 1. Esta forma la denominaremos determinante en la base (e1 ,...,en) y la
denotaremos por el símbolo det, es decir,
det(e1 ,...,en) = 1
31
Llamaremos determinante de n vectores x 1 ,...,x n ∈V, referido a la base (e1 ,...,en) a la
imagen de la n-pla (x1,...,xn) por la forma determinante, que será igual a
det(x 1 ,...,x n ) =
∑
(i1 ,..,in ) permutación de
(1,..,n) de signatura s(i)
s(i) xi11...x i n n
Ejemplo VI.6.2
En el espacio vectorial K3 sobre K referido a una base (e1 ,e2 ,e3) para los vectores
x 1 = x 11 e1 +x 21 e2 +x 31 e3
x 2 = x 12 e1 +x 22 e2 +x 32 e3
x 3 = x 13 e1 +x 23 e2 +x 33 e3
tendremos que, según el ejemplo anterior
det(x 1 ,x 2 ,x 3 ) = (x 11 x 22 x 33 −x 11 x 32 x 23 −x 21 x 12 x 33 +x 21 x 32 x 13 +x 31 x 12 x 23 −x 31 x 22 x 13 )
y así, para R3 referido a la base canónica tendremos, por ejemplo, que
det((1,−1,0),(2,3,5),(−2,4,−4)) =
= 1⋅3⋅(−4)+(−1)⋅5⋅(−2)+0⋅2⋅4−1⋅5⋅4−(−1)⋅2⋅(−4)−0⋅3⋅(−2) = −3 0
Llamaremos determinante de una matriz cuadrada A sobre K al determinante de los
vectores columna a1,a2,..,an, como vectores de K n, e.v.s. K, referido a la base canónica; lo
notaremos por det(A) o bien por Ay, en el caso de que la matriz esté explícitamente dada, por
a11 a 12 . . a 1n
a21 a 22 . . a 2n
.........
an1 a n2 . . a nn
con lo que
a11
a21
det(a 1 ,...,a n ) =
..
an1
a12 . . a1n
a22 . . a2n
=
∑ s(i) ai11...ainn
.......
(i1 ,..,in ) permutación de
(1,..,n) de signaturas(i)
an2 . . ann
y el determinante de una matriz cuadrada es igual a la suma de los n! productos que pueden
formarse con n elementos de la matriz tomando, de todas las maneras posibles, uno de cada fila y
uno de cada columna; cada sumando tiene un signo igual a s(i), signatura de la permutación de
subíndices de fila, supuestos ordenados los factores por los subíndices de columna.
Ejemplo VI.6.3
32
El determinante de una matriz de orden 1 será igual al único elemento que la forma
a11 = a11
Para el determinante de una matriz cuadrada de orden 2 tendremos
a 11 a 12
= +a11a22−a21a12
a 21 a 22
es decir, producto de los elementos de la que llamaremos diagonal principal, menos el
producto de los elementos de la diagonal secundaria. Para una matriz de orden tres es
a 11 a 12 a 13
a 21 a 22 a 23 = a11a22a33+a21a32a13+a31a12a23−a11a32a23−a21a12a33−a31a22a13
a 31 a 32 a 33
por tanto la suma de los productos de los elementos de la diagonal principal y sus dos
paralelas, menos la suma de los productos de los elementos de la diagonal secundaria y
sus dos paralelas. Esta regla práctica de obtención de los determinantes de las matrices
cuadradas de órdenes 2 y 3 se denomina regla de Sarrus. Para matrices de orden
superior a tres el cálculo de su determinante a partir de la definición es muy poco
práctico, excepto en los casos particulares siguientes:
Matriz diagonal
a11 0 . . 0
0 a22 . . 0
= a11a22...ann
.........
0 0 . . ann
dado que el único sumando no nulo se obtiene con el elemento a11 de la primera
fila, acompañado del elemento a22 de la segunda,..., y del elemento ann de la
última fila. En particular, para la matriz unidad I será det(I) = 1.
Matrices triangulares
a11
a21
...
an1
0 .. 0
a11 a12 . . a1n
a22 . . 0
0 a22 . . a2n
=
= a11a22...ann
......
..........
an2 . . ann
0 0 . . ann
dado que el único sumando no nulo se obtiene con el elemento a11 de la primera
fila, acompañado del elemento a 22 de la segunda, ya que no puede formar
producto con el a21 por ser de su misma columna,.. y del elemento ann de la última
fila. Análogamente
33
0
0 . . a1n
............
= (–1)n(n-1)/2a1n...an-12 an1
0 an-1 2 . . an-1n
an1 an2 . . ann
dado que el único sumando distinto de 0 tiene como permutación de subíndices de
fila la (n,n−1,...,1) que tiene n(n−1)/2 inversiones.
Podríamos haber definido como determinante de una matriz cuadrada el determinante de sus
vectores fila, aunque de hecho es lo mismo puesto que los determinantes de una matriz y su
matriz transpuesta son iguales
det(A) = det(At)
En efecto, si a los elementos de A les llamamos aij y a'ij a los de At, tenemos que por definición
de matriz transpuesta,
aji = aij'
luego según la definición de determinante y la conmutatividad del producto en K, reordenando los
factores según el subíndice de fila, es decir, componiendo con la permutación inversa i -1
det(A) =
∑
=
∑
∑
s(i) ai11...a inn =
(i1 ,..,in ) permutación de
(1,..,n) de signaturas(i)
s(i) a1i -1...a ni -1 =
(i1 ,..,in ) permutación de
(1,..,n) de signaturas(i)
1
n
-1
t
s(i ) ai -1 1...a i -1 n = det(A )
1
n
(i1-1 ,..,in-1) permutación de
(1,..,n) designaturas(i -1)
dado que, una permutación y su inversa tienen la misma signatura.
A partir de esta propiedad, cualquier resultado cierto para el determinante de los vectores
columna de una matriz será válido para el determinante de los vectores fila, por lo que en las
siguientes propiedades de los determinantes se hablará de líneas, refiriéndose tanto a columnas
como a filas. Estas propiedades se enuncian en la Tabla VI.6.2
TABLA VI.6.2
________________________________________________________________
Propiedades de los determinantes
1) det(A) ≠ 0 equivale a que A es regular
2) Un determinante con dos líneas paralelas iguales es 0
34
3) Un determinante con dos líneas paralelas proporcionales es 0
4) Un determinante con los elementos de una línea nulos es 0
5) det(x 1 ,...,x i+x',...,x
i
n ) = det(x 1 ,...,x i ,...,x n )+det(x 1 ,...,x',..,.x
i
n)
6) det(x 1 ,..., α x i,...,x n ) = α det(x 1 ,...,x i,...,x n )
7) Si en un determinante se permutan dos líneas paralelas, el determinante
cambia de signo
8) Si a una línea se le suma otra paralela multiplicada por un escalar no nulo,
el determinante no varía.
9) Si A y B son matrices cuadradas, entonces
det(A·B) = det(B)⋅det(A)
10) Si A es inversible, entonces det(A-1) = 1/det(A).
________________________________________________________________
Demostraciones:
1) Por propiedades de las formas n-lineales alternadas: la imagen de una n-pla de vectores
l.d. es igual a 0 y recíprocamente, si la forma n-lineal no es la forma nula ( y det no lo es) si la
imagen de una n-pla es 0, entonces los vectores forman un conjunto l.d..
Las propiedades 2) a 7) son consecuencia de 1) y de que el determinante es una forma nlineal alternada, por lo que el determinante conserva la suma y el producto externo respecto de
cualquier elemento de la n-pla (propiedades 5) y 6)) y que la imagen cambia de signo si
intercambiamos dos vectores (propiedad 7)).
8) Razonando con los vectores columna, p.ej., tendremos, según las propiedades anteriores
det(x 1 ,...,x i + α x j ,...,x j ,...,x n ) = det(x 1 ,...,x i ,...,x j ,...,x n )+det(x 1 ,..., α x j ,...,x j ,...,x n ) =
= det(x 1 ,...,x i,...,x n )
9) En efecto, de acuerdo con el resultado de un producto de matrices
a11b11+a 12b 21+..+a 1nbn1 a 11b12+a 12b 22+..+a 1nbn2 . . a 11b1p+a 12b 2p+..+a 1n b np
AB =
a21b11+a 22b 21+..+a 2nbn1 a 21b12+a 22b 22+..+a 2nbn2 . . a 21b1p+a 22b 2p+..+a 2n b np
........................................................
am1b11+a m2b 21+..+a mnbn1 a m1b12+a m2b 22+..+a mnb n2 . . a m1b1p+a m2b 2p+..+a mn b np
tenemos que los vectores fila p1,...,pn de AB son combinaciones de los vectores fila b 1 ,...,b n
de B, ya que para i = 1,...,n es
p i = a i1 b 1 +a i2 b 2 +...+a inb n
35
Como el determinante de una matriz cuadrada es el determinante de sus vectores fila, de acuerdo
con las propiedades de las formas n-lineales alternadas, tenemos
det(AB) = det(p 1,...,p n) = (
∑
s(i) a i11 ...a inn ) det(b 1 ,...,b n ) = det(A)⋅det(B)
(i1,..,in) permutación de
(1,..,n) de signatura s(i)
10) Como por definición de matriz inversa es A ⋅A -1 = I, teniendo en cuenta la propiedad
anterior y que el determinante de la matriz unidad es 1, tendremos
det(A⋅A-1) = 1 ⇒ det(A)⋅det(A-1) = 1 ⇒ det(A-1) = 1/det(A)
Como consecuencia inmediata de estas propiedades se deduce que las transformaciones
elementales aplicadas a la matriz de un determinante la convierten en otra, cuyo determinante
respecto al primero
a) cambia de signo si se permutan dos filas (o dos columnas),
b) si se multiplica una fila (o una columna) por un escalar no nulo, el determinante queda
multiplicado por el escalar,
c) no varía si se suma una fila (o columna) otra fila (o columna) multiplicada por un escalar
no nulo.
Estas propiedades nos permiten construir un método para el cálculo de un determinante
consistente en aplicar sucesivas transformaciones elementales sobre su matriz hasta reducirla a
una matriz triangular, cuyo determinante se calcula de forma inmediata. Se denomina método de
Gauss, es de rápida aplicación y fácilmente programable.
Ejemplo VI.6.4
El método de Gauss permite obtener el valor del siguiente determinante
0 0 1 2 2
2 1 3 4 2
2 1 3 4 2
0 0 1 2 2
–1
3 –1 1 5 3 = − 3 –1 1 5 3 =
2
–2 –5 –1 3 –5
–2 –5 –1 3 –5
4 3 2 –1 –4
4 3 2 –1 –4
2
0
1
= 0
2
0
0
3 1 4 2
2
1 0 2 2
0
1
0 –5 12 14 =
0
2·5·5
0 –4 3 –7
0
0 1 –1 0
0
2 1 3 4 2
2 3 1 4 2
0 0 1 2 2
0 1 0 2 2
1
0 –5 –7 –2 0 =
0 –7 –5 –2 0 =
2
0 –4 2 7 –3
0 2 –4 7 –3
0 1 –4 –9 –8
0 –4 1 –9 –8
3 1
4
2
2
1 0
2
2
0
1
0 –5 12 14 =
0
2·5·5·33
0 0 –33 –91
0
0 0
7 14
0
3 1 4
2
1 0 2
2
0 –5 12
14 = −35
0 0 –33 –91
0 0 0 –175
36
Si en una matriz cuadrada A de orden n se suprimen n−h filas e igual número de columnas se
obtiene una matriz de orden h cuyo determinante llamaremos menor de A. Para determinarlo
basta conocer los subíndices 1 ≤ c1 <...< ch ≤ n de las columnas y los subíndices 1 ≤ f1 <...< fh
≤ n de las filas que lo forman. Si en la matriz A suprimimos las columnas c 1,...,c h, y las filas
f 1 ,...,f h se obtiene otra matriz cuadrada cuyo determinante se denomina menor
complementario del anterior. Un menor se dice que es de clase par cuando la suma de los
subíndices de las columnas y filas que lo forman
σ = c 1+..+c p+f1+..+fp
es par, y análogamente se define la clase impar. Llamaremos signatura del menor a (−1)σ, es
decir, al resultado de elevar −1 a la suma de los índices de sus filas y de sus columnas, por lo que
la signatura de un menor de clase par es 1 y −1 si es de clase impar. La signatura de un menor y
la de su menor complementario es la misma, pues la suma de los subíndices de fila más los de
columna de un menor más los subíndices de fila y columna de su menor complementario es igual
a la suma de todos los subíndices de fila y columna de la matriz, es decir 2(1+2+...+n), que es
un número par. Llamaremos adjunto del menor a su signatura por su menor complementario.
Ejemplo VI.6.5
En la matriz
2
3
A= 4
5
1
0
1
2
3
3
1 2 7
0 –1 9
0 0 6
–1 0 1
5 2 8
los subíndices f1 = 1, f2 = 2, c1 = 2, c2 = 4 determinan el menor
0 2
1 –1
cuya signatura es (−1) 1+2+2+4 = −1, siendo, por tanto, de clase impar. Su menor
complementario se obtiene suprimiento las filas 1ª y 2ª y las columnas 2ª y 4ª
4 0
5 –1
1 5
6
1
8
y su adjunto es, por tanto
4 0
– 5 –1
1 5
6
1
8
37
Si elegimos como menor de orden 1 y formado por el elemento que está en la 2ª fila y 5ª
columna, | 9 |, tenemos
2
4
menor complementario:
5
1
0 1
2 0
3 –1
3 5
2
0
2+5
, signatura: (–1) , adjunto = –
0
2
2
4
5
1
0 1
2 0
3 –1
3 5
2
0
0
2
En general, la signatura del menor de orden 1 formado por el elemento aij es (−1)i+j, luego las
signaturas de estos menores de orden 1, según la posición que ocupan en la matriz, vendrán
dadas por
+ – + –. . .
– + – +...
+ – + –. . .
– + – +...
..........
. . . . . . . . .+
Estos conceptos nos permiten construir otro procedimiento para el cálculo de un determinante;
se denomina regla de Laplace y se basa en el siguiente teorema:
"Todo determinante es igual a la suma de los productos de todos los menores de orden h,
que se pueden formar con h líneas paralelas fijas, por sus adjuntos repectivos"
En efecto, demostraremos previamente que si multiplicamos un menor por su adjunto, el
producto forma parte del desarrollo del determinante. Sea el determinante de orden n
a11 . . a 1h a 1h+1 . . a 1n
.....................
ah1 . . a hh a hh+1 . . a h n
D=
a h+11 . . a h+1h a h+1h+1 . . a h+1n
.....................
an1 . . a nh a nh+1 . . a n n
y supongamos el menor M formado por las h primeras filas y las h primeras columnas, cuya
signatura será (−1)2(1+...+h) = +1, por lo que su adjunto es igual a su menor complementario M'.
Un término cualquiera del producto de ambos tiene la forma
(–1)σa i11 ... a ihh · (–1)σ 'a ih+1h+1 ... a inn
siendo σ el número de inversiones de la permutación de filas (i1 ,...,ih ) del menor M y σ ' el
38
número de inversiones de la permutación de filas (ih+1 ,...,in ) del menor M'. El número de
inversiones de la permutación (i1,...,ih,ih+1,...,in) es σ+σ', ya que (i1,...,ih) es una permutación
de (1,...,h) y (ih+1,...,in) es una permutación de (h+1,...,n), por lo que el producto anterior
(–1) σ+σ 'a i 1 1 ...a i h h ·aih+1 h ...a inn
es un término del desarrollo del determinante D, es decir
D = M·M'+...
Si el menor M estuviera formado, en general, por las filas f 1 ,...,f h y las columnas c 1 ,...,c h ,
podemos reducirlo al caso anterior llevando la fila f1 al primer lugar,..., la fila fh al lugar h, la
columna c 1 a la primera,... y la columna ch al lugar h, para lo cual habremos realizado los
siguientes cambios de línea
(f1−1)+...+(fh−h)+(c 1−1)+...+(c h−h) = (f1+...+fh)+(c 1+...+c h)−2(1+...+h)
La relación entre D y el nuevo determinante obtenido D' es
D = (–1)(f1+...+fh)+(c1+...+ch)+2D'
Aplicando el resultado anterior a D' tendremos
D = (–1)(f1+...+fh)+(c1+...+ch)+2MM '+... = (–1)(f1+...+fh)+(c1+...+ch)M M '+...
y teniendo en cuenta que el adjunto de M es
(–1)(f1+...+fh)+(c1+...+ch)M '
resulta que, efectivamente, el producto de cualquier menor por su adjunto forma parte del
n
desarrollo del determinante D. Si sumamos los productos de los h distintos menores que
pueden formarse con las h líneas paralelas fijas por sus adjuntos, el número total de sumandos es
n
h! (n–h)! = n!
h
siendo todos ellos distintos al estar formados por distintos elementos de la matriz de D; por tanto,
obtenemos así todos los términos del desarrollo del determinante D.
Ejemplo VI.6.6
Apliquemos la regla de Laplace para desarrollar el determinante del ejemplo VII.5.3
39
0 0 1 2 2
2 1 3 4 2
3 –1 1 5 3
–2 –5 –1 3 –5
4 3 2 –1 –4
utilizando los menores que pueden formarse con las columnas 3ª y 5ª. El determinante
será igual a
(–1)
11
1
3
3 –1 5
2
1
–2 –5 3 + (–1)12
2
1
4 3 –1
2 1 4
2 1 4
2
13 1 2
–2 –5 3 + (–1)
3 –1 5 +
3
–1 –5
4 3 –1
4 3 –1
+ (–1)
14
1 2
2 –4
2 1
3 –1
–2 –5
4
3
5 + (–1)13
1
3
+ (–1)
15
3 2
2 –4
0 0
3 –1
–2 –5
2
0
15 1 3
5 + (–1)
2
–1 –5
3
4
+ (–1)
17
0 0
–1 –5
2 1
2 –4
3 –1
0 0 2
0 0 2
2
14 3 2
–2 –5 3 + (–1)
3 –1 5 +
3
–1 –5
4 3 –1
4 3 –1
0 2
0 0
16 1 3
1 4 + (–1)
2 1
2 –4
3 –1
–2 –5
2
4 +
3
2
4 = –(–4)·48+1·58–(–3)·47+(–8)·(–43)–7·28+(–13)·26–
5
–(–16)·(–34)–(–2)·4+(–10)·(–16)–14·(–10) = –35
Si aplicamos la regla de Laplace con h = 1, es decir, fijando tan solo una línea, el determinante
es igual a la suma de los productos obtenidos multiplicando todos los elementos de ésta por sus
adjuntos respectivos. Así, el determinante de orden n lo reducimos al cálculo de n determinantes
de orden n−1; si elegimos una línea con elementos iguales a 0, el número de determinantes a
calcular es menor; si hacemos transformaciones elementales previas para conseguir que los
elementos de una línea sean nulos, excepto uno de ellos, el determinante de orden n se reduce a
un determinante de orden n−1 y, reiterando el proceso, podemos llegar hasta un determinante de
orden 3 o de orden 2 y aplicar la regla de Sarrus.
Ejemplo VI.6.7
Este proceso aplicado al determinante del ejemplo anterior es:
40
0 0 1 2 2
0 0 1 0 0
2 1 –2 –4
2 1 –2 –4
2 1 3 4 2
2 1 3 –2 –4
3 –1 3 1
5 0 1 –3
=
3 –1 1 5 3 = 3 –1 1 3 1 =
=
–2 –5 5 –3
8 0 –5 –23
–2 –5 –1 3 –5
–2 –5 –1 5 –3
4 3 –5 –8
–2 0 1 4
4 3 2 –1 –4
4 3 2 –5 –8
5 1 –3
5
= – 8 –5 –23 = – 33
–2 1 4
–7
1 –3
33 –38
0 –38 =
= –35
–7 7
0 7
Si la suma de los productos de los elementos de una línea por sus adjuntos es igual al
determinante, la suma de los productos de los elementos de una línea por los adjuntos de una
paralela, vale cero; en efecto, si en el determinante
a 11 . . a 1i . . a 1j . . a 1n
a 21 . . a 2i . . a 2j . . a 2n
................
a n1 . . a ni . . a nj . . a nn
formamos la suma de los productos de los elementos de la columna i por los adjuntos de los
elementos de la columna j
a 1iA 1j+a 2iA 2j+...+a niA nj
el resultado es igual al determinante
a 11 . . a 1i . . a 1i . . a 1n
a 21 . . a 2i . . a 2i . . a 2n
................
a n1 . . a ni . . a ni . . a nn
que es 0 por tener dos columnas iguales.
Ejercicios
VI.35.-Calcular los siguientes determinantes:
1
5
5
3
4
0
2
1
8 12
1 2
1 2
4 3
1 3 5 7
3 6 9 12
5 10 15 20
7 14 21 28
9 18 27 36
9
15
25
35
45
41
VI.36.-Desarrollar los determinantes
5 7 6 8 5
3 α1 4 6 4
2 3 α2 4
3
1 2
0 α3 2
2 4
2
(para α1 =
1 1
1 2
1 4
1 8
1 16
4 α4
, α2 =
, α3 =
1 1 1
3 4 5
9 16 25
27 64 125
81 256 625
y α4 =
1
a
a
2
1
b
1
c
1
d
b2 c2 d2
a3 b 3 c 3 d 3
)
1 1
1 1
1 2+a 1 1
1 1 2+a 1
1 1 1 2+a
a–b–c 2a
2a
2b b–c–a 2b
2c
2c c–a–b
VI.37.-Calcular
2
1
0
0
0
0
0
1
1
.
1
2 0 0 0 0
4 –1 0 0 0
3 2 1 0 0
0 1 3 –2 0
0 0 2 1 2
0 0 0 3 1
1 1
0 1
1 0
.....
1 1
..
..
..
..
..
1
1
1
.
0
1 1 1
–1 0 1
–1 –1 0
.......
–1 –1 –1
1
n
n
.
n
n n
2 n
n 3
.....
n n
a
x
x
b
b
x
x
a
..
..
..
..
..
n
n
n
.
n
..
..
..
...
..
1
1
1
.
0
0 1 1
–1 0 1
–1 –1 0
........
–1 –1 –1
a0
–1
0
..
0
0
a1
x
–1
...
0
0
VI.38.- Demostrar que
x
a
b
x
VI.39.- Calcular
x
b
2
2
2
= (b–a) (a+b) –4x
a
x
a2
0
x
...
0
0
..
..
..
..
..
. . an -1
..
0
..
0
.......
..
x
. . –1
1
1
1
..
0
an
0
0
..
0
x
42
p+q q
q p+q
......
q
q
q
q
...
q
..
..
...
..
q
q
..
p+q
1
x
x
x2 x3
siendo n el orden del determinante
VI.40.- Resolver en R, las ecuaciones
1+x 1 1 1
1 1–x 1 1
1
1 1+x 1
1
1 1 1–x
= 81 ,
x
2
x
x
3
1
1
1
1
x
1
1
x
1
x2 x3
3
1
1
x
x
x2
= 512000
VI.41.-Resolver las ecuaciones
x
1
1
1
x
3
1
x
1
1
1
1
x
1
1
1
=0
1
x
1
x
1
1
x
1
=0
1
1
8 27 –64
x 2x+1 2x+1
2x+1 3x–1 4x = 0
3x–1 4x 6x–1
2
x 4 9 16
=0
x 2 3 –4
1 1 1 1
x
3
2
x
x
1
3x 2
3x
1
x 2+2x 2x+1 1
=0
2x+1 x +2 1
3
3
1
1 1 1
–1 x 1
–1 –1 x
.......
–1 –1 –1
x a a
a x a =0
a a x
.. 1
.. 1
.. 1 =0
...
.. x
VI.42.- Sea E el espacio vectorial de las matrices cuadradas de orden (2,2), con coeficientes en
a b
R y sea B =
un elemento de E . Se define la siguiente aplicación
c d
fB : E
A
a) Probar que fB es lineal.
b) Demostrar que el det(fB) = (det (B))2.
E
fB(A) = BA
43
VI.7.- CARACTERISTICA DE UNA MATRIZ
Generalizando los conceptos anteriores, dada una matriz cualquiera A∈M(m,n)(K) se define
como menor de orden h de A a cualquier determinante de orden h formado por h columnas de
subíndices 1 ≤ c 1 <...<c h ≤ n y h filas de subíndices 1 ≤ f1 <...<fh ≤ m de la matriz dada;
obviamente el máximo orden de un menor es menor o igual que la menor de las dos dimensiones
de la matriz. Llamamos característica de la matriz A al orden del mayor menor no nulo que
puede formarse con sus filas y columnas, es decir, el orden de la submatriz cuadrada de A, de
mayor orden, entre las que tienen determinante no nulo.
Se verifica que para toda matriz A∈M(m,n)(K) el rango es igual a la característica: en efecto,
sea A∈M(m,n)(K) tal que
rang(A) = r
caract(A) = c
Veamos que r ≥ c : por definición de característica existe un menor de orden c no nulo, cuyas
filas y columnas podemos suponer que son las c primeras de la matriz A (lo cual siempre es
posible conseguir mediante transformaciones elementales, que no varían el rango). La submatriz
B de A formada por estas c primeras columnas tiene rango c, ya que sus primeras c filas forman
un conjunto de vectores l.i., luego
r = rang(A) ≥ rang(B) = c
Veamos que también se cumple c ≥ r y habremos completado el proceso de demostración: como
rang(A) = r, en la matriz A hay r columnas l.i.; sea C la submatriz correspondiente a estas
columnas; dado que rang(C) = rang(C t), tendremos que en C hay r filas l.i., que nos
determinarán un menor de orden r no nulo, que también es menor de A , por lo que su
característica es, por lo menos r, es decir, c ≥ r. De ambos resultados se obtiene r = c.
Ejemplo VI.7.2
Para la matriz
1
2
A=
3
4
5 1
6 2
0 0
2 –1
4
4
0
3
tenemos que
det (A) = 0
pues la 4ª columna es igual a la 2ª menos la 3ª. Como
1
2
3
5
6
0
1
5
2 = 3·
6
0
1
= 3·4 = 12
2
44
es
rang(A) = caract(A) = 3
El cálculo de la característica de una matriz, puede plantearse de dos modos: empezando por el
menor de mayor orden, o por los orden 2, cuyos valores son calculables inmediatamente. En
cualquier caso su cálculo sería bastante largo; existe un modo de simplificar el proceso basado en
el siguiente resultado:
"Si en una matriz cuadrada existe un menor de orden r distinto de 0 y todos los menores de
orden r+1 que lo contienen son iguales a 0, entonces la característica de la matriz es r.
Recíprocamente si la característica de la matriz es r, existe un menor de orden r distinto de
cero y todos los menores de orden r+1 que lo contienen, si los hubiere, son 0".
En efecto, sean f1,...,fr c1,...,cr las filas y columnas que forman el menor no nulo de orden r,
por lo que el rango de la submatriz que forman es r y el conjunto de los vectores columna
{c1,...,cr} es l.i.; si a estas r columnas añadimos otra cualquiera ci la submatriz formada por
estas r+1 columnas c 1 ,...,c r ,c i y las r filas f1,...,fr, ampliadas con el nuevo elemento de la
columna ci, tiene rango r, por tener un menor de orden r distinto de 0; todos los determinantes de
orden r+1 formados por las columnas c1,...,cr,ci y las filas f1,...,fr fj (j ≠ 1,..,r) son nulos, por
hipótesis, por lo que la fila fj es combinación lineal de las otras y la submatriz formada por las
columnas c1,...,cr,ci, y todas las filas tiene rango r; así ci es combinación lineal de las demás y,
como i es cualquiera, la matriz tiene rango r. El recíproco es inmediato a partir de la definición de
característica.
Ejemplo VI.7.1
Para el cálculo de la característica de la matriz
0 7 7 –3 11 8 1
0 3 1 1 1 2 1
1 0 1 –1 2 3 –2
–1 2 2 –1 3 0 2
empezamos por un menor de orden dos no nulo
1
–1
0
≠0
2
Calculamos menores de orden tres que contengan a este menor de orden dos distinto de
0. Como
0 3 1
1 0 1 ≠0
–1 2 2
continuamos con los menores de orden cuatro que contienen a este menor de orden tres
45
0
0
1
–1
7
3
0
2
7 –3
1 1
=0
1 –1
2 –1
0
0
1
–1
7
3
0
2
7 11
1 1
=0
1 2
2 3
0
0
1
–1
7
3
0
2
7
1
1
2
8
2
=0
3
0
0
0
1
–1
7
3
0
2
7 1
1 1
=0
1 –2
2 2
con lo que, según el resultado anterior, todo menor de orden cuatro es nulo y la
característica de la matriz es 3.
Ejercicios
VI.43 .-
Calcular el rango de las matrices
α1 1
2
3
1 α1 2
1
1
1 α1
4
1
0 α1
1 4 5
, α2 = , α3 =
2
(para α1 =
a 1 1
1 a 1
1 1 a
1
a 1 1 1
1 a 1 a
1 1 a a
VI.44.- Sea el endomorfismo de
2
R3
1 –3 1 4
5
2 –6 1
–3 –8 8 7
–7 –13 15 10
y α4 =
–1 4 –2 5 0
3 –1 0 –2 5
3 10 –6 11 10
)
1
–i
1–i
–1
1 –1 3
–1 i 1–2i
i 1 –2+i
1+i
2–i
–1+i
–2i
i 2i
1 2+i
2i
0
1+i 2+i
–2 4 2
de matriz M = 1 a a . Estudiar su rango según los
–1 2 1
valores de a Demostrar que para todo a el rango de M es dos.
VI.45 .- Hallar según los valores de a∈R el rango de la matriz
1
a
A=
0
a
0
0
a
a
1
a
0
a
0
0
a
a
1
a
0
a
VI.8.-APLICACIONES DE LOS DETERMINANTES
Los determinantes son una herramienta muy útil en la resolución de dos problemas, vistos
anteriormente: el cálculo de la matriz inversa y la resolución de sistemas de ecuaciones lineales.
46
Sabemos que, según resultados anteriores, para una matriz cuadrada A de orden n
A inversible ⇔ rang(A) = n ⇔ det(A) ≠ 0
Supongamos una matriz de este tipo
a11 a 12 . . a 1n
a21 a 22 . . a 2n
A=
............
an1 a n2 . . a n n
Construyamos la matriz
A 11 A21 . . An1
A 12 A22 . . An2
A* =
............
A 1n A2n . . An n
en la que A ij es el adjunto de a ij en A; esta matriz se denomina matriz adjunta de A. Si
efectuamos el producto de ambas resulta
a11A 11+a 12 A 12 +..+a 1nA1n
a21A 11+a 22 A 12 +..+a 2nA1n
AA* =
...................
an1A 11+a n2 A 12 +..+a nnA1n
a 11A 21+a 12 A 22 +..+a 1nA 2n .
a 21A 21+a 22 A 22 +..+a 2nA 2n .
.....................
a n1A 21+a n2 A 22 +..+a nnA 2n .
.
.
.
.
a 11A n1+a 12 A n2 +..+a 1n A n n
a 21A n1+a 22 A n2 +..+a 2n A n n
..................
a n1A n1+a n2 A n2 +..+a nn A n n
y teniendo en cuenta que la suma de los productos de los elementos de una línea por sus adjuntos
es igual al determinante, mientras que la suma de los productos de los elementos de una línea por
los adjuntos de una paralela es cero, será
AA* =
det(A)
0
.. 0
0
det(A) . . 0
= det(A)
................
0
0
. . det(A)
1
0
..
0
0..0
1..0
= det(A) I
.....
1..1
y como A es inversible, podemos escribir
A* = det(A)
A-1I
⇒
A-1
1
=  A*
det(A)
es decir, la matriz inversa es igual a la matriz adjunta multiplicada por el inverso del determinante.
47
Ejemplo VI.8.1
Para la matriz
0
A= 1
–1
3
0
2
1
1
2
0
det(A) = 1
–1
3
0
2
1
1 = –7
2
tenemos
luego es regular y tiene inversa. Como
–2 –4 3
A* = –3 1 1
2 –3 –3
la inversa es
2/7 4/7 –3/7
A = 3/7 –1/7 –1/7
–2/7 3/7 3/7
-1
Ejemplo VI.8.2
Veremos a continuación un esbozo de como con la ayuda de una matriz inversible se
pueden construir y descifrar claves (Criptografía) en la transmisión de mensajes. Si
queremos enviar la siguiente información:
"LAS MATEMATICAS SON UTILES"
y no queremos que sea entendida por ningún posible interceptor, podemos realizar los
siguiente pasos:
a) Asignamos a cada letra una de las 26 letras del alfabeto un número de orden que sea
un elemento del conjunto Z/(26)
A, B, C, D, E, ....., X, Y, Z
1, 2, 3, 4, 5, ....., 24, 25, 0
b) Agrupamos las letras de nuestro mensaje en grupos de n letras, para n∈N*; por
ejemplo, para n = 3
48
LAS MAT EMA TIC ASS ONU TIL ESX
añadiendo la letra X para completar el último grupo.
c) Escribimos cada grupo de n letras como un vector de Rn tal que sus componentes
sean los números asignados a cada una de ellas, según el apartado a). Construimos con
estos vectores una matriz A de n filas y tantas columnas como grupos y de coeficientes
en Z/(26). En nuestro ejemplo es
A=
12
13
5
21
1
16
21
5
1
1
13
9
20
14
9
20
20
21
1
3
20
22
12
24
d) Construimos una matriz cuadrada M∈M(n,n)(Z) inversible y tal que su determinante
sea igual a ± 1 (matriz codificadora), para que los coeficientes de M-1 pertenezcan a Z.
En nuestro caso tomamos, por ejemplo
0
M= 1
1
1
1
3
1
2
5
1
2
–1
3
1
–1
–2
–1
1
⇒ M –1 =
e) Multiplicando la matriz M por la matriz A, obtenemos una nueva matriz B, que
proporciona el mensaje codificado. En nuestro caso es
0 1 1
12
13
5
21
1
16
21
5
B = MA = 1 1 2
1
1
13
9
20
14
9
20
1 3 5
20
21
1
3
20
22
12
24
21
22
14
12
40
36
21
44
53
56
20
36
61
74
54
73
115 121
49
63
161 168 108 185
=
=
y el mensaje codificado es
21,53,115,22,56,121,14,20,49,12,36,63,40,61,161,36,74,168,21,54,108,44,73,185
El receptor adecuado del mensaje, será conocedor de la matriz M, por lo cual podrá
construir con facilidad la matriz B, obtener A = M -1B y a partir de ella escribir la
información original. Si en lugar de expresar el mensaje codificado numéricamente,
queremos expresarlo en letras del alfabeto, basta convertir los elementos de B a
elementos de Z/(26); en el ejemplo
B' =
21
22
14
12
14
10
21
18
1
4
20
10
9
22
2
21
11
17
23
11
5
12
4
3
49
y el mensaje codificado es
21, 1,11,22, 4,17,14,20,23,12,10, 11,14, 9, 5,10,22,12,21, 2, 4,18,21, 3
T ,A, K, U, D, P, N, S, V, L, J, K, N, I, E, J, U, L, T, B, D,Q, T, C
Análogamente al caso anterior el receptor, conocedor de la matriz codificadora M, a
partir del mensaje recibido construye B' y obtiene A = M -1B', es decir el mensaje
original.
Recordemos los resultados básicos sobre compatibilidad de un sistema de ecuaciones lineales
con m ecuaciones y n incógnitas. Escrito de forma matricial será
Ax = b
siendo A la matriz de los coeficientes, del tipo (m,n), x la matriz columna de las incógnitas, del
tipo (n,1), y b la matriz columna formada por los términos independientes, del tipo (m,1). El
sistema es compatible si y sólo si las matrices de coeficientes y la ampliada tienen el mismo
rango, es decir,
rang(A) = rang(A|b) = r
Si el rango común r es igual al número de incógnitas n, el sistema es determinado; si r es menor
que n el sistema es indeterminado y, en este caso, la solución general es igual a una solución
particular más cualquier combinación lineal de n−r soluciones l.i. del sistema homogéneo
asociado.
Ax = 0
Vamos a estudiar la resolución de sistemas mediante determinantes, según el valor de r.
1º Caso : r = n = m (sistema de Cramer)
El sistema tiene igual número de ecuaciones que de incógnitas, la matriz A es regular y según
el Teorema de Rouché existe una única solución, que obtendremos teniendo en cuenta que:
A*b
Ax = b ⇒ x = A-1b ⇒ x = 
det(A)
es decir,
x1
A 11 A21 . . An1
x2
A 12 A22 . . An2
1
=
..
det(A) . . . . . . . . . . . .
xn
A 1n A2n . . An n
b1
b2
..
bn
y desarrollando e igualando los elementos de las matrices resultantes en ambos miembros la
primera incógnita es
50
x1=
A 11 b 1 +A 21 b 2 +..+A n1 b n
=
b1
b2
..
bn
a 12 . . a 1n
a 22 . . a 2n
.......
a n2 . . a nn
det(A)
det(A)
A 12 b 1 +A 22 b 2 +..+A n2 b n
a 11 b1 . . a 1n
a 21 b2 . . a 2n
.........
a n1 bn . . a nn
la segunda
x2=
=
det(A)
det(A)
y, así sucesivamente, para la última
xn =
A 1nb 1+A 2nb 2+..+A nnb n
=
a11
a21
...
an1
a12 . . b1
a22 . . b2
.......
an2 . . bn
det(A)
det(A)
Cada incógnita resulta ser igual a un cociente en el que el divisor es el determinante de los
coeficientes del sistema y el dividendo es el determinante de la matriz resultante de sustituir en
la matriz del sistema A la columna de coeficientes de la incógnita por los términos
independientes.
Ejemplo VI.8.3
El sistema
3x+2z = 1
x+y+z = 1
2x+5z = 4
tiene tres ecuaciones , tres incógnitas y
3
A= 1
2
0
1
0
2
1
5
⇒ det(A) = 11 ⇒ rang(A) = 3
51
siendo pues un sistema de Cramer cuya solución es
x=
1
1
4
0
1
0
11
2
1
5
=
–3
y=
11
3
1
2
1
1
4
11
2
1
5
4
=
z=
11
3
1
2
0
1
0
11
1
1
4
=
10
11
2º caso : r = m < n o r = n < m o r < n y r < m
En primer lugar, cuando r < m, hay que probar la compatibilidad rang(A) = rang(A|b) = r. Si
el sistema es compatible la solución general puede hallarse de acuerdo con el siguiente
razonamiento: la matriz A|b contiene un menor de orden r cuyas filas indican las ecuaciones
l.i. del sistema, que llamaremos ecuaciones principales, de forma que las demás filas
corresponden a ecuaciones que son combinación lineal de éstas, por lo que pueden ser
suprimidas quedando como sistema equivalente el formado por las ecuaciones principales; las
r columnas l.i. del menor distinto de cero que define el rango de A determinan las incógnitas,
que llamaremos incógnitas principales, de modo que pasando al segundo miembro los
términos que contienen a las incógnitas no principales, formamos un sistema de Cramer cuya
solución nos da la solución general del sistema. Por ejemplo si las filas y columnas del menor
no nulo de A son las r primeras hemos reducido el sistema al
a11x1+...+a1rxr = b1−a1r+1xr+1−...−a1nxn
..........................
ar1x1+...+arrxr = br−arr+1xr+1−...−arnxn
cuya solución expresará las incógnitas principales x1,...,xr en función de xr+1,...,xn.
Ejemplo VI.8.4
Para el sistema
2x+3y–z = 1
x+y+3z = 7
3x+4y+2z = 8
x+2y–4z = –6
se verifica
2
1
rang(A) = rang
3
1
siendo distinto de 0 el menor
3 –1
1 3
= 2 = rang
4 2
2 –4
2
1
3
1
3 –1 1
1 3 7
4 2 8
2 –4 –6
52
2
1
3
1
que señala como ecuaciones principales a las dos primeras y como incógnitas principales
a x e y. El sistema es equivalente al formado por estas ecuaciones e incógnitas, es decir,
2x+3y = 1+z
x+y = 7–3z
cuya solución es
x=
1+z 3
7–3z 1
2
1
3
1
= −10z+20
y=
2 1+z
1 7–3z
2
1
= 7z−13
3
1
Caso particular interesante es el de un sistema homogéneo con n ecuaciones y n incógnitas tal
que el rango de la matriz de coeficientes sea n−1, es decir,
a 11x1+a 12x2+...+a 1nxn = 0
a 21x1+a 22x2+...+a 2nxn = 0
.................
a n1x1+a n2x2+...+a nnxn = 0
con
a11 a 12 . . a 1n
a21 a 22 . . a 2n
rang
= n−1
............
an1 a n2 . . a n n
Esto significa que existe un menor de orden n−1 distinto de cero que podemos suponer, sin
pérdida de generalidad en el razonamiento, que está formado por las primeras n−1 filas y
columnas; por ello, y según lo anterior, el sistema equivale al
a 11x1+a 12x2+...+a 1n-1xn-1 = −a 1nxn
a 21x1+a 22x2+...+a 2n-1xn-1 = −a 2nxn
......................
an-11x1+an-12x2+...+an-1n-1xn-1 = −an-1nxn
que es un sistema de Cramer, siendo la solución para x1 el cociente
53
−a1nxn
a12 . . . a1n-1
−a2nxn
a22 . . . a2n-1
...................
−an-1nxn an-12 . . an-1n-1
x1 =
=
a11 a12 . . . a1n-1
a21 a22 . . . a2n-1
−xn(−1)
a12 . . . a1n-1 a1n
a22 . . . a2n-1 a2n
...............
an-12 . . . an-1n-1 an-1n
n-2
a11
a21
................
an-11 an-12 . . an-1n-1
a12 . . . a1n-1
a22 . . . a2n-1
................
an-11 an-12 . . an-1n-1
El determinante del denominador es Ann, adjunto del elemento ann en la matriz de coeficientes del
sistema y el numerador es An1, adjunto del elemento an1 en la matriz del sistema. Podemos, por
tanto, escribir
x1 =
x n A n1
Ann
luego
x1
A n1
xn
=
Ann
si A n1 no es nulo (si A n1 = 0, entonces x1 = 0 por lo que podemos escribir la solución en la
forma anterior aunque A n1 sea nulo, interpretando que en este caso es nula la incógnita del
numerador). Análogamente se obtienen las demás soluciones, que pueden escribirse en la forma
x2
=
A n2
xn
,...,
Ann
x n-1
xn
=
A nn-1
Ann
o escribiéndolas conjuntamente
x1
A n1
=
x2
= ... =
A n2
x n-1
=
A nn-1
xn
Ann
es decir, valores proporcionales a los adjuntos de los elementos de la fila de la matriz que no
forma parte del menor principal.
Ejemplo VI.8.5
El sistema de tres ecuaciones e incógnitas
2x+3y–z = 0
x+y+3z = 0
2x+2y+6z = 0
puede comprobarse que verifica rang(A) = 2, ya que
54
2
1
2
3 –1
1 3 =0
2 6
siendo distinto de 0 el menor
2
1
3
1
Por ello, el sistema tiene por solución
y
x
z
=
=
10 −7 −1
Ejercicios
VI.45.- Demostrar que ((1,–1,α1,0), ( α 2 ,0,2,2), (0,–1,–3, α 3 ), (1,–1,0, α4)) es una base de
R4 y hallar la matriz del cambio de esta base a la base canónica, para α1 =
, α2 =
, α3 =
, α4 =
.
VI.46.- Hallar las inversas de las matrices siguientes:
3 2 1
4 6 2
1 2 3
2 1 1
4 2 0
–3 1 1
1
2
3
1
2 3 4
3 5 –2
5 1 1
1 –5 –7
VI.47.- Discutir para los diferentes valores de m∈R el sistema
x+my+z = m+2
x+y+mz = –2(m+1)
mx+y+z = m
VI.48.- Discutir y resolver según los valores de k y m el sistema
x–2y = 3k+3m
x-y = 2k+2m+1
2
2
mx+ky+5 = m –k –1
2
2
kx+my+7 = k –m +13
VI.49.- Discutir según los valores de a y b, los sistemas
55
ax+y+z+t = a
x+ay+z+t = a
x+y+az+t = a
x+y+z+at = a
ax+by+z = 1
x+aby+z = b
x+by+az = 1
VI.50.-Estudiar la compatibilidad de los sistemas lineales siguientes y resolver el segundo:
2x+y–z = b1
x+2y+z = b2
3x+y–2z = b3
ax+y+z = 1
x+ay+z = a
x+y+az = a
2
VI.51.- Resolver, según los valores de los parámetros reales a, b, c, d el sistema
x+y+z = 1
ax+by+cz = d
2
2
2
2
a x+b y+c z = d
Encontrar el valor de P = a3x+b3y+c3z, si (x,y,z) es una solución del sistema anterior.
VI.52.- Bajo que condición el sistema sobre R
y+az+a 2t = 1
2
x+a z+at = –1
2
ax+a y+t = 1
2
a x+ay+z = 1
posee solución única. Resuélvase en este caso concreto. Hallar a y b para el siguiente
sistema admita solución distinta de la trivial:
2x–ay+bz = 0
x–ay+z = 0
2bx+2y+3z = 0
3x–y+2z = 0
56
PROCEDIMIENTOS PRÁCTICOS BASICOS
Los procedimientos básicos que forman los elementos constructivos a partir de los cuales
pueden abordarse los problemas que tratan sobre las materias desarrolladas en este Cuaderno,
son los siguientes:
- Relación matriz-fórmula en una forma bilineal.
- Imagen matricial de un par de vectores en una forma bilineal.
- Matrices de una forma bilineal en bases distintas.
- Relación matriz-fórmula en una form cuadrática
- Averiguar si una forma cuadrática es definida.
- Averiguar si una aplicación de V×V en R es un producto escalar.
- Hallar el producto escalar de dos vectores.
- Hallar la norma de un vector.
- Hallar una base ortonormal de un espacio euclidiano.
- Averiguar si dos subespacios son ortogonales.
- Hallar el subespacio ortogonal a un subespacio dado.
- Proyectar un vector sobre un subespacio.
- Hallar el ángulo de dos vectores.
- Cálculo de determinante por el algoritmo de Gauss.
- Cálculo de determinante por la regla de Laplace.
- Cálculo de la característica de una matriz.
- Cálculo del rango por determinantes.
- Averiguar si n vectores de un e.v. de dimensión n forman una base
- Hallar la inversa de una matriz regular.
- Resolver un sistema lineal mediante determinantes.
57
EJERCICIOS DE RECAPITULACION
VI.53.- Si f : E×E
R es una forma bilineal, probar que g, definida por
g(x,y) = f(x,y)+f(y,x)
es también bilineal. ¿Es g simétrica?.
VI.54.- Sea la forma bilineal f : R2×R2
R, cuya matriz es la base canónica es
A=
4 2
2 1
a) Si definimos el conjunto anulador N de f como el conjunto de vectores x∈R2 tales
que
(∀y∈R 2) (f(x,y) = 0)
hallar N, una base de N y comprobar que N coincide con los vectores del núcleo del
endomorfismo cuya matriz en la base canónica es A.
b) Sea la nueva base de R2 formada por el vector (1,0) y por un vector de E de la base
del anulador. Hallar la matriz de f en esta nueva base.
c) ¿Es f definida positiva?.
VI.55.- Sea la matriz
1
A= 3
4
3
1
0
4
0
1
asociada a un endomorfismo f de R3 referido a una base ortonormal (e). Definimos en
R3 dos formas bilineales
f1 (x,y) = <x,f(y)>
f2 (x,y) = <f(x),y>
x e y son dos vectores expresados en la base ortonormal (e). Hallar las matrices
asociadas a f1 y a f2 en dicha base. Comprobar que f1 = f2. ¿Cómo ha de ser la matriz A
para que se verifique la condición anterior?.
VI.56.- Sea V un espacio vectorial real. Si <,> y (|) son dos productos escalares en V; averiguar
si las aplicaciones de V2 en R definidas por
(x,y)
<x,y>+(x | y)
son productos escalares.
(x,y)
k <x,y> con k∈R +
58
VI.57.- Si V es un e.v.s. R de dimensión 1, hallar todos los productos escalares en V.
VI.58.- Sea V el espacio vectorial sobre R de las funciones reales de variable real de la forma
f(x) = ae -x+be -2x+ce -3x
con a,b,c∈R
Definimos en V la siguiente operación
∞
<f,g> =
f(x) g(x) dx
0
a) Demostrar que se ha definido un producto escalar.
b) Dado el conjunto M = {f∈V  f(x) = ae -x+be -3x con a,b∈R}, demostrar que es un
subespacio vectorial de V y hallar una base ortonormal para M.
c) Expresar la función g(x) = e-x−2e -3x en la base anterior y calcular su norma .
d) Hallar el subespacio ortogonal asociado al subespacio engendrado por e -3x.
VI.59.- Sea (e1,e2,e3) una base de E, espacio vectorial sobre R, que verifica
e 1   = 1 ,  e 2   = 2 ,  e 3   = 2 , e1⊥e2 , e2⊥e3 , ∠(e1,e3) = 60˚
a) Hallar la expresión matricial del producto escalar respecto de la base (e1,e2,e3).
b) Calcular el ángulo que forman los vectores u1 = e1–e2 y u2 = 2e2–e3.
d) Hallar una base ortonormal del subespacio [u1,u2].
VI.60.- Calcular los siguientes determinantes:
1 3
–1 a
0 –1
0 0
....
0 0
5
0
a
–1
...
0
7
0
0
a
..
0
. . 2n+1
..
0
..
0
..
0
......
..
a
a
a
a
a
..
a
b
a
a
a
..
a
donde los * denotan escalares cualquiera.
VI.61.- Resolver la ecuación
a+x x x x
x b+x x x
=0
x
x c+x x
x
x x d+x
∗
b
a
a
..
a
∗ ..
∗ ..
b ..
a ..
.....
a ..
∗
∗
∗
∗
..
a
59
VI.62.- Demostrar que
x
a
b
c
a
x
c
b
b
c
x
a
c
b
= (x+a+b+c) (x+a–b–c) (x–a+b–c) (x–a–b+c)
a
x
VI.63.-Resolver las ecuaciones
x–1 x 2–1 x 3–1
2
a–x
b–x c–x
a'–x b'–x c'–x = 0
a''–x b''–x c''–x
3
2x–4 x –4 x –8 = 0
2
3
3x–9 x –9 x –27
VI.64.-Dada una matriz A∈M(n,n)(K), considérese el endomorfismo
fA : M(n,n)(K)
M
M (n,n)(K)
fA(M) = AM
Demostrar que det(fA) = (det(A))n. Lo mismo si fA(M) = MA. Si fA(M) = MA−AM,
demostrar que det(fA) = 0.
BIBLIOGRAFIA
de Burgos J. (1988). Curso de Algebra y Geometría. Alhambra. Madrid.
Dixmier J. (1974). Matemáticas Generales. Editorial Aguilar. Madrid.
Godement R. (1974). Algebra. Tecnos. Madrid.
Hoffmann R., Kunze R. (1974). Algebra Lineal. Prentice. Madrid.
Lentin A., Rivaud J. (1973). Algebra Moderna. Aguilar. Madrid.
Noble B., Daniel J.W. (1988). Applied Linear Algebra. Prentice Hall. London.
Queysanne M. (1985) Algebra. Vicens-Vives. Barcelona.
Sainz M.A., Serarols J.L. Pérez A.M. (1994). Álgebra. Escuela Politécnica Superior. Gerona.
Sancho J. (1974). Algebra lineal y geometría. Universidad de Zaragoza.
60
Torregrosa J.R., Jordan C. (1987). Algebra Lineal y sus aplicaciones. McGraw-Hill. Madrid.
Xambó S. (1977). Algebra Lineal y geometrias lineales. EUNIBAR. Barcelona.
Descargar