Tema 3 Producto escalar en un espacio vectorial.

Anuncio
Tema 3
Producto escalar
en un espacio vectorial.
3.1.
Producto escalar
Una vez estudiada la estructura de espacio vectorial, sobrepondremos a dicha estructura una nueva operación entre vectores: el producto escalar. Nos permitirá introducir conceptos geométricos como la longitud de un vector o el ángulo entre vectores.
Definición 3.1 Sea V un espacio vectorial sobre R. Definimos un producto escalar
en V como una aplicación
( , ): V ×V
u, v
−→
R
(3.1)
−→ (u, v)
que satisface las siguientes propiedades:
P1. (u, v) = (v, u) ∀ u, v ∈ V .
P2. (u, λv + µw) = λ(u, v) + µ(u, w) ∀ u, v, w ∈ V,
∀ λ, µ ∈ R.
P3. (u, u) > 0 ∀ v ∈ V, ((u, u) = 0 ⇔ u = 0).
Llamaremos espacio vectorial eclı́deo —y lo denotaremos por (V, (
espacio vectorial en el que se ha definido un producto escalar.
,
))— a un
64
Producto escalar en un espacio vectorial.
Observaciones
O1. Representaremos el producto escalar de dos vectores u y v indistintamente por
(u, v), hu, vi ó u · v.
O2. Por la primera propiedad se dice que el producto escalar es simétrico (su valor
no se altera al cambiar el orden de los vectores), en contra de lo que sucedı́a
con el determinante que era antisimétrico (cambiaba de signo al intercambiar
columnas).
O3. La segunda propiedad es de nuevo la linealidad. Combinando las dos primeras
propiedades se deduce que el producto escalar es bilineal, ya que es lineal en sus
dos argumentos, es decir también sucede que (λv + µw, u) = λ(v, u) + µ(w, u)
(del determinante decı́amos que era multilineal, ya que era lineal en cualquiera
de las filas o columnas).
O4. Por satisfacer las tres propiedades expuestas se dice que el producto escalar es
una forma bilineal simétrica definida positiva.
Ejemplos de productos escalares
i) Sea V = Rn . Sean u = (x1 , x2 , . . . , xn ), v = (y1 , y2 , . . . , yn ). Entonces
(u, v) = x1 y1 + x2 y2 + · · · + xn yn
(3.2)
Es el llamado producto escalar usual. Veamos que (3.2) se es efectivamente un
producto escalar.
P1. (v, u) = y1 x1 + y2 x2 + · · · + yn xn = x1 y1 + x2 y2 + · · · + xn yn = (u, v)
P2. Sea w = (z1 , z2 , . . . , zn ). Entonces
(u, λv + µw) = x1 (λy1 + µz1 ) + x2 (λy2 + µz2 ) + · · · + xn (λyn + µzn )
= λ(x1 y1 + x2 y2 + · · · + xn yn ) + µ(x1 z1 + x2 z2 + · · · + xn zn ) =
= λ(u, v) + µ(u, w)
Apuntes de Álgebra Lineal
A. Rodrı́guez
3.1 Producto escalar
65
P3. (u, u) = x21 + x22 + · · · + x2n > 0, y al tratarse de una suma de números
positivos o nulos, obviamente x21 + x22 + · · · + x2n = 0 ⇔ x1 = x2 = · · · =
xn = 0 ⇒ u = 0.
Como veremos más adelante, con un apropiado cambio de base todo producto
escalar en un espacio de dimensión finita n puede reducirse al producto escalar
usual.
ii) Sea V = R2 . Para u = (x1 , x2 ), v = (y1 , y2 ) el producto escalar usual indica
(u, v) = x1 y1 +x2 y2 . Veamos que podemos definir otro producto escalar diferente
hu, vi = x1 y1 + x2 y1 + x1 y2 + αx2 y2 ,
α∈R
(3.3)
Veamos si (3.3) es un producto escalar
P1. hv, ui = y1 x1 + y2 x1 + y1 x2 + αy2 x2 = x1 y1 + x2 y1 + x1 y2 + αx2 y2 = hu, vi.
P2. Sea w = (x1 , z2 ). Entonces
(u, λv + µw) = x1 (λy1 + µz1 ) + x2 (λy1 + µz1 ) + x1 (λy2 + µz2 ) + αx2 (λy2 + µz2 )
= λ(x1 y1 + x2 y1 + y2 x1 + αx2 y2 ) + µ(x1 z1 + x2 z1 + x1 z2 + αx2 z2 ) =
= λ(u, v) + µ(u, w)
P3. hu, ui = x21 + 2x1 x2 + αx22 = (x1 + x2 )2 + (α − 1)x22 > 0 ⇔ α − 1 > 0. Por
otro lado, si α > 1 entonces (x1 + x2 )2 + (α − 1)x22 = 0 si y sólo si
x1 + x 2 = 0
x2 = 0
)
⇒ x1 = x2 = 0
Hemos probado entonces que (3.3) es un producto escalar si α > 1
Como hemos visto, un mismo espacio vectorial puede admitir productos escalares
distintos. Por ejemplo, para α = 2, si u = (1, 1) y v = (−1, 1), entonces (u, v) =
0, pero hu, vi = −3.
66
Producto escalar en un espacio vectorial.
iii) Sea V = C(R). Sean f, g ∈ V . Definimos
(f, g) =
Z
b
f (t)g(t) dt
(3.4)
a
Veamos que se trata de un producto escalar
i) (g, f ) =
Z
b
g(t)f (t) dt =
a
Z
b
f (t)g(t) dt = (f, g)
a
ii) Sea h ∈ V , entonces por linealidad de la integración
(f, λg + µh) =
Z
Z
b
b
f (t)(λg(t) + µh(t)) dt =
(λf (t)g(t) + µf (t)h(t)) dt =
a
Z b
Z b
f (t)h(t) dt = λ(f, g) + µ(f, h)
f (t)g(t) dt + µ
=λ
a
a
iii) (f, f ) =
Z
a
b
f 2 (t) dt > 0, ya que f 2 (t) > 0, por lo que el área bajo su gráfica
a
será positiva (y nula si y sólo si f es la función nula en [a, b]).
iv) Sea V = Pn (R). Sean x0 , x1 , . . . , xn ∈ R, n + 1 números reales distintos y sean
p, q ∈ V . Definimos
(p, q) = p(x0 )q(x0 ) + p(x1 )q(x1 ) + · · · + p(xn )q(xn )
(3.5)
Veamos que es un producto escalar
P1. (q, p) = q(x0 )p(x0 )+· · ·+q(xn )p(xn ) = p(x0 )q(x0 )+· · ·+p(xn )q(xn ) = (p, q)
P2. Sea r ∈ V . Entonces
(p, λq + µr) = p(x0 )(λq(x0 ) + µr(x0 )) + · · · + p(xn )(λq(xn ) + µr(xn )) =
= λ(p(x0 )q(x0 ) + · · · + p(xn )q(xn )) + µ(p(x0 )r(x0 ) + · · · + p(xn )r(xn ))
= λ(p, q) + µ(p, r)
P3. (p, p) = p(x0 )2 + p(x1 )2 + · · · + p(xn )2 > 0. Por otro lado p(x0 )2 + p(x1 )2 +
· · · + p(xn )2 = 0 ⇔ p(x0 ) = p(x1 ) = · · · = p(xn ) = 0. Ahora bien, como p
es un polinomio de grado 6 n tendrá a lo sumo en n raı́ces reales (nunca
Apuntes de Álgebra Lineal
A. Rodrı́guez
3.1 Producto escalar
67
n + 1 salvo en el caso trivial del polinomio nulo) por lo que (p, p) = 0 ⇔
p(x) = 0 + 0x + · · · + 0xn .
v) Sea V = Mn (R). Sean A, B ∈ V . Definimos
(A, B) = tr(AB T )
(3.6)
donde tr(AB T ) indica la trazaa de la matriz AB T . Veamos que estamos de nuevo
frente a un producto escalar
P1. (B, A) = tr(BAT ) = tr((BAT )T ) = tr(AB T ) = (A, B), donde hemos utilizado las propiedades (AT )T = A y (AB)T = B T AT de la trasposición de
matrices.
P2. Sea C ∈ V . Entonces (A, λB + µC) = tr(A(λB + µC)T ) = tr(λAB T +
µAC T ) = λtr(AB T ) + µtr(AC T ) = λ(A, B) + µ(A, C).
P
P3. (A, A) = tr(AAT ) = ni=1 (AAT )ii . Ahora bien, como es sabido del producto
P
de matrices (AB)ij = nk=1 aik bkj , por lo que si B = AT entonces (AAT )ij =
Pn
Pn
T
T
k=1 aik (A )kj =
k=1 aik ajk , de donde con i = j obtenemos (AA )ii =
Pn
2
k=1 aik . De esta manera
(A, A) =
n X
n
X
a2ij > 0
i=1 j=1
Además, por tratarse de una suma de cuadrados (A, A) = 0 ⇔ aij =
0 ∀ i, j ⇒ A = O.
a
La traza de una matriz cuadrada A se define como la suma de los elementos de su diagonal
tr(A) =
n
X
i=1
y satisface las siguientes propiedades
a) tr(A) = tr(AT )
b) tr(λA + µB) = λtrA + µtrB
aii
(3.7)
68
Producto escalar en un espacio vectorial.
3.2.
Norma de un vector
Definiremos ahora una nueva aplicación, relacionada con el producto escalar, cuyo
significado geométrico es la longitud o módulo de un vector.
Definición 3.2 Sea V un espacio vectorial sobre R. Definimos una norma en V como
una aplicación
|| || : V
−→
R+
u −→ ||u||
(3.8)
que satisface las siguientes propiedades:
P1. ||λu|| = |λ|||u|| ∀ u ∈ V, ∀ λ ∈ R.
P2. ||u|| > 0 ∀ u ∈ V, (||u|| = 0 ⇔ u = 0).
P3. ||u + v|| 6 ||u|| + ||v|| ∀ u, v ∈ V .
Llamaremos espacio vectorial normado —y lo denotaremos por (V, || ||)— a un espacio
vectorial en el que se ha definido una norma.
Observaciones
O1. La tercera propiedad es la llamada desigualdad triangular, y tiene su origen en
la relación entre las longitudes de los lados de un triángulo.
O2. Por satisfacer las tres propiedades anteriores se dice que la norma es una forma
cuadrática definida positiva.
Veamos ahora que en todo espacio vectorial euclı́deo existe una norma que proviene del producto escalar.
Teorema 3.1 Sea (V, ( , )) un espacio vectorial euclı́deo. Entonces
p
||v|| = + (v, v)
es una norma en V a la que llamaremos norma euclı́dea.
Apuntes de Álgebra Lineal
(3.9)
A. Rodrı́guez
3.2 Norma de un vector
69
Demostración Tendremos que probar que (3.9) satisface las propiedades de una
norma.
p
p
p
P1. ||λv|| = + (λv, λv) = + λ2 (v, v) = +|λ| (v, v) = |λ|||v||
P2. Es inmediato a partir de la tercera propiedad del producto escalar.
Para probar la desigualdad triangular antes hemos de introducir la siguiente relación
Teorema 3.2 Desigualdad de Cauchy-Schwartz. Sea (V, ( , )) un espacio vectorial euclı́deo y sea || || la norma euclı́dea (3.9) definida en él. Entonces
|(u, v)| 6 ||u||||v||
(3.10)
Demostración Sean u, v ∈ V . Es claro que para cualquier λ ∈ R se tiene que
(λu + v, λu + v) > 0. Utilizando las propiedades del producto escalar
(λu + v, λu + v) = λ(u, λu + v) + (v, λu + v)
= λ2 (u, u) + λ(u, v) + λ(v, u) + (v, v)
= λ2 ||u||2 + 2λ(u, v) + ||v||2 > 0
Ahora bien, para que la parábola p(λ) ≡ λ2 ||u||2 + 2λ(u, v) + ||v||2 se mantenga
siempre positiva o nula, ha de ser que no tenga raı́ces (de otro modo cruzarı́a el eje
λ y pasarı́a de ser positiva a negativa o vice-versa), y para ello basta con que el
discriminante en
−2(u, v) ±
p
4(u, v)2 − 4||u||2 ||v||2
2||u||2
(3.11)
sea negativo o nulo, es decir
4(u, v)2 − 4||u||2 ||v||2 6 0 ⇒ |(u, v)| 6 ||u||||v||
como querı́amos probar.
Una vez demostrada la desigualdad de Cauchy-Schwartz podemos probar la desigualdad triangular
70
Producto escalar en un espacio vectorial.
P3. Utilizando las propiedades del producto escalar, de la norma y la desigualdad
de Cauchy-Schwartz obtenemos
||u + v||2 = (u + v, u + v) = ||u||2 + 2(u, v) + ||v||2
6 ||u||2 + 2|(u, v)| + ||v||2
6 ||u||2 + 2||u||||v|| + ||v||2 = (||u|| + ||v||)2
donde, sin más que tomar raı́ces cuadradas obtenemos finalmente la desigualdad
triangular.
Ejemplos de normas euclı́deas Veamos las normas euclı́deas derivadas de todos
los productos escalares vistos hasta ahora.
i) Sea V = Rn y sea v = (x1 , x2 , . . . , xn ) ∈ V. Del producto escalar usual (3.2) se
deriva la norma
q
||v|| = x21 + x22 + · · · + x2n
(3.12)
ii) Sea V = R2 y sea v = (x1 , x2 ) ∈ V. Además de la norma usual ||v|| =
el producto escalar (3.3) con α = 2 produce la norma
||v|| =
q
x21
+ 2x1 x2 +
2x22
q
= (x1 + x2 )2 + x22
Por tanto, para v = (1, 1), según la norma usual tenemos ||v|| =
√
la norma (3.13) tenemos ||v|| = 5
p
x21 + x22 ,
(3.13)
√
2, pero según
iii) Sea V = C(R) y f ∈ V . Entonces el producto escalar (3.4) produce la norma
||f || =
s
Z
b
f 2 (t) dt
(3.14)
a
iv) Sea V = Pn (R) y p ∈ V . El producto escalar (3.5) define la norma
||p|| =
Apuntes de Álgebra Lineal
p
p(x0 )2 + p(x1 )2 + · · · + p(xn )2
(3.15)
A. Rodrı́guez
3.3 Matriz de un producto escalar
71
v) Sea V = Mn (R) y A ∈ V . Del producto escalar (3.6) se sigue la norma
||A|| = tr(AAT )
(3.16)
Algunos ejemplos de normas no euclı́deas Aunque no trabajaremos con ellas,
es importante saber que existen normas (es decir, aplicaciones que satisfacen las
propiedades dadas en la definición 3.2) que no provienen de un producto escalar.
Veamos alguna de ellas.
i) Sea V = Rn y v = (x1 , x2 , . . . , xn ) ∈ V . Definimos la norma p como
||v||p =
p
p
|x1 |p + |x2 |p + · · · + |xn |p
(3.17)
Aunque no lo demostraremos, (3.17) satisface las propiedades de norma. Por
otro lado, es inmediato que para p = 2 (3.17) se reduce a la norma euclı́dea
(3.12).
Por ejemplo, para n = 2 y v = (1, −2) tendremos ||v||2 =
√
√
5 y ||v||3 = 3 9.
ii) La llamada norma infinito es el lı́mite con p → ∞ de la norma p. Es un sencillo
ejercicio de cálculo comprobar que
||v||∞ ≡ lı́m ||v||p = máx |xi |
p→∞
i
(3.18)
que produce, por ejemplo, ||(1, −2)||∞ = 2.
3.3.
Matriz de un producto escalar
Veremos ahora que, debido a la bilinealidad, podemos reexpresar el producto
escalar (en espacios de dimensión finita) en forma matricial, de manera que su manejo
se hace mucho más sencillo.
En efecto, sea (V, ( , )) un espacio vectorial euclı́deo de dimensión finita n y sea
B = {v 1 , v 2 , . . . , v n } una base de V . Sean u y v dos vectores de V cuyo producto
72
Producto escalar en un espacio vectorial.
escalar (u, v) se quiere calcular. Para ello, recurriremos a su expresión en coordenadas
en la base B
u = x 1 v 1 + x2 v 2 + · · · + x n v n ,
y
v = y 1 v 1 + y2 v 2 + · · · + y n v n
(3.19)
Teniendo en cuenta el desarrollo de u en (3.19) el producto escalar resulta
(u, v) = (
n
X
xi v i , v) =
i=1
n
X
i=1
xi (v i , v) = x1 (v 1 , v) + x2 (v 2 , v) + · · · + xn (v n , v) (3.20)
donde hemos utilizado la linealidad del producto escalar en el primer argumento.
Ahora bien, si en cada uno de los n sumandos de (3.20) introducimos el desarrollo de
v en B obtenemos
(u, v) = (
n
X
xi v i ,
yj v j )
j=1
i=1
= x1 (v 1 ,
n
X
n
X
yj v j ) + x2 (v 2 ,
j=1
n
X
j=1
yj v j ) + · · · + xn (v n ,
n
X
yj v j )
j=1
= x1 y1 (v 1 , v 1 ) + x1 y1 (v 1 , v 2 ) + · · · + x1 yn (v 1 , v n )
+ x2 y1 (v 2 , v 1 ) + x2 y2 (v 2 , v 2 ) + · · · + x2 yn (v 2 , v n )
..
.
+ xn y1 (v n , v 1 ) + xn y2 (v n , v 2 ) + · · · + xn yn (v n , v n ) =
(3.21)
n X
n
X
xi yj (v i , v j )
i=1 j=1
de donde se desprende que para conocer el producto escalar de dos vectores sólo es
necesario conocer sus coordenadas en una cierta base y el producto escalar de los
vectores de la dicha base entre sı́.
Es un sencillo ejercicio comprobar que si hacemos X T = (x1 x2 · · · xn ), Y T =
(y1 y2 · · · yn ) y G = (gij ), con gij ≡ (v i , v j ) podemos reexpresar el doble sumatorio
Apuntes de Álgebra Lineal
A. Rodrı́guez
3.3 Matriz de un producto escalar
73
en (3.21) como
(u, v) =
x1 x2

(v 1 , v 1 ) (v 1 , v 2 ) · · ·
(v 1 , v n )

 (v 2 , v 1 ) (v 2 , v 2 ) · · · (v 2 , v n )

· · · xn 
..
..
..

.
.
.

(v n , v 1 ) (v n , v 2 ) · · · (v n , v n )







y1
y2
..
.
yn




 = X T GY


(3.22)
donde G es la llamada matriz del producto escalar en la base B.
Ejemplo 3.1 Calculemos ahora la matriz de algunos de los productos escalares vistos
hasta ahora.
i) Calculemos la matriz del producto escalar usual en Rn (3.2) en la base canónica
Bc = {e1 , e2 , . . . , en } dada en (2.13) de Rn , en la cual las coordenadas de los
vectores coinciden con sus componentes. Es claro que
gij = (ei , ej ) =
(
1,
si i = j
0,
si i 6= j
(3.23)
por lo que G = I, es decir, la matriz del producto escalar usual en la base
P
P
canónica será la matriz identidad. Entonces, para u = i xi ei y v = j yj ej
obtenemos trivialmente
(u, v) =
x1 x2

y1



 y2 


· · · xn I  .  = x 1 y 1 + x 2 y 2 + · · · + x n y n
 .. 


(3.24)
yn
ii) Consideremos ahora el producto escalar (3.3) en R2 para α = 2
hu, vi = x1 y1 + x2 y1 + x1 y2 + 2x2 y2
(3.25)
y calculemos su matriz en la base canónica Bc = {e1 , e2 } de R2 . Es inmediato
comprobar que (e1 , e1 ) = (e1 , e2 ) = (e2 , e2 ) = 1 y (e2 , e2 ) = 2. Por tanto (3.25)
74
Producto escalar en un espacio vectorial.
puede reexpresarse como
hu, vi =
x1 x2
1 1
1 2
!
y1
y2
!
(3.26)
Podrı́amos haber obtenido la matriz más fácilmente ya que el elemento de matriz
gij acompaña al producto xi yj (por ejemplo, el término 2x2 y2 en (3.25) da lugar
al elemento de matriz g22 = 2 en (3.26)), por lo que la simple lectura de (3.25)
nos lleva a la matriz sin necesidad de realizar los productos escalares.
iii) Consideremos ahora el producto escalar (3.4) aunque en el espacio vectorial
V = P2 (R) (de otro modo, con V = C(R) de dimension infinita no se define
la matriz asociada). Tomaremos a = −1, b = 1 y calcularemos la matriz en
la base canónica Bc = {1, t, t2 }. Multiplicando entre sı́ los vectores de la base
(1, 1) =
Z
Z
1
−1
1 · 1 dt = 2;
(1, t) =
1
2
t · t dt = ;
(t, t) =
3
−1
2
(t, t ) =
Z
Z
1
−1
2
1 · t dt = 0;
(1, t ) =
1
2
−1
t · t dt = 0;
2
2
(t , t ) =
obtenemos la expresión matricial del producto escalar
(p, q) =
a0 a1

2


a2 
 0
 2
3
0
2
3
0
2
3
0
2
5
Z
Z
1
2
1 · t2 dt = ;
3
−1
1
2
t2 · t2 dt = ;
5
−1



 b0


  b1 



b2
(3.27)
donde p(t) = a0 + a1 t + a2 t2 y q(t) = b0 + b1 t + b2 t2 . Ahora disponemos de
una forma alternativa de calcular integrales de polinomios de grado 6 2 en el
intervalo [−1, 1]. Por ejemplo

2
Z 1


(1 − t, 1 + t) =
(1 − t2 ) dt = 1 −1 0 
 0
−1
 2
3
0
2
3
0
2
3
0
2
5



 1
  4
 1  =
  3

0
Apuntes de Álgebra Lineal
A. Rodrı́guez
3.3 Matriz de un producto escalar
75
Ahora bien, aunque la expresión matricial del producto escalar supone una simplicación en los cálculos, sus elementos dependen de la base escogida. Tendremos pues
que saber cómo cambia la matriz del producto escalar al cambiar la base.
Si en una base B = {v 1 , v 2 , . . . , v n } la matriz G del producto escalar tiene por
elementos gij = (v i , v j ), en una base distinta B 0 = {v 01 , v 02 , . . . , v 0n } la matriz G0 del
producto escalar tendrá por elementos gij0 = (v 0i , v 0j ). Obtener la relación entre las
matrices G y G0 es sencillo teniendo en cuenta la matriz P de cambio de base de B
a B 0 . En efecto, la relación entre las coordenadas en ambas bases de los vectores u y
v vendrá dada por
P X0 = X
y PY 0 = Y
(3.28)
De esta forma podremos expresar el producto escalar como
(u, v) = X T GY = (P X 0 )T GP Y 0 = X 0 P T GP Y 0 = X 0 G0 Y 0
(3.29)
donde hemos hecho
G0 = P T GP
(3.30)
que nos da la relación entre las matrices del producto escalar en ambas bases. (Si dos
matrices G y G0 están relacionadas mediante una matriz invertible P como en (3.30)
se dice que son congruentes).
Ejemplo 3.2 Calculemos la matriz del producto escalar (3.25) en la base B 0 = {v 01 ≡
(1, 0), v 02 ≡ (1, −1)} de R2 . Es claro que
hv 01 , v 01 i =
1 0
1 1
1 2
!
hv 01 , v 02 i =
1
0
!
= 1;
1 0
hv 02 , v 02 i =
1 1
1 2
!
1
−1
1 −1
!
1 1
1 2
!
1
−1
!
=0
por lo que la matriz del producto escalar será la matriz identidad G0 = I. Si consideramos ahora los vectores expresados en B 0 : u = x01 v 01 + x02 v 02 y v = y10 v 01 + y20 v 02 ,
entonces
hu, vi =
x01 x02
1 0
0 1
!
x01
y10
!
= x01 y10 + x02 y20
(3.31)
=1
76
Producto escalar en un espacio vectorial.
El mismo resultado se obtendrı́a aplicando la relación (3.30) con la matriz
P =
1
1
0 −1
!
(3.32)
de cambio de base entre la base canónica y B 0 . En efecto
P T GP =
1
0
1 −1
!
1 1
1 2
!
1
1
0 −1
!
=
1 0
0 1
!
= G0
(3.33)
En el ejemplo anterior hemos visto cómo el producto escalar (3.25) se ha simplificado notablemente ya que ¡se ha convertido en el producto escalar usual! Para ello,
sólo ha sido preciso expresarlo en la base adecuada. Estudiaremos este tipo de bases
en la siguiente sección.
3.4.
Ángulo entre vectores
Introduciremos una última noción geométrica: el ángulo entre dos vectores.
Definición 3.3 Sea (V, ( , )) un espacio vectorial euclı́deo y sea || || la norma euclı́dea
definida en él. Definimos el ángulo α entre dos vectores no nulos u, v ∈ V como
cos α =
(u, v)
||u||||v||
(3.34)
Observaciones
O1. Por convenio tomaremos α ∈ [0, π).
O2. Obsérvese que la expresión (3.34) es una buena definición para un ángulo ya que por la desigualdad de Cauchy-Schwartz |(u, v)| 6 ||u||||v||, luego
|(u, v)|/||u||||v|| 6 1 lo que llevado a (3.34) produce | cos α| 6 1, como debe ser.
Apuntes de Álgebra Lineal
A. Rodrı́guez
3.4 Ángulo entre vectores
77
O3. De (3.34) se desprende fácilmente que dos vectores no nulos son perpendiculales
(forman un ángulo α = π/2) si y sólo si su producto escalar es nulo. En efecto
π
(u, v) = cos α ||u|| ||v|| = 0 ⇔ cos α = 0 ⇒ α =
|{z} |{z}
2
6=0
(3.35)
6=0
Igualmente puede probarse que dos vectores son linealmente dependientes si y
sólo si forman un ángulo α = 0 ó π (es decir, son proporcionales).
En adelante nos ocuparemos de los conjuntos de vectores perpendiculares entre
sı́.
Definición 3.4 Sea (V, ( , )) un espacio vectorial euclı́deo y sea S = {v 1 , v 2 , . . . , v n } ⊂
V . Entonces
Se dice que S es un conjunto ortogonal si (v i , v j ) = 0 para i 6= j.
Si además (v i , v i ) = 1 ∀ i, se dice que S es ortonormal.
Observaciones
O1. Los conjuntos ortogonales son conjuntos de vectores perpendiculares entre sı́ (lo
que representaremos por v i ⊥ v j ) y pueden incluir el vector 0.
O2. Se dice que un vector está normalizado si su norma es la unidad. Los conjuntos
ortonormales son, pues, conjuntos ortogonales normalizados, ya que (v i , v i ) =
||v i ||2 = 1 ∀ i (un conjunto ortonormal, por lo tanto, no puede incluir el 0). Propiedades de los conjuntos ortogonales y ortonormales
P1. 0 ⊥ v ∀ v ∈ V .
P2. u ⊥ v ⇔ ||u + v||2 = ||u||2 + ||v||2 .
P3. Todo conjunto ortonormal es linealmente independiente.
78
Producto escalar en un espacio vectorial.
Demostración
P1. Se sigue de la linealidad del producto escalar. En efecto, como podemos escribir
0 = u − u ∀ u, entonces (0, v) = (u − u, v) = (u, v) − (u, v) = 0 ∀ v ∈
V . (Obsérvese que este es el mismo razonamiento que nos condujo a que el
determinante de una matriz con una columna de ceros es nulo).
P2. Es el conocido Teorema de Pitágoras. Demostraremos sólamente la implicación
hacia la derecha.
||u + v||2 = (u + v, u + v) = ||u||2 + ||v||2 + 2(u, v) = ||u||2 + ||v||2
u⊥v
Esta propiedad puede generalizarse fácilmente. S = {v 1 , v 2 , . . . , v n } será un
conjunto ortogonal si y sólo si
||v 1 + v 2 + · · · + v n ||2 = ||v 1 ||2 + ||v 2 ||2 + · · · + ||v n ||2
(3.36)
P3. Sea S = {v 1 , v 2 , . . . , v n } ortonormal. Para ver que es linealmente independiente
plantearemos la combinación lineal
λ1 v 1 + λ 2 v 2 + · · · + λ n v n = 0
(3.37)
Si multiplicamos escalarmente ambos lados de la igualdad por v 1 obtenemos
(v 1 , λ1 v 1 + λ2 v 2 + · · · + λn v n ) = (v 1 , 0)
(3.38)
El primer término de (3.38) se descompone en n productos escalares, mientras
que el segundo se anula por la primera propiedad demostrada arriba, con lo que
finalmente resulta
λ1 (v 1 , v 1 ) + λ2 (v 1 , v 2 ) + · · · + λn (v 1 , v n ) = 0
(3.39)
Ahora bien, todos los productos escalares en (3.39) se anulan salvo el primero
que vale 1, por lo que finalmente obtenemos λ1 = 0. Si ahora multiplicamos
(3.38) por v 2 , . . . , v n , obtenemos respectivamente λ2 = · · · = λn = 0, por lo que
S es linealmente independiente.
Apuntes de Álgebra Lineal
A. Rodrı́guez
3.5 Bases ortonormales
79
Obsérvese que esta propiedad también serı́a válida para un conjunto ortogonal
siempre y cuando no contuviera al vector 0 (ya que, como sabemos, todo conjunto
que contiene al 0 es dependiente).
Esta última propiedad de los conjuntos ortonormales los convierte en bases cuando
su número de vectores coincida con la dimensión del espacio. Veremos que este tipo
de bases son las más importantes en los espacios vectoriales euclı́deos.
3.5.
Bases ortonormales
Definición 3.5 Sea (V, ( , )) un espacio vectorial euclı́deo de dimensión n y sea
B = {v 1 , v 2 , . . . , v n } una base de V . Diremos que B es una base ortonormal de V si
es, además, un conjunto ortonormal.
Veremos a continuación las propiedades de las bases ortonormales que las convierten en las bases más adecuadas para utilizar en los espacios vectoriales euclı́deos.
Propiedades de las bases ortonormales
P1. Sea G la matriz de un producto escalar en una base ortonormal. Entonces
G=I
(3.40)
P2. Sea v ∈ V y sea B = {v 1 , v 2 , . . . , v n } una base ortonormal de V . Entonces
v = (v, v 1 )v 1 + (v, v 2 )v 2 + · · · + (v, v n )v n
(3.41)
P3. Sean B y B 0 dos bases ortonormales y sea P la matriz de cambio de base entre
B y B 0 . Entonces P es una matriz ortogonal, es decir
PPT = PTP = I
o, lo que es lo mismo, P −1 = P T .
(3.42)
80
Producto escalar en un espacio vectorial.
Demostración
P1. Por la propia definición, al ser B una base ortonormal, entonces
gij = (v i , v j ) =
(
1,
si i = j
0,
si i 6= j
(3.43)
lo que significa que si si expresamos los vectores u y v en la base ortonormal
como u = x1 v 1 + x2 v 2 + · · · + xn v n y v = y1 v 1 + y2 v 2 + · · · + yn v n , entonces
(u, v) = x1 y1 + x2 y2 + · · · + xn yn
(3.44)
es decir, en una base ortonormal todo producto escalar ¡se reduce al producto
escalar usual!
P2. Esta propiedad nos indica que las coordenadas de un vector en una base ortonormal coinciden con los productos escalares del vector por los vectores respectivos
de la base. Veamos que esto es ası́. En principio, por ser B una base todo vector
v se podrá representar según unas ciertas coordenadas
v = x1 v 1 + x2 v 2 + · · · + x n v n
(3.45)
Si en (3.45) multiplicamos escalarmente por v 1 a derecha e izquierda del igual
obtenemos
(v, v 1 ) = (x1 v 1 + x2 v 2 + · · · + xn v n , v 1 )
= x1 (v 1 , v 1 ) + x2 (v 2 , v 1 ) + · · · + xn (v n , v 1 ) = x1
donde hemos utilizado la linealidad del producto escalar y el hecho de que B
es ortonormal. Análogamente, mulitiplicando (3.45) por v 2 , . . . , v n , se obtiene
(v, v 2 ) = x2 , . . . , (v, v n ) = xn .
P3. En efecto, si retomamos la expresión (3.30)
G0 = P T GP
(3.46)
que relaciona la matriz del producto escalar en dos bases distintas y tenemos
Apuntes de Álgebra Lineal
A. Rodrı́guez
3.5 Bases ortonormales
81
en cuenta que ambas son ortonormales, entonces G = G0 = I, lo que llevado a
(3.46) produce P T P = I.
Ejemplo 3.3 Retomemos ahora los ejemplos de bases ortonormales que hemos visto
durante el tema.
i) Como hemos visto en el ejemplo 3.1 la base canónica de Rn es una base ortonormal para el producto escalar usual, aunque podemos encontrar otras bases
ortonormales para dicho producto escalar. Por ejemplo, sea n = 2 y sea la base
1
1
B 0 = {v 01 ≡ √ (1, 1), v 02 ≡ √ (−1, 1)}
2
2
(3.47)
Es fácil comprobar que ||v10 || = ||v20 || = 1 y (v 01 , v 02 ) = 0, por lo que B 0 es
ortonormal. Encontrar las coordenadas de un vector en dicha base será sencillo.
√
√
Por ejemplo, para v = (2, 1) tenemos (v, v 01 ) = 3/ 2 y (v, v 02 ) = −1/ 2 por lo
que podemos expresar
3 1
1 1
3
1
v = (2, 1) = √ √ (1, 1) − √ √ (−1, 1) = √ v 01 − √ v 02
2 2
2 2
2
2
(3.48)
Por otro lado, la matriz P de cambio de base entre la base canónica y B 0 contendrá los vectores de B 0 puestos en columnas
1
P =√
2
1 −1
1
1
!
(3.49)
Al tratarse de dos bases ortonormales la matriz de cambio ha de ser ortogonal,
lo que podemos comprobar con un sencillo cálculo
1
PPT = √
2
1 −1
1
1
!
1
√
2
1
1
−1 1
!
=
1 0
0 1
!
=I
(3.50)
ii) Ni la base canónica ni la base (3.47), en cambio, son ortonormales para el producto escalar (3.25). No obstante en el ejemplo 3.1 encontramos una base ortonormal
B 0 = {(1, 0), (1, 1)} para dicho producto escalar.
82
Producto escalar en un espacio vectorial.
Ejemplo 3.4 Encontrar la forma de todas las matrices ortogonales 2 × 2.
a b
Solución Sea A =
c d
!
una matriz ortogonal de orden 2. Entonces ha de
cumplir
At A =
a c
b d
!
a b
c d
!
a2 + c2 ab + cd
=
ab + cd b2 + d2
!
=
1 0
0 1
!
(3.51)
Ahora bien, (3.51) se satisface si y sólo si

2
2


 a +c =1
ab + cd = 0


 b2 + d 2 = 1
(3.52)
que es un sistema no lineal de 3 ecuaciones y 4 incógnitas.
Para que las ecuaciones primera y tercera de (3.52) se satisfagan podemos imponer
a = cos α, c = sen α
(3.53)
b = cos β, d = sen β
para unos ciertos ángulos α, β ∈ [0, 2π). Si ahora introducimos las restricciones (3.53)
en la segunda ecuación de (3.52) obtenemos
ab + cd = cos α cos β + sen α sen β = cos(α − β) = 0 ⇒ α − β = ±
π
2
(3.54)
Si ahora introducimos las condiciones (3.53) y (3.54) en A obtenemos
A=
cos α
sen α
cos(α ± π/2)
sen (α ± π/2)
!
(3.55)
donde, si tenemos en cuenta que cos(α ± π/2) = ∓ sen α y sen (α ± π/2) = ± cos α,
sólo resultan dos posibilidades
Rα ≡
Apuntes de Álgebra Lineal
cos α − sen α
sen α
cos α
!
ó Sα/2 ≡
cos α
sen α
sen α − cos α
!
(3.56)
A. Rodrı́guez
3.5 Bases ortonormales
83
para α ∈ [0, 2π). Obsérvese que la matriz ortogonal (3.49) del ejemplo 3.3 coincide
con Rπ/4 . Volveremos sobre el significado de estas matrices en el tema 6.
Ya que las bases ortonormales han demostrado tener propiedades tan simplificadoras será interesante tener un método para obtenerlas. Lo veremos en la siguiente
sección.
3.5.1.
Método de ortogonalización de Gram-Schmidt
El método de ortogonalización de Gram-Schmidt nos permitirá encontrar a partir
de una base B = {u1 , u2 , u3 , . . . , un } otra base ortogonal B 0 = {v 1 , v 2 , u3 , . . . , v n }
de la siguiente forma.
Tomaremos como primer vector de la base ortogonal el primer vector de la base
inicial, es decir
v 1 = u1
(3.57)
Posteriormente, trataremos de encontrar el vector vector v 2 como una combinación
lineal del segundo vector de la base inicial u2 con el vector v 1 en la forma v 2 =
u2 + αv 1 de tal forma que v 2 sea perpendicular a v 1 , es decir
(v 2 , v 1 ) = (u2 + αv 1 , v 1 ) = (u2 , v 1 ) + α||v 1 ||2 = 0 ⇒ α = −
(u2 , v 1 )
||v 1 ||2
(3.58)
con lo que resulta
v 2 = u2 −
(u2 , v 1 )
v1
||v 1 ||2
(3.59)
y el conjunto {v 1 , v 2 } es ortogonal.
A continuación, buscamos v 3 de como una combinación lineal del tercer vector de
la base inicial u3 y los dos vectores ya hallados v 1 y v 2 en la forma v 3 = u3 +αv 1 +βv 2
de modo que v 3 sea perpendicular a v 1 y v 2
(u3 , v 1 )
||v 1 ||2
(u3 , v 2 )
(v 3 , v 2 ) =(u3 + αv 1 + βv 2 , v 2 ) = (u3 , v 2 ) + β||v 2 ||2 = 0 ⇒ β = −
||v 2 ||2
(v 3 , v 1 ) =(u3 + αv 1 + βv 2 , v 1 ) = (u3 , v 1 ) + α||v 1 ||2 = 0 ⇒ α = −
84
Producto escalar en un espacio vectorial.
donde hemos utilizado que (v 1 , v 2 ) = 0. Finalmente resulta
v 3 = u3 −
(u3 , v 2 )
(u3 , v 1 )
v1 −
v2
2
||v 1 ||
||v 2 ||2
(3.60)
y el conjunto {v 1 , v 2 , v 3 } es ortogonal.
Ya estamos en condiciones de generalizar. Los vectores de B 0 se obtendrán recursivamente en la forma
(ui , v 1 )
(ui , v 2 )
(ui , v i−1 )
v1 −
v2 − · · · −
v i−1 ,
2
2
||v 1 ||
||v 2 ||
||v i−1 ||2
v i = ui −
i = 2, . . . , n
(3.61)
Conseguir una base ortonormal es ahora sencillo. Basta con normalizar (dividir por la
norma) los vectores de B 0 para convertirlos en unitarios obteniendo la base ortonormal
B 00 = {w1 , w2 , w 3 , . . . , wn },
con w i =
vi
, i = 1, . . . , n
||v i ||
(3.62)
Ejemplo 3.5 Hallar una base ortonormal de R3 con el producto escalar usual a
partir de la base B = {(1, 1, 1), (1, 1, 0), (1, 0, 0)}
Solución Tomaremos en primer lugar
v 1 = u1 = (1, 1, 1)
con ||v 1 || =
√
3. A continuación, teniendo en cuenta que (u2 , v 1 ) = 2, obtenemos
v 2 = u2 −
con ||v 2 || =
v 3 = u3 −
p
1
2
(u2 , v 1 )
= (1, 1, 0) − · (1, 1, 1) = (1, 1, −2)
2
||v 1 ||
3
3
2/3. Por último, al ser (u3 , v 1 ) = 1 y (u3 , v 2 ) = 1/3, obtenemos
(u3 , v 2 )
1
1/3 1
1
(u3 , v 1 )
v1 −
v 2 = (1, 0, 0)− (1, 1, 1)−
(1, 1, −2) = (1, −1, 0)
2
2
||v 1 ||
||v 2 ||
3
2/3 3
2
con ||v 3 || =
√
2/2.
Finalmente, sin más que dividir por su norma cada uno de los vectores hallados
Apuntes de Álgebra Lineal
A. Rodrı́guez
3.5 Bases ortonormales
85
obtenemos la base ortonormal
1
1
1
B 00 = { √ (1, 1, 1), √ (1, 1, −2), √ (1, −1, 0)}
3
6
2
(3.63)
Si ahora disponemos los vectores de B 00 en las columnas de una matriz




P =


1
1
√
√
3
3
1
1
√
√
6
6
1
1
√ −√
2
2
1
√
3
−2
√
6
0







(3.64)
ésta será la matriz de cambio de base desde la base canónica hasta B 00 . Como ambas
bases son ortonormales, P será ortogonal, como puede comprobarse fácilmente.
De hecho, una caracterı́stica de las matrices ortogonales de orden n es que sus
columnas (ası́ como sus filas) forman bases ortonormales en Rn respecto al producto
escalar usual.
Ejemplo 3.6 Hallar una base ortonormal de V = P2 (R) con el producto escalar
(p, q) =
Z
1
p(t)q(t) dt
(3.65)
−1
a partir de la base canónica Bc = {1, t, t2 }.
Solución Llamaremos p1 , p2 , p3 a los polinomios de la base canónica y q1 , q2 , q3 a
los de la base ortonormal. Primero hacemos
q1 (t) = p1 (t) = 1
con ||q1 ||2 =
R1
−1
dt = 2.
A continuación, teniendo en cuenta que (p2 , q1 ) =
q2 (t) = p2 (t) −
con ||q2 (t)||2 =
(3.66)
R1
−1
R1
−1
t dt = 0
(p2 , q1 )
q1 (t) = t
||q1 ||2
t2 dt = 2/3. Es decir, el conjunto {1, t} ya era ortogonal.
(3.67)
86
Producto escalar en un espacio vectorial.
Por último, teniendo en cuenta que (p3 , q1 ) =
R1
−1
t3 dt = 0
q3 (t) = p3 (t) −
con ||q3 ||2 =
R1
−1
R1
−1
t2 dt = 2/3 y (p3 , q2 ) =
(p3 , q2 )
2/3
1
(p3 , q1 )
q1 (t) −
q2 (t) = p3 (t) −
p1 (t) = t2 −
2
2
||q1 ||
||q2 ||
2
3
(3.68)
(t2 − 1/3) dt = 8/45.
Ahora, sin más que normalizar obtenemos ya la base ortonormal
B 00 =
(
1
√ ,
2
r
3 3
t,
2 2
r )
5 2 1
t −
2
3
(3.69)
Apuntes de Álgebra Lineal
A. Rodrı́guez
Descargar