Tema 3 Producto escalar en un espacio vectorial. 3.1. Producto escalar Una vez estudiada la estructura de espacio vectorial, sobrepondremos a dicha estructura una nueva operación entre vectores: el producto escalar. Nos permitirá introducir conceptos geométricos como la longitud de un vector o el ángulo entre vectores. Definición 3.1 Sea V un espacio vectorial sobre R. Definimos un producto escalar en V como una aplicación ( , ): V ×V u, v −→ R (3.1) −→ (u, v) que satisface las siguientes propiedades: P1. (u, v) = (v, u) ∀ u, v ∈ V . P2. (u, λv + µw) = λ(u, v) + µ(u, w) ∀ u, v, w ∈ V, ∀ λ, µ ∈ R. P3. (u, u) > 0 ∀ v ∈ V, ((u, u) = 0 ⇔ u = 0). Llamaremos espacio vectorial eclı́deo —y lo denotaremos por (V, ( espacio vectorial en el que se ha definido un producto escalar. , ))— a un 64 Producto escalar en un espacio vectorial. Observaciones O1. Representaremos el producto escalar de dos vectores u y v indistintamente por (u, v), hu, vi ó u · v. O2. Por la primera propiedad se dice que el producto escalar es simétrico (su valor no se altera al cambiar el orden de los vectores), en contra de lo que sucedı́a con el determinante que era antisimétrico (cambiaba de signo al intercambiar columnas). O3. La segunda propiedad es de nuevo la linealidad. Combinando las dos primeras propiedades se deduce que el producto escalar es bilineal, ya que es lineal en sus dos argumentos, es decir también sucede que (λv + µw, u) = λ(v, u) + µ(w, u) (del determinante decı́amos que era multilineal, ya que era lineal en cualquiera de las filas o columnas). O4. Por satisfacer las tres propiedades expuestas se dice que el producto escalar es una forma bilineal simétrica definida positiva. Ejemplos de productos escalares i) Sea V = Rn . Sean u = (x1 , x2 , . . . , xn ), v = (y1 , y2 , . . . , yn ). Entonces (u, v) = x1 y1 + x2 y2 + · · · + xn yn (3.2) Es el llamado producto escalar usual. Veamos que (3.2) se es efectivamente un producto escalar. P1. (v, u) = y1 x1 + y2 x2 + · · · + yn xn = x1 y1 + x2 y2 + · · · + xn yn = (u, v) P2. Sea w = (z1 , z2 , . . . , zn ). Entonces (u, λv + µw) = x1 (λy1 + µz1 ) + x2 (λy2 + µz2 ) + · · · + xn (λyn + µzn ) = λ(x1 y1 + x2 y2 + · · · + xn yn ) + µ(x1 z1 + x2 z2 + · · · + xn zn ) = = λ(u, v) + µ(u, w) Apuntes de Álgebra Lineal A. Rodrı́guez 3.1 Producto escalar 65 P3. (u, u) = x21 + x22 + · · · + x2n > 0, y al tratarse de una suma de números positivos o nulos, obviamente x21 + x22 + · · · + x2n = 0 ⇔ x1 = x2 = · · · = xn = 0 ⇒ u = 0. Como veremos más adelante, con un apropiado cambio de base todo producto escalar en un espacio de dimensión finita n puede reducirse al producto escalar usual. ii) Sea V = R2 . Para u = (x1 , x2 ), v = (y1 , y2 ) el producto escalar usual indica (u, v) = x1 y1 +x2 y2 . Veamos que podemos definir otro producto escalar diferente hu, vi = x1 y1 + x2 y1 + x1 y2 + αx2 y2 , α∈R (3.3) Veamos si (3.3) es un producto escalar P1. hv, ui = y1 x1 + y2 x1 + y1 x2 + αy2 x2 = x1 y1 + x2 y1 + x1 y2 + αx2 y2 = hu, vi. P2. Sea w = (x1 , z2 ). Entonces (u, λv + µw) = x1 (λy1 + µz1 ) + x2 (λy1 + µz1 ) + x1 (λy2 + µz2 ) + αx2 (λy2 + µz2 ) = λ(x1 y1 + x2 y1 + y2 x1 + αx2 y2 ) + µ(x1 z1 + x2 z1 + x1 z2 + αx2 z2 ) = = λ(u, v) + µ(u, w) P3. hu, ui = x21 + 2x1 x2 + αx22 = (x1 + x2 )2 + (α − 1)x22 > 0 ⇔ α − 1 > 0. Por otro lado, si α > 1 entonces (x1 + x2 )2 + (α − 1)x22 = 0 si y sólo si x1 + x 2 = 0 x2 = 0 ) ⇒ x1 = x2 = 0 Hemos probado entonces que (3.3) es un producto escalar si α > 1 Como hemos visto, un mismo espacio vectorial puede admitir productos escalares distintos. Por ejemplo, para α = 2, si u = (1, 1) y v = (−1, 1), entonces (u, v) = 0, pero hu, vi = −3. 66 Producto escalar en un espacio vectorial. iii) Sea V = C(R). Sean f, g ∈ V . Definimos (f, g) = Z b f (t)g(t) dt (3.4) a Veamos que se trata de un producto escalar i) (g, f ) = Z b g(t)f (t) dt = a Z b f (t)g(t) dt = (f, g) a ii) Sea h ∈ V , entonces por linealidad de la integración (f, λg + µh) = Z Z b b f (t)(λg(t) + µh(t)) dt = (λf (t)g(t) + µf (t)h(t)) dt = a Z b Z b f (t)h(t) dt = λ(f, g) + µ(f, h) f (t)g(t) dt + µ =λ a a iii) (f, f ) = Z a b f 2 (t) dt > 0, ya que f 2 (t) > 0, por lo que el área bajo su gráfica a será positiva (y nula si y sólo si f es la función nula en [a, b]). iv) Sea V = Pn (R). Sean x0 , x1 , . . . , xn ∈ R, n + 1 números reales distintos y sean p, q ∈ V . Definimos (p, q) = p(x0 )q(x0 ) + p(x1 )q(x1 ) + · · · + p(xn )q(xn ) (3.5) Veamos que es un producto escalar P1. (q, p) = q(x0 )p(x0 )+· · ·+q(xn )p(xn ) = p(x0 )q(x0 )+· · ·+p(xn )q(xn ) = (p, q) P2. Sea r ∈ V . Entonces (p, λq + µr) = p(x0 )(λq(x0 ) + µr(x0 )) + · · · + p(xn )(λq(xn ) + µr(xn )) = = λ(p(x0 )q(x0 ) + · · · + p(xn )q(xn )) + µ(p(x0 )r(x0 ) + · · · + p(xn )r(xn )) = λ(p, q) + µ(p, r) P3. (p, p) = p(x0 )2 + p(x1 )2 + · · · + p(xn )2 > 0. Por otro lado p(x0 )2 + p(x1 )2 + · · · + p(xn )2 = 0 ⇔ p(x0 ) = p(x1 ) = · · · = p(xn ) = 0. Ahora bien, como p es un polinomio de grado 6 n tendrá a lo sumo en n raı́ces reales (nunca Apuntes de Álgebra Lineal A. Rodrı́guez 3.1 Producto escalar 67 n + 1 salvo en el caso trivial del polinomio nulo) por lo que (p, p) = 0 ⇔ p(x) = 0 + 0x + · · · + 0xn . v) Sea V = Mn (R). Sean A, B ∈ V . Definimos (A, B) = tr(AB T ) (3.6) donde tr(AB T ) indica la trazaa de la matriz AB T . Veamos que estamos de nuevo frente a un producto escalar P1. (B, A) = tr(BAT ) = tr((BAT )T ) = tr(AB T ) = (A, B), donde hemos utilizado las propiedades (AT )T = A y (AB)T = B T AT de la trasposición de matrices. P2. Sea C ∈ V . Entonces (A, λB + µC) = tr(A(λB + µC)T ) = tr(λAB T + µAC T ) = λtr(AB T ) + µtr(AC T ) = λ(A, B) + µ(A, C). P P3. (A, A) = tr(AAT ) = ni=1 (AAT )ii . Ahora bien, como es sabido del producto P de matrices (AB)ij = nk=1 aik bkj , por lo que si B = AT entonces (AAT )ij = Pn Pn T T k=1 aik (A )kj = k=1 aik ajk , de donde con i = j obtenemos (AA )ii = Pn 2 k=1 aik . De esta manera (A, A) = n X n X a2ij > 0 i=1 j=1 Además, por tratarse de una suma de cuadrados (A, A) = 0 ⇔ aij = 0 ∀ i, j ⇒ A = O. a La traza de una matriz cuadrada A se define como la suma de los elementos de su diagonal tr(A) = n X i=1 y satisface las siguientes propiedades a) tr(A) = tr(AT ) b) tr(λA + µB) = λtrA + µtrB aii (3.7) 68 Producto escalar en un espacio vectorial. 3.2. Norma de un vector Definiremos ahora una nueva aplicación, relacionada con el producto escalar, cuyo significado geométrico es la longitud o módulo de un vector. Definición 3.2 Sea V un espacio vectorial sobre R. Definimos una norma en V como una aplicación || || : V −→ R+ u −→ ||u|| (3.8) que satisface las siguientes propiedades: P1. ||λu|| = |λ|||u|| ∀ u ∈ V, ∀ λ ∈ R. P2. ||u|| > 0 ∀ u ∈ V, (||u|| = 0 ⇔ u = 0). P3. ||u + v|| 6 ||u|| + ||v|| ∀ u, v ∈ V . Llamaremos espacio vectorial normado —y lo denotaremos por (V, || ||)— a un espacio vectorial en el que se ha definido una norma. Observaciones O1. La tercera propiedad es la llamada desigualdad triangular, y tiene su origen en la relación entre las longitudes de los lados de un triángulo. O2. Por satisfacer las tres propiedades anteriores se dice que la norma es una forma cuadrática definida positiva. Veamos ahora que en todo espacio vectorial euclı́deo existe una norma que proviene del producto escalar. Teorema 3.1 Sea (V, ( , )) un espacio vectorial euclı́deo. Entonces p ||v|| = + (v, v) es una norma en V a la que llamaremos norma euclı́dea. Apuntes de Álgebra Lineal (3.9) A. Rodrı́guez 3.2 Norma de un vector 69 Demostración Tendremos que probar que (3.9) satisface las propiedades de una norma. p p p P1. ||λv|| = + (λv, λv) = + λ2 (v, v) = +|λ| (v, v) = |λ|||v|| P2. Es inmediato a partir de la tercera propiedad del producto escalar. Para probar la desigualdad triangular antes hemos de introducir la siguiente relación Teorema 3.2 Desigualdad de Cauchy-Schwartz. Sea (V, ( , )) un espacio vectorial euclı́deo y sea || || la norma euclı́dea (3.9) definida en él. Entonces |(u, v)| 6 ||u||||v|| (3.10) Demostración Sean u, v ∈ V . Es claro que para cualquier λ ∈ R se tiene que (λu + v, λu + v) > 0. Utilizando las propiedades del producto escalar (λu + v, λu + v) = λ(u, λu + v) + (v, λu + v) = λ2 (u, u) + λ(u, v) + λ(v, u) + (v, v) = λ2 ||u||2 + 2λ(u, v) + ||v||2 > 0 Ahora bien, para que la parábola p(λ) ≡ λ2 ||u||2 + 2λ(u, v) + ||v||2 se mantenga siempre positiva o nula, ha de ser que no tenga raı́ces (de otro modo cruzarı́a el eje λ y pasarı́a de ser positiva a negativa o vice-versa), y para ello basta con que el discriminante en −2(u, v) ± p 4(u, v)2 − 4||u||2 ||v||2 2||u||2 (3.11) sea negativo o nulo, es decir 4(u, v)2 − 4||u||2 ||v||2 6 0 ⇒ |(u, v)| 6 ||u||||v|| como querı́amos probar. Una vez demostrada la desigualdad de Cauchy-Schwartz podemos probar la desigualdad triangular 70 Producto escalar en un espacio vectorial. P3. Utilizando las propiedades del producto escalar, de la norma y la desigualdad de Cauchy-Schwartz obtenemos ||u + v||2 = (u + v, u + v) = ||u||2 + 2(u, v) + ||v||2 6 ||u||2 + 2|(u, v)| + ||v||2 6 ||u||2 + 2||u||||v|| + ||v||2 = (||u|| + ||v||)2 donde, sin más que tomar raı́ces cuadradas obtenemos finalmente la desigualdad triangular. Ejemplos de normas euclı́deas Veamos las normas euclı́deas derivadas de todos los productos escalares vistos hasta ahora. i) Sea V = Rn y sea v = (x1 , x2 , . . . , xn ) ∈ V. Del producto escalar usual (3.2) se deriva la norma q ||v|| = x21 + x22 + · · · + x2n (3.12) ii) Sea V = R2 y sea v = (x1 , x2 ) ∈ V. Además de la norma usual ||v|| = el producto escalar (3.3) con α = 2 produce la norma ||v|| = q x21 + 2x1 x2 + 2x22 q = (x1 + x2 )2 + x22 Por tanto, para v = (1, 1), según la norma usual tenemos ||v|| = √ la norma (3.13) tenemos ||v|| = 5 p x21 + x22 , (3.13) √ 2, pero según iii) Sea V = C(R) y f ∈ V . Entonces el producto escalar (3.4) produce la norma ||f || = s Z b f 2 (t) dt (3.14) a iv) Sea V = Pn (R) y p ∈ V . El producto escalar (3.5) define la norma ||p|| = Apuntes de Álgebra Lineal p p(x0 )2 + p(x1 )2 + · · · + p(xn )2 (3.15) A. Rodrı́guez 3.3 Matriz de un producto escalar 71 v) Sea V = Mn (R) y A ∈ V . Del producto escalar (3.6) se sigue la norma ||A|| = tr(AAT ) (3.16) Algunos ejemplos de normas no euclı́deas Aunque no trabajaremos con ellas, es importante saber que existen normas (es decir, aplicaciones que satisfacen las propiedades dadas en la definición 3.2) que no provienen de un producto escalar. Veamos alguna de ellas. i) Sea V = Rn y v = (x1 , x2 , . . . , xn ) ∈ V . Definimos la norma p como ||v||p = p p |x1 |p + |x2 |p + · · · + |xn |p (3.17) Aunque no lo demostraremos, (3.17) satisface las propiedades de norma. Por otro lado, es inmediato que para p = 2 (3.17) se reduce a la norma euclı́dea (3.12). Por ejemplo, para n = 2 y v = (1, −2) tendremos ||v||2 = √ √ 5 y ||v||3 = 3 9. ii) La llamada norma infinito es el lı́mite con p → ∞ de la norma p. Es un sencillo ejercicio de cálculo comprobar que ||v||∞ ≡ lı́m ||v||p = máx |xi | p→∞ i (3.18) que produce, por ejemplo, ||(1, −2)||∞ = 2. 3.3. Matriz de un producto escalar Veremos ahora que, debido a la bilinealidad, podemos reexpresar el producto escalar (en espacios de dimensión finita) en forma matricial, de manera que su manejo se hace mucho más sencillo. En efecto, sea (V, ( , )) un espacio vectorial euclı́deo de dimensión finita n y sea B = {v 1 , v 2 , . . . , v n } una base de V . Sean u y v dos vectores de V cuyo producto 72 Producto escalar en un espacio vectorial. escalar (u, v) se quiere calcular. Para ello, recurriremos a su expresión en coordenadas en la base B u = x 1 v 1 + x2 v 2 + · · · + x n v n , y v = y 1 v 1 + y2 v 2 + · · · + y n v n (3.19) Teniendo en cuenta el desarrollo de u en (3.19) el producto escalar resulta (u, v) = ( n X xi v i , v) = i=1 n X i=1 xi (v i , v) = x1 (v 1 , v) + x2 (v 2 , v) + · · · + xn (v n , v) (3.20) donde hemos utilizado la linealidad del producto escalar en el primer argumento. Ahora bien, si en cada uno de los n sumandos de (3.20) introducimos el desarrollo de v en B obtenemos (u, v) = ( n X xi v i , yj v j ) j=1 i=1 = x1 (v 1 , n X n X yj v j ) + x2 (v 2 , j=1 n X j=1 yj v j ) + · · · + xn (v n , n X yj v j ) j=1 = x1 y1 (v 1 , v 1 ) + x1 y1 (v 1 , v 2 ) + · · · + x1 yn (v 1 , v n ) + x2 y1 (v 2 , v 1 ) + x2 y2 (v 2 , v 2 ) + · · · + x2 yn (v 2 , v n ) .. . + xn y1 (v n , v 1 ) + xn y2 (v n , v 2 ) + · · · + xn yn (v n , v n ) = (3.21) n X n X xi yj (v i , v j ) i=1 j=1 de donde se desprende que para conocer el producto escalar de dos vectores sólo es necesario conocer sus coordenadas en una cierta base y el producto escalar de los vectores de la dicha base entre sı́. Es un sencillo ejercicio comprobar que si hacemos X T = (x1 x2 · · · xn ), Y T = (y1 y2 · · · yn ) y G = (gij ), con gij ≡ (v i , v j ) podemos reexpresar el doble sumatorio Apuntes de Álgebra Lineal A. Rodrı́guez 3.3 Matriz de un producto escalar 73 en (3.21) como (u, v) = x1 x2 (v 1 , v 1 ) (v 1 , v 2 ) · · · (v 1 , v n ) (v 2 , v 1 ) (v 2 , v 2 ) · · · (v 2 , v n ) · · · xn .. .. .. . . . (v n , v 1 ) (v n , v 2 ) · · · (v n , v n ) y1 y2 .. . yn = X T GY (3.22) donde G es la llamada matriz del producto escalar en la base B. Ejemplo 3.1 Calculemos ahora la matriz de algunos de los productos escalares vistos hasta ahora. i) Calculemos la matriz del producto escalar usual en Rn (3.2) en la base canónica Bc = {e1 , e2 , . . . , en } dada en (2.13) de Rn , en la cual las coordenadas de los vectores coinciden con sus componentes. Es claro que gij = (ei , ej ) = ( 1, si i = j 0, si i 6= j (3.23) por lo que G = I, es decir, la matriz del producto escalar usual en la base P P canónica será la matriz identidad. Entonces, para u = i xi ei y v = j yj ej obtenemos trivialmente (u, v) = x1 x2 y1 y2 · · · xn I . = x 1 y 1 + x 2 y 2 + · · · + x n y n .. (3.24) yn ii) Consideremos ahora el producto escalar (3.3) en R2 para α = 2 hu, vi = x1 y1 + x2 y1 + x1 y2 + 2x2 y2 (3.25) y calculemos su matriz en la base canónica Bc = {e1 , e2 } de R2 . Es inmediato comprobar que (e1 , e1 ) = (e1 , e2 ) = (e2 , e2 ) = 1 y (e2 , e2 ) = 2. Por tanto (3.25) 74 Producto escalar en un espacio vectorial. puede reexpresarse como hu, vi = x1 x2 1 1 1 2 ! y1 y2 ! (3.26) Podrı́amos haber obtenido la matriz más fácilmente ya que el elemento de matriz gij acompaña al producto xi yj (por ejemplo, el término 2x2 y2 en (3.25) da lugar al elemento de matriz g22 = 2 en (3.26)), por lo que la simple lectura de (3.25) nos lleva a la matriz sin necesidad de realizar los productos escalares. iii) Consideremos ahora el producto escalar (3.4) aunque en el espacio vectorial V = P2 (R) (de otro modo, con V = C(R) de dimension infinita no se define la matriz asociada). Tomaremos a = −1, b = 1 y calcularemos la matriz en la base canónica Bc = {1, t, t2 }. Multiplicando entre sı́ los vectores de la base (1, 1) = Z Z 1 −1 1 · 1 dt = 2; (1, t) = 1 2 t · t dt = ; (t, t) = 3 −1 2 (t, t ) = Z Z 1 −1 2 1 · t dt = 0; (1, t ) = 1 2 −1 t · t dt = 0; 2 2 (t , t ) = obtenemos la expresión matricial del producto escalar (p, q) = a0 a1 2 a2 0 2 3 0 2 3 0 2 3 0 2 5 Z Z 1 2 1 · t2 dt = ; 3 −1 1 2 t2 · t2 dt = ; 5 −1 b0 b1 b2 (3.27) donde p(t) = a0 + a1 t + a2 t2 y q(t) = b0 + b1 t + b2 t2 . Ahora disponemos de una forma alternativa de calcular integrales de polinomios de grado 6 2 en el intervalo [−1, 1]. Por ejemplo 2 Z 1 (1 − t, 1 + t) = (1 − t2 ) dt = 1 −1 0 0 −1 2 3 0 2 3 0 2 3 0 2 5 1 4 1 = 3 0 Apuntes de Álgebra Lineal A. Rodrı́guez 3.3 Matriz de un producto escalar 75 Ahora bien, aunque la expresión matricial del producto escalar supone una simplicación en los cálculos, sus elementos dependen de la base escogida. Tendremos pues que saber cómo cambia la matriz del producto escalar al cambiar la base. Si en una base B = {v 1 , v 2 , . . . , v n } la matriz G del producto escalar tiene por elementos gij = (v i , v j ), en una base distinta B 0 = {v 01 , v 02 , . . . , v 0n } la matriz G0 del producto escalar tendrá por elementos gij0 = (v 0i , v 0j ). Obtener la relación entre las matrices G y G0 es sencillo teniendo en cuenta la matriz P de cambio de base de B a B 0 . En efecto, la relación entre las coordenadas en ambas bases de los vectores u y v vendrá dada por P X0 = X y PY 0 = Y (3.28) De esta forma podremos expresar el producto escalar como (u, v) = X T GY = (P X 0 )T GP Y 0 = X 0 P T GP Y 0 = X 0 G0 Y 0 (3.29) donde hemos hecho G0 = P T GP (3.30) que nos da la relación entre las matrices del producto escalar en ambas bases. (Si dos matrices G y G0 están relacionadas mediante una matriz invertible P como en (3.30) se dice que son congruentes). Ejemplo 3.2 Calculemos la matriz del producto escalar (3.25) en la base B 0 = {v 01 ≡ (1, 0), v 02 ≡ (1, −1)} de R2 . Es claro que hv 01 , v 01 i = 1 0 1 1 1 2 ! hv 01 , v 02 i = 1 0 ! = 1; 1 0 hv 02 , v 02 i = 1 1 1 2 ! 1 −1 1 −1 ! 1 1 1 2 ! 1 −1 ! =0 por lo que la matriz del producto escalar será la matriz identidad G0 = I. Si consideramos ahora los vectores expresados en B 0 : u = x01 v 01 + x02 v 02 y v = y10 v 01 + y20 v 02 , entonces hu, vi = x01 x02 1 0 0 1 ! x01 y10 ! = x01 y10 + x02 y20 (3.31) =1 76 Producto escalar en un espacio vectorial. El mismo resultado se obtendrı́a aplicando la relación (3.30) con la matriz P = 1 1 0 −1 ! (3.32) de cambio de base entre la base canónica y B 0 . En efecto P T GP = 1 0 1 −1 ! 1 1 1 2 ! 1 1 0 −1 ! = 1 0 0 1 ! = G0 (3.33) En el ejemplo anterior hemos visto cómo el producto escalar (3.25) se ha simplificado notablemente ya que ¡se ha convertido en el producto escalar usual! Para ello, sólo ha sido preciso expresarlo en la base adecuada. Estudiaremos este tipo de bases en la siguiente sección. 3.4. Ángulo entre vectores Introduciremos una última noción geométrica: el ángulo entre dos vectores. Definición 3.3 Sea (V, ( , )) un espacio vectorial euclı́deo y sea || || la norma euclı́dea definida en él. Definimos el ángulo α entre dos vectores no nulos u, v ∈ V como cos α = (u, v) ||u||||v|| (3.34) Observaciones O1. Por convenio tomaremos α ∈ [0, π). O2. Obsérvese que la expresión (3.34) es una buena definición para un ángulo ya que por la desigualdad de Cauchy-Schwartz |(u, v)| 6 ||u||||v||, luego |(u, v)|/||u||||v|| 6 1 lo que llevado a (3.34) produce | cos α| 6 1, como debe ser. Apuntes de Álgebra Lineal A. Rodrı́guez 3.4 Ángulo entre vectores 77 O3. De (3.34) se desprende fácilmente que dos vectores no nulos son perpendiculales (forman un ángulo α = π/2) si y sólo si su producto escalar es nulo. En efecto π (u, v) = cos α ||u|| ||v|| = 0 ⇔ cos α = 0 ⇒ α = |{z} |{z} 2 6=0 (3.35) 6=0 Igualmente puede probarse que dos vectores son linealmente dependientes si y sólo si forman un ángulo α = 0 ó π (es decir, son proporcionales). En adelante nos ocuparemos de los conjuntos de vectores perpendiculares entre sı́. Definición 3.4 Sea (V, ( , )) un espacio vectorial euclı́deo y sea S = {v 1 , v 2 , . . . , v n } ⊂ V . Entonces Se dice que S es un conjunto ortogonal si (v i , v j ) = 0 para i 6= j. Si además (v i , v i ) = 1 ∀ i, se dice que S es ortonormal. Observaciones O1. Los conjuntos ortogonales son conjuntos de vectores perpendiculares entre sı́ (lo que representaremos por v i ⊥ v j ) y pueden incluir el vector 0. O2. Se dice que un vector está normalizado si su norma es la unidad. Los conjuntos ortonormales son, pues, conjuntos ortogonales normalizados, ya que (v i , v i ) = ||v i ||2 = 1 ∀ i (un conjunto ortonormal, por lo tanto, no puede incluir el 0). Propiedades de los conjuntos ortogonales y ortonormales P1. 0 ⊥ v ∀ v ∈ V . P2. u ⊥ v ⇔ ||u + v||2 = ||u||2 + ||v||2 . P3. Todo conjunto ortonormal es linealmente independiente. 78 Producto escalar en un espacio vectorial. Demostración P1. Se sigue de la linealidad del producto escalar. En efecto, como podemos escribir 0 = u − u ∀ u, entonces (0, v) = (u − u, v) = (u, v) − (u, v) = 0 ∀ v ∈ V . (Obsérvese que este es el mismo razonamiento que nos condujo a que el determinante de una matriz con una columna de ceros es nulo). P2. Es el conocido Teorema de Pitágoras. Demostraremos sólamente la implicación hacia la derecha. ||u + v||2 = (u + v, u + v) = ||u||2 + ||v||2 + 2(u, v) = ||u||2 + ||v||2 u⊥v Esta propiedad puede generalizarse fácilmente. S = {v 1 , v 2 , . . . , v n } será un conjunto ortogonal si y sólo si ||v 1 + v 2 + · · · + v n ||2 = ||v 1 ||2 + ||v 2 ||2 + · · · + ||v n ||2 (3.36) P3. Sea S = {v 1 , v 2 , . . . , v n } ortonormal. Para ver que es linealmente independiente plantearemos la combinación lineal λ1 v 1 + λ 2 v 2 + · · · + λ n v n = 0 (3.37) Si multiplicamos escalarmente ambos lados de la igualdad por v 1 obtenemos (v 1 , λ1 v 1 + λ2 v 2 + · · · + λn v n ) = (v 1 , 0) (3.38) El primer término de (3.38) se descompone en n productos escalares, mientras que el segundo se anula por la primera propiedad demostrada arriba, con lo que finalmente resulta λ1 (v 1 , v 1 ) + λ2 (v 1 , v 2 ) + · · · + λn (v 1 , v n ) = 0 (3.39) Ahora bien, todos los productos escalares en (3.39) se anulan salvo el primero que vale 1, por lo que finalmente obtenemos λ1 = 0. Si ahora multiplicamos (3.38) por v 2 , . . . , v n , obtenemos respectivamente λ2 = · · · = λn = 0, por lo que S es linealmente independiente. Apuntes de Álgebra Lineal A. Rodrı́guez 3.5 Bases ortonormales 79 Obsérvese que esta propiedad también serı́a válida para un conjunto ortogonal siempre y cuando no contuviera al vector 0 (ya que, como sabemos, todo conjunto que contiene al 0 es dependiente). Esta última propiedad de los conjuntos ortonormales los convierte en bases cuando su número de vectores coincida con la dimensión del espacio. Veremos que este tipo de bases son las más importantes en los espacios vectoriales euclı́deos. 3.5. Bases ortonormales Definición 3.5 Sea (V, ( , )) un espacio vectorial euclı́deo de dimensión n y sea B = {v 1 , v 2 , . . . , v n } una base de V . Diremos que B es una base ortonormal de V si es, además, un conjunto ortonormal. Veremos a continuación las propiedades de las bases ortonormales que las convierten en las bases más adecuadas para utilizar en los espacios vectoriales euclı́deos. Propiedades de las bases ortonormales P1. Sea G la matriz de un producto escalar en una base ortonormal. Entonces G=I (3.40) P2. Sea v ∈ V y sea B = {v 1 , v 2 , . . . , v n } una base ortonormal de V . Entonces v = (v, v 1 )v 1 + (v, v 2 )v 2 + · · · + (v, v n )v n (3.41) P3. Sean B y B 0 dos bases ortonormales y sea P la matriz de cambio de base entre B y B 0 . Entonces P es una matriz ortogonal, es decir PPT = PTP = I o, lo que es lo mismo, P −1 = P T . (3.42) 80 Producto escalar en un espacio vectorial. Demostración P1. Por la propia definición, al ser B una base ortonormal, entonces gij = (v i , v j ) = ( 1, si i = j 0, si i 6= j (3.43) lo que significa que si si expresamos los vectores u y v en la base ortonormal como u = x1 v 1 + x2 v 2 + · · · + xn v n y v = y1 v 1 + y2 v 2 + · · · + yn v n , entonces (u, v) = x1 y1 + x2 y2 + · · · + xn yn (3.44) es decir, en una base ortonormal todo producto escalar ¡se reduce al producto escalar usual! P2. Esta propiedad nos indica que las coordenadas de un vector en una base ortonormal coinciden con los productos escalares del vector por los vectores respectivos de la base. Veamos que esto es ası́. En principio, por ser B una base todo vector v se podrá representar según unas ciertas coordenadas v = x1 v 1 + x2 v 2 + · · · + x n v n (3.45) Si en (3.45) multiplicamos escalarmente por v 1 a derecha e izquierda del igual obtenemos (v, v 1 ) = (x1 v 1 + x2 v 2 + · · · + xn v n , v 1 ) = x1 (v 1 , v 1 ) + x2 (v 2 , v 1 ) + · · · + xn (v n , v 1 ) = x1 donde hemos utilizado la linealidad del producto escalar y el hecho de que B es ortonormal. Análogamente, mulitiplicando (3.45) por v 2 , . . . , v n , se obtiene (v, v 2 ) = x2 , . . . , (v, v n ) = xn . P3. En efecto, si retomamos la expresión (3.30) G0 = P T GP (3.46) que relaciona la matriz del producto escalar en dos bases distintas y tenemos Apuntes de Álgebra Lineal A. Rodrı́guez 3.5 Bases ortonormales 81 en cuenta que ambas son ortonormales, entonces G = G0 = I, lo que llevado a (3.46) produce P T P = I. Ejemplo 3.3 Retomemos ahora los ejemplos de bases ortonormales que hemos visto durante el tema. i) Como hemos visto en el ejemplo 3.1 la base canónica de Rn es una base ortonormal para el producto escalar usual, aunque podemos encontrar otras bases ortonormales para dicho producto escalar. Por ejemplo, sea n = 2 y sea la base 1 1 B 0 = {v 01 ≡ √ (1, 1), v 02 ≡ √ (−1, 1)} 2 2 (3.47) Es fácil comprobar que ||v10 || = ||v20 || = 1 y (v 01 , v 02 ) = 0, por lo que B 0 es ortonormal. Encontrar las coordenadas de un vector en dicha base será sencillo. √ √ Por ejemplo, para v = (2, 1) tenemos (v, v 01 ) = 3/ 2 y (v, v 02 ) = −1/ 2 por lo que podemos expresar 3 1 1 1 3 1 v = (2, 1) = √ √ (1, 1) − √ √ (−1, 1) = √ v 01 − √ v 02 2 2 2 2 2 2 (3.48) Por otro lado, la matriz P de cambio de base entre la base canónica y B 0 contendrá los vectores de B 0 puestos en columnas 1 P =√ 2 1 −1 1 1 ! (3.49) Al tratarse de dos bases ortonormales la matriz de cambio ha de ser ortogonal, lo que podemos comprobar con un sencillo cálculo 1 PPT = √ 2 1 −1 1 1 ! 1 √ 2 1 1 −1 1 ! = 1 0 0 1 ! =I (3.50) ii) Ni la base canónica ni la base (3.47), en cambio, son ortonormales para el producto escalar (3.25). No obstante en el ejemplo 3.1 encontramos una base ortonormal B 0 = {(1, 0), (1, 1)} para dicho producto escalar. 82 Producto escalar en un espacio vectorial. Ejemplo 3.4 Encontrar la forma de todas las matrices ortogonales 2 × 2. a b Solución Sea A = c d ! una matriz ortogonal de orden 2. Entonces ha de cumplir At A = a c b d ! a b c d ! a2 + c2 ab + cd = ab + cd b2 + d2 ! = 1 0 0 1 ! (3.51) Ahora bien, (3.51) se satisface si y sólo si 2 2 a +c =1 ab + cd = 0 b2 + d 2 = 1 (3.52) que es un sistema no lineal de 3 ecuaciones y 4 incógnitas. Para que las ecuaciones primera y tercera de (3.52) se satisfagan podemos imponer a = cos α, c = sen α (3.53) b = cos β, d = sen β para unos ciertos ángulos α, β ∈ [0, 2π). Si ahora introducimos las restricciones (3.53) en la segunda ecuación de (3.52) obtenemos ab + cd = cos α cos β + sen α sen β = cos(α − β) = 0 ⇒ α − β = ± π 2 (3.54) Si ahora introducimos las condiciones (3.53) y (3.54) en A obtenemos A= cos α sen α cos(α ± π/2) sen (α ± π/2) ! (3.55) donde, si tenemos en cuenta que cos(α ± π/2) = ∓ sen α y sen (α ± π/2) = ± cos α, sólo resultan dos posibilidades Rα ≡ Apuntes de Álgebra Lineal cos α − sen α sen α cos α ! ó Sα/2 ≡ cos α sen α sen α − cos α ! (3.56) A. Rodrı́guez 3.5 Bases ortonormales 83 para α ∈ [0, 2π). Obsérvese que la matriz ortogonal (3.49) del ejemplo 3.3 coincide con Rπ/4 . Volveremos sobre el significado de estas matrices en el tema 6. Ya que las bases ortonormales han demostrado tener propiedades tan simplificadoras será interesante tener un método para obtenerlas. Lo veremos en la siguiente sección. 3.5.1. Método de ortogonalización de Gram-Schmidt El método de ortogonalización de Gram-Schmidt nos permitirá encontrar a partir de una base B = {u1 , u2 , u3 , . . . , un } otra base ortogonal B 0 = {v 1 , v 2 , u3 , . . . , v n } de la siguiente forma. Tomaremos como primer vector de la base ortogonal el primer vector de la base inicial, es decir v 1 = u1 (3.57) Posteriormente, trataremos de encontrar el vector vector v 2 como una combinación lineal del segundo vector de la base inicial u2 con el vector v 1 en la forma v 2 = u2 + αv 1 de tal forma que v 2 sea perpendicular a v 1 , es decir (v 2 , v 1 ) = (u2 + αv 1 , v 1 ) = (u2 , v 1 ) + α||v 1 ||2 = 0 ⇒ α = − (u2 , v 1 ) ||v 1 ||2 (3.58) con lo que resulta v 2 = u2 − (u2 , v 1 ) v1 ||v 1 ||2 (3.59) y el conjunto {v 1 , v 2 } es ortogonal. A continuación, buscamos v 3 de como una combinación lineal del tercer vector de la base inicial u3 y los dos vectores ya hallados v 1 y v 2 en la forma v 3 = u3 +αv 1 +βv 2 de modo que v 3 sea perpendicular a v 1 y v 2 (u3 , v 1 ) ||v 1 ||2 (u3 , v 2 ) (v 3 , v 2 ) =(u3 + αv 1 + βv 2 , v 2 ) = (u3 , v 2 ) + β||v 2 ||2 = 0 ⇒ β = − ||v 2 ||2 (v 3 , v 1 ) =(u3 + αv 1 + βv 2 , v 1 ) = (u3 , v 1 ) + α||v 1 ||2 = 0 ⇒ α = − 84 Producto escalar en un espacio vectorial. donde hemos utilizado que (v 1 , v 2 ) = 0. Finalmente resulta v 3 = u3 − (u3 , v 2 ) (u3 , v 1 ) v1 − v2 2 ||v 1 || ||v 2 ||2 (3.60) y el conjunto {v 1 , v 2 , v 3 } es ortogonal. Ya estamos en condiciones de generalizar. Los vectores de B 0 se obtendrán recursivamente en la forma (ui , v 1 ) (ui , v 2 ) (ui , v i−1 ) v1 − v2 − · · · − v i−1 , 2 2 ||v 1 || ||v 2 || ||v i−1 ||2 v i = ui − i = 2, . . . , n (3.61) Conseguir una base ortonormal es ahora sencillo. Basta con normalizar (dividir por la norma) los vectores de B 0 para convertirlos en unitarios obteniendo la base ortonormal B 00 = {w1 , w2 , w 3 , . . . , wn }, con w i = vi , i = 1, . . . , n ||v i || (3.62) Ejemplo 3.5 Hallar una base ortonormal de R3 con el producto escalar usual a partir de la base B = {(1, 1, 1), (1, 1, 0), (1, 0, 0)} Solución Tomaremos en primer lugar v 1 = u1 = (1, 1, 1) con ||v 1 || = √ 3. A continuación, teniendo en cuenta que (u2 , v 1 ) = 2, obtenemos v 2 = u2 − con ||v 2 || = v 3 = u3 − p 1 2 (u2 , v 1 ) = (1, 1, 0) − · (1, 1, 1) = (1, 1, −2) 2 ||v 1 || 3 3 2/3. Por último, al ser (u3 , v 1 ) = 1 y (u3 , v 2 ) = 1/3, obtenemos (u3 , v 2 ) 1 1/3 1 1 (u3 , v 1 ) v1 − v 2 = (1, 0, 0)− (1, 1, 1)− (1, 1, −2) = (1, −1, 0) 2 2 ||v 1 || ||v 2 || 3 2/3 3 2 con ||v 3 || = √ 2/2. Finalmente, sin más que dividir por su norma cada uno de los vectores hallados Apuntes de Álgebra Lineal A. Rodrı́guez 3.5 Bases ortonormales 85 obtenemos la base ortonormal 1 1 1 B 00 = { √ (1, 1, 1), √ (1, 1, −2), √ (1, −1, 0)} 3 6 2 (3.63) Si ahora disponemos los vectores de B 00 en las columnas de una matriz P = 1 1 √ √ 3 3 1 1 √ √ 6 6 1 1 √ −√ 2 2 1 √ 3 −2 √ 6 0 (3.64) ésta será la matriz de cambio de base desde la base canónica hasta B 00 . Como ambas bases son ortonormales, P será ortogonal, como puede comprobarse fácilmente. De hecho, una caracterı́stica de las matrices ortogonales de orden n es que sus columnas (ası́ como sus filas) forman bases ortonormales en Rn respecto al producto escalar usual. Ejemplo 3.6 Hallar una base ortonormal de V = P2 (R) con el producto escalar (p, q) = Z 1 p(t)q(t) dt (3.65) −1 a partir de la base canónica Bc = {1, t, t2 }. Solución Llamaremos p1 , p2 , p3 a los polinomios de la base canónica y q1 , q2 , q3 a los de la base ortonormal. Primero hacemos q1 (t) = p1 (t) = 1 con ||q1 ||2 = R1 −1 dt = 2. A continuación, teniendo en cuenta que (p2 , q1 ) = q2 (t) = p2 (t) − con ||q2 (t)||2 = (3.66) R1 −1 R1 −1 t dt = 0 (p2 , q1 ) q1 (t) = t ||q1 ||2 t2 dt = 2/3. Es decir, el conjunto {1, t} ya era ortogonal. (3.67) 86 Producto escalar en un espacio vectorial. Por último, teniendo en cuenta que (p3 , q1 ) = R1 −1 t3 dt = 0 q3 (t) = p3 (t) − con ||q3 ||2 = R1 −1 R1 −1 t2 dt = 2/3 y (p3 , q2 ) = (p3 , q2 ) 2/3 1 (p3 , q1 ) q1 (t) − q2 (t) = p3 (t) − p1 (t) = t2 − 2 2 ||q1 || ||q2 || 2 3 (3.68) (t2 − 1/3) dt = 8/45. Ahora, sin más que normalizar obtenemos ya la base ortonormal B 00 = ( 1 √ , 2 r 3 3 t, 2 2 r ) 5 2 1 t − 2 3 (3.69) Apuntes de Álgebra Lineal A. Rodrı́guez