Tema 3 Producto escalar en un espacio vectorial.

Tema 3 Producto escalar en un espacio vectorial. 3.1. Producto escalar Una vez estudiada la estructura de espacio vectorial, sobrepondremos a dicha estructura una nueva operación entre vectores: el producto escalar. Nos permitirá introducir conceptos geométricos como la longitud de un vector o el ángulo entre vectores. Definición 3.1 Sea V un espacio vectorial sobre R. Definimos un producto escalar en V como una aplicación ( , ): V ×V u, v −→ R (3.1) −→ (u, v) que satisface las siguientes propiedades: P1. (u, v) = (v, u) ∀ u, v ∈ V . P2. (u, λv + µw) = λ(u, v) + µ(u, w) ∀ u, v, w ∈ V, ∀ λ, µ ∈ R. P3. (u, u) > 0 ∀ v ∈ V, ((u, u) = 0 ⇔ u = 0). Llamaremos espacio vectorial eclı́deo —y lo denotaremos por (V, ( espacio vectorial en el que se ha definido un producto escalar. , ))— a un 64 Producto escalar en un espacio vectorial. Observaciones O1. Representaremos el producto escalar de dos vectores u y v indistintamente por (u, v), hu, vi ó u · v. O2. Por la primera propiedad se dice que el producto escalar es simétrico (su valor no se altera al cambiar el orden de los vectores), en contra de lo que sucedı́a con el determinante que era antisimétrico (cambiaba de signo al intercambiar columnas). O3. La segunda propiedad es de nuevo la linealidad. Combinando las dos primeras propiedades se deduce que el producto escalar es bilineal, ya que es lineal en sus dos argumentos, es decir también sucede que (λv + µw, u) = λ(v, u) + µ(w, u) (del determinante decı́amos que era multilineal, ya que era lineal en cualquiera de las filas o columnas). O4. Por satisfacer las tres propiedades expuestas se dice que el producto escalar es una forma bilineal simétrica definida positiva. Ejemplos de productos escalares i) Sea V = Rn . Sean u = (x1 , x2 , . . . , xn ), v = (y1 , y2 , . . . , yn ). Entonces (u, v) = x1 y1 + x2 y2 + · · · + xn yn (3.2) Es el llamado producto escalar usual. Veamos que (3.2) se es efectivamente un producto escalar. P1. (v, u) = y1 x1 + y2 x2 + · · · + yn xn = x1 y1 + x2 y2 + · · · + xn yn = (u, v) P2. Sea w = (z1 , z2 , . . . , zn ). Entonces (u, λv + µw) = x1 (λy1 + µz1 ) + x2 (λy2 + µz2 ) + · · · + xn (λyn + µzn ) = λ(x1 y1 + x2 y2 + · · · + xn yn ) + µ(x1 z1 + x2 z2 + · · · + xn zn ) = = λ(u, v) + µ(u, w) Apuntes de Álgebra Lineal A. Rodrı́guez 3.1 Producto escalar 65 P3. (u, u) = x21 + x22 + · · · + x2n > 0, y al tratarse de una suma de números positivos o nulos, obviamente x21 + x22 + · · · + x2n = 0 ⇔ x1 = x2 = · · · = xn = 0 ⇒ u = 0. Como veremos más adelante, con un apropiado cambio de base todo producto escalar en un espacio de dimensión finita n puede reducirse al producto escalar usual. ii) Sea V = R2 . Para u = (x1 , x2 ), v = (y1 , y2 ) el producto escalar usual indica (u, v) = x1 y1 +x2 y2 . Veamos que podemos definir otro producto escalar diferente hu, vi = x1 y1 + x2 y1 + x1 y2 + αx2 y2 , α∈R (3.3) Veamos si (3.3) es un producto escalar P1. hv, ui = y1 x1 + y2 x1 + y1 x2 + αy2 x2 = x1 y1 + x2 y1 + x1 y2 + αx2 y2 = hu, vi. P2. Sea w = (x1 , z2 ). Entonces (u, λv + µw) = x1 (λy1 + µz1 ) + x2 (λy1 + µz1 ) + x1 (λy2 + µz2 ) + αx2 (λy2 + µz2 ) = λ(x1 y1 + x2 y1 + y2 x1 + αx2 y2 ) + µ(x1 z1 + x2 z1 + x1 z2 + αx2 z2 ) = = λ(u, v) + µ(u, w) P3. hu, ui = x21 + 2x1 x2 + αx22 = (x1 + x2 )2 + (α − 1)x22 > 0 ⇔ α − 1 > 0. Por otro lado, si α > 1 entonces (x1 + x2 )2 + (α − 1)x22 = 0 si y sólo si x1 + x 2 = 0 x2 = 0 ) ⇒ x1 = x2 = 0 Hemos probado entonces que (3.3) es un producto escalar si α > 1 Como hemos visto, un mismo espacio vectorial puede admitir productos escalares distintos. Por ejemplo, para α = 2, si u = (1, 1) y v = (−1, 1), entonces (u, v) = 0, pero hu, vi = −3. 66 Producto escalar en un espacio vectorial. iii) Sea V = C(R). Sean f, g ∈ V . Definimos (f, g) = Z b f (t)g(t) dt (3.4) a Veamos que se trata de un producto escalar i) (g, f ) = Z b g(t)f (t) dt = a Z b f (t)g(t) dt = (f, g) a ii) Sea h ∈ V , entonces por linealidad de la integración (f, λg + µh) = Z Z b b f (t)(λg(t) + µh(t)) dt = (λf (t)g(t) + µf (t)h(t)) dt = a Z b Z b f (t)h(t) dt = λ(f, g) + µ(f, h) f (t)g(t) dt + µ =λ a a iii) (f, f ) = Z a b f 2 (t) dt > 0, ya que f 2 (t) > 0, por lo que el área bajo su gráfica a será positiva (y nula si y sólo si f es la función nula en [a, b]). iv) Sea V = Pn (R). Sean x0 , x1 , . . . , xn ∈ R, n + 1 números reales distintos y sean p, q ∈ V . Definimos (p, q) = p(x0 )q(x0 ) + p(x1 )q(x1 ) + · · · + p(xn )q(xn ) (3.5) Veamos que es un producto escalar P1. (q, p) = q(x0 )p(x0 )+· · ·+q(xn )p(xn ) = p(x0 )q(x0 )+· · ·+p(xn )q(xn ) = (p, q) P2. Sea r ∈ V . Entonces (p, λq + µr) = p(x0 )(λq(x0 ) + µr(x0 )) + · · · + p(xn )(λq(xn ) + µr(xn )) = = λ(p(x0 )q(x0 ) + · · · + p(xn )q(xn )) + µ(p(x0 )r(x0 ) + · · · + p(xn )r(xn )) = λ(p, q) + µ(p, r) P3. (p, p) = p(x0 )2 + p(x1 )2 + · · · + p(xn )2 > 0. Por otro lado p(x0 )2 + p(x1 )2 + · · · + p(xn )2 = 0 ⇔ p(x0 ) = p(x1 ) = · · · = p(xn ) = 0. Ahora bien, como p es un polinomio de grado 6 n tendrá a lo sumo en n raı́ces reales (nunca Apuntes de Álgebra Lineal A. Rodrı́guez 3.1 Producto escalar 67 n + 1 salvo en el caso trivial del polinomio nulo) por lo que (p, p) = 0 ⇔ p(x) = 0 + 0x + · · · + 0xn . v) Sea V = Mn (R). Sean A, B ∈ V . Definimos (A, B) = tr(AB T ) (3.6) donde tr(AB T ) indica la trazaa de la matriz AB T . Veamos que estamos de nuevo frente a un producto escalar P1. (B, A) = tr(BAT ) = tr((BAT )T ) = tr(AB T ) = (A, B), donde hemos utilizado las propiedades (AT )T = A y (AB)T = B T AT de la trasposición de matrices. P2. Sea C ∈ V . Entonces (A, λB + µC) = tr(A(λB + µC)T ) = tr(λAB T + µAC T ) = λtr(AB T ) + µtr(AC T ) = λ(A, B) + µ(A, C). P P3. (A, A) = tr(AAT ) = ni=1 (AAT )ii . Ahora bien, como es sabido del producto P de matrices (AB)ij = nk=1 aik bkj , por lo que si B = AT entonces (AAT )ij = Pn Pn T T k=1 aik (A )kj = k=1 aik ajk , de donde con i = j obtenemos (AA )ii = Pn 2 k=1 aik . De esta manera (A, A) = n X n X a2ij > 0 i=1 j=1 Además, por tratarse de una suma de cuadrados (A, A) = 0 ⇔ aij = 0 ∀ i, j ⇒ A = O. a La traza de una matriz cuadrada A se define como la suma de los elementos de su diagonal tr(A) = n X i=1 y satisface las siguientes propiedades a) tr(A) = tr(AT ) b) tr(λA + µB) = λtrA + µtrB aii (3.7) 68 Producto escalar en un espacio vectorial. 3.2. Norma de un vector Definiremos ahora una nueva aplicación, relacionada con el producto escalar, cuyo significado geométrico es la longitud o módulo de un vector. Definición 3.2 Sea V un espacio vectorial sobre R. Definimos una norma en V como una aplicación || || : V −→ R+ u −→ ||u|| (3.8) que satisface las siguientes propiedades: P1. ||λu|| = |λ|||u|| ∀ u ∈ V, ∀ λ ∈ R. P2. ||u|| > 0 ∀ u ∈ V, (||u|| = 0 ⇔ u = 0). P3. ||u + v|| 6 ||u|| + ||v|| ∀ u, v ∈ V . Llamaremos espacio vectorial normado —y lo denotaremos por (V, || ||)— a un espacio vectorial en el que se ha definido una norma. Observaciones O1. La tercera propiedad es la llamada desigualdad triangular, y tiene su origen en la relación entre las longitudes de los lados de un triángulo. O2. Por satisfacer las tres propiedades anteriores se dice que la norma es una forma cuadrática definida positiva. Veamos ahora que en todo espacio vectorial euclı́deo existe una norma que proviene del producto escalar. Teorema 3.1 Sea (V, ( , )) un espacio vectorial euclı́deo. Entonces p ||v|| = + (v, v) es una norma en V a la que llamaremos norma euclı́dea. Apuntes de Álgebra Lineal (3.9) A. Rodrı́guez 3.2 Norma de un vector 69 Demostración Tendremos que probar que (3.9) satisface las propiedades de una norma. p p p P1. ||λv|| = + (λv, λv) = + λ2 (v, v) = +|λ| (v, v) = |λ|||v|| P2. Es inmediato a partir de la tercera propiedad del producto escalar. Para probar la desigualdad triangular antes hemos de introducir la siguiente relación Teorema 3.2 Desigualdad de Cauchy-Schwartz. Sea (V, ( , )) un espacio vectorial euclı́deo y sea || || la norma euclı́dea (3.9) definida en él. Entonces |(u, v)| 6 ||u||||v|| (3.10) Demostración Sean u, v ∈ V . Es claro que para cualquier λ ∈ R se tiene que (λu + v, λu + v) > 0. Utilizando las propiedades del producto escalar (λu + v, λu + v) = λ(u, λu + v) + (v, λu + v) = λ2 (u, u) + λ(u, v) + λ(v, u) + (v, v) = λ2 ||u||2 + 2λ(u, v) + ||v||2 > 0 Ahora bien, para que la parábola p(λ) ≡ λ2 ||u||2 + 2λ(u, v) + ||v||2 se mantenga siempre positiva o nula, ha de ser que no tenga raı́ces (de otro modo cruzarı́a el eje λ y pasarı́a de ser positiva a negativa o vice-versa), y para ello basta con que el discriminante en −2(u, v) ± p 4(u, v)2 − 4||u||2 ||v||2 2||u||2 (3.11) sea negativo o nulo, es decir 4(u, v)2 − 4||u||2 ||v||2 6 0 ⇒ |(u, v)| 6 ||u||||v|| como querı́amos probar. Una vez demostrada la desigualdad de Cauchy-Schwartz podemos probar la desigualdad triangular 70 Producto escalar en un espacio vectorial. P3. Utilizando las propiedades del producto escalar, de la norma y la desigualdad de Cauchy-Schwartz obtenemos ||u + v||2 = (u + v, u + v) = ||u||2 + 2(u, v) + ||v||2 6 ||u||2 + 2|(u, v)| + ||v||2 6 ||u||2 + 2||u||||v|| + ||v||2 = (||u|| + ||v||)2 donde, sin más que tomar raı́ces cuadradas obtenemos finalmente la desigualdad triangular. Ejemplos de normas euclı́deas Veamos las normas euclı́deas derivadas de todos los productos escalares vistos hasta ahora. i) Sea V = Rn y sea v = (x1 , x2 , . . . , xn ) ∈ V. Del producto escalar usual (3.2) se deriva la norma q ||v|| = x21 + x22 + · · · + x2n (3.12) ii) Sea V = R2 y sea v = (x1 , x2 ) ∈ V. Además de la norma usual ||v|| = el producto escalar (3.3) con α = 2 produce la norma ||v|| = q x21 + 2x1 x2 + 2x22 q = (x1 + x2 )2 + x22 Por tanto, para v = (1, 1), según la norma usual tenemos ||v|| = √ la norma (3.13) tenemos ||v|| = 5 p x21 + x22 , (3.13) √ 2, pero según iii) Sea V = C(R) y f ∈ V . Entonces el producto escalar (3.4) produce la norma ||f || = s Z b f 2 (t) dt (3.14) a iv) Sea V = Pn (R) y p ∈ V . El producto escalar (3.5) define la norma ||p|| = Apuntes de Álgebra Lineal p p(x0 )2 + p(x1 )2 + · · · + p(xn )2 (3.15) A. Rodrı́guez 3.3 Matriz de un producto escalar 71 v) Sea V = Mn (R) y A ∈ V . Del producto escalar (3.6) se sigue la norma ||A|| = tr(AAT ) (3.16) Algunos ejemplos de normas no euclı́deas Aunque no trabajaremos con ellas, es importante saber que existen normas (es decir, aplicaciones que satisfacen las propiedades dadas en la definición 3.2) que no provienen de un producto escalar. Veamos alguna de ellas. i) Sea V = Rn y v = (x1 , x2 , . . . , xn ) ∈ V . Definimos la norma p como ||v||p = p p |x1 |p + |x2 |p + · · · + |xn |p (3.17) Aunque no lo demostraremos, (3.17) satisface las propiedades de norma. Por otro lado, es inmediato que para p = 2 (3.17) se reduce a la norma euclı́dea (3.12). Por ejemplo, para n = 2 y v = (1, −2) tendremos ||v||2 = √ √ 5 y ||v||3 = 3 9. ii) La llamada norma infinito es el lı́mite con p → ∞ de la norma p. Es un sencillo ejercicio de cálculo comprobar que ||v||∞ ≡ lı́m ||v||p = máx |xi | p→∞ i (3.18) que produce, por ejemplo, ||(1, −2)||∞ = 2. 3.3. Matriz de un producto escalar Veremos ahora que, debido a la bilinealidad, podemos reexpresar el producto escalar (en espacios de dimensión finita) en forma matricial, de manera que su manejo se hace mucho más sencillo. En efecto, sea (V, ( , )) un espacio vectorial euclı́deo de dimensión finita n y sea B = {v 1 , v 2 , . . . , v n } una base de V . Sean u y v dos vectores de V cuyo producto 72 Producto escalar en un espacio vectorial. escalar (u, v) se quiere calcular. Para ello, recurriremos a su expresión en coordenadas en la base B u = x 1 v 1 + x2 v 2 + · · · + x n v n , y v = y 1 v 1 + y2 v 2 + · · · + y n v n (3.19) Teniendo en cuenta el desarrollo de u en (3.19) el producto escalar resulta (u, v) = ( n X xi v i , v) = i=1 n X i=1 xi (v i , v) = x1 (v 1 , v) + x2 (v 2 , v) + · · · + xn (v n , v) (3.20) donde hemos utilizado la linealidad del producto escalar en el primer argumento. Ahora bien, si en cada uno de los n sumandos de (3.20) introducimos el desarrollo de v en B obtenemos (u, v) = ( n X xi v i , yj v j ) j=1 i=1 = x1 (v 1 , n X n X yj v j ) + x2 (v 2 , j=1 n X j=1 yj v j ) + · · · + xn (v n , n X yj v j ) j=1 = x1 y1 (v 1 , v 1 ) + x1 y1 (v 1 , v 2 ) + · · · + x1 yn (v 1 , v n ) + x2 y1 (v 2 , v 1 ) + x2 y2 (v 2 , v 2 ) + · · · + x2 yn (v 2 , v n ) .. . + xn y1 (v n , v 1 ) + xn y2 (v n , v 2 ) + · · · + xn yn (v n , v n ) = (3.21) n X n X xi yj (v i , v j ) i=1 j=1 de donde se desprende que para conocer el producto escalar de dos vectores sólo es necesario conocer sus coordenadas en una cierta base y el producto escalar de los vectores de la dicha base entre sı́. Es un sencillo ejercicio comprobar que si hacemos X T = (x1 x2 · · · xn ), Y T = (y1 y2 · · · yn ) y G = (gij ), con gij ≡ (v i , v j ) podemos reexpresar el doble sumatorio Apuntes de Álgebra Lineal A. Rodrı́guez 3.3 Matriz de un producto escalar 73 en (3.21) como (u, v) = x1 x2  (v 1 , v 1 ) (v 1 , v 2 ) · · · (v 1 , v n )   (v 2 , v 1 ) (v 2 , v 2 ) · · · (v 2 , v n )  · · · xn  .. .. ..  . . .  (v n , v 1 ) (v n , v 2 ) · · · (v n , v n )        y1 y2 .. . yn      = X T GY   (3.22) donde G es la llamada matriz del producto escalar en la base B. Ejemplo 3.1 Calculemos ahora la matriz de algunos de los productos escalares vistos hasta ahora. i) Calculemos la matriz del producto escalar usual en Rn (3.2) en la base canónica Bc = {e1 , e2 , . . . , en } dada en (2.13) de Rn , en la cual las coordenadas de los vectores coinciden con sus componentes. Es claro que gij = (ei , ej ) = ( 1, si i = j 0, si i 6= j (3.23) por lo que G = I, es decir, la matriz del producto escalar usual en la base P P canónica será la matriz identidad. Entonces, para u = i xi ei y v = j yj ej obtenemos trivialmente (u, v) = x1 x2  y1     y2    · · · xn I  .  = x 1 y 1 + x 2 y 2 + · · · + x n y n  ..    (3.24) yn ii) Consideremos ahora el producto escalar (3.3) en R2 para α = 2 hu, vi = x1 y1 + x2 y1 + x1 y2 + 2x2 y2 (3.25) y calculemos su matriz en la base canónica Bc = {e1 , e2 } de R2 . Es inmediato comprobar que (e1 , e1 ) = (e1 , e2 ) = (e2 , e2 ) = 1 y (e2 , e2 ) = 2. Por tanto (3.25) 74 Producto escalar en un espacio vectorial. puede reexpresarse como hu, vi = x1 x2 1 1 1 2 ! y1 y2 ! (3.26) Podrı́amos haber obtenido la matriz más fácilmente ya que el elemento de matriz gij acompaña al producto xi yj (por ejemplo, el término 2x2 y2 en (3.25) da lugar al elemento de matriz g22 = 2 en (3.26)), por lo que la simple lectura de (3.25) nos lleva a la matriz sin necesidad de realizar los productos escalares. iii) Consideremos ahora el producto escalar (3.4) aunque en el espacio vectorial V = P2 (R) (de otro modo, con V = C(R) de dimension infinita no se define la matriz asociada). Tomaremos a = −1, b = 1 y calcularemos la matriz en la base canónica Bc = {1, t, t2 }. Multiplicando entre sı́ los vectores de la base (1, 1) = Z Z 1 −1 1 · 1 dt = 2; (1, t) = 1 2 t · t dt = ; (t, t) = 3 −1 2 (t, t ) = Z Z 1 −1 2 1 · t dt = 0; (1, t ) = 1 2 −1 t · t dt = 0; 2 2 (t , t ) = obtenemos la expresión matricial del producto escalar (p, q) = a0 a1  2   a2   0  2 3 0 2 3 0 2 3 0 2 5 Z Z 1 2 1 · t2 dt = ; 3 −1 1 2 t2 · t2 dt = ; 5 −1     b0     b1     b2 (3.27) donde p(t) = a0 + a1 t + a2 t2 y q(t) = b0 + b1 t + b2 t2 . Ahora disponemos de una forma alternativa de calcular integrales de polinomios de grado 6 2 en el intervalo [−1, 1]. Por ejemplo  2 Z 1   (1 − t, 1 + t) = (1 − t2 ) dt = 1 −1 0   0 −1  2 3 0 2 3 0 2 3 0 2 5     1   4  1  =   3  0 Apuntes de Álgebra Lineal A. Rodrı́guez 3.3 Matriz de un producto escalar 75 Ahora bien, aunque la expresión matricial del producto escalar supone una simplicación en los cálculos, sus elementos dependen de la base escogida. Tendremos pues que saber cómo cambia la matriz del producto escalar al cambiar la base. Si en una base B = {v 1 , v 2 , . . . , v n } la matriz G del producto escalar tiene por elementos gij = (v i , v j ), en una base distinta B 0 = {v 01 , v 02 , . . . , v 0n } la matriz G0 del producto escalar tendrá por elementos gij0 = (v 0i , v 0j ). Obtener la relación entre las matrices G y G0 es sencillo teniendo en cuenta la matriz P de cambio de base de B a B 0 . En efecto, la relación entre las coordenadas en ambas bases de los vectores u y v vendrá dada por P X0 = X y PY 0 = Y (3.28) De esta forma podremos expresar el producto escalar como (u, v) = X T GY = (P X 0 )T GP Y 0 = X 0 P T GP Y 0 = X 0 G0 Y 0 (3.29) donde hemos hecho G0 = P T GP (3.30) que nos da la relación entre las matrices del producto escalar en ambas bases. (Si dos matrices G y G0 están relacionadas mediante una matriz invertible P como en (3.30) se dice que son congruentes). Ejemplo 3.2 Calculemos la matriz del producto escalar (3.25) en la base B 0 = {v 01 ≡ (1, 0), v 02 ≡ (1, −1)} de R2 . Es claro que hv 01 , v 01 i = 1 0 1 1 1 2 ! hv 01 , v 02 i = 1 0 ! = 1; 1 0 hv 02 , v 02 i = 1 1 1 2 ! 1 −1 1 −1 ! 1 1 1 2 ! 1 −1 ! =0 por lo que la matriz del producto escalar será la matriz identidad G0 = I. Si consideramos ahora los vectores expresados en B 0 : u = x01 v 01 + x02 v 02 y v = y10 v 01 + y20 v 02 , entonces hu, vi = x01 x02 1 0 0 1 ! x01 y10 ! = x01 y10 + x02 y20 (3.31) =1 76 Producto escalar en un espacio vectorial. El mismo resultado se obtendrı́a aplicando la relación (3.30) con la matriz P = 1 1 0 −1 ! (3.32) de cambio de base entre la base canónica y B 0 . En efecto P T GP = 1 0 1 −1 ! 1 1 1 2 ! 1 1 0 −1 ! = 1 0 0 1 ! = G0 (3.33) En el ejemplo anterior hemos visto cómo el producto escalar (3.25) se ha simplificado notablemente ya que ¡se ha convertido en el producto escalar usual! Para ello, sólo ha sido preciso expresarlo en la base adecuada. Estudiaremos este tipo de bases en la siguiente sección. 3.4. Ángulo entre vectores Introduciremos una última noción geométrica: el ángulo entre dos vectores. Definición 3.3 Sea (V, ( , )) un espacio vectorial euclı́deo y sea || || la norma euclı́dea definida en él. Definimos el ángulo α entre dos vectores no nulos u, v ∈ V como cos α = (u, v) ||u||||v|| (3.34) Observaciones O1. Por convenio tomaremos α ∈ [0, π). O2. Obsérvese que la expresión (3.34) es una buena definición para un ángulo ya que por la desigualdad de Cauchy-Schwartz |(u, v)| 6 ||u||||v||, luego |(u, v)|/||u||||v|| 6 1 lo que llevado a (3.34) produce | cos α| 6 1, como debe ser. Apuntes de Álgebra Lineal A. Rodrı́guez 3.4 Ángulo entre vectores 77 O3. De (3.34) se desprende fácilmente que dos vectores no nulos son perpendiculales (forman un ángulo α = π/2) si y sólo si su producto escalar es nulo. En efecto π (u, v) = cos α ||u|| ||v|| = 0 ⇔ cos α = 0 ⇒ α = |{z} |{z} 2 6=0 (3.35) 6=0 Igualmente puede probarse que dos vectores son linealmente dependientes si y sólo si forman un ángulo α = 0 ó π (es decir, son proporcionales). En adelante nos ocuparemos de los conjuntos de vectores perpendiculares entre sı́. Definición 3.4 Sea (V, ( , )) un espacio vectorial euclı́deo y sea S = {v 1 , v 2 , . . . , v n } ⊂ V . Entonces Se dice que S es un conjunto ortogonal si (v i , v j ) = 0 para i 6= j. Si además (v i , v i ) = 1 ∀ i, se dice que S es ortonormal. Observaciones O1. Los conjuntos ortogonales son conjuntos de vectores perpendiculares entre sı́ (lo que representaremos por v i ⊥ v j ) y pueden incluir el vector 0. O2. Se dice que un vector está normalizado si su norma es la unidad. Los conjuntos ortonormales son, pues, conjuntos ortogonales normalizados, ya que (v i , v i ) = ||v i ||2 = 1 ∀ i (un conjunto ortonormal, por lo tanto, no puede incluir el 0). Propiedades de los conjuntos ortogonales y ortonormales P1. 0 ⊥ v ∀ v ∈ V . P2. u ⊥ v ⇔ ||u + v||2 = ||u||2 + ||v||2 . P3. Todo conjunto ortonormal es linealmente independiente. 78 Producto escalar en un espacio vectorial. Demostración P1. Se sigue de la linealidad del producto escalar. En efecto, como podemos escribir 0 = u − u ∀ u, entonces (0, v) = (u − u, v) = (u, v) − (u, v) = 0 ∀ v ∈ V . (Obsérvese que este es el mismo razonamiento que nos condujo a que el determinante de una matriz con una columna de ceros es nulo). P2. Es el conocido Teorema de Pitágoras. Demostraremos sólamente la implicación hacia la derecha. ||u + v||2 = (u + v, u + v) = ||u||2 + ||v||2 + 2(u, v) = ||u||2 + ||v||2 u⊥v Esta propiedad puede generalizarse fácilmente. S = {v 1 , v 2 , . . . , v n } será un conjunto ortogonal si y sólo si ||v 1 + v 2 + · · · + v n ||2 = ||v 1 ||2 + ||v 2 ||2 + · · · + ||v n ||2 (3.36) P3. Sea S = {v 1 , v 2 , . . . , v n } ortonormal. Para ver que es linealmente independiente plantearemos la combinación lineal λ1 v 1 + λ 2 v 2 + · · · + λ n v n = 0 (3.37) Si multiplicamos escalarmente ambos lados de la igualdad por v 1 obtenemos (v 1 , λ1 v 1 + λ2 v 2 + · · · + λn v n ) = (v 1 , 0) (3.38) El primer término de (3.38) se descompone en n productos escalares, mientras que el segundo se anula por la primera propiedad demostrada arriba, con lo que finalmente resulta λ1 (v 1 , v 1 ) + λ2 (v 1 , v 2 ) + · · · + λn (v 1 , v n ) = 0 (3.39) Ahora bien, todos los productos escalares en (3.39) se anulan salvo el primero que vale 1, por lo que finalmente obtenemos λ1 = 0. Si ahora multiplicamos (3.38) por v 2 , . . . , v n , obtenemos respectivamente λ2 = · · · = λn = 0, por lo que S es linealmente independiente. Apuntes de Álgebra Lineal A. Rodrı́guez 3.5 Bases ortonormales 79 Obsérvese que esta propiedad también serı́a válida para un conjunto ortogonal siempre y cuando no contuviera al vector 0 (ya que, como sabemos, todo conjunto que contiene al 0 es dependiente). Esta última propiedad de los conjuntos ortonormales los convierte en bases cuando su número de vectores coincida con la dimensión del espacio. Veremos que este tipo de bases son las más importantes en los espacios vectoriales euclı́deos. 3.5. Bases ortonormales Definición 3.5 Sea (V, ( , )) un espacio vectorial euclı́deo de dimensión n y sea B = {v 1 , v 2 , . . . , v n } una base de V . Diremos que B es una base ortonormal de V si es, además, un conjunto ortonormal. Veremos a continuación las propiedades de las bases ortonormales que las convierten en las bases más adecuadas para utilizar en los espacios vectoriales euclı́deos. Propiedades de las bases ortonormales P1. Sea G la matriz de un producto escalar en una base ortonormal. Entonces G=I (3.40) P2. Sea v ∈ V y sea B = {v 1 , v 2 , . . . , v n } una base ortonormal de V . Entonces v = (v, v 1 )v 1 + (v, v 2 )v 2 + · · · + (v, v n )v n (3.41) P3. Sean B y B 0 dos bases ortonormales y sea P la matriz de cambio de base entre B y B 0 . Entonces P es una matriz ortogonal, es decir PPT = PTP = I o, lo que es lo mismo, P −1 = P T . (3.42) 80 Producto escalar en un espacio vectorial. Demostración P1. Por la propia definición, al ser B una base ortonormal, entonces gij = (v i , v j ) = ( 1, si i = j 0, si i 6= j (3.43) lo que significa que si si expresamos los vectores u y v en la base ortonormal como u = x1 v 1 + x2 v 2 + · · · + xn v n y v = y1 v 1 + y2 v 2 + · · · + yn v n , entonces (u, v) = x1 y1 + x2 y2 + · · · + xn yn (3.44) es decir, en una base ortonormal todo producto escalar ¡se reduce al producto escalar usual! P2. Esta propiedad nos indica que las coordenadas de un vector en una base ortonormal coinciden con los productos escalares del vector por los vectores respectivos de la base. Veamos que esto es ası́. En principio, por ser B una base todo vector v se podrá representar según unas ciertas coordenadas v = x1 v 1 + x2 v 2 + · · · + x n v n (3.45) Si en (3.45) multiplicamos escalarmente por v 1 a derecha e izquierda del igual obtenemos (v, v 1 ) = (x1 v 1 + x2 v 2 + · · · + xn v n , v 1 ) = x1 (v 1 , v 1 ) + x2 (v 2 , v 1 ) + · · · + xn (v n , v 1 ) = x1 donde hemos utilizado la linealidad del producto escalar y el hecho de que B es ortonormal. Análogamente, mulitiplicando (3.45) por v 2 , . . . , v n , se obtiene (v, v 2 ) = x2 , . . . , (v, v n ) = xn . P3. En efecto, si retomamos la expresión (3.30) G0 = P T GP (3.46) que relaciona la matriz del producto escalar en dos bases distintas y tenemos Apuntes de Álgebra Lineal A. Rodrı́guez 3.5 Bases ortonormales 81 en cuenta que ambas son ortonormales, entonces G = G0 = I, lo que llevado a (3.46) produce P T P = I. Ejemplo 3.3 Retomemos ahora los ejemplos de bases ortonormales que hemos visto durante el tema. i) Como hemos visto en el ejemplo 3.1 la base canónica de Rn es una base ortonormal para el producto escalar usual, aunque podemos encontrar otras bases ortonormales para dicho producto escalar. Por ejemplo, sea n = 2 y sea la base 1 1 B 0 = {v 01 ≡ √ (1, 1), v 02 ≡ √ (−1, 1)} 2 2 (3.47) Es fácil comprobar que ||v10 || = ||v20 || = 1 y (v 01 , v 02 ) = 0, por lo que B 0 es ortonormal. Encontrar las coordenadas de un vector en dicha base será sencillo. √ √ Por ejemplo, para v = (2, 1) tenemos (v, v 01 ) = 3/ 2 y (v, v 02 ) = −1/ 2 por lo que podemos expresar 3 1 1 1 3 1 v = (2, 1) = √ √ (1, 1) − √ √ (−1, 1) = √ v 01 − √ v 02 2 2 2 2 2 2 (3.48) Por otro lado, la matriz P de cambio de base entre la base canónica y B 0 contendrá los vectores de B 0 puestos en columnas 1 P =√ 2 1 −1 1 1 ! (3.49) Al tratarse de dos bases ortonormales la matriz de cambio ha de ser ortogonal, lo que podemos comprobar con un sencillo cálculo 1 PPT = √ 2 1 −1 1 1 ! 1 √ 2 1 1 −1 1 ! = 1 0 0 1 ! =I (3.50) ii) Ni la base canónica ni la base (3.47), en cambio, son ortonormales para el producto escalar (3.25). No obstante en el ejemplo 3.1 encontramos una base ortonormal B 0 = {(1, 0), (1, 1)} para dicho producto escalar. 82 Producto escalar en un espacio vectorial. Ejemplo 3.4 Encontrar la forma de todas las matrices ortogonales 2 × 2. a b Solución Sea A = c d ! una matriz ortogonal de orden 2. Entonces ha de cumplir At A = a c b d ! a b c d ! a2 + c2 ab + cd = ab + cd b2 + d2 ! = 1 0 0 1 ! (3.51) Ahora bien, (3.51) se satisface si y sólo si  2 2    a +c =1 ab + cd = 0    b2 + d 2 = 1 (3.52) que es un sistema no lineal de 3 ecuaciones y 4 incógnitas. Para que las ecuaciones primera y tercera de (3.52) se satisfagan podemos imponer a = cos α, c = sen α (3.53) b = cos β, d = sen β para unos ciertos ángulos α, β ∈ [0, 2π). Si ahora introducimos las restricciones (3.53) en la segunda ecuación de (3.52) obtenemos ab + cd = cos α cos β + sen α sen β = cos(α − β) = 0 ⇒ α − β = ± π 2 (3.54) Si ahora introducimos las condiciones (3.53) y (3.54) en A obtenemos A= cos α sen α cos(α ± π/2) sen (α ± π/2) ! (3.55) donde, si tenemos en cuenta que cos(α ± π/2) = ∓ sen α y sen (α ± π/2) = ± cos α, sólo resultan dos posibilidades Rα ≡ Apuntes de Álgebra Lineal cos α − sen α sen α cos α ! ó Sα/2 ≡ cos α sen α sen α − cos α ! (3.56) A. Rodrı́guez 3.5 Bases ortonormales 83 para α ∈ [0, 2π). Obsérvese que la matriz ortogonal (3.49) del ejemplo 3.3 coincide con Rπ/4 . Volveremos sobre el significado de estas matrices en el tema 6. Ya que las bases ortonormales han demostrado tener propiedades tan simplificadoras será interesante tener un método para obtenerlas. Lo veremos en la siguiente sección. 3.5.1. Método de ortogonalización de Gram-Schmidt El método de ortogonalización de Gram-Schmidt nos permitirá encontrar a partir de una base B = {u1 , u2 , u3 , . . . , un } otra base ortogonal B 0 = {v 1 , v 2 , u3 , . . . , v n } de la siguiente forma. Tomaremos como primer vector de la base ortogonal el primer vector de la base inicial, es decir v 1 = u1 (3.57) Posteriormente, trataremos de encontrar el vector vector v 2 como una combinación lineal del segundo vector de la base inicial u2 con el vector v 1 en la forma v 2 = u2 + αv 1 de tal forma que v 2 sea perpendicular a v 1 , es decir (v 2 , v 1 ) = (u2 + αv 1 , v 1 ) = (u2 , v 1 ) + α||v 1 ||2 = 0 ⇒ α = − (u2 , v 1 ) ||v 1 ||2 (3.58) con lo que resulta v 2 = u2 − (u2 , v 1 ) v1 ||v 1 ||2 (3.59) y el conjunto {v 1 , v 2 } es ortogonal. A continuación, buscamos v 3 de como una combinación lineal del tercer vector de la base inicial u3 y los dos vectores ya hallados v 1 y v 2 en la forma v 3 = u3 +αv 1 +βv 2 de modo que v 3 sea perpendicular a v 1 y v 2 (u3 , v 1 ) ||v 1 ||2 (u3 , v 2 ) (v 3 , v 2 ) =(u3 + αv 1 + βv 2 , v 2 ) = (u3 , v 2 ) + β||v 2 ||2 = 0 ⇒ β = − ||v 2 ||2 (v 3 , v 1 ) =(u3 + αv 1 + βv 2 , v 1 ) = (u3 , v 1 ) + α||v 1 ||2 = 0 ⇒ α = − 84 Producto escalar en un espacio vectorial. donde hemos utilizado que (v 1 , v 2 ) = 0. Finalmente resulta v 3 = u3 − (u3 , v 2 ) (u3 , v 1 ) v1 − v2 2 ||v 1 || ||v 2 ||2 (3.60) y el conjunto {v 1 , v 2 , v 3 } es ortogonal. Ya estamos en condiciones de generalizar. Los vectores de B 0 se obtendrán recursivamente en la forma (ui , v 1 ) (ui , v 2 ) (ui , v i−1 ) v1 − v2 − · · · − v i−1 , 2 2 ||v 1 || ||v 2 || ||v i−1 ||2 v i = ui − i = 2, . . . , n (3.61) Conseguir una base ortonormal es ahora sencillo. Basta con normalizar (dividir por la norma) los vectores de B 0 para convertirlos en unitarios obteniendo la base ortonormal B 00 = {w1 , w2 , w 3 , . . . , wn }, con w i = vi , i = 1, . . . , n ||v i || (3.62) Ejemplo 3.5 Hallar una base ortonormal de R3 con el producto escalar usual a partir de la base B = {(1, 1, 1), (1, 1, 0), (1, 0, 0)} Solución Tomaremos en primer lugar v 1 = u1 = (1, 1, 1) con ||v 1 || = √ 3. A continuación, teniendo en cuenta que (u2 , v 1 ) = 2, obtenemos v 2 = u2 − con ||v 2 || = v 3 = u3 − p 1 2 (u2 , v 1 ) = (1, 1, 0) − · (1, 1, 1) = (1, 1, −2) 2 ||v 1 || 3 3 2/3. Por último, al ser (u3 , v 1 ) = 1 y (u3 , v 2 ) = 1/3, obtenemos (u3 , v 2 ) 1 1/3 1 1 (u3 , v 1 ) v1 − v 2 = (1, 0, 0)− (1, 1, 1)− (1, 1, −2) = (1, −1, 0) 2 2 ||v 1 || ||v 2 || 3 2/3 3 2 con ||v 3 || = √ 2/2. Finalmente, sin más que dividir por su norma cada uno de los vectores hallados Apuntes de Álgebra Lineal A. Rodrı́guez 3.5 Bases ortonormales 85 obtenemos la base ortonormal 1 1 1 B 00 = { √ (1, 1, 1), √ (1, 1, −2), √ (1, −1, 0)} 3 6 2 (3.63) Si ahora disponemos los vectores de B 00 en las columnas de una matriz     P =   1 1 √ √ 3 3 1 1 √ √ 6 6 1 1 √ −√ 2 2 1 √ 3 −2 √ 6 0        (3.64) ésta será la matriz de cambio de base desde la base canónica hasta B 00 . Como ambas bases son ortonormales, P será ortogonal, como puede comprobarse fácilmente. De hecho, una caracterı́stica de las matrices ortogonales de orden n es que sus columnas (ası́ como sus filas) forman bases ortonormales en Rn respecto al producto escalar usual. Ejemplo 3.6 Hallar una base ortonormal de V = P2 (R) con el producto escalar (p, q) = Z 1 p(t)q(t) dt (3.65) −1 a partir de la base canónica Bc = {1, t, t2 }. Solución Llamaremos p1 , p2 , p3 a los polinomios de la base canónica y q1 , q2 , q3 a los de la base ortonormal. Primero hacemos q1 (t) = p1 (t) = 1 con ||q1 ||2 = R1 −1 dt = 2. A continuación, teniendo en cuenta que (p2 , q1 ) = q2 (t) = p2 (t) − con ||q2 (t)||2 = (3.66) R1 −1 R1 −1 t dt = 0 (p2 , q1 ) q1 (t) = t ||q1 ||2 t2 dt = 2/3. Es decir, el conjunto {1, t} ya era ortogonal. (3.67) 86 Producto escalar en un espacio vectorial. Por último, teniendo en cuenta que (p3 , q1 ) = R1 −1 t3 dt = 0 q3 (t) = p3 (t) − con ||q3 ||2 = R1 −1 R1 −1 t2 dt = 2/3 y (p3 , q2 ) = (p3 , q2 ) 2/3 1 (p3 , q1 ) q1 (t) − q2 (t) = p3 (t) − p1 (t) = t2 − 2 2 ||q1 || ||q2 || 2 3 (3.68) (t2 − 1/3) dt = 8/45. Ahora, sin más que normalizar obtenemos ya la base ortonormal B 00 = ( 1 √ , 2 r 3 3 t, 2 2 r ) 5 2 1 t − 2 3 (3.69) Apuntes de Álgebra Lineal A. Rodrı́guez

Tema 3 Producto escalar en un espacio vectorial.

Documentos relacionados

Productos

Apoyo

Tema 3 Producto escalar en un espacio vectorial.

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib