Décimo segunda clase. Espacios vectoriales de señales

Anuncio
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
1
Décimo segunda clase. Espacios vectoriales de señales
En la clase pasada vimos el concepto de espacio vectorial en ℝn, donde los vectores eran arreglos
verticales de n números reales (o complejos) y los escalares eran números reales (o complejos), para
los cuales definimos la suma entre vectores y el producto de un vector por un escalar. El espacio
vectorial lo definimos, entonces, como un subconjunto de ℝn cerrado para las combinaciones
lineales de vectores y notamos que podíamos encontrar bases de vectores (conjuntos de n vectores
linealmente independientes) que expandían el espacio vectorial. Este concepto es extremadamente
valioso en el estudio de la física, por ejemplo, donde los espacios vectoriales resultan ser modelos
matemáticos de realidades muy concretas, como el campo gravitacional o los campos electromagnéticos (Figura 1)
Figura 1. El concepto de espacio vectorial en ℝ2 y ℝ3 tiene muchas aplicaciones en física. (a) Campo gravitacional, (b)
campo magnético, (c) campo cuántico
Pues bien, este concepto lo podemos llevar a espacios vectoriales abstractos si definimos
adecuadamente el campo de escalares, la suma de vectores y la multiplicación por escalares. Sólo
falta dar estructuras adecuadas a algunos conjuntos abstractos y a algunas operaciones dentro de
ellos. Por ejemplo, así como los espacios vectoriales en ℝn los definimos sobre el "campo escalar de
los reales", para espacios vectoriales más abstractos debemos definir una estructura correspondiente
para el campo de escalares, por lo cual definiremos las estructuras de Grupo y de Campo, que ni
siquiera tienen que ver con números. Así podremos extender el concepto de espacio vectorial a
muchas clases de objetos diferentes a los elementos de ℝn.
1. Espacios vectoriales abstractos
Un grupo {G,} es un conjunto de elementos, G, y una operación definida entre cualquier par de
esos elementos, , que satisfacen los siguientes cuatro axiomas:
 G es cerrado para . Esto es, a, b  G  a  b  G

La operación  es asociativa. Esto es, a, b, c  G  a   b  c    a  b   c

La operación  tiene un elemento identidad en G. Esto es, e  G : a  G, a  e  e  a  a

Cada elemento de G tiene un
a  G, a 1  G : a  a 1  a 1  a  e
elemento
inverso
para
 en G.
Esto
Un grupo Abeliano es un grupo que también satisface la propiedad de conmutatividad. Esto es:
es,
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
2

a, b  G  a  b  b  a
Dada la notación, es difícil dejar de pensar en el conjunto de números reales y la multiplicación,
{ℝ, }. Pero, claramente, los números reales no pueden formar un grupo con respecto a la
multiplicación porque el elemento cero no tiene un inverso multiplicativo en ℝ, por lo cual se
incumple el cuarto axioma. Debemos sacudirnos de estereotipos y notar que G no tiene que ser un
conjunto de números o de arreglos de números (aunque puede serlo) y  no tiene que ser la
multiplicación entre números (aunque puede serlo). Veamos, por ejemplo, un ejemplo muy ajeno a
los conjuntos de números:
G = Conjunto de permutaciones de tres objetos
 = Aplicación sucesiva de dos permutaciones
Por ejemplo, si tengo los tres objetos (Sol, Venus, Marte), les puedo aplicar seis permutaciones
diferentes:
(123)(☼♀♂)=(☼♀♂), (132)(☼♀♂)=(☼♂♀), (213)(☼♀♂)=(♀☼♂)
(231)(☼♀♂)=(♀♂☼), (312)(☼♀♂)=(♂☼♀), (321)(☼♀♂)=(♂♀☼)
Esto es, G = {(123),(132),(213),(231),(312),(321)}, donde el elemento (ijk) del conjunto G es la
permutación que hace que en la posición 1 se ubique el objeto que estaba en la posición i, en la
posición 2 se ubique el objeto que estaba en la posición j, y en la posición 3 se ubique el objeto que
estaba en la posición k. ¿Es {G,} un grupo? Claramente G es cerrado para  porque la aplicación
sucesiva de dos permutaciones da otra permutación. Por ejemplo,
[(231)(321)](☼♀♂)=(231)(♂♀☼)=(♀☼♂)=(213)(☼♀♂)  (231)(321)=(213)
La asociatividad es evidente:
(z(1) z(2) z(3))[(y(1) y(2) y(3))(x(1) x(2) x(3))] = (z(1) z(2) z(3))[ x(y(1)) x(y(2)) x(y(3))] = [x(y(z(1))) x(y(z(1))) x(y(z(1)))]
[(z(1) z(2) z(3))(y(1) y(2) y(3))](x(1) x(2) x(3)) = [ y(z(1)) y(z(2)) y(z(3))](x(1) x(2) x(3)) = [x(y(z(1))) x(y(z(1))) x(y(z(1)))]
de donde (g1g2)g3 = g1(g2g3).
El elemento identidad de {G,} es (123) pues (ijk)(123)=(123)(ijk)=(ijk).
Por último, el elemento inverso de cada elemento de G es la permutación que retorna al orden
original. Es interesante notar que para cuatro elementos de G, g-1 = g.
(123)-1 = (123), (132)-1 = (132), (213)-1 = (213), (231)-1 = (312), (312)-1 = (231), (321)-1 = (321)
De esta manera se ha verificado que {G,} es un grupo, aunque también es evidente que no se trata
de un grupo Abeliano: (231)(321)=(213)  (132)=(321)(231). Pero queda claro que los grupos no
tienen que ser de números con respecto a operaciones numéricas, aunque pueden serlo:


Los enteros con respecto a la suma, (ℤ, +), forman un grupo Abeliano, así como (ℝ, +), (ℚ,
+) y (ℂ, +). En todos ellos, el elemento identidad es 0 y el inverso de x es –x. (ℕ, +) no es
un grupo porque el único inverso aditivo en ℕ es 0-1 = 0.
Los reales distintos de cero con respecto a la multiplicación, (ℝ\{0}, ), forman un grupo
Abeliano, así como (ℚ\{0}, ). El elemento identidad es 1 y el inverso multiplicativo es x-1
= 1/x.
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate

3
cos( ) sin( ) 
Las matrices que producen rotaciones en ℝ2, r ( )  
 , 0    2 , forman

sin(

)
cos(

)


un grupo Abeliano con respecto a la multiplicación de matrices, donde la identidad es r(0) y
el inverso de r()-1 = r(-).
Con los grupos se pueden formar campos, que constituirán los escalares de nuestros espacios
vectoriales abstractos. Un campo es un conjunto de elementos, F, y un par de operaciones,  y +,
definidas sobre los elementos de F, que satisfacen los siguientes axiomas:
 {F,+} es un grupo Abeliano con identidad 0
 {F\{0},} es un grupo Abeliano con identidad 1
  se distribuye sobre +. Esto es, a,b,c  F  a(b+c) = ab + ac
Por supuesto, la multiplicación y la suma sobre los reales, los racionales y los complejos son los
campos más fáciles de identificar, debido a la familiaridad que tenemos con ellos. Pero es posible
imaginar muchos más. Por ejemplo, nótese que el conjunto {0, 1} forma un campo finito sobre la
operación AND () y la operación XOR (+). Se le llama GF(2) –Campo de Galois de orden 2–, y
constituye el fundamento teórico de los sistemas de comunicación digital. Considerando que la
operación lógica AND es la multiplicación módulo 2 y la operación lógica XOR es la adición
módulo 2, se suele generalizar al campo de Galois de orden p, con p primo, donde los elementos
del campo son los enteros {0,1,2,…,p-1} y las operaciones  y + son la multiplicación y la suma
módulo p, respectivamente. Estos campos GF(p) son fundamentales en el estudio de los métodos de
control de error en comunicaciones digitales, donde la información se representa como polinomios
sobre campos de Galois. La siguiente figura muestra GF(3) como ejemplo de un campo finito.
GF(3)={0,1,2}
00=0, 01=0, 02=0,
10=0, 11=1, 12=2,
20=0, 21=2, 22=1
0+0=0, 0+1=1, 0+2=2,
1+0=1, 1+1=2, 1+2=0,
2+0=2, 2+1=0, 2+2=1
Grupo Abeliano con identidad 1
Grupo Abeliano con identidad 0
0(2+2)=02+ 02=0
0(2+1)=02+ 01=0
0(2+0)=02+ 00=0
0(1+1)=01+ 01=0
0(1+0)=01+ 00=0
0(0+0)=00+ 00=0
1(2+2)=12+ 12=1
1(2+1)=12+ 11=0
1(2+0)=12+ 10=2
1(1+1)=11+ 11=2
1(1+0)=11+ 10=1
1(0+0)=10+ 10=0
2(2+2)=22+ 22=2
2(2+1)=22+ 21=1
2(2+0)=22+ 20=1
2(1+1)=21+ 21=1
2(1+0)=21+ 20=2
2(0+0)=20+ 20=0
 se distribuye sobre +
Figura 2. Campo finito de Galois de orden 3
Así como los espacios vectoriales en ℝn que vimos en la clase anterior se desarrollaban sobre el
campo de los reales (o de los complejos), el concepto abstracto de Espacio Vectorial requiere un
campo de escalares y un conjunto abstracto de objetos (vectores). Sea V un conjunto de elementos
llamados vectores y F un campo de elementos llamados escalares. Además de las operaciones (,+)
definidas para F, introducimos otra operación aditiva «+» entre vectores, que a dos vectores x y y en
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
4
V asocia otro vector x+y en V. También introducimos una operación multiplicativa «» que a cada
escalar a en F y cada vector x en V asocia otro vector ax en V. Entonces V forma un Espacio
Vectorial sobre el campo F si se satisfacen las siguientes condiciones:
 V forma un grupo Abeliano para +
 a  F , x V  a  x V

a, b  F , x , y V  a  ( x  y )  a  x  a  y , (a  b)  x  a  x  b  x

a, b  F , x V  (a  b)  x  a  (b  x )

1 F , x V  1 x  x
Nótese que se debe distinguir muy bien cuándo se trata de multiplicación entre escalares, de
multiplicación entre un escalar y un vector, de suma entre escalares y de suma entre vectores. El
contexto (la naturaleza de los operandos) permitirá dilucidar cualquier duda.
2. Ejemplos de espacios vectoriales abstractos
Por supuesto, los primeros ejemplos de espacios vectoriales son los de algunos subconjuntos de ℝn
sobre el campo de los reales, con la suma y la multiplicación ya conocidas: El espacio vectorial
expandido por las columnas de una matriz, o el espacio vectorial que constituido por el kernel de
una matriz K ( A)  x  n : Ax  0 , etc. Pero nótese que con nuestra nueva definición abstracta


podemos pensar en otros ejemplos más imaginativos: El conjunto de matrices reales nn forma un
espacio vectorial sobre el campo de los reales. El conjunto de polinomios P en una variable real t
con coeficientes complejos forma un espacio vectorial sobre el campo de los complejos, etc.
Consideremos, por ejemplo, este último caso: el espacio vectorial de los polinomios de grado menor
o igual a N se define como V   P : 

N

tales que P(t )   nt n , N  ,  n  , t   . Es un espacio
n 0

vectorial sobre el campo escalar de los complejos porque forma un grupo Abeliano para la suma de
polinomios: P, Q V   P  Q  (t )  P(t )  Q(t ) V ; es cerrado para la multiplicación por escalar:
N
P    nt n V ,  
n 0
N
    P  (t )    P(t )     n  t n V ; el producto por escalar se distribuye
sobre la suma de polinomios:
n 0
P, Q V ,  
    ( P  Q)  (t )    P(t )    Q(t ) ; el producto por
vector se distribuye sobre la suma de escalares: P V ,  ,     (   )  P  (t )    P(t )    Q(t ) ; el
producto entre vectores y escalares es asociativo: a, b  , P V   (a  b)  P  (t )  a  (b  P)(t ) ; la
identidad del producto escalar no cambia el producto entre escalar y vector: (1P)(t)=P(t).
Si los elementos de un espacio vectorial pueden ser tan abstractos como los polinomios de grado
dado, lejos de los vectores en ℝn de la clase anterior, podemos imaginar muchos otros espacios
vectoriales con elementos aún más abstractos. Antes de pasar a los espacios vectoriales de señales,
veremos un ejemplo adicional de gran utilidad en el mundo de las comunicaciones digitales: Los
códigos lineales de bloques.
Un código q-ario de control de errores por bloques es un conjunto de M palabras clave C={c0, c1,
…, cM-1}, cada una consistente en n coordenadas ci=[di0, di1, …, din], donde los dij toman valores en
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
5
GF(q), el campo de Galois de orden q. El proceso de codificación consiste en dividir un flujo de
datos en bloques y asociar cada uno de estos bloques biunívocamente con una de las palabras claves
en C. La colección de todas las n-tuplas sobre GF(q) forma un espacio vectorial sobre GF(q) con qn
vectores, por lo que hay (qn-M) n-tuplas que no son palabras clave válidas. Si M=qk, se trata de un
código (n,k).
C forma un código q-ario lineal si constituye un subespacio vectorial sobre GF(q). Una matriz G,
cuyas filas sean los vectores de una base del subespacio, es una matriz generadora para el código C.
Para codificar un bloque de datos, simplemente se multiplica el vector fila del flujo de datos por la
matriz generadora G.
El complemento ortogonal de C, Co, es un subespacio vectorial de dimensión n-k. Una matriz H
cuyas columnas sean los vectores de una base del espacio Co es una matriz "verificadora de
paridad" para el código C. En efecto, una secuencia c de n símbolos de GF(q) será un código válido
sólo si cHT=0.
Un ejemplo sencillo es el código Hamming(7,4) en GF(2), en el que a cuatro bits de datos se añaden
tres bits de paridad para formar 16 palabras clave de 7 bits. Las matrices generadora y verificadora
de paridad son
1
1

1

G  0
0

0
0

1 0 1
0 1 1 
0 0 0

1 1 1 ,
1 0 0

0 1 0
0 0 1 
1 0 1 0 1 0 1
H  0 1 1 0 0 1 1
0 0 0 1 1 1 1
Si el transmisor desea enviar 4 bits de datos, d = [d1 d2 d3 d4], construye y envía la palabra clave
c = dGT., la cual tiene los bits de datos en las posiciones 3, 5, 6 y 7 y tiene bits de paridad en las
posiciones 1, 2 y 4. Durante la transmisión, algunos bits pueden sufrir errores, de manera que al
receptor llega una palabra y = c + e, donde e es una patrón de errores (recuerde que la suma en
GF(2) es la función lógica XOR). El receptor calcula el síndrome s = yHT = eHT, el cual indica la
posición del bit equivocado si hay sólo un bit equivocado (de manera que se puede corregir) o da
una secuencia distinta de 000 si hay dos bits equivocados (de manera que se pueden detectar). Esto
es posible precisamente porque las filas de G y H expanden espacios vectoriales C y Co que son
complementos ortogonales entre ellos.
En adelante, pues, hablaremos de espacios vectoriales abstractos y, más tarde, nos concentraremos
en los espacios vectoriales de señales.
3. Espacios Vectoriales Normados
Sea V un espacio vectorial sobre algún campo F. Una función |||| : V  ℝ es una norma en V si
satisface las siguientes propiedades:
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
6
(1) x V , x  0 con igualdad si y sólo si x  0;
(2)   F , x V ,  x   x ;
(3) x , y V , x  y  x  y
Ya
hemos
x   x1
visto
ampliamente
xn  V  x 
T
x2
el
n
x
i 1
Vℝn
caso
i
2
y
la
norma
Euclidiana,
donde
, pero podemos definir normas en cada uno de los
espacios vectoriales abstractos que hemos revisado. Por ejemplo, en un espacio C de códigos
binarios sobre el campo GF(2), una norma ampliamente utilizada para medir la capacidad de
detección y corrección de errores es el número de unos en el vector (o código), conocida como el
peso del código:
c  c1 c2
n
cn   C  0,1  c   ci
T
n
i 1
por ejemplo, 0011011001  5 .
Como ejemplo adicional, consideremos el espacio vectorial de las funciones continuas en un
intervalo dado, sobre el campo de los reales: V   f :  a, b 
tal que f es continua . La suma
entre vectores y el producto con escalares se definen de manera obvia:
f , g V   f  g  (t )  f (t )  g (t ) V
   f  (t )   f (t ) V
f V ,  
Tenemos muchas posibilidades para dotar a este espacio vectorial con una norma. Tres de las más
usadas son las siguientes,
b
(1)
f
(2)
f
(3)
f
  f (t ) dt
1
a

2


b
2
f (t ) dt
a
 max f (t )
t a ,b 
Las tres son casos particulares de la norma-p
f
p


b
a
p
f (t ) dt

1
p
, p 1
Un ejemplo semejante corresponde al espacio vectorial de las secuencias finitas, que podemos
representar también como funciones en tiempo discreto: V  x : 0,1,..., n  1   , donde la suma
de vectores y el producto por escalar son semejantes al ejemplo anterior:
x, y V   x  y  [n]  x[n]  y[n] V
x V ,  
   x  [n]   x[n] V
Nótese que este espacio vectorial, donde los vectores son series de tiempo con n muestras en el
tiempo discreto, es fundamentalmente idéntico al espacio ℝn. Es sólo que la interpretación no es la
de vectores físicos en un espacio Euclidiano n-dimensional, sino la de series de tiempo con un
número finito de muestras. Ahora tenemos también muchas opciones para dotarlo de una norma:
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
7
n 1
x 1   x[i ]
(1)
i 0
n 1
 x[i]
x2
(2)
(3)
x

2
i 0
 max
i0,1,..., n 1
x[i ]
donde las tres normas son casos particulares de la norma-p generalizada,
1
x
p
 n 1
p p
   x[i ]  , p  1
 i 0

Cuando el número de muestras en la secuencia es 2, podemos graficar en el plano las normas
definidas anteriormente:
x1
x1
1
1
x0
-1
x0
1
-1
1
-1
x 
2
-1
: x 1  1
x 
2
: x 2  1
x1
1
x0
-1
1
-1
x 
2
: x

 1
Figura 3. Normas en el espacio vectorial V = {x:{0,1}ℝ}
Pero si podemos considerar secuencias finitas, ¿porqué no secuencias infinitas? El siguiente es el
espacio vectorial de las secuencias de longitud infinita, que podríamos interpretar como un espacio
Euclidiano -dimensional: V   x :   , con la misma definición de suma y producto que en el
ejemplo anterior y con las mismas normas:
x1
(1)

x2
(2)
(3)
x


x[n]
n 


x[n]
2
n 
 max x[n]
n
que son formas particulares de la norma-p
x
p
1
p

p
   x[n]  , p  1
 n 


Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
8
Sin embargo, en este ejemplo surge el problema de la convergencia: No tendría sentido definir este
espacio vectorial si para algunas secuencias de V la norma no converge. En este caso, para evitar
problemas, definimos espacios vectoriales de secuencias infinitas con características precisas de
convergencia. Por ejemplo, definamos los siguientes tres espacios vectoriales:

l1 ( )   x :



tales que
n 

l 2 ( )  x :


l ( )  x :





x[n]    sobre el campo , con norma x 1   x[n]
n 


tales que

n 

2
x[n]    sobre el campo , con norma x 2 


tales que max x[n]   sobre el campo , con norma x
n



x[n]
2
n 
 max x[n]
n
O, en general,
1



 
p
p p
l ( )   x :  tales que  x[n]    sobre el campo , con norma x p    x[n]  , p  1
n 


 n

Todos ellos son espacios vectoriales válidos sobre el campo de los reales, donde la suma entre
vectores y el producto entre un escalar y un vector se definen como antes:
p
x, y  l p ( )   x  y  [n]  x[n]  y[n]  l p ( )
x  l p ( ),  
   x  [n]   x[n]  l p ( )
Pero, si lo miramos bien, acabamos de definir espacios vectoriales de señales en tiempo discreto. En
particular, l2(ℤ) es el espacio vectorial de las señales de energía en tiempo discreto.
4. Espacios vectoriales de señales
A continuación definimos algunos espacios vectoriales de señales sobre el campo escalar de los
complejos (otros espacios semejantes se pueden definir sobre el campo escalar de los reales y
conservan los mismos nombres):
(1)
Espacio de señales complejas absolutamente sumables en tiempo continuo

L1 ( )  x :

tales que 



x(t ) dt   sobre el campo
(2)
Espacio de señales complejas absolutamente sumables en tiempo discreto
(3)



l1 ( )   x :  tales que  x[n]    sobre el campo
n 


Espacio de señales complejas de energía en tiempo continuo

L2 ( )  x :

tales que 



x(t ) dt   sobre el campo
2
(4)
Espacio de señales complejas de energía en tiempo discreto
(5)



2
l 2 ( )   x :  tales que  x[n]    sobre el campo
n 


Espacio de señales complejas acotadas en tiempo continuo

L ( )  x :


tales que max x(t )   sobre el campo
t
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
(6)
9
Espacio de señales complejas acotadas en tiempo discreto

l ( )  x :
(7)


tales que max x[n]   sobre el campo
n
(8)
Espacio de señales complejas de potencia en tiempo continuo
1 T
2


P 2 ( )   x :  tales que lim
x(t ) dt    sobre el campo
T  2T T


Espacio de señales complejas de potencia en tiempo discreto
(9)
N
1


2
p 2 ( )   x :  tales que lim
x[n]    sobre el campo

N  2 N  1
n  N


Espacio de señales complejas periódicas de potencia en tiempo continuo
1 T
2


PT2 ( )   x :  tales que x(t  T )  x(t )t  y  x(t ) dt    sobre el campo
0
T


(10) Espacio de señales complejas periódicas de potencia en tiempo discreto
1 N 1


2
pN2 ( )   x :  tales que x[n  N ]  x[n]n  y  x[n]    sobre el campo
N n 0


(11) Espacio de señales complejas de energía con simetría hermitiana en tiempo continuo

L2par ( )  x :

tales que 


x(t ) dt   y x(t )  x(t )* t 
2
 sobre el campo
(en el campo ℝ, con la señal definida en los reales, el operador * (complejo conjugado) se
omite y la señal hermitiana toma el nombre se señal par)
(12) Espacio de señales complejas de potencia con simetría anti-hermitiana en tiempo discreto

2
Pimpar
( )  x :


tales que lim
T 
1
2T

T
T
2

x(t ) dt   y x(t )   x(t )* t   sobre el campo

(en el campo ℝ, con la señal definida en los reales, el operador * (complejo conjugado) se
omite y la señal anti-hermitiana toma el nombre se señal impar)
(13) etc.
Es fácil verificar que todos ellos forman espacios vectoriales. Sólo como ejemplo, consideremos las

señales reales acotadas en tiempo continuo, L ( )  x :


tales que max x(t )   sobre
t
Sean x, y  L ( ), y a, b 
El producto escalar se define así:
a  x :  tal que (a  x)(t )  a  x(t ) t 
y la suma vectorial se define así:
( x  y ) :  tal que ( x  y )(t )  x(t )  y (t ) t 
de manera que a  ( x  y)  a  x  a  y,
( a  b)  x  a  x  b  x
( a  b)  x  a  ( b  x )
más aún, z  a  x  b  y  L ( ). En efecto,
z

 max z (t )  max a  x(t )  b  y (t )  a max x(t )  b max y (t )  a x
t
t
t
t

b y


.
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
10
5. Producto interno en espacios vectoriales de señales. Correlación.
En el contexto abstracto en el que estamos trabajando, si V es un espacio vectorial definido sobre un
campo F (por ejemplo, ℝ ó ℂ), un producto interno es una función que va del producto cartesiano
VV al campo escalar F, <,>:VV F, que satisface tres axiomas:
 x,y,z  V y  a,b  F,
(1) <x,y> = <y,x>*
(2) <ax + by, z> = a<x,z> + b<y,z>
(3) <x,x>  0, con igualdad sólo si x=0
De estos axiomas surgen propiedades interesantes como, por ejemplo, la familiar expansión del
binomio cuadrado:
<x+y, x+y> = <x, x> + <x, y> + <y, x> + <y, y>
que en ℝ toma la forma
<x+y, x+y> = <x, x> + 2<x, y> + <y, y>
y en ℂ toma la forma
<x+y, x+y> = <x, x> + 2Re(<x, y>) + <y, y>.
Considerando que <x, x> es la norma al cuadrado del vector x, <x, x> = ||x||2.
||x+y||2 = ||x||2 + ||y||2 + 2Re(<x, y>).
Lo más interesante (pues es aquí donde se aprovecha la visión geométrica de las señales desde la
perspectiva de los espacios vectoriales) es que para cualquier producto interno que satisfaga los tres
axiomas de la definición, la intuición geométrica del mismo como la proyección perpendicular de
un vector sobre el otro sigue siendo válida. En efecto, de las propiedades descritas surge la
desigualdad de Cauchy-Schwarz,
|<x,y>|2  <x,x>  <y,y>,
con igualdad si los vectores son linealmente dependientes, lo cual es fácil de demostrar: Si y es
igual a 0, la relación se cumple trivialmente con igualdad. Y si y es diferente de 0, podemos
construir el vector
z = x – [<x,y>/<y,y>] y
para encontrar que
<z, y> = <x, y> – [<x, y> / <y, y>] <y, y> = <x, y> – <x, y> = 0,
indicando que z y y son ortogonales. En consecuencia, al expresar
x = z + [<x, y> / <y, y>] y
estamos refiriéndonos a una relación pitagórica, por lo que
||x||2 = ||z||2 + |<x, y>/<y, y>|2 ||y||2 = ||z||2 + |<x,y>|2 / ||y||2  |<x,y>|2 / ||y||2.
Multiplicando por ||y||2 a ambos lados de la desigualdad obtenemos |<x,y>|2  ||x||2||y||2, que es la
desigualdad de Cauchy-Schwarz.
Claro, si se cumple la desigualdad de Cauchy-Schwarz en un entorno tan abstracto, también se
cumple la desigualdad del triángulo:
||x + y||2 = <x+y, x+y> = <x, x> + 2Re(<x, y>) + <y, y> = ||x||2 + 2Re(<x, y>) + ||y||2
de donde
||x + y||2  ||x||2 + 2|<x, y>| + ||y||2  ||x||2 + 2||x|| ||y|| + ||y||2 = (||x|| + ||y||)2
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
11
y, tomando raíces cuadradas, se obtiene la desigualdad del triángulo:
||x + y||  ||x|| + ||y||
Gracias a estas desigualdades, toda la intuición geométrica que podemos obtener de los espacios
vectoriales en ℝ3, tan familiares para nosotros, es directamente aplicable a los espacios abstractos
de señales. Por ejemplo, la noción del "ángulo" entre dos señales se puede extender mediante la
relación conocida de los espacios Euclidianos,
cos( ) 
x, y
x y
A esta cantidad se le conoce como "coeficiente de correlación", 0    1.
Aunque existen muchas maneras de definir productos internos en diferentes espacios vectoriales,
conviene que recordemos cómo definíamos el producto interno en ℝn en la sección 5 de la clase
anterior:
n
x , y  y T x   xi yi
i 1
En ℂ la transposición incluía también conjugación:
n
n
x , y  y H x   xi yi*
i 1
En estos dos casos, la desigualdad de Cauchy-Schwarz toma la siguiente forma:
2
n
 n
 n
2 
2
*
x
y

x
  i i    i   yi 
 i 1
  i 1
 i 1

Recordamos esta expresión porque, como extensión de la definición del producto interno en ℝn, en
los espacios de señales de energía el producto interno se define así:
l2 
:

 x[n] y [n]
x, y 
*
n 
L2 
:

x, y   x(t ) y* (t )dt

Si la definición incluye un desplazamiento de tiempo en la segunda señal, tendríamos la definición
de la función de correlación entre dos señales:



*
 Rx , y  k    x[n] y [n  k ], k  
n 


R


x, y
    x(t ) y* (t   )dt ,  
Esto es, en espacios vectoriales de señales de energía, <x,y> = Rx,y(0).
En L2(ℝ), la desigualdad de Cauchy-Schwarz toma la siguiente forma:

2


x(t ) y* (t )dt 



2
x(t ) dt
 


2
y (t ) dt

y la desigualdad del triángulo es



x(t )  y(t ) dt 
2



x(t ) dt 
2



2
y(t ) dt
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
12
En l2(ℤ), la desigualdad de Cauchy-Schwarz toma la siguiente forma:

 x[n] y [n]
*
n 
2

 
2 
2
   x[n]   y[n] 
 n
 n

y la desigualdad del triángulo es


n 
x[n]  y[n] 
2


x[n] 
n 
2


y[n]
2
n 
6. Espacio de Hilbert
Entre los muchos posibles espacios vectoriales abstractos, los más adecuados para el análisis de
señales son los que extienden los espacios Euclidianos a un número infinito de dimensiones, ya sea
un número contable (espacios de señales en tiempo discreto) o un número incontable de
dimensiones (espacios de señales en tiempo continuo). Estos espacios se conocen, en general, como
Espacios de Hilbert. Los espacios Euclidianos mismos forman los ejemplos más clásicos de
espacios de Hilbert. Por ser sencillamente extensiones de dimensión infinita de los espacios
Euclidianos, la intuición geométrica juega un papel mucho más preponderante, por la validez del
teorema de Pitágoras o la ley del paralelogramo, por ejemplo. En efecto, en los espacios de Hilbert
resulta muy claro hacer construcciones geométricas como la proyección perpendicular de un vector
en un plano, por ejemplo, lo cual resulta en toda una teoría de optimización basada en el error
cuadrado promedio. Es en estos espacios, por ejemplo, en donde los impulsos unitarios desplazados
forman una base canónica de infinitas dimensiones, idéntica a la base canónica {(1,0,0), (0,1,0),
(0,0,1)} de ℝ3.
Al considerar infinitas dimensiones surgen cuestiones sobre la existencia de límites dentro del
espacio vectorial, los cuales permitirían utilizar técnicas de análisis como el cálculo diferencial e
integral. Por eso los espacios de Hilbert se enmarcan dentro de los espacios métricos de Banach. Un
espacio métrico es un espacio vectorial V dotado con una medida para la distancia entre dos
vectores, d(x, y) (métrica), la cual satisface tres propiedades elementales: (1) d(x,y)0 con igualdad
sólo si x=y, (2) d(x,y) = d(y,x) y (3) para todo z  V, d(x,y)  d(x,z) + d(z,y). Un espacio de Banach
es un espacio normado en el que la métrica es la norma del vector diferencia, d(x,y) = ||x – y|| y
satisface un criterio adicional: Debe ser un espacio "completo". Un espacio vectorial V es completo
si para cualquier secuencia de vectores {x1, x2, x3, …} en V, tal que la métrica d(xn, xn-1) converge a
cero a medida que n tiende a infinito, todos los vectores de la secuencia, incluido el vector xn en el
límite n, pertenecen al espacio V. Esta simple propiedad nos permite utilizar los conceptos del
cálculo diferencial e integral en el análisis de los espacios. Para hacer de un espacio de Banach un
espacio de Hilbert, sólo necesitamos que la norma esté dada por la raíz cuadrada del producto
interno, ||x||2=<x,x>.
La siguiente figura repasa los conceptos vistos en esta clase, hasta llegar al espacio de Hilbert.
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
13
Espacio vectorial
Espacio
normado
Espacio
de Banach
Espacio
de
Hilbert
Espacio con
Producto
interno
Figura 4. Resumen de los conceptos de espacios vectoriales abstractos, hasta los espacios de Hilbert
7. Ejemplos
Considere las siguientes tres señales en tiempo discreto: {k[n] = u[n-k] - u[n-k-2], nℤ}k{0,1,2},
mostradas en la siguiente figura. {0, 1, 2} son linealmente independientes porque la única forma
de combinarlas linealmente para obtener el vector 0 (la señal en tiempo discreto que es
idénticamente igual a cero para cualquier nℤ) es haciendo que los coeficientes de la combinación
lineal sean todos cero. En efecto, el espacio de señales expandido por { 0, 1, 2} es V = {x:ℤℝ
tales que x = a0 + b1 + c2, con a, b, c ℝ}, que es el espacio vectorial de las señales x:ℤℝ
tales que x[n]=0 nℤ, excepto x[0] = a, x[1] = a+b, x[2] = b+c, x[3] = c. La siguiente figura
muestra las señales base {0, 1, 2} y tres de las señales del espacio V expandido por {0, 1, 2}.
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
 0[n]
14
[2, 1, -1] : 2* 0[n] +  1[n] -  2[n]
3
2
1
0
-1
3
2
1
0
-1
-2
0
2
4
6
-2
 1[n]
0
2
4
6
[-1, 2, 1] : - 0[n] + 2* 1[n] +  2[n]
3
2
1
0
-1
3
2
1
0
-1
-2
0
2
4
6
-2
 2[n]
0
2
4
6
[1, 1, 1] :  0[n] +  1[n] +  2[n]
3
2
1
0
-1
3
2
1
0
-1
-2
0
2
4
6
-2
0
2
4
6
Figura 5. Una base vectorial de señales y algunos vectores del respectivo espacio de señales expandido
Sin embargo, los vectores {0, 1, 2} no forman una base ortogonal para el espacio V porque
0 , 0 
1 , 1 
2 , 2 

  [n] [n]   [0] [0]   [1] [1]  2
n 
0
0
0
0
0
0

 1[n]1[n]  1[1]1[1]  1[2]1[2]  2
1 , 2  2 , 1 
n 

  [n] [n]   [2] [2]   [3] [3]  2
n 
2
2
2
2
2
2
0 , 1  1 , 0 

  [n] [n]   [1] [1]  1
0
n 
1
0
1

  [n] [n]   [2] [2]  1
n 
0 , 2  2 , 0 
1
2
1
2

  [n] [n]  0
n 
0
2
Pero podemos construir una base ortogonal para el mismo espacio si restamos a cada vector base las
proyecciones sobre los otros vectores. Este proceso se conoce como la ortogonalización de
Gramm-Schmidt.
 0  0
 1  1 
 2  2 
1 ,  0
1
 0  1   0
 0, 0
2
El primer vector base,  0 , se
escoge igual al anterior, 0 .
El segundo vector base,  1 , se escoge
eliminando de 1 su proyección sobre  0
El tercer vector base,  2 , se escoge eliminando
2 ,  0
 ,
2
  2 1    
 0 ,  0 0  1 ,  1 1 2 3 1 de 2 sus proyecciones sobre  0 y sobre  1
Las señales resultantes se muestran en la siguiente figura, así como las nuevas coordenadas de las
señales mostradas en la figura anterior:
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
0[n]
15
[5/2, 1/3, -1] : 5*0[n]/2 + 1[n]/3 - 2[n]
2
3
2
1
0
-1
1
0
-1
-2
0
2
4
6
-2
1[n]
0
2
4
6
[0, 8/3, 1] : 0*0[n] + 8*1[n]/3 + 2[n]
2
3
2
1
0
-1
1
0
-1
-2
0
2
4
6
-2
2[n]
0
2
4
6
[3/2, 5/3, 1] : 3*0[n]/2 + 5*1[n]/3 + 2[n]
2
3
2
1
0
-1
1
0
-1
-2
0
2
4
6
-2
0
2
4
6
Figura 6. Otra base (esta vez ortogonal) para el mismo espacio vectorial de señales
Una representación gráfica para el proceso que acabamos de hacer con la ortogonalización de
Gramm-Schmidt se muestra en la siguiente figura: Escogimos a 0 idéntica a 0 y luego, para
asegurarnos que 0 y 1 sean perpendiculares, hicimos que 1 fuera el resultado de quitarle a 1
cualquier componente en la dirección de 0. Por último, hicimos que 2 fuera el resultado de quitarle
a 2 cualquier componente en las direcciones de 0 y 1; en este caso, como 2 ya era ortogonal a 0,
bastó con eliminar el componentes de 2 en la dirección de 1 para obtener 2.
1
2
 1  1   0
1
0   0
1 ,  0
1
  
 0, 0 0 2 0
Proyección ortogonal de 1 sobre 0
(1)
1
2
 1  1   0
1
 0
2
1 ,  0
1
  
 0, 0 0 2 0
0 y 1 son dos vectores
ortogonales que expanden
el mismo espacio vectorial
que 0 y 1
(2)
0   0
(3)
1
 1  1   0
2
1
2 ,  1
2
  
1, 1 1 3 1
Proyección ortogonal
de 2 sobre 1
0   0
1
1
2
 1  1   0
1
1
2 ,  1
2
  
1, 1 1 3 1
2
2
2 ya es ortogonal a 0
0, 1 y 2 son tres vectores
ortogonales que expanden
el mismo espacio vectorial
que 0, 1 y 2
2
3
 2  2   1
2
 1
3
(4)
2
0   0
0   0
(5)
0   0
2
3
 2  2   1
(6)
Figura 7. Proceso de Ortogonalización de Gramm-Schmidt
La ortogonalidad de {0, 1, 2} es fácil de verificar:
 0, 0 
1, 1 
 2, 2 


n 
0
[n] 0 [n]  2

  [n] [n]  3 / 2
n 
1


n 
2
1
[n] 2 [n]  4 / 3
 0 ,  1   1,  0 

n 
 0, 2   0, 2 
 1,  2   1,  2 

0
[ n] 1[ n]  0

  [n]
n 
0

  [n]
n 
1
2
2
[ n]  0
[ n]  0
Por ejemplo, fijándonos en la señal del extremo inferior derecho de la Figura 5 y la Figura 6, hemos
encontrado 2 expresiones para representarla, cada una en una base diferente:
x[n] = 0[n] + 1[n] + 2[n]
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
16
x[n] = 30[n]/2 + 51[n]/3 + 2[n]
Otra representación posible, como ya vimos en la novena clase es
x[n] = 0[n] + 21[n] + 22[n] + 3[n]
donde {k[n]=[n-k], nℤ}k{0,1,2,3} es otro conjunto de señales ortogonales constituido por algunos
desplazamientos del impulso unitario. Sin embargo, el espacio vectorial V expandido por estas
cuatro señales es mucho mayor, pues incluye a todas las señales en tiempo discreto que toman el
valor cero para instantes menores que cero y para instantes superiores a tres. Claramente, V  V .
Si queremos expresar una señal que está dada como combinación lineal de { 0, 1, 2}, por ejemplo
{x[n] = a0[n] + b1[n] + c2[n], nℤ}, como combinación lineal de {0, 1, 2, 3}, por ejemplo
{x[n] = p0[n] + q1[n] + r2[n] + s3[n], nℤ}, usamos la siguiente matriz de cambio de base:
1
1

0

0
0
1
1
0
0
 p  a 
a 
0     q   a  b 
b 

1    r  b  c 
 c    

1    s   c 
puesto que {a0[n] + b1[n] + c2[n], nℤ} = {a0[n] + (a+b)1[n] + (b+c)2[n] + c3[n], nℤ}.
Para hacer el cambio inverso de base (siempre que la señal esté efectivamente en V) tenemos
diferentes alternativas como, por ejemplo,
 p
 1 0 0 0    a   p 
 1 1 0 0  q    b    q  p  ,

r    

 0 0 0 1   s   c   s 
 
 p
 0 1 1 1     a   q  r  s 
 1 1 0 0  q    b    q  p  , etc.

 r    

 1 1 1 0  s   c   p  q  r 
 
En efecto, si el vector [p, q, r, s] pertenece a V, debe ser de la forma [p=a, q=a+b, r=b+c, s=c], en
cuyo caso las transformaciones anteriores (que son sólo un cambio de base) conducen al vector
[a,b,c]: {x[n] = p0[n] + q1[n] + r2[n] + s3[n], nℤ} = {a0[n] + b1[n] + c2[n], nℤ}.
Pero ¿qué pasa si la señal original xV no está en V y queremos aproximarla como una
combinación lineal de {0, 1, 2}, x̂ V? Por supuesto, no importa qué señal de V escojamos,
siempre cometeremos un error. Por esta razón, lo que deberíamos buscar es la aproximación que
minimice el "error cuadrado promedio" (MSE por sus siglas en inglés, Mean Square Error) o,
equivalentemente, la aproximación que minimice la energía del error. El problema es fácil de
plantear como un problema de optimización:
1 3
2
[a* , b* , c* ]  arg min   x[n]  xˆ[n]
4 n 0
a ,b ,c
La función objetivo, el MSE, no es más que cuatro veces la energía total de la señal de error
e[n]  x[n]  xˆ[n], n   . Por eso el criterio estadístico de minimizar el error cuadrado promedio se
conoce en teoría de señales como la minimización de la energía del error. Aunque podríamos
aplicar directamente técnicas de programación matemática para resolver el anterior problema de
optimización, es mucho más interesante recurrir a nuestra visión geométrica de las señales y aplicar
el principio de ortogonalidad.
Para visualizar el principio de ortogonalidad, representemos a V como ℝ3 y a V como ℝ2, lo cual
indica el hecho de que V  V . Esta representación se muestra en la siguiente figura.
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
17
e  x  xˆ
Espacio de aproximación, V
Figura 8. La proyección perpendicular sobre el espacio de aproximación minimiza el MSE
Claramente, para obtener la mejor aproximación de x en V, debemos escoger la proyección
perpendicular de x sobre V. De esta manera, se minimiza la magnitud del error, y por consiguiente
el MSE (pues la magnitud es la raíz cuadrada de la energía). Esto es, el error e  x  xˆ debe ser
perpendicular a cualquier otro vector de V, lo que permite expresar el principio de ortogonalidad
así: x  xˆ, z  0 z V . Si expresamos x̂  a*0  b*1  c*2 y z  a0  b1  c2 , el principio de
ortogonalidad toma la siguiente forma:
a x, 0  b x, 1  c x, 2  a  a* 0 , 0  b* 1 , 0  c* 2 , 0  
b  a* 0 , 1  b* 1 , 1  c* 2 , 1  
c  a* 0 , 2  b* 1 , 2  c* 2 , 2

a, b, c 
Lo cual exige que
 0 , 0

 0 , 1
 0 , 2
1 , 0
1 , 1
1 , 2
2 , 0
2 , 1
2 , 2
  a*   x, 0
 * 
  b    x, 1
  c*   x, 2
 




Este es el sistema de ecuaciones normales, que está dado en términos de las correlaciones entre los
vectores base (matriz de coeficientes) y las correlaciones entre la señal a aproximar y los vectores
base (vector independiente). Con {x[n] = p0[n] + q1[n] + r2[n] + s3[n], nℤ}, las ecuaciones
normales conducen a la siguiente aproximación óptima en el sentido MSE:
*
2 1 0 a   p  q 
1 2 1   b*    q  r 

  

 0 1 2   c*   r  s 
¿Qué hubiera pasado si expresamos V en la base {0, 1, 2}? Que la matriz de coeficientes resulta
diagonal y su inversión es inmediata. Por ejemplo, para aproximar {x[n] = p0[n] + q1[n] + r2[n]
+ s3[n], nℤ} como {u0[n] + v1[n] + w2[n], nℤ} debemos escoger [u*,v*,w*] para satisfacer las
siguientes ecuaciones normales

2

0


0

0
3
2
0





0 *
pq
 u  

 *  p q

0 v      r 
 *
 2 2

w  



4
p q r 

    s
3
3 3 3 
Por supuesto, {u*0[n] + v*1[n] + w*2[n], nℤ} = {a*0[n] + b*1[n] + c*2[n], nℤ}.
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
18
Para terminar esta larga clase, vamos a extender el ejemplo anterior usando unos espacios
vectoriales más interesantes: El espacio de las señales periódicas de potencia en tiempo discreto,
con período N.
1 N 1


2
pN2 ( )   x :  tales que x[n  N ]  x[n]n  y  x[n]    sobre el campo
N n 0


La representación de una señal x  p2N(ℤ) en la base canónica de los impulsos desplazados es
inmediata:

N 1



 x[n], n     x[k ] [n  k ], n     x[k ]    [n  k  mN ], n   
 m

Ya que sólo hay N coeficientes en la combinación lineal, sería interesante buscar una aproximación
en algún espacio vectorial expandido por sólo N señales. Como acabamos de ver, si escogemos un
conjunto de señales linealmente independientes k [n], n  k 0,1,..., N 1 , queremos encontrar la mejor
k 
k 0
N 1
aproximación en el sentido MSE que tome la forma  xˆ[n]   akk [n], n   . Si aseguramos que


k 0
cada uno de los vectores base sea periódico con período N, garantizaríamos la periodicidad de x̂ .
Suponiendo que ese es el caso, la correlación como medida de energía sería infinita, por lo que
conviene definir la correlación en términos de la potencia acumulada en un período:
N 1
k ,  j  k [n] *j [n],
n 0
N 1
x,  j   x[n] *j [n]
n 0
El operador de conjugación aparece aquí porque estamos usando el campo escalar de los números
complejos, y así se definió la correlación en ℂ para que la correlación de un vector consigo mismo
de en términos de la suma de los cuadrados de la magnitud de sus componentes. Entonces, de
acuerdo con el principio de ortogonalidad, el error cuadrado promedio entre la señal y su
aproximación se minimiza si satisfacemos las ecuaciones normales,
 0 , 0
1 , 0
2 , 0
N 1 , 0   a0   x, 0 




1 , 1
2 , 1
N 1 , 1   a1   x, 1 
 0 , 1
 0 , 2
1 , 2
2 , 2
N 1 , 2   a2    x, 2 


  ,
 0 N 1
1 , N 1
2 , N 1
N 1 , N 1




 a 
  N 1 


 x, 
N 1





Pero si notamos que estamos buscando N variables a partir de N ecuaciones, la condición de
independencia lineal es suficiente para asegurar que no se trata de ninguna aproximación, sino que
hemos logrado una representación de la misma señal periódica en otra base del mismo espacio
vectorial. Además, si conseguimos que los vectores base sean también ortogonales, las ecuaciones
normales se podrían resolver inmediatamente, pues la matriz de coeficientes sería una matriz
diagonal:
x, k
ak 
, k  0,1, 2,..., N  1
k , k
Todas estas propiedades (independencia lineal, periodicidad y ortogonalidad) son satisfechas por las
familias de exponenciales complejas armónicamente relacionadas, k [n]  e j 2 kn / N , n  
,
k 0,1,..., N 1
vistas en la novena clase, para las cuales
Universidad Distrital Francisco José de Caldas - Análisis de Señales y Sistemas - Marco A. Alzate
k , k  N ,
19
k  0,1, 2,..., N 1
N 1
x, k   x[n]e j 2 kn / N , k  0,1, 2,..., N  1
n 0
de manera que los coeficientes que determinan el cambio de base son
1 N 1
ak   x[n]e j 2 kn / N , k  0,1, 2,..., N  1
N n 0
De esta manera hemos encontrado dos formas de expresar cualquier señal x  p2N(ℤ) :
N 1

k 0
 m


N 1

k 0
 x[n], n     x[k ]    [n  k  mN ], n      ak e j 2 kn/ N , n 
 a


k
N 1

  x[n]e j 2 kn / N , k  0,1,..., N  1
n 0

La primera expresión es la expansión del espacio vectorial p2N(ℤ) en la base de los impulsos
unitarios repetidos cada N muestras y la segunda expresión es la expansión del mismo espacio
vectorial en la base de las exponenciales complejas armónicamente relacionadas. Así pues, el par de
transformaciones
N 1
 x[n], n     ak e j 2 kn/ N , n 
k 0
,
N 1


 j 2 kn / N
, k  0,1,..., N  1
ak   x[n]e
n 0


conocidas como fórmulas de síntesis y análisis de la serie de Fourier en tiempo discreto, son
solamente distintas expresiones para la misma señal en bases ortogonales diferentes. Este cambio de
bases se estudiará profundamente más adelante.
Descargar