Apuntes de cátedra - Universidad Nacional de Salta

Anuncio
Universidad Nacional de Salta
Facultad de Ciencias Exactas
Departamento de Matemática
DINÁMICA SIMBÓLICA
APUNTES DE CÁTEDRA
NOVIEMBRE DE 2016
JORGE YAZLLE
CAMILO JADUR
Índice general
Capítulo 1.
ESPACIOS SHIFT
1
1.
Deniciones básicas
2.
Full shifts
1
3.
Los Espacios Shift
3
4.
Lenguajes
5
5.
Shifts de bloques
8
6.
Códigos de ventana deslizante
Capítulo 2.
1
10
SHIFTS DE TIPO FINITO
19
1.
Restricciones de tipo nito
19
2.
Grafos y sus shifts
22
3.
Representación de shifts de tipo nito por medio de grafos
27
4.
Desdoblamiento de estados
30
Capítulo 3.
1.
SHIFTS SÓFICOS
37
Presentaciones de shifts sócos
Capítulo 4.
37
ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT
Z
A
40
1.
Una métrica para
2.
Sucesiones
42
3.
Cilindros. Conexidad
44
4.
Continuidad
45
5.
Sistemas dinámicos
47
Capítulo 5.
ENTROPÍA
40
50
1.
Denición y propiedades básicas
50
2.
Cálculo de la entropía de shifts sócos irreducibles
52
3.
Los puntos períodicos y la entropía
55
4.
Cálculo de la entropía de shifts sócos
57
Capítulo 6.
CÓDIGOS DE ESTADOS FINITOS
61
1.
Coloreo de rutas y presentaciones cerrantes a derecha
2.
Códigos de estados nitos
66
3.
Autovectores aproximados
67
4.
Construcción de códigos de estados nitos
71
0
61
Capítulo 1
ESPACIOS SHIFT
1.
Un
letras.
Deniciones básicas
alfabeto es un conjunto nito,
Un bloque, o palabra, sobre
cuyos elementos se denominan
un alfabeto
A
símbolos,
o también
es una sucesión nita (posiblemente
A. Formalmente, una palabra u sobre A es una función u del conjunto
{x ∈ N : 1 ≤ x ≤ n} en A (para algún entero n ≥ 0). En el caso n = 0, se tiene la función
vacía, o sucesión vacía, que llamaremos palabra vacía y denotaremos por ε. La longitud (o
largo, o tamaño) de la palabra es n, es decir, la cantidad de términos de la sucesión, y se
denota por |u|. La palabra vacía tiene largo 0. Para una palabra no vacía u, el k -ésimo término
de la sucesión se denota, como es costumbre, mediante uk . Entonces, una palabra no vacía de
largo n sobre A es u1 u2 · · · un , con ui ∈ A para todo i ∈ {1, . . . , n}. Un bloque de longitud n
se llama un n-bloque. Dos palabras u y v son iguales si tienen el mismo largo n y, para todo
j entre 1 y n, es uj = vj .
n
El conjunto de todas las palabras de largo n sobre un alfabeto A se designa por A , y el
S
∞
n
∗
∗
conjunto de todas las palabras sobre A se designa por A . Es decir, A =
n=0 A . Notar
n
∗
que, para todo n ≥ 0, A es un conjunto nito, en tanto que A es un conjunto que tiene una
vacía) de letras de
cantidad innita de elementos.
Un alfabeto que a menudo usaremos es
y las palabras que sobre él pueden
0
1
. Tenemos que, en este caso, es A = {ε}, A =
{000, 001, 010, 011, 100, 101, 110, 111}, etc. Además, A∗ =
sucesiones binarias
formarse se llaman
{0, 1}, A2 = {00, 01, 10, 11},
A3 =
A = {0, 1},
{ε, 0, 1, 00, 01, 10, 11, . . .}.
Sea u un bloque. Un subbloque (o subpalabra)
i ≥ 1 tal que ∀k ∈ Z, 1 ≤ k ≤ |w| ⇒ wk = ui+k−1 .
de
u
es una palabra
w
tal que existe
De la denición, se desprende que la
u = u1 · · · un es un n-bloque no
vacío, sus subpalabras no vacías son de la forma ui · · · uj , en donde i, j son enteros tales que
1 ≤ i ≤ j ≤ n. Si w es subbloque de u, escribimos w v u, y decimos que w ocurre en u.
Obviamente, w v u ⇒ |w| ≤ |u|.
Si u y v son dos bloques sobre A, la concatenación de u y v es la nueva palabra que
se obtiene al escribir los símbolos de u y, a continuación, los de v , sin ningún signo especial
intermedio. La concatenación de u y v se escribe uv . Notar que, en general, uv 6= vu. Es directo
ver que |uv| = |u|+|v|. De manera análoga, la concatenación de tres o más bloques es la palabra
palabra vacía es subbloque de cualquier palabra, y que si
que se obtiene de escribir los respectivos símbolos consecutivamente. La concatenación de un
n
bloque u consigo mismo una cantidad n de veces se designa por u . Formalmente:
n
u =
Por ejemplo,
(01)3 = 010101,
Se cumple que para todo
(um )n = umn .
ε
uun−1
A,
si
n=0
n>0
013 = 0111.
∗
bloque u ∈ A y enteros
y
2.
Dado un alfabeto
si
se denomina
conjunto de todas las funciones de
Z
en
no negativos
m
y
n,
y
Full shifts
full shift sobre el alfabeto A,
A.
um un = um+n
es
El full shift sobre
1
A
o
full A-shift,
se denota por
A
Z
.
al
2
1. ESPACIOS SHIFT
Una función de
Z
A
en
no es más que una sucesión bi-innita de símbolos de
A,
que puede
escribirse así:
x = (xn )n∈Z = · · · x−2 x−1 x0 x1 x2 x3 · · ·
A = {0, 1} es la que tiene 0 en sus términos
· · · 01010101010 · · · .
la coordenada 0 de x, escribiremos un signo de puntuación
Un ejemplo de tales sucesiones bi-innitas para
impares, y
1
en sus pares, es decir,
Para tener una idea de cuál es
a la izquierda de
x0 ,
así:
. . . x−2 x−1 .x0 x1 x2 . . .
En nuestro ejemplo anterior, escribimos
· · · 010.10101010 · · · .
Debe quedar claro que el signo de puntuación no es un elemento del alfabeto, ni un término
de la sucesión
x;
es sólo una manera de representar a
una referencia a sus posiciones.
Z
Los elementos de A reciben el nombre de
xi = yi para todo entero i.
AZ no contiene palabras,
Notar que
de modo de tener
puntos. Cada punto es, entonces, una sucesión
bi-innita, o tirilla bi-innita, de símbolos. Dos puntos
y sólo si,
· · · x−2 x−1 x0 x1 x2 · · ·
x = (xi )i∈Z
sino sucesiones bi-innitas.
e
y = (yi )i∈Z
A∗
y
AZ
son iguales si,
no tienen ningún
elemento en común.
x = · · · x−2 x−1 x0 x1 x2 x3 · · · ∈ AZ , designamos por x[i,j] a la sucesión (nita) de los
símbolos de x que van desde la coordenada i hasta la coordenada j , ambas inclusive. Es decir,
x[i,j] = xi xi+1 · · · xj−1 xj . Adoptamos la convención de que para i > j , x[i,j] = ε (formalmente,
x[i,j] es la función u con dominio {n ∈ Z : 1 ≤ n ≤ j − i + 1} y codominio A tal que un =
xi+n−1 ). Denotamos por x[i,∞) a la sucesión innita a derecha xi xi+1 · · · , mientras que x(−∞,i]
∗
Z
es la sucesión innita a izquierda · · · xi−1 xi . Dados u ∈ A y x ∈ A , decimos que u ocurre
en x, o también que u es palabra o bloque de x (y lo escribimos u v x) si existen enteros
i, j tales que x[i,j] = u. Notar que la palabra vacía ocurre en cualquier punto del full shift:
∀x ∈ AZ , x[1,0] = ε. El (2k + 1)-bloque central de x es x[−k,k] .
∗
∞
Z
Para un bloque no vacío u = u1 · · · un ∈ A − {ε}, designamos por u
al punto x ∈ A
que resulta de la concatenación innita (hacia ambos lados) de la palabra u consigo misma de
modo que ∀i ∈ {0, . . . , n − 1} , xi = ui+1 :
Dado
u∞ = · · · uuuuu.uuuuuu · · · = · · · u1 · · · un u1 · · · un .u1 · · · un u1 · · · un · · ·
0 es u1 . Por ejemplo, si u = 011, entonces u∞ = · · · 011011.011011011 · · · ,
· · · 0110110.11011011 · · · = (110)∞ .
Obsérvese que la coordenada
que no es el mismo que
2.1.
La transformación shift.
i de una sucesión (xi )i∈Z
representa el valor de la sucesión en el minuto i.
Se puede pensar en el subíndice
como indicador del tiempo, de modo que
xi
El paso de una unidad de tiempo equivale entonces a desplazar (shift) cada coordenada de
Z
Z
la sucesión un lugar hacia la izquierda. Esto dene una transormación natural de A en A ,
llamada
transformación shift y denotada por σ , del siguiente modo:
σ : AZ → AZ
x
7→ y = σ (x)
con
yi = xi+1
x = (00111)∞ = · · · 00111.0011100111 · · · , entonces σ (x) = · · · 001110.011100111 · · ·
notación standard en teoría de sistemas dinámicos, usaremos σx para σ (x), y
Por ejemplo, si
Conforme a
σxi
(σ (x))i .
es una función biyectiva. Su inversa,
para
σ −1 , desplaza cada posición de una sucesión un lugar
k
hacia la derecha. Si k es un entero positivo, σ designa a la composición de σ consigo misma
k veces, y produce el efecto de desplazar todas las coordenadas de una sucesión k lugares a la
k
−k
−1
izquierda (σ xi = xi+k ), mientras que σ
es la composición de σ
consigo misma k veces,
−k
0
y mueve k lugares a la derecha (σ
xi = xi−k ). σ se dene como la función identidad. Se
k
puede resumir todo diciendo que σ xi = xi+k , sea k positivo o no. Nótese que, en consecuencia,
σ
3. LOS ESPACIOS SHIFT
xi = σ k xi−k .
k ∈ Z.
Por ser composición de biyecciones,
Proposición 1.1.
σk
3
es una biyección de
AZ ,
para cualquier
Sean u ∈ A∗ , x ∈ AZ y k ∈ Z; se tiene que u v x ⇔ u v σ k x.
Demostración. Puesto que
x[i,j] = σ k x[i−k,j−k] ,
se tiene que
u v x ⇔ ∃i, j ∈ Z : u = x[i,j] = σ k x[i−k,j−k] ⇔ u v σ k x
n ≥ 1 tal que σ n x = x, se llama punto periódico
para σ , y, en ese caso, n es un período de x. Para el caso particular en que n = 1 (es decir,
σx = x), x se llama punto jo para σ . Todo punto periódico es de la forma u∞ , con u ∈ A∗ .
∞
En particular, un punto jo para σ es de la forma a , para algún a ∈ A. Si x es periódico de
período n, también es periódico de período 2n, 3n, . . . El menor de los números positivos k tales
k
que σ x = x se llama período mínimo de x.
Un punto
x ∈ AZ
para el cual existe un
Sea x un punto periódico para σ de período mínimo n0 . Entonces, para cualquier
entero positivo k , x tiene período kn0 .
Lema 1.2.
k . Para k = 1, se cumple pues n0 es un período de
σ (k+1)n0 x = σ n0 σ kn0 x = σ n0 x = x, por lo que (k + 1) n0 es
Demostración. Por inducción sobre
x.
Supongamos que
un período de
σ kn0 x = x.
Es
x.
Proposición 1.3. Sea x un punto periódico para σ de período mínimo n0 . x tiene período
n si, y sólo si, n es múltiplo de n0 .
tiene período n. Sean
n0 . Por el Lema 1.2, vemos que x = σ r σ kn0 x =
Demostración. Para la ida, supongamos que
n = kn0 + r con 0 ≤ r <
r < n0 debe ser r = 0, y entonces n
es múltiplo de
x
k y r tales que
σ r x, pero como
n0 .
La vuelta es el contenido del Lema 1.2.
3.
Los Espacios Shift
∗
una colección de bloques sobre un alfabeto A, es decir, F ⊆ A .
Z
Designamos por XF al subconjunto de A formado por todos aquellos puntos en los que
Definición 1.4. Sea
F
no
ocurre ningún bloque de F . Es decir,
XF =
x ∈ AZ : ∀f ∈ F, f
=
x ∈ AZ : ∀i, j ∈ Z, x[i,j] ∈
/F
no ocurre en
x
x∈
/ XF ⇔ ∃i, j ∈ Z : x[i,j] ∈ F .
continuación, algunos ejemplos sobre A = {0, 1}:
Obsérvese que
A
Ejemplo 1.5. Si
F1 = ∅,
es
XF1 = AZ ,
pues trivialmente se tiene que
Z, x[i,j] ∈
/ F1 .
Ejemplo 1.6. Si
F2 = {0, 1},
es
Ejemplo 1.7. Si
F3 = {ε},
XF3 = ∅,
Ejemplo 1.8. Si
F4 = {0}, es XF4 = {1∞ }, pues cualquier
que xi = 0, y entonces x[i,i] ∈ F4 .
una coordenada
i
tal
Ejemplo 1.9. Si
xi = 0,
es
xi+1 = 0
o
es
XF2 = ∅,
∀x ∈ AZ , x[0,0] ∈ F2 .
∀x ∈ AZ , x[1,0] = ε ∈ F3 .
pues
pues
∀x ∈ AZ , ∀i, j ∈
∞
F5 = {00, 01}, es XF5 = {1 } pues si un
xi+1 = 1, y en cualquier caso x[i,i+1] ∈ F5 .
punto
x
distinto de
1∞
posee
punto
x
tiene una coordenada
(01)∞ , (010)∞ , (00100010)∞ ,
· · · 0000.10000 · · · , · · · 00100000.00000 · · · , · · · 00001000100101.01010010001000010000010 · · · . XF6
Z
es precisamente el conjunto de puntos de A que no contienen dos 1 consecutivos. Este espacio
shift es conocido como el shift de la razón de oro.
Ejemplo 1.10. Si
F6 = {11},
algunos puntos de
XF6
son
4
1. ESPACIOS SHIFT
Ejemplo 1.11. Si
F7 = {1n : n ≥ 2},
Ejemplo 1.12. Si
F8 = A∗ ,
Ejemplo 1.13. Si
F9 = {102n+1 1 : n ∈ N}, XF9
es
es
X F7 = X F6 .
XF8 = ∅.
es precisamente el conjunto de puntos de
A
tales que entre dos ocurrencias consecutivas de 1 hay una cantidad par de 0 (es decir,
Z
n
aquellos puntos x ∈ A tales que 10 1 v x ⇒ n es par). Este espacio shift es conocido como el
Z
shift par.
Proposición 1.14.
1.
2.
3.
Sean F y F 0 subconjuntos de A∗ . Entonces:
XF ∪F 0 = XF ∩ XF 0
XF ∩F 0 ⊇ XF ∪ XF 0
Si F ⊆ F 0 , entonces XF ⊇ XF 0 .
Demostración. Para la primera aserción,
x ∈ XF ∩ XF 0 ⇔ ∀u v x, u ∈
/ F ∧u ∈
/ F0 ⇔
∀u v x, u ∈
/ F ∪ F 0 ⇔ x ∈ XF ∪F 0 .
Para la segunda, si x ∈ XF y u v x, se tiene que u ∈
/ F , por lo que u ∈
/ F ∩ F 0 , y entonces
x ∈ XF ∩F 0 ; de aquí que XF ⊆ XF ∩F 0 . Análogamente, XF 0 ⊆ XF ∩F 0 , y, de las dos contenciones
anteriores, es XF ∪ XF 0 ⊆ XF ∩F 0 .
Para la tercera, si x ∈ XF 0 y u v x, u ∈
/ F 0 ⊇ F , y entonces u ∈
/ F . Por lo tanto, x ∈ XF . F ⊆ A∗ ,
Z
de la denición de XF resulta claro que XF ⊆ A . Ahora bien, dado un
Z
∗
subconjunto cualquiera X de A , ¾existirá siempre un F ⊆ A tal que X = XF ? Resulta que
Dado
no siempre, y aquellos
X
para los que sí existe tal
F
reciben un nombre especial y son objeto
de nuestro estudio.
Definición 1.15. Un
existe un
∗
F ⊆A
Pensamos en
sobre el alfabeto
A
es un conjunto
X ⊆ AZ
tal que
X = XF .
tal que
F
espacio shift
como en un conjunto de
bloques prohibidos para X .
Antes de ver ejemplos de subconjuntos de
AZ
que son o no espacios shift, veamos una
propiedad importante que cumplen los conjuntos que sí lo son.
Proposición 1.16.
pertenece a X .
Sean X un espacio shift, x ∈ X y k ∈ Z. Entonces σ k x también
Demostración. Sea
k
F
tal que
X = XF .
Consideremos un bloque arbitrario
u
que ocurra
σ x. Por la Proposición 1.1, tenemos que también u ocurre en x, luego u no puede pertenecer
F . Como u era un bloque arbitrario de σ k x, vemos que ningún bloque de σ k x está en F , por
k
k
lo que σ x ∈ XF , es decir, σ x ∈ X .
en
a
Sea X ⊆ AZ , y supongamos que existen x ∈ X y k ∈ Z tales que
σ x∈
/ X . Entonces X no es un espacio shift.
Corolario 1.17.
k
Corolario 1.18.
Si X es un espacio shift y k ∈ Z, entonces σ k (X) = X .
y ∈ σ k (X), existe x ∈ X tal que y = σ k (x), que, de acuerdo a la
k
−k
Proposición 1.16, está en X ; luego σ (X) ⊆ X . Esto también muestra que σ
(X) ⊆ X , por
k
−k
k
k
k
−k
lo que σ
σ (X) ⊆ σ (X); pero como σ es biyectiva, se tiene que σ σ (X) = X , y
k
entonces tenemos que X ⊆ σ (X).
Demostración. Si
La propiedad de ser
σ (X) = X
se llama
invariancia por shift
o
shift invariancia.
Los corolarios anteriores dicen que todo espacio shift es shift invariante, o, igualmente, que
un conjunto que no es shift invariante no puede ser un espacio shift. Por ejemplo, el conjunto
∞
∞
unitario X = {(01) } no es un espacio shift pues σ (01)
= (10)∞ ∈
/ X . Sin embargo, la shift
invariancia de un conjunto no garantiza que éste sea un espacio shift.
4. LENGUAJES
5
{0, 1} en las que
hay exactamente una coordenada 1 y el resto son todas 0. Es decir, X = (xi )i∈Z : ∃k ∈ Z : (xk = 1 ∧ ∀i 6=
Si x ∈ X , σx también pertenece a X , es decir, X es invariante por shift. Sin embargo, veamos que X no es espacio shift. Para arribar a una contradicción, supongamos que lo fuera.
k
Quiere decir que existiría un F tal que X = XF . Debe ocurrir que ∀k ≥ 1, 0 ∈
/ F (pues
k
∞
∀k ≥ 1, 0 v · · · 000000.1000000 · · · ∈ X ). Pero entonces 0 pertenecería a XF , con lo cual
0∞ ∈ X , que contradice la denición de X . La contradicción proviene de suponer la existencia
del conjunto F , es decir, de suponer que X es un espacio shift.
Ejemplo 1.19. Sea
X
el conjunto de todas las sucesiones bi-innitas sobre
Ejemplo 1.20. El conjunto vacío y el full shift
{0, 1}Z
son espacios shift, según se mostró
en los ejemplos 1.5 y 1.6. En general, cualquier full shift es un espacio shift. Los conjuntos
y
XF6
X F4
de los ejemplos 1.8 y 1.10 son también espacios shift. Los ejemplos 1.8 y 1.9 muestran
que un mismo espacio shift puede ser descripto a través de diferentes colecciones de bloques
prohibidos.
La restricción de
σ
a un espacio shift
X
será denotada por
σX .
En vistas del Corolario
es una biyección de X en X . Las deniciones anteriormente dadas para puntos jos y
Z
periódicos de A para σ son igualmente aplicables a un espacio shift X y su respectiva σX .
1.18,
σX
El siguiente resultado será útil en lo sucesivo, pues arma que el conjunto de bloques prohibidos para un espacio shift puede verse como constituido por palabras de longitud al menos
donde
N
N,
es cualquier entero positivo.
Sean X un espacio shift y N un entero positivo. Entonces, existe F ⊆
A tal que todo bloque en F tiene longitud al menos N , y X = XF .
Proposición 1.21.
∗
Demostración. Siendo
X
un espacio shift, hay un
F1 = w ∈ AN : ∃u ∈ F 0 : u v w
F 0 ⊆ A∗
tal que
X = XF 0 .
Hagamos
F2 = {u ∈ F 0 : |u| > N }
F = F1 ∪ F 2
Es decir,
F
consta de todas las palabras de
aquellas palabras de largo
Observar que
que
N
F0
que tengan largo mayor que
N,
más todas
F 0.
sobre el alfabeto que contengan una subpalabra que esté en
F1 ∩ F2 = ∅. Es directo ver que todo bloque en F
tiene largo al menos
N . Veamos
X = XF :
x∈
/ XF
⇔ ∃i, j ∈ Z : x[i,j] ∈ F
⇔ ∃i, j ∈ Z : x[i,j] ∈ F1 ∨ x[i,j] ∈ F2
⇔ ∃i, j ∈ Z : j − i + 1 = N ∧ ∃u ∈ F 0 : u v x[i,j] ∨ j − i + 1 > N ∧ x[i,j] ∈ F 0
⇔ ∃u ∈ F 0 : u v x
⇔ x∈
/ XF 0 = X
4.
Definición 1.22. Un
Lenguajes
lenguaje sobre un alfabeto A es cualquier subconjunto de A∗ .
c
∗
es un lenguaje, designaremos por L a su complemento en A , es decir, el
∗
conjunto de todas las palabras de A que no pertenecen a L.
Z
Si X es un subconjunto de A (no necesariamente un espacio shift) y n un entero no
En adelante, si
L
negativo, denotamos por
de
X,
Bn (X)
al conjunto de bloques de longitud
n
que ocurren en puntos
es decir,
Bn (X) = {u ∈ An : ∃x ∈ X : u v x}
Z
n
Por ejemplo, si X = A , entonces Bn (X) es precisamente A . Si X = X{11} ,
B1 (X) = {0, 1}, B2 (X) = {00, 01, 10}, B3 (X) = {000, 001, 010, 100, 101}.
es
B0 (X) = {ε},
6
1. ESPACIOS SHIFT
X = XF y f ∈ F , no puede haber un n tal que f ∈ Bn (X). Es decir,
∀n ∈ N, F ∩ Bn (X) = ∅. Sin embargo, bien puede ocurrir que un bloque de longitud n que no
esté en F tampoco esté en Bn (X).
Nótese que si
Definición 1.23. Sea
X
un subconjunto de
AZ
. El
lenguaje de X , denotado por B (X),
es el conjunto de todos los bloques que ocurren en puntos de
B (X) = {u ∈ A∗ : ∃x ∈ X : u v x} =
X.
∞
[
En otras palabras,
Bn (X)
n=0
Ejemplo 1.24.
B X{11} = {ε, 0, 1, 00, 01, 10, 000, 001, 010, 100, 101, . . .}.
Ejemplo 1.25. Sean
X1 = {(01)∞ , (10)∞ }
y
X2 = {(01)∞ };
se tiene que
B (X1 ) = {ε, 0, 1, 01, 10, 010, 101, 0101, 1010, . . .} = B (X2 )
a pesar de que
X1 6= X2 ;
notar, sin embargo, que
X1
es un espacio shift, mientras que
X2
no lo
es.
Así como
F
se interpretaba como un conjunto de bloques prohibidos para
conjunto de bloques permitidos para
shift
X,
decimos de él que
permitido en X .
XF .
XF , B (XF )
es el
Cuando un bloque está en el lenguaje de un espacio
ocurre en X , o que aparece en X , o que está en X , o que está
X = XF , entonces F ∩ B (X) = ∅.
esté en F tampoco esté en B (X).
Una consideración análoga a la de más arriba: si
embargo, bien puede ocurrir que un bloque que no
Sin
Si un bloque está en el lenguaje de un espacio shift, la denición nos dice que hay un
punto del espacio en el cual, en determinada posición, encontramos ese bloque. Sin embargo,
usando shift invariancia, podemos ver que el bloque aparece en algún punto del espacio en la
coordenada que uno quiera.
Proposición 1.26. Sean X un espacio shift, u un bloque en B (X), y k un entero. Entonces,
existe x ∈ X tal que x[k,k+|u|−1] = u.
u ∈ B (X), existe x0 ∈ X tal que u v x0 , es decir, hay un
i ∈ Z tal que x0[i,i+|u|−1] = u. Hagamos x = σ i−k x0 . Por Proposición 1.16, x pertenece a X , y
x[k,k+|u|−1] = σ i−k x0[k,k+|u|−1] = x0[i,i+|u|−1] = u.
Demostración. Dado que
No cualquier lenguaje (en el sentido de la denición 1.22) es el lenguaje de algún espacio
shift. Por ejemplo, resulta directo ver que el lenguaje de un espacio shift no vacío es un conjunto
∗
innito, de modo que un subconjunto nito no vacío de A no puede ser el lenguaje de ningún
espacio shift sobre
A.
Buscamos caracterizar a aquellos lenguajes que son los lenguajes de los
espacios shift.
Sean X un espacio shift y B (X) su lenguaje. Si v ∈ B (X), entonces:
cualquier subbloque de v pertenece también a B (X).
hay bloques u y w no vacíos en B (X) tales que uvw ∈ B (X).
Proposición 1.27.
1.
2.
v ∈ B (X), existen i, j ∈ Z y x ∈ X tales que v = x[i,j] . Si v 0 v v ,
v 0 ocurre también en x, de modo que v 0 ∈ B (X). Además, haciendo u = xi−1 y w = xj+1 , se
tiene que u y w son bloques no vacíos que están en B (X) y que uvw = x[i−1,j+1] v x, por lo
que uvw ∈ B (X).
Demostración. Como
La proposición anterior establece condiciones necesarias para los bloques del lenguaje de
un espacio shift. Resulta que esas condiciones son también sucientes: cualquier lenguaje cuyas
palabras satisfagan esas condiciones, es el lenguaje de algún espacio shift.
Proposición 1.28. Sea L un lenguaje con la propiedad de que para todo v ∈ L: (a) cualquier
subbloque de v está en L, y (b) hay bloques no vacíos u y w en L tales que uvw está en L.
Entonces L es el lenguaje de algún espacio shift.
4. LENGUAJES
Demostración. Consideremos el espacio shift
7
X = XLc ,
y veriquemos que
B (X) = L.
Lo haremos por doble inclusión:
v ∈ B (X), existe x ∈ X tal que v v x, de modo que v ∈
/ Lc , o sea que v ∈ L.
Sea ahora v un bloque de longitud n en L, digamos v = x0 · · · xn−1 . Por aplicación de la
condición (b), hay bloques u y w , cuyos símbolos denotaremos, respectivamente, x−j · · · x−1 y
xn · · · xk tales que el bloque v 0 = uvw = x−j · · · x−1 x0 · · · xn−1 xn · · · xk está en L. Aplicando
0
0
0
nuevamente la condición (b) a v hay bloques u = x−j 0 · · · x−j−1 y w = xk+1 · · · xk0 tales que
el bloque x−j 0 · · · x−j−1 x−j · · · x−1 x0 · · · xn−1 xn · · · xk xk+1 · · · xk0 está en L. Continuando de esta
manera, tenemos denido xi para todo entero i, de modo tal que el punto x = (xi )i∈Z cumple
que todos sus bloques están en L, y v = x[0,n−1] . Luego, x ∈ XLc , ya que ningún bloque de x
c
está en L , y v v x, por lo que v ∈ B (XLc ) = B (X).
Si
De las dos proposiciones anteriores, vemos que un subconjunto de
A∗
es el lenguaje de algún
espacio shift si, y sólo si, todos sus bloques cumplen las propiedades (a) y (b) enunciadas en la
Proposición 1.28.
Hay una correspondencia biunívoca entre el conjunto de todos los espacios shift y el conjunto
de todos los lenguajes de espacios shift. Es decir, el lenguaje de un espacio shift determina
completamente a ese espacio shift. Dicho de otro modo, no hay dos espacios shift distintos que
tengan el mismo lenguaje, según veremos a continuación.
Proposición 1.29.
Sea X ⊆ AZ . X es un espacio shift si, y sólo si, X = XB(X)c .
Demostración. La vuelta es consecuencia inmediata de la denición de espacio shift.
Demostraremos la ida por doble inclusión:
todos sus bloques están en B (X) (por la denición de
c
ninguno de ellos está en B (X) , y así x ∈ XB(X)c .
Si
x
x ∈ X,
B (X)),
de modo que
Para la otra contención, dado que X es un espacio shift, hay un F tal que X = XF . Si
∈ XB(X)c y v v x, v ∈
/ B (X)c , es decir, v ∈ B (X), por lo que v ∈
/ F . Como v era un bloque
arbitrario de
x,
hemos demostrado que ningún bloque de
x
está en
F,
por lo que
quedando probada la otra inclusión.
Corolario 1.30.
x ∈ XF = X ,
Sean X1 y X2 espacios shift. Entonces, X1 = X2 ⇔ B (X1 ) = B (X2 ).
Demostración. La ida es inmediata de la denición de lenguaje de un espacio shift.
B (X1 ) = B (X2 ),
X1 = XB(X1 )c = XB(X2 )c = X2
Para la vuelta, suponiendo que
proposición anterior,
En este corolario, es esencial que
X1
y
X2
tenemos que
B (X1 )c = B (X2 )c ,
y, por la
sean espacios shift (ver ejemplo 1.25).
Todos estos resultados muestran que si bien un mismo espacio shift
X
puede ser descripto
a través de varios conjuntos prohibidos, hay un conjunto de bloques prohibidos maximal, que
es el complemento del lenguaje de ese espacio shift: cualquier
c
que F ⊆ B (X) , pues ya sabemos que F ∩ B (X) = ∅.
F
tal que
X = XF
cumple con
Resumimos la correspondencia entre espacios shift y lenguajes de espacios shift a través de
las siguientes ecuaciones:
L = B (XLc )
X = XB(X)c
La Proposición 1.29 tiene otro útil corolario, que dice que si un punto
sus bloques en el lenguaje de un espacio shift
a
X,
entonces el punto
x
x
de
AZ
tiene todos
necesariamente pertenece
X.
Corolario 1.31.
Demostración.
X = XB(X)
c,
Sea X un subconjunto de AZ . X es un espacio shift si, y sólo si,
∀x ∈ AZ , ∀i, j ∈ Z, x[i,j] ∈ B (X) ⇒ x ∈ X
Z
Notemos que ∀x ∈ A , ∀i, j ∈ Z, x[i,j] ∈ B (X) ⇒ x ∈ X si, y sólo
de modo que el corolario se deduce directamente de la Proposición 1.29.
si,
8
1. ESPACIOS SHIFT
4.1.
Irreducibilidad.
v ∈ B (X). Por la
Proposición 1.28, v puede ser extendido hacia ambos lados para formar un bloque uvw que
también está en el lenguaje de X . Ahora bien, dados dos bloques u y w en B (X), puede no ser
posible encontrar un bloque v tal que uvw esté en B (X).
Ejemplo 1.32. Sea
1
Supongamos que
X
es un espacio shift, y que
y tomemos u y w en B (X). Ni u ni w pueden contener dos
· · · 00000u0w0000000 · · · no contiene dos 1 consecutivos, y
B (X).
X = X{11} ,
consecutivos. Entonces, el punto
por eso el bloque
u0w
está en
X = {0∞ , 1∞ }. Se tiene
Sin embargo, no hay ningún bloque v tal que 1v0
contiene simultáneamente un 0 y un 1.
Ejemplo 1.33. Sea
que
u = 1
y
w = 0
B (X).
punto de X
están ambos en
esté en el lenguaje, pues ningún
Los espacios shift en los que dos bloques del lenguaje pueden ser enganchados a través de
un tercer bloque forman una clase importante de espacios shift.
X es irreducible si para cualquier par de bloques u y
B (X) tal que uvw pertenece a B (X). Un espacio shift que
Definición 1.34. Un espacio shift
w
en
B (X),
existe un bloque
no es irreducible se llama
v
en
reducible.
El espacio shift del ejemplo 1.32 es irreducible, en tanto que el del ejemplo 1.33 es reducible.
5.
Shifts de bloques
Hemos denido un alfabeto como un conjunto nito de símbolos, sin exigir nada en especial
A
es un alfabeto y N es un entero positivo, cae también en la categoría
N
N
de alfabeto el conjunto A . Por claridad notacional, cuando estemos pensando en A
como
a los símbolos. Si
alfabeto, representaremos su símbolos de la forma

aN

 ... 


 a 
2
a1
a1 a2 · · · aN . Nótese que cada ai ∈ A.
AN es un alfabeto (cuyos elementos son en realidad bloques sobre otro alfabeto),
N
N Z
Z
tenemos derecho a pensar en la full A -shift, es decir, A
. Dado un punto x de A , hay
N Z
que de manera bastante natural pueden asociarse a x. Los llamaremos,
dos puntos de A
respectivamente, βN (x) y γN (x). El siguiente diagrama ilustra cómo se obtienen a partir de x:
en lugar de
Ya que
x
= ···
x−1

βN (x) = · · ·




γN (x) = · · ·
xN −2
.
.
.
x0
x−1
x−1
x0






. 



.



.
.

 . 
 x


−N +1
x−N
Nótese que, a partir de
cada posición.
.
βN (x),
xN −1
.
.
.
x1
x0
xN −1
.
.
.
x1
x0
x1
xN
x2







 ... 


 x 
2
x1



 
x2N −1
 
xN +1
.
.
.
x3
x2
x3N −1
···
x3








 
xN +2
.
.
.
x4
x3
x4N −1




···

.
.
.
 
 
 

.
.
.
.
.
.
 
 
 
 ···
  x
  x
  x

N +1
2N +1
3N +1
xN
x2N
x3N
es posible recuperar
x,
leyendo los símbolos inferiores de
5. SHIFTS DE BLOQUES
βN
Formalizamos la denición de
y de
γN :
9
Ambas son funciones de
AZ
en
AN
Z
, y se
denen mediante:

xi+N −1

(βN (x))i = 

βN (x)
se llama la
.
.
.
xi+1
xi






(γN (x))i = 

x(i+1)N −1
.
.
.
xiN +1
xiN




presentación en bloques de tamaño N , con solape, del punto
x. El término solape se reere al hecho de que dos coordenadas consecutivas cualesquiera de
βN (x) consisten en bloques u = u1 · · · uN y v = v1 · · · vN con u2 · · · uN = v1 · · · vN −1 . Cuando
dos bloques u y v cumplen esto, es decir, que la cola de u (lo que queda de u luego de eliminar
el primer símbolo) es igual a la cabecera de v (lo que queda de v luego de eliminar el último
símbolo), decimos que u y v solapan progresivamente. Entonces, dos símbolos consecutivos
de βN (x), vistos como bloques sobre A, solapan progresivamente, y de allí el nombre para βN .
γN (x) se llama la presentación en bloques de tamaño N , sin solape, del punto x, por la
razón de que no necesariamente se cumple la condición de solape progresivo entre coordenadas
consecutivas de
γN (x).
Las deniciones anteriores pueden generalizarse de la siguiente manera:
X un espacio shift y N un entero positivo. Hagamos AN
X = BN (X).
N Z
βN : X → AX mediante


xi+N −1
.


.
.

(βN (x))i = 
 x

Definición 1.35. Sean
Se dene la función
i+1
xi
La imagen de X a través de
[N ]
se denota X
. Es decir,
Análogamente, se dene la
βN
se llama
presentación en N -bloques de X , con solape, y
X [N ] = {βN (x) : x ∈ X} = βN (X)
N Z
mediante
función γN : X → AX


x(i+1)N −1
.


.
.

(γN (x))i = 
 x

iN +1
xiN
La imagen de X a través de
N
se denota X . Es decir,
γN
se llama
presentación en N -bloques de X , sin solape,
X N = {γN (x) : x ∈ X} = γN (X)
0
1
0
2
Ejemplo 1.36. Sea X = X{11} . Entonces, AX =
,
,
.
0
0
1
Si x = · · · 000.01010 · · · , entonces
0
0
0
1
0
1
0
β2 (x) = · · ·
.
···
0
0
0
0
1
0
1
γ2 (x) =
···
0
0
.
1
0
1
0
···
X [2] = XF1 y que X 2 = XF2 con
0
0
1
0
1
1
0
0
F1 =
,
,
,
0
1
0
0
0
0
1
1
Se puede mostrar que
y
10
1. ESPACIOS SHIFT
F2 =
(notar que
F1
tiene cuatro elementos, y
F2
1
0
0
1
uno).
Por cuestiones de codicación que más adelante detallaremos, de ahora en más estaremos
más interesados en las presentaciones con solape que en las sin solape. Nótese que la función
−1
βN actúa inyectivamente, de modo que es una biyección entre X y X [N ] . De este modo, βN
es
[N ]
una función bien denida desde X
hacia X , o, más generalmente, desde el conjunto de todos
N Z
Z
los puntos de A
cuyos símbolos consecutivos solapan progresivamente hacia A .
Será conveniente sobrecargar el símbolo
βN ,
manera: para
w = w1 · · · wm
m ≥ N,


wN
 ... 

βN (w) = 
 w 
con
2
denimos




w1
Es directo ver que
βN
βN se pueda conN , de la siguiente
de manera que la función
siderar también para actuar sobre bloques de tamaño mayor o igual que
wN +1
.
.
.
w3
w2
wm



 ···

.


.
.


 w

m−N +2
wm−N +1
actúa sobre bloques en forma inyectiva:

u 6= u0 ⇒ βN (u) 6= βN (u0 ).
Las presentaciones con (o sin) solape de cualquier espacio shift son también espacios shift.
Sea X un espacio shift sobre el alfabeto A. Para todo N ≥ 1, X [N ] es
un espacio shift sobre el alfabeto BN (X).
Proposición 1.37.
F 0 tal que X = XF 0 . En virtud de la Proposición 1.21, podemos
0
suponer que cada bloque de F tiene largo al menos N . Hagamos
F1 = {βN (w) : w ∈ F 0 }
F2 = uv ∈ (BN (X))2 : u y v no solapan progresivamente
Demostración. Sea
F = F1 ∪ F 2
X [N ] = XF , con lo que quedará establecido que X [N ] es un espacio shift.
[N ]
Primero veamos que X
⊆ XF1 . Sea x
e ∈ X [N ] , y u
e un bloque en x
e. Existe x ∈ X tal
que βN (x) = x
e, por lo que hay un bloque u de x tal que βN (u) = u
e. Dado que que βN
es inyectiva y que u ∈
/ F 0 , vemos que u
e∈
/ F1 . Como u
e era arbitrario, x
e ∈ XF1 .
[N ]
Ahora veamos que X
⊆ XF2 : sabemos que si x
e ∈ X [N ] , ocurre que ∀i ∈ Z, x
ei y
x
ei+1 solapan progresivamente. Entonces, ningún bloque de x
e de tamaño 2 puede estar
en F2 (que tiene sólo bloques de tamaño 2), por lo que x
e ∈ X F2 .
[N ]
Como X
⊆ XF1 y X [N ] ⊆ XF2 , se tiene, usando la Proposición 1.14, que X [N ] ⊆
XF1 ∩ XF2 = XF1 ∪F2 = XF .
[N ]
Veamos ahora que XF ⊆ X
: sea x
e ∈ XF = XF1 ∪F2 = XF1 ∩ XF2 . Entonces, x
e ∈ XF1 y
−1
Z
x
e ∈ XF2 . Como x
e ∈ XF2 , podemos hacer x = βN (e
x), el cual pertenece a A ; pero dado
que x
e ∈ XF1 , debe ser x ∈ XF 0 = X , y entonces x
e ∈ X [N ] .
y veriquemos que
6.
Códigos de ventana deslizante
En Teoría de Códigos, interesan las maneras que hay de traducir un mensaje (fuente) sobre
un alfabeto
A
en mensaje sobre otro alfabeto
U
(posiblemente el mismo que el del mensaje
fuente). Esto puede ser visto (sobre todo si el mensaje fuente es largo) como una manera de
transformar puntos de un espacio shift en puntos de otro espacio shift, a través de una función.
De las maneras en que esto se puede hacer, hay una clásica que explicamos seguidamente.
Supongamos dados dos enteros
Φ
m
y
n,
con
m + n ≥ 0, y supongamos también dada una
+ n + 1 sobre A en símbolos de U . Entonces,
y ∈ U Z es mirar el bloque que hay en una
que transforma bloques de tamaño m
Z
una manera de transformar un x ∈ A en un
función
6. CÓDIGOS DE VENTANA DESLIZANTE
ventana de ancho
la función
m+n+1
alrededor de la coordenada i-ésima de
11
x
y aplicarle a ese bloque
Φ para obtener la correspondiente coordenada del transformado. Más concretamente,
y será Φ x[i−m,i+n] . Para calcular luego la (i + 1)-ésima coordenada
la i-ésima coordenada de
de
y,
desplazamos toda la ventana una posición a la derecha, y repetimos. Llevando esto a
cabo para todo
i ∈ Z,
obtenemos el transformado de
la ventana, transformar usando
Φ
x.
Esta operación de ver el contenido de
y deslizar, motiva que la función transformadora reciba el
nombre de código de ventana deslizante, que abreviaremos CVD. Formalmente:
m, n ∈ Z con m + n ≥ 0, A y U alfabetos, X un espacio shift sobre
A, y Φ una función de Bm+n+1 (X) en U . El código de ventana deslizante con memoria
m y anticipación n inducido por Φ es la transformación φ : X → U Z denida por y = φ (x)
con yi = Φ x[i−m,i+n] .
Definición 1.38. Sean
Notar, en la denición de arriba, la distinción tipográca entre
φ
(que transforma tirillas
Φ (que transforma bloques de tamaño m + n + 1). Decimos que φ es inducida
por Φ, o que Φ induce a φ, y, para expresar este hecho, escribimos φ = Φ[−m,n]
. La función
∞
Φ se llama función de bloques, o función inductora, de φ. De los números m y n decimos
que son, respectivamente, la memoria y la anticipación de φ (o también de Φ), por el hecho
bi-innitas) y
de que indican cuántas coordenadas del pasado y del futuro hay que conocer para obtener
el transformado en la posición que corresponde al presente.
Ejemplo 1.39.
A = {0, 1} , U = {A, B, C} , m = 1, n = 2, X = X{110,101} , Φ : B4 (X) → U
dada por
Φ (0000) = A Φ (0001) = A Φ (0010) = B Φ (0011) = A
Φ (0100) = C Φ (1000) = B Φ (1001) = C Φ (1111) = A
[−m,n]
φ = Φ∞
y x = · · · 001.000010010001 · · · , tenemos que φ (x) = · · · BC.BAABCCBCBA ·
pues φ (x)−2 = Φ x[−2−m,−2+n] = Φ x[−3,0] = Φ (0010) = B , φ (x)−1 = Φ x[−1−m,−1+n] =
Φ x[−2,1] =Φ (0100) = C , φ (x)0 = Φ x[0−m,0+n] = Φ x[−1,2] = Φ (1000) = B , φ (x)1 =
Φ x[1−m,1+n] = Φ x[0,2] = Φ (0000) = A, y así.
Entonces, si
A, U, X, x y Φ iguales que en el ejemplo anterior, excepto que m = 0, n = 3.
φ (x) = · · · BCB.AABCCBCBA · · ·
Ejemplo 1.40.
En este caso,
Ejemplo 1.41.
1 = Φ (1),
y
F =
A = {0, 1} = U, X = AZ , m = 0 = n, Φ : B1 (X) → U
x ∈ AZ , F (x) = 1∞ .
[−m,n]
Φ∞
. Entonces, para todo
dada por
Φ (0) =
A cualquier alfabeto, X cualquier espacio shift sobre A, U = A, m = 0, n =
[−m,n]
1, Φ (ab) = b, φ = Φ∞
. Entonces, φ = σX , pues, para x ∈ X, φxi = Φ (xi xi+1 ) = xi+1 =
σX (x)i .
Ejemplo 1.42.
A cualquier alfabeto, X cualquier espacio shift sobre A, U = A, m = 1, n =
[−m,n]
−1
0, Φ (ab) = a, φ = Φ∞
. Entonces, φ = σX , pues, para x ∈ X, φxi = Φ (xi−1 xi ) = xi−1 =
−1
σX
(x)i .
Ejemplo 1.43.
U = AN (N ≥ 1), X cualquier espacio shift sobre A,
y φ = βN (la presentación en N -bloques con solape de X ). Entonces φ es un CVD con memoria
0 y anticipación N − 1 inducido por Φ denida como


aN
Φ (a1 · · · aN ) =  ... 
a1
Ejemplo 1.44.
A
cualquier alfabeto,
12
1. ESPACIOS SHIFT
Ejemplo 1.45. En relación al ejemplo anterior,
X,
con memoria y anticipación
0,
inducido por

Φ 
aN
.
.
.
−1
βN
es también un CVD desde
Φ denida

X [N ]
hacia
como
 = a1
a1
Al igual que con la transformación shift
obligatoriamente) la notación
Los CVD para los cuales
σ , si φ es un CVD,
φxi para (φ (x))i .
emplearemos (aunque no
φx para φ (x) y
m = 0 = n se llaman códigos monobloque,
dado que actúan
mirando bloques que tienen un solo símbolo (el que corresponde al presente).
Y
Si un CVD φ con dominio X es tal que φ (X) es un subconjunto de algún espacio shift
⊆ U Z , podemos mirar a φ como una función entre los espacios shift X e Y , y diremos
entonces que el CVD es un código entre los espacios shift
X
e
Y.
φ entre dos espacios shift X e Y es un CVD. Para que lo sea, debemos
Φ : Bm+n+1 (X) → B1 (Y ) tal que ∀x ∈ X, ∀i ∈ Z, φxi =
posible el hallazgo de una función inductora, φ no es un CVD.
No cualquier función
m,
encontrar un
Φ x[i−m,i+n]
un
n
. Si no es
Ejemplo 1.46.
y una
A = {0, 1} = U, X = AZ , Y = U Z , φ : X → Y
∞
∞
0
si x = 0
φ (x) =
1∞ si x 6= 0∞
denida por
φ no es un CVD. Supongamos que lo fuera. Debe haber una función inductora Φ
m y anticipación n. Sea x = (xi )i∈Z denido por xn+1 = 1, y xi = 0 para todo
∞
i 6= n + 1. Ya que
)0 = 0 (pues φ0∞ = 0∞ ), debe ser Φ (0m+n+1 ) = 0. Pero entonces
es (φ0 m+n+1
φx0 = Φ x[−m,n] = Φ (0
) = 0. Contradicción, pues por la denición de φ se tiene que
∞
φ (x) = 1 , de donde φx0 = 1.
Veamos que
con memoria
A veces será conveniente agrandar el ancho de la ventana para la función inductora (sin
modicar, obviamente, el CVD en cuestión). Para hacer esto, simplemente debemos ignorar las
coordenadas añadidas a la ventana. Esto es lo que dice el siguiente resultado:
Proposición 1.47. Sea φ : X → Y un código de ventana deslizante con memoria m
y anticipación n. Sean M ≥ m y N ≥ n. Entonces existe un código de ventana deslizante
φe : X → Y con memoria M y anticipación N tal que φe = φ.
Demostración. Sea Φ : Bm+n+1 (X) → B1 (Y ) la función inductora de φ.
e
Φ : BM +N +1 (X) → B1 (Y ) mediante
e (a−M a−M +1 · · · a−m · · · a−1 a0 a1 · · · an · · · aN ) = Φ (a−m · · · a0 · · · an )
Φ
Denamos
]
e i=Φ
e [−M,N
e x[i−M,i+N ] =
φe = Φ
. Sea x ∈ X . Para cualquier i ∈ Z, se tiene que φx
∞
e = φx. Como x es arbitrario, se sigue que φe = φ.
Φ x[i−m,i+n] = φxi , y entonces φx
y hagamos
Dado un código de ventana deslizante, se puede suponer que su memoria
es igual a su anticipación.
Corolario 1.48.
m y anticipación n inducido por una transformación de bloques
Φ (que transforma bloques de tamaño m + n + 1 en símbolos), se puede denir, de manera
∗
natural, una función Φ que transforma bloques de tamaño m + n + k (k ≥ 1), haciendo
Dado un CVD con memoria
Φ∗ (a−m a−m+1 · · · a0 a1 · · · an−1 an an+1 · · · an+k−1 ) = Φ (a−m · · · an ) Φ (a−m+1 · · · an+1 ) · · · Φ (ak−m−1,n+k−1 )
Si además convenimos en que
Φ∗ ,
aplicado a un bloque de tamaño menor que
produce la palabra vacía, tenemos que, para
∗
Φ (a1 · · · ap ) =
p ≥ 0,
es
ε
Φ (a1 · · · am+n+1 ) Φ∗ (a2 · · · ap )
si
si
p<m+n+1
p≥m+n+1
m+n+1
6. CÓDIGOS DE VENTANA DESLIZANTE
Φ
y
Φ∗
13
son funcionalmente tan parecidas que en general usaremos la misma notación
Φ
para referirnos a ambas.
Un hecho importante a tener en cuenta es que la composición de CVD es otro CVD.
Proposición 1.49. Sean X , Y y Z espacios shift, y supongamos que φ1 : X → Y y
φ2 : Y → Z son códigos de ventana deslizante. Entonces φ2 ◦ φ1 es un código de ventana
deslizante desde X hacia Z .
n1 , y φ2
inducido por Φ2 con memoria m2 y anticipación n2 . Sea φ : X → Z denido por φx = φ2 (φ1 x).
0
Designemos por φ al CVD con memoria m1 + m2 y anticipación n1 + n2 inducido por la función
Φ : Bm1 +m2 +n1 +n2 +1 (X) → B1 (Z) denida por
Demostración. Supongamos
φ1
inducido por
Φ1
con memoria
m1
y anticipación
Φ (a−m1 −m2 · · · a0 · · · an1 +n2 ) = Φ2 (Φ1 (a−m1 −m2 · · · a0 · · · an1 +n2 ))
Φ1 corresponde en realidad a Φ∗1 como se denió antes). Para x ∈ X y para
cualquier i ∈ Z es
0
φ xi = Φ x[i−m2 −m1 ,i+n2 +n1 ] = Φ2 Φ1 x[i−m2 −m1 ,i+n2 +n1 ] = Φ2 (φ1 x)[i−m2 ,i+n2 ] = φ2 (φ1 x)i = φxi
(nótese que
de modo que
φ0 x = φx.
Luego,
φ = φ2 ◦ φ1
es un CVD.
El enuncado anterior, junto a los ejemplos 1.42 y 1.43, permite ver que para cualquier espacio
−k
k
X y cualquier k ≥ 1, σX
y σX son CVD.
Si φ : X → Y es un CVD y x ∈ X , entonces calcular φ a la sucesión desplazada σX (x) da
shift
lo mismo que desplazar la sucesión
φ (x)
usando
σY .
Esta propiedad de conmutar con las
σ
es
una de las claves para saber si una transformación es un CVD.
Sean X e Y dos espacios shift, y k un entero. Si φ es un código de
k
= σYk ◦ φ, es decir, el siguiente diagrama conmuta:
ventana deslizante, entonces φ ◦ σX
Proposición 1.50.
X
↓φ
Y
k
σX
−→
σYk
−→
X
φ ↓
Y
φ es inducido por Φ con memoria m y anticipación
k
k
∀x
∈
X,
φ
σ
. Sea entonces i ∈ Z. Se tiene que
X (x) = σY (φ (x))
k
k
φ σX
(x) i = Φ σX
(x) [i−m,i+n] = Φ x[i−m+k,i+n+k] = Φ x[(i+k)−m,(i+k)+n] = (φx)i+k =
Demostración. Supongamos que
n.
Debemos probar que
σYk (φx)i .
Como
i
es arbitrario, se tiene lo deseado.
La condición de conmutar con
σ es necesaria, pero no suciente, para que una transformación
sea CVD. El Ejemplo 1.46 sirve para demostrarlo, pues ya hemos visto que la función allí
Z
∞
∞
estudiada no es un CVD, y sin embargo conmuta con σ : sea x ∈ {0, 1} ; si x = 0 , es σx = 0
=
∞
∞
∞
φx, por lo que σ (φ (x)) = 0 = φ (σx); y si x 6= 0 , es σx 6= 0 , por lo que φx = φ (σx) = 1∞ ,
∞
teniendo entonces que σ (φx) = 1
= φ (σx); resumiendo, ∀x ∈ {0, 1}Z , σ (φx) = φ (σx).
Los siguientes resultados establecen condiciones necesarias y sucientes para que una transformación entre dos espacios shift sea un CVD.
Lema 1.51. Sean X e Y dos espacios shift, y φ una función de X en Y tal que φ◦σX = σY ◦φ.
−1
= σY−1 ◦ φ.
Entonces φ ◦ σX
σX y σY son biyecciones, se tiene que σY−1 ◦ σY y σY ◦ σY−1
−1
−1
son la identidad en Y , así como σX ◦ σX y σX ◦ σX son la identidad en X . De allí que
−1
−1
−1
−1
−1
−1
φ ◦ σX = σY ◦ σY ◦ φ ◦ σX = σY ◦ (σY ◦ φ) ◦ σX = σY−1 ◦ (φ ◦ σX ) ◦ σX
= σY−1 ◦ φ ◦
−1
σX ◦ σX
= σY−1 ◦ φ, como se quería probar.
Demostración. Puesto que
14
1. ESPACIOS SHIFT
Sean X e Y dos espacios shift, y φ una función de X en Y tal que φ◦σX = σY ◦φ.
k
Entonces, para todo k ∈ Z, φ ◦ σX
= σYk ◦ φ.
Lema 1.52.
0
0
σX
y σY son, respectivamente, la identidad en X y en Y , la
k
k
proposición se cumple para k = 0. Lo que resta probar es, entonces, que ∀k ≥ 1, φ ◦ σX = σY ◦ φ
−k
−k
y φ ◦ σX = σY ◦ φ. Lo haremos por inducción sobre k . Para k = 1, es cierto por hipótesis y
por Lema 1.51. Suponiendo válido para k , veamos que vale para k + 1:
k+1
k
φ ◦ σX
= φ ◦ σX
◦ σX = σYk ◦ φ ◦ σX = σYk ◦ (φ ◦ σX ) = σYk ◦ (σY ◦ φ) = σYk+1 ◦ φ
−k−1
−k
−1
−1
−1
φ ◦ σX
= φ ◦ σX
◦ σX
= σY−k ◦ φ ◦ σX
= σY−k ◦ φ ◦ σX
= σY−k ◦ σY−1 ◦ φ =
σY−k−1 ◦ φ
Demostración. Ya que
Proposición 1.53. Sean X e Y dos espacios shift, y φ una función de X en Y . φ es un
código de ventana deslizante si, y sólo si, las dos condiciones siguientes se satisfacen simultáneamente:
1. φ ◦ σX = σY ◦ φ.
2. Existen un entero N ≥ 0 y una función Φ : B2N +1 (X) → B1 (Y ) tales que para todo
x ∈ X , (φx)0 = Φ x[−N,N ] .
Demostración. Para la ida, supongamos que
es inducida por
Φ
con memoria y anti-
x en X , (φx)0 =
Φ x[−N,N ] . Además, la Proposición 1.50 con k = 1 muestra que φ ◦ σX = σY ◦ φ.
Para la vuelta, supongamos que φ ◦ σX = σY ◦ φ y que existen N ≥ 0 y una función
Φ : B2N +1 (X) → B1 (Y ) tales que para todo x ∈ X, (φx)0 = Φ x[−N,N ] . Sean x ∈ X e i ∈ Z.
cipación
N (hemos
φ
apelado al Corolario 1.48), de modo que para cualquier
Por el lema 1.52, se tiene que
i
i
(φx)i = σYi (φx) 0 = φ σX
x 0 = Φ (σX
x)[−N,N ] = Φ x[i−N,i+N ]
lo cual muestra que
φ
es CVD inducido por
Φ
con memoria y anticipación
N.
N ≥ 0 tal que (φx)0
−N y N . La negación de esta condición
signica que para todo N ≥ 0, existen x, y ∈ X tales que x[−N,N ] = y[−N,N ] pero (φx)0 6= (φx)0 .
La segunda condición de la proposición anterior establece que existe
es función de lo que
6.1.
e
Y
x
contiene entre las coordenadas
Inmersiones, factores y conjugaciones.
dos espacios shift, y
Definición 1.54.
inyectivo. Se dice que
φ
una función de
X
en
Para las siguientes deniciones, sean
X
Y.
φ es una inmersión de X en Y si φ es un código de ventana deslizante
X está inmerso en Y si existe una inmersión de X en Y .
código factor de X sobre Y si φ es un código de ventana
deslizante sobreyectivo. Se dice que Y es un factor de X si existe un código factor de X sobre
Definición 1.55.
φ
es un
Y.
Definición 1.56.
biyectivo. Se dice que
de
X
a
φ es una conjugación de X a Y si φ es un código de ventana deslizante
X es conjugado a Y (simbolizado X ∼ Y ) si existe una conjugación
Y.
−1
Por ejemplo, σX y σX son conjugaciones de
−1
βN es una conjugación de X [N ] a X .
X
a
X , βN
es una conjugación de
X
a
X [N ] ,
y
De la denición, se ve que toda conjugación es una función biyectiva. Sin embargo, no es
cierto en general que cualquier función biyectiva entre dos espacios shift sea una conjugación.
∞
∞
∞ ∞
∞
Por ejemplo, sean X = {0 , 1 } , Y = {(01) , (10) } y φ : X → Y dada por φ (0 ) =
∞
∞
(01) , φ (1∞ ) = (10) . φ es una función biyectiva, pero no es una conjugación pues no es
∞
∞
un CVD (condición indispensable para ser conjugación), ya que σY (φ (0 )) = σY ((01) ) =
∞
∞
∞
(10) 6= (01) = φ (0∞ ) = φ (σX ((01) )), es decir, φ no conmuta con σ .
6. CÓDIGOS DE VENTANA DESLIZANTE
15
La denición establece que una conjugación es un CVD biyectivo (por lo cual, toda conjugación es también un código factor y una inmersión), y esto nos permite garantizar sólo que
su inversa es una función biyectiva (pero, por lo visto hasta aquí, no necesariamente un CVD).
−1
Más adelante, demostraremos que si φ es conjugación, φ
es un CVD (y, en consecuencia,
también es una conjugación).
Proposición 1.57.
La composición de dos conjugaciones es otra conjugación.
Demostración. Se deduce directamente de la Proposición 1.49 y del hecho que la com-
posición de funciones biyectivas es una función biyectiva.
−k
k
σX
y σX son también conjugaciones de X
−1
k ≥ 0, pues σX y σX
lo son.
Como consecuencia,
shift
X
y cualquier
a
X , para cualquier espacio
Veamos la acción de un CVD sobre los puntos periódicos de un espacio shift. El siguiente
resultado muestra que las inmersiones (y en consecuencia las conjugaciones) preservan el mínimo
período de un punto periódico.
Sean φ : X → Y un código de ventana deslizante, x ∈ X un punto
periódico período n para σX , e y = φx. Entonces y tiene también período n para σY , y el mínimo
período de y divide al mínimo período de x. Si φ es además una inmersión, el período mínimo
de y es igual al período mínimo de x.
Proposición 1.58.
n
σX
(x) = x, tenemos que, por la propiedad de conmutar φ con
n
n
σ , φx = φ (σX (x)) = σY (φx), es decir, y = σYn (y). Entonces y tiene período n para σY . Si x
tiene mínimo período n0 , entonces y tiene período n0 , y el mínimo período de y divide a n0 . Si
n
φ es inyectiva, tenemos que σX
(x) = x si, y sólo si, σYn (φx) = φx (la ida está demostrada al
n
n
n
principio, y para la vuelta: σY (φx) = φx ⇒ φ (σX (x)) = φx ⇒ σX (x) = x por la inyectividad
de φ). Entonces, x tiene período n si, y sólo si, y tiene período n. Dicho de otro modo, el
conjunto de períodos para x es el mismo que el conjunto de períodos para y , de manera que el
período mínimo de x es el mismo que el período mínimo de y .
Demostración. Ya que
De esta proposición se deduce que dos espacios shift que no tienen la misma cantidad
n (cualquiera sea n) no pueden ser conjugados. Es decir, la
n de un espacio shift es un invariante por conjugación:
∀n > 0, X ∼ Y ⇒ |{x ∈ X : x tiene período n}| = |{x ∈ Y : x tiene período n}|.
6.1.1. Recodicación a códigos monobloque. Sea φ : X → Y un CVD. Mostraremos cómo
e conjugado a X y φ a un CVD monobloque φe de X
e a
es posible recodicar X a un shift X
Y . Este procedimiento se denomina recodicación de φ a un código monobloque, y será
de puntos periódicos de período
cantidad de puntos de período
usado en varias demostraciones posteriores.
Proposición 1.59. Sea φ : X → Y un código de ventana deslizante. Entonces existe un
e , una conjugación ξ de X a X
e y un código de ventana deslizante monobloque
espacio shift X
−1
e
e
φ : X → Y tales que ξ es una conjugación y φe ◦ ξ = φ. Si además φ es una conjugación, φe
también lo es.
φ es inducida
◦ βm+n+1 . Dado
Φ con memoria m y anticipación n.
−m
Tomemos
y ξ =
que σ e
y βm+n+1 son conjugaciones, y
X
e . Su inversa ξ −1 : X
e →X
teniendo en cuenta la Proposición 1.57, ξ es conjugación de X a X
−1
−1
−1
m
m
está dada por ξ
= βm+n+1 ◦ σXe , y es otra conjugación pues βm+n+1 y σXe lo son. Denamos
e → Y mediante φe = φ◦ξ −1 . Tenemos que φe es CVD, por ser la composición de dos CVD, y
φe : X
−1
e
e
e
e → B1 (Y )
cumple que φ◦ξ = φ◦ξ
◦ξ = φ. Además, una función inductora para φ es Φ : B1 X
Demostración. Supongamos que
e = X [m+n+1]
X
−m
σX
e
por
16
1. ESPACIOS SHIFT
denida por


pues para



x
e = 


xi+n
.
.
.
xi
.
.
.
an
 ..
 .

e
Φ
 a0
 .
 ..
a−m







xi−m

e
∈X




 = Φ (a−m · · · a0 · · · an )


se tiene que
i∈Z
xi+n+m
.

.
.


m
σXe (e
x) =  xi+m

.
.

.
xi
y entonces, para cualquier entero







−1
m
βm+n+1
σX
x) = (xi )i∈Z ∈ X
e (e
i∈Z
j
se cumple que




−1
m
exj = φ ξ −1 x
e
=
Φ
x
=
Φ
φe
e j = Φ βm+n+1
σX
(e
x
)

[j−m,j+n]
e
[j−m,j+n]


xj+n
.
.
.
xj
.
.
.







xj−m
de donde se ve que
φe es
un CVD monobloque.
Si se tiene además que
con
φ,
por la Proposición
6.2.
φ es una conjugación, siendo φe la composición de la conjugación ξ −1
e una conjugación de X
e a Y.
1.57, es φ
Imagen de un espacio shift por un código de ventana deslizante.
Hasta
ahora, hemos visto que un CVD φ actúa transformando puntos de un espacio shift X en
Z
puntos de algún full shift U . Cabe preguntarse cómo actúa globalmente φ, en el sentido de
Z
qué características tiene φ (X) como subconjunto de U . Mostraremos ahora que φ (X) es un
espacio shift sobre el alfabeto
U.
Lema 1.60. Sea φ un código de ventana deslizante monobloque desde un espacio shift X
hacia un full shift U Z . Entonces, φ (X) es un espacio shift sobre el alfabeto U .
A al alfabeto de X . Supongamos que φ está inducida por
Φ : B1 (X) → U . Hagamos L = {Φ (w) : w ∈ B (X)}, y veriquemos que φ (X) = XLc , con lo
que quedará probado que φ (X) es un espacio shift.
1. Sea y ∈ φ (X). Existe x ∈ X tal que y = φx. Sea u tal que u v y . Entonces existen
i, j ∈ Z tales que u = y[i,j] = (φx)[i,j] = Φ x[i,j] , es decir, u = Φ (w) con w ∈ B (X).
Luego, u ∈ L, por lo que u ∈
/ Lc . Como u era un bloque arbitrario de y , vemos que
y ∈ XLc . Entonces, φ (X) ⊆ XLc .
2. Sea y ∈ XLc . Entonces todo bloque de y está en L, de donde se deduce que para todo
n ≥ 0, existe w ∈ B (X) tal que y[−n,n] = Φ (w). Porlo tanto,
para todo n ≥ 0,
(n)
(n)
(n)
existe x
∈ X tal que x[−n,n] = w y φx(n) [−n,n] = Φ x[−n,n] = y[−n,n] . Usaremos
(n) la sucesión
x
para encontrar un punto x ∈ X tal que φx = y , con lo que
n∈N
quedará probado que y ∈ φ (X), y, con ello, que XLc ⊆ φ (X). Como A es nito, hay
Demostración. Llamemos
6. CÓDIGOS DE VENTANA DESLIZANTE
17
x(n) tienen igual símbolo a0 en la posición 0. Sea
S0 el conjunto de todos esos n. Como A3 es nito, hay un subconjunto innito S1 de S0
(n)
y símbolos a−1 y a1 tales que ∀n ∈ S1 , x[−1,1] = a−1 a0 a1 . Continuando de esta manera,
para cada k ≥ 1 conseguimos un subconjunto innito Sk de Sk−1 y símbolos a−k y
(n)
ak tales que ∀n ∈ Sk , x[−k,k] = a−k · · · a0 · · · ak . Denamos x = (ak )k∈Z . Ocurrirá que
una cantidad innita de
(n)
n
tales que
∀k ≥ 0, ∀n ∈ Sk , x[−k,k] = x[−k,k] .
Si u = x[i,j] para algunos enteros i y j , haciendo
(n)
x[−k,k] para cualquier n ∈ Sk , por lo que existe n ≥ 0
k = máx {|i| , |j|} será x[−k,k] =
(n)
tal que u v x
∈ X , es decir, u ∈ B (X); puesto que cualquier bloque de x está en el
lenguaje del espacio shift X , se tiene que, por Corolario 1.31, x ∈ X . Sea ahora k ≥ 0.
Tomemos n ∈ Sk tal que n ≥ k (tal elección es posible pues Sk es un conjunto innito).
Tenemos que
(n)
(φx)[−k,k] = Φ x[−k,k] = Φ x[−k,k] = y[−k,k]
Es decir,
∀k ≥ 0, (φx)[−k,k] = y[−k,k] .
Entonces,
φx = y .
Teorema 1.61. Sea φ un código de ventana deslizante desde un espacio shift X hacia un
full shift U Z . Entonces, φ (X) es un espacio shift sobre el alfabeto U .
Demostración. Por Proposición 1.59, existe un espacio shift
e y un CVD monobloque φe : X
e → Y tales que φ = φe ◦ ξ .
X →X
e . Entonces, φ (X) = φe (ξ (X)) = φe X
e , que, por Lema
ξ (X) = X
en consecuencia φ (X) es espacio shift sobre U .
6.3.
Inversa de una conjugación.
e,
X
Como
una conjugación
ξ
ξ :
es conjugación, es
1.60, es un espacio shift, y
Mostremos ahora que la inversa de una conjugación
es siempre una conjugación.
Sea φ una conjugación monobloque del espacio shift X al espacio shift Y .
es una conjugación de Y a X .
Lema 1.62.
Entonces, φ
−1
A el alfabeto para X y U el de Y . Supongamos que φ está inducida
Φ : B1 (X) → B1 (Y ). Hagamos ψ = φ−1 . Debemos mostrar que ψ es un CVD biyectivo de
Y a X . Por ser la inversa de una función biyectiva, ψ es también biyectiva, así que sólo resta
Demostración. Sean
por
vericar que es CVD, para lo que usaremos la Proposición 1.53.
φ un CVD, tenemos que φ ◦ σX = σY ◦ φ, por lo que ψ ◦ φ ◦ σX ◦ ψ = ψ ◦ σY ◦ φ ◦ ψ ,
σX ◦ ψ = ψ ◦ σY . Por lo tanto, ψ cumple la condición de conmutar con σ .
Supongamos que no existe un N ≥ 0 tal que para todo y ∈ Y , (ψy)0 dependa de
(n)
y[−N,N ] . Esto quiere decir que para cada n ≥ 0 existen y (n) e yb(n) en Y tales que y[−n,n] =
(n)
yb[−n,n] pero ψ y (n) 0 6= ψ yb(n) 0 . Llamemos x(n) = ψ y (n) y x
b(n) = ψ yb(n) . Tenemos
(n)
que, para cada n ≥ 0, tanto x
como x
b(n) están en X , y además x(n) 6=
b(n) pues
x
(n)
ambos dieren en la coordenada 0. Consideremos las dos sucesiones en X , x
y
n∈N
(n) 0
x
b
. Como A es nito, debe haber un símbolo a0 ∈ A, y un conjunto innito S0
n∈N
0
(n)
de enteros tal que ∀n ∈ S0 , x
= a0 ; nótese que ∀n ∈ S00 , x
b(n) 0 6= a0 . Puesto que
0
0
A es nito, debe
innito S0 de S0 tal que
haber un símbolo b0 6= a0 y un subconjunto
(n)
(n)
∀n ∈ S0 , x
b 0 = b0 . Observar que, entonces, ∀n ∈ S0 , x 0 = a0 6= b0 = x
b(n) 0 .
3
0
Como la cantidad de bloques en A es nita, debe haber un subconjunto innito S1 de
S0 y símbolos a−1 y a1 tales que ∀n ∈ S10 , x(n) [−1,1] = a−1 a0 a1 , y consecuentemente
0
debe haber un subconjunto innito S1 de S1 y símbolos b−1 y b1 tales que ∀n ∈ S1 ,
x
b(n) 0 = b−1 b0 b1 . Notar que ∀n ∈ S1 , x(n) [−1,1] = a−1 a0 a1 6= b−1 b0 b1= x
b(n) [−1,1] .
Continuando de esta manera, para cada k ≥ 1 encontramos un subconjunto innito Sk
1. Por ser
y entonces
2.
18
1. ESPACIOS SHIFT
a−k , ak , b−k y bk tales que ∀n ∈ Sk , x(n) [−k,k] = a−k · · · a0 · · · ak 6=
b−k · · · b0 · · · bk = x
b(n) [−k,k] . Tomemos x = (ak )k∈Z y x
b = (bk )k∈Z . Obsérvese que ∀k ≥
de
Sk−1
y símbolos
(n)
0, ∀n ∈ Sk , x[−k,k] = x[−k,k]
yx
b[−k,k]
(n)
= x
b[−k,k] .
Si u = x[i,j] para algunos enteros i y j ,
(n)
x[−k,k] para cualquier n ∈ Sk , por lo que existe
k = máx {|i| , |j|} será x[−k,k] =
n ≥ 0 tal que u v x(n) ∈ X , es decir, u ∈ B (X); puesto que cualquier bloque de x está
en el lenguaje del espacio shift X , se tiene que, por Corolario 1.31, x ∈ X . Igualmente,
x
b ∈ X . Además, x 6= x
b pues x0 = a0 6= b0 = x
b0 . Sea ahora k ≥ 0. Tomemos n ∈ Sk tal
que n ≥ k (tal elección es posible pues Sk es un conjunto innito). Tenemos que
(n)
(n)
(n)
(φx)[−k,k] = Φ x[−k,k] = Φ x[−k,k] = y[−k,k] = yb[−k,k]
(n)
= Φ x
b[−k,k] = Φ x
b[−k,k] = (φb
x)[−k,k]
haciendo
Es decir,
x 6= x
b.
∀k ≥ 0, (φx)[−k,k] = (φb
x)[−k,k] .
Contradicción a la inyectividad de
no hay un
N ≥0
tal que
ψy0
De allí, tendríamos que
φ. La contradicción
y[−N,N ] .
φx = φb
x
pese a ser
proviene de suponer que
es función de
Teorema 1.63. Sea φ una conjugación del espacio shift X al espacio shift Y . Entonces,
φ−1 es una conjugación de Y a X .
e , una conjugación ξ : X →
X
e . Entonces
e y una conjugación monobloque φe : X
e → Y tales que ξ es conjugación y φ = φ◦ξ
X
−1
−1
−1
−1
e
φ = ξ ◦ φ , y, por aplicación de Lema 1.62 y Proposición 1.57, φ resulta ser también
una conjugación.
Demostración. Por Proposición 1.59, existe un espacio shift
−1
Capítulo 2
SHIFTS DE TIPO FINITO
Los espacios shift que pueden ser descriptos por un conjunto
se llaman
shifts de tipo nito
nito
de bloques prohibidos
(abreviado STF). A pesar de ser los más simples, juegan un rol
fundamental en ciertas áreas de la Matemática, tales como sistemas dinámicos. Su estudio también ha proporcionado soluciones a problemas prácticos de importancia, tales como encontrar
esquemas de codicación ecientes para almacenar datos en discos de computadoras.
Una razón por la que los STF son tan útiles es que tienen una representación sencilla
usando un grafo nito dirigido. Preguntas sobre el shift pueden, a menudo, reformularse como
preguntas sobre la matriz de adyacencia del grafo. Resultados básicos del álgebra lineal nos
ayudan a analizar esta matriz y encontrar respuestas.
En este capítulo, primero presentamos los STF, y damos algunos ejemplos típicos. Luego
se explica las conexiones con los grafos dirigidos y las matrices, e introducimos la fundamental
operación de desdoblamiento de estados. Concluimos con una breve descripción sobre el almacenamiento magnético, indicando por qué la shift de paso limitado (1,3) es la característica
central de la mayoría de los métodos más usados para el almacenamiento de datos en discos
rígidos de computadoras.
1.
Restricciones de tipo nito
Primero denimos shifts de tipo nito, y luego explicamos el hecho de que tienen una
propiedad (markoviana) de memoria nita.
Definición 2.1. Un
shift de tipo nito (STF) es un espacio shift que puede describirse
por un conjunto nito de bloques prohibidos, es decir, un espacio shift
algún conjunto nito
F
de bloques tal que
X
para el cual existe
X = XF .
Ya hemos tratado antes con varios STF.
AZ es un
A = XF .
Ejemplo 2.2. El full shift
está prohibido, de modo que
STF: podemos tomar simplemente
Ejemplo 2.3. El shift de la razón de oro
F = {11},
obteniendo
F =∅
pues nada
Z
X
(ejemplo 1.10) es un STF, pues podemos tomar
X = XF .
X el conjunto de todos los puntos de {e, f, g}Z tales que e puede ser
seguido sólo por e o por f , f puede ser seguido sólo por g , y g puede ser seguido sólo por e o por
f . Entonces X es el espacio shift que resulta de tomar F = {eg, f e, f f, gg}, y, en consecuencia,
es un STF.
Ejemplo 2.4. Sea
Notemos que un STF
X
podría también describirse mediante un conjunto innito de bloques
prohibidos. De hecho, la Proposición 1.29 muestra que ésto puede ocurrir siempre que
X
no
X es innito. La denición de STF sólo
algún F adecuado.
Z
Supongamos que X ⊆ A es STF, y que X = XF para una colección nita F de bloques.
Sea N la longitud del bloque más largo en F . Si formamos la colección FN de todos los bloques
de longitud N sobre A que contienen algún subbloque en F , entonces tendremos que XFN = XF
(prop. 1.21) y los bloques de FN tienen todos la misma longitud N . Por ejemplo, si A = {0, 1}
y F = {11, 000}, entonces F3 = {110, 111, 011, 000}. A veces, será conveniente asumir que
sea el full shift, pues el complemento del lenguaje de
pide que exista
19
20
2. SHIFTS DE TIPO FINITO
este procedimiento ya ha sido llevado a cabo, y que todos los bloques prohibidos tienen igual
longitud.
Si todos los bloques en
F
tienen longitud
N,
entonces
x ∈ AZ
está en
XF exactamente
cuando x[i,i+N −1] ∈
/ F para todo i ∈ Z, o, equivalentemente, cuando x[i,i+N −1] ∈ BN (XF ) para
todo i ∈ Z (Supongamos que ∀i ∈ Z, x[i,i+N −1] ∈
/ F . Sea u un bloque de x. Si |u| 6= N, u ∈
/F
pues F tiene sólo bloques de tamaño N , y si |u| = N, u ∈
/ F por la hipótesis; entonces ningún
bloque de x está en F , por lo que x ∈ XF y ∀i ∈ Z, xi,i+N −1] ∈ B (XF ). Recíprocamente, si un
bloque de tamaño N está en BN (XF ), no puede estar en F ). Luego, para determinar si x está
o no en XF , sólo necesitamos escanear las coordenadas de x con una ventana de ancho N , y
vericar que cada bloque visto a través de esta ventana está en la colección permitida BN (X).
Esta observación es, a menudo, útil cuando se debe decidir si un dado espacio shift es o no de
tipo nito.
Ejemplo 2.5. El shift par
X
(ejemplo 1.13) no es un STF, pues, si lo fuera, existiría
N ≥1
y una colección de N -bloques tal que X = XF . En dicha colección, no puede haber bloques de la
0k , ni 0k 10l para ningún k, l ≥ 0, ya que 0∞ 10∞ ∈ X . Pero entonces 0∞ 102N +1 10∞ ∈ XF
forma
N -bloques
pues ninguno de sus
está en
F.
Sin embargo, ese punto no pertenece a
X
por la
denición del shift par.
Hay también una noción de memoria para un STF:
Definición 2.6. Un shift de tipo nito
es de memoria M
una colección de bloques prohibidos que tienen todos longitud
si puede describirse mediante
M + 1.
F
M.
Para motivar esta denición, supongamos que todos los bloques de
Sea
u = a1 a2 . . . an
un bloque con longitud
u
máquina lee los símbolos de
detecte si
u
n
mucho mayor que
tienen longitud
uno por vez, de izquierda a derecha. Para que esta máquina
contiene o no un bloque prohibido, sólo debe recordar los previos
leídos, es decir, necesita sólo
Observación 2.7. Sea
bloques de longitud
M
X
M +1.
Supongamos que una
M
símbolos
espacios de memoria.
un STF de memoria
M,
descripto a través de un conjunto
F
de
M + 1.
u un bloque de A∗ que no contiene ningún subbloque en F . Esto no garantiza que
u ∈ B(X). Por ejemplo: F = {10, 11}, u = 001. u no contiene subbloques en F , pero
u∈
/ B(X) pues X = {0∞ }.
0
M +1
Sea F = A
− B(XF ). Entonces, F ⊆ F 0 , y XF 0 = XF . Para ver la primera aserción,
si f ∈ F, |f | = M + 1 y f ∈
/ B(XF ), luego f ∈ F 0 . Para la segunda, ya que F ⊆ F 0 ,
se tiene que XF 0 ⊆ XF . Si x ∈ XF y u es un bloque de longitud M + 1 que ocurre en
x, u ∈ B(XF ), por lo que u ∈
/ F 0 . Luego x no contiene bloques en F 0 , mostrando que
x ∈ XF 0 y, consecuentemente, XF ⊆ XF 0 .
1. Sea
2.
Notar que un STF de memoria
M
es también de memoria
K
para todo
K ≥ M.
Un STF
de memoria 0 es simplemente un full shift, pues prohibir bloques de tamaño 1 es meramente
quitar letras del alfabeto. Se puede pensar en un STF de memoria 1 como en uno dado por
una colección de símbolos junto con una descripción de cuáles símbolos pueden seguir a cuáles,
como en el ejemplo 2.4. Posteriormente veremos muchos ejemplos de tales STF de memoria 1.
Proposición 2.8.
memoria M .
Si X es un shift de tipo nito, entonces hay un M ≥ 0 tal que X es de
X es de tipo nito, X = XF para alguna colección nita de
M = 0. Si F =
6 ∅, sea M igual a la longitud del bloque más largo en
F , menos 1. Nuestra discusión anterior muestra que X es descripto por FM +1 (el conjunto de
todas las palabras de largo M + 1 que contienen algún subbloque en F ), por lo que X es de
memoria M .
Demostración. Ya que
bloques
F.
Si
F = ∅,
sea
1. RESTRICCIONES DE TIPO FINITO
21
El lenguaje de un STF está caracterizado por la propiedad de que si dos palabras se solapan
lo sufuciente, pueden ser unidas a lo largo del solape para formar otra palabra en el lenguaje.
Sea X un espacio shift sobre el alfabeto A, y M ≥ 0. X es STF de memoria
M si, y sólo si, ∀u, v, w ∈ A∗ , uv ∈ B(X) ∧ vw ∈ B(X) ∧ |v| ≥ M ⇒ uvw ∈ B(X)
Teorema 2.9.
F una colección de bloques de
M + 1 tal que X = XF . Sean u, v y w en A∗ tales que uv y vw estén en B(X) con
|v| ≥ M . Existen x e y en X tales que x[i,i+|uv|−1] = uv , y[j,j+|vw|−1] = vw. Consideremos el
punto z = x(−∞,i+|uv|−1] y[j+|v|,∞) = · · · xi−2 xi−1 uvwyj+|vw| yj+|vw|+1 · · · . No puede contener un
bloque en F pues, al ser |v| ≥ M , una ventana de ancho M + 1 no puede ver simultáneamente
símbolos de u, v y w , por lo que todo bloque que esta ventana vea corresponde a un bloque en
x o en y . Entonces z ∈ X y uvw ∈ B(X).
M +1
Para la suciencia, denamos F = A
− BM +1 (X), y veamos que X = XF . Si x ∈ X e
i ∈ Z, x[i,i+M ] ∈ BM +1 (X), es decir, ∀i, x[i,i+M ] ∈
/ F . Luego x ∈ XF , y se deduce que X ⊆ XF .
Ahora, sea x ∈ XF . Mostremos, por inducción sobre n, que ∀n ≥ M, x[0,n] ∈ B(X). Para
n = M es cierto pues x[0,M ] ∈
/ F , por lo que x[0,M ] ∈ BM +1 (X), y, de allí, x[0,M ] ∈ B(X);
esto muestra también que ∀n ∈ {0, . . . , M − 1}, x[0,n] ∈ B(X). Supongamos que x[0,n] ∈ B(X).
Hagamos u = x[0,n−M ] , v = x[n−M +1,n] y w = xn+1 . Observemos que uv = x[0,n] ∈ B(X),
vw = x[n−M +1,n+1] ∈
/ F y |vw| = M + 1, por lo que vw ∈ BM +1 (X) ⊆ B(X). Además, |v| = M .
Entonces uvw ∈ B(X), es decir, x[0,n+1] ∈ B(X). Un razonamiento análogo en la otra dirección
muestra que ∀m, n ∈ Z, x[m,n] ∈ B(X), es decir, cualquier bloque en x está en B(X), y, siendo
X espacio shift, x ∈ X , por lo que XF ⊆ X .
Demostración. Para la necesidad de la condición, sea
tamaño
Ejemplo 2.10. El teorema anterior da otra forma de ver que el shift par X no es de tipo
2M +1
nito. Pues si lo fuera, sería de memoria M para algún M ≥ 1. Ya que 10
∈ B(X) y que
2M +1
2M +1
0
1 ∈ B(X), deberíamos tener que 10
1 ∈ B(X), lo que violaría la denición de shift
par.
φ con memoria 0 y anticipación 1 que tiene por dominio el shift de la
X , inducido por Φ tal que Φ(00) = 1, Φ(01) = 0 = Φ(10). Ocurre que Φ(u) = 10k 1
2n
si, y sólo si, existe n ≥ 0 tal que u = 0(01) 00, por lo que k = 2n. Luego, φ(X) ⊆ Y , donde
Y es el shift par. Además, si y ∈ Y , es posible construir x ∈ X tal que y = φ(x) (teniendo
2k
k
en cuenta que si y[i,i+2k+1] = 10 1, entonces debe ser x[i,i+2k+2] = 0(01) 00). Entonces, φ es
Consideremos el CVD
razón de oro
un código factor del shift de la razón de oro en el shift par, siendo el primero de tipo nito
y el segundo no. Es fácil construir también códigos de ventana deslizante sobreyectivos desde
espacios shift que no son de tipo nito hacia otros que sí lo son (por ejemplo, desde el shift par
∞
hacia {0 } por el CVD de memoria 0 y anticipación 0 inducido por Φ(0) = Φ(1) = 0). Sin
embargo, las conjugaciones preservan el carácter de tipo nito.
Teorema 2.11. Sea X un shift de tipo nito, e Y un espacio shift conjugado a X . Entonces
Y es un shift de tipo nito.
A y U los alfabetos para X e Y respectivamente. Supongamos que
M . Sea φ : X → Y una conjugación inducida por Φ, y ψ : Y → X
su inversa, inducida por Ψ. Podemos suponer que φ y ψ tienen ambas la misma memoria y
anticipación l . Sabemos que ψ ◦φ es código de ventana deslizante con memoria y anticipación 2l ,
y que una función inductora es Ψ ◦ Φ : B4l+1 (X) → B1 (X). Dicha composición de inductoras,
aplicada a un bloque a−2l · · · a0 · · · a2l devuelve el carácter central a0 ; como consecuencia de
ésto, si s, t y w son bloques con |s| = |t| = 2l , Φ ◦ Ψ(swt) = w . Mostraremos que Y es
∗
un STF de memoria M + 4l , usando el teorema anterior. Sean u, v, w ∈ U tales que uv ∈
B(Y ), vw ∈ B(Y ), |v| ≥ M + 4l, digamos v = v1 · · · vk con k ≥ M + 4l. Existen s, t ∈ B(Y ) :
suv ∈ B(Y ), vwt ∈ B(Y ), |s| = |t| = 2l. Sea u0 = Ψ(suv1 · · · v2l ), w0 = Ψ(vk−2l+1 · · · vk wt).
0
0
Entonces Ψ(suv) = u Ψ(v) ∈ B(X), Ψ(vwt) = Ψ(v)w ∈ B(X). Como |v| ≥ M + 4, será
0
0
|Ψ(v)| = |v| − 2l ≥ M . Luego Ψ(suvwt) = u Ψ(v)w ∈ B(X). Por ello, Φ (Ψ(suvwt)) ∈ B(Y ),
es decir, uvw ∈ B(Y ).
Demostración. Sean
X
es un STF de memoria
22
2. SHIFTS DE TIPO FINITO
2.
Grafos y sus shifts
Un método fundamental para construir shifts de tipo nito se basa en un grafo nito dirigido, considerando la colección de todos los caminos bi-innitos (es decir, sucesiones de aristas
consecutivas)
en el grafo. En un sentido que precisaremos más adelante, cualquier shift de tipo
nito fuede ser recodicado en un shift de aristas. En esta sección, introducimos los shifts de
aristas, y usamos la matriz de adyacencia del grafo para responder preguntas sobre su shift.
Realmente, la razón por la que un shift de aristas puede ser entendido mucho mejor que un
shift general es que podemos aplicar la potente maquinaria del álgebra lineal a su matriz de
adyacencia.
Comenzamos con las deniciones básicas concernientes a la teoría de grafos.
Definición 2.12. Un grafo nito dirigido G es una cuaterna (V, Σ, i, t) donde:
V es un conjunto nito cuyos elementos llamaremos vértices, nodos o estados.
Σ es un conjunto nito cuyos elementos llamaremos aristas o arcos.
i es una función de Σ en V . Para una arista a, i(a) se llama vértice inicial de a. También
decimos que la arista a arranca en el nodo i(a).
t es una función de Σ en V . Para una arista a, t(a) se llama vértice terminal de a.
También decimos que la arista a termina en el nodo t(a).
Una manera cómoda de visualizar un grafo es mediante un dibujo donde los nodos se
representan por círculos (con el nombre del nodo en su interior) y cada arista
i(a) hasta t(a), con un rótulo que indica su
un grafo con V = {I, J} y ocho aristas, teniéndose que, por
i(f ) = t(f ) = i(g) = t(g) = J , etc.
una echa desde
a
mediante
nombre. La gura 1 muestra
ejemplo,
i(e) = I , t(e) = J ,
Figura 1.
Muchas veces, cuando hagamos referencia a distintos grafos en forma simultánea, emplearemos la notación
V (G), Σ(G), iG
G en
inicial y terminal de un grafo
y
tG
para indicar conjuntos de nodos, aristas y funciones
particular.
G = (V, Σ, i, t) un grafo.
Para nodos I, J de G, denotaremos por ΣI al conjunto de todas las aristas de G que
J
arrancan en I , es decir, ΣI = {a ∈ Σ : i(a) = I}. Similarmente, Σ denotará al conjunto
J
de todas las aristas de G que terminan en J , es decir, Σ
= {a ∈ Σ : t(a) = J}.
J
Reservamos el símbolo ΣI para el conjunto de todas las aristas de G que empiezan en
I y terminan en J , es decir ΣJI = {a ∈ Σ : i(a) = I ∧ t(a) = J}. Llamamos grado de
salida
J de I a |ΣI |, la cantidad de aristas que arrancan en I , y grado de entrada de J
a Σ , la cantidad de aristas que llegan a J . La matriz de adyacencia AG del grafo
G se dene como la matriz
J cuadrada de |V | × |V | indizada por V , cuyo elemento en la
posición IJ es AIJ = ΣI . Es decir, AIJ es la cantidad de aristas de I a J en G.
Un lazo, bucle o rulo en G es una arista a tal que i(a) = t(a).
Un camino π en el grafo G es una sucesión nita de aristas π = e1 e2 · · · ek tal que
∀i ∈ {1, . . . , k − 1}, t(ei ) = i(ei+1 ). Denimos el vértice inicial del camino π como
Definición 2.13. Sea
2. GRAFOS Y SUS SHIFTS
23
i(π) = i(e1 ), el vértice inicial de la primera arista del camino, y el vértice nal de
π como t(π) = t(ek ), el vértice nal de la última arista del camino. La longitud del
camino π es la cantidad de aristas que contiene, denotada por |π|. Es decir, |π| = k . La
sucesión vacía cumple también con la denición de camino, con longitud 0 y vértices
G. Un ciclo en G es un
un ciclo π = e1 · · · ek tal
inicial y nal idénticos, pudiendo ser cualquiera de los nodos de
camino
π
en
G
que los estados
tal que i(π) = t(π). Un ciclo simple
i(e1 ), . . . , i(ek ) son distintos.
G
en
Desde el punto de vista de la dinámica simbólica, interesa la
es
conectividad
de las aristas de
un grafo, no los nombres de las mismas ni de los vértices del grafo. Por ello, grafos diferentes
pueden en realidad representar un mismo objeto desde ese punto de vista.
G y H , un homomorsmo de G a H es un par de
funciones (∂, Φ) con ∂ : V (G) → V (H) y Φ : Σ(G) → Σ(H) tales que ∀e ∈ Σ(G), iH (Φ(e)) =
∂ (iG (e)) y tH (Φ(e)) = ∂ (tG (e)). En caso de ser ambas funciones inyectivas, el homomorsmo
se llama inmersión de G en H . Si ambas funciones son biyectivas, se llama isomorsmo
entre G y H . Dos grafos se dicen isomorfos si hay un isomorsmo entre ellos, y en ese caso
escribimos G ∼
= H . Un isomorsmo es, a los nes prácticos, simplemente un cambio de nombre
Definición 2.14. Dados dos grafos
de nodos y aristas. La relación de ser isomorfos es una relación de equivalencia entre grafos.
Definición 2.15. Un
Σ(G),
y las funciones
iH
subgrafo H
tH
y
del grafo
G
son, respectivamente, las restricciones
En términos de matrices de adyacencia, si
H
V (H) ⊆ V (G), Σ(H) ⊆
de iG y tG a Σ(H).
es un grafo tal que
es subgrafo de
G se tiene que (AH )I,J ≤ (AG )I,J
I, J ∈ V (H).
para toda pareja de vértices
En cuanto a los isomorsmos, se tiene que dos grafos
y
H
son isomorfos si, y sólo si,
AG = P AH P . Recordemos que una matriz de
0 o 1 que tiene exactamente un 1 en cada
la, y exactamente un 1 en cada columna. Es fácil demostrar si P es matriz de permutación,
P también lo es, y P −1 = P T . Si (∂, Φ) es un isomorsmo entre G = (V, Σ, iG , tG ) y H =
(W, Σ0 , iH , tH ), se dene P con las indizadas según V (G) y columnas indizadas según V (H)
mediante
1
si ∂(I) = J
PI,J =
0
si ∂(I) 6= J
Resulta directo chequear que P es matriz de permutación. Además, teniendo en cuenta que e ∈
ΣJI ⇐⇒ Φ(e) ∈ Σ∂J
∂I , a través de un cálculo rutinario se puede ver que (AG P )I,J = (P AH )I,J
−1
para todos I, J , de modo que AG = P AH P
.
Recíprocamente, si G y H son grafos tales que admiten una matriz de permutación P tal
−1
que AG = P AH P
, considerando a las las de P en el mismo orden que las de AG y a las
columnas de P en el mismo orden que las de AH , se dene ∂I = J ⇐⇒ PI,J = 1. De la
−1
condición AG = P AH P
, se deduce que (AG )I,J = (AH )∂I,∂J , con lo que los grafos G y H son
existe una matriz de permutación
P
G
−1
tal que
permutación es una matriz cuadrada con entradas
isomorfos.
2.1.
Shifts de aristas.
Definición 2.16. Sea
denotado por
XG
o
XA ,
G
A continuación deniremos el espacio shift generado por un grafo.
un grafo con matriz de adyacencia
A.
El
shift de aristas
es el conjunto de todos los caminos bi-innitos de
G.
de
G,
Es decir:
XG = {x = (xk )k∈Z : ∀k ∈ Z, xk ∈ Σ ∧ t(xk ) = i(xk+1 )}
Como puede verse,
conjunto
Σ
XG
ΣZ ,
que tiene como alfabeto el
de aristas del grafo.
Ejemplo 2.17. Sean
Entonces,
shift
es un subconjunto del full shift
XG1
X{eg,f e,f f,gg}
G1
y
G2
los grafos mostrados en la gura 2.
es el full shift sobre el alfabeto
del ejemplo 2.4.
{0, 1, . . . , r−1}, mientras que XG2
es el espacio
24
2. SHIFTS DE TIPO FINITO
G1
G2
Figura 2.
Justiquemos que el uso del término shift para los shifts de aristas es adecuado.
Si G = (V, Σ, i, t) es un grafo, entonces XG es un espacio shift. Más
aún, es un shift de tipo nito de memoria 1.
Proposición 2.18.
Demostración. Consideremos la colección nita
F = {ef ∈ Σ2 : t(e) 6= i(f )}
XG = XF : Sea x ∈ XG , y k ∈ Z. Debe ser t(xk ) = i(xk+1 ) por la denición de
xk xk+1 ∈
/ F . Entonces, ningún bloque de x está en F , y x ∈ XF . Recíprocamente,
sea x ∈ XF , y k ∈ Z. xk xk+1 ∈
/ F , por lo que t(xk ) = i(xk+1 ). Como esto ocurre para todo
k ∈ Z, se ve que x ∈ XG .
Como F tiene todos sus bloques de tamaño 2, XG es un shift de tipo nito de memoria
1.
y mostremos que
XG .
Luego
Es sencillo demostrar que si
(∂, Φ)
es un isomorsmo entre
G
G
y
H son isomorfos, entonces XG y XH son conjugados: si
H , Φ puede verse como la función inductora (biyectiva) de
y
un código de ventana deslizante de memoria y anticipación 0, que, en vistas de la biyectividad
de
Φ,
resultará ser una conjugación entre
También es fácil ver que si
H
XG
y
Observemos el grafo de la gura 3. En él,
bi-innito, pues desde
I = t(a)
XH .
G, XH ⊆ XG .
la arista a no
es subgrafo de
forma parte de ningún camino
no arranca ninguna arista. Podemos pensar en el nodo
en un nodo muerto. Una situación análoga ocurre con el nodo
arista, de modo que las aristas
b
y
c
que arrancan en
J
J,
I
como
al cual no llega ninguna
tampoco pueden formar parte de un
camino bi-innito.
Figura 3.
Definición 2.19. Un nodo de un grafo se llama
sale, ninguna arista.
nodo muerto si a él no llega, o de él no
2. GRAFOS Y SUS SHIFTS
Los nodos muertos de un grafo
G
25
pueden eliminarse, conjuntamente con todas las aristas
que a él llegan o salen, sin alterar el shift de aristas asociado. En el subgrafo que resulta de esta
eliminación, pueden a su vez haber quedado nodos muertos. Sin embargo, repitiendo el proceso
de eliminación sobre el subgrafo la cantidad de veces que sea necesaria hasta que no queden
nodos muertos, se obtiene como resultado un subgrafo del grafo original que contiene todas las
aristas que forman parte de algún camino bi-innito en
G.
Ejemplo 2.20. La gura 4 muestra el resultado del proceso de eliminación de nodos muertos
del grafo de la gura 3.
Figura 4.
Definición 2.21. Un grafo se llama
esencial si no contiene nodos muertos.
u1 · · · uk es un bloque de largo k que está en el lenguaje de XG , entonces
G (si u v x ∈ XG , existe j ∈ Z tal que x[j+1,j+k] = u1 · · · uk , de donde, para
cualquier n ∈ {1, . . . , k − 1}, es t(un ) = t(xj+n ) = i(xj+n+1 ) = i(un+1 ), por lo que u1 · · · uk es
camino en G). Sin embargo, no es cierto que cualquier camino en un grafo G sea un bloque
del lenguaje de XG . Por ejemplo, cualquier arista vinculada a un nodo muerto en un grafo no
esencial es un camino de longitud 1 en G, pero no puede formar parte de un camino bi-innito
en G, por lo que no pertenece a B1 (XG ).
Es fácil ver que si
u
es un camino en
Sea G un grafo esencial. Entonces, el conjunto de los caminos (nitos) en G
es un precisamente el conjunto de bloques en el lenguaje de XG .
Lema 2.22.
Demostración. Por nuestros comentarios anteriores, ya sabemos que los bloques en el
lenguaje de
XG
son caminos en
G.
Probemos ahora que, bajo la hipótesis de que
G
es esencial,
G son bloques en el lenguaje de XG . Sea π un camino en G. Por ser G esencial,
a1 que llega a i(π) y una arista b1 saliendo de t(π). Inductivamente, para cada
k ≥ 2, hay una arista ak llegando a i(ak−1 ) y una arista bk−1 saliendo de t(bk ). Entonces,
· · · a2 a1 πb1 b2 · · · es camino bi-innito en G, y π ocurre en él. Luego, π está en B (XG ).
Proposición 2.23. Si G = V (G), Σ(G), iG , tG es un grafo, existe un único subgrafo H
de G tal que H esencial y XG = XH .
los caminos de
hay una arista
Σ(H) = B1 (XG ), es decir, el conjunto de todas las aristas de G que
intervienen en algún camino bi-innito en G. Hagamos V (H) = {i(a) : a ∈ Σ(H)}, el conjunto
de nodos visitados por las aristas de H , y sean iH y tH las respectivas restricciones de iG y tG
a Σ(H). Entonces H es subgrafo de G, y, en consecuencia, cualquier camino bi-innito en H es
también camino bi-innito en G, así que XH ⊆ XG .
Veamos que también XG ⊆ XH : si x ∈ XG , se tiene que para todo k ∈ Z, xk y xk+1 están
ambos en B1 (XG ), y además tG (xk ) = iG (xk+1 ). Luego, para todo k ∈ Z, es xk ∈ Σ(H) y
además tH (xk ) = tG (xk ) = iG (xk+1 ) = iH (xk+1 ), de donde x ∈ XH .
Demostración. Sea
26
2. SHIFTS DE TIPO FINITO
H es esencial, pues si I ∈ V (H), debe haber una arista a ∈ Σ(H) tal que I = iG (a).
Como a ∈ B1 (XG ), existe x ∈ XG tal que xk = a para algún k ∈ Z. Entonces tH (xk−1 ) =
tG (xk−1 ) = iG (xk ) = iH (xk ) = I , mostrando que la arista xk−1 llega a I y la arista xk sale desde
I.
0
Para ver que H es único, consideremos cualquier subgrafo esencial H de G tal que XH 0 =
XG . Si hubiera una arista en H que no esté en H 0 o una en H 0 que no esté en H , sería
B1 (XH ) 6= B1 (XH 0 ) (lema 2.22, considerando que H y H 0 son esenciales), por lo que B (XG ) =
B (XH ) 6= B (XH 0 ), es decir, sería XG 6= XH 0 , y tendríamos una contradicción. Luego, H y
H 0 tienen las mismas aristas, y siendo ambos esenciales, tienen también los mismos nodos, de
donde concluimos que ambos son iguales.
Además,
Ya que el subgrafo
H
de la proposición anterior contiene la única parte de
G
usada para la
dinámica simbólica, usualmente restringiremos nuestra atención a los grafos esenciales.
La matriz de adyacencia de un grafo puede usarse para obtener información sobre la cantidad
de caminos de longitud
n ≥ 0
en el grafo, y, consecuentemente, si el grafo es esencial, para
obtener la cantidad de bloques de tamaño
Proposición 2.24.
1.
2.
n
en
B (XG ),
esto es,
|Bn (XG )|.
Sea G un grafo con matriz de adyacencia A, y sea n ≥ 0. Entonces:
Para vértices I, J cualesquiera en G, el número de caminos de longitud n desde I hasta
J en G es (An )IJ , es decir, la posición IJ de la matriz An .
El número de ciclos de longitud n en G es tr(An ), la traza de An , y es igual al número
de puntos periódicos de XG de período n.
Demostración.
I, J ∈ V (G). Si I = J , (A0 )IJ = 1, y el único
camino de I a J de longitud 0 es el camino vacío; si I =
6 J , (A0 )IJ = 0 y no hay camino
en G de I a J de longitud 0. Luego, la proposición es verdadera para n = 0. Supongamos
que la proposición es cierta para n. Un camino de I a J de longitud n + 1 consiste en
un camino de longitud n de I a K seguido de una arista desde K hasta J , donde K es
algún nodo. La cantidad de caminos de longitud n + 1 de I a J cuyo penúltimo vértice
visitado es K es entonces la cantidad de caminos de longitud n de I a K multiplicada
por la cantidad de aristas de K a J , que por hipótesis inductiva y denición de matriz
n
de adyacencia es (A )IK AKJ . Para obtener todos los caminos desde I a J en G de
longitud n + 1 hacemos variar a K en el conjunto de nodos de G y sumamos. Es decir,
la cantidad de caminos de longitud n + 1 de I a J es
X
(An )IK AKJ
1. Probamos por inducción sobre
n.
Sean
K∈V (G)
que es precisamente la denición de
(An+1 )IJ ,
con lo que queda demostrada la primera
parte.
2. La primera parte del enunciado se sigue del ítem anterior y de la denición de ciclo.
∞
Para la segunda parte, notar que que si π es un ciclo de longitud n en G, entonces π
es
un punto periódico en
de período
n,
XG de período n, mientras que si x ∈ XG es un punto periódico
x[0,n−1] debe ser un ciclo de longitud n en G. Esto establece una
entre los ciclos en G de longitud n y los puntos en XG de período
entonces
correspondencia 1 a 1
n.
Recordemos que un espacio shift
u, w ∈ B(X),
existe
v ∈ B(X)
X se dice irreducible si
uvw ∈ B(X). Es fácil
tal que
lugar a shifts de aristas irreducibles.
para cualquier pareja de bloques
caracterizar a los grafos que dan
3. REPRESENTACIÓN DE SHIFTS DE TIPO FINITO POR MEDIO DE GRAFOS
Definición 2.25. Un grafo
en
G,
existe un camino
reducible.
π
en
G
G
se dice
tal que
irreducible si para cualquier pareja I, J
i(π) = I
y
t(π) = J .
Si
G
27
de vértices
no es irreducible, se llama
La gura 5 muestra un ejemplo de grafo reducible, ya que no hay en él un camino desde
hasta
I
J.
Figura 5.
Proposición 2.26.
shift irreducible.
Sea G un grafo esencial. G es irreducible si, y sólo si, XG es un espacio
G irreducible. Sean u, w ∈ B (XG ). Entonces u y w
G (lema 2.22). Por ser G irreducible, hay un camino v en G desde t(u) hasta
i(w), por lo que uvw es camino en G y, nuevamente por lema 2.22, uvw ∈ B (XG ).
Supongamos ahora que XG es irreducible. Sean I, J vértices en G, y sean a y b aristas en
G tales que t(a) = I , i(b) = J . Tales aristas existen pues G es esencial. Por lema 2.22, a y b
están en B (XG ). Por irreducibilidad de XG , existe v ∈ B (XG ) tal que avb ∈ B (XG ). Tal v debe
ser entonces camino en G desde t(a) hasta i(b), es decir, camino desde I hasta J . Luego, G es
irreducible.
Demostración. Primero supongamos
son caminos en
3.
Representación de shifts de tipo nito por medio de grafos
Hemos presentado, en la sección anterior, los shifts de aristas, que resultaron ser STF de
memoria 1. Por lo tanto, un STF que no tenga memoria 1 no puede ser un shift de aristas. Más
aún, el siguiente ejemplo muestra que hay STF de memoria 1 que no son shifts de aristas.
G tal que XG sea el shift de la razón de oro. Para
XG = X{11} . Por prop. 2.23, podríamos suponer que G es
esencial. Entonces debería contener exactamente dos aristas llamadas 0 y 1. La arista 1 debería
∞
iniciar en un nodo y terminar en otro distinto (de lo contrario, 1
estaría en XG , lo que no
puede ser) y entonces la arista 0 debería ir desde t(1) hasta i(1) (pues en otro caso G no sería
esencial). Pero entonces XG 6= X{11} , contradicción que proviene de suponer la existencia de tal
G.
Ejemplo 2.27. No existe un grafo
verlo, supongamos que
G
cumple que
A pesar de que los shifts de aristas aparecen como particulares shifts de tipo nito, mostraremos ahora que todo shift de tipo nito puede recodicarse a un shift de aristas.
Si X es un shift de tipo nito de memoria M , entonces X [M +1] es un shift
de aristas. En consecuencia, todo shift de tipo nito es conjugado a un shift de aristas.
Teorema 2.28.
M . Podemos suponer M ≥ 1. Sea F tal que
X = XF , siendo todos los bloques en F de largo M + 1. Hagamos V = BM (X) y Σ = BM +1 (X).
Para a = a1 a2 · · · aM aM +1 ∈ Σ, denamos i(a) = a1 · · · aM y t(a) = a2 · · · aM aM +1 . Puede
verse que i(a) y t(a) están en V , ya que son subbloques de a1 · · · aM aM +1 ∈ B(X). Denamos
Demostración. Sea
X
un STF de memoria
28
2. SHIFTS DE TIPO FINITO
G = (V, Σ, i, t). Notar que, dados vértices I = a1 · · · aM y J = b1 · · · bM , hay una única arista
de I a J si, y sólo si, a2 · · · aM = b1 · · · bM −1 y a1 · · · aM bM ∈ BM +1 (X). Es decir, hay arista de
I a J si, y sólo si, I y J solapan progresivamente y el bloque obtenido de agregar a I el último
símbolo de J está en BM +1 (X).
[M +1]
Veriquemos ahora que XG = X
.
Sea x ∈ XG . Se tiene que, para todo k ∈ Z, xk ∈ Σ (es decir, xk es un bloque de tamaño M +1
en el lenguaje de X ), y t (xk ) = i (xk+1 ). Pero si xk = a1 · · · aM +1 y xk+1 = b1 · · · bM +1 , es t (xk ) =
a2 · · · aM +1 e i (xk+1 ) = b1 · · · bM . Se tiene entonces que xk y xk+1 solapan progresivamente.
−1
Denamos entonces x = βM +1 (x). Para cualquier k ∈ Z, x[k,k+M ] = xk ∈ BM +1 (X), por lo que
x no tiene bloques en F , es decir, x ∈ X , y entonces x = βM +1 (x) pertenece a X [M +1] .
[M +1]
. Sea x tal que βM +1 (x) = x. Se tiene que, para cualquier k ∈ Z,
Ahora sea x ∈ X
es xk = xk · · · xk+M y xk+1 = xk+1 · · · xk+M +1 , por lo que xk ∈ BM +1 (X) = Σ y t(xk ) =
xk+1 · · · xk+M = i(xk+1 ) de acuerdo a la denición de G. Entonces, x ∈ XG .
[M +1]
La última armación del teorema se deduce del hecho de que X ∼ X
.
X = X{11} , X es STF de memoria 1. Tenemos que B1 (X) = {0, 1} = V
y que B2 (X) = {00, 01, 10} = Σ. Denimos i(00) = i(01) = 0, i(10) = 1, t(00) = t(10) = 0 y
t(01) = 1. El grafo (V, Σ, i, t) mostrado en la gura 6 es precisamente X [2] .
Ejemplo 2.29. Si
Figura 6.
Dado un shift de aristas
XG ,
nos preguntamos si las presentaciones con solape de
XG
son
también shifts de aristas, y, en caso de serlo, si podemos construir los correspondientes grafos
directamente a partir de
G.
Definición 2.30. Sea
G
un grafo, y sea
N
un entero positivo. Se dene el grafo
G[N ]
del
siguiente modo:
G[1] = G.
[N ]
para N ≥ 2, los vértices de G
son los caminos en G de longitud N − 1, y las aristas
[N ]
de G
son los caminos en G de longitud N . Si a = a1 · · · aN es una arista, denimos
iG[N ] (a) = a1 · · · aN −1 y tG[N ] (a) = a2 · · · aN . Obsérvese que G[N ] es un grafo bien denido.
Ejemplo 2.31. Sea G = (V, Σ, i, t) con V = {I, J}, Σ = {e, f, g}, i(e = i(f ) = I ,
i(g) = J , t(e) = t(g) = I , t(f ) = J . G[1] es el propio G. G[2] tiene vértices {e, f, g} y aristas
{ee, ef, f g, ge, gf }. G[3] tiene vértices {ee, ef, f g, ge, gf } y aristas {eee, eef, ef g, f ge, f gf, gee,
gef, gf g}. Todos ellos se muestran en la gura 7.
Proposición 2.32.
XG[N ] .
Si G es un grafo esencial y N es un entero positivo, entonces (XG )[N ] =
Demostración. Los símbolos para
(XG )[N ]
son los
N -bloques
de
XG ,
que son los caminos
N en G (lema 2.22). Pero éstos son precisamente los símbolos para XG[N ] . Una sucesión
bi-innita de estos símbolos está en ambos espacios shift precisamente cuando dos símbolos
de largo
consecutivos solapan progresivamente, de donde se concluye el resultado.
3. REPRESENTACIÓN DE SHIFTS DE TIPO FINITO POR MEDIO DE GRAFOS
G[1]
G[2]
29
G[3]
Figura 7.
Un camino bi-innito en un grafo
G
determina una sucesión bi-innita de vértices de ese
grafo, a saber, los vértices que el camino bi-innito atraviesa (pero a una sucesión bi-innita
de vértices puede corresponderle más de un camino bi-innito, a menos que el grafo no posea
aristas en paralelo entre dos nodos). Formalmente, sea G = (V, Σ, i, t) un grafo, y sea (xk )k∈Z un
punto de XG . Entonces, la sucesión bi-innita de vértices que este camino bi-innito determina
Z
es el punto (i(xk ))k∈Z , que pertenece al full shift V .
Para considerar estos recorridos bi-innitos, introducimos la matriz de incidencia de un
grafo.
G = (V, Σ, i, t) un grafo con matriz
de incidencia de G es la matriz B , de tamaño |V | × |V | con
V , tal que, para vértices m, n ∈ V ,
1 si (AG )mn > 0
Bmn =
0 si (AG )mn = 0
Definición 2.33. Sea
de adyacencia
G
desde
La
matriz
las y columnas indizadas por
(m, n) de la matriz de incidencia es 1 o 0, dependiendo
m hacia n (en caso de haber, no importa cuántas hay).
Es decir, la entrada
arista en
AG .
de si hay o no
Ahora consideraremos el conjunto de todas las sucesiones bi-innitas de vértices que determinan los caminos bi-innitos en
Definición 2.34. Sea
G,
y que resultará ser también un espacio shift.
G = (V, Σ, i, t)
vértices de G es el conjunto
un grafo con matriz de incidencia
B.
El
shift de
X̂G = (xk )k∈Z ∈ V Z : ∀k ∈ Z, Bxk xk+1 = 1
Proposición 2.35.
Los shifts de vértices son shifts de tipo nito de memoria 1.
Demostración. Sea G = (V, Σ, i, t) un grafo con matriz de incidencia B . Consideremos
F = {mn ∈ V 2 : Bmn = 0}, y veamos que X̂G = XF .
Sea x ∈ X̂G , y consideremos j, k ∈ Z. Si k − j + 1 6= 2, x[j,k] ∈
/ F (pues F contiene sólo
palabras de largo 2). Y si k−j +1 = 2, es x[j,k] = xj xj+1 , pero, por estar x en X̂G , es Bxj xj+1 = 1,
por lo que x[i,j] ∈
/ F . Entonces ningún bloque de x pertenece a F , es decir, x ∈ XF .
Recíprocamente, si x ∈ XF , se tiene que, para todo j ∈ Z, x[j,j+1] ∈
/ F , de donde Bxj xj+1 = 1,
por lo que x ∈ X̂G .
Ya que todos los bloques de F tienen largo 2, se sigue que X̂G es un STF de memoria 1.
Proposición 2.36.
1.
2.
3.
La familia de todos los shifts de tipo nito de memoria 1 es la familia de todos los shifts
de vértices.
Cualquier shift de aristas es un shift de vértices (en un grafo diferente).
Si X es un shift de tipo nito de memoria M , X [M ] es un shift de vértices. De hecho,
existe un grafo G tal que X̂G = X [M ] y XG = X [M +1] .
30
2. SHIFTS DE TIPO FINITO
Demostración.
1. La proposición 2.35 muestra que cualquier shift de vértices es un SFT de memoria 1.
Ahora, sea
XF
un espacio shift con todos los bloques en
F
de largo 2. Denamos un
G como sigue: su conjunto de vértices es V = B1 (XG ), y para m, n ∈ V , pongamos
mn de m a n si, y sólo si, mn ∈
/ F . La matriz de incidencia de G tendrá
entonces, en la posición (m, n), un 1 si mn ∈
/ F , y un 0 si mn ∈ F . Luego, un punto de
Z
V está en X̂G precisamente cuando para todo k ∈ Z, Bxk xk+1 = 1, o, equivalentemente,
cuando xk xk+1 ∈
/ F , mostrando que X̂G = XF .
grafo
una única arista
2. El enunciado es consecuencia directa del ítem anterior y del hecho de que todo shift de
aristas es un STF de memoria 1.
3. Veamos que el grafo G construido en la prueba del teorema 2.28, aparte de satisfacer
[M +1]
[M ]
que XG = X
, cumple que X̂G = X
.
G construido tiene conjunto de vértices V = BM (X), y entre
los vértices I = a1 · · · aM y J = b1 · · · bM hay arista si, y sólo si, a2 · · · aM = b1 · · · bM −1
y a1 · · · aM bM ∈ BM +1 (X). Es decir, llamando B a la matriz de incidencia, se tiene que
BIJ = 1 si, y sólo si, I y J solapan progresivamente y el bloque obtenido de agregar a
I el último símbolo de J está en BM +1 (X).
Recordemos también que es X = XF para alguna colección F de bloques de tamaño
M + 1.
Sea x ∈ X̂G . Se tiene que, para todo k ∈ Z, xk ∈ V , y Bxk xk+1 = 1, de donde xk
−1
y xk+1 solapan progresivamente. Denamos x = βM (x). Se tiene que, para cualquier
k ∈ Z, xk · · · xk+M ∈ BM +1 (X) (pues es el bloque que resulta de agregar a xk el último
/ F , y entonces x ∈ X , así que x ∈ X [M ] .
símbolo de xk+1 ), es decir, xk · · · xk+M ∈
[M ]
Ahora sea x ∈ X
. Sea x tal que βM (x) = x. Se tiene que, para cualquier k ∈ Z,
es xk = xk · · · xk+M −1 ∈ BM (X), xk+1 = xk+1 · · · xk+M ∈ BM (X), y xk · · · xk+M ∈
BM +1 (X), por lo que Bxk xk+1 = 1. Luego, x ∈ X̂G .
Recordemos que el grafo
4.
Desdoblamiento de estados
El desdoblamiento de estados es un procedimiento para construir nuevos grafos a partir de
uno dado. Comenzando con una partición del conjunto de aristas, cada estado es desdoblado
en una cierta cantidad de estados derivados. Aunque el grafo resultante puede parecer muy
distinto del original, ambos tienen shifts de aristas conjugados. Hay una operación inversa del
desdoblamiento, llamada amalgama de estados. Resulta ser que cualquier conjugación entre
shifts de aristas puede dividirse en una sucesión nita de desdoblamientos y amalgamas de
estados. Esto, junto a aplicaciones para la producción de códigos de estados nitos, explica la
crucial importancia del desdoblamiento de estados en dinámica simbólica.
Comenzamos con una descripción del desdoblamiento de un solo estado, operación que
desdoblamiento elemental. Sea G un grafo con conjunto de estados V y conjunto
de aristas Σ. Fijemos un estado I ∈ V , y supongamos, por el momento, que no hay bucles en I .
Hagamos una partición del conjunto de aristas salientes de I (es decir, ΣI ) en dos subconjuntos
1
2
disjuntos no vacíos ΣI y ΣI . Construimos un nuevo grafo H , basándonos en esta partición, como
1 2
i
sigue: el conjunto de estados es W = (V − {I}) ∪ {I , I }. Para cada arista e ∈ ΣI (donde i
i
es 1 o 2), pongamos una arista en H desde I hasta t(e) llevando el mismo nombre e (notar
I
que, como no hay bucles en I , t(e) 6= I , de modo que t(e) ∈ W ). Para cada f en Σ (es decir,
1
1
2
cada arista f llegando a I ), pongamos dos aristas f desde i(f ) hasta I y f desde i(f ) hasta
2
I . Todas las otras aristas de G (es decir, las que no están vinculadas al nodo I ) se copian
en H con el mismo nombre e idénticos nodos inicial y terminal. Queda entonces completa la
construcción de H . Hablando sin precisión, desdoblamos las aristas salientes y reproducimos
las aristas entrantes a I . La gura 8 muestra cómo es la operación.
denominaremos
4. DESDOBLAMIENTO DE ESTADOS
31
Figura 8.
G el grafo de la izquierda en la gura 9, y consideremos la partición de
Σ2I = {b, c}. A la derecha de esa gura se muestra el grafo resultante
I con esa partición.
Ejemplo 2.37. Sea
ΣI
dada por
Σ1I = {a}
de desdoblar el estado
y
Figura 9.
Supongamos que
H
se forma a partir de
G
desdoblando el estado
I,
como se describió
más arriba. A continuación construimos una conjugación entre sus shifts de aristas XG y XH .
i
I
Denamos la transformación monobloque Ψ : B1 (XH ) → B1 (XG ) mediante Ψ(f ) = f si f ∈ Σ
I
y Ψ(e) = e si e ∈
/ Σ . En otras palabras, Ψ simplemente borra supraíndices. Es posible chequear
(lo haremos más adelante) que borrar supraíndices de los caminos en
G,
de modo que
Ψ
H produce caminos en
ψ : XH → XG . Ahora
induce un código de ventana deslizante monobloque
Φ : B2 (XG ) → B1 (XH ) mediante:

si
f∈
/ ΣI
 f
f 1 si f ∈ ΣI y e ∈ Σ1I
Φ(f e) =
 2
f
si
f ∈ ΣI y e ∈ Σ2I
denamos un código 2-bloque
Es decir,
Φ
se anticipa un símbolo y puede añadir un supraíndice, dependiendo de lo que ve.
G en
0 yanticipación 1.
Puesto que agregar y eliminar supraíndices no tiene efecto, vemos que ψ φ(x) = x para todo
x ∈ XG . Recíprocamente, los supraíndices están unívocamente determinados
por la denición
1
2
de Φ, ya que ΣI y ΣI son una partición de ΣI , de modo que φ ψ(y) = y para todo y ∈ XH .
Luego, φ es una conjugación de XG en XH .
Es factible chequear (también lo haremos más adelante) que
caminos de
H , y, por lo tanto, induce un CVD φ de XG
Ejemplo 2.38. Las acciones de
2.37 se muestran a continuación:
φ
y
ψ
en
XH
Φ
transforma caminos de
con memoria
sobre puntos típicos
x ∈ XG , y ∈ XH
del ejemplo
32
2. SHIFTS DE TIPO FINITO
x = ···
d
a
d
b
d
φ
↓
c
e
.a
d
↑
ψ
c
e
b
···
d
d1 a d2 b d2 c e1 . a d2 c e2 b · · ·
Notar que no gura el símbolo en y debajo de la última d de x, pues para ello hace falta conocer
el símbolo a la derecha de dicha d.
y = ···
El procedimiento general de desdoblamiento de estados es una extensión, en dos sentidos,
del proceso elemental recientemente descripto: por un lado, las aristas salientes de un estado
pueden particionarse en una cantidad de conjuntos que no necesariamente sea
2,
y, por otro
lado, se puede particionar simultáneamente los conjuntos de aristas salientes de todos los estados
(incluyendo los que presentan bucles).
G = (V, Σ, iG , tGP
) un grafo. Para cada estado I ∈ V , sean denidos
un entero positivo m(I) tal que m(I) ≤ |
I |, y una partición de ΣI en conjuntos disjuntos
m(I)
1
2
(no vacíos) ΣI , ΣI , . . . , ΣI
(es decir, m(I) ≥ 1 es la cantidad de átomos en la partición de
ΣI ). Sea P la partición resultante de Σ. El grafo de estados desdoblados G[P] formado a
partir de G usando P es el grafo (W, Σ0 , iH , tH ) denido como sigue:
k
Conjunto de estados: W = I : I ∈ V ∧ 1 ≤ k ≤ m(I) .
j
0
Conjunto de aristas: Σ = e : e ∈ Σ ∧ 1 ≤ j ≤ m tG (e)
.
n
j
n
Función de nodos iniciales: iH (e ) = (iG (e)) donde n es tal que e ∈ Σi (e) .
G
j
j
Función de nodos terminales: tH (e ) = (tG (e)) .
n
j
Es decir, si e ∈ Σ va de I a J en G, entonces existe n tal que e ∈ ΣI , y el estado inicial de e
[P]
n
j
j
n
j
en G
es I y el terminal es J ; es decir, e va de I a J .
Un desdoblamiento elemental de G por el estado I ocurre cuando m(I) = 2 y m(J) =
1 para todo J 6= I .
Definición 2.39. Sea
se tiene que m(J) = 1, los supraíndices 1 (en el nombre del
1
estado y de las aristas entrantes a J en el grafo desdoblado) se vuelven redundantes, y no hay
Cuando para algún estado
J
problemas en omitirlos (pues se obtiene un grafo isomorfo), como hicimos en nuestras primeras
discusiones respecto de los desdoblamientos elementales.
Asumiremos que los elementos de las particiones de aristas salientes de cada nodo nunca
son vacíos. Esto garantiza que el grafo obtenido de desdoblar estados en un grafo esencial (o
irreducible) es también esencial (o irreducible).
Observación 2.40. De la denición del grafo desdoblado, se desprende que una arista
n
ej
k
n
va de I hasta J si, y sólo si, e ∈ ΣI (lo cual implica que iG (e) = I ), tG (e) = J y j = k . Por
n
k
ello, la cantidad de aristas desde I hasta J en el grafo desdoblado es precisamente la cantidad
n
de aristas en ΣI que terminan en J en el grafo G. Es decir,
0
0J k ΣI n ∩ Σ = ΣnI ∩ ΣJ para todos
k ∈ {1, . . . , m(J)}, n ∈ {1, . . . , m(I)}, I, J ∈ V (G).
el grafo de la izquierda en la gura 10, de modo que ΣI = {e, f } y
{g}. Tomemos las siguientes particiones: Σ1I = {e}, Σ2I = {f } y Σ1J = {g}, de modo que
= 2 y m(J) = 1. Entonces P = {Σ1I , Σ2I , Σ1J }. El grafo resultante del desdoblamiento se
Ejemplo 2.41. Sea
ΣJ =
m(I)
G
muestra a la derecha en esa misma gura. Notar que, en particular, el bucle
1
1
2
1
2
desdobla en un bucle e en el estado I y otra arista e desde I hasta I .
e
en el estado
ΣI ,
a saber,
Σ1I = {e}
y
se
{e, f }Z . EsenΣ2I = {f }. El grafo
Ejemplo 2.42. La gura 11 muestra a la izquierda un grafo del full shift
cialmente, hay una sola partición no trivial de
I
4. DESDOBLAMIENTO DE ESTADOS
33
Figura 10.
resultante del desdoblamiento se muestra en la misma gura a la derecha, y puede advertirse
que, salvo cambio de nombres, es esencialmente la presentación del full shift en bloques de
tamaño
2
con solape.
Figura 11.
1
Ejemplo 2.43. Para el grafo G a la izquierda en la gura 12, sea P denida por ΣI = {a},
[P]
2
2
1
1
ΣI = {b, c}, ΣJ = {d}, ΣK = {e} y ΣK = {f }. El grafo G se muestra a la derecha de esa
misma gura.
Figura 12.
34
2. SHIFTS DE TIPO FINITO
Como la construcción de
[P]
que G
es el grafo de
G[P]
usa particiones de conjuntos de aristas
desdoblamiento de salidas
una correspondiente noción de
formado a partir de
desdoblamientos de entradas,
salientes, decimos
G usando P. Hay
usando particiones de conjuntos
de aristas entrantes.
un grafo. Para cada estado I ∈ V , sea denida una
I
I
I
partición de Σ en conjuntos disjuntos (no vacíos) Σ1 , Σ2 , . . . , Σm(I) , donde m(I) ≥ 1 es la canI
tidad de conjuntos en la partición de Σ . Sea P la partición resultante de Σ. El
Definición 2.44. Sea
G = (V, Σ, i, t)
I
grafo de desdoblamiento de entradas G[P] formado a partir de G usandoP tiene como conjunto de esta
{Ik : I ∈ V ∧ 1 ≤ k ≤ m(I)} y como conjunto de aristas a ej : e ∈ Σ ∧ 1 ≤ j ≤ m i(e)
J
Si e ∈ Σ va de I a J en G, entonces existe j tal que e ∈ Σj , y el estado inicial de ei en G[P]
Ii y el terminal es Jj .
dos a
.
es
G el grafo a la izquierda en la gura 13. Denamos P mediante ΣI1 =
= {f }. El correspondiente G[P] se muestra en esa misma gura, a la
Ejemplo 2.45. Sea
{e}, ΣI2
derecha.
= {g}
J
y Σ1
Figura 13.
también como un desdoblamiento de
salidas de G (y similarmente para los desdoblamientos de entradas). También es apropiado dar
Será conveniente considerar a un grafo isomorfo a
G[P]
un nombre a la operación inversa del desdoblamiento.
H
es un
desdoblamiento de un grafo G, y G es una amalgama
o a
G[P] ,
para alguna partición
Definición 2.46. Un grafo
de
H,
si
H
es isomorfo a
[P]
G
P
del conjunto de aristas de
G.
desdoblamiento de salidas, desdoblaamalgama de entradas. Notar que los isomorsmos
Si hace falta mayor precisión, emplearemos los términos
miento de entradas, amalgama de salidas
o
de grafos, de acuerdo a nuestra denición, pueden ser vistos como cualquiera de estas cuatro
operaciones.
Al igual que en los desdoblamientos elementales, los desdoblamientos en general producen
grafos cuyos shifts de aristas son conjugados a los del grafo inicial.
Si un grafo H es un desdoblamiento de un grafo G, entonces los shifts de
son conjugados.
Teorema 2.47.
aristas XG y XH
Demostración. Probaremos sólo para el caso de los desdoblamientos de salida, siendo el
otro caso similar.
Ya que los isomorsmos de grafos establecen conjugaciones, y que la composición de con[P]
jugaciones es otra conjugación, alcanza con probar el resultado para el caso en que H = G
.
Mostraremos, en sucesivos pasos, que existen CVD ψ : XH → XG y φ : XG → XH tales que
φ = ψ −1 , con lo que quedará demostrado que φ es una conjugación, y, por lo tanto, XG ∼ XH .
4. DESDOBLAMIENTO DE ESTADOS
Denamos la transformación monobloque
[0,0]
y consideremos ψ = Ψ∞ .
35
Ψ : B1 (XH ) → B1 (XG )
mediante
Ψ (ej ) = e,
y ∈ XH , y tomemos k ∈ Z. Debe ser yk = ej , yk+1 = f m con e, f ∈ Σ y
tH (e ) = iH (f m ); por denición de H , esto implica que (tG (e))j = (iG (f ))n con n tal
n
que f ∈ Σi (f ) , de donde concluimos que tG (e) = iG (f ) (es decir, ef es camino en G) y
G
j
que j = n, es decir, f ∈ Σi (f ) . Por lo tanto,
G
tG ((ψy)k ) = tG (Ψ(yk )) = tG Ψ(ej ) = tG (e) = iG (f ) = iG (Ψ(f m )) = iG ((ψy)k+1 )
Sea
j
mostrando que
ψ(y) ∈ XG ,
y entonces
ψ (XH ) ⊆ XG ,
ψ : XH → XG
por lo que
es un
CVD monobloque bien denido.
Ahora denamos la transformación de bloques
siguiente: si
ef ∈ B2 (XG ),
entonces existe un
Φ : B2 (XG ) → B1 (XH ) por
j
único j tal que f ∈ Σi (f ) ,
G
medio de lo
y denimos
[0,1]
Φ∞ .
Φ(ef ) = ej . Consideremos φ =
Sea x ∈ XG , y tomemos k ∈ Z. Tenemos que xk , xk+1 , xk+2 ∈ Σ, xk xk+1 , xk+1 xx+2 ∈
B2 (XG ), y existen I, J ∈ V tales que tG (xk ) = iG (xk+1 ) = I , tG (xk+1 ) = iG (xk+2 ) = J .
n1
n2
n1
Sean n1 y n2 tales que xk+1 ∈ ΣI
y xk+2 ∈ ΣJ . Entonces Φ(xk xk + 1) = xk y
n2
Φ(xk+1 xk+2 ) = xk+1 . Luego,
tH ((φx)k ) = tH (Φ(xk xk+1 )) = tH (xnk 1 ) = (tG (xk ))n1 = I n1
2
iH ((φx)k+1 ) = iH (Φ(xk+1 xk+2 )) = iH xnk+1
= (iG (xk+1 ))n1 = I n1
mostrando que
φ(x) ∈ XH ,
y entonces
φ (XG ) ⊆ XH ,
φ : XG → XH
por lo que
es un
CVD bien denido.
x ∈ XG y k ∈ Z. Entonces (φx)k = Φ (xk xk+1 ) = xnk para algún n, y entonces
(ψ(φx))k = Ψ ((φx)k ) = Ψ (xnk ) = xk . En consecuencia, (ψ ◦ φ)(x) = x para todo
x ∈ XG .
Recíprocamente, sean y ∈ XH y k ∈ Z. Razonando como antes, debe ser yk yk+1 =
ej f m con f ∈ ΣjiG (f ) , por lo que (ψy)[k,k+1] = ef (con ef ∈ B2 (XG ) pues ψ(y) ∈ XG )
j
j
y entonces Φ(ef ) = e , así que (φ(ψy))k = Φ (ψy)[k,k+1] = Φ(ef ) = e = yk . En
consecuencia, (φ ◦ ψ)(y) = y para todo y ∈ XH .
Sean
Queda entonces demostrado que
φ : XG → XH
es código de ventana deslizante que posee función
inversa que es también código de ventana deslizante, por lo que
XG
y
XH
son conjugados.
H es un desdoblamiento de salidas de G, hay un
XG , que se denomina código de amalgama de salidas, cuyo
inverso es un código con memoria 0 y anticipación 1 llamado código de de desdoblamiento
de salidas. Análogamente, si H es un desdoblamiento de entradas de G, tenemos un código de
La demostración anterior muestra que si
código monobloque desde
XH
a
amalgama de entradas monobloque con inverso denominado código de desdoblamiento
de entradas que tiene memoria 0 y anticipación 1.
Del teorema previo, se deduce que si un grafo
(nita) de desdoblamientos y amalgamas de un grafo
H puede ser obtenido por una sucesión
G, entonces XH ∼ XG (la conjugación es
la composición de los sucesivos códigos de desdoblamiento o amalgama). Aunque no lo haremos
aquí, es posible probar también el recíproco: cualquier conjugación entre shifts de aristas puede
escribirse como una composición de códigos de desdoblamientos y amalgamas. Este importante
resultado se conoce como
4.1.
Teorema de la Descomposición.
Los desdoblamientos y las matrices de adyacencia.
Consideremos el ejem-
plo 2.43. Los estados de G y de su desdoblado son, respectivamente, V = {I, J, K} y W =
{I 1 , I 2 , J 1 , K 1 , K 2 }. Podemos representar cómo los estados en W se derivan a partir de los estados en
V
por medio de la siguiente matriz
D
con las indizadas por
V
y columnas indizadas
36
2. SHIFTS DE TIPO FINITO
por
W
(en el orden dado):


1 1 0 0 0
D= 0 0 1 0 0 
0 0 0 1 1
1
2
Por ejemplo, DI,I 1 = 1 = DI,I 2 pues I e I resultan de desdoblar
DI,J 1 = 0 pues J 1 no procede del desdoblamiento de I .
el estado
I,
mientras que
Por otro lado, podemos especicar las cantidades de aristas en cada partición que terminan
en un estado dado, por medio de la siguiente matriz
indizadas por
V
E
con las indizadas por
W
y columnas
(en el orden dado):



E=


donde, por ejemplo,
EI 1 ,J
0
0
1
0
1
1
1
0
1
0
0
1
0
0
0
es la cantidad de aristas en






Σ1I
que terminan en
J,
en este caso una
sola arista.
Un cómputo directo muestra que el producto
y que
ED
DE
es igual a la matriz de adyacencia de
G,
da la matriz de adyacencia del grafo desdoblado. Veremos ahora que esta situación
se cumple en general.
G = (V, Σ, i, t) un grafo, P una partición de salida de Σ, y H = G[P] .
conjunto de vértices de H . La matriz de división D para P es la
Definición 2.48. Sea
W al
V × W denida
Designemos por
matriz sobre
por
DI,J k =
La
1
0
si
si
I=J
I 6= J
matriz de aristas E para P es la matriz sobre W × V
EI n ,J
denida por
= ΣnI ∩ ΣJ De la observación 2.40, surge que EI n ,J corresponde a la cantidad de aristas en el grafo
I n hasta J k (cualquiera sea k ∈ {1, . . . , m(J)}).
desdoblado que van desde desde
Las matrices de división y de aristas permiten obtener las matrices de adyacencia de los
grafos involucrados en un desdoblamiento, de acuerdo al siguiente resultado.
Teorema 2.49.
Sean G, P, H , D y E como en la denición anterior. Entonces,
DE = AG
ED = AH
Demostración. Se tiene que
X
(DE)I,J =
DI,K EK,J =
X m(L)
X
L∈V i=1
K∈W
m(I)
DI,Li ELi ,J =
X
m(I)
DI,I i EI i ,J =
i=1
X
EI i ,J
i=1


m(I)
m(I)
X
[
[
i
J
i
J
i
J
ΣI ∩ Σ = =
ΣI ∩ Σ = 
ΣI  ∩ Σ i=1
i=1
i=1
= ΣI ∩ ΣJ = (AG )I,J
m(I)
mostrando que
DE = AG .
Por otro lado,
(ED)I i ,J j =
X
EI i ,K DK,J j = EI i ,J DJ,J j = EI i ,J
K∈V
j
= ΣiI ∩ ΣJ = Σ0I i ∩ Σ0J = (AH )I i ,J j
por lo que
ED = AH .
Capítulo 3
SHIFTS SÓFICOS
Supongamos que las aristas de un grafo son rotuladas con símbolos de algún alfabeto
A,
con la posibilidad de que dos o más aristas puedan llevar el mismo rótulo. Cualquier camino
Z
biinnito en el grafo produce un punto en el full shift A por lectura de los rótulos de sus
aristas, y el conjunto de todos los puntos que así pueden obtenerse se llama un shift sóco.
Los shifts sócos son importantes por un número de razones. Veremos en este capítulo que
son precisamente aquellos espacios shift que son factores de shifts de tipo nito. Así, la clase
de los shifts sócos es la más pequeña colección de espacios shift que contiene a los STF y que
también contiene a todos los factores de cada espacio de la colección. Los shifts sócos son los
análogos de los lenguajes regulares de la teoría de autómatas, y varios de los algoritmos que
veremos en ÿ3.4 son adaptaciones de los de autómatas de estados nitos. Los shifts de tipo
nito y los sócos son modelos naturales para almacenamiento y transmisión de la información;
estudiaremos su uso en los códigos de estados nitos en el capítulo 5.
1.
Presentaciones de shifts sócos
Los shifts sócos se denen usando grafos a cuyas aristas se asigna rótulos, donde varias
aristas pueden llevar el mismo rótulo.
grafo rotulado G es un par (G, L), donde G es un grafo con conjunto
rotuladora L : Σ → A asigna a cada arista e de G un rótulo L(e) del
alfabeto A. El grafo subyacente de G es G. Un grafo rotulado se dice irreducible si su grafo
Definición 3.1. Un
de aristas
Σ,
y la
subyacente es irreducible.
A veces nos referiremos a un grafo rotulado simplemente como un grafo, y a estados o aristas
del grafo subyacente
G
de un grafo rotulado
G
G . La rotuladora L
de G. En un extremo,
como estados o aristas de
A a las aristas
A = Σ y L(e) = e para toda e ∈ Σ, dando una rotulación uno a uno de aristas
por sus nombres. En el otro extremo, A podría consistir de una única letra a y todas las aristas
estarían rotuladas con a, es decir, L(e) = a para toda e ∈ Σ. Usualmente, L será no inyectiva,
de modo que varias aristas llevarán el mismo rótulo. Aunque L no necesita ser sobreyectiva,
toda letra que no esté en la imagen de L no son usadas. Usaremos normalmente caracteres
como e, f o g para los nombres de las aristas, y a, b, c o enteros pequeños para sus rótulos. La
puede ser cualquier asignación de letras de un alfabeto
podríamos tener
gura ... muestra dos ejemplos de grafos rotulados típicos.
Así como un grafo
grafo rotulado
(I, J)
G
G
es convenientemente descripto por su matriz de adyacencia
tiene como análogo una
contiene la suma formal de los rótulos de todas las aristas que van de
carácter
∅
AG ,
un
matriz de adyacencia simbólica AG , cuya entrada
si no hay tal arista. Por ejemplo, si
G
y
H
I
a
J,
o un
son los grafos rotulados de la gura ... a
izquierda y derecha respectivamente, entonces
AG =
a b
b a


a c
b
AH =  ∅ b a + b 
a c
∅
Hay un análogo del homomorsmo de grafos para grafos rotulados, que añade el requisito de
que los rótulos se preserven.
G = (G, LG ) y H = (H, LH ) grafos rotulados. Un homomorsmo
de grafos rotulados desde G a H es un homomorsmo de grafos (∂Φ, Φ) : G → H tal que
Definición 3.2. Sean
37
38
3. SHIFTS SÓFICOS
LH (Φ(e)) = LG (e) para toda arista e ∈ Σ(G). En este caso, escribimos (∂Φ, Φ) : G → H. Si
ambas ∂Φ y Φ son biyecciones, entonces (∂Φ, Φ) se llama isomorsmo de grafos rotulados,
denotado mediante (∂Φ, Φ) : G ∼
= H. Dos grafos rotulados son isomorfos como grafos
rotulados (o simplemente isomorfos) si existe un isomorsmo de grafos rotulados entre ellos.
Se puede pensar que dos grafos rotulados isomorfos son el mismo para nuestros propósitos.
Si
G = (G, L)
es un grafo rotulado, entonces
caminos biinnitos del grafo subyacente
de
G
G.
L
puede ser usada para rotular caminos y
Denimos el
rótulo de un camino π = e1 e2 . . . en
mediante
L(π) = L(e1 )L(e2 ) . . . L(en )
n-bloque sobre A, y al cual a veces nos referiremos como un bloque rotulado. Para
el camino vacío ε, denimos L(ε) = ε, la palabra vacía sobre A. Si ξ = . . . e−1 e0 e1 . . . es un
camino biinnito en G, de modo que ξ es un punto del shift de aristas XG , denimos el rótulo
del camino xi como
L∞ (ξ) = . . . L(e−1 )L(e0 )L(e1 ) . . . ∈ AZ
que es un
El conjunto de los rótulos de todos los caminos biinnitos en
G
es denotado por
XG = x ∈ AZ : x = L∞ (ξ) para algún ξ ∈ XG
= {L∞ (ξ) : ξ ∈ XG } = L∞ (XG )
A-shift. Por ejemplo, si G es el grafo rotulado de la izquierda
XG es el full {a, b}-shift; el grafo rotulado H de la derecha produce un
subconjunto propio del full {a, b, c}-shift (¾por qué?). Notar también que si G y H son isomorfos,
entonces XG = XH .
Así,
XG
es un subconjunto del full
en la gura ..., entonces
Este capítulo trata los espacios shift que surgen de grafos rotulados.
Definición 3.3. Un subconjunto
algún grafo rotulado
cual
XG = X .
G.
Una
X
de un full shift es un
presentación de un shift sóco X
La transformación shift en
XG
es denotada por
shift sóco
si
X = XG para
G para el
es un grafo rotulado
σG .
El término sóco fue acuñado por Weiss, y se deriva de la palabra hebrea para nito.
Es importante darse cuenta de que un shift sóco dado tiene muchas presentaciones diferentes. Por ejemplo, la gura ... muestra cuatro presentaciones del full 2-shift, ninguna de las
cuales son isomorfas entre sí (aunque los grafos subyacentes de (b) y (c) son grafos isomorfos).
Si
X
G = (G, L) y w es un bloque en B(X), decimos que
presentación de w si L(π) = w. Un bloque w dado puede tener
es un shift sóco presentado por
un camino
π
en
G
es una
varios caminos diferentes que lo presenten. Por ejemplo, en la gura ...(d), el bloque 010001
tiene tres presentaciones, una empezando en cada uno de los tres vértices. Si
que un camino biinnito
caminos, un punto de
ξ
XG
en
XG
es una
x ∈ XG ,
decimos
presentación de x si L∞ (ξ) = x. Al igual que con los
puede tener varias presentaciones diferentes.
Nuestra denición de un shift sóco no requiere que sea un espacio shift. Sin embargo,
siempre lo es.
Teorema 3.4.
Los shifts sócos son espacios shift.
X un shift sóco sobre A, y G = (G, L)
L : Σ → A induce un código monobloque L∞ : XG → XG ,
X = L∞ (XG ) es un espacio shift por teorema 1.61.
Demostración. Sea
Entonces
una presentación de
X.
de modo que su imagen
Nótese que los shifts de aristas son shifts sócos, pues podemos simplemente usar el conjunto
de aristas
L(e) = e.
Σ
como alfabeto y, como rotuladora, la función identidad
L : Σ → Σ
dada por
El siguiente resultado extiende esta observación para mostrar que los shifts de tipo
nito son sócos.
Teorema 3.5.
Todo shift de tipo nito es un shift sóco.
1. PRESENTACIONES DE SHIFTS SÓFICOS
39
M ≥ 0. Sea G el grafo construi[M +1]
do según la demostración del teorema 2.28, de modo que X
= XG . Recordemos que
V (G) = BM (X), Σ(G) = BM +1 (X) y cada arista e1 . . . eM +1 va desde e1 . . . eM hasta e2 . . . eM +1 .
Rotulemos la arista e1 . . . eM +1 con el símbolo e1 . Mostraremos que el grafo rotulado G = (G, L)
es una presentación de X .
[M +1]
Sea βM +1 : X → X
= XG el código de bloques dado por
Demostración. Sea
X
un STF, digamos de memoria
βM +1 (x)[i] = x[i,i+M ]
L x[i,i+M ] = xi , vemos que L∞ (βM +1 (x)) = x para todo x ∈ X , probando que X ⊆ XG .
[M +1]
Recíprocamente, cada punto ξ ∈ XG = X
tiene la forma ξ = βM +1 (x) para algún x ∈ X ,
así que L∞ (ξ) = L∞ (βM +1 (x)) = x ∈ X . Luego, XG = L∞ (XG ) ⊆ X , y entonces X = XG .
Como
Capítulo 4
ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS
SHIFT
El objetivo de este capítulo es analizar a los espacios shift a través de sus características
topológicas. Mediante la denición de una manera adecuada para medir distancias entre tirillas
biinnitas, podremos ver a la full shift como un espacio métrico y estudiarla con las herramientas
clásicas de la topología y el análisis. De ésto, resultará una caracterización de los espacios shift
y de los códigos de ventana deslizante a través de propiedades topológicas. Esto forma parte de
investigaciones más o menos recientes (alrededor de 1970) en el área de la Dinámica Simbólica,
de modo que se trata de tópicos relativamente nuevos en Matemática, y en franco proceso de
expansión.
No se pretende dar aquí un estudio detallado de la teoría general de espacios métricos, sino
más bien enunciar las deniciones y propiedades básicas de los mismos con el único objetivo de
aplicarlos al estudio de los espacios shift.
En el presente capítulo, primero deniremos una métrica para la full shift y veremos algunas
propiedades básicas importantes de la misma, para luego estudiar la convergencia de sucesiones
y arribar a la conclusión de que los espacios shift están caracterizados por ser subconjuntos
compactos y shift-invariantes de la full shift. Luego analizaremos la continuidad de acuerdo a
la métrica denida, encontrando que los códigos de ventana deslizante se caracterizan por ser
las funciones entre espacios shift que son continuas y conmutan con la función shift.
1.
Definición 4.1. Una
d : X × X → R+
0
1.
2.
3.
métrica
Una métrica para AZ
o
función distancia
para un conjunto
d (x, y) = 0 ⇔ x = y
∀x, y ∈ X, d (x, y) = d (y, x) (axioma de simetría)
∀x, y, z ∈ X, d (x, z) ≤ d (x, y) + d (y, z) (desigualdad
El par
(X, d)
X
es una función
con las siguientes propiedades:
se denomina
triangular)
espacio métrico.
Para llevar adelante el objetivo planteado en la introducción, debemos dotar a
AZ
de una
métrica adecuada. Para nuestros propósitos, adecuada va a querer decir que dos puntos x e
y de AZ estarán tanto más cerca cuanto más grande sea el bloque central en que coinciden.
Así, por ejemplo,
· · · 00010.110101110000 · · ·
y
· · · 10010.110101110010 · · ·
deberán estar entre
sí a una distancia menor que la distancia que haya entre los puntos · · · 00010.1101110000 · · · y
· · · 00011.11111111 · · · Para ello, deniremos d : AZ × AZ → R+
0 mediante
d (x, y) =
0
si
− mı́n{|k|:xk 6=yk }
2
si
x=y
x 6= y
En palabras, para encontrar la distancia entre dos puntos distintos
coordenada entera
−|k|
y evaluar 2
.
k
(positiva o negativa) en la que
x
e
y
x e y , hay que detectar la
dieren más cercana a la coordenada
0,
Ejemplo 4.2. Encontremos la distancia entre los puntos
x = · · · 00010.110101110000 · · ·
y = · · · 10010.110101110010 · · ·
40
1. UNA MÉTRICA PARA
AZ
41
A n de visualizar mejor, dispongamos ambos puntos uno debajo del otro, y marquemos con
×
las coordenadas en que
xk 6= yk :
−5 −4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11
x ... 0
0
0
1
0 1 1 0 1 0 1 1 1 0 0 0 0 ...
×
×
×
y ... 1
0
0
0
0 1 1 0 1 0 1 1 1 0 0 1 0 ...
× más
= 1/4.
La marca
−|−2|
2
cercana a la coordenada
0
corresponde a
k = −2,
de modo que
Notemos que, de acuerdo a esta denición, el mayor valor que puede tomar
d
d (x, y) =
es
1,
que
corresponde al caso en que los dos puntos entre los que se está midiendo la distancia dieren
en la coordenada
0.
Justiquemos que la función
d
así denida es efectivamente una métrica para
AZ :
x e y en AZ , o bien son iguales o bien son distintos. En el primer
+
caso, es d (x, y) = 0 ∈ R0 . En el caso en que x 6= y , el conjunto {k : xk 6= yk } ⊆ Z es no
vacío, de modo que el conjunto {|k| : xk 6= yk } ⊆ N tampoco es vacío, y entonces tiene
−t
un mínimo elemento N . Ya que la función exponencial 2
es estrictamente positiva
+
−N
para t ∈ R, d (x, y) = 2
∈ R0 . Esto muestra también que d (x, y) = 0 ⇔ x = y .
Dados dos puntos
El cumplimiento del axioma de simetría es directo de ver.
Z
Para la desigualdad triangular, sean x, y, z ∈ A dos a dos distintos. Llamemos
Nxy = mı́n {|k| : xk 6= yk }
Nyz = mı́n {|k| : yk 6= zk }
Nxz = mı́n {|k| : xk 6= zk }
N = mı́n {Nxy , Nyz }.
N = 0, es y0 6= x0 o y0 6= z0 , de modo que d (x, y) = 1 o d (y, z) = 1, y por lo
tanto es d (x, y) + d (y, z) ≥ 1 ≥ d (x, z).
• Si N > 0, es x[−N +1,N −1] = z[−N +1,N −1] , pues si tomamos i tal que |i| < N , tenemos
que |i| < Nxy y |i| < Nyz , de donde xi = yi e yi = zi , por lo que xi = zi . O sea que
Nxz ≥ N . Por lo tanto, observando que 2−Nxz ≤ 2−N y que es N = Nxy o N = Nyz ,
Tomemos
•
Si
se tiene
d (x, z) = 2−Nxz ≤ 2−N ≤ 2−Nxy + 2−Nyz = d (x, y) + d (y, z)
Es decir, en cualquier caso se verica la desigualdad triangular.
La función distancia puede restringirse de
de la full shift, y el par
(X, d)
AZ × AZ
a
X ×X
para cualquier subconjunto
X
sigue siendo un espacio métrico.
La métrica recientemente denida recibe el nombre de
métrica usual para los espacios
shift, y es a la que haremos referencia por defecto siempre que hablemos de distancia en espacios
shift, a menos que especiquemos lo contrario.
Una condición necesaria y suciente para que dos puntos distintos estén a distancia menor
ε esrictamente
positivo es que ambos coincidan en una ventana central de tamaño 2k +1,
1
en donde k = log
(a menos que especiquemos otra cosa, log siempre signicará logaritmo
ε
en base 2; además, para r ∈ R, brc es la parte entera o piso de r , es decir, el mayor entero que
no supera a r ). Para probar la armación, notemos que
1
d (x, y) < ε ⇔ 2− mı́n{|k|:xk 6=yk } < ε ⇔ mı́n {|k| : xk 6= yk } > log
ε
1
⇔ mı́n {|k| : xk 6= yk } > log
⇔ x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c]
ε
ε
ε
ε
ε
Juntando esto con el hecho de que dos puntos de la full shift que están a distancia 0 coinciden
en el bloque central de tamaño 2k + 1 cualquiera sea k ∈ N, tenemos el siguiente resultado.
que un
Proposición 4.3.
Sea ε > 0, y x e y dos puntos de AZ . Se tiene que
d (x, y) < ε ⇐⇒ x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c]
ε
ε
ε
ε
42
4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT
En particular, para cualquier K ∈ N, tenemos que d (x, y) < 2−K ⇔ x[−K,K] = y[−K,K] .
(X, d) un espacio métrico, x ∈ X y r ∈ R+ . El entorno de radio r
con centro en x, denotado Br (x), es el conjunto de puntos del espacio cuya distancia a x es
menor que r .
Definición 4.4. Sea
En virtud de la Proposición 4.3, el entorno de radio
ε
con centro en
x ∈ X ⊆ AZ ,
para la
métrica usual, es
Particularmente,
n
o
Bε (x) = y ∈ X : x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c]
ε
ε
ε
ε
para K ∈ N, B2−K (x) = y ∈ X : x[−K,K] = y[−K,K] .
E de un espacio métrico (X, d), se dice que un punto
x ∈ E es un punto interior a E si existe r > 0 tal que Br (x) ⊆ E . E es abierto en X si
todos sus puntos son puntos interiores a E .
Definición 4.5. Dado un subconjunto
Como caso particular, los entornos de cualquier espacio métrico son conjuntos abiertos.
Puede demostrarse que cualquier conjunto abierto de un espacio métrico es una unión de entornos, y viceversa. Además, la unión arbitraria de conjuntos abiertos es un conjunto abierto,
y la intersección nita de conjuntos abiertos es también un conjunto abierto.
En el caso particular de la full shift, a partir de la denición de conjunto abierto y de la
Z
caracterización de los entornos, se deduce que un subconjunto X de A es abierto si, y sólo si,
Z
para cada x ∈ X , existe K ∈ N tal que cualquier punto y ∈ A que satisface y[−K,K] = x[−K,K]
pertenece también a
X.
Tal
K
dependerá, en general, de
x.
E de un espacio métrico (X, d), se dice que un punto
x ∈ X es un punto de acumulación de E si todo entorno con centro en x tiene un punto de
E − {x}. E es cerrado si contiene a todos sus puntos de acumulación. La clausura de E es
la unión de E con el conjunto de sus puntos de acumulación.
Definición 4.6. Dado un subconjunto
Se tiene que
E
es cerrado si, y sólo si, su complemento es abierto. Además,
y sólo si, la clausura de
E
coincide con
E.
E
es cerrado si,
Puede verse, usando las leyes de De Morgan, que la
intersección arbitraria de conjuntos cerrados es un conjunto cerrado, así como la unión nita
de conjuntos cerrados es también un conjunto cerrado.
2.
Sucesiones
(X, d) es una función de N en X . Denotaremos por xn
al n-ésimo término de la sucesión, y por {xn }n∈N a la sucesión completa. Cuando el espacio
(n)
métrico en cuestión sea un espacio shift, denotaremos x
al n-ésimo término de la sucesión,
pues seguiremos usando xn para referirnos al símbolo que haya en la n-ésima coordenada de la
tirilla biinnita x.
Una sucesión en un espacio métrico
{xn }n∈N en el espacio (X, d) se dice convergente en X si
lı́mn→∞ d (xn , p) = 0. En este caso, escribimos lı́mn→∞ xn = p, o también
Definición 4.7. Una sucesión
p∈X
xn −→ p
existe
tal que
n→∞
Obsérvese que
lı́mn→∞ xn = p
si, y sólo si,
∀ε > 0, ∃N ∈ N : ∀n ≥ N, d (xn , p) < ε.
Caracterizaremos ahora la convergencia de sucesiones en espacios shift. Básicamente, una
(n) Z
x
en un espacio shift converge a x ∈ A cuando para cualquier K natural,
n∈N
por grande que sea, el bloque central de tamaño 2K + 1 de x coincide con el bloque central de
(n)
tamaño 2K + 1 de x
, para todo n sucientemente grande.
sucesión
Proposición 4.8.
Sea x(n) n∈N una sucesión en el espacio shift X con la métrica usual,
(n)
y x ∈ AZ . Se tiene que lı́mn→∞ x(n) = x si, y sólo si, ∀K ∈ N, ∃N ∈ N : ∀n ≥ N, x[−K,K] =
x[−K,K] .
2. SUCESIONES
43
Demostración. Dado que la función exponencial a tasa menor que
mente a
0,
1
tiende asintótica-
por la Proposición 4.3 tenemos que:
lı́m x(n) = x ⇔ ∀ε > 0, ∃N ∈ N : ∀n ≥ N, d x(n) , x < ε ⇔
n→∞
∀K ∈ N, ∃N ∈ N : ∀n ≥ N, d x(n) , x < 2−K ⇔
(n)
∀K ∈ N, ∃N ∈ N : ∀n ≥ N, x[−K,K] = x[−K,K]
Ejemplo 4.9. Estudiar la convergencia de la sucesión
(n)
xi
=
1
0
si
si
x
(n)
n∈N
en
{0, 1}
Z
denida por
|i| = n
|i| =
6 n
Veamos el siguiente cuadro:
(0)
x
x(1)
x(2)
x(3)
−4 −3 −2 −1 0 1 2 3
0
0
0
0 1 0 0 0
0
0
0
1 0 1 0 0
0
0
1
0 0 0 1 0
0
1
0
0 0 0 0 1
···
···
···
···
4
0
0
0
0
···
···
···
···
.
.
.
Rápidamente nos damos cuenta que la ventana central de tamaño
puros
0,
para todo
2K + 1
de
x(n)
consta de
n ≥ K + 1.
Luego, de acuerdo al criterio de convergencia en espacios shift,
∞
el límite de la sucesión es el punto 0 .
Ejemplo 4.10. Estudiar la convergencia de la sucesión
x(n) =
(0001)∞
(01)∞
x(n)
n∈N
en
{0, 1}Z
denida por
n es par
n es impar
si
si
Dispongamos los términos encolumnados, como antes:
x(0)
x(1)
x(2)
x(3)
−4 −3 −2 −1 0 1 2 3
0
0
0
1 0 0 0 1
0
1
0
1 0 1 0 1
0
0
0
1 0 0 0 1
0
1
0
1 0 1 0 1
···
···
···
···
4
0
0
0
0
···
···
···
···
.
.
.
1,
Aquí vemos que la coordenada
tural y
a
en el alfabeto
{0, 1},
por ejemplo, no se estabiliza nunca: para cualquier N na(n)
n > N tal que x1 6= a. Entonces, esta sucesión no es
existe
convergente.
{xn }n∈N y {zk }k∈N dos sucesiones en el espacio métrico (X, d). Se
{zk }k∈N es subsucesión de {xn }n∈N si existe una sucesión de números naturales
estrictamente creciente {nk }k∈N tal que para todo k ∈ N, es zk = xnk .
Definición 4.11. Sean
dice que
(X, d) un espacio métrico. Un subconjunto K
K posee subsucesión convergente en K .
Definición 4.12. Sea
si toda sucesión en
Es bien sabido que un subconjunto
que unidos cubren a
K
K
de
X
se dice
compacto
es compacto si, y sólo si, cualquier familia de abiertos
posee una subfamilia
nita
que también cubre a
K.
Además, todo
subconjunto compacto de un espacio métrico es un conjunto cerrado, y si el espacio métrico es
compacto, entonces la familia de los subconjuntos compactos del espacio es precisamente la de
los subconjuntos cerrados.
El siguiente resultado muestra que cualquier espacio shift (en particular la full shift) es
compacto para la métrica usual.
44
4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT
Sea X un espacio shift con la métrica usual. Entonces X es un subconjunto compacto de A .
(n) Demostración. Sea
x
una sucesión en X . Ya que A es un conjunto nito, debe
n∈N
existir a0 ∈ A y un subconjunto innito B0 de números naturales tal que para todo n ∈ B0 ,
(n)
x0 = a0 . Elijamos cualquier n0 ∈ B0 . Como A3 es nito, deben existir a−1 y a1 en A,
(n)
y un subconjunto innito B1 ⊆ B0 tal que para todo n ∈ B1 , x[−1,1] = a−1 a0 a1 . Elijamos
n1 ∈ B1 tal que n1 > n0 (tal elección es posible, pues B1 es un conjunto innito de números naturales, y por tanto no acotado). Siguiendo de esta manera, para cada k ∈ N, como
A2k+1 es nito, deben existir a−k y ak en A, y un subconjunto innito Bk ⊆ Bk−1 tal que
(n)
para todo n ∈ Bk , x[−k,k] = a−k · · · a0 · · · ak . Elijamos nk ∈ Bk tal que nk > nk−1 . De este modo, hemos denido (inductivamente) a−k , ak y nk para todo k ∈ N. Como {nk }k∈N es
(n ) (n) creciente, x k
es subsucesión de x
. denamos x = (ak )k∈Z . Dado que todo blok∈N
n∈N
(nk )
que de x ocurre en algún x
∈ X , tenemos que x pertenece al espacio shift X . Además,
lı́mk→∞ x(nk ) = x, pues dado K ∈ N, tomando N = K , tenemos que para todo k ≥ N es
(nk )
= a−K a−K+1 · · · a0 · · · aK−1 aK = x[−K,K] . Entonces X es compacto.
x[−K,K]
Proposición 4.13.
Z
La sola compacidad no caracteriza completamente a los espacios shift: por ejemplo, el con∞
junto unitario {(01) } es un subconjunto compacto de la full {0, 1}-shift (como cualquier
conjunto nito de cualquier espacio métrico) pero no es un espacio shift pues carece de la
shift-invariancia. Precisamente, compacidad más shift-invariancia equivalen a tener carácter de
espacio shift.
Un subconjunto de AZ es un espacio shift si, y sólo si, es compacto (para
la métrica usual de los espacios shift) y shift-invariante.
Teorema 4.14.
Demostración. La shift-invariancia de un espacio shift fue demostrada en el primer ca-
pítulo, y la compacidad en la Proposición 4.13.
Z
es un subconjunto compacto y shift-invariante de A .
c
c
Por ser compacto, X es cerrado, y entonces X es abierto. De allí que para cada y ∈ X existe
c
K (y) ∈ N tal que B2−K(y) (y) está contenido en X . Tomemos F = y[−K(y),K(y)] : y ∈ X c , y
Recíprocamente, supongamos que
veriquemos que
X
X = XF .
c
x ∈ X , entonces x[−K(x),K(x)] ∈ F , de donde x ∈
/ XF . Luego, XF ⊆ X .
Si x ∈
/ XF , debe existir u ∈ F tal que u v x. Por denición de F , u debe ser de longitud
impar, es decir, |u| = 2n + 1 para algún n ∈ N. Entonces u ocurre en x desde alguna
0
m+n
posición m ∈ Z, es decir, x[m,m+2n] = u. Llamando x = σ
(x), es x0[−n,n] = u. Como
u ∈ F , hay un y ∈ X c tal que y[−K(y),K(y)] = u, debiendo entonces ser K(y) = n. Pero
0
0
c
0
entonces x[−n,n] = y[−n,n] , de donde x ∈ B2−K(y) (y) ⊆ X , o sea, x ∈
/ X . Y, por la shift
invariancia, x ∈
/ X . Luego, X ⊆ XF .
Si
3.
AZ
Cilindros. Conexidad
puede ser visto como el producto cartesiano innito
cartesiano, se dene un
cilindro
como un subconjunto
C
Xi∈Z A. Como en cualquier producto
del producto para el cual un número
nito de coordenadas están jas. En el caso particular de los espacios shift, nos van a interesar
los cilindros en que un número nito de coordenadas consecutivas están jas. Formalmente:
A, u ∈ A∗ y k ∈ Z. El
cilindro en X asociado al bloque u en la posición k es el conjunto CkX (u) denido por
CkX (u) = x ∈ X : x[k,k+|u|−1] = u
Definición 4.15. Sea
A
un alfabeto,
X
un espacio shift sobre
4. CONTINUIDAD
45
X , el cilindro asociado a u en la posición k es el conjunto de
puntos del espacio X tales que el bloque u ocurre en la posición k . Obsérvese que para cualquier
X
n
/ B (X).
(u). Además, CkX (u) = ∅ si, y sólo si, u ∈
n ∈ Z, es σX
CkX (u) = Ck−n
Si x es un punto del espacio shift X y ε es un real positivo, entonces
n
o
Bε (x) = y ∈ X : x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c] = C−Xblog 1 c x[−blog 1 c,blog 1 c]
En palabras, en el espacio shift
ε
En particular, para
k ∈ N,
ε
ε
ε
ε
ε
ε
se tiene que
X
B2−k (x) = y ∈ X : y[−k,k] = x[−k,k] = C−k
x[−k,k]
Como vemos, los entornos en un espacio shift son cilindros. La recíproca no es cierta en general:
no todo cilindro es un entorno. Sin embargo, todo cilindro es un conjunto abierto. En efecto,
X
sea x ∈ Ck (u). Tomando N = máx {|k| , |k + |u| − 1|}, se tiene que −N ≤ k ≤ k + |u| − 1 ≤ N ,
de modo que
X
B2−N (x) = C−N
x[−N,N ] = y ∈ X : y[−N,N ] = x[−N,N ]
⊆ y ∈ X : y[k,k+|u|−1] = x[k,k+|u|−1] = CkX (u)
Pero además los cilindros son cerrados, pues
c
= x ∈ X : x[k,k+|u|−1] 6= u =
CkX (u)
[
x ∈ X : x[k,k+|u|−1] = v
v∈A|u| −{u}
[
=
CkX (v)
v∈A|u| −{u}
Es decir, el complemento de un cilindro es una unión de conjuntos abiertos, y por lo tanto es
un conjunto abierto; luego, el cilindro es cerrado.
Entonces, los cilindros en un espacio shift son conjuntos a la vez abiertos y cerrados. Esto
revela otra característica topológica de los espacios shift: son conjuntos
nexos.
totalmente disco-
Recordamos que una forma de caracterizar a los conjuntos disconexos de un espacio
métrico es como aquellos conjuntos que poseen un subconjunto propio no vacío que es a la vez
abierto y cerrado. Y un conjunto totalmente disconexo es aquel para el cual todo subconjunto
de más de un punto es disconexo. El conjunto clásico de Cantor en la recta real tiene esta
misma estructura: se trata de una nube de puntos no aislados en la cual ningún par de puntos
distintos pertenece a una misma pieza conexa.
4.
Definición 4.16. Sean
se dice
(X, dX )
continua en x ∈ X
e
Continuidad
(Y, dY )
φ:X →Y
lı́mn→∞ xn = x, se
dos espacios métricos. Una función
si para toda sucesión
{xn }n∈N
en
X
tal que
lı́mn→∞ φ (xn ) = φ (x). Si A ⊆ X , φ se dice continua en A si φ es continua en cada
φ es continua en X , biyectiva y además su función inversa es también continua, φ se
denomina un homeomorsmo entre X e Y , y los espacios X e Y se dicen homeomorfos.
tiene que
x ∈ A.
Si
Una función entre dos espacios métricos es continua en todo su dominio si, y sólo si, la
preimagen de cualquier subconjunto abierto del codominio es un subconjunto abierto del dominio. La composición de funciones continuas es también una función continua.
La denición de continuidad que hemos dado corresponde en realidad a la denición de la
continuidad secuencial o sucesional, y equivale a la clásica denición ε − δ de continuidad: φ
es continua en x si ∀ε > 0, ∃δ > 0 : dX (y, x) < δ ⇒ dY (φ (y) , φ (x)) < ε. Pero la continuidad
desde el punto de vista de las sucesiones es más fácil de manejar cuando el espacio métrico es
un espacio shift, ya que tenemos completamente caracterizadas a las sucesiones que convergen
en un espacio shift.
Todo código de ventana deslizante entre dos espacios shift es una función continua en todo su dominio.
Proposición 4.17.
46
4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT
Y dos espacios shift yφ : X → Y un CVD inducido por
Φ con memoria y anticipación L ≥ 0. Sean x ∈ X y x(n) n∈N una sucesión en X tal que
lı́mn→∞ x(n) = x. Debemos ver que ∀K ∈ N, ∃N ∈ N : ∀n ≥ N, φx(n) [−K,K] = (φx)[−K,K] .
(n) Sea K ∈ N. Por la hipótesis de convergencia de x
a x, tenemos que existe N ∈ N tal
n∈N
(n)
(n)
que ∀n ≥ N, x[−K−L,K+L] = x[−K−L,K+L] . Veamos que para todo n ≥ N es φx
=
[−K,K]
(φx)[−K,K] : si i es un entero tal que −K ≤ i ≤ K , será −K − L ≤ i − L ≤ i + L ≤ K + L, por
n
lo que x[i−L,i+L] = x[i−L,i+L] , y entonces
(n)
φx(n) i = Φ x[i−L,i+L] = Φ x[i−L,i+L] = (φx)i
(n)
Luego, lı́mn→∞ φ x
= φ (x), de donde se deduce que φ es continua en x, y ya que x es
arbitrario, φ es continua en X .
Demostración. Sean
X
e
La sola continuidad de una función entre dos espacios shift no garantiza que sea un CVD.
Hace falta algo más: la conmutabilidad de la función con las shifts de los respectivos espacios.
Este resultado se obtuvo por Hedlund y otros en el año 1969. Antes de demostrarlo, enunciemos
algunos resultados conocidos de la teoría general de espacios métricos, y cuyas demostraciones
quedan de ejercicio.
Proposición 4.18. Sean A y B dos subconjuntos compactos disjuntos no vacíos de un
espacio métrico. Existe un número real estrictamente positivo δ tal que para todos a ∈ A y
b ∈ B , d (a, b) ≥ δ .
Sea {Ak }nk=1 una familia nita de subconjuntos compactos no vacíos de
un espacio métrico, dos a dos disjuntos. Existe δ > 0 tal que si x ∈ Ai e y ∈ Aj con i 6= j ,
entonces d (x, y) ≥ δ .
Corolario 4.19.
Sea φ una función continua entre los espacios métricos X e Y , con
X compacto, y sea F un subconjunto compacto de Y . Entonces, φ−1 (F ) es un subconjunto
compacto de X .
Proposición 4.20.
Teorema 4.21.
(Curtis, Lyndon, Hedlund) Sean X e Y dos espacios shift, y φ una
función de X en Y . φ es un código de ventana deslizante si, y sólo si, φ es una función continua
tal que φ ◦ σX = σY ◦ φ.
Demostración. Sabemos, de los primeros capítulos, que si
las
σ,
y la Proposición 4.17 muestra que
φ
φ
es un CVD, conmuta con
es continua.
φ es un CVD si, y sólo si,
x[−N,N ] . El hecho de conmutar
con σ lo tenemos por hipótesis, así que sólo resta probar la existencia de un tal N , para lo
cual usaremos la hipótesis de la continuidad de φ. Sea U = B1 (φ (X)), el conjunto de símbolos
que aparecen en los transformados de los puntos de X . Obviamente, U es un subconjunto
Y
del alfabeto de Y . Para cada b ∈ U , el cilindro C0 (b) es un subconjunto cerrado de Y , y
Y
como Y es compacto, C0 (b) es compacto. Además, si b y c son elementos de U con b 6= c, es
Y
Y
C0 (b) ∩ C0 (c) = ∅. Para cada b ∈ U , hagamos Eb = φ−1 C0Y (b) . Por su denición y por la
Proposición 4.20, cada Eb es un subconjunto compacto no vacío de X , y si b 6= c, Eb ∩ Ec = ∅,
Y
pues si x ∈ Eb , es φ (x) ∈ C0 (b), luego φ (x) ∈
/ C0Y (c), y entonces x ∈
/ Ec . Además, cada x ∈ X
pertenece a un único Eb . Así que la familia {Eb }b∈U es una familia de conjuntos compactos que
constituye una partición para X . Luego, por el Corolario 4.19, existe δ > 0 tal que d (x, y) ≥ δ
toda vez que x ∈ Eb e y ∈ Ec con b 6= c. Tomemos N ∈ N sucientemente grande como para
−N
que 2
< δ . Si x e y son puntos de X tales que x[−N,N ] = y[−N,N ] , entonces d (x, y) < 2−N < δ ,
por lo que x e y deben estar en un mismo Eb . Esto signica que existe b ∈ U tal que φ (x) y
φ (y) están ambos en C0Y (b), o sea, φ (x)0 = b = φ (y)0 . Pero esto quiere decir que la coordenada
0 del transformado por φ de x ∈ X depende sólo de x[−N,N ] , como queríamos probar.
Para la vuelta, recordemos otra caracterización de los CVD:
conmuta con las
σ
y existe un
N ∈ N tal que φ (x)0
es función de
5. SISTEMAS DINÁMICOS
5.
47
Sistemas dinámicos
Los sistemas físicos pueden usualmente describirse a través de una cantidad nita de mediciones. Por ejemplo, un péndulo oscilante constituye un sistema que queda totalmente caracterizado por el ángulo respecto de la vertical y por la velocidad angular. Un gas se describe a través
de la posición y momentum de cada molécula. A medida que transcurre el tiempo, esos valores
cambian. Si denotamos por
M
al conjunto de todos los valores posibles para un dado sistema,
el estado del mismo en un instante dado corresponde a uno de esos estados. Imaginemos que
lmamos el sistema y que luego observamos los cuadros que corresponden al instante
luego a
t=1
seg,
t=2
t = 0,
seg, etc. Cada cuadro depende del anterior, de acuerdo a la manera
en que el sistema evolucione durante cada intervalo de un segundo. Si suponemos que las leyes
que gobiernan el sistema no cambian con el tiempo, la dependencia de cada cuadro respecto
del anterior se traduce en una función
estado del sistema en
t = 0, T (x0 )
T :M →M
x0 es el
t = 1, T ◦ T (x0 ) en t = 2,
que usualmente es continua. Así, si
describe el estado del sistema en
y así. Por lo tanto, estudiar el comportamiento del sistema en el tiempo se reduce a estudiar
las iteraciones de T , es decir, la composición de T consigo misma. Para n ≥ 0, designaremos
n
0
por T
a la composición de T consigo misma n veces. Es decir, T es la identidad, y, para
n > 0, T n = T ◦ T n−1 . Notar que T n es continua si T lo es, pues la continuidad se preserva por
composición.
sistema dinámico
Definición 4.22. Un
métrico compacto y
T
(M, T ), en donde M es un espacio
M . Si T es un homeomorsmo, el
es un par
es una transformación continua en
sistema dinámico se dice
inversible.
Para nosotros, los sistemas dinámicos más interesantes serán aquellos en los que el conjunto
M
X
sea un espacio shift. En particular, si
dinámico que denominamos
(X, φ)
es un espacio shift, el par
sistema dinámico shift.
φ
Si
(X, σX ) es un sistema
X en X , el par
es un CVD de
es también un sistema dinámico.
(M, T ),
Definición 4.23. Para un sistema dinámico
sucesión
n
{T x}n∈N .
la
Si el sistema es inversible, la órbita de
x
órbita
de un punto x ∈
n
es la sucesión {T x}n∈Z .
M
es la
punto periódico es un punto
x ∈ M tal que T x = x para algún n > 0, y tal n se llama un período de x. Si x es un punto
n
periódico, el menor de los n > 0 tales que T x = x se llama período mínimo de x. Una
n
órbita {T x} es periódica si x es un punto periódico.
Definición 4.24. Para un sistema dinámico
(M, T ),
un
n
Un conjunto de problemas que interesan en relación a estos tópicos involucra el estudio
del comportamiento de la órbita de puntos y de conjuntos en un dado sistema dinámico. Por
ejemplo, si se tiene un sistema dinámico
(M, T )
en particular, puede interesar saber cómo se
distribuyen las órbitas de los puntos de un dado subconjunto abierto
U
de
M,
o si el conjunto
de puntos periódicos del espacio es denso.
Otro conjunto de problemas tiene que ver con problemas de clasicación de sistemas dinámicos: ¾Cuándo dos sistemas dinámicos aparentemente distintos son el mismo sistema?
Definición 4.25. Sean
(M, T )
a
(N, S)
(M, T )
y
(N, S) dos sistemas dinámicos. Un homomorsmo θ de
θ : M → N tal que θ ◦ T = S ◦ θ. Los homomorsmos
es una función continua
de un sistema dinámico a sí mismo se denominan
Una simple inducción muestra que si
θ
endomorsmos del sistema dinámico.
es un homomorsmo de
n
n
para cualquier entero positivo n, se tiene que θ ◦ T = S ◦ θ .
(M, T )
a
(N, S),
entonces,
Notemos que, debido al Teorema de Curtis, Lyndon y Hedlund, los homomorsmos entre
los sistemas dinámicos shift son precisamente los códigos de ventana deslizante.
inmersión es un homomorsmo inyectivo, un factor es un homouna conjugación topológica es un homomorsmo biyectivo. Dos
Definición 4.26. Una
morsmo sobreyectivo, y
48
4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT
sistemas dinámicos se dicen
topológicamente conjugados si existe una conjugación topoló-
gica entre ellos.
Las nociones de inmersión, factor y conjugación conducen a problemas de clasicación de
sistemas dinámicos. Dos sistemas dinámicos conjugados son esencialmente el mismo, pero la
cuestión de si dos dados sistemas dinámicos son conjugados, o uno factor del otro, o uno inmerso
en el otro, puede ser muy difícil de resolver.
Para detectar si dos sistemas dinámicos
no
son conjugados, una estrategia es la siguiente:
asociemos a cada sistema dinámico con alguna entidad (que puede ser un número, un conjunto,
o lo que sea) de manera que dos sistemas conjugados tengan asociados la misma entidad. Luego,
dados dos sistemas dinámicos en particular, obtengamos las entidades asociadas respectivas, y
si éstas no coinciden sabremos que los sistemas no son conjugados (aunque puede ocurrir que
no podamos deducir nada si vemos que ambas entidades coinciden). Dichas entidades reciben
el nombre de
invariantes por conjugación.
Una de tales entidades es el conjunto de puntos periódicos de período
n,
donde
n
es un
natural jo. Ya hemos visto, en el capítulo primero, la demostración para el caso en que los
sistemas involucrados son sistemas dinámicos shift. Veamos el resultado en general.
Proposición 4.27. Sea n un entero positivo. La cantidad de puntos periódicos de período
n es un invariante por conjugación.
(M, T ) y (N, S) sistemas dinámicos conjugados, y θ : M → N una
conjugación. Denotemos por pn (T ) al cardinal del conjunto de puntos periódicos de período n
para T , y pn (S) al de los puntos periódicos para S . Para x ∈ M , se tiene que
Demostración. Sean
T n x = x ⇔ θ (T n x) = θ (x) ⇔ S n (θ (x)) = θ (x)
θ establece
pn (T ) = pn (S).
de modo que
una biyección entre los puntos jos de
Tn
y los de
S n.
Por lo tanto,
Un argumento similar al anterior muestra que el número de puntos periódicos de período
mínimo
n
es también invariante por conjugación.
Veamos ahora otro invariante por conjugación.
(M, T ) es topológicamente transitivo
V , existe n > 0 tal que (T n U ) ∩ V 6= ∅.
Definición 4.28. Un sistema dinámico
cualquier par de abiertos no vacíos
U
y
si para
Es decir, un sistema topológicamente transitivo mueve a cada conjunto abierto lo suciente
como para que llegue a tocar a cualquier otro conjunto abierto, en alguna iteración. La denición implica que ese toque se producirá una cantidad innita de veces, según demostraremos
a continuación.
Sean (M, T ) un sistema topológicamente transitivo, U y V dos conjuntos abiertos no vacíos y m un natural arbitrario. Existe n > m tal que (T n U ) ∩ V 6= ∅.
Lema 4.29.
W = (T m )−1 (V ).
T continua en M , W es
k
abierto, así que, por hipótesis de transitividad topológica, existe k > 0 tal que T U ∩ W 6= ∅.
−1
k
m
Eso quiere decir que existe z ∈ T U tal que z ∈ (T )
(V ); lo primero signica que existe
k
m
x ∈ U tal que T x = z , y lo segundo
dice que T z ∈ V . Poniendo n = m + k , tendremos que
n > m y que T n x = T m T k x = T m z ∈ V . Es decir, existe x ∈ U tal que T n x ∈ V , de donde
(T n U ) ∩ V 6= ∅.
Demostración. Sea
Ya que
V
es abierto y
De manera directa, se desprende de allí el siguiente resultado.
Sean (M, T ) un sistema topológicamente transitivo, y U y V dos conjuntos abiertos no vacíos. Existe una sucesión {nk }k∈N de naturales estrictamente creciente tal
que para todo k ∈ N, es (T nk U ) ∩ V 6= ∅.
Proposición 4.30.
Proposición 4.31.
La transitividad topológica es invariante por conjugación.
5. SISTEMAS DINÁMICOS
49
(M, T ) y (N, S) sistemas dinámicos conjugados, con (M, T ) topológicamente transitivo, y θ : M → N una conjugación. Sean U y V abiertos en N . Denotemos
U 0 = θ−1 (U ) y V 0 = θ−1 (V ). Como θ es continua, U 0 y V 0 son abiertos en M , por lo que existe
n > 0 tal que (T n U 0 ) ∩ V 0 6= ∅, es decir, (T n (θ−1 (U ))) ∩ θ−1 (V ) 6= ∅. Por lo tanto, siendo θ una
Demostración. Sean
biyección, tenemos que
∅=
6 θ
Entonces,
(N, S)
T n θ−1 (U ) ∩ θ−1 (V ) = θ T n θ−1 (U ) ∩ θ θ−1 (V )
= S n θ θ−1 (U ) ∩ V = (S n U ) ∩ V
es también topológicamente transitivo.
En el primer capítulo, hemos denido irreducibilidad: un espacio shift
para cualquier par de palabras
tal que
uvw ∈ B (X).
u
w
y
en el lenguaje, hay una palabra
v
X
es irreducible si
también en
B (X)
Veremos ahora que en el contexto de los sistemas dinámicos shift, la
irreducibilidad de un espacio shift
X
equivale a la transitividad topológica del sistema dinámico
(X, σX ).
Proposición 4.32. Un sistema dinámico shift es topológicamente transitivo si, y sólo si, el
espacio shift es irreducible.
(X, σX ) es topológicamente
X
X
transitivo. Sean u y w en B (X). Hagamos U = C0 (u) y V = C0 (w). Ya que U y V son
n
abiertos y no vacíos, por Lema 4.29, existe n > |u| tal que (σX U ) ∩ V 6= ∅, es decir, hay un
n
X
x ∈ X tal que x ∈ σX
C0X (u) = C−n
(u) y x ∈ C0X (w). Es decir que x[−n,−n+|u|−1] = u y
x[0,|w|−1] = w. Como n > |u|, es −n + |u| − 1 < 0, de modo que podemos tomar v = x[−n+|u|,−1]
Demostración. Supongamos que el sistema dinámico shift
uvw ∈ B (X).
X es un espacio shift irreducible, y sean U y V dos abiertos
no vacíos en el espacio métrico X . Sean x ∈ U , y ∈ V , y tomemos k, l ∈ N tal que B2−k (x) ⊆ U
X
y B2−l (y) ⊆ V . Hagamos u = x[−k,k] y w = y[−l,l] . Sabemos que B2−k (x) = C−k (u) y que
X
B2−l (y) = C−l
(w). Como X es irreducible, existe v ∈ B (X) tal que uvw ∈ B (X). Tomemos
X
z ∈ X tal que z[−k,−k+|u|+|v|+|w|−1] = uvw. Tenemos que z ∈ C−k
(u) ⊆ U , y además, puesto que
|u| = 2k + 1 y |w| = 2l + 1,
k−|u|−|v|−l
−k−1−|v|−l
−k−1−|v|−l
X
X
X
z ∈ C−k+|u|+|v|
(w) = σX
C−l
(w) = σX
C−l
(w) ⊆ σX
(V )
para ver que
uvw v x,
es decir,
Recíprocamente, supongamos que
Es decir, z
n
que (σX U )
k+l+|v|+1
∈ U y σX
∩ V 6= ∅.
(z) ∈ V .
Por lo tanto, tomando
n = k + l + |v| + 1 > 0,
tenemos
De nuestros resultados anteriores, deducimos que, en el universo de los espacios shift, el
carácter de irreducible es invariante por conjugación.
Teorema 4.33.
o ninguno lo es.
Sean X e Y espacios shift conjugados. Entonces o ambos son irreducibles
(X, σX ) es topológicamente transitivo (prop.
4.32), lo que, por ser
e Y conjugados, equivale a que (Y, σY ) es topológicamente transitivo
(prop. 4.31), lo que ocurre si, y sólo si, Y es irreducible.
Demostración.
X
X
es irreducible si, y sólo si,
En el próximo capítulo deniremos e investigaremos un importante invariante por conjugación entre espacios shift: la entropía.
Capítulo 5
ENTROPÍA
X es observar la cantidad de los
n en el lenguaje de X a medida que n crece; cuanto más grande es el número
de n-bloques en B(X), más complejidad tiene el espacio X . Veremos que, conforme n aumenta,
|Bn (X)| crece exponencialmente, es decir, se comporta como λn para algún real no negativo λ.
Poniendo c = log λ (recordando nuestra convención de que log signica logaritmo en base 2),
tendremos que, para n sucientemente grande, es |Bn (X)| ∼
= 2cn , de modo que c ∼
= n1 log |Bn (X)|.
Esa tasa de crecimiento c, en el límite cuando n → ∞, recibe el nombre de entropía del espacio
shift X , y es un invariante por conjugación entre espacios shift. El objetivo de este capítulo es
Una manera de medir la complejidad de un espacio shift
bloques de largo
estudiar propiedades de esta entidad, y encontrar métodos para saber calcularla para distintas
clases de espacios shift.
1.
Definición 5.1. Sea
X
Denición y propiedades básicas
un espacio shift. La
entropía de X
se dene como
1
log |Bn (X)|
n→∞ n
h(X) = lı́m
con la convención de que
log 0 = −∞.
X = AZ , para todo n ∈ N es Bn (X) = An , así que log |Bn (X)| = log |An| =
log |A| = n log |A|. Dividiendo por n y tomando límite cuando n → ∞, vemos que h AZ =
log |A|. Es decir, la entropía de un full shift es el logaritmo de la cantidad de letras de su
alfabeto. De la denición, se desprende también directamente que h(∅) = −∞.
Por ejemplo, si
n
Nuestra primera tarea es ver que la entropía es un número bien denido, para lo cual
debemos garantizar que ese límite que la dene efectivamente existe. Primero observemos que,
siendo
X
no vacío, es
|Bn (X)| ≥ 1
para todo
n ∈ N,
así que el límite, de existir, es un real no
negativo.
Sean
m, n ∈ N y sea u ∈ Bm+n (X). Tal u debe ser la concatenación de un bloque v ∈ Bm (X)
w ∈ Bn (X). Por lo tanto, Bm+n (X) ⊆ {vw : v ∈ Bm (X), w ∈ Bn (X)} (la contención
y un bloque
puede ser estricta, ya que la concatenación de dos bloques en el lenguaje de un espacio shift no
necesariamente produce otro bloque en ese lenguaje). Entonces, por el principio fundamental
del conteo, ocurre que
|Bm+n (X)| ≤ |Bm (X)| · |Bn (X)|
En consecuencia,
log |Bm+n (X)| ≤ log |Bm (X)| + log |Bn (X)|
Poniendo an = log |Bn (X)| para cada n ∈ N, resulta que la sucesión {an }n∈N es una sucesión
subaditiva de reales no negativos, es decir, am+n ≤ am + an para todos m, n ∈ N. Una simple
+
inducción muestra que si an es cualquier sucesión subaditiva en R0 , entonces, para enteros
positivos c y k cualesquiera, ack ≤ cak y, en particular, ar ≤ ra1 para cualquier entero positivo
r.
+
Las sucesiones subaditivas en R0 poseen una interesante propiedad que establecemos en el
siguiente resultado.
Sea {an }n∈N una sucesión subaditiva de reales no negativos. Entonces lı́mn→∞
existe y vale ı́nf n≥1 ann .
Lema 5.2.
50
an
n
1. DEFINICIÓN Y PROPIEDADES BÁSICAS
Demostración. Designemos
n ≥ 1.
Debemos ver que
α = ı́nf n≥1
a
an
, teniéndose entonces que n
n
n
51
≥ α
para todo
an ∀ε > 0, ∃N : ∀n ≥ N, α − < ε
n
k ≥ 1 tal que akk ≤ α + 2ε .
Por otro lado, sea m cualquier entero positivo mayor que 2a1 /ε. Hagamos N = mk . Sea n ≥ N .
Por el teorema de la división, existen naturales c y r tales que n = ck + r con 0 ≤ r < k . Ya
que (c + 1)k > n ≥ N = mk , tenemos que (c + 1) > m, por lo que c ≥ m ≥ 1. Si fuese r = 0,
Consideremos entonces
ε>0
tendremos
jo. Por propiedad de ínmo, existe
an
ack
cak
ak
ε
=
≤
=
≤ α + < α + ε,
n
ck
ck
k
2
r > 0, tendremos
an
ack+r
ack + ar
cak + ra1
ak a1
ak a1
ε ε
=
≤
≤
<
+
≤
+
<α+ + =α+ε
n
ck + r
ck
ck
k
c
k
m
2 2
a
a
decir, se cumple en cualquier caso que α − n = n − α < ε.
mientras que si fuese
Es
n
Aplicando el lema 5.2 al hecho de que
n
{log |Bn (X)|}n∈N
es una sucesión subaditiva de reales
no negativos, se deduce inmediatamente que la entropía de cualquier espacio shift es un número
real no negativo bien denido.
X e Y son espacios shift con X ⊆ Y , tendremos
h(X) ≤ h(Y ), pues, para todo n ∈ N, es Bn (X) ⊆ Bn (Y ), de modo que |Bn (X)| ≤ |Bn (Y )|;
aplicando logaritmos, dividiendo por n y tomando límite cuando n → ∞ tenemos el resultado.
De la denición, resulta inmediato que si
que
Combinado con lo que ya sabemos de la entropía de los full shifts, esto nos dice que la entropía
Z
de un espacio shift X ⊆ A no supera a log |A|.
Investigaremos ahora otras propiedades de la entropía.
Proposición 5.3.
Sean X, Y espacios shift. Si Y es factor de X , entonces h(Y ) ≤ h(X).
φ : X → Y un código de ventana deslizante factor, inducido por Φ
con memoria m y anticipación k . Cualquier bloque de tamaño n en el lenguaje de Y es la imagen
de algún bloque de tamaño m + n + k en el lenguaje de X , por lo que |Bn (Y )| ≤ |Bm+n+k (X)|.
Demostración. Sea
Por lo tanto,
1
1
log |Bn (Y )| ≤ lı́m log |Bm+n+k (X)|
n→∞ n
n→∞ n
m+n+k
1
= lı́m
log |Bm+n+k (X)|
n→∞
n
m+n+k
m+n+k
1
= lı́m
lı́m
log |Bm+n+k (X)| = h(X)
n→∞
n→∞
n
m+n+k
h(Y ) =
lı́m
La entropía es un invariante por conjugación. Es decir, si X e Y son
espacios shift conjugados, entonces h(X) = h(Y ).
Corolario 5.4.
Demostración. Siendo
h(X) ≤ h(Y )
y
X
h(Y ) ≤ h(X),
e
Y
conjugados, cada uno de ellos es un factor del otro, así que
de donde se sigue el resultado.
Esto permite ver rápidamente que dos full shifts con distinta cantidad de letras en sus
alfabetos no pueden ser conjugados, pues sus entropías son diferentes. Debe notarse que, sin
∞
∞ ∞
embargo, la entropía no es un invariante completo. Por ejemplo, si X = {0 } e Y = {0 , 1 },
ambos tienen entropía 0 (pruébelo) pero no son conjugados pues no poseen la misma cantidad
de puntos jos para
Corolario 5.5.
h(Y ).
σ.
Si X es un espacio shift inmerso en un espacio shift Y , entonces h(X) ≤
52
5. ENTROPÍA
Demostración. Sea
φ(X),
que es un subshift
φ : X → Y una inmersión. Entonces X
de Y . Luego, h(X) = h(φ(X)) ≤ h(Y ).
es conjugado al espacio shift
Dedicaremos bastante de este capítulo a establecer métodos de cálculo de la entropía de
shifts de aristas. Ya que cualquier shift de tipo nito es conjugado a uno de aristas, tendremos
entonces un método para calcular la entropía de cualquier shift de tipo nito, y también la de
cualquier shift sóco, en base al siguiente resultado.
Proposición 5.6.
h (XG ) = h (XG ).
Sea G = (G, L) un grafo rotulado, con L resolvente a derecha. Entonces,
L∞ es código factor de XG a XG , tenemos que h (XG ) ≤ h (XG ).
G tiene k vértices. Cualquier bloque en B (XG ) tiene a lo sumo k presentaciones (pues hay a lo sumo una presentación comenzando en cada vértice). Luego, |Bn (XG )| ≤
k |Bn (XG )|, así que log |Bn (XG )| ≤ log k + log |Bn (XG )|. Dividiendo por n y tomando límite
cuando n → ∞, concluimos que h (XG ) ≤ h (XG ), y el resultado queda establecido.
Demostración. Como
Supongamos que
2.
Cálculo de la entropía de shifts sócos irreducibles
Comenzaremos analizando métodos para calcular la entropía de shifts de aristas que sean
irreducibles. Convendrá, a tal efecto, realizar algunas convenciones sobre notación matricial.
estrictamente positiva (A > 0)
si todos sus coecientes son positivos; similarmente, diremos que A es no negativa (A ≥ 0)
si todos sus coecientes son reales no negativos. Más generalmente, si A y B son matrices de
igual tamaño, escribimos A > B cuando cada coeciente de A es estrictamente mayor que el
respectivo coeciente de B ; escribimos A ≥ B cuando cada coeciente de A es mayor o igual
que el respectivo coeciente de B . Toda esta notación se aplica también a los vectores (por ser
Diremos que una matriz
A
(no necesariamente cuadrada) es
casos particulares de matrices rectangulares).
G es esencial si desde cualquier vértice sale al menos una arista, y a
G
no tiene las nulas ni columnas nulas. Por otro lado, un grafo G es irreducible si desde cualquier
vértice hay camino en G hasta cualquier otro vértice. Esto equivale a que para cualquier pareja
n
de vértices I, J , existe n ≥ 0 tal que (A )IJ > 0. Todo esto motiva las siguientes deniciones:
Recordemos que un grafo
cualquier vértice llega al menos una arista. Esto se traduce en que la matriz de adyacencia de
Definición 5.7. Sea
nulas ni columnas nulas.
A ≥ 0 una matriz cuadrada. A se dice esencial si
A se dice irreducible si ∀I, J, ∃n ≥ 0 : (An )IJ > 0.
no contiene las
Notar que un grafo es esencial si, y sólo si, su matriz de adyacencia es esencial. Similarmente,
un grafo es irreducible si, y sólo si, su matriz de adyacencia es irreducible.
0
Convendremos que A = Id|A|×|A| cualquiera sea la matriz cuadrada A. Como caso particu0
lar, [0] = [1]; entonces, [0] es irreducible pero no esencial. Cualquier matriz distinta de [0] que
no sea esencial no puede ser irreducible, ya que si A tiene alguna la nula, la correspondiente
n
la de A (cualquiera sea n ≥ 1) es también nula (y análogamente si A tiene alguna columna
nula). Dicho de otro modo, toda matriz irreducible debe necesariamente ser esencial (salvo el
caso excepcional de la matriz
[0]).
La matriz de adyacencia es una valiosa herramienta para computar la entropía de shifts
G un grafo esencial de r vértices con matriz de adyacencia A. Sabemos que An
de aristas. Sea
contiene la información necesaria para calcular la cantidad de caminos de largo
la cantidad de bloques de tamaño
n
en el lenguaje de
|Bn (XG )| =
r X
r
X
n en G, es decir,
XG :
(An )IJ
I=1 J=1
Por lo tanto, para conocer la entropía de XG , debemos averiguar cómo van variando los coeAn conforme crece n. Veremos a continuación que, para ello, el conocimiento de los
cientes de
autovalores de
A
es fundamental.
2. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS IRREDUCIBLES
53
Sea A ≥ 0 una matriz r × r no nula que posee un autovector v > 0.
Entonces, el correspondiente autovalor λ es positivo, y existen constantes positivas c0 y d0 tales
que
r X
r
X
n
c0 λ ≤
(An )IJ ≤ d0 λn
Proposición 5.8.
I=1 J=1
En consecuencia, si G es un grafo cuya matriz de adyacencia es A, entonces h (XG ) = log λ.
Demostración. Como
Av = λv.
Ya que
A
v
es autovector correspondiente al autovalor
posee al menos un coeciente
de donde se deduce que
λ
AKL > 0,
es
(Av)K > 0,
se cumple que
es decir,
λvK > 0,
v
tiene todos sus coecientes positivos.
n
n
Una simple inducción muestra que, ya que Av = λv, se tiene que A v = λ v para cualquier
Pr
n
n
n ≥ 1. Entonces, para cualquier índice I , es (A v)I = (λ v)I , de donde J=1 (An )IJ vJ = λn vI .
De allí que
r X
r
r
X
X
n
n
(A )IJ vJ = λ
vI
I=1 J=1
I=1
Designemos
es positivo pues
λ,
c = mı́n{v1 , . . . , vr }
d = máx{v1 , . . . , vr }.
y
Notemos que tanto
c
como
d
son
estrictamente positivos.
Por un lado, tendremos que
r X
r
X
n
(A )IJ vJ ≥
I=1 J=1
r X
r
X
n
(A )IJ c = c
r X
r
X
I=1 J=1
(An )IJ
I=1 J=1
y que
n
λ
r
X
n
vI ≤ λ
I=1
Entonces
r
X
d = λn rd
I=1
r
r X
X
rd n
λ
c
(An )IJ ≤
I=1 J=1
Llamemos
d0 = rd/c,
resultando
d0 > 0
r, d
pues
y
c
son positivos.
Por otro lado, tendremos que
r X
r
X
n
(A )IJ vJ ≤
I=1 J=1
r X
r
X
n
(A )IJ d = d
I=1 J=1
r X
r
X
(An )IJ
I=1 J=1
y que
n
λ
r
X
vI ≥ λ
n
I=1
Entonces
r
X
c = λn rc
I=1
r
r X
X
(An )IJ ≥
I=1 J=1
Llamemos
c0 = rc/d,
, resultando
c0 > 0
pues
rc n
λ
d
r, d
y
c
son positivos.
Juntando las dos desigualdades de más arriba, tenemos que, para cualquier
c0 λ n ≤
r X
r
X
n ∈ N,
es
(An )IJ ≤ d0 λn
I=1 J=1
es un
PrG P
r
Si
I=1
grafo esencial que tiene matriz de adyacencia
n
J=1 (A )IJ .
A,
se cumple que
Por nuestro resultado anterior, esto signica que
c0 λn ≤ |Bn (XG )| ≤ d0 λn
|Bn (XG )| =
54
5. ENTROPÍA
de donde
Tomando límites
1
1
1
1
1
log c0 + n log λ ≤ log |Bn (XG )| ≤ log d0 + n log λ
n
n
n
n
n
cuando n → ∞, resulta h (XG )) = log λ.
Si una matriz no nula A a coecientes enteros admite un autovector
positivo, todos los autovectores positivos de ella corresponden a un mismo autovalor.
Corolario 5.9.
0
el shift de aristas correspondiente a A. Sean v, v autovectores
0
positivos correspondientes a autovalores λ, λ respectivamente. Aplicando la proposición 5.8,
0
0
concluimos que log λ = h (XG ) = log λ , de donde λ = λ .
Demostración. Sea
G
Dada una matriz A ≥ 0 que admite un autovector positivo v correspondiente al autovalor λ > 0, cualquier autovalor µ de A cumple que |µ| ≤ λ.
Corolario 5.10.
r el tamaño de A. Sean µ un autovalor de A y v0
µ. Como A v = µn v0 y A ≥ 0, es, por un lado,
r
r
r
r
X
X
X
X
n
n 0
n 0
n 0
|vI0 |
|(A v )I | =
|(µ v )I | =
|µ vI | = |µ|
Demostración. Sea
asociado a
un autovector
n 0
I=1
I=1
I=1
I=1
y, por otro lado,
r
r X
r X
r
r X
r
X
X
X
n
0 n
0
(A
)
v
≤
|(A
)
v
|
=
(An )IJ |vJ0 |
|(An v0 )I | =
IJ J IJ J
I=1
I=1 J=1
I=1 J=1
I=1 J=1
!
r
r
r
X
XX
|vI0 | d0 λn
(An )IJ ≤
≤ máx |vI0 |
r
X
1≤I≤r
donde
d0 > 0
I=1 J=1
I=1
es el garantizado en la proposición 5.8.
|µ|n ≤ d0 λn ,
Juntando todo esto, resulta que, para todo n ≥ 0, es
1/n
Como d0 > 0, es lı́mn→∞ d0
= 1, y entonces |µ| ≤ λ.
Dado un grafo esencial
XG
G
con matriz de adyacencia
A,
Teorema de PerronFrobenius,
1/n
|µ| ≤ d0 λ.
para poder calcular la entropía de
por aplicación de la proposición 5.8, necesitamos saber si
Para ello, contamos con el
es decir,
A
posee un autovector positivo.
que enunciaremos sin demostración
y que es válido para una clase especial de matrices que comprende a las matrices de adyacencia
de los grafos irreducibles.
Teorema 5.11.
(PerronFrobenius) Sea A ≥ 0 una matriz irreducible no nula. Entonces
A posee un autovector vA positivo con autovalor correspondiente λA positivo que es geométricamente y algebraicamente simple. Cualquier autovalor µ de A tiene módulo menor o igual que
λA , y cualquier autovector positivo de A es un múltiplo positivo de vA .
El autovalor λA del teorema anterior se denomina autovalor de Perron de A, y vA es
autovector de Perron de A. El teorema muestra que vA es único salvo multiplicación por
un
un
escalar.
Por combinación de la proposición 5.8 con el teorema de PerronFrobenius, obtenemos el
siguiente resultado principal.
Teorema 5.12.
1.
2.
Si G es un grafo irreducible con matriz de adyacencia A, entonces h(XG ) = log λA .
Si X es un shift de tipo nito irreducible de memoria M y G es el grafo esencial con
matriz de adyacencia A tal que X [M +1] = XG , entonces h(X) = log λA .
Demostración.
3. LOS PUNTOS PERÍODICOS Y LA ENTROPÍA
1. Como
G
es irreducible,
A
55
es irreducible, por lo que admite un autovector positivo que
λA . Entonces, por proposición 5.8, h(XG ) = log λA .
[M +1]
X es conjugado
a X
, siendo la entropía invariante por conjugación, es
[M +1]
= h(XG ). Como X es irreducible, también lo es X [M ] (teor. 4.33),
h(X) = h X
de donde G es irreducible, lo que implica que A también lo es. Entonces, por el inciso
anterior, h(X) = log λA .
corresponde a
2. Ya que
Sea X un shift sóco irreducible y G = (G, L) una presentación irreducible resolvente a derecha de X . Entonces h(X) = log λA , siendo A la matriz de adyacencia de
G.
Corolario 5.13.
Demostración. Por proposición 5.6,
el teorema 5.12,
h(XG ) = log λA
3.
h(X) = h(XG ) = h(XG ), y, siendo G irreducible, por
Los puntos períodicos y la entropía
Queremos ahora investigar cómo crece la cantidad de puntos periódicos de período
hay en un espacio shift
X,
a medida que crece
n.
X
un espacio shift y
la cantidad de puntos periódicos (para
σ)
n
que
Veremos que existe una vinculación entre la
tasa de crecimiento de esa cantidad y la entropía de
Definición 5.14. Sea
n
X.
un entero positivo. Designamos por
de período
n
que hay en
pn (X)
a
X.
Z
Por ejemplo, si X = {0, 1} y n es cualquier entero positivo, tomando cualquier bloque u ∈
An se tiene que u∞ es un punto periódico de X , y bloques diferentes generan puntos periódicos
n
diferentes, por lo que pn (X) = 2 . Como vemos, al igual que lo que ocurre con |Bn (X)|, pn (X)
puede crecer sin cota, por lo que resulta pertinente considerar la tasa de crecimiento de pn (X),
1
log pn (X), y ver qué ocurre con esta sucesión cuando n → ∞. Debe advertirse, desde
n
un comienzo, que puede no existir el límite de dicha sucesión, ni siquiera restringiendo X a la
es decir,
familia de los shifts de tipo nito.
Ejemplo 5.15. Sea
X
un shift de aristas con conjunto de vértices
total de 6 aristas, de las cuales una es un rulo en
I,
2 van de
J
a
K
y
{I, J, K} teniendo un
3 de K a J . Su matriz
de adyacencia es

1 0 0
A= 0 0 2 
0 3 0

An y sumamos
n/2
en cada paso los coecientes de su diagonal, obtenemos que, para n par, es pn (X) = 1 + 2 · 6
1
y, para n impar, es pn (X) = 1, así que la subsucesión de
log pn (X) correspondiente a los
n
√
términos pares tiende a log
6, y la correspondiente a los impares tiende a 0. Por lo tanto,
1
log
p
(X)
carece
de
límite.
n
n
Por la proposición 2.24, sabemos que
pn (X)
es la traza de
An .
Si computamos
1
log pn (X) puede no existir, consideraremos lı́m supn→∞ n1 log pn (X), recorn
dando que el límite superior de una sucesión es el mayor de sus puntos de acumulación, y
Ya que
lı́mn→∞
siempre existe (y coincide con el límite de la sucesión si éste existe).
Proposición 5.16.
Sea X un espacio shift. Entonces, lı́m supn→∞
Demostración. Cada punto
por lo que
x∈X
de período
n
1
n
log pn (X) ≤ h(X).
está determinado por
x[0,n−1] ∈ Bn (X),
pn (X) ≤ |Bn (X)|. En consecuencia,
1
1
1
lı́m sup log pn (X) ≤ lı́m sup log |Bn (X)| = lı́m log |Bn (X)| = h(X)
n→∞ n
n→∞ n
n→∞ n
56
5. ENTROPÍA
La proposición anterior muestra que la tasa de crecimiento de
X
pn (X)
tiene a la entropía de
como cota superior. Sin embargo, para muchos espacios shift esa tasa iguala a
Proposición 5.17.
h(X).
Si X es un shift de aristas irreducible, entonces lı́m supn→∞
G = (V, Σ, i, t)
J en G cualesquiera
Demostración. Sea
camino desde
I
hasta
N = máx {mı́n {|π| : π
I,J∈V
un grafo irreducible tal que
sean los vértices
camino desde
I
I, J ,
hasta
h(X).
1
n
log pn (X) =
X = XG .
Como hay
sea
J
en
G}}
I, J arbitrarios en G, hay un camino en G desde I hasta J de
N.
Sea π un bloque en Bn (X) (y, por lo tanto, un camino en G), y sea τ un camino en G desde
t(π) hasta i(π) con |τ | ≤ N . Entonces, πτ es ciclo en G, por lo que (πτ )∞ determina un punto
periódico en X , con período n + |τ | ≤ n + N . Así vemos cómo construir, para cada bloque en
Bn (X), un punto periódico en X cuyo período está entre n y n + N . Notar que dos bloques
diferentes en Bn (X) generan diferentes puntos periódicos. Por lo tanto,
Por lo tanto, dados vértices
longitud menor o igual que
|Bn (X)| ≤ pn (X) + pn+1 (X) + · · · + pn+N (X)
n, elijamos kn en el conjunto {0, 1, . . . , N }
i ∈ {0, 1, . . . , N }. Tendremos que
Para cada
tal que
pn+kn (X) ≥ pn+i (X)
para cada
|Bn (X)| ≤ (N + 1)pn+kn (X)
por lo que
1
1
1
log |Bn (X)| ≤ log(N + 1) + log pn+kn (X)
n
n
n
En consecuencia,
1
1
log |Bn (X)| = lı́m sup log |Bn (X)|
n→∞ n
n→∞ n
1
1
n + kn 1
≤ lı́m sup log(N + 1) + lı́m sup log pn+kn (X) = lı́m sup
log pn+kn (X)
n n + kn
n→∞ n
n→∞ n
n→∞
n + kn
1
1
= lı́m sup
lı́m sup
log pn+kn (X) ≤ lı́m sup log pn (X)
n
n→∞
n→∞ n + kn
n→∞ n
h(X) =
Es decir,
lı́m
h(X) ≤ lı́m supn→∞
1
n
log pn (X).
Entonces, aplicando la proposición 5.16, tenemos la
igualdad deseada.
Si X es un shift de tipo nito irreducible, entonces lı́m supn→∞
Corolario 5.18.
h(X).
G
log pn (X) =
X tiene memoria M . Entonces existe un grafo
XG = X [M +1] . Siendo X y X [M +1] conjugados, es
1
1
h(X) = h X [M +1] = h(XG ) = lı́m sup log pn (XG ) = lı́m sup log pn (X)
n→∞ n
n→∞ n
Demostración. Supongamos que
cible
1
n
irredu-
tal que
pues, siendo la cantidad de puntos periódicos invariante por conjugación, es
para todo
n.
Corolario 5.19.
h(X).
Si X es un shift sóco irreducible, entonces lı́m supn→∞
1
n
log pn (X) =
G = (G, L) una presentación resolvente a derecha para X , con G
h(X) = h(XG ) (prop. 5.6). Supongamos que G tiene r vértices. Por
resolvente a derecha, cada punto en XG tiene a lo sumo r presentaciones
Demostración. Sea
irreducible. Sabemos que
ser una presentación
pn (XG ) = pn (X)
4. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS
en
XG .
Como
L
57
es código de ventana deslizante, transforma puntos de período
n
puntos de período
de
XG ,
n
de
XG
en
por lo que
pn (XG ) ≤ r · pn (XG )
Entonces,
1
1
log pn (X) = lı́m sup log pn (XG )
n
n→∞ n
1
1
1
1
≥ lı́m sup log + lı́m sup log pn (XG ) = lı́m sup log pn (XG )
r
n→∞ n
n→∞ n
n→∞ n
= h(XG ) = h(X)
lı́m sup
n→∞
Es decir,
h(X) ≤ lı́m supn→∞
1
n
log pn (X).
Entonces, aplicando la proposición 5.16, tenemos la
igualdad deseada.
4.
Cálculo de la entropía de shifts sócos
Previamente vimos cómo calcular la entropía de shifts sócos irreducibles: obtener una
presentación resolvente a derecha irreducible, y tomar el logaritmo del autovalor de Perron de
la matriz de adyacencia del grafo subyacente. Ahora generalizaremos el método de cálculo para
el caso de shifts sócos en general (no necesariamente irreducibles).
Como siempre, arrancaremos considerando los shifts de aristas, en este caso correspondientes
a grafos arbitrarios (no necesariamente irreducibles). Veremos cómo, en este caso, el correspondiente grafo
G
la entropía de
contiene ciertos subgrafos irreducibles cuya identicación nos permitirá obtener
XG .
La idea es reorganizar las las y columnas de la matriz de adyacencia
A
de
G
de modo de
triangular por bloques, según veremos enseguida, y usar ciertas submatrices
cercanas a la diagonal para calcular la entropía de XG .
llevarla a una forma
cuadradas
Definición 5.20. Dado un grafo G = (V, Σ, i, t) con matriz de adyacencia A, y estados
I, J ∈ V , decimos que I se comunica con J (denotado I
J ) si existe camino en G desde I
n
hasta J ; equivalentemente, si existe n ≥ 0 tal que (A )IJ > 0. Decimos que I se intercomunica
con J (denotado I ! J ) si I J y J I .
Es fácil chequear que la intercomunicación establece una relación de equivalencia entre los
clases de intercomunicación. Una clase de éstas consiste en un conjunto maximal de estados tal que desde cualquiera de
vértices del grafo (ejercicio). Sus clases de equivalencia se llaman
ellos se puede ir a cualquier otro de la clase por un camino en
G. G es irreducible precisamente
tiene una sola clase de intercomunicación.
Una arista de
G
que sale de un estado perteneciente a una clase de intercomunicación
y termina en un estado de una clase de intercomunicación
transición de C1 a C2 .
C1 ∪ C2
diferente se llama
Debe notarse que si hay una arista de transición de
puede haber al mismo tiempo arista de transición de
estados en
C2
C2
a
C1 ,
C1
arista de
C1
a
C2 ,
no
pues, en ese caso, todos los
estarían intercomunicados, contradiciendo la maximalidad de las clases de
intercomunicación.
G se puede construir otro grafo H cuyos
G, y hay una arista (única) desde un vértice Ci
en G una arista de transición de Ci a Cj .
Con las clases de intercomunicación de un grafo
vértices son las clases de intercomunicación de
en
H
si, y sólo si, hay
Ejemplo 5.21. Sea
G
grafo mostrado a continuación, con su correspondiente matriz de
hacia otro vértice
adyacencia
A:
Cj
58
5. ENTROPÍA
1
2
3
4
5
6
7
8
Notar que
5 ! 4
1
0
1
0
0
0
0
0
0
2
1
0
0
0
0
0
1
0
3
0
1
0
0
0
0
0
0
4
0
1
1
0
2
0
0
0
5
0
0
0
1
1
0
0
0
6
0
0
0
0
0
2
0
0
7
1
0
0
0
0
0
0
0
8
0
0
0
1
0
1
1
0
y ningún otro vértice se intercomunica con 5 (ni con 4: por ejemplo,
a pesar de haber camino de 1 a 4, es imposible en el grafo ir de 4 a 1). Luego, una clase de
intercomunicación es C1 = {5, 4}. Análogamente se ve que hay otras cuatro clases: C2 = {8},
C3 = {1, 2, 7}, C4 = {6} y C5 = {3}, según puede observarse en la gura que sigue, que es
básicamente el mismo grafo G excepto que con los vértices de cada clase agrupados según una
línea discontinua.
La arista de G que va de 4 a 8 es de transición de C1 a C2 . Hay también aristas de transición
C3 a C1 , de C3 a C5 , de C3 a C2 , de C3 a C4 , de C5 a C1 y de C4 a C2 . Por lo tanto, el
grafo H de las clases de intercomunicación tiene cinco vértices (C1 , C2 , C3 , C4 , C5 ) y siete aristas
(C1 − C2 , C3 − C1 , C3 − C5 , C3 − C2 , C3 − C4 , C5 − C1 , C4 − C2 ), según se muestra a continuación.
de
Notar que el grafo
H
que se construye de esta manera no puede tener rulos (pues por
denición las aristas de transición vinculan vértices de clases distintas) ni, más generalmente,
ciclos, pues, en ese caso, habría nodos de una clase intercomunicados con nodos de otra clase
distinta, lo que no puede ser por la maximalidad de las clases. Esto implica que no todo estado de
H
H ). Entonces,
anterior, C2 es
puede tener aristas salientes (si fuera ése el caso, se podría generar un ciclo en
debe haber al menos un estado en
H
sin aristas salientes (en nuestro ejemplo
sumideros. Análogamente debe haber al menos un estado en
H sin aristas entrantes (C3 es el único del ejemplo anterior) y tales nodos se llaman fuentes.
el único). Tales nodos se llaman
4. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS
Si quitamos los sumideros de
H
59
(y las aristas conectadas a ellos) de a uno por vez, recursi-
vamente, hasta que no quede ninguno, obtendremos una manera de renombrar los vértices de
H de acuerdo al orden en que se fueron quitando los vértices; así, el primer nodo quitado será
C10 , el segundo C20 , y así sucesivamente. De este modo, las clases de intercomunicación quedarán
0
0
ordenadas de manera tal que sólo puede haber camino en H desde Ci hasta Cj cuando i > j .
En nuestro ejemplo, el procedimiento anteriormente descripto tiene varias alternativas; una
C10 = C2 = {8}, C20 = C1 = {5, 4}, C30 = C4 = {6}, C40 = C5 = {3} y C50 = C3 =
{1, 2, 7}.
de ellas es
Este orden nos permite reescribir la matriz de adyacencia A de G usando el orden en que
0
0
aparecen los vértices de G en C1 , C2 , etc. Al hacer este reordenamiento, la matriz asume una
forma triangular inferior por bloques que puede esquematizarse de la siguiente manera:
C10
C20
C30
.
.
.
Ck0
En ese esquema,
0
C10 C20 C30
A1 0 0
∗ A2 0
∗ ∗ A3
···
···
···
···
C 0k
0
0
0
.
.
.
.
.
.
.
.
.
.
.
.
..
∗
∗
∗
···
.
Ak
representa submatrices rectangulares nulas, y
tangulares posiblemente no nulas. Cada una de las matrices
∗
Ai
representa submatrices reccorresponde a la matriz de
adyacencia del subgrafo irreducible Gi de G que se obtiene de considerar los vértices pertene0
cientes a la clase Ci con las aristas de G que inician y terminan en dichos vértices. Cada Gi se
llama una
G, y las Ai se llaman las
componente irreducible de
de A. También nos referiremos a los XGi
componentes irreducibles
como las componentes irreducibles de XG .
Para el ejemplo 5.21, un posible reordenamiento siguiendo este proceso es el siguiente:
8
5
4
6
3
1
2
7
8
0
0
1
1
0
0
0
1
5
0
1
1
0
0
0
0
0
4
0
2
0
0
1
0
1
0
6
0
0
0
2
0
0
0
0
3
0
0
0
0
0
0
1
0
1
0
0
0
0
0
0
1
0
2
0
0
0
0
0
1
0
1
7
0
0
0
0
0
1
0
0
Ya que el polonomio característico de una matriz no cambia por una permutación simultánea
de las y columnas, podemos calcular el polinomio característico
χA (t)
de la matriz
A
original
más fácilmente usando la forma triangular por bloques. Al realizar la expansión (de Laplace)
para obtener el determinante, cualquier producto que involucre un término
debajo de la diagonal involucrará también un término
Por ello, sólo los bloques
de
A,
Ai
∗
de la porción por
0 de la porción por encima de la diagonal.
sobre la diagonal importan al calcular el polinomio característico
resultando éste ser el producto de los determinantes de las componentes irreducibles de
A:
χA (t) = χA1 (t)χA2 (t) · · · χAk (t)
En consecuencia, los autovalores de A son exactamente los autovalores de las Ai . En particular,
el mayor de los λAi (en valor absoluto) será también un autovalor de A. Esto sugiere la siguiente
denición.
Definición 5.22. Sea
El
A
una matriz no negativa con componentes irreducibles
autovalor de Perron de A es λA = máx{λAi : 1 ≤ i ≤ k}.
Ya que el conjunto de autovalores de
autovalor de
A
A
es la unión de los autovalores de las
tiene módulo acotado por alguno de los
λAi .
A1 , . . . , A k .
Ai ,
cualquier
Luego, el autovalor de Perron de
60
5. ENTROPÍA
A es el más
λA controla
grande (en valor absoluto) de los autovalores de A. Veremos, a continuación, que
n
la tasa de crecimiento de A (y, en consecuencia, la entropía de XG corresponde
al máximo de las entropías de sus componentes irreducibles
XGi ),
lo que es una extensión del
teorema 5.12 a grafos en general.
Teorema 5.23.
Sea G un grafo con matriz de adyacencia A. Entonces, h (XG ) = log λA .
A son A1 , . . . , Ak . Será
λA = λAq para algún q ∈ {1, . . . , k}. Como XG ⊇ XGq , es h (XG ) ≥ h XGq = log λAq = log λA .
Resta probar la desigualdad en el otro sentido. Si λA = 0, es porque cada λAi es 0, lo que
implica que cada Ai es la matriz [0]. En ese caso, G no tiene caminos biinnitos, lo que implica
que XG = ∅, quedando en ese caso el resultado establecido.
Supongamos entonces que λA > 0. Probaremos la desigualdad deseada acotando el número
de caminos de longitud n en G. Cualquiera de tales caminos se puede descomponer en subcaDemostración. Supongamos que las componentes irreducibles de
minos dentro de clases de intercomunicación separados por aristas de transición entre clases.
Es decir, cualquier
π ∈ Bn (XG )
es de la forma
π = τ (1) e(1) τ (2) e(2) · · · τ (j−1) e(j−1) τ (j)
i ∈ {1, . . . , j}, τ (i) es camino (digamos de largo ni ) en alguno de los subgrafos
(i)
irreducibles de G (digamos Gqi ), y, para cada i ∈ {1, . . . , j − 1}, e
es una arista en G desde
algún estado en Gqi hasta algún estado de Gqi+1 . Observar que q1 > q2 > · · · > qj , y entonces
j ≤ k . Sea M la cantidad total de aristas de transición entre clases que hay en G. Cada e(i)
tiene a lo sumo M posibilidades, y a lo sumo n lugares en los que pueden ocurrir. O sea que
k
la cantidad total de maneras de acomodar aristas de transición es a lo sumo (M n) . Por cada
(i)
una de tales maneras, el número de opciones para cada τ
es Bni XGq .
i
m
Nótese que, siendo Gi irreducible para cada i entre 1 y k , es |Bm (XGi )| ≤ di λA para
i
+
algún di ∈ R
(prop. 5.8). Denamos entonces d = máx{di : 1 ≤ i ≤ k}. Tendremos que
|Bm (XGi )| ≤ dλm
A . Por lo tanto, siendo n1 + · · · + nk ≤ n, la cantidad de formas de elegir los
(i)
τ es, a lo sumo,
Bn1 XGq × · · · × Bn XGq ≤ dj λn1 +···+nj ≤ dk λnA
donde, para cada
1
j
i
A
Luego,
Aplicando logaritmos,
|Bn (XG )| ≤ (M n)k dk λnA = (M d)k nk λnA
dividiendo por n y tomando límite cuando n → ∞,
log λA .
resulta
h (XG ) ≤
Con el resultado previo, ya estamos en condiciones de calcular la entropía de cualquier
espacio shift sóco (posiblemente irreducible).
Corolario 5.24. Sea X un shift sóco, y G = (G, L) una presentación resolvente a derecha
para X . Entonces, h(X) = log λA , siendo A la matriz de adyacencia de G.
Demostración. Por la proposición 5.6, sabemos que
X = XG ,
se concluye el resultado.
h (XG ) = h (XG ) = log λA .
Como
Capítulo 6
CÓDIGOS DE ESTADOS FINITOS
A en
X , y hacerlo de tal manera que exista algún modo de recuperar
Por diversos motivos, puede interesar codicar sucesiones arbitrarias sobre un alfabeto
sucesiones de algún shift sóco
la sucesión original conociendo su imagen. Lo primero que interesa es saber si es posible tal
∞
operación. Por ejemplo, si A = {0, 1} y X = {0 } es evidente que no. En caso de ser posible, de
los métodos disponibles investigaremos en este capítulo uno que se denomina
nitos,
código de estados
en el que los símbolos de la sucesión imagen se obtienen de a uno por vez, a medida
que se van leyendo uno por uno los símbolos de la sucesión original, los que son interpretados
como una suerte de
instrucciones.
El método usa grafos rotulados con dos clases especiales de
rotulaciones, una resolvente a derecha que además cumple otras condiciones, y una un poco
más débil que resolvente a derecha.
1.
Coloreo de rutas y presentaciones cerrantes a derecha
Recordemos que una rotulación
a derecha
L:Σ→A
para un grafo
G = (V, Σ, i, t)
se dice
resolvente
L|ΣI es
si desde un mismo nodo no salen dos aristas con un mismo rótulo; es decir,
inyectiva para cada
I ∈ V.
Si imponemos la condición más fuerte de que cada
L|ΣI
sea una
biyección, tendremos un tipo especial de rotulaciones resolventes a derecha.
G un grafo con conjunto de aristas Σ. Un coloreo de rutas de G es
L : Σ → A que, para cada I ∈ V , establece una biyección entre las aristas que
las letras del alfabeto. G se dice coloreable si admite un coloreo de rutas.
Definición 6.1. Sea
una rotulación
salen de
I
y
La gura 1 muestra un ejemplo de grafo coloreable con
A = {0, 1}, y un ejemplo de coloreo.
Figura 1. Ejemplo de coloreo de rutas
Vemos entonces que, en un coloreo de rutas, por cada vértice
I
de
G
y cada letra
a ∈ A,
I cuyo rótulo es a. Esto obliga a que desde cada vértice
|A| aristas. Entonces, G es coloreable si, y sólo si, tiene grado de salida
sale exactamente una arista desde
deban salir exactamente
constante
desde sus vértices, lo que, en términos de la matriz de adyacencia, signica que las
las suman todas lo mismo. Un grafo con r estados y n aristas saliendo desde cada vértice
r
admite (n!) posibles coloreos de rutas (pues para cada uno de los r vértices hay que elegir
una forma de asignar a
n
aristas las
n
letras del alfabeto, que es como ordenar las letras del
alfabeto).
Otra consecuencia de la denición es que si
vértices, cada palabra sobre
A
L
tiene exactamente
61
es un coloreo de rutas para
r
G
que tiene
r
presentaciones, una empezando en cada
62
6. CÓDIGOS DE ESTADOS FINITOS
w
w = a1 a2 . . . am ,
cuyo rótulo es
Si
toma la
símbolo
I ∈ V
w ∈ A∗ ,
hay un único camino comenzando en I
Z
(y, en consecuencia, un coloreo de rutas resulta una presentación para A ).
vértice. Es decir, para cada
y cada
I se toma la única arista e1 ∈ Σ saliente con rótulo a1 , desde t(e1 ) se
única arista e2 ∈ Σ saliente con rótulo a2 , y así sucesivamente. En este sentido, cada
de A se interpreta como una instrucción de cuál arista tomar si se está en un dado
desde
vértice.
Ahora veamos otro tipo de rotulaciones especiales para grafos, que satisfacen una condición
más débil que la de ser resolventes a derecha.
cerrante a derecha con demora D si cualquier
Definición 6.2. Un grafo rotulado se dice
pareja de caminos de longitud
D+1
arrancando desde un mismo vértice y llevando el mismo
rótulo usan la misma primera arista. Un grafo rotulado se dice
cerrante a derecha con alguna demora
cerrante a derecha
si es
D ≥ 0.
Informalmente hablando, un grafo rotulado puede no ser resolvente a derecha (lo cual creará
ambigüedad sobre cuál arista rotulada tomar para salir desde algunos estados) pero es cerrante
a derecha si esa ambigüedad queda salvada mirando anticipadamente una cierta cantidad
D
de símbolos adicionales que vendrán después. Para los grafos resolventes a derecha, no hay que
mirar anticipadamente nada, correspondiendo al caso en que la demora es
D = 0.
Ejemplo 6.3. Consideremos los grados rotulados (a)(d) mostrados en la gura 2.
El grafo (a) tiene demora
aristas rotuladas
el bucle en
I
a
J
I
a
D = 1.
Para verlo, consideremos el estado
comenzando en
I,
I.
Ya que hay dos
el grafo no es resolvente a derecha. Sin embargo,
a, mientras que la arista de
b o c. Luego, el rótulo de un camino
sólo puede ser seguido por una arista rotulada
sólo puede ser seguida por una arista rotulada
de longitud 2 empezando en
I
determina su arista inicial. Un análisis similar permite
concluir lo mismo para el estado
J,
y el estado
K
es más fácil, dado que las aristas que
salen de él llevan rótulos distintos.
De manera análoga al inciso anterior, se puede vericar que el grafo rotulado (b) también
es cerrante a derecha con demora 1.
En el grafo rotulado (c), hay dos caminos con diferentes aristas iniciales rotulados
ab,
por lo que este grafo no tiene demora 1. Sin embargo, el siguiente símbolo determina
cuál de los dos caminos debe tomarse, por lo que el grafo es cerrante a derecha con
demora
D = 2.
En el grafo rotulado (d), para cualquier m, hay dos caminos comenzando en J que
m
presentan al bloque ab ; ya que estos caminos tienen distinta arista inicial, el grafo no
es cerrante a derecha.
Una manera equivalente, y a veces cómoda, de visualizar la propiedad de una rotuladora de
ser cerrante a derecha con demora
D
es pensar que dos caminos de largo
D+1
arrancando en
un mismo vértice pero usando distinta primera arista no pueden llevar el mismo rótulo.
Obviamente, así como el concepto de rotulación resolvente a derecha tiene su dual, que es el
resolvente a izquierda (todas las aristas que llegan a un mismo nodo tienen rótulos diferentes),
se puede denir la noción dual de cerrante a derecha que es la de rotulación cerrante a izquierda:
todos los caminos de largo D + 1 que terminan en un mismo nodo y llevan el mismo rótulo
de
usan la misma última arista. Pero en el presente capítulo usaremos sólo la noción de cerrante
a derecha.
La propiedad de ser cerrante a derecha con demora
caminos de largo
D + 1:
D
tiene una consecuencia sobre los
todos los caminos de esa longitud que arrancan en un mismo vértice
y llevan igual rótulo, tienen la misma primera arista. La gura 3 ilustra ese hecho. Esto puede
generalizarse a caminos más largos diciendo que todos los caminos de largo mayor que
D
arrancando de un mismo nodo y teniendo el mismo rótulo usan las mismas aristas, excepto
quizás las últimas
D
de largo mayor que
aristas. Es decir, dos caminos
D)
e0 e1 . . . ek
y
f0 f1 . . . fk
con
k≥D
(o sea,
que arrancan en el mismo vértice y llevan el mismo rótulo cumplen
1. COLOREO DE RUTAS Y PRESENTACIONES CERRANTES A DERECHA
(a)
63
(b)
(c)
(d)
Figura 2. Ejemplos de rotulaciones con o sin cierre a derecha
Figura 3. Cierre por la arista inicial de caminos con igual rótulo
ej = fj para cada j ∈ {0, . . . , k − D}: aplicando la denición a los dos bloques iniciales
e0 . . . eD y f0 . . . fD , obtenemos que e0 = f0 , con lo cual e1 . . . ek y f1 . . . fk arrancan en un
mismo vértice, y, en caso de tener largo al menos D + 1, aplicamos el mismo razonamiento
para ver que e1 = f1 , y así sucesivamente. Visto así, la propiedad de cierre a derecha actúa a
que
la manera de un cierre de prenda de vestir, juntando todas las aristas de los caminos de largo
mayor que
D
D
que arrancan desde un mismo vértice y llevan un mismo rótulo, salvo las últimas
aristas. Véase la gura 4.
Figura 4. Cierre de todas excepto las últimas
D
aristas de caminos con igual rótulo
64
6. CÓDIGOS DE ESTADOS FINITOS
Usando esta idea para caminos cada vez más largos, vemos que la ambigüedad se traslada
cada vez más hacia la derecha; en un caso límite de caminos innitamente largos hacia la
derecha, esa ambigüedad queda entonces
expulsada al innito (o sea, no subsiste la ambigüedad).
Es decir, veremos que, en un grafo rotulado cerrante a derecha, cualquier pareja de caminos
innitos a derecha que empiezan en el mismo estado y llevan el mismo rótulo corresponden en
realidad a un único camino en el grafo. Para formalizar esto, dado un espacio shift X cualquiera
X + como el conjunto de todas las sucesiones innitas a derecha
denimos su
shift unilateral
que aparecen en
X.
Es decir,
X + = {x0 x1 x2 . . . : (xk )k∈Z ∈ X}
En el caso del shift de aristas correspondiente al grafo
G = (V, Σ, i, t), X+
G
corresponde al
conjunto de caminos innitos a derecha que pueden ser recorridos en el grafo:
X+
G = {e0 e1 e2 . . . : ∀k ∈ N, ek ∈ Σ ∧ t(ek ) = i(ek+1 )}
Si
I
es un estado de
G,
designamos por
X+
G,I
como el conjunto de caminos innitos a derecha
que pueden ser recorridos en el grafo empezando en
I:
+
X+
G,I = e0 e1 e2 . . . ∈ XG : i(e0 ) = I
G = (G, L) es un grafo rotulado, X+
G es la familia de los rótulos de todos los caminos innitos
+
derecha en G. Si para cada e0 e1 e2 . . . ∈ XG designamos
Si
a
tendremos que
X+
G
L+ (e0 e1 e2 . . .) = L(e0 )L(e1 )L(e2 ) . . . ,
+
+
+
= L+ (X+
L (x) : x ∈ X+
: X+
G) =
G , resultando que L
G → XG
es una
función sobreyectiva.
Proposición 6.4. Un grafo rotulado (G, L) es cerrante a derecha si, y sólo si, para cada
vértice I del grafo, L+ |X+ es inyectiva.
G,I
Demostración. Supongamos primero que
es cerrante a derecha, digamos con de-
I un vértice cualquiera del grafo, y sean x = e0 e1 e2 . . . e y = f0 f1 f2 . . . caminos
+
+
X+
G,I tales que L (x) = L (y). Entonces i(e0 ) = I = i(f0 ) y L(e0 )L(e1 ) . . . L(eD ) =
L(e0 )L(e1 ) . . . L(eD ). Por ser el grafo rotulado cerrante a derecha con demora D, debe ser e0 = f0
y, en consecuencia, e1 y f1 comienzan en el mismo vértice t(e0 ). Como L(e1 )L(e2 ) . . . L(eD+1 ) =
L(f1 )L(f2 ) . . . L(fD+1 ) y el grafo es cerrante a derecha, es e1 = f1 . Aplicando sucesivamente
el mismo razonamiento, se cumple que para todo k ∈ N es ek = fk , es decir, x = y , y de este
+
+
modo L es inyectiva si se la restringe a XG,I .
Ahora probemos la vuelta por contrarreciprocidad. Supongamos entonces que (G, L) no es
cerrante a derecha. Esto signica que para cada D ≥ 0, existe una pareja de caminos de largo
D + 1, digamos π y τ , que comienzan en un mismo vértice, tienen distinta primera arista y
2
llevan ambos el mismo rótulo. Elijamos tales caminos para el caso en que D = |V | . Será
mora
D.
(G, L)
Sea
innitos en
π = e0 e1 . . . eD
τ = f0 f1 . . . fD
i(e0 ) = i(f0 ), e0 6= f0 y L(e0 )L(e1 ) . . . L(eD ) = L(f0 )L(f1 ) . . . L(fD ). Como D + 1 > |V |2 ,
debe haber índices i < j tales que la pareja ei , fi coincide con ej , fj , por lo que ei . . . ej y fi . . . fj
son ambos ciclos en G comenzando en un mismo nodo; llamémosles β y γ respectivamente,
0
0
siendo |β| = |γ|. Hagamos α = e0 . . . ei−1 y α = f0 . . . fi−1 , siendo |α| = |α |. Notar que
0
L(α) = L(α ) por ser ambos subcaminos iniciales de π y τ con igual longitud; y, similarmente,
L(β) = L(γ). Entonces αβ ∞ y α0 γ ∞ son dos caminos innitos a derecha arrancando en i(e0 ),
+
ambos distintos (pues e0 6= f0 ) y con rotulaciones iguales. Luego, L |X+
no es inyectiva.
con
G,i(e0 )
Una situación en la que podemos garantizar que un grafo rotulado es cerrante a derecha es
aquella en la que la función rotuladora, como código de ventana deslizante que es, resulta ser
una conjugación.
1. COLOREO DE RUTAS Y PRESENTACIONES CERRANTES A DERECHA
65
Sea G = (G, L) un grafo rotulado con L∞ : XG → XG conjugación cuya
tiene anticipación n. Entonces el grafo rotulado es cerrante a derecha con demora
Proposición 6.5.
inversa
n.
L−1
∞
Demostración. Podemos suponer que
caminos comenzando en el mismo vértice
I
G
es esencial. Sean
e0 e1 . . . en
y
f0 f1 . . . fn
dos
y llevando el mismo rótulo. Debemos probar que
e0 = f0 .
m a la memoria de L−1
∞ y Φ a la respectiva función de bloques, elijamos un
camino π en G de largo m que termine en I (tal elección es posible por ser G esencial).
Entonces L(πe0 e1 . . . en ) = L(π)L(e0 e1 . . . en ) = L(π)L(f0 f1 . . . fn ) = L(πf0 f1 . . . fn ). Luego,
Φ (L(πe0 e1 . . . en )) = Φ (L(πf0 f1 . . . fn )), siendo el primer miembro de esta igualdad precisa−1
mente e0 , y el segundo f0 (por ser Φ la función inductora de L∞ ). Es decir, e0 = f0 .
Llamando
Recordemos que el desdoblamiento de salidas de un grafo rotulado corresponde a un desei con el mismo rótulo
doblamiento de salidas del grafo subyacente, rotulando todas las aristas
que en el grafo original tiene la arista
e.
Recordemos también que esto produce una nueva
presentación del mismo shift sóco. Demostraremos ahora que si se desdobla un grafo rotulado
resolvente a derecha con demora
con demora
D, el grafo desdoblado es también resolvente a derecha, aunque
D + 1.
Proposición 6.6. Sea G cerrante a derecha con demora D . Cualquier grafo rotulado obtenido por desdoblamiento de salidas de G es cerrante a derecha con demora D + 1.
G = (G, L), y sea (H, L0 ) un grafo obtenido por desdoblamiento de
i
i
i
salidas de G . Recordar que H tiene estados I y aristas e , y que el código de amalgama e → e
0
0 i
da una conjugación de XH a XG . Además, la rotuladora L en H está dada por L (e ) = L(e).
0
Veremos que (H, L ) es cerrante a derecha con demora D + 1.
iD+1
jD+1
j0 j1
i0 i1
Sean e0 e1 . . . eD+1 y f0 f1 . . . fD+1 dos caminos de largo D +2 en H comenzando ambos en
I i y teniendo el mismo rótulo (según L0 ). Aplicando el código amalgama, vemos que e0 e1 . . . eD+1
y f0 f1 . . . fD+1 son caminos de largo D + 2 en G comenzando en I y con el mismo rótulo
(para L). Así que e0 e1 = f0 f1 . Ya que i0 está determinado por el elemento de la partición al
que pertenece e1 , y similarmente j0 está determinado por el elemento de la partición al que
j0
i0
0
pertenece f1 , concluimos que e0 = f0 , quedando establecido que L es cerrante a derecha con
demora D + 1.
Demostración. Sea
Ejemplo 6.7. Consideremos el grafo rotulado (b) de la gura 2, que es cerrante a derecha
1
2
1
con demora 1. Hagamos un desdoblamiento elemental de salidas usando ΣI , ΣI y ΣJ , donde
Σ1I consiste en el rulo en I rotulado a y la única arista de I a J rotulada b, Σ2I es el resto de
1
las aristas que salen de I , y ΣJ = ΣJ . El grafo rotulado desdoblado resultante se muestra en la
1
gura 5. En él, hay dos caminos comenzando en I rotulados aa que usan distinta arista inicial,
por lo que el grafo no tiene demora 1. Sin embargo, la proposición muestra que tiene demora
2, como efectivamente puede vericarse.
Figura 5. El desdoblamiento de grafos rotulados incrementa una unidad la demora
66
6. CÓDIGOS DE ESTADOS FINITOS
Recordemos que, en un grafo rotulado, la entropía del shift de aristas del grafo subyacente
y la del sóco coinciden si la rotulación es resolvente a derecha. Lo mismo es cierto para las
rotulaciones cerrantes a derecha.
Proposición 6.8.
h (XG ).
Sea G = (G, L) un grafo rotulado cerrante a derecha. Entonces, h (XG ) =
h (XG ) ≤ h (XG ).
Para probar la desigualdad en el otro sentido, supongamos que G es cerrante a derecha con
demora D . Entonces, cada estado I de G y cada bloque de largo n + D en el lenguaje de XG
determinan a lo sumo un camino de largo n en G, y todos los caminos en Bn (XG ) surgen de
esta forma. Luego, |Bn (XG )| ≤ |V | × |Bn+D (XG )|. Aplicando logaritmos, dividiendo por n y
tomando límite cuando n → ∞, resulta h (XG ) ≤ h (XG ).
Demostración. Ya que
XG
es factor de
2.
XG ,
tenemos que
Códigos de estados nitos
Introduciremos ahora una clase de dispositivos para transformar sucesiones arbitrarias (es
decir, sin restricciones) sobre un alfabeto en sucesiones sujetas a determinadas restricciones
(posiblemente sobre otro alfabeto). Analizaremos también desde el punto de vista teórico la
factibilidad del método en lo que resta del capítulo.
código de estados nitos (CEF)
grafo codicador, I es un coloreo de
Definición 6.9. Un
es una terna
(G, I, O),
donde
G
rotulación
de entradas y O es una rotulación cerrante a derecha de G llamada rotulación de salidas.
es un grafo llamado
Si todos los vértices de
O∞ (XG ),
G
rutas de
G
llamado
n y si X es un espacio shift que
(X, n)-código de estados nitos.
tienen grado de salida
decimos que la terna
(G, I, O)
es un
contiene a
Representaremos grácamente a los CEF mediante el dibujo del correspondiente grafo y
una leyenda de la forma
a/b
en cada arista
e,
en donde
a
representa
I(e)
y
b
representa
O(e).
Ejemplo 6.10. El grafo rotulado (b) de la gura 2 tiene grado de salida constante 4, de
modo que proporciona una rotulación de salida para un CEF. La gura 6 muestra una posible
elección de rotulación de entradas con alfabeto
{0, 1, 2, 3}.
Figura 6. Un ejemplo de CEF
(G, I, O)
(X, n)-CEF e I0 es un estado jo de G, podemos transformar cualquier
+
a0 a1 a2 . . . ∈ AZ en otra sucesión de salidas r0 r1 r2 . . . de X +
del siguiente modo: identicamos la única arista e0 saliendo de I0 tal que I(e0 ) = a0 y denimos
r0 = O(e0 ). Ahora desde el vértice terminal de e0 sale una única arista e1 tal que I(e1 ) = a1 y
denimos r1 = O(e1 ). Continuando de esta manera, denimos rk para cualquier k ∈ N.
Si
es un
sucesión arbitraria de entradas
Obviamente, queremos ser capaces de recuperar la sucesión original a partir de la sucesión
así obtenida. Es precisamente para ello que hemos requerido que
proposición 6.4 nos garantiza que
O
O
sea cerrante a derecha: la
es inyectiva cuando se restringe a los caminos innitos en
G que arrancan en I0 , lo que signica que hay un único camino innito e0 e1 e2 . . . en X+
G,I0 tal
que O(e0 e1 e2 . . .) = r0 r1 r2 . . .; por lo tanto, cada ak se recupera viendo I(ek ).
3. AUTOVECTORES APROXIMADOS
(G, O)
r0 r1 . . . rD determina e0 , así que a0 =
I(e0 ). Luego, r1 r2 . . . rD+1 es un camino rotulado (por O) en G que comienza en t(e0 ), y por lo
tanto determina e1 , de donde a1 = I(e1 ). Continuando de este modo, obtenemos todos los ak .
Concretamente, si
tiene demora
D,
67
el bloque
En la práctica sólo podemos manejar sucesiones nitas de símbolos. En tal caso, a partir
de una sucesión nita arbitraria
a0 a1 . . . ak
podemos generar, por el método arriba descripto,
a0 a1 . . . ak−D (pues O es
D). Si bien esto parece alarmante, una solución posible es agregar
D símbolos arbitrarios a la derecha de a0 a1 . . . ak y codicar mediante el CEF esta sucesión
más grande; obtendremos así una r0 r1 . . . rk . . . rk+D que nos permitirá recuperar a0 a1 . . . ak
r0 r1 . . . rk .
Pero el conocimiento de ésta sólo nos permite recuperar
cerrante a derecha con demora
completamente y sin ambigüedades.
Ahora bien, dado un alfabeto de
n
símbolos para las sucesiones arbitrarias de entrada y un
X , resta ver bajo qué condiciones existe un (X, n)-CEF. El teorema principal de los
X tenga suciente
capacidad de almacenamiento de información, o complejidad, la que es medida por la entropía.
shift sóco
códigos de estados nitos establece cuál es exactamente esa condición: que
Teorema 6.11.
(Teorema de los Códigos de Estados Finitos) Sean X un shift sóco
y n un entero positivo. Entonces, hay un (X, n)-código de estados nitos si, y sólo si, h(X) ≥
log n.
La dirección fácil de la demostración es la directa: si
(G, I, O)
es un
(X, n)-CEF,
por
la proposición 6.8, que establece que las rotulaciones cerrantes a derecha preservan entropía,
tenemos que
shift de
n
h (I∞ (XG )) = h(XG ) = h (O∞ (XG )). Como (G, I)
O∞ (XG ) ⊆ X , tenemos que
es una presentación del full
símbolos, y además
log n = h (I∞ (XG )) = h (O∞ (XG )) ≤ h(X)
La demostración de la implicación recíproca es mucho más delicada, y requiere de nuevas ideas
que desarrollaremos en las secciones posteriores del capítulo.
3.
Supongamos que
n
Autovectores aproximados
es un entero positivo y que
una presentación resolvente a derecha
X
es un shift sóco. Sabemos que
X
admite
Si tenemos la suerte de que, en esa presentación,
(X, n)-CEF simplemente
n aristas salientes desde cada estado (borrando las otras) y restringiendo
L a esas aristas elegidas (llamemos O a esa restricción). Obtenemos así un subgrafo G coloreable,
al que dotamos de cualquier coloreo de rutas I . Tenemos que (G, I, O) constituye un (X, n)CEF, pues I y O son ambas resolventes a derecha (y entonces O es cerrante a derecha con
demora D = 0) y O∞ (XG ) = L∞ (XG ) ⊆ L∞ (XH ) = X .
El problema sería que H no tuviese al menos n aristas saliendo desde cada estado. Veremos,
sin embargo, que si X satisface la condición h(X) ≥ log n, una cadena de desdoblamientos de
estados convenientemente elegidos, aplicados sucesivamente a partir de (H, L), producirá una
presentación de X en la que hay al menos n aristas saliendo desde cada vértice. A ella le aplisalen al menos
n
(H, L).
aristas desde cada vértice, podemos diseñar un
eligiendo exactamente
caremos nuestras consideraciones previas, y de esta manera quedará completa la demostración
del Teorema de los Códigos de Estados Finitos, que se hará en la sección posterior.
Nos dedicaremos ahora a presentar la herramienta precisa que nos servirá de guía para elegir
(H, L), para
autovector aproximado,
convenientemente la sucesión de desdoblamientos de estados a realizar, a partir de
llegar a la presentación buscada. Esa herramienta recibe el nombre de
y, para motivar su nombre y su denición, notemos que si un grafo con matriz de adyacencia
A
tiene al menos
n
aristas saliendo desde cada vértice, cada la de
condición equivale a la desigualdad matricial
dimensión igual al tamaño de
columna
v 6= 0
A
A1 ≥ n1,
1
A
suma al menos
1
n.
Esa
es el vector columna de
y que tiene todos sus coecientes valiendo
que, reemplazado en cuenta de
recibirá un nombre especial.
en donde
1.
Cualquier vector
en esa desigualdad, la siga satisfaciendo,
68
6. CÓDIGOS DE ESTADOS FINITOS
Definición 6.12. Sea
A
una matriz a coecientes enteros no negativos, y
n
un entero
(A, n)-autovector aproximado ((A, n)-AA) es un vector v 6= 0 con coecientes
Av ≥ nv.
1 3
Ejemplo 6.13. Sean A =
y n = 5. De la denición de autovector aproximado,
6 1
resulta que cualquier (A, 5)-AA u = (u1 , u2 ) debe satisfacer
u1 + 3u2 ≥ 5u1
6u1 + u2 ≥ 5u2
positivo. Un
enteros no negativos que satisface
o, equivalentemente,
−4u1 + 3u2 ≥ 0
6u1 − 4u2 ≥ 0
Este sistema determina un cono en el primer cuadrante; los puntos de ese cono que tienen
ambas coordenadas enteras son precisamente los
(A, 5)-autovectores
aproximados. Entre ellos,
tenemos
2
3
3
4
5
6
6
7
,
,
,
,
,
,
,...
4
6
7
8
9
10
A
de tamaño r y un n > 0, el conjunto de los (A, n)-AA es el conjunto de vectores (u1 , . . . , ur )
a coordenadas enteras no negativas que se encuentran en el cono poliédrico de dimensión r (o
Pr
menor) determinado por el sistema de inecuaciones {
J=1 AIJ uJ ≥ nuI : 1 ≤ I ≤ r}.
El ejemplo anterior es generalizable de manera directa al hecho de que dada una matriz
Observación 6.14. Podemos caracterizar de diversas maneras a los autovectores aproxi-
mados.
v un (A, n)-autovector aproximado. Siendo A ≥ 0, es A2 v = A(Av) ≥ A(nv) =
n(Av) ≥ n(nv) = n2 v. Una sencilla inducción muestra que, más generalmente, para
k
k
todo k ≥ 0 se cumple que A v ≥ n v toda vez que v es un (A, n)-AA.
+
Por lo tanto, dados n ∈ Z , A y v 6= 0 a coecientes enteros no negativos,
Sea
v
Sea
A
es
(A, n)-AA ⇐⇒ ∀k ∈ N, Ak v ≥ nk v
la matriz de adyacencia de un grafo
G = (V, Σ, i, t),
y
v 6= 0
un vector a coe-
cientes enteros no negativos de dimensión igual al tamaño de A. Consideremos cualquier
S
J ∈ V . Como ΣJ es la unión disjunta L∈V ΣLJ , se tiene que
X
X
vt(e) =
e∈ΣJ
e∈
S
L∈V
vt(e) =
XX
vt(e) =
L∈V e∈ΣL
J
ΣL
J
XX
vL =
L∈V e∈ΣL
J
X X
ΣLJ vL =
AJL vL
L∈V
Por otra parte, de la denición de autovector aproximado, se tiene que
si, y sólo si,
∀J ∈ V,
v
P
es
L∈V
AJL vJ ≥ nvJ .
L∈V
v es un (A, n)-AA
Por lo dicho previamente, resulta que
(A, n)-AA ⇐⇒ ∀J ∈ V,
X
vt(e) ≥ nvJ
e∈ΣJ
Cuando
irreducible
A es la matriz de adyacencia de un grafo G y posee un (A, n)-AA, hay un subgrafo
H de G cuya matriz de adyacencia B admite un (B, n)-autovector aproximado
estrictamente positivo.
Lema 6.15. Sean G = (V, Σ, i, t) un grafo con matriz de adyacencia A. Existe un (A, n)-AA
si, y sólo si, G posee un subgrafo irreducible H con matriz de adyacencia B tal que existe un
(B, n)-AA estrictamente positivo.
3. AUTOVECTORES APROXIMADOS
69
Demostración.
⇒)
v un (A, n)-AA. Designemos por K al subgrafo de G que resulta de quitar todos los
I (y, obviamente, sus aristas incidentes) para los cuales vI = 0. Sea H una componente
conexa de K que sea un sumidero, es decir, que no contenga aristas que terminen en un estado
que no esté en H . Tal H es un subgrafo de G. Llamando VH al conjunto de vértices de H y B
a su matriz de adyacencia, sea w la restricción de v a VH . Por su denición, es w > 0.
Sea
vértices
Además, podemos observar que:
J ∈ VH
P, es wJ = vJ y AIJ = BIJ , por lo que BIJ wJ = AIJ vJ . De allí
B
w
=
IJ J
J∈VH
J∈VH AIJ vJ .
Para cualquier J ∈ V − VH , puede ocurrir una de dos alternativas:
1. O bien J no es un vértice en el subgrafo K , lo que ocurre por ser vJ = 0.
2. O bien J es un vértice de K . En tal caso, todas las aristas de G incidentes con I y
con J subsisten en K , y, por denición de H , no hay arista en K desde I hasta J ,
de donde se deduce que no hay arista en G desde I hasta J . Entonces, en este caso,
AIJ = 0.
Cualquiera sea esa alternativa, resulta entonces que AIJ vJ = 0. Siendo J arbitrario en
P
V − VH , tenemos que J∈V −VH AIJ vJ = 0.
Para cualquier
que
P
Entonces,
X
X
BIJ wJ =
X
AIJ vJ ≥ nvI = nwI
J∈V
(B, n)-AA estrictamente positivo.
⇐) Sea w un (B, n)-AA para el subgrafo H = (V 0 , Σ0 , i0 , t0 ), y sea v el vector denido por
wJ si J ∈ V 0
vJ =
0 si J ∈ V − V 0
P
Sea I un vértice arbitrario de G. Si I ∈
/ V 0 , siendo vI = 0, la desigualdad L∈V AIL vL ≥ nvI
0
se cumple trivialmente. Y para cualquier I ∈ V , resulta
X
X
X
X
X
AIL vL =
AIL vL +
AIL vL =
AIL wL ≥
BIL wL ≥ nwI = nvI
quedando así demostrado que
L∈V 0
L∈V
Ya que
w
AIJ vJ =
J∈V −VH
J∈VH
J∈VH
X
AIJ vJ +
v 6= 0
pues
L∈V −V 0
w > 0,
Dada una matriz
A
es un
resulta que
v
L∈V 0
(A, n)-AA.
es un
n,
y un entro positivo
L∈V 0
¾cuándo existe un
(A, n)-AA?
Teorema 6.16. Sean A ≥ 0 una matriz a coecientes enteros, y n un entero positivo.
Entonces, hay un (A, n)-AA si, y sólo si, λA ≥ n. Si además suponemos que A es irreducible,
entonces hay un (A, n)-AA estrictamente positivo.
Demostración. Llamemos
sea
r
al tamaño de
A.
Sea
G
un grafo cuya matriz de adyacencia
A.
A es irreducible y que
admite un (A, n)-AA v > 0. Sean c = mı́n{vI : 1 ≤ I ≤ r} y d = máx{vI : 1 ≤ I ≤ r},
k
k
teniéndose que d ≥ c > 0. Para cualquier k ∈ N, es A v ≥ n v (observación 6.14), lo que
k
implica que para cualquier I ∈ {1, . . . , r} es A v
≥ nk vI , y entonces
I
Para la implicación directa, por el lema 6.15, podemos suponer que
d
r X
r
X
k
A
I=1 J=1
Pr
Pr
IJ
≥
r X
r
X
I=1 J=1
k
k
A
IJ
vJ ≥
r
X
I=1
k
k
n vI = n
r
X
vI ≥ nk rc
I=1
A IJ ≥ nk rc/d. Pero además, por la proposición 5.8 y el Teorema de
J=1 P
Pr
r
k
k
Perron-Frobenius, es
I=1
J=1 A IJ ≤ d0 λA para alguna constante d0 > 0. Juntando todo
rc
1/k
esto, y llamando t =
, resulta que, para cualquier k ∈ N, es λA ≥ t
n. Haciendo tender k
dd0
a innito, y considerando que t > 0, resulta que λA ≥ n.
Es decir,
I=1
70
6. CÓDIGOS DE ESTADOS FINITOS
λA ≥ n. Usando una
componente irreducible de G de entropía maximal, podemos suponer que A es irreducible. Su
autovector de Perron vA es positivo, y satisface AvA = λA vA ≥ nvA . Si vA tuviese todos sus
coecientes racionales, haciendo v = M vA (donde M es el producto de los denominadores de
los coecientes de vA ) obtendríamos que Av = AM vA = M (AvA ) ≥ M nvA = nv, mostrando
que v sería el (A, n)-AA que buscamos. Pero no tenemos garantía de que vA vaya a tener todos
Para la implicación recíproca, supongamos que se cumple la condición
sus coecientes racionales, así que debemos trabajar un poco más para asegurar que hay un
(A, n)-AA. Distinguiremos dos casos:
1. λA = n. En este caso, resolvemos
Av = nv
la ecuación vectorial
por eliminación gaus-
siana (siendo el sistema consistente ya que admite al menos la solución
A
v
tiene todos sus coecientes enteros, la solución
λA
racionales. Por el teorema de Perron-Frobenius,
que
v
es múltiplo de
vA .
Multiplicando a
v
vA ),
y, ya que
debe tener todos sus coecientes
es geométricamente simple, por lo
por el producto de los denominadores de
v0 > 0 que cumple
sus coecientes (y eventualmente por −1), obtenemos un vector
Av0 ≥ nv0 . Entonces, v0 es un (A, n)-AA.
λA > n,
2. Si
de modo que
AvA > nvA ,
elijamos
v
con coordenadas racionales sucien-
temente cercanas a las respectivas coordenadas de
siga cumpliéndose. Apliquemos a tal
vA
tal que la desigualdad
Av > nv
v
el proceso de multiplicar por el producto de
0
los denominadores (y eventualmente por −1) para obtener un vector v que satisfará
0
0
0
Av ≥ nv . Entonces, v es un (A, n)-AA.
Veremos más adelante que, a la hora de construir
necesario obtener explícitamente un
vinculada al shift sóco
λA ≥ n,
condición
X)
existe un
(A, n)-AA,
y el entero positivo
(A, n)-AA;
(X, n)-códigos
de estados nitos, es
conociendo cierta matriz
n.
A
(estrechamente
El teorema anterior asegura que, bajo la
sin embargo, no proporciona una manera explícita de
encontrar uno. Afortunadamente, existe un algoritmo que permite hacerlo. Antes de presentarlo,
0
denimos una nueva notación: dados dos vectores v, v de igual tamaño r , designamos por
mı́n(v, v0 ) al vector minimal componente a componente, es decir, (mı́n(v, v0 ))I = mı́n{vI , vI0 }
para cada I ∈ {1, . . . , r}. Además, designamos por bvc al vector que se obtiene de tomar las
partes enteras de las componentes de
Teorema 6.17.
v,
es decir,
bvcI = bvI c
para cada
I ∈ {1, . . . , r}.
(Algoritmo del autovector aproximado) Sean A ≥ 0 una matriz a
coecientes enteros, n un entero positivo y v 6= 0 un vector a coecientes enteros no negativos.
Pongamos
1
0
Av
v = mı́n v,
n
Si v0 = v, contestar v y nalizar. Si no, reemplazar v por v0 y repetir. Este proceso nalmente
culmina, y su respuesta es o bien un (A, n)-autovector aproximado o bien el vector nulo.
Demostración. Los sucesivos vectores que se van produciendo tienen coecientes enteros
no negativos y monótonamente decrecientes componente a componente. Luego, el proceso debe
terminar, pues el vector nulo
0
satisface la condición
1
0 = mı́n 0,
A0
n
si es que ésta no se produce antes.
Sea
v
la respuesta. Se tiene que
v
es un vector a coecientes enteros no negativos. Si
v = 0,
se cumple el enunciado. Si no, notemos que
1
v = mı́n v,
Av
n
por lo que
Av ≥ nv
con
v 6= 0,
es decir,
v
es un
≤
1
Av
n
(A, n)-AA.
4. CONSTRUCCIÓN DE CÓDIGOS DE ESTADOS FINITOS
71
Típicamente, el algoritmo anterior se emplea del siguiente modo: comenzar con
v
siendo el
vector cuyas componentes son todas 1 y aplicar el algoritmo; si la respuesta es un vector no
nulo, ya tenemos el autovector aproximado que buscamos. En caso contrario, tomar
v
siendo
el vector cuyas componentes son todas 2, y así sucesivamente. El teorema 6.17 asegura que en
algún momento terminaremos con este procedimiento, pues existe un
p = máxI vI ,
(A, n)-AA v.
Si hacemos
aplicando el algoritmo comenzando con el vector cuyas componentes son todas
p,
se obtendrá como respuesta un vector no nulo (ejercicio).
Ejemplo 6.18. Apliquemos el algoritmo anterior a la matriz
ejemplo 6.13. Comenzando con
v=
Comenzando con
v=
Comenzando con
v=
2
2
del
, obtenemos sucesivamente
→
1
2
→
0
1
→
0
0
0
0
0
0
→
1
1
→
0
1
→
→
0
0
, obtenemos sucesivamente
3
3
y hemos obtenido el más pequeño de los
4.
n=5
, obtenemos sucesivamente
→
3
3
y el
1
1
2
2
1
1
A=
1 3
6 1
→
2
3
→
2
3
(A, 5)-autovectores
aproximados.
Construcción de códigos de estados nitos
En esta sección completaremos la demostración del Teorema de los Códigos de Estados
Finitos. Lo haremos de manera constructiva, es decir, proporcionando también un método para
construir el CEF, conocidos
n
y el shift sóco
X
con
h(X) ≥ log n.
(G0 , L0 ) para X . Luego,
G = (G00 , L) con h (XG ) =
El primer paso es obtener una presentación resolvente a derecha
basados en el corolario 5.24, elegimos una componente irreducible
h (XG0 ) = h(X) ≥ log n. A partir de G , y siguiendo una adecuada secuencia de desdoblamientos
de estados de grafos rotulados, construimos una presentación de X en la que desde cada vértice
salen al menos n aristas, y en esa presentación eliminamos algunas aristas para obtener un grafo
G en el que, desde cada vértice, queden saliendo exactamente n aristas. La función rotuladora
restringida a esas aristas será nuestra rotuladora de salidas O , y como rotuladora de entradas
I elegimos cualquier coloreo de rutas del grafo que resulta. Así obtenemos el CEF (G, I, O)
que buscamos.
Para ello, necesitamos demostrar una proposición que constituye el corazón de la demostración de que efectivamente existe aquella secuencia de desdoblamientos de estados de grafos
rotulados de la que hablamos más arriba. Y dicha proposición usa un sencillo hecho de teoría
de números que enunciamos a continuación.
n
Sea {mP
i }i=1 una sucesión de n enteros positivos. Entonces, existe S ⊆ {1, . . . , n}
tal que n es factor de i∈S mi .
P
N
Demostración. Para cada N ∈ {1, . . . , n}, sea pN =
m
mod n.
i
i=1
∗
Si los pN son todos distintos, debe haber algún N tal que pN ∗ = 0 (pues los posibles restos
PN ∗
de una división por n son 0, 1, . . . , n − 1) y, en ese caso n es factor de
i=1 mi ; luego, basta
∗
tomar S = {1, . . . , N } para ver que el enunciado es cierto.
Lema 6.19.
72
6. CÓDIGOS DE ESTADOS FINITOS
N1 < N2 tales que pN1 = pN2 . Eso signica que
PN2
P 2
mi mod n, es decir, i=N1 +1 mi = 0 mod n. De aquí que N
i=1 mi =
i=N1 +1 mi es
múltiplo de n; luego, basta tomar S = {N1 + 1, . . . , N2 } para ver que el enunciado es cierto. Si no son todos distintos, debe haber
P
PN1
N2
i=1
Sean n un entero positivo, G = (V, Σ, i, t) un grafo irreducible con
matriz de adyacencia A, y v > 0 un (A, n)-autovector aproximado. Supongamos que algún
estado K ∗ ∈ V tiene menos de n aristas saliendo de él. Entonces, existe I ∈ V y una partición
de ΣI en subconjuntos no vacíos Σ1I y Σ2I tal que el grafo G0 que resulta de desdoblar I en
I 1 , I 2 usando esa partición posee matriz de adyacencia A0 que admite un (A0 , n)-autovector
aproximado v0 > 0 con vI0 1 + vI0 2 = vI y vJ0 = vJ para todo J ∈ V − {I 1 , I 2 }.
Proposición 6.20.
p = máxJ∈V vJ . Notar que debe haber algún
P estado K tal que
P vK < p,
pues, de lo contrario, tendríamos que ∀K ∈ V, vK = p y entonces
L AK ∗ L vL = p
L AK ∗ L =
p |ΣK ∗ |; como v es (A, n)-AA, tendríamos que p |ΣK ∗ | ≥ nvK ∗ = np, es decir, |ΣK ∗ | ≥ n,
∗
contradiciendo la hipótesis de que desde K salen menos de n aristas.
0
Elijamos entonces I , K ∈ V tales que vK < p y vI 0 = p. Como G es irreducible, hay camino
0
en G desde I hasta K . Sea I el último estado en el recorrido de ese camino tal que vI = p, y
∗
e la arista de ese camino que sale del estado I . Observar
que vt(e∗ ) < p.
P
≥ nvI = np (observación 6.14).
Designemos m = |ΣI |. Como v es (A, n)-AA, es
e∈ΣI vt(e) P
∗
Además, ∀e ∈ ΣI , vt(e) ≤ p y ∃e ∈ ΣI : vt(e∗ ) < p. Luego,
e∈ΣI vt(e) < p |ΣI | = pm. De
lo anterior, tenemos que m > n, es decir, hay más de n aristas saliendo de I . Enumeremos
∗
las aristas de G que salen de I como e1 , . . . , en , . . . , em con e1 = e . Aplicando el lema 6.19 a
P
la sucesión vt(e1 ) , . . . , vt(en ) , vemos que existe S ⊆ {1, . . . , n} tal que
i∈S vt(ei ) = qn para
1
1
2
+
1
6 Σ2I
algún q ∈ Z . Designemos ΣI = {ei : i ∈ S} y ΣI = ΣI − ΣI . Tendremos que ΣI 6= ∅ =
0
0
0 0 0
1
(pues |ΣI | > |ΣI |). Sea G = (V , Σ , i , t ) el grafo que resulta de hacer un desdoblamiento
1
2
0
elemental de G por el estado I usando la partición ΣI = {ΣI , ΣI }, y llamemos A a su matriz
0
de adyacencia. Denamos v mediante:

q si J = I 1

0
vI − q si J = I 2
vJ =

vJ si J ∈ V − {I 1 , I 2 }
Demostración. Sea
0
2
0
Veamos que v así denido es positivo. Para J 6= I , vJ > 0 pues q > 0 y vJ > 0. Y para
Pn
P
0
ver que vI 2 > 0, notemos que nq =
i=1 vt(ei ) < np, pues vt(e1 ) = vt(e∗ ) < p y
e∈Σ1I vt(e) ≤
P
n
vt(ei ) ≤ p para i ∈ {2, . . . , n} (así que i=1 vt(ei ) < np); de allí que q < p y, en consecuencia,
vI0 2 = vI − q = p − q > 0.
0
Tengamos presente que cada arista e de G que no termina en I es también arista en G y
0
cumple que vt0 (e) = vt(e) ; en tanto, cada arista e de G que termina en I (incluidos los rulos en
I ) aparece desdoblada en G0 como e1 y e2 , siendo vt0 0 (e1 ) + vt0 0 (e2 ) = vI0 1 + vI0 2 = vI = vt(e) .
0
0
Resta ver que v es (A , n)-AA. Lo haremos por la segunda caracterización dada en la
observación 6.14.
1
1
2
1
2
Designemos ∆ a los rulos en I , ∆ a las aristas que van de I a I y ∆ a
1
1
2
1
0
las que salen de I y no terminan ni en I ni en I (siendo ∆ ⊂ ΣI ). Se tiene que ΣI 1
1
2
1
es la unión disjunta ∆ ∪ ∆ ∪ ∆ , y además ΣI es la unión disjunta de ∆ con los rulos
1
1
1
en I que están en ΣI . Por lo dicho más arriba, por cada arista e ∈ ∆ hay una arista
e2 ∈ ∆2 y viceversa; y cada pareja e1 , e2 proviene de un rulo e ∈ ΣII ∩ Σ1I . Entonces,
Si
X
J = I 1:
vt0 0 (e) =
X
=
X
e∈Σ0 1
vt0 0 (e) +
e∈∆
vt0 0 (e) +
e∈∆1
e∈∆
I
X
vt(e) +
X
e∈ΣII ∩Σ1I
X
vt0 0 (e) =
e∈∆2
vt(e) =
X
e∈Σ1I
X
e∈∆
X
vt(e) +
e∈ΣII ∩Σ1I
vt(e) = nq = nvI0 1
vt0 0 (e) + vt0 0 (e)
4. CONSTRUCCIÓN DE CÓDIGOS DE ESTADOS FINITOS
J = I 2:
Si
P
Por análisis similar al realizado en el caso anterior, resulta
vt(e) ,
e∈Σ2I
73
y, como
Σ2I = ΣI − Σ1I ,
P
e∈Σ0 2
I
vt0 0 (e) =
se tiene que
!
X
X
0
vt(e)
=
e∈Σ0 2
X
vt(e) =
e∈ΣI −Σ1I
I
vt(e)
− nq ≥ nvI − nq = n(vI − q) = nvI0 2
e∈ΣI
J ∈
/ {I 1 , I 2 }: Designemos ∆1 a las aristas que van de J a I 1 , ∆2 a las que van de
J a I 2 y ∆ a las que van de J hasta un vértice distinto de I 1 y de I 2 . Se tiene que
Σ0J es la unión disjunta ∆ ∪ ∆1 ∪ ∆2 . Como antes, por cada arista e1 ∈ ∆1 hay una
2
2
1 2
arista e ∈ ∆ y viceversa; y cada pareja e , e proviene de una arista e en G desde J
P
0
hasta I . Procediendo de manera análoga a lo anterior, se llega a ver que
e∈Σ0J vt0 (e) =
P
0
e∈ΣJ vt(e) ≥ nvJ = nvJ .
Si
0
Es decir, para todos los vértices de G se cumple la desigualdad requerida en la observación
0
0
0
0
6.14 en cuanto a v , A y n, resultando entonces que v es un (A , n)-AA.
Sean n ∈ Z+ y G un grafo irreducible con matriz de adyacencia A. Si
λA ≥ n, entonces existe una sucesión de grafos G0 , G1 , . . . , Gm tales que G0 = G, Gm tiene
al menos n aristas saliendo desde cada vértice, y para cada i ∈ {1, . . . , m}, Gi resulta de un
desdoblamiento elemental de Gi−1 .
Teorema 6.21.
v > 0 un (A, n)-AA, cuya existencia está garantizada por el teorema
G0 = G. Si desde cada estado de G salen al menos de n aristas, tomamos m = 0
y el enunciado se cumple. En caso contrario, sea G1 el grafo que resulta de aplicar a G0 la
(1)
proposición 6.20, cuya matriz de adyacencia tendrá un autovector aproximado v
> 0 cuya
dimensión es una unidad mayor que la de v pero cuya suma de componentes es igual a la
suma de las componentes de v. Si G1 tampoco tiene al menos n aristas saliendo desde cada
vértice, le aplicamos nuevamente la proposición 6.20 para obtener un grafo G2 cuya matriz de
(2)
adyacencia tiene autovector aproximado v
> 0 con dimensión una unidad mayor que la de
(1)
v y suma de coecientes igual a la suma de los coecientes de v(1) , y así sucesivamente. El
(i)
proceso debe terminar, pues cada v
que se obtiene en cada paso es estrictamente positivo y
(i−1)
tiene una coordenada más que v
, pero sus respectivas sumas de coecientes son iguales.
Entonces, el último Gm obtenido es el buscado.
Demostración. Sea
6.16. Hagamos
Ahora podemos completar la demostración del Teorema de los Códigos de Estados Finitos,
cuya vuelta nos estaba faltando.
Demostración.
(X, n)-CEF.)
(Suciencia de la condición de entropía para existencia de un
Supongamos que
X
es un shift sóco con
sentación resolvente a derecha para
X.
Sea
G0
h(X) ≥ log n,
y sea
(H, L) una
H tal
una componente irreducible de
preque
h (XG0 ) = h (XG ), y sea A la matriz de adyacencia de G0 . Designemos L0 a la restricción
de L a las aristas de G0 . Como h(X) = log λA ≥ log n, es λA ≥ n. Aplicando entonces a G0
el teorema 6.21, obtenemos la sucesión de grafos rotulados G0 = (G0 , L0 ), . . . , Gm = (Gm , Lm )
donde G1 , . . . , Gm son los que resultan del teorema, y cada grafo rotulado Gi es el correspondiente desdoblamiento (como grafo rotulado) de Gi−1 . Sabemos que X ⊇ XG0 = XGm , y, por
proposición 6.6, Gm es cerrante a derecha con demora m. Como Gm tiene al menos n aristas
saliendo desde cada vértice, elegimos exactamente n aristas saliendo desde cada vértice (eliminando las otras) para obtener así un subgrafo G coloreable al que dotamos de un coloreo
de rutas I . Designando por O a la restricción de Lm a las aristas de G, resulta que la terna
(G, I, O) es un (X, n)-CEF, pues O∞ (XG ) = (Lm )∞ (XG ) ⊆ (Lm )∞ (XGm ) = XGm ⊆ X .
X el shift sóco mostrado en la
(X, 3)-CEF, y, en caso armativo, veremos
Ejemplo 6.22. Sea
construir un
gura 7. Analizaremos si es posible
la aplicación del procedimiento que
está implícito en las demostraciones anteriores para obtener tal código de estados nitos.
74
6. CÓDIGOS DE ESTADOS FINITOS
Figura 7. Shift sóco
X
para construir un
(X, 3)-CEF
El grafo subyacente es irreducible y su matriz de adyacencia es


2 1 1
A= 0 1 1 
2 1 0
Su autovalor de Perron es
h(X) = log λA ≥ log 3.
(X, 3)-CEF.
λA = 3, 1149 . . .,
y como la presentación es resolvente a derecha, es
Entonces, de acuerdo al Teorema de los Códigos de Estados Finitos,
existe un
Como el grafo subyacente ya es irreducible y la presentación es resolvente a derecha, el grafo
rotulado de la gura 7 será nuestro
G0
de arranque. Como hay estados con menos de tres aristas
salientes, deberemos seguir el procedimiento dado en la demostración de la proposición 6.20.
Por aplicación del algoritmo de búsqueda de autovector aproximado, llegamos a que
[3, 1, 2] es un (A, 3)-AA. De acuerdo a
e∗ que arranque en un estado I
v=
la demostración de la proposición 6.20, buscamos una
vI maximal, y termine en un estado J con vJ no
∗
maximal. Hay varias opciones; elegiremos I = 1 y e la arista de 1 a 3 que tiene rótulo a.
1
∗
De acuerdo a la demostración, elegimos ΣI conteniendo e y la arista de 1 a 2 con rótulo d,
2
y ΣI son todas las otras aristas que salen de I (los dos rulos en 1, en este caso). Notar que
P
e∈Σ1I vt(e) = 3, así que el q de la demostración vale, en esta etapa, 1. Luego, el autovector
aproximado correspondiente al grafo desdoblado G1 tendrá coecientes 1 y 2, respectivamente,
para los dos estados en que se desdoblará I ; los otros estados conservarán el valor que tienen
asociado en G0 .
arista
con
En la gura 8, mostramos la sucesión de desdoblamientos de grafos rotulados que se produce.
En cada paso, mostramos dentro de un hexágono al lado de cada estado el valor del coeciente
del autovector aproximado que le corresponde en esa etapa, e indicamos con I el estado por el
∗
cual se produce el desdoblamiento, con (∗) la arista e , y con línea discontinua las aristas de
1
ΣI .
El proceso para en G3 , pues hemos llegado a una presentación en la que desde cada vértice
salen al menos tres aristas.
Elegimos entonces exactamente tres aristas saliendo de cada vértice, eliminando las otras,
y coloreamos el grafo rotulado resultante con el alfabeto de entradas
gura 8 muestra, en la parte inferior, uno de los posibles
Usando el hecho de que
de tamaño
N sin solape),
h X
N
= N h(X)
(donde
A = {0, 1, 2}.
(X, 3)-CEF.
XN
es la presentación de
La misma
X
en bloques
en los ejercicios se verá cómo se puede adaptar el Teorema de los
Códigos de Estados Finitos para construir códigos aún sin cumplirse de manera directa la
condición
h(X) ≥ log n.
4. CONSTRUCCIÓN DE CÓDIGOS DE ESTADOS FINITOS
G0
G1
G2
G3
Figura 8. Cadena de desdoblamientos y un
(X, 3)-CEF
resultante
75
Descargar