Universidad Nacional de Salta Facultad de Ciencias Exactas Departamento de Matemática DINÁMICA SIMBÓLICA APUNTES DE CÁTEDRA NOVIEMBRE DE 2016 JORGE YAZLLE CAMILO JADUR Índice general Capítulo 1. ESPACIOS SHIFT 1 1. Deniciones básicas 2. Full shifts 1 3. Los Espacios Shift 3 4. Lenguajes 5 5. Shifts de bloques 8 6. Códigos de ventana deslizante Capítulo 2. 1 10 SHIFTS DE TIPO FINITO 19 1. Restricciones de tipo nito 19 2. Grafos y sus shifts 22 3. Representación de shifts de tipo nito por medio de grafos 27 4. Desdoblamiento de estados 30 Capítulo 3. 1. SHIFTS SÓFICOS 37 Presentaciones de shifts sócos Capítulo 4. 37 ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT Z A 40 1. Una métrica para 2. Sucesiones 42 3. Cilindros. Conexidad 44 4. Continuidad 45 5. Sistemas dinámicos 47 Capítulo 5. ENTROPÍA 40 50 1. Denición y propiedades básicas 50 2. Cálculo de la entropía de shifts sócos irreducibles 52 3. Los puntos períodicos y la entropía 55 4. Cálculo de la entropía de shifts sócos 57 Capítulo 6. CÓDIGOS DE ESTADOS FINITOS 61 1. Coloreo de rutas y presentaciones cerrantes a derecha 2. Códigos de estados nitos 66 3. Autovectores aproximados 67 4. Construcción de códigos de estados nitos 71 0 61 Capítulo 1 ESPACIOS SHIFT 1. Un letras. Deniciones básicas alfabeto es un conjunto nito, Un bloque, o palabra, sobre cuyos elementos se denominan un alfabeto A símbolos, o también es una sucesión nita (posiblemente A. Formalmente, una palabra u sobre A es una función u del conjunto {x ∈ N : 1 ≤ x ≤ n} en A (para algún entero n ≥ 0). En el caso n = 0, se tiene la función vacía, o sucesión vacía, que llamaremos palabra vacía y denotaremos por ε. La longitud (o largo, o tamaño) de la palabra es n, es decir, la cantidad de términos de la sucesión, y se denota por |u|. La palabra vacía tiene largo 0. Para una palabra no vacía u, el k -ésimo término de la sucesión se denota, como es costumbre, mediante uk . Entonces, una palabra no vacía de largo n sobre A es u1 u2 · · · un , con ui ∈ A para todo i ∈ {1, . . . , n}. Un bloque de longitud n se llama un n-bloque. Dos palabras u y v son iguales si tienen el mismo largo n y, para todo j entre 1 y n, es uj = vj . n El conjunto de todas las palabras de largo n sobre un alfabeto A se designa por A , y el S ∞ n ∗ ∗ conjunto de todas las palabras sobre A se designa por A . Es decir, A = n=0 A . Notar n ∗ que, para todo n ≥ 0, A es un conjunto nito, en tanto que A es un conjunto que tiene una vacía) de letras de cantidad innita de elementos. Un alfabeto que a menudo usaremos es y las palabras que sobre él pueden 0 1 . Tenemos que, en este caso, es A = {ε}, A = {000, 001, 010, 011, 100, 101, 110, 111}, etc. Además, A∗ = sucesiones binarias formarse se llaman {0, 1}, A2 = {00, 01, 10, 11}, A3 = A = {0, 1}, {ε, 0, 1, 00, 01, 10, 11, . . .}. Sea u un bloque. Un subbloque (o subpalabra) i ≥ 1 tal que ∀k ∈ Z, 1 ≤ k ≤ |w| ⇒ wk = ui+k−1 . de u es una palabra w tal que existe De la denición, se desprende que la u = u1 · · · un es un n-bloque no vacío, sus subpalabras no vacías son de la forma ui · · · uj , en donde i, j son enteros tales que 1 ≤ i ≤ j ≤ n. Si w es subbloque de u, escribimos w v u, y decimos que w ocurre en u. Obviamente, w v u ⇒ |w| ≤ |u|. Si u y v son dos bloques sobre A, la concatenación de u y v es la nueva palabra que se obtiene al escribir los símbolos de u y, a continuación, los de v , sin ningún signo especial intermedio. La concatenación de u y v se escribe uv . Notar que, en general, uv 6= vu. Es directo ver que |uv| = |u|+|v|. De manera análoga, la concatenación de tres o más bloques es la palabra palabra vacía es subbloque de cualquier palabra, y que si que se obtiene de escribir los respectivos símbolos consecutivamente. La concatenación de un n bloque u consigo mismo una cantidad n de veces se designa por u . Formalmente: n u = Por ejemplo, (01)3 = 010101, Se cumple que para todo (um )n = umn . ε uun−1 A, si n=0 n>0 013 = 0111. ∗ bloque u ∈ A y enteros y 2. Dado un alfabeto si se denomina conjunto de todas las funciones de Z en no negativos m y n, y Full shifts full shift sobre el alfabeto A, A. um un = um+n es El full shift sobre 1 A o full A-shift, se denota por A Z . al 2 1. ESPACIOS SHIFT Una función de Z A en no es más que una sucesión bi-innita de símbolos de A, que puede escribirse así: x = (xn )n∈Z = · · · x−2 x−1 x0 x1 x2 x3 · · · A = {0, 1} es la que tiene 0 en sus términos · · · 01010101010 · · · . la coordenada 0 de x, escribiremos un signo de puntuación Un ejemplo de tales sucesiones bi-innitas para impares, y 1 en sus pares, es decir, Para tener una idea de cuál es a la izquierda de x0 , así: . . . x−2 x−1 .x0 x1 x2 . . . En nuestro ejemplo anterior, escribimos · · · 010.10101010 · · · . Debe quedar claro que el signo de puntuación no es un elemento del alfabeto, ni un término de la sucesión x; es sólo una manera de representar a una referencia a sus posiciones. Z Los elementos de A reciben el nombre de xi = yi para todo entero i. AZ no contiene palabras, Notar que de modo de tener puntos. Cada punto es, entonces, una sucesión bi-innita, o tirilla bi-innita, de símbolos. Dos puntos y sólo si, · · · x−2 x−1 x0 x1 x2 · · · x = (xi )i∈Z sino sucesiones bi-innitas. e y = (yi )i∈Z A∗ y AZ son iguales si, no tienen ningún elemento en común. x = · · · x−2 x−1 x0 x1 x2 x3 · · · ∈ AZ , designamos por x[i,j] a la sucesión (nita) de los símbolos de x que van desde la coordenada i hasta la coordenada j , ambas inclusive. Es decir, x[i,j] = xi xi+1 · · · xj−1 xj . Adoptamos la convención de que para i > j , x[i,j] = ε (formalmente, x[i,j] es la función u con dominio {n ∈ Z : 1 ≤ n ≤ j − i + 1} y codominio A tal que un = xi+n−1 ). Denotamos por x[i,∞) a la sucesión innita a derecha xi xi+1 · · · , mientras que x(−∞,i] ∗ Z es la sucesión innita a izquierda · · · xi−1 xi . Dados u ∈ A y x ∈ A , decimos que u ocurre en x, o también que u es palabra o bloque de x (y lo escribimos u v x) si existen enteros i, j tales que x[i,j] = u. Notar que la palabra vacía ocurre en cualquier punto del full shift: ∀x ∈ AZ , x[1,0] = ε. El (2k + 1)-bloque central de x es x[−k,k] . ∗ ∞ Z Para un bloque no vacío u = u1 · · · un ∈ A − {ε}, designamos por u al punto x ∈ A que resulta de la concatenación innita (hacia ambos lados) de la palabra u consigo misma de modo que ∀i ∈ {0, . . . , n − 1} , xi = ui+1 : Dado u∞ = · · · uuuuu.uuuuuu · · · = · · · u1 · · · un u1 · · · un .u1 · · · un u1 · · · un · · · 0 es u1 . Por ejemplo, si u = 011, entonces u∞ = · · · 011011.011011011 · · · , · · · 0110110.11011011 · · · = (110)∞ . Obsérvese que la coordenada que no es el mismo que 2.1. La transformación shift. i de una sucesión (xi )i∈Z representa el valor de la sucesión en el minuto i. Se puede pensar en el subíndice como indicador del tiempo, de modo que xi El paso de una unidad de tiempo equivale entonces a desplazar (shift) cada coordenada de Z Z la sucesión un lugar hacia la izquierda. Esto dene una transormación natural de A en A , llamada transformación shift y denotada por σ , del siguiente modo: σ : AZ → AZ x 7→ y = σ (x) con yi = xi+1 x = (00111)∞ = · · · 00111.0011100111 · · · , entonces σ (x) = · · · 001110.011100111 · · · notación standard en teoría de sistemas dinámicos, usaremos σx para σ (x), y Por ejemplo, si Conforme a σxi (σ (x))i . es una función biyectiva. Su inversa, para σ −1 , desplaza cada posición de una sucesión un lugar k hacia la derecha. Si k es un entero positivo, σ designa a la composición de σ consigo misma k veces, y produce el efecto de desplazar todas las coordenadas de una sucesión k lugares a la k −k −1 izquierda (σ xi = xi+k ), mientras que σ es la composición de σ consigo misma k veces, −k 0 y mueve k lugares a la derecha (σ xi = xi−k ). σ se dene como la función identidad. Se k puede resumir todo diciendo que σ xi = xi+k , sea k positivo o no. Nótese que, en consecuencia, σ 3. LOS ESPACIOS SHIFT xi = σ k xi−k . k ∈ Z. Por ser composición de biyecciones, Proposición 1.1. σk 3 es una biyección de AZ , para cualquier Sean u ∈ A∗ , x ∈ AZ y k ∈ Z; se tiene que u v x ⇔ u v σ k x. Demostración. Puesto que x[i,j] = σ k x[i−k,j−k] , se tiene que u v x ⇔ ∃i, j ∈ Z : u = x[i,j] = σ k x[i−k,j−k] ⇔ u v σ k x n ≥ 1 tal que σ n x = x, se llama punto periódico para σ , y, en ese caso, n es un período de x. Para el caso particular en que n = 1 (es decir, σx = x), x se llama punto jo para σ . Todo punto periódico es de la forma u∞ , con u ∈ A∗ . ∞ En particular, un punto jo para σ es de la forma a , para algún a ∈ A. Si x es periódico de período n, también es periódico de período 2n, 3n, . . . El menor de los números positivos k tales k que σ x = x se llama período mínimo de x. Un punto x ∈ AZ para el cual existe un Sea x un punto periódico para σ de período mínimo n0 . Entonces, para cualquier entero positivo k , x tiene período kn0 . Lema 1.2. k . Para k = 1, se cumple pues n0 es un período de σ (k+1)n0 x = σ n0 σ kn0 x = σ n0 x = x, por lo que (k + 1) n0 es Demostración. Por inducción sobre x. Supongamos que un período de σ kn0 x = x. Es x. Proposición 1.3. Sea x un punto periódico para σ de período mínimo n0 . x tiene período n si, y sólo si, n es múltiplo de n0 . tiene período n. Sean n0 . Por el Lema 1.2, vemos que x = σ r σ kn0 x = Demostración. Para la ida, supongamos que n = kn0 + r con 0 ≤ r < r < n0 debe ser r = 0, y entonces n es múltiplo de x k y r tales que σ r x, pero como n0 . La vuelta es el contenido del Lema 1.2. 3. Los Espacios Shift ∗ una colección de bloques sobre un alfabeto A, es decir, F ⊆ A . Z Designamos por XF al subconjunto de A formado por todos aquellos puntos en los que Definición 1.4. Sea F no ocurre ningún bloque de F . Es decir, XF = x ∈ AZ : ∀f ∈ F, f = x ∈ AZ : ∀i, j ∈ Z, x[i,j] ∈ /F no ocurre en x x∈ / XF ⇔ ∃i, j ∈ Z : x[i,j] ∈ F . continuación, algunos ejemplos sobre A = {0, 1}: Obsérvese que A Ejemplo 1.5. Si F1 = ∅, es XF1 = AZ , pues trivialmente se tiene que Z, x[i,j] ∈ / F1 . Ejemplo 1.6. Si F2 = {0, 1}, es Ejemplo 1.7. Si F3 = {ε}, XF3 = ∅, Ejemplo 1.8. Si F4 = {0}, es XF4 = {1∞ }, pues cualquier que xi = 0, y entonces x[i,i] ∈ F4 . una coordenada i tal Ejemplo 1.9. Si xi = 0, es xi+1 = 0 o es XF2 = ∅, ∀x ∈ AZ , x[0,0] ∈ F2 . ∀x ∈ AZ , x[1,0] = ε ∈ F3 . pues pues ∀x ∈ AZ , ∀i, j ∈ ∞ F5 = {00, 01}, es XF5 = {1 } pues si un xi+1 = 1, y en cualquier caso x[i,i+1] ∈ F5 . punto x distinto de 1∞ posee punto x tiene una coordenada (01)∞ , (010)∞ , (00100010)∞ , · · · 0000.10000 · · · , · · · 00100000.00000 · · · , · · · 00001000100101.01010010001000010000010 · · · . XF6 Z es precisamente el conjunto de puntos de A que no contienen dos 1 consecutivos. Este espacio shift es conocido como el shift de la razón de oro. Ejemplo 1.10. Si F6 = {11}, algunos puntos de XF6 son 4 1. ESPACIOS SHIFT Ejemplo 1.11. Si F7 = {1n : n ≥ 2}, Ejemplo 1.12. Si F8 = A∗ , Ejemplo 1.13. Si F9 = {102n+1 1 : n ∈ N}, XF9 es es X F7 = X F6 . XF8 = ∅. es precisamente el conjunto de puntos de A tales que entre dos ocurrencias consecutivas de 1 hay una cantidad par de 0 (es decir, Z n aquellos puntos x ∈ A tales que 10 1 v x ⇒ n es par). Este espacio shift es conocido como el Z shift par. Proposición 1.14. 1. 2. 3. Sean F y F 0 subconjuntos de A∗ . Entonces: XF ∪F 0 = XF ∩ XF 0 XF ∩F 0 ⊇ XF ∪ XF 0 Si F ⊆ F 0 , entonces XF ⊇ XF 0 . Demostración. Para la primera aserción, x ∈ XF ∩ XF 0 ⇔ ∀u v x, u ∈ / F ∧u ∈ / F0 ⇔ ∀u v x, u ∈ / F ∪ F 0 ⇔ x ∈ XF ∪F 0 . Para la segunda, si x ∈ XF y u v x, se tiene que u ∈ / F , por lo que u ∈ / F ∩ F 0 , y entonces x ∈ XF ∩F 0 ; de aquí que XF ⊆ XF ∩F 0 . Análogamente, XF 0 ⊆ XF ∩F 0 , y, de las dos contenciones anteriores, es XF ∪ XF 0 ⊆ XF ∩F 0 . Para la tercera, si x ∈ XF 0 y u v x, u ∈ / F 0 ⊇ F , y entonces u ∈ / F . Por lo tanto, x ∈ XF . F ⊆ A∗ , Z de la denición de XF resulta claro que XF ⊆ A . Ahora bien, dado un Z ∗ subconjunto cualquiera X de A , ¾existirá siempre un F ⊆ A tal que X = XF ? Resulta que Dado no siempre, y aquellos X para los que sí existe tal F reciben un nombre especial y son objeto de nuestro estudio. Definición 1.15. Un existe un ∗ F ⊆A Pensamos en sobre el alfabeto A es un conjunto X ⊆ AZ tal que X = XF . tal que F espacio shift como en un conjunto de bloques prohibidos para X . Antes de ver ejemplos de subconjuntos de AZ que son o no espacios shift, veamos una propiedad importante que cumplen los conjuntos que sí lo son. Proposición 1.16. pertenece a X . Sean X un espacio shift, x ∈ X y k ∈ Z. Entonces σ k x también Demostración. Sea k F tal que X = XF . Consideremos un bloque arbitrario u que ocurra σ x. Por la Proposición 1.1, tenemos que también u ocurre en x, luego u no puede pertenecer F . Como u era un bloque arbitrario de σ k x, vemos que ningún bloque de σ k x está en F , por k k lo que σ x ∈ XF , es decir, σ x ∈ X . en a Sea X ⊆ AZ , y supongamos que existen x ∈ X y k ∈ Z tales que σ x∈ / X . Entonces X no es un espacio shift. Corolario 1.17. k Corolario 1.18. Si X es un espacio shift y k ∈ Z, entonces σ k (X) = X . y ∈ σ k (X), existe x ∈ X tal que y = σ k (x), que, de acuerdo a la k −k Proposición 1.16, está en X ; luego σ (X) ⊆ X . Esto también muestra que σ (X) ⊆ X , por k −k k k k −k lo que σ σ (X) ⊆ σ (X); pero como σ es biyectiva, se tiene que σ σ (X) = X , y k entonces tenemos que X ⊆ σ (X). Demostración. Si La propiedad de ser σ (X) = X se llama invariancia por shift o shift invariancia. Los corolarios anteriores dicen que todo espacio shift es shift invariante, o, igualmente, que un conjunto que no es shift invariante no puede ser un espacio shift. Por ejemplo, el conjunto ∞ ∞ unitario X = {(01) } no es un espacio shift pues σ (01) = (10)∞ ∈ / X . Sin embargo, la shift invariancia de un conjunto no garantiza que éste sea un espacio shift. 4. LENGUAJES 5 {0, 1} en las que hay exactamente una coordenada 1 y el resto son todas 0. Es decir, X = (xi )i∈Z : ∃k ∈ Z : (xk = 1 ∧ ∀i 6= Si x ∈ X , σx también pertenece a X , es decir, X es invariante por shift. Sin embargo, veamos que X no es espacio shift. Para arribar a una contradicción, supongamos que lo fuera. k Quiere decir que existiría un F tal que X = XF . Debe ocurrir que ∀k ≥ 1, 0 ∈ / F (pues k ∞ ∀k ≥ 1, 0 v · · · 000000.1000000 · · · ∈ X ). Pero entonces 0 pertenecería a XF , con lo cual 0∞ ∈ X , que contradice la denición de X . La contradicción proviene de suponer la existencia del conjunto F , es decir, de suponer que X es un espacio shift. Ejemplo 1.19. Sea X el conjunto de todas las sucesiones bi-innitas sobre Ejemplo 1.20. El conjunto vacío y el full shift {0, 1}Z son espacios shift, según se mostró en los ejemplos 1.5 y 1.6. En general, cualquier full shift es un espacio shift. Los conjuntos y XF6 X F4 de los ejemplos 1.8 y 1.10 son también espacios shift. Los ejemplos 1.8 y 1.9 muestran que un mismo espacio shift puede ser descripto a través de diferentes colecciones de bloques prohibidos. La restricción de σ a un espacio shift X será denotada por σX . En vistas del Corolario es una biyección de X en X . Las deniciones anteriormente dadas para puntos jos y Z periódicos de A para σ son igualmente aplicables a un espacio shift X y su respectiva σX . 1.18, σX El siguiente resultado será útil en lo sucesivo, pues arma que el conjunto de bloques prohibidos para un espacio shift puede verse como constituido por palabras de longitud al menos donde N N, es cualquier entero positivo. Sean X un espacio shift y N un entero positivo. Entonces, existe F ⊆ A tal que todo bloque en F tiene longitud al menos N , y X = XF . Proposición 1.21. ∗ Demostración. Siendo X un espacio shift, hay un F1 = w ∈ AN : ∃u ∈ F 0 : u v w F 0 ⊆ A∗ tal que X = XF 0 . Hagamos F2 = {u ∈ F 0 : |u| > N } F = F1 ∪ F 2 Es decir, F consta de todas las palabras de aquellas palabras de largo Observar que que N F0 que tengan largo mayor que N, más todas F 0. sobre el alfabeto que contengan una subpalabra que esté en F1 ∩ F2 = ∅. Es directo ver que todo bloque en F tiene largo al menos N . Veamos X = XF : x∈ / XF ⇔ ∃i, j ∈ Z : x[i,j] ∈ F ⇔ ∃i, j ∈ Z : x[i,j] ∈ F1 ∨ x[i,j] ∈ F2 ⇔ ∃i, j ∈ Z : j − i + 1 = N ∧ ∃u ∈ F 0 : u v x[i,j] ∨ j − i + 1 > N ∧ x[i,j] ∈ F 0 ⇔ ∃u ∈ F 0 : u v x ⇔ x∈ / XF 0 = X 4. Definición 1.22. Un Lenguajes lenguaje sobre un alfabeto A es cualquier subconjunto de A∗ . c ∗ es un lenguaje, designaremos por L a su complemento en A , es decir, el ∗ conjunto de todas las palabras de A que no pertenecen a L. Z Si X es un subconjunto de A (no necesariamente un espacio shift) y n un entero no En adelante, si L negativo, denotamos por de X, Bn (X) al conjunto de bloques de longitud n que ocurren en puntos es decir, Bn (X) = {u ∈ An : ∃x ∈ X : u v x} Z n Por ejemplo, si X = A , entonces Bn (X) es precisamente A . Si X = X{11} , B1 (X) = {0, 1}, B2 (X) = {00, 01, 10}, B3 (X) = {000, 001, 010, 100, 101}. es B0 (X) = {ε}, 6 1. ESPACIOS SHIFT X = XF y f ∈ F , no puede haber un n tal que f ∈ Bn (X). Es decir, ∀n ∈ N, F ∩ Bn (X) = ∅. Sin embargo, bien puede ocurrir que un bloque de longitud n que no esté en F tampoco esté en Bn (X). Nótese que si Definición 1.23. Sea X un subconjunto de AZ . El lenguaje de X , denotado por B (X), es el conjunto de todos los bloques que ocurren en puntos de B (X) = {u ∈ A∗ : ∃x ∈ X : u v x} = X. ∞ [ En otras palabras, Bn (X) n=0 Ejemplo 1.24. B X{11} = {ε, 0, 1, 00, 01, 10, 000, 001, 010, 100, 101, . . .}. Ejemplo 1.25. Sean X1 = {(01)∞ , (10)∞ } y X2 = {(01)∞ }; se tiene que B (X1 ) = {ε, 0, 1, 01, 10, 010, 101, 0101, 1010, . . .} = B (X2 ) a pesar de que X1 6= X2 ; notar, sin embargo, que X1 es un espacio shift, mientras que X2 no lo es. Así como F se interpretaba como un conjunto de bloques prohibidos para conjunto de bloques permitidos para shift X, decimos de él que permitido en X . XF . XF , B (XF ) es el Cuando un bloque está en el lenguaje de un espacio ocurre en X , o que aparece en X , o que está en X , o que está X = XF , entonces F ∩ B (X) = ∅. esté en F tampoco esté en B (X). Una consideración análoga a la de más arriba: si embargo, bien puede ocurrir que un bloque que no Sin Si un bloque está en el lenguaje de un espacio shift, la denición nos dice que hay un punto del espacio en el cual, en determinada posición, encontramos ese bloque. Sin embargo, usando shift invariancia, podemos ver que el bloque aparece en algún punto del espacio en la coordenada que uno quiera. Proposición 1.26. Sean X un espacio shift, u un bloque en B (X), y k un entero. Entonces, existe x ∈ X tal que x[k,k+|u|−1] = u. u ∈ B (X), existe x0 ∈ X tal que u v x0 , es decir, hay un i ∈ Z tal que x0[i,i+|u|−1] = u. Hagamos x = σ i−k x0 . Por Proposición 1.16, x pertenece a X , y x[k,k+|u|−1] = σ i−k x0[k,k+|u|−1] = x0[i,i+|u|−1] = u. Demostración. Dado que No cualquier lenguaje (en el sentido de la denición 1.22) es el lenguaje de algún espacio shift. Por ejemplo, resulta directo ver que el lenguaje de un espacio shift no vacío es un conjunto ∗ innito, de modo que un subconjunto nito no vacío de A no puede ser el lenguaje de ningún espacio shift sobre A. Buscamos caracterizar a aquellos lenguajes que son los lenguajes de los espacios shift. Sean X un espacio shift y B (X) su lenguaje. Si v ∈ B (X), entonces: cualquier subbloque de v pertenece también a B (X). hay bloques u y w no vacíos en B (X) tales que uvw ∈ B (X). Proposición 1.27. 1. 2. v ∈ B (X), existen i, j ∈ Z y x ∈ X tales que v = x[i,j] . Si v 0 v v , v 0 ocurre también en x, de modo que v 0 ∈ B (X). Además, haciendo u = xi−1 y w = xj+1 , se tiene que u y w son bloques no vacíos que están en B (X) y que uvw = x[i−1,j+1] v x, por lo que uvw ∈ B (X). Demostración. Como La proposición anterior establece condiciones necesarias para los bloques del lenguaje de un espacio shift. Resulta que esas condiciones son también sucientes: cualquier lenguaje cuyas palabras satisfagan esas condiciones, es el lenguaje de algún espacio shift. Proposición 1.28. Sea L un lenguaje con la propiedad de que para todo v ∈ L: (a) cualquier subbloque de v está en L, y (b) hay bloques no vacíos u y w en L tales que uvw está en L. Entonces L es el lenguaje de algún espacio shift. 4. LENGUAJES Demostración. Consideremos el espacio shift 7 X = XLc , y veriquemos que B (X) = L. Lo haremos por doble inclusión: v ∈ B (X), existe x ∈ X tal que v v x, de modo que v ∈ / Lc , o sea que v ∈ L. Sea ahora v un bloque de longitud n en L, digamos v = x0 · · · xn−1 . Por aplicación de la condición (b), hay bloques u y w , cuyos símbolos denotaremos, respectivamente, x−j · · · x−1 y xn · · · xk tales que el bloque v 0 = uvw = x−j · · · x−1 x0 · · · xn−1 xn · · · xk está en L. Aplicando 0 0 0 nuevamente la condición (b) a v hay bloques u = x−j 0 · · · x−j−1 y w = xk+1 · · · xk0 tales que el bloque x−j 0 · · · x−j−1 x−j · · · x−1 x0 · · · xn−1 xn · · · xk xk+1 · · · xk0 está en L. Continuando de esta manera, tenemos denido xi para todo entero i, de modo tal que el punto x = (xi )i∈Z cumple que todos sus bloques están en L, y v = x[0,n−1] . Luego, x ∈ XLc , ya que ningún bloque de x c está en L , y v v x, por lo que v ∈ B (XLc ) = B (X). Si De las dos proposiciones anteriores, vemos que un subconjunto de A∗ es el lenguaje de algún espacio shift si, y sólo si, todos sus bloques cumplen las propiedades (a) y (b) enunciadas en la Proposición 1.28. Hay una correspondencia biunívoca entre el conjunto de todos los espacios shift y el conjunto de todos los lenguajes de espacios shift. Es decir, el lenguaje de un espacio shift determina completamente a ese espacio shift. Dicho de otro modo, no hay dos espacios shift distintos que tengan el mismo lenguaje, según veremos a continuación. Proposición 1.29. Sea X ⊆ AZ . X es un espacio shift si, y sólo si, X = XB(X)c . Demostración. La vuelta es consecuencia inmediata de la denición de espacio shift. Demostraremos la ida por doble inclusión: todos sus bloques están en B (X) (por la denición de c ninguno de ellos está en B (X) , y así x ∈ XB(X)c . Si x x ∈ X, B (X)), de modo que Para la otra contención, dado que X es un espacio shift, hay un F tal que X = XF . Si ∈ XB(X)c y v v x, v ∈ / B (X)c , es decir, v ∈ B (X), por lo que v ∈ / F . Como v era un bloque arbitrario de x, hemos demostrado que ningún bloque de x está en F, por lo que quedando probada la otra inclusión. Corolario 1.30. x ∈ XF = X , Sean X1 y X2 espacios shift. Entonces, X1 = X2 ⇔ B (X1 ) = B (X2 ). Demostración. La ida es inmediata de la denición de lenguaje de un espacio shift. B (X1 ) = B (X2 ), X1 = XB(X1 )c = XB(X2 )c = X2 Para la vuelta, suponiendo que proposición anterior, En este corolario, es esencial que X1 y X2 tenemos que B (X1 )c = B (X2 )c , y, por la sean espacios shift (ver ejemplo 1.25). Todos estos resultados muestran que si bien un mismo espacio shift X puede ser descripto a través de varios conjuntos prohibidos, hay un conjunto de bloques prohibidos maximal, que es el complemento del lenguaje de ese espacio shift: cualquier c que F ⊆ B (X) , pues ya sabemos que F ∩ B (X) = ∅. F tal que X = XF cumple con Resumimos la correspondencia entre espacios shift y lenguajes de espacios shift a través de las siguientes ecuaciones: L = B (XLc ) X = XB(X)c La Proposición 1.29 tiene otro útil corolario, que dice que si un punto sus bloques en el lenguaje de un espacio shift a X, entonces el punto x x de AZ tiene todos necesariamente pertenece X. Corolario 1.31. Demostración. X = XB(X) c, Sea X un subconjunto de AZ . X es un espacio shift si, y sólo si, ∀x ∈ AZ , ∀i, j ∈ Z, x[i,j] ∈ B (X) ⇒ x ∈ X Z Notemos que ∀x ∈ A , ∀i, j ∈ Z, x[i,j] ∈ B (X) ⇒ x ∈ X si, y sólo de modo que el corolario se deduce directamente de la Proposición 1.29. si, 8 1. ESPACIOS SHIFT 4.1. Irreducibilidad. v ∈ B (X). Por la Proposición 1.28, v puede ser extendido hacia ambos lados para formar un bloque uvw que también está en el lenguaje de X . Ahora bien, dados dos bloques u y w en B (X), puede no ser posible encontrar un bloque v tal que uvw esté en B (X). Ejemplo 1.32. Sea 1 Supongamos que X es un espacio shift, y que y tomemos u y w en B (X). Ni u ni w pueden contener dos · · · 00000u0w0000000 · · · no contiene dos 1 consecutivos, y B (X). X = X{11} , consecutivos. Entonces, el punto por eso el bloque u0w está en X = {0∞ , 1∞ }. Se tiene Sin embargo, no hay ningún bloque v tal que 1v0 contiene simultáneamente un 0 y un 1. Ejemplo 1.33. Sea que u = 1 y w = 0 B (X). punto de X están ambos en esté en el lenguaje, pues ningún Los espacios shift en los que dos bloques del lenguaje pueden ser enganchados a través de un tercer bloque forman una clase importante de espacios shift. X es irreducible si para cualquier par de bloques u y B (X) tal que uvw pertenece a B (X). Un espacio shift que Definición 1.34. Un espacio shift w en B (X), existe un bloque no es irreducible se llama v en reducible. El espacio shift del ejemplo 1.32 es irreducible, en tanto que el del ejemplo 1.33 es reducible. 5. Shifts de bloques Hemos denido un alfabeto como un conjunto nito de símbolos, sin exigir nada en especial A es un alfabeto y N es un entero positivo, cae también en la categoría N N de alfabeto el conjunto A . Por claridad notacional, cuando estemos pensando en A como a los símbolos. Si alfabeto, representaremos su símbolos de la forma aN ... a 2 a1 a1 a2 · · · aN . Nótese que cada ai ∈ A. AN es un alfabeto (cuyos elementos son en realidad bloques sobre otro alfabeto), N N Z Z tenemos derecho a pensar en la full A -shift, es decir, A . Dado un punto x de A , hay N Z que de manera bastante natural pueden asociarse a x. Los llamaremos, dos puntos de A respectivamente, βN (x) y γN (x). El siguiente diagrama ilustra cómo se obtienen a partir de x: en lugar de Ya que x = ··· x−1 βN (x) = · · · γN (x) = · · · xN −2 . . . x0 x−1 x−1 x0 . . . . . x −N +1 x−N Nótese que, a partir de cada posición. . βN (x), xN −1 . . . x1 x0 xN −1 . . . x1 x0 x1 xN x2 ... x 2 x1 x2N −1 xN +1 . . . x3 x2 x3N −1 ··· x3 xN +2 . . . x4 x3 x4N −1 ··· . . . . . . . . . ··· x x x N +1 2N +1 3N +1 xN x2N x3N es posible recuperar x, leyendo los símbolos inferiores de 5. SHIFTS DE BLOQUES βN Formalizamos la denición de y de γN : 9 Ambas son funciones de AZ en AN Z , y se denen mediante: xi+N −1 (βN (x))i = βN (x) se llama la . . . xi+1 xi (γN (x))i = x(i+1)N −1 . . . xiN +1 xiN presentación en bloques de tamaño N , con solape, del punto x. El término solape se reere al hecho de que dos coordenadas consecutivas cualesquiera de βN (x) consisten en bloques u = u1 · · · uN y v = v1 · · · vN con u2 · · · uN = v1 · · · vN −1 . Cuando dos bloques u y v cumplen esto, es decir, que la cola de u (lo que queda de u luego de eliminar el primer símbolo) es igual a la cabecera de v (lo que queda de v luego de eliminar el último símbolo), decimos que u y v solapan progresivamente. Entonces, dos símbolos consecutivos de βN (x), vistos como bloques sobre A, solapan progresivamente, y de allí el nombre para βN . γN (x) se llama la presentación en bloques de tamaño N , sin solape, del punto x, por la razón de que no necesariamente se cumple la condición de solape progresivo entre coordenadas consecutivas de γN (x). Las deniciones anteriores pueden generalizarse de la siguiente manera: X un espacio shift y N un entero positivo. Hagamos AN X = BN (X). N Z βN : X → AX mediante xi+N −1 . . . (βN (x))i = x Definición 1.35. Sean Se dene la función i+1 xi La imagen de X a través de [N ] se denota X . Es decir, Análogamente, se dene la βN se llama presentación en N -bloques de X , con solape, y X [N ] = {βN (x) : x ∈ X} = βN (X) N Z mediante función γN : X → AX x(i+1)N −1 . . . (γN (x))i = x iN +1 xiN La imagen de X a través de N se denota X . Es decir, γN se llama presentación en N -bloques de X , sin solape, X N = {γN (x) : x ∈ X} = γN (X) 0 1 0 2 Ejemplo 1.36. Sea X = X{11} . Entonces, AX = , , . 0 0 1 Si x = · · · 000.01010 · · · , entonces 0 0 0 1 0 1 0 β2 (x) = · · · . ··· 0 0 0 0 1 0 1 γ2 (x) = ··· 0 0 . 1 0 1 0 ··· X [2] = XF1 y que X 2 = XF2 con 0 0 1 0 1 1 0 0 F1 = , , , 0 1 0 0 0 0 1 1 Se puede mostrar que y 10 1. ESPACIOS SHIFT F2 = (notar que F1 tiene cuatro elementos, y F2 1 0 0 1 uno). Por cuestiones de codicación que más adelante detallaremos, de ahora en más estaremos más interesados en las presentaciones con solape que en las sin solape. Nótese que la función −1 βN actúa inyectivamente, de modo que es una biyección entre X y X [N ] . De este modo, βN es [N ] una función bien denida desde X hacia X , o, más generalmente, desde el conjunto de todos N Z Z los puntos de A cuyos símbolos consecutivos solapan progresivamente hacia A . Será conveniente sobrecargar el símbolo βN , manera: para w = w1 · · · wm m ≥ N, wN ... βN (w) = w con 2 denimos w1 Es directo ver que βN βN se pueda conN , de la siguiente de manera que la función siderar también para actuar sobre bloques de tamaño mayor o igual que wN +1 . . . w3 w2 wm ··· . . . w m−N +2 wm−N +1 actúa sobre bloques en forma inyectiva: u 6= u0 ⇒ βN (u) 6= βN (u0 ). Las presentaciones con (o sin) solape de cualquier espacio shift son también espacios shift. Sea X un espacio shift sobre el alfabeto A. Para todo N ≥ 1, X [N ] es un espacio shift sobre el alfabeto BN (X). Proposición 1.37. F 0 tal que X = XF 0 . En virtud de la Proposición 1.21, podemos 0 suponer que cada bloque de F tiene largo al menos N . Hagamos F1 = {βN (w) : w ∈ F 0 } F2 = uv ∈ (BN (X))2 : u y v no solapan progresivamente Demostración. Sea F = F1 ∪ F 2 X [N ] = XF , con lo que quedará establecido que X [N ] es un espacio shift. [N ] Primero veamos que X ⊆ XF1 . Sea x e ∈ X [N ] , y u e un bloque en x e. Existe x ∈ X tal que βN (x) = x e, por lo que hay un bloque u de x tal que βN (u) = u e. Dado que que βN es inyectiva y que u ∈ / F 0 , vemos que u e∈ / F1 . Como u e era arbitrario, x e ∈ XF1 . [N ] Ahora veamos que X ⊆ XF2 : sabemos que si x e ∈ X [N ] , ocurre que ∀i ∈ Z, x ei y x ei+1 solapan progresivamente. Entonces, ningún bloque de x e de tamaño 2 puede estar en F2 (que tiene sólo bloques de tamaño 2), por lo que x e ∈ X F2 . [N ] Como X ⊆ XF1 y X [N ] ⊆ XF2 , se tiene, usando la Proposición 1.14, que X [N ] ⊆ XF1 ∩ XF2 = XF1 ∪F2 = XF . [N ] Veamos ahora que XF ⊆ X : sea x e ∈ XF = XF1 ∪F2 = XF1 ∩ XF2 . Entonces, x e ∈ XF1 y −1 Z x e ∈ XF2 . Como x e ∈ XF2 , podemos hacer x = βN (e x), el cual pertenece a A ; pero dado que x e ∈ XF1 , debe ser x ∈ XF 0 = X , y entonces x e ∈ X [N ] . y veriquemos que 6. Códigos de ventana deslizante En Teoría de Códigos, interesan las maneras que hay de traducir un mensaje (fuente) sobre un alfabeto A en mensaje sobre otro alfabeto U (posiblemente el mismo que el del mensaje fuente). Esto puede ser visto (sobre todo si el mensaje fuente es largo) como una manera de transformar puntos de un espacio shift en puntos de otro espacio shift, a través de una función. De las maneras en que esto se puede hacer, hay una clásica que explicamos seguidamente. Supongamos dados dos enteros Φ m y n, con m + n ≥ 0, y supongamos también dada una + n + 1 sobre A en símbolos de U . Entonces, y ∈ U Z es mirar el bloque que hay en una que transforma bloques de tamaño m Z una manera de transformar un x ∈ A en un función 6. CÓDIGOS DE VENTANA DESLIZANTE ventana de ancho la función m+n+1 alrededor de la coordenada i-ésima de 11 x y aplicarle a ese bloque Φ para obtener la correspondiente coordenada del transformado. Más concretamente, y será Φ x[i−m,i+n] . Para calcular luego la (i + 1)-ésima coordenada la i-ésima coordenada de de y, desplazamos toda la ventana una posición a la derecha, y repetimos. Llevando esto a cabo para todo i ∈ Z, obtenemos el transformado de la ventana, transformar usando Φ x. Esta operación de ver el contenido de y deslizar, motiva que la función transformadora reciba el nombre de código de ventana deslizante, que abreviaremos CVD. Formalmente: m, n ∈ Z con m + n ≥ 0, A y U alfabetos, X un espacio shift sobre A, y Φ una función de Bm+n+1 (X) en U . El código de ventana deslizante con memoria m y anticipación n inducido por Φ es la transformación φ : X → U Z denida por y = φ (x) con yi = Φ x[i−m,i+n] . Definición 1.38. Sean Notar, en la denición de arriba, la distinción tipográca entre φ (que transforma tirillas Φ (que transforma bloques de tamaño m + n + 1). Decimos que φ es inducida por Φ, o que Φ induce a φ, y, para expresar este hecho, escribimos φ = Φ[−m,n] . La función ∞ Φ se llama función de bloques, o función inductora, de φ. De los números m y n decimos que son, respectivamente, la memoria y la anticipación de φ (o también de Φ), por el hecho bi-innitas) y de que indican cuántas coordenadas del pasado y del futuro hay que conocer para obtener el transformado en la posición que corresponde al presente. Ejemplo 1.39. A = {0, 1} , U = {A, B, C} , m = 1, n = 2, X = X{110,101} , Φ : B4 (X) → U dada por Φ (0000) = A Φ (0001) = A Φ (0010) = B Φ (0011) = A Φ (0100) = C Φ (1000) = B Φ (1001) = C Φ (1111) = A [−m,n] φ = Φ∞ y x = · · · 001.000010010001 · · · , tenemos que φ (x) = · · · BC.BAABCCBCBA · pues φ (x)−2 = Φ x[−2−m,−2+n] = Φ x[−3,0] = Φ (0010) = B , φ (x)−1 = Φ x[−1−m,−1+n] = Φ x[−2,1] =Φ (0100) = C , φ (x)0 = Φ x[0−m,0+n] = Φ x[−1,2] = Φ (1000) = B , φ (x)1 = Φ x[1−m,1+n] = Φ x[0,2] = Φ (0000) = A, y así. Entonces, si A, U, X, x y Φ iguales que en el ejemplo anterior, excepto que m = 0, n = 3. φ (x) = · · · BCB.AABCCBCBA · · · Ejemplo 1.40. En este caso, Ejemplo 1.41. 1 = Φ (1), y F = A = {0, 1} = U, X = AZ , m = 0 = n, Φ : B1 (X) → U x ∈ AZ , F (x) = 1∞ . [−m,n] Φ∞ . Entonces, para todo dada por Φ (0) = A cualquier alfabeto, X cualquier espacio shift sobre A, U = A, m = 0, n = [−m,n] 1, Φ (ab) = b, φ = Φ∞ . Entonces, φ = σX , pues, para x ∈ X, φxi = Φ (xi xi+1 ) = xi+1 = σX (x)i . Ejemplo 1.42. A cualquier alfabeto, X cualquier espacio shift sobre A, U = A, m = 1, n = [−m,n] −1 0, Φ (ab) = a, φ = Φ∞ . Entonces, φ = σX , pues, para x ∈ X, φxi = Φ (xi−1 xi ) = xi−1 = −1 σX (x)i . Ejemplo 1.43. U = AN (N ≥ 1), X cualquier espacio shift sobre A, y φ = βN (la presentación en N -bloques con solape de X ). Entonces φ es un CVD con memoria 0 y anticipación N − 1 inducido por Φ denida como aN Φ (a1 · · · aN ) = ... a1 Ejemplo 1.44. A cualquier alfabeto, 12 1. ESPACIOS SHIFT Ejemplo 1.45. En relación al ejemplo anterior, X, con memoria y anticipación 0, inducido por Φ aN . . . −1 βN es también un CVD desde Φ denida X [N ] hacia como = a1 a1 Al igual que con la transformación shift obligatoriamente) la notación Los CVD para los cuales σ , si φ es un CVD, φxi para (φ (x))i . emplearemos (aunque no φx para φ (x) y m = 0 = n se llaman códigos monobloque, dado que actúan mirando bloques que tienen un solo símbolo (el que corresponde al presente). Y Si un CVD φ con dominio X es tal que φ (X) es un subconjunto de algún espacio shift ⊆ U Z , podemos mirar a φ como una función entre los espacios shift X e Y , y diremos entonces que el CVD es un código entre los espacios shift X e Y. φ entre dos espacios shift X e Y es un CVD. Para que lo sea, debemos Φ : Bm+n+1 (X) → B1 (Y ) tal que ∀x ∈ X, ∀i ∈ Z, φxi = posible el hallazgo de una función inductora, φ no es un CVD. No cualquier función m, encontrar un Φ x[i−m,i+n] un n . Si no es Ejemplo 1.46. y una A = {0, 1} = U, X = AZ , Y = U Z , φ : X → Y ∞ ∞ 0 si x = 0 φ (x) = 1∞ si x 6= 0∞ denida por φ no es un CVD. Supongamos que lo fuera. Debe haber una función inductora Φ m y anticipación n. Sea x = (xi )i∈Z denido por xn+1 = 1, y xi = 0 para todo ∞ i 6= n + 1. Ya que )0 = 0 (pues φ0∞ = 0∞ ), debe ser Φ (0m+n+1 ) = 0. Pero entonces es (φ0 m+n+1 φx0 = Φ x[−m,n] = Φ (0 ) = 0. Contradicción, pues por la denición de φ se tiene que ∞ φ (x) = 1 , de donde φx0 = 1. Veamos que con memoria A veces será conveniente agrandar el ancho de la ventana para la función inductora (sin modicar, obviamente, el CVD en cuestión). Para hacer esto, simplemente debemos ignorar las coordenadas añadidas a la ventana. Esto es lo que dice el siguiente resultado: Proposición 1.47. Sea φ : X → Y un código de ventana deslizante con memoria m y anticipación n. Sean M ≥ m y N ≥ n. Entonces existe un código de ventana deslizante φe : X → Y con memoria M y anticipación N tal que φe = φ. Demostración. Sea Φ : Bm+n+1 (X) → B1 (Y ) la función inductora de φ. e Φ : BM +N +1 (X) → B1 (Y ) mediante e (a−M a−M +1 · · · a−m · · · a−1 a0 a1 · · · an · · · aN ) = Φ (a−m · · · a0 · · · an ) Φ Denamos ] e i=Φ e [−M,N e x[i−M,i+N ] = φe = Φ . Sea x ∈ X . Para cualquier i ∈ Z, se tiene que φx ∞ e = φx. Como x es arbitrario, se sigue que φe = φ. Φ x[i−m,i+n] = φxi , y entonces φx y hagamos Dado un código de ventana deslizante, se puede suponer que su memoria es igual a su anticipación. Corolario 1.48. m y anticipación n inducido por una transformación de bloques Φ (que transforma bloques de tamaño m + n + 1 en símbolos), se puede denir, de manera ∗ natural, una función Φ que transforma bloques de tamaño m + n + k (k ≥ 1), haciendo Dado un CVD con memoria Φ∗ (a−m a−m+1 · · · a0 a1 · · · an−1 an an+1 · · · an+k−1 ) = Φ (a−m · · · an ) Φ (a−m+1 · · · an+1 ) · · · Φ (ak−m−1,n+k−1 ) Si además convenimos en que Φ∗ , aplicado a un bloque de tamaño menor que produce la palabra vacía, tenemos que, para ∗ Φ (a1 · · · ap ) = p ≥ 0, es ε Φ (a1 · · · am+n+1 ) Φ∗ (a2 · · · ap ) si si p<m+n+1 p≥m+n+1 m+n+1 6. CÓDIGOS DE VENTANA DESLIZANTE Φ y Φ∗ 13 son funcionalmente tan parecidas que en general usaremos la misma notación Φ para referirnos a ambas. Un hecho importante a tener en cuenta es que la composición de CVD es otro CVD. Proposición 1.49. Sean X , Y y Z espacios shift, y supongamos que φ1 : X → Y y φ2 : Y → Z son códigos de ventana deslizante. Entonces φ2 ◦ φ1 es un código de ventana deslizante desde X hacia Z . n1 , y φ2 inducido por Φ2 con memoria m2 y anticipación n2 . Sea φ : X → Z denido por φx = φ2 (φ1 x). 0 Designemos por φ al CVD con memoria m1 + m2 y anticipación n1 + n2 inducido por la función Φ : Bm1 +m2 +n1 +n2 +1 (X) → B1 (Z) denida por Demostración. Supongamos φ1 inducido por Φ1 con memoria m1 y anticipación Φ (a−m1 −m2 · · · a0 · · · an1 +n2 ) = Φ2 (Φ1 (a−m1 −m2 · · · a0 · · · an1 +n2 )) Φ1 corresponde en realidad a Φ∗1 como se denió antes). Para x ∈ X y para cualquier i ∈ Z es 0 φ xi = Φ x[i−m2 −m1 ,i+n2 +n1 ] = Φ2 Φ1 x[i−m2 −m1 ,i+n2 +n1 ] = Φ2 (φ1 x)[i−m2 ,i+n2 ] = φ2 (φ1 x)i = φxi (nótese que de modo que φ0 x = φx. Luego, φ = φ2 ◦ φ1 es un CVD. El enuncado anterior, junto a los ejemplos 1.42 y 1.43, permite ver que para cualquier espacio −k k X y cualquier k ≥ 1, σX y σX son CVD. Si φ : X → Y es un CVD y x ∈ X , entonces calcular φ a la sucesión desplazada σX (x) da shift lo mismo que desplazar la sucesión φ (x) usando σY . Esta propiedad de conmutar con las σ es una de las claves para saber si una transformación es un CVD. Sean X e Y dos espacios shift, y k un entero. Si φ es un código de k = σYk ◦ φ, es decir, el siguiente diagrama conmuta: ventana deslizante, entonces φ ◦ σX Proposición 1.50. X ↓φ Y k σX −→ σYk −→ X φ ↓ Y φ es inducido por Φ con memoria m y anticipación k k ∀x ∈ X, φ σ . Sea entonces i ∈ Z. Se tiene que X (x) = σY (φ (x)) k k φ σX (x) i = Φ σX (x) [i−m,i+n] = Φ x[i−m+k,i+n+k] = Φ x[(i+k)−m,(i+k)+n] = (φx)i+k = Demostración. Supongamos que n. Debemos probar que σYk (φx)i . Como i es arbitrario, se tiene lo deseado. La condición de conmutar con σ es necesaria, pero no suciente, para que una transformación sea CVD. El Ejemplo 1.46 sirve para demostrarlo, pues ya hemos visto que la función allí Z ∞ ∞ estudiada no es un CVD, y sin embargo conmuta con σ : sea x ∈ {0, 1} ; si x = 0 , es σx = 0 = ∞ ∞ ∞ φx, por lo que σ (φ (x)) = 0 = φ (σx); y si x 6= 0 , es σx 6= 0 , por lo que φx = φ (σx) = 1∞ , ∞ teniendo entonces que σ (φx) = 1 = φ (σx); resumiendo, ∀x ∈ {0, 1}Z , σ (φx) = φ (σx). Los siguientes resultados establecen condiciones necesarias y sucientes para que una transformación entre dos espacios shift sea un CVD. Lema 1.51. Sean X e Y dos espacios shift, y φ una función de X en Y tal que φ◦σX = σY ◦φ. −1 = σY−1 ◦ φ. Entonces φ ◦ σX σX y σY son biyecciones, se tiene que σY−1 ◦ σY y σY ◦ σY−1 −1 −1 son la identidad en Y , así como σX ◦ σX y σX ◦ σX son la identidad en X . De allí que −1 −1 −1 −1 −1 −1 φ ◦ σX = σY ◦ σY ◦ φ ◦ σX = σY ◦ (σY ◦ φ) ◦ σX = σY−1 ◦ (φ ◦ σX ) ◦ σX = σY−1 ◦ φ ◦ −1 σX ◦ σX = σY−1 ◦ φ, como se quería probar. Demostración. Puesto que 14 1. ESPACIOS SHIFT Sean X e Y dos espacios shift, y φ una función de X en Y tal que φ◦σX = σY ◦φ. k Entonces, para todo k ∈ Z, φ ◦ σX = σYk ◦ φ. Lema 1.52. 0 0 σX y σY son, respectivamente, la identidad en X y en Y , la k k proposición se cumple para k = 0. Lo que resta probar es, entonces, que ∀k ≥ 1, φ ◦ σX = σY ◦ φ −k −k y φ ◦ σX = σY ◦ φ. Lo haremos por inducción sobre k . Para k = 1, es cierto por hipótesis y por Lema 1.51. Suponiendo válido para k , veamos que vale para k + 1: k+1 k φ ◦ σX = φ ◦ σX ◦ σX = σYk ◦ φ ◦ σX = σYk ◦ (φ ◦ σX ) = σYk ◦ (σY ◦ φ) = σYk+1 ◦ φ −k−1 −k −1 −1 −1 φ ◦ σX = φ ◦ σX ◦ σX = σY−k ◦ φ ◦ σX = σY−k ◦ φ ◦ σX = σY−k ◦ σY−1 ◦ φ = σY−k−1 ◦ φ Demostración. Ya que Proposición 1.53. Sean X e Y dos espacios shift, y φ una función de X en Y . φ es un código de ventana deslizante si, y sólo si, las dos condiciones siguientes se satisfacen simultáneamente: 1. φ ◦ σX = σY ◦ φ. 2. Existen un entero N ≥ 0 y una función Φ : B2N +1 (X) → B1 (Y ) tales que para todo x ∈ X , (φx)0 = Φ x[−N,N ] . Demostración. Para la ida, supongamos que es inducida por Φ con memoria y anti- x en X , (φx)0 = Φ x[−N,N ] . Además, la Proposición 1.50 con k = 1 muestra que φ ◦ σX = σY ◦ φ. Para la vuelta, supongamos que φ ◦ σX = σY ◦ φ y que existen N ≥ 0 y una función Φ : B2N +1 (X) → B1 (Y ) tales que para todo x ∈ X, (φx)0 = Φ x[−N,N ] . Sean x ∈ X e i ∈ Z. cipación N (hemos φ apelado al Corolario 1.48), de modo que para cualquier Por el lema 1.52, se tiene que i i (φx)i = σYi (φx) 0 = φ σX x 0 = Φ (σX x)[−N,N ] = Φ x[i−N,i+N ] lo cual muestra que φ es CVD inducido por Φ con memoria y anticipación N. N ≥ 0 tal que (φx)0 −N y N . La negación de esta condición signica que para todo N ≥ 0, existen x, y ∈ X tales que x[−N,N ] = y[−N,N ] pero (φx)0 6= (φx)0 . La segunda condición de la proposición anterior establece que existe es función de lo que 6.1. e Y x contiene entre las coordenadas Inmersiones, factores y conjugaciones. dos espacios shift, y Definición 1.54. inyectivo. Se dice que φ una función de X en Para las siguientes deniciones, sean X Y. φ es una inmersión de X en Y si φ es un código de ventana deslizante X está inmerso en Y si existe una inmersión de X en Y . código factor de X sobre Y si φ es un código de ventana deslizante sobreyectivo. Se dice que Y es un factor de X si existe un código factor de X sobre Definición 1.55. φ es un Y. Definición 1.56. biyectivo. Se dice que de X a φ es una conjugación de X a Y si φ es un código de ventana deslizante X es conjugado a Y (simbolizado X ∼ Y ) si existe una conjugación Y. −1 Por ejemplo, σX y σX son conjugaciones de −1 βN es una conjugación de X [N ] a X . X a X , βN es una conjugación de X a X [N ] , y De la denición, se ve que toda conjugación es una función biyectiva. Sin embargo, no es cierto en general que cualquier función biyectiva entre dos espacios shift sea una conjugación. ∞ ∞ ∞ ∞ ∞ Por ejemplo, sean X = {0 , 1 } , Y = {(01) , (10) } y φ : X → Y dada por φ (0 ) = ∞ ∞ (01) , φ (1∞ ) = (10) . φ es una función biyectiva, pero no es una conjugación pues no es ∞ ∞ un CVD (condición indispensable para ser conjugación), ya que σY (φ (0 )) = σY ((01) ) = ∞ ∞ ∞ (10) 6= (01) = φ (0∞ ) = φ (σX ((01) )), es decir, φ no conmuta con σ . 6. CÓDIGOS DE VENTANA DESLIZANTE 15 La denición establece que una conjugación es un CVD biyectivo (por lo cual, toda conjugación es también un código factor y una inmersión), y esto nos permite garantizar sólo que su inversa es una función biyectiva (pero, por lo visto hasta aquí, no necesariamente un CVD). −1 Más adelante, demostraremos que si φ es conjugación, φ es un CVD (y, en consecuencia, también es una conjugación). Proposición 1.57. La composición de dos conjugaciones es otra conjugación. Demostración. Se deduce directamente de la Proposición 1.49 y del hecho que la com- posición de funciones biyectivas es una función biyectiva. −k k σX y σX son también conjugaciones de X −1 k ≥ 0, pues σX y σX lo son. Como consecuencia, shift X y cualquier a X , para cualquier espacio Veamos la acción de un CVD sobre los puntos periódicos de un espacio shift. El siguiente resultado muestra que las inmersiones (y en consecuencia las conjugaciones) preservan el mínimo período de un punto periódico. Sean φ : X → Y un código de ventana deslizante, x ∈ X un punto periódico período n para σX , e y = φx. Entonces y tiene también período n para σY , y el mínimo período de y divide al mínimo período de x. Si φ es además una inmersión, el período mínimo de y es igual al período mínimo de x. Proposición 1.58. n σX (x) = x, tenemos que, por la propiedad de conmutar φ con n n σ , φx = φ (σX (x)) = σY (φx), es decir, y = σYn (y). Entonces y tiene período n para σY . Si x tiene mínimo período n0 , entonces y tiene período n0 , y el mínimo período de y divide a n0 . Si n φ es inyectiva, tenemos que σX (x) = x si, y sólo si, σYn (φx) = φx (la ida está demostrada al n n n principio, y para la vuelta: σY (φx) = φx ⇒ φ (σX (x)) = φx ⇒ σX (x) = x por la inyectividad de φ). Entonces, x tiene período n si, y sólo si, y tiene período n. Dicho de otro modo, el conjunto de períodos para x es el mismo que el conjunto de períodos para y , de manera que el período mínimo de x es el mismo que el período mínimo de y . Demostración. Ya que De esta proposición se deduce que dos espacios shift que no tienen la misma cantidad n (cualquiera sea n) no pueden ser conjugados. Es decir, la n de un espacio shift es un invariante por conjugación: ∀n > 0, X ∼ Y ⇒ |{x ∈ X : x tiene período n}| = |{x ∈ Y : x tiene período n}|. 6.1.1. Recodicación a códigos monobloque. Sea φ : X → Y un CVD. Mostraremos cómo e conjugado a X y φ a un CVD monobloque φe de X e a es posible recodicar X a un shift X Y . Este procedimiento se denomina recodicación de φ a un código monobloque, y será de puntos periódicos de período cantidad de puntos de período usado en varias demostraciones posteriores. Proposición 1.59. Sea φ : X → Y un código de ventana deslizante. Entonces existe un e , una conjugación ξ de X a X e y un código de ventana deslizante monobloque espacio shift X −1 e e φ : X → Y tales que ξ es una conjugación y φe ◦ ξ = φ. Si además φ es una conjugación, φe también lo es. φ es inducida ◦ βm+n+1 . Dado Φ con memoria m y anticipación n. −m Tomemos y ξ = que σ e y βm+n+1 son conjugaciones, y X e . Su inversa ξ −1 : X e →X teniendo en cuenta la Proposición 1.57, ξ es conjugación de X a X −1 −1 −1 m m está dada por ξ = βm+n+1 ◦ σXe , y es otra conjugación pues βm+n+1 y σXe lo son. Denamos e → Y mediante φe = φ◦ξ −1 . Tenemos que φe es CVD, por ser la composición de dos CVD, y φe : X −1 e e e e → B1 (Y ) cumple que φ◦ξ = φ◦ξ ◦ξ = φ. Además, una función inductora para φ es Φ : B1 X Demostración. Supongamos que e = X [m+n+1] X −m σX e por 16 1. ESPACIOS SHIFT denida por pues para x e = xi+n . . . xi . . . an .. . e Φ a0 . .. a−m xi−m e ∈X = Φ (a−m · · · a0 · · · an ) se tiene que i∈Z xi+n+m . . . m σXe (e x) = xi+m . . . xi y entonces, para cualquier entero −1 m βm+n+1 σX x) = (xi )i∈Z ∈ X e (e i∈Z j se cumple que −1 m exj = φ ξ −1 x e = Φ x = Φ φe e j = Φ βm+n+1 σX (e x ) [j−m,j+n] e [j−m,j+n] xj+n . . . xj . . . xj−m de donde se ve que φe es un CVD monobloque. Si se tiene además que con φ, por la Proposición 6.2. φ es una conjugación, siendo φe la composición de la conjugación ξ −1 e una conjugación de X e a Y. 1.57, es φ Imagen de un espacio shift por un código de ventana deslizante. Hasta ahora, hemos visto que un CVD φ actúa transformando puntos de un espacio shift X en Z puntos de algún full shift U . Cabe preguntarse cómo actúa globalmente φ, en el sentido de Z qué características tiene φ (X) como subconjunto de U . Mostraremos ahora que φ (X) es un espacio shift sobre el alfabeto U. Lema 1.60. Sea φ un código de ventana deslizante monobloque desde un espacio shift X hacia un full shift U Z . Entonces, φ (X) es un espacio shift sobre el alfabeto U . A al alfabeto de X . Supongamos que φ está inducida por Φ : B1 (X) → U . Hagamos L = {Φ (w) : w ∈ B (X)}, y veriquemos que φ (X) = XLc , con lo que quedará probado que φ (X) es un espacio shift. 1. Sea y ∈ φ (X). Existe x ∈ X tal que y = φx. Sea u tal que u v y . Entonces existen i, j ∈ Z tales que u = y[i,j] = (φx)[i,j] = Φ x[i,j] , es decir, u = Φ (w) con w ∈ B (X). Luego, u ∈ L, por lo que u ∈ / Lc . Como u era un bloque arbitrario de y , vemos que y ∈ XLc . Entonces, φ (X) ⊆ XLc . 2. Sea y ∈ XLc . Entonces todo bloque de y está en L, de donde se deduce que para todo n ≥ 0, existe w ∈ B (X) tal que y[−n,n] = Φ (w). Porlo tanto, para todo n ≥ 0, (n) (n) (n) existe x ∈ X tal que x[−n,n] = w y φx(n) [−n,n] = Φ x[−n,n] = y[−n,n] . Usaremos (n) la sucesión x para encontrar un punto x ∈ X tal que φx = y , con lo que n∈N quedará probado que y ∈ φ (X), y, con ello, que XLc ⊆ φ (X). Como A es nito, hay Demostración. Llamemos 6. CÓDIGOS DE VENTANA DESLIZANTE 17 x(n) tienen igual símbolo a0 en la posición 0. Sea S0 el conjunto de todos esos n. Como A3 es nito, hay un subconjunto innito S1 de S0 (n) y símbolos a−1 y a1 tales que ∀n ∈ S1 , x[−1,1] = a−1 a0 a1 . Continuando de esta manera, para cada k ≥ 1 conseguimos un subconjunto innito Sk de Sk−1 y símbolos a−k y (n) ak tales que ∀n ∈ Sk , x[−k,k] = a−k · · · a0 · · · ak . Denamos x = (ak )k∈Z . Ocurrirá que una cantidad innita de (n) n tales que ∀k ≥ 0, ∀n ∈ Sk , x[−k,k] = x[−k,k] . Si u = x[i,j] para algunos enteros i y j , haciendo (n) x[−k,k] para cualquier n ∈ Sk , por lo que existe n ≥ 0 k = máx {|i| , |j|} será x[−k,k] = (n) tal que u v x ∈ X , es decir, u ∈ B (X); puesto que cualquier bloque de x está en el lenguaje del espacio shift X , se tiene que, por Corolario 1.31, x ∈ X . Sea ahora k ≥ 0. Tomemos n ∈ Sk tal que n ≥ k (tal elección es posible pues Sk es un conjunto innito). Tenemos que (n) (φx)[−k,k] = Φ x[−k,k] = Φ x[−k,k] = y[−k,k] Es decir, ∀k ≥ 0, (φx)[−k,k] = y[−k,k] . Entonces, φx = y . Teorema 1.61. Sea φ un código de ventana deslizante desde un espacio shift X hacia un full shift U Z . Entonces, φ (X) es un espacio shift sobre el alfabeto U . Demostración. Por Proposición 1.59, existe un espacio shift e y un CVD monobloque φe : X e → Y tales que φ = φe ◦ ξ . X →X e . Entonces, φ (X) = φe (ξ (X)) = φe X e , que, por Lema ξ (X) = X en consecuencia φ (X) es espacio shift sobre U . 6.3. Inversa de una conjugación. e, X Como una conjugación ξ ξ : es conjugación, es 1.60, es un espacio shift, y Mostremos ahora que la inversa de una conjugación es siempre una conjugación. Sea φ una conjugación monobloque del espacio shift X al espacio shift Y . es una conjugación de Y a X . Lema 1.62. Entonces, φ −1 A el alfabeto para X y U el de Y . Supongamos que φ está inducida Φ : B1 (X) → B1 (Y ). Hagamos ψ = φ−1 . Debemos mostrar que ψ es un CVD biyectivo de Y a X . Por ser la inversa de una función biyectiva, ψ es también biyectiva, así que sólo resta Demostración. Sean por vericar que es CVD, para lo que usaremos la Proposición 1.53. φ un CVD, tenemos que φ ◦ σX = σY ◦ φ, por lo que ψ ◦ φ ◦ σX ◦ ψ = ψ ◦ σY ◦ φ ◦ ψ , σX ◦ ψ = ψ ◦ σY . Por lo tanto, ψ cumple la condición de conmutar con σ . Supongamos que no existe un N ≥ 0 tal que para todo y ∈ Y , (ψy)0 dependa de (n) y[−N,N ] . Esto quiere decir que para cada n ≥ 0 existen y (n) e yb(n) en Y tales que y[−n,n] = (n) yb[−n,n] pero ψ y (n) 0 6= ψ yb(n) 0 . Llamemos x(n) = ψ y (n) y x b(n) = ψ yb(n) . Tenemos (n) que, para cada n ≥ 0, tanto x como x b(n) están en X , y además x(n) 6= b(n) pues x (n) ambos dieren en la coordenada 0. Consideremos las dos sucesiones en X , x y n∈N (n) 0 x b . Como A es nito, debe haber un símbolo a0 ∈ A, y un conjunto innito S0 n∈N 0 (n) de enteros tal que ∀n ∈ S0 , x = a0 ; nótese que ∀n ∈ S00 , x b(n) 0 6= a0 . Puesto que 0 0 A es nito, debe innito S0 de S0 tal que haber un símbolo b0 6= a0 y un subconjunto (n) (n) ∀n ∈ S0 , x b 0 = b0 . Observar que, entonces, ∀n ∈ S0 , x 0 = a0 6= b0 = x b(n) 0 . 3 0 Como la cantidad de bloques en A es nita, debe haber un subconjunto innito S1 de S0 y símbolos a−1 y a1 tales que ∀n ∈ S10 , x(n) [−1,1] = a−1 a0 a1 , y consecuentemente 0 debe haber un subconjunto innito S1 de S1 y símbolos b−1 y b1 tales que ∀n ∈ S1 , x b(n) 0 = b−1 b0 b1 . Notar que ∀n ∈ S1 , x(n) [−1,1] = a−1 a0 a1 6= b−1 b0 b1= x b(n) [−1,1] . Continuando de esta manera, para cada k ≥ 1 encontramos un subconjunto innito Sk 1. Por ser y entonces 2. 18 1. ESPACIOS SHIFT a−k , ak , b−k y bk tales que ∀n ∈ Sk , x(n) [−k,k] = a−k · · · a0 · · · ak 6= b−k · · · b0 · · · bk = x b(n) [−k,k] . Tomemos x = (ak )k∈Z y x b = (bk )k∈Z . Obsérvese que ∀k ≥ de Sk−1 y símbolos (n) 0, ∀n ∈ Sk , x[−k,k] = x[−k,k] yx b[−k,k] (n) = x b[−k,k] . Si u = x[i,j] para algunos enteros i y j , (n) x[−k,k] para cualquier n ∈ Sk , por lo que existe k = máx {|i| , |j|} será x[−k,k] = n ≥ 0 tal que u v x(n) ∈ X , es decir, u ∈ B (X); puesto que cualquier bloque de x está en el lenguaje del espacio shift X , se tiene que, por Corolario 1.31, x ∈ X . Igualmente, x b ∈ X . Además, x 6= x b pues x0 = a0 6= b0 = x b0 . Sea ahora k ≥ 0. Tomemos n ∈ Sk tal que n ≥ k (tal elección es posible pues Sk es un conjunto innito). Tenemos que (n) (n) (n) (φx)[−k,k] = Φ x[−k,k] = Φ x[−k,k] = y[−k,k] = yb[−k,k] (n) = Φ x b[−k,k] = Φ x b[−k,k] = (φb x)[−k,k] haciendo Es decir, x 6= x b. ∀k ≥ 0, (φx)[−k,k] = (φb x)[−k,k] . Contradicción a la inyectividad de no hay un N ≥0 tal que ψy0 De allí, tendríamos que φ. La contradicción y[−N,N ] . φx = φb x pese a ser proviene de suponer que es función de Teorema 1.63. Sea φ una conjugación del espacio shift X al espacio shift Y . Entonces, φ−1 es una conjugación de Y a X . e , una conjugación ξ : X → X e . Entonces e y una conjugación monobloque φe : X e → Y tales que ξ es conjugación y φ = φ◦ξ X −1 −1 −1 −1 e φ = ξ ◦ φ , y, por aplicación de Lema 1.62 y Proposición 1.57, φ resulta ser también una conjugación. Demostración. Por Proposición 1.59, existe un espacio shift −1 Capítulo 2 SHIFTS DE TIPO FINITO Los espacios shift que pueden ser descriptos por un conjunto se llaman shifts de tipo nito nito de bloques prohibidos (abreviado STF). A pesar de ser los más simples, juegan un rol fundamental en ciertas áreas de la Matemática, tales como sistemas dinámicos. Su estudio también ha proporcionado soluciones a problemas prácticos de importancia, tales como encontrar esquemas de codicación ecientes para almacenar datos en discos de computadoras. Una razón por la que los STF son tan útiles es que tienen una representación sencilla usando un grafo nito dirigido. Preguntas sobre el shift pueden, a menudo, reformularse como preguntas sobre la matriz de adyacencia del grafo. Resultados básicos del álgebra lineal nos ayudan a analizar esta matriz y encontrar respuestas. En este capítulo, primero presentamos los STF, y damos algunos ejemplos típicos. Luego se explica las conexiones con los grafos dirigidos y las matrices, e introducimos la fundamental operación de desdoblamiento de estados. Concluimos con una breve descripción sobre el almacenamiento magnético, indicando por qué la shift de paso limitado (1,3) es la característica central de la mayoría de los métodos más usados para el almacenamiento de datos en discos rígidos de computadoras. 1. Restricciones de tipo nito Primero denimos shifts de tipo nito, y luego explicamos el hecho de que tienen una propiedad (markoviana) de memoria nita. Definición 2.1. Un shift de tipo nito (STF) es un espacio shift que puede describirse por un conjunto nito de bloques prohibidos, es decir, un espacio shift algún conjunto nito F de bloques tal que X para el cual existe X = XF . Ya hemos tratado antes con varios STF. AZ es un A = XF . Ejemplo 2.2. El full shift está prohibido, de modo que STF: podemos tomar simplemente Ejemplo 2.3. El shift de la razón de oro F = {11}, obteniendo F =∅ pues nada Z X (ejemplo 1.10) es un STF, pues podemos tomar X = XF . X el conjunto de todos los puntos de {e, f, g}Z tales que e puede ser seguido sólo por e o por f , f puede ser seguido sólo por g , y g puede ser seguido sólo por e o por f . Entonces X es el espacio shift que resulta de tomar F = {eg, f e, f f, gg}, y, en consecuencia, es un STF. Ejemplo 2.4. Sea Notemos que un STF X podría también describirse mediante un conjunto innito de bloques prohibidos. De hecho, la Proposición 1.29 muestra que ésto puede ocurrir siempre que X no X es innito. La denición de STF sólo algún F adecuado. Z Supongamos que X ⊆ A es STF, y que X = XF para una colección nita F de bloques. Sea N la longitud del bloque más largo en F . Si formamos la colección FN de todos los bloques de longitud N sobre A que contienen algún subbloque en F , entonces tendremos que XFN = XF (prop. 1.21) y los bloques de FN tienen todos la misma longitud N . Por ejemplo, si A = {0, 1} y F = {11, 000}, entonces F3 = {110, 111, 011, 000}. A veces, será conveniente asumir que sea el full shift, pues el complemento del lenguaje de pide que exista 19 20 2. SHIFTS DE TIPO FINITO este procedimiento ya ha sido llevado a cabo, y que todos los bloques prohibidos tienen igual longitud. Si todos los bloques en F tienen longitud N, entonces x ∈ AZ está en XF exactamente cuando x[i,i+N −1] ∈ / F para todo i ∈ Z, o, equivalentemente, cuando x[i,i+N −1] ∈ BN (XF ) para todo i ∈ Z (Supongamos que ∀i ∈ Z, x[i,i+N −1] ∈ / F . Sea u un bloque de x. Si |u| 6= N, u ∈ /F pues F tiene sólo bloques de tamaño N , y si |u| = N, u ∈ / F por la hipótesis; entonces ningún bloque de x está en F , por lo que x ∈ XF y ∀i ∈ Z, xi,i+N −1] ∈ B (XF ). Recíprocamente, si un bloque de tamaño N está en BN (XF ), no puede estar en F ). Luego, para determinar si x está o no en XF , sólo necesitamos escanear las coordenadas de x con una ventana de ancho N , y vericar que cada bloque visto a través de esta ventana está en la colección permitida BN (X). Esta observación es, a menudo, útil cuando se debe decidir si un dado espacio shift es o no de tipo nito. Ejemplo 2.5. El shift par X (ejemplo 1.13) no es un STF, pues, si lo fuera, existiría N ≥1 y una colección de N -bloques tal que X = XF . En dicha colección, no puede haber bloques de la 0k , ni 0k 10l para ningún k, l ≥ 0, ya que 0∞ 10∞ ∈ X . Pero entonces 0∞ 102N +1 10∞ ∈ XF forma N -bloques pues ninguno de sus está en F. Sin embargo, ese punto no pertenece a X por la denición del shift par. Hay también una noción de memoria para un STF: Definición 2.6. Un shift de tipo nito es de memoria M una colección de bloques prohibidos que tienen todos longitud si puede describirse mediante M + 1. F M. Para motivar esta denición, supongamos que todos los bloques de Sea u = a1 a2 . . . an un bloque con longitud u máquina lee los símbolos de detecte si u n mucho mayor que tienen longitud uno por vez, de izquierda a derecha. Para que esta máquina contiene o no un bloque prohibido, sólo debe recordar los previos leídos, es decir, necesita sólo Observación 2.7. Sea bloques de longitud M X M +1. Supongamos que una M símbolos espacios de memoria. un STF de memoria M, descripto a través de un conjunto F de M + 1. u un bloque de A∗ que no contiene ningún subbloque en F . Esto no garantiza que u ∈ B(X). Por ejemplo: F = {10, 11}, u = 001. u no contiene subbloques en F , pero u∈ / B(X) pues X = {0∞ }. 0 M +1 Sea F = A − B(XF ). Entonces, F ⊆ F 0 , y XF 0 = XF . Para ver la primera aserción, si f ∈ F, |f | = M + 1 y f ∈ / B(XF ), luego f ∈ F 0 . Para la segunda, ya que F ⊆ F 0 , se tiene que XF 0 ⊆ XF . Si x ∈ XF y u es un bloque de longitud M + 1 que ocurre en x, u ∈ B(XF ), por lo que u ∈ / F 0 . Luego x no contiene bloques en F 0 , mostrando que x ∈ XF 0 y, consecuentemente, XF ⊆ XF 0 . 1. Sea 2. Notar que un STF de memoria M es también de memoria K para todo K ≥ M. Un STF de memoria 0 es simplemente un full shift, pues prohibir bloques de tamaño 1 es meramente quitar letras del alfabeto. Se puede pensar en un STF de memoria 1 como en uno dado por una colección de símbolos junto con una descripción de cuáles símbolos pueden seguir a cuáles, como en el ejemplo 2.4. Posteriormente veremos muchos ejemplos de tales STF de memoria 1. Proposición 2.8. memoria M . Si X es un shift de tipo nito, entonces hay un M ≥ 0 tal que X es de X es de tipo nito, X = XF para alguna colección nita de M = 0. Si F = 6 ∅, sea M igual a la longitud del bloque más largo en F , menos 1. Nuestra discusión anterior muestra que X es descripto por FM +1 (el conjunto de todas las palabras de largo M + 1 que contienen algún subbloque en F ), por lo que X es de memoria M . Demostración. Ya que bloques F. Si F = ∅, sea 1. RESTRICCIONES DE TIPO FINITO 21 El lenguaje de un STF está caracterizado por la propiedad de que si dos palabras se solapan lo sufuciente, pueden ser unidas a lo largo del solape para formar otra palabra en el lenguaje. Sea X un espacio shift sobre el alfabeto A, y M ≥ 0. X es STF de memoria M si, y sólo si, ∀u, v, w ∈ A∗ , uv ∈ B(X) ∧ vw ∈ B(X) ∧ |v| ≥ M ⇒ uvw ∈ B(X) Teorema 2.9. F una colección de bloques de M + 1 tal que X = XF . Sean u, v y w en A∗ tales que uv y vw estén en B(X) con |v| ≥ M . Existen x e y en X tales que x[i,i+|uv|−1] = uv , y[j,j+|vw|−1] = vw. Consideremos el punto z = x(−∞,i+|uv|−1] y[j+|v|,∞) = · · · xi−2 xi−1 uvwyj+|vw| yj+|vw|+1 · · · . No puede contener un bloque en F pues, al ser |v| ≥ M , una ventana de ancho M + 1 no puede ver simultáneamente símbolos de u, v y w , por lo que todo bloque que esta ventana vea corresponde a un bloque en x o en y . Entonces z ∈ X y uvw ∈ B(X). M +1 Para la suciencia, denamos F = A − BM +1 (X), y veamos que X = XF . Si x ∈ X e i ∈ Z, x[i,i+M ] ∈ BM +1 (X), es decir, ∀i, x[i,i+M ] ∈ / F . Luego x ∈ XF , y se deduce que X ⊆ XF . Ahora, sea x ∈ XF . Mostremos, por inducción sobre n, que ∀n ≥ M, x[0,n] ∈ B(X). Para n = M es cierto pues x[0,M ] ∈ / F , por lo que x[0,M ] ∈ BM +1 (X), y, de allí, x[0,M ] ∈ B(X); esto muestra también que ∀n ∈ {0, . . . , M − 1}, x[0,n] ∈ B(X). Supongamos que x[0,n] ∈ B(X). Hagamos u = x[0,n−M ] , v = x[n−M +1,n] y w = xn+1 . Observemos que uv = x[0,n] ∈ B(X), vw = x[n−M +1,n+1] ∈ / F y |vw| = M + 1, por lo que vw ∈ BM +1 (X) ⊆ B(X). Además, |v| = M . Entonces uvw ∈ B(X), es decir, x[0,n+1] ∈ B(X). Un razonamiento análogo en la otra dirección muestra que ∀m, n ∈ Z, x[m,n] ∈ B(X), es decir, cualquier bloque en x está en B(X), y, siendo X espacio shift, x ∈ X , por lo que XF ⊆ X . Demostración. Para la necesidad de la condición, sea tamaño Ejemplo 2.10. El teorema anterior da otra forma de ver que el shift par X no es de tipo 2M +1 nito. Pues si lo fuera, sería de memoria M para algún M ≥ 1. Ya que 10 ∈ B(X) y que 2M +1 2M +1 0 1 ∈ B(X), deberíamos tener que 10 1 ∈ B(X), lo que violaría la denición de shift par. φ con memoria 0 y anticipación 1 que tiene por dominio el shift de la X , inducido por Φ tal que Φ(00) = 1, Φ(01) = 0 = Φ(10). Ocurre que Φ(u) = 10k 1 2n si, y sólo si, existe n ≥ 0 tal que u = 0(01) 00, por lo que k = 2n. Luego, φ(X) ⊆ Y , donde Y es el shift par. Además, si y ∈ Y , es posible construir x ∈ X tal que y = φ(x) (teniendo 2k k en cuenta que si y[i,i+2k+1] = 10 1, entonces debe ser x[i,i+2k+2] = 0(01) 00). Entonces, φ es Consideremos el CVD razón de oro un código factor del shift de la razón de oro en el shift par, siendo el primero de tipo nito y el segundo no. Es fácil construir también códigos de ventana deslizante sobreyectivos desde espacios shift que no son de tipo nito hacia otros que sí lo son (por ejemplo, desde el shift par ∞ hacia {0 } por el CVD de memoria 0 y anticipación 0 inducido por Φ(0) = Φ(1) = 0). Sin embargo, las conjugaciones preservan el carácter de tipo nito. Teorema 2.11. Sea X un shift de tipo nito, e Y un espacio shift conjugado a X . Entonces Y es un shift de tipo nito. A y U los alfabetos para X e Y respectivamente. Supongamos que M . Sea φ : X → Y una conjugación inducida por Φ, y ψ : Y → X su inversa, inducida por Ψ. Podemos suponer que φ y ψ tienen ambas la misma memoria y anticipación l . Sabemos que ψ ◦φ es código de ventana deslizante con memoria y anticipación 2l , y que una función inductora es Ψ ◦ Φ : B4l+1 (X) → B1 (X). Dicha composición de inductoras, aplicada a un bloque a−2l · · · a0 · · · a2l devuelve el carácter central a0 ; como consecuencia de ésto, si s, t y w son bloques con |s| = |t| = 2l , Φ ◦ Ψ(swt) = w . Mostraremos que Y es ∗ un STF de memoria M + 4l , usando el teorema anterior. Sean u, v, w ∈ U tales que uv ∈ B(Y ), vw ∈ B(Y ), |v| ≥ M + 4l, digamos v = v1 · · · vk con k ≥ M + 4l. Existen s, t ∈ B(Y ) : suv ∈ B(Y ), vwt ∈ B(Y ), |s| = |t| = 2l. Sea u0 = Ψ(suv1 · · · v2l ), w0 = Ψ(vk−2l+1 · · · vk wt). 0 0 Entonces Ψ(suv) = u Ψ(v) ∈ B(X), Ψ(vwt) = Ψ(v)w ∈ B(X). Como |v| ≥ M + 4, será 0 0 |Ψ(v)| = |v| − 2l ≥ M . Luego Ψ(suvwt) = u Ψ(v)w ∈ B(X). Por ello, Φ (Ψ(suvwt)) ∈ B(Y ), es decir, uvw ∈ B(Y ). Demostración. Sean X es un STF de memoria 22 2. SHIFTS DE TIPO FINITO 2. Grafos y sus shifts Un método fundamental para construir shifts de tipo nito se basa en un grafo nito dirigido, considerando la colección de todos los caminos bi-innitos (es decir, sucesiones de aristas consecutivas) en el grafo. En un sentido que precisaremos más adelante, cualquier shift de tipo nito fuede ser recodicado en un shift de aristas. En esta sección, introducimos los shifts de aristas, y usamos la matriz de adyacencia del grafo para responder preguntas sobre su shift. Realmente, la razón por la que un shift de aristas puede ser entendido mucho mejor que un shift general es que podemos aplicar la potente maquinaria del álgebra lineal a su matriz de adyacencia. Comenzamos con las deniciones básicas concernientes a la teoría de grafos. Definición 2.12. Un grafo nito dirigido G es una cuaterna (V, Σ, i, t) donde: V es un conjunto nito cuyos elementos llamaremos vértices, nodos o estados. Σ es un conjunto nito cuyos elementos llamaremos aristas o arcos. i es una función de Σ en V . Para una arista a, i(a) se llama vértice inicial de a. También decimos que la arista a arranca en el nodo i(a). t es una función de Σ en V . Para una arista a, t(a) se llama vértice terminal de a. También decimos que la arista a termina en el nodo t(a). Una manera cómoda de visualizar un grafo es mediante un dibujo donde los nodos se representan por círculos (con el nombre del nodo en su interior) y cada arista i(a) hasta t(a), con un rótulo que indica su un grafo con V = {I, J} y ocho aristas, teniéndose que, por i(f ) = t(f ) = i(g) = t(g) = J , etc. una echa desde a mediante nombre. La gura 1 muestra ejemplo, i(e) = I , t(e) = J , Figura 1. Muchas veces, cuando hagamos referencia a distintos grafos en forma simultánea, emplearemos la notación V (G), Σ(G), iG G en inicial y terminal de un grafo y tG para indicar conjuntos de nodos, aristas y funciones particular. G = (V, Σ, i, t) un grafo. Para nodos I, J de G, denotaremos por ΣI al conjunto de todas las aristas de G que J arrancan en I , es decir, ΣI = {a ∈ Σ : i(a) = I}. Similarmente, Σ denotará al conjunto J de todas las aristas de G que terminan en J , es decir, Σ = {a ∈ Σ : t(a) = J}. J Reservamos el símbolo ΣI para el conjunto de todas las aristas de G que empiezan en I y terminan en J , es decir ΣJI = {a ∈ Σ : i(a) = I ∧ t(a) = J}. Llamamos grado de salida J de I a |ΣI |, la cantidad de aristas que arrancan en I , y grado de entrada de J a Σ , la cantidad de aristas que llegan a J . La matriz de adyacencia AG del grafo G se dene como la matriz J cuadrada de |V | × |V | indizada por V , cuyo elemento en la posición IJ es AIJ = ΣI . Es decir, AIJ es la cantidad de aristas de I a J en G. Un lazo, bucle o rulo en G es una arista a tal que i(a) = t(a). Un camino π en el grafo G es una sucesión nita de aristas π = e1 e2 · · · ek tal que ∀i ∈ {1, . . . , k − 1}, t(ei ) = i(ei+1 ). Denimos el vértice inicial del camino π como Definición 2.13. Sea 2. GRAFOS Y SUS SHIFTS 23 i(π) = i(e1 ), el vértice inicial de la primera arista del camino, y el vértice nal de π como t(π) = t(ek ), el vértice nal de la última arista del camino. La longitud del camino π es la cantidad de aristas que contiene, denotada por |π|. Es decir, |π| = k . La sucesión vacía cumple también con la denición de camino, con longitud 0 y vértices G. Un ciclo en G es un un ciclo π = e1 · · · ek tal inicial y nal idénticos, pudiendo ser cualquiera de los nodos de camino π en G que los estados tal que i(π) = t(π). Un ciclo simple i(e1 ), . . . , i(ek ) son distintos. G en Desde el punto de vista de la dinámica simbólica, interesa la es conectividad de las aristas de un grafo, no los nombres de las mismas ni de los vértices del grafo. Por ello, grafos diferentes pueden en realidad representar un mismo objeto desde ese punto de vista. G y H , un homomorsmo de G a H es un par de funciones (∂, Φ) con ∂ : V (G) → V (H) y Φ : Σ(G) → Σ(H) tales que ∀e ∈ Σ(G), iH (Φ(e)) = ∂ (iG (e)) y tH (Φ(e)) = ∂ (tG (e)). En caso de ser ambas funciones inyectivas, el homomorsmo se llama inmersión de G en H . Si ambas funciones son biyectivas, se llama isomorsmo entre G y H . Dos grafos se dicen isomorfos si hay un isomorsmo entre ellos, y en ese caso escribimos G ∼ = H . Un isomorsmo es, a los nes prácticos, simplemente un cambio de nombre Definición 2.14. Dados dos grafos de nodos y aristas. La relación de ser isomorfos es una relación de equivalencia entre grafos. Definición 2.15. Un Σ(G), y las funciones iH subgrafo H tH y del grafo G son, respectivamente, las restricciones En términos de matrices de adyacencia, si H V (H) ⊆ V (G), Σ(H) ⊆ de iG y tG a Σ(H). es un grafo tal que es subgrafo de G se tiene que (AH )I,J ≤ (AG )I,J I, J ∈ V (H). para toda pareja de vértices En cuanto a los isomorsmos, se tiene que dos grafos y H son isomorfos si, y sólo si, AG = P AH P . Recordemos que una matriz de 0 o 1 que tiene exactamente un 1 en cada la, y exactamente un 1 en cada columna. Es fácil demostrar si P es matriz de permutación, P también lo es, y P −1 = P T . Si (∂, Φ) es un isomorsmo entre G = (V, Σ, iG , tG ) y H = (W, Σ0 , iH , tH ), se dene P con las indizadas según V (G) y columnas indizadas según V (H) mediante 1 si ∂(I) = J PI,J = 0 si ∂(I) 6= J Resulta directo chequear que P es matriz de permutación. Además, teniendo en cuenta que e ∈ ΣJI ⇐⇒ Φ(e) ∈ Σ∂J ∂I , a través de un cálculo rutinario se puede ver que (AG P )I,J = (P AH )I,J −1 para todos I, J , de modo que AG = P AH P . Recíprocamente, si G y H son grafos tales que admiten una matriz de permutación P tal −1 que AG = P AH P , considerando a las las de P en el mismo orden que las de AG y a las columnas de P en el mismo orden que las de AH , se dene ∂I = J ⇐⇒ PI,J = 1. De la −1 condición AG = P AH P , se deduce que (AG )I,J = (AH )∂I,∂J , con lo que los grafos G y H son existe una matriz de permutación P G −1 tal que permutación es una matriz cuadrada con entradas isomorfos. 2.1. Shifts de aristas. Definición 2.16. Sea denotado por XG o XA , G A continuación deniremos el espacio shift generado por un grafo. un grafo con matriz de adyacencia A. El shift de aristas es el conjunto de todos los caminos bi-innitos de G. de G, Es decir: XG = {x = (xk )k∈Z : ∀k ∈ Z, xk ∈ Σ ∧ t(xk ) = i(xk+1 )} Como puede verse, conjunto Σ XG ΣZ , que tiene como alfabeto el de aristas del grafo. Ejemplo 2.17. Sean Entonces, shift es un subconjunto del full shift XG1 X{eg,f e,f f,gg} G1 y G2 los grafos mostrados en la gura 2. es el full shift sobre el alfabeto del ejemplo 2.4. {0, 1, . . . , r−1}, mientras que XG2 es el espacio 24 2. SHIFTS DE TIPO FINITO G1 G2 Figura 2. Justiquemos que el uso del término shift para los shifts de aristas es adecuado. Si G = (V, Σ, i, t) es un grafo, entonces XG es un espacio shift. Más aún, es un shift de tipo nito de memoria 1. Proposición 2.18. Demostración. Consideremos la colección nita F = {ef ∈ Σ2 : t(e) 6= i(f )} XG = XF : Sea x ∈ XG , y k ∈ Z. Debe ser t(xk ) = i(xk+1 ) por la denición de xk xk+1 ∈ / F . Entonces, ningún bloque de x está en F , y x ∈ XF . Recíprocamente, sea x ∈ XF , y k ∈ Z. xk xk+1 ∈ / F , por lo que t(xk ) = i(xk+1 ). Como esto ocurre para todo k ∈ Z, se ve que x ∈ XG . Como F tiene todos sus bloques de tamaño 2, XG es un shift de tipo nito de memoria 1. y mostremos que XG . Luego Es sencillo demostrar que si (∂, Φ) es un isomorsmo entre G G y H son isomorfos, entonces XG y XH son conjugados: si H , Φ puede verse como la función inductora (biyectiva) de y un código de ventana deslizante de memoria y anticipación 0, que, en vistas de la biyectividad de Φ, resultará ser una conjugación entre También es fácil ver que si H XG y Observemos el grafo de la gura 3. En él, bi-innito, pues desde I = t(a) XH . G, XH ⊆ XG . la arista a no es subgrafo de forma parte de ningún camino no arranca ninguna arista. Podemos pensar en el nodo en un nodo muerto. Una situación análoga ocurre con el nodo arista, de modo que las aristas b y c que arrancan en J J, I como al cual no llega ninguna tampoco pueden formar parte de un camino bi-innito. Figura 3. Definición 2.19. Un nodo de un grafo se llama sale, ninguna arista. nodo muerto si a él no llega, o de él no 2. GRAFOS Y SUS SHIFTS Los nodos muertos de un grafo G 25 pueden eliminarse, conjuntamente con todas las aristas que a él llegan o salen, sin alterar el shift de aristas asociado. En el subgrafo que resulta de esta eliminación, pueden a su vez haber quedado nodos muertos. Sin embargo, repitiendo el proceso de eliminación sobre el subgrafo la cantidad de veces que sea necesaria hasta que no queden nodos muertos, se obtiene como resultado un subgrafo del grafo original que contiene todas las aristas que forman parte de algún camino bi-innito en G. Ejemplo 2.20. La gura 4 muestra el resultado del proceso de eliminación de nodos muertos del grafo de la gura 3. Figura 4. Definición 2.21. Un grafo se llama esencial si no contiene nodos muertos. u1 · · · uk es un bloque de largo k que está en el lenguaje de XG , entonces G (si u v x ∈ XG , existe j ∈ Z tal que x[j+1,j+k] = u1 · · · uk , de donde, para cualquier n ∈ {1, . . . , k − 1}, es t(un ) = t(xj+n ) = i(xj+n+1 ) = i(un+1 ), por lo que u1 · · · uk es camino en G). Sin embargo, no es cierto que cualquier camino en un grafo G sea un bloque del lenguaje de XG . Por ejemplo, cualquier arista vinculada a un nodo muerto en un grafo no esencial es un camino de longitud 1 en G, pero no puede formar parte de un camino bi-innito en G, por lo que no pertenece a B1 (XG ). Es fácil ver que si u es un camino en Sea G un grafo esencial. Entonces, el conjunto de los caminos (nitos) en G es un precisamente el conjunto de bloques en el lenguaje de XG . Lema 2.22. Demostración. Por nuestros comentarios anteriores, ya sabemos que los bloques en el lenguaje de XG son caminos en G. Probemos ahora que, bajo la hipótesis de que G es esencial, G son bloques en el lenguaje de XG . Sea π un camino en G. Por ser G esencial, a1 que llega a i(π) y una arista b1 saliendo de t(π). Inductivamente, para cada k ≥ 2, hay una arista ak llegando a i(ak−1 ) y una arista bk−1 saliendo de t(bk ). Entonces, · · · a2 a1 πb1 b2 · · · es camino bi-innito en G, y π ocurre en él. Luego, π está en B (XG ). Proposición 2.23. Si G = V (G), Σ(G), iG , tG es un grafo, existe un único subgrafo H de G tal que H esencial y XG = XH . los caminos de hay una arista Σ(H) = B1 (XG ), es decir, el conjunto de todas las aristas de G que intervienen en algún camino bi-innito en G. Hagamos V (H) = {i(a) : a ∈ Σ(H)}, el conjunto de nodos visitados por las aristas de H , y sean iH y tH las respectivas restricciones de iG y tG a Σ(H). Entonces H es subgrafo de G, y, en consecuencia, cualquier camino bi-innito en H es también camino bi-innito en G, así que XH ⊆ XG . Veamos que también XG ⊆ XH : si x ∈ XG , se tiene que para todo k ∈ Z, xk y xk+1 están ambos en B1 (XG ), y además tG (xk ) = iG (xk+1 ). Luego, para todo k ∈ Z, es xk ∈ Σ(H) y además tH (xk ) = tG (xk ) = iG (xk+1 ) = iH (xk+1 ), de donde x ∈ XH . Demostración. Sea 26 2. SHIFTS DE TIPO FINITO H es esencial, pues si I ∈ V (H), debe haber una arista a ∈ Σ(H) tal que I = iG (a). Como a ∈ B1 (XG ), existe x ∈ XG tal que xk = a para algún k ∈ Z. Entonces tH (xk−1 ) = tG (xk−1 ) = iG (xk ) = iH (xk ) = I , mostrando que la arista xk−1 llega a I y la arista xk sale desde I. 0 Para ver que H es único, consideremos cualquier subgrafo esencial H de G tal que XH 0 = XG . Si hubiera una arista en H que no esté en H 0 o una en H 0 que no esté en H , sería B1 (XH ) 6= B1 (XH 0 ) (lema 2.22, considerando que H y H 0 son esenciales), por lo que B (XG ) = B (XH ) 6= B (XH 0 ), es decir, sería XG 6= XH 0 , y tendríamos una contradicción. Luego, H y H 0 tienen las mismas aristas, y siendo ambos esenciales, tienen también los mismos nodos, de donde concluimos que ambos son iguales. Además, Ya que el subgrafo H de la proposición anterior contiene la única parte de G usada para la dinámica simbólica, usualmente restringiremos nuestra atención a los grafos esenciales. La matriz de adyacencia de un grafo puede usarse para obtener información sobre la cantidad de caminos de longitud n ≥ 0 en el grafo, y, consecuentemente, si el grafo es esencial, para obtener la cantidad de bloques de tamaño Proposición 2.24. 1. 2. n en B (XG ), esto es, |Bn (XG )|. Sea G un grafo con matriz de adyacencia A, y sea n ≥ 0. Entonces: Para vértices I, J cualesquiera en G, el número de caminos de longitud n desde I hasta J en G es (An )IJ , es decir, la posición IJ de la matriz An . El número de ciclos de longitud n en G es tr(An ), la traza de An , y es igual al número de puntos periódicos de XG de período n. Demostración. I, J ∈ V (G). Si I = J , (A0 )IJ = 1, y el único camino de I a J de longitud 0 es el camino vacío; si I = 6 J , (A0 )IJ = 0 y no hay camino en G de I a J de longitud 0. Luego, la proposición es verdadera para n = 0. Supongamos que la proposición es cierta para n. Un camino de I a J de longitud n + 1 consiste en un camino de longitud n de I a K seguido de una arista desde K hasta J , donde K es algún nodo. La cantidad de caminos de longitud n + 1 de I a J cuyo penúltimo vértice visitado es K es entonces la cantidad de caminos de longitud n de I a K multiplicada por la cantidad de aristas de K a J , que por hipótesis inductiva y denición de matriz n de adyacencia es (A )IK AKJ . Para obtener todos los caminos desde I a J en G de longitud n + 1 hacemos variar a K en el conjunto de nodos de G y sumamos. Es decir, la cantidad de caminos de longitud n + 1 de I a J es X (An )IK AKJ 1. Probamos por inducción sobre n. Sean K∈V (G) que es precisamente la denición de (An+1 )IJ , con lo que queda demostrada la primera parte. 2. La primera parte del enunciado se sigue del ítem anterior y de la denición de ciclo. ∞ Para la segunda parte, notar que que si π es un ciclo de longitud n en G, entonces π es un punto periódico en de período n, XG de período n, mientras que si x ∈ XG es un punto periódico x[0,n−1] debe ser un ciclo de longitud n en G. Esto establece una entre los ciclos en G de longitud n y los puntos en XG de período entonces correspondencia 1 a 1 n. Recordemos que un espacio shift u, w ∈ B(X), existe v ∈ B(X) X se dice irreducible si uvw ∈ B(X). Es fácil tal que lugar a shifts de aristas irreducibles. para cualquier pareja de bloques caracterizar a los grafos que dan 3. REPRESENTACIÓN DE SHIFTS DE TIPO FINITO POR MEDIO DE GRAFOS Definición 2.25. Un grafo en G, existe un camino reducible. π en G G se dice tal que irreducible si para cualquier pareja I, J i(π) = I y t(π) = J . Si G 27 de vértices no es irreducible, se llama La gura 5 muestra un ejemplo de grafo reducible, ya que no hay en él un camino desde hasta I J. Figura 5. Proposición 2.26. shift irreducible. Sea G un grafo esencial. G es irreducible si, y sólo si, XG es un espacio G irreducible. Sean u, w ∈ B (XG ). Entonces u y w G (lema 2.22). Por ser G irreducible, hay un camino v en G desde t(u) hasta i(w), por lo que uvw es camino en G y, nuevamente por lema 2.22, uvw ∈ B (XG ). Supongamos ahora que XG es irreducible. Sean I, J vértices en G, y sean a y b aristas en G tales que t(a) = I , i(b) = J . Tales aristas existen pues G es esencial. Por lema 2.22, a y b están en B (XG ). Por irreducibilidad de XG , existe v ∈ B (XG ) tal que avb ∈ B (XG ). Tal v debe ser entonces camino en G desde t(a) hasta i(b), es decir, camino desde I hasta J . Luego, G es irreducible. Demostración. Primero supongamos son caminos en 3. Representación de shifts de tipo nito por medio de grafos Hemos presentado, en la sección anterior, los shifts de aristas, que resultaron ser STF de memoria 1. Por lo tanto, un STF que no tenga memoria 1 no puede ser un shift de aristas. Más aún, el siguiente ejemplo muestra que hay STF de memoria 1 que no son shifts de aristas. G tal que XG sea el shift de la razón de oro. Para XG = X{11} . Por prop. 2.23, podríamos suponer que G es esencial. Entonces debería contener exactamente dos aristas llamadas 0 y 1. La arista 1 debería ∞ iniciar en un nodo y terminar en otro distinto (de lo contrario, 1 estaría en XG , lo que no puede ser) y entonces la arista 0 debería ir desde t(1) hasta i(1) (pues en otro caso G no sería esencial). Pero entonces XG 6= X{11} , contradicción que proviene de suponer la existencia de tal G. Ejemplo 2.27. No existe un grafo verlo, supongamos que G cumple que A pesar de que los shifts de aristas aparecen como particulares shifts de tipo nito, mostraremos ahora que todo shift de tipo nito puede recodicarse a un shift de aristas. Si X es un shift de tipo nito de memoria M , entonces X [M +1] es un shift de aristas. En consecuencia, todo shift de tipo nito es conjugado a un shift de aristas. Teorema 2.28. M . Podemos suponer M ≥ 1. Sea F tal que X = XF , siendo todos los bloques en F de largo M + 1. Hagamos V = BM (X) y Σ = BM +1 (X). Para a = a1 a2 · · · aM aM +1 ∈ Σ, denamos i(a) = a1 · · · aM y t(a) = a2 · · · aM aM +1 . Puede verse que i(a) y t(a) están en V , ya que son subbloques de a1 · · · aM aM +1 ∈ B(X). Denamos Demostración. Sea X un STF de memoria 28 2. SHIFTS DE TIPO FINITO G = (V, Σ, i, t). Notar que, dados vértices I = a1 · · · aM y J = b1 · · · bM , hay una única arista de I a J si, y sólo si, a2 · · · aM = b1 · · · bM −1 y a1 · · · aM bM ∈ BM +1 (X). Es decir, hay arista de I a J si, y sólo si, I y J solapan progresivamente y el bloque obtenido de agregar a I el último símbolo de J está en BM +1 (X). [M +1] Veriquemos ahora que XG = X . Sea x ∈ XG . Se tiene que, para todo k ∈ Z, xk ∈ Σ (es decir, xk es un bloque de tamaño M +1 en el lenguaje de X ), y t (xk ) = i (xk+1 ). Pero si xk = a1 · · · aM +1 y xk+1 = b1 · · · bM +1 , es t (xk ) = a2 · · · aM +1 e i (xk+1 ) = b1 · · · bM . Se tiene entonces que xk y xk+1 solapan progresivamente. −1 Denamos entonces x = βM +1 (x). Para cualquier k ∈ Z, x[k,k+M ] = xk ∈ BM +1 (X), por lo que x no tiene bloques en F , es decir, x ∈ X , y entonces x = βM +1 (x) pertenece a X [M +1] . [M +1] . Sea x tal que βM +1 (x) = x. Se tiene que, para cualquier k ∈ Z, Ahora sea x ∈ X es xk = xk · · · xk+M y xk+1 = xk+1 · · · xk+M +1 , por lo que xk ∈ BM +1 (X) = Σ y t(xk ) = xk+1 · · · xk+M = i(xk+1 ) de acuerdo a la denición de G. Entonces, x ∈ XG . [M +1] La última armación del teorema se deduce del hecho de que X ∼ X . X = X{11} , X es STF de memoria 1. Tenemos que B1 (X) = {0, 1} = V y que B2 (X) = {00, 01, 10} = Σ. Denimos i(00) = i(01) = 0, i(10) = 1, t(00) = t(10) = 0 y t(01) = 1. El grafo (V, Σ, i, t) mostrado en la gura 6 es precisamente X [2] . Ejemplo 2.29. Si Figura 6. Dado un shift de aristas XG , nos preguntamos si las presentaciones con solape de XG son también shifts de aristas, y, en caso de serlo, si podemos construir los correspondientes grafos directamente a partir de G. Definición 2.30. Sea G un grafo, y sea N un entero positivo. Se dene el grafo G[N ] del siguiente modo: G[1] = G. [N ] para N ≥ 2, los vértices de G son los caminos en G de longitud N − 1, y las aristas [N ] de G son los caminos en G de longitud N . Si a = a1 · · · aN es una arista, denimos iG[N ] (a) = a1 · · · aN −1 y tG[N ] (a) = a2 · · · aN . Obsérvese que G[N ] es un grafo bien denido. Ejemplo 2.31. Sea G = (V, Σ, i, t) con V = {I, J}, Σ = {e, f, g}, i(e = i(f ) = I , i(g) = J , t(e) = t(g) = I , t(f ) = J . G[1] es el propio G. G[2] tiene vértices {e, f, g} y aristas {ee, ef, f g, ge, gf }. G[3] tiene vértices {ee, ef, f g, ge, gf } y aristas {eee, eef, ef g, f ge, f gf, gee, gef, gf g}. Todos ellos se muestran en la gura 7. Proposición 2.32. XG[N ] . Si G es un grafo esencial y N es un entero positivo, entonces (XG )[N ] = Demostración. Los símbolos para (XG )[N ] son los N -bloques de XG , que son los caminos N en G (lema 2.22). Pero éstos son precisamente los símbolos para XG[N ] . Una sucesión bi-innita de estos símbolos está en ambos espacios shift precisamente cuando dos símbolos de largo consecutivos solapan progresivamente, de donde se concluye el resultado. 3. REPRESENTACIÓN DE SHIFTS DE TIPO FINITO POR MEDIO DE GRAFOS G[1] G[2] 29 G[3] Figura 7. Un camino bi-innito en un grafo G determina una sucesión bi-innita de vértices de ese grafo, a saber, los vértices que el camino bi-innito atraviesa (pero a una sucesión bi-innita de vértices puede corresponderle más de un camino bi-innito, a menos que el grafo no posea aristas en paralelo entre dos nodos). Formalmente, sea G = (V, Σ, i, t) un grafo, y sea (xk )k∈Z un punto de XG . Entonces, la sucesión bi-innita de vértices que este camino bi-innito determina Z es el punto (i(xk ))k∈Z , que pertenece al full shift V . Para considerar estos recorridos bi-innitos, introducimos la matriz de incidencia de un grafo. G = (V, Σ, i, t) un grafo con matriz de incidencia de G es la matriz B , de tamaño |V | × |V | con V , tal que, para vértices m, n ∈ V , 1 si (AG )mn > 0 Bmn = 0 si (AG )mn = 0 Definición 2.33. Sea de adyacencia G desde La matriz las y columnas indizadas por (m, n) de la matriz de incidencia es 1 o 0, dependiendo m hacia n (en caso de haber, no importa cuántas hay). Es decir, la entrada arista en AG . de si hay o no Ahora consideraremos el conjunto de todas las sucesiones bi-innitas de vértices que determinan los caminos bi-innitos en Definición 2.34. Sea G, y que resultará ser también un espacio shift. G = (V, Σ, i, t) vértices de G es el conjunto un grafo con matriz de incidencia B. El shift de X̂G = (xk )k∈Z ∈ V Z : ∀k ∈ Z, Bxk xk+1 = 1 Proposición 2.35. Los shifts de vértices son shifts de tipo nito de memoria 1. Demostración. Sea G = (V, Σ, i, t) un grafo con matriz de incidencia B . Consideremos F = {mn ∈ V 2 : Bmn = 0}, y veamos que X̂G = XF . Sea x ∈ X̂G , y consideremos j, k ∈ Z. Si k − j + 1 6= 2, x[j,k] ∈ / F (pues F contiene sólo palabras de largo 2). Y si k−j +1 = 2, es x[j,k] = xj xj+1 , pero, por estar x en X̂G , es Bxj xj+1 = 1, por lo que x[i,j] ∈ / F . Entonces ningún bloque de x pertenece a F , es decir, x ∈ XF . Recíprocamente, si x ∈ XF , se tiene que, para todo j ∈ Z, x[j,j+1] ∈ / F , de donde Bxj xj+1 = 1, por lo que x ∈ X̂G . Ya que todos los bloques de F tienen largo 2, se sigue que X̂G es un STF de memoria 1. Proposición 2.36. 1. 2. 3. La familia de todos los shifts de tipo nito de memoria 1 es la familia de todos los shifts de vértices. Cualquier shift de aristas es un shift de vértices (en un grafo diferente). Si X es un shift de tipo nito de memoria M , X [M ] es un shift de vértices. De hecho, existe un grafo G tal que X̂G = X [M ] y XG = X [M +1] . 30 2. SHIFTS DE TIPO FINITO Demostración. 1. La proposición 2.35 muestra que cualquier shift de vértices es un SFT de memoria 1. Ahora, sea XF un espacio shift con todos los bloques en F de largo 2. Denamos un G como sigue: su conjunto de vértices es V = B1 (XG ), y para m, n ∈ V , pongamos mn de m a n si, y sólo si, mn ∈ / F . La matriz de incidencia de G tendrá entonces, en la posición (m, n), un 1 si mn ∈ / F , y un 0 si mn ∈ F . Luego, un punto de Z V está en X̂G precisamente cuando para todo k ∈ Z, Bxk xk+1 = 1, o, equivalentemente, cuando xk xk+1 ∈ / F , mostrando que X̂G = XF . grafo una única arista 2. El enunciado es consecuencia directa del ítem anterior y del hecho de que todo shift de aristas es un STF de memoria 1. 3. Veamos que el grafo G construido en la prueba del teorema 2.28, aparte de satisfacer [M +1] [M ] que XG = X , cumple que X̂G = X . G construido tiene conjunto de vértices V = BM (X), y entre los vértices I = a1 · · · aM y J = b1 · · · bM hay arista si, y sólo si, a2 · · · aM = b1 · · · bM −1 y a1 · · · aM bM ∈ BM +1 (X). Es decir, llamando B a la matriz de incidencia, se tiene que BIJ = 1 si, y sólo si, I y J solapan progresivamente y el bloque obtenido de agregar a I el último símbolo de J está en BM +1 (X). Recordemos también que es X = XF para alguna colección F de bloques de tamaño M + 1. Sea x ∈ X̂G . Se tiene que, para todo k ∈ Z, xk ∈ V , y Bxk xk+1 = 1, de donde xk −1 y xk+1 solapan progresivamente. Denamos x = βM (x). Se tiene que, para cualquier k ∈ Z, xk · · · xk+M ∈ BM +1 (X) (pues es el bloque que resulta de agregar a xk el último / F , y entonces x ∈ X , así que x ∈ X [M ] . símbolo de xk+1 ), es decir, xk · · · xk+M ∈ [M ] Ahora sea x ∈ X . Sea x tal que βM (x) = x. Se tiene que, para cualquier k ∈ Z, es xk = xk · · · xk+M −1 ∈ BM (X), xk+1 = xk+1 · · · xk+M ∈ BM (X), y xk · · · xk+M ∈ BM +1 (X), por lo que Bxk xk+1 = 1. Luego, x ∈ X̂G . Recordemos que el grafo 4. Desdoblamiento de estados El desdoblamiento de estados es un procedimiento para construir nuevos grafos a partir de uno dado. Comenzando con una partición del conjunto de aristas, cada estado es desdoblado en una cierta cantidad de estados derivados. Aunque el grafo resultante puede parecer muy distinto del original, ambos tienen shifts de aristas conjugados. Hay una operación inversa del desdoblamiento, llamada amalgama de estados. Resulta ser que cualquier conjugación entre shifts de aristas puede dividirse en una sucesión nita de desdoblamientos y amalgamas de estados. Esto, junto a aplicaciones para la producción de códigos de estados nitos, explica la crucial importancia del desdoblamiento de estados en dinámica simbólica. Comenzamos con una descripción del desdoblamiento de un solo estado, operación que desdoblamiento elemental. Sea G un grafo con conjunto de estados V y conjunto de aristas Σ. Fijemos un estado I ∈ V , y supongamos, por el momento, que no hay bucles en I . Hagamos una partición del conjunto de aristas salientes de I (es decir, ΣI ) en dos subconjuntos 1 2 disjuntos no vacíos ΣI y ΣI . Construimos un nuevo grafo H , basándonos en esta partición, como 1 2 i sigue: el conjunto de estados es W = (V − {I}) ∪ {I , I }. Para cada arista e ∈ ΣI (donde i i es 1 o 2), pongamos una arista en H desde I hasta t(e) llevando el mismo nombre e (notar I que, como no hay bucles en I , t(e) 6= I , de modo que t(e) ∈ W ). Para cada f en Σ (es decir, 1 1 2 cada arista f llegando a I ), pongamos dos aristas f desde i(f ) hasta I y f desde i(f ) hasta 2 I . Todas las otras aristas de G (es decir, las que no están vinculadas al nodo I ) se copian en H con el mismo nombre e idénticos nodos inicial y terminal. Queda entonces completa la construcción de H . Hablando sin precisión, desdoblamos las aristas salientes y reproducimos las aristas entrantes a I . La gura 8 muestra cómo es la operación. denominaremos 4. DESDOBLAMIENTO DE ESTADOS 31 Figura 8. G el grafo de la izquierda en la gura 9, y consideremos la partición de Σ2I = {b, c}. A la derecha de esa gura se muestra el grafo resultante I con esa partición. Ejemplo 2.37. Sea ΣI dada por Σ1I = {a} de desdoblar el estado y Figura 9. Supongamos que H se forma a partir de G desdoblando el estado I, como se describió más arriba. A continuación construimos una conjugación entre sus shifts de aristas XG y XH . i I Denamos la transformación monobloque Ψ : B1 (XH ) → B1 (XG ) mediante Ψ(f ) = f si f ∈ Σ I y Ψ(e) = e si e ∈ / Σ . En otras palabras, Ψ simplemente borra supraíndices. Es posible chequear (lo haremos más adelante) que borrar supraíndices de los caminos en G, de modo que Ψ H produce caminos en ψ : XH → XG . Ahora induce un código de ventana deslizante monobloque Φ : B2 (XG ) → B1 (XH ) mediante: si f∈ / ΣI f f 1 si f ∈ ΣI y e ∈ Σ1I Φ(f e) = 2 f si f ∈ ΣI y e ∈ Σ2I denamos un código 2-bloque Es decir, Φ se anticipa un símbolo y puede añadir un supraíndice, dependiendo de lo que ve. G en 0 yanticipación 1. Puesto que agregar y eliminar supraíndices no tiene efecto, vemos que ψ φ(x) = x para todo x ∈ XG . Recíprocamente, los supraíndices están unívocamente determinados por la denición 1 2 de Φ, ya que ΣI y ΣI son una partición de ΣI , de modo que φ ψ(y) = y para todo y ∈ XH . Luego, φ es una conjugación de XG en XH . Es factible chequear (también lo haremos más adelante) que caminos de H , y, por lo tanto, induce un CVD φ de XG Ejemplo 2.38. Las acciones de 2.37 se muestran a continuación: φ y ψ en XH Φ transforma caminos de con memoria sobre puntos típicos x ∈ XG , y ∈ XH del ejemplo 32 2. SHIFTS DE TIPO FINITO x = ··· d a d b d φ ↓ c e .a d ↑ ψ c e b ··· d d1 a d2 b d2 c e1 . a d2 c e2 b · · · Notar que no gura el símbolo en y debajo de la última d de x, pues para ello hace falta conocer el símbolo a la derecha de dicha d. y = ··· El procedimiento general de desdoblamiento de estados es una extensión, en dos sentidos, del proceso elemental recientemente descripto: por un lado, las aristas salientes de un estado pueden particionarse en una cantidad de conjuntos que no necesariamente sea 2, y, por otro lado, se puede particionar simultáneamente los conjuntos de aristas salientes de todos los estados (incluyendo los que presentan bucles). G = (V, Σ, iG , tGP ) un grafo. Para cada estado I ∈ V , sean denidos un entero positivo m(I) tal que m(I) ≤ | I |, y una partición de ΣI en conjuntos disjuntos m(I) 1 2 (no vacíos) ΣI , ΣI , . . . , ΣI (es decir, m(I) ≥ 1 es la cantidad de átomos en la partición de ΣI ). Sea P la partición resultante de Σ. El grafo de estados desdoblados G[P] formado a partir de G usando P es el grafo (W, Σ0 , iH , tH ) denido como sigue: k Conjunto de estados: W = I : I ∈ V ∧ 1 ≤ k ≤ m(I) . j 0 Conjunto de aristas: Σ = e : e ∈ Σ ∧ 1 ≤ j ≤ m tG (e) . n j n Función de nodos iniciales: iH (e ) = (iG (e)) donde n es tal que e ∈ Σi (e) . G j j Función de nodos terminales: tH (e ) = (tG (e)) . n j Es decir, si e ∈ Σ va de I a J en G, entonces existe n tal que e ∈ ΣI , y el estado inicial de e [P] n j j n j en G es I y el terminal es J ; es decir, e va de I a J . Un desdoblamiento elemental de G por el estado I ocurre cuando m(I) = 2 y m(J) = 1 para todo J 6= I . Definición 2.39. Sea se tiene que m(J) = 1, los supraíndices 1 (en el nombre del 1 estado y de las aristas entrantes a J en el grafo desdoblado) se vuelven redundantes, y no hay Cuando para algún estado J problemas en omitirlos (pues se obtiene un grafo isomorfo), como hicimos en nuestras primeras discusiones respecto de los desdoblamientos elementales. Asumiremos que los elementos de las particiones de aristas salientes de cada nodo nunca son vacíos. Esto garantiza que el grafo obtenido de desdoblar estados en un grafo esencial (o irreducible) es también esencial (o irreducible). Observación 2.40. De la denición del grafo desdoblado, se desprende que una arista n ej k n va de I hasta J si, y sólo si, e ∈ ΣI (lo cual implica que iG (e) = I ), tG (e) = J y j = k . Por n k ello, la cantidad de aristas desde I hasta J en el grafo desdoblado es precisamente la cantidad n de aristas en ΣI que terminan en J en el grafo G. Es decir, 0 0J k ΣI n ∩ Σ = ΣnI ∩ ΣJ para todos k ∈ {1, . . . , m(J)}, n ∈ {1, . . . , m(I)}, I, J ∈ V (G). el grafo de la izquierda en la gura 10, de modo que ΣI = {e, f } y {g}. Tomemos las siguientes particiones: Σ1I = {e}, Σ2I = {f } y Σ1J = {g}, de modo que = 2 y m(J) = 1. Entonces P = {Σ1I , Σ2I , Σ1J }. El grafo resultante del desdoblamiento se Ejemplo 2.41. Sea ΣJ = m(I) G muestra a la derecha en esa misma gura. Notar que, en particular, el bucle 1 1 2 1 2 desdobla en un bucle e en el estado I y otra arista e desde I hasta I . e en el estado ΣI , a saber, Σ1I = {e} y se {e, f }Z . EsenΣ2I = {f }. El grafo Ejemplo 2.42. La gura 11 muestra a la izquierda un grafo del full shift cialmente, hay una sola partición no trivial de I 4. DESDOBLAMIENTO DE ESTADOS 33 Figura 10. resultante del desdoblamiento se muestra en la misma gura a la derecha, y puede advertirse que, salvo cambio de nombres, es esencialmente la presentación del full shift en bloques de tamaño 2 con solape. Figura 11. 1 Ejemplo 2.43. Para el grafo G a la izquierda en la gura 12, sea P denida por ΣI = {a}, [P] 2 2 1 1 ΣI = {b, c}, ΣJ = {d}, ΣK = {e} y ΣK = {f }. El grafo G se muestra a la derecha de esa misma gura. Figura 12. 34 2. SHIFTS DE TIPO FINITO Como la construcción de [P] que G es el grafo de G[P] usa particiones de conjuntos de aristas desdoblamiento de salidas una correspondiente noción de formado a partir de desdoblamientos de entradas, salientes, decimos G usando P. Hay usando particiones de conjuntos de aristas entrantes. un grafo. Para cada estado I ∈ V , sea denida una I I I partición de Σ en conjuntos disjuntos (no vacíos) Σ1 , Σ2 , . . . , Σm(I) , donde m(I) ≥ 1 es la canI tidad de conjuntos en la partición de Σ . Sea P la partición resultante de Σ. El Definición 2.44. Sea G = (V, Σ, i, t) I grafo de desdoblamiento de entradas G[P] formado a partir de G usandoP tiene como conjunto de esta {Ik : I ∈ V ∧ 1 ≤ k ≤ m(I)} y como conjunto de aristas a ej : e ∈ Σ ∧ 1 ≤ j ≤ m i(e) J Si e ∈ Σ va de I a J en G, entonces existe j tal que e ∈ Σj , y el estado inicial de ei en G[P] Ii y el terminal es Jj . dos a . es G el grafo a la izquierda en la gura 13. Denamos P mediante ΣI1 = = {f }. El correspondiente G[P] se muestra en esa misma gura, a la Ejemplo 2.45. Sea {e}, ΣI2 derecha. = {g} J y Σ1 Figura 13. también como un desdoblamiento de salidas de G (y similarmente para los desdoblamientos de entradas). También es apropiado dar Será conveniente considerar a un grafo isomorfo a G[P] un nombre a la operación inversa del desdoblamiento. H es un desdoblamiento de un grafo G, y G es una amalgama o a G[P] , para alguna partición Definición 2.46. Un grafo de H, si H es isomorfo a [P] G P del conjunto de aristas de G. desdoblamiento de salidas, desdoblaamalgama de entradas. Notar que los isomorsmos Si hace falta mayor precisión, emplearemos los términos miento de entradas, amalgama de salidas o de grafos, de acuerdo a nuestra denición, pueden ser vistos como cualquiera de estas cuatro operaciones. Al igual que en los desdoblamientos elementales, los desdoblamientos en general producen grafos cuyos shifts de aristas son conjugados a los del grafo inicial. Si un grafo H es un desdoblamiento de un grafo G, entonces los shifts de son conjugados. Teorema 2.47. aristas XG y XH Demostración. Probaremos sólo para el caso de los desdoblamientos de salida, siendo el otro caso similar. Ya que los isomorsmos de grafos establecen conjugaciones, y que la composición de con[P] jugaciones es otra conjugación, alcanza con probar el resultado para el caso en que H = G . Mostraremos, en sucesivos pasos, que existen CVD ψ : XH → XG y φ : XG → XH tales que φ = ψ −1 , con lo que quedará demostrado que φ es una conjugación, y, por lo tanto, XG ∼ XH . 4. DESDOBLAMIENTO DE ESTADOS Denamos la transformación monobloque [0,0] y consideremos ψ = Ψ∞ . 35 Ψ : B1 (XH ) → B1 (XG ) mediante Ψ (ej ) = e, y ∈ XH , y tomemos k ∈ Z. Debe ser yk = ej , yk+1 = f m con e, f ∈ Σ y tH (e ) = iH (f m ); por denición de H , esto implica que (tG (e))j = (iG (f ))n con n tal n que f ∈ Σi (f ) , de donde concluimos que tG (e) = iG (f ) (es decir, ef es camino en G) y G j que j = n, es decir, f ∈ Σi (f ) . Por lo tanto, G tG ((ψy)k ) = tG (Ψ(yk )) = tG Ψ(ej ) = tG (e) = iG (f ) = iG (Ψ(f m )) = iG ((ψy)k+1 ) Sea j mostrando que ψ(y) ∈ XG , y entonces ψ (XH ) ⊆ XG , ψ : XH → XG por lo que es un CVD monobloque bien denido. Ahora denamos la transformación de bloques siguiente: si ef ∈ B2 (XG ), entonces existe un Φ : B2 (XG ) → B1 (XH ) por j único j tal que f ∈ Σi (f ) , G medio de lo y denimos [0,1] Φ∞ . Φ(ef ) = ej . Consideremos φ = Sea x ∈ XG , y tomemos k ∈ Z. Tenemos que xk , xk+1 , xk+2 ∈ Σ, xk xk+1 , xk+1 xx+2 ∈ B2 (XG ), y existen I, J ∈ V tales que tG (xk ) = iG (xk+1 ) = I , tG (xk+1 ) = iG (xk+2 ) = J . n1 n2 n1 Sean n1 y n2 tales que xk+1 ∈ ΣI y xk+2 ∈ ΣJ . Entonces Φ(xk xk + 1) = xk y n2 Φ(xk+1 xk+2 ) = xk+1 . Luego, tH ((φx)k ) = tH (Φ(xk xk+1 )) = tH (xnk 1 ) = (tG (xk ))n1 = I n1 2 iH ((φx)k+1 ) = iH (Φ(xk+1 xk+2 )) = iH xnk+1 = (iG (xk+1 ))n1 = I n1 mostrando que φ(x) ∈ XH , y entonces φ (XG ) ⊆ XH , φ : XG → XH por lo que es un CVD bien denido. x ∈ XG y k ∈ Z. Entonces (φx)k = Φ (xk xk+1 ) = xnk para algún n, y entonces (ψ(φx))k = Ψ ((φx)k ) = Ψ (xnk ) = xk . En consecuencia, (ψ ◦ φ)(x) = x para todo x ∈ XG . Recíprocamente, sean y ∈ XH y k ∈ Z. Razonando como antes, debe ser yk yk+1 = ej f m con f ∈ ΣjiG (f ) , por lo que (ψy)[k,k+1] = ef (con ef ∈ B2 (XG ) pues ψ(y) ∈ XG ) j j y entonces Φ(ef ) = e , así que (φ(ψy))k = Φ (ψy)[k,k+1] = Φ(ef ) = e = yk . En consecuencia, (φ ◦ ψ)(y) = y para todo y ∈ XH . Sean Queda entonces demostrado que φ : XG → XH es código de ventana deslizante que posee función inversa que es también código de ventana deslizante, por lo que XG y XH son conjugados. H es un desdoblamiento de salidas de G, hay un XG , que se denomina código de amalgama de salidas, cuyo inverso es un código con memoria 0 y anticipación 1 llamado código de de desdoblamiento de salidas. Análogamente, si H es un desdoblamiento de entradas de G, tenemos un código de La demostración anterior muestra que si código monobloque desde XH a amalgama de entradas monobloque con inverso denominado código de desdoblamiento de entradas que tiene memoria 0 y anticipación 1. Del teorema previo, se deduce que si un grafo (nita) de desdoblamientos y amalgamas de un grafo H puede ser obtenido por una sucesión G, entonces XH ∼ XG (la conjugación es la composición de los sucesivos códigos de desdoblamiento o amalgama). Aunque no lo haremos aquí, es posible probar también el recíproco: cualquier conjugación entre shifts de aristas puede escribirse como una composición de códigos de desdoblamientos y amalgamas. Este importante resultado se conoce como 4.1. Teorema de la Descomposición. Los desdoblamientos y las matrices de adyacencia. Consideremos el ejem- plo 2.43. Los estados de G y de su desdoblado son, respectivamente, V = {I, J, K} y W = {I 1 , I 2 , J 1 , K 1 , K 2 }. Podemos representar cómo los estados en W se derivan a partir de los estados en V por medio de la siguiente matriz D con las indizadas por V y columnas indizadas 36 2. SHIFTS DE TIPO FINITO por W (en el orden dado): 1 1 0 0 0 D= 0 0 1 0 0 0 0 0 1 1 1 2 Por ejemplo, DI,I 1 = 1 = DI,I 2 pues I e I resultan de desdoblar DI,J 1 = 0 pues J 1 no procede del desdoblamiento de I . el estado I, mientras que Por otro lado, podemos especicar las cantidades de aristas en cada partición que terminan en un estado dado, por medio de la siguiente matriz indizadas por V E con las indizadas por W y columnas (en el orden dado): E= donde, por ejemplo, EI 1 ,J 0 0 1 0 1 1 1 0 1 0 0 1 0 0 0 es la cantidad de aristas en Σ1I que terminan en J, en este caso una sola arista. Un cómputo directo muestra que el producto y que ED DE es igual a la matriz de adyacencia de G, da la matriz de adyacencia del grafo desdoblado. Veremos ahora que esta situación se cumple en general. G = (V, Σ, i, t) un grafo, P una partición de salida de Σ, y H = G[P] . conjunto de vértices de H . La matriz de división D para P es la Definición 2.48. Sea W al V × W denida Designemos por matriz sobre por DI,J k = La 1 0 si si I=J I 6= J matriz de aristas E para P es la matriz sobre W × V EI n ,J denida por = ΣnI ∩ ΣJ De la observación 2.40, surge que EI n ,J corresponde a la cantidad de aristas en el grafo I n hasta J k (cualquiera sea k ∈ {1, . . . , m(J)}). desdoblado que van desde desde Las matrices de división y de aristas permiten obtener las matrices de adyacencia de los grafos involucrados en un desdoblamiento, de acuerdo al siguiente resultado. Teorema 2.49. Sean G, P, H , D y E como en la denición anterior. Entonces, DE = AG ED = AH Demostración. Se tiene que X (DE)I,J = DI,K EK,J = X m(L) X L∈V i=1 K∈W m(I) DI,Li ELi ,J = X m(I) DI,I i EI i ,J = i=1 X EI i ,J i=1 m(I) m(I) X [ [ i J i J i J ΣI ∩ Σ = = ΣI ∩ Σ = ΣI ∩ Σ i=1 i=1 i=1 = ΣI ∩ ΣJ = (AG )I,J m(I) mostrando que DE = AG . Por otro lado, (ED)I i ,J j = X EI i ,K DK,J j = EI i ,J DJ,J j = EI i ,J K∈V j = ΣiI ∩ ΣJ = Σ0I i ∩ Σ0J = (AH )I i ,J j por lo que ED = AH . Capítulo 3 SHIFTS SÓFICOS Supongamos que las aristas de un grafo son rotuladas con símbolos de algún alfabeto A, con la posibilidad de que dos o más aristas puedan llevar el mismo rótulo. Cualquier camino Z biinnito en el grafo produce un punto en el full shift A por lectura de los rótulos de sus aristas, y el conjunto de todos los puntos que así pueden obtenerse se llama un shift sóco. Los shifts sócos son importantes por un número de razones. Veremos en este capítulo que son precisamente aquellos espacios shift que son factores de shifts de tipo nito. Así, la clase de los shifts sócos es la más pequeña colección de espacios shift que contiene a los STF y que también contiene a todos los factores de cada espacio de la colección. Los shifts sócos son los análogos de los lenguajes regulares de la teoría de autómatas, y varios de los algoritmos que veremos en ÿ3.4 son adaptaciones de los de autómatas de estados nitos. Los shifts de tipo nito y los sócos son modelos naturales para almacenamiento y transmisión de la información; estudiaremos su uso en los códigos de estados nitos en el capítulo 5. 1. Presentaciones de shifts sócos Los shifts sócos se denen usando grafos a cuyas aristas se asigna rótulos, donde varias aristas pueden llevar el mismo rótulo. grafo rotulado G es un par (G, L), donde G es un grafo con conjunto rotuladora L : Σ → A asigna a cada arista e de G un rótulo L(e) del alfabeto A. El grafo subyacente de G es G. Un grafo rotulado se dice irreducible si su grafo Definición 3.1. Un de aristas Σ, y la subyacente es irreducible. A veces nos referiremos a un grafo rotulado simplemente como un grafo, y a estados o aristas del grafo subyacente G de un grafo rotulado G G . La rotuladora L de G. En un extremo, como estados o aristas de A a las aristas A = Σ y L(e) = e para toda e ∈ Σ, dando una rotulación uno a uno de aristas por sus nombres. En el otro extremo, A podría consistir de una única letra a y todas las aristas estarían rotuladas con a, es decir, L(e) = a para toda e ∈ Σ. Usualmente, L será no inyectiva, de modo que varias aristas llevarán el mismo rótulo. Aunque L no necesita ser sobreyectiva, toda letra que no esté en la imagen de L no son usadas. Usaremos normalmente caracteres como e, f o g para los nombres de las aristas, y a, b, c o enteros pequeños para sus rótulos. La puede ser cualquier asignación de letras de un alfabeto podríamos tener gura ... muestra dos ejemplos de grafos rotulados típicos. Así como un grafo grafo rotulado (I, J) G G es convenientemente descripto por su matriz de adyacencia tiene como análogo una contiene la suma formal de los rótulos de todas las aristas que van de carácter ∅ AG , un matriz de adyacencia simbólica AG , cuya entrada si no hay tal arista. Por ejemplo, si G y H I a J, o un son los grafos rotulados de la gura ... a izquierda y derecha respectivamente, entonces AG = a b b a a c b AH = ∅ b a + b a c ∅ Hay un análogo del homomorsmo de grafos para grafos rotulados, que añade el requisito de que los rótulos se preserven. G = (G, LG ) y H = (H, LH ) grafos rotulados. Un homomorsmo de grafos rotulados desde G a H es un homomorsmo de grafos (∂Φ, Φ) : G → H tal que Definición 3.2. Sean 37 38 3. SHIFTS SÓFICOS LH (Φ(e)) = LG (e) para toda arista e ∈ Σ(G). En este caso, escribimos (∂Φ, Φ) : G → H. Si ambas ∂Φ y Φ son biyecciones, entonces (∂Φ, Φ) se llama isomorsmo de grafos rotulados, denotado mediante (∂Φ, Φ) : G ∼ = H. Dos grafos rotulados son isomorfos como grafos rotulados (o simplemente isomorfos) si existe un isomorsmo de grafos rotulados entre ellos. Se puede pensar que dos grafos rotulados isomorfos son el mismo para nuestros propósitos. Si G = (G, L) es un grafo rotulado, entonces caminos biinnitos del grafo subyacente de G G. L puede ser usada para rotular caminos y Denimos el rótulo de un camino π = e1 e2 . . . en mediante L(π) = L(e1 )L(e2 ) . . . L(en ) n-bloque sobre A, y al cual a veces nos referiremos como un bloque rotulado. Para el camino vacío ε, denimos L(ε) = ε, la palabra vacía sobre A. Si ξ = . . . e−1 e0 e1 . . . es un camino biinnito en G, de modo que ξ es un punto del shift de aristas XG , denimos el rótulo del camino xi como L∞ (ξ) = . . . L(e−1 )L(e0 )L(e1 ) . . . ∈ AZ que es un El conjunto de los rótulos de todos los caminos biinnitos en G es denotado por XG = x ∈ AZ : x = L∞ (ξ) para algún ξ ∈ XG = {L∞ (ξ) : ξ ∈ XG } = L∞ (XG ) A-shift. Por ejemplo, si G es el grafo rotulado de la izquierda XG es el full {a, b}-shift; el grafo rotulado H de la derecha produce un subconjunto propio del full {a, b, c}-shift (¾por qué?). Notar también que si G y H son isomorfos, entonces XG = XH . Así, XG es un subconjunto del full en la gura ..., entonces Este capítulo trata los espacios shift que surgen de grafos rotulados. Definición 3.3. Un subconjunto algún grafo rotulado cual XG = X . G. Una X de un full shift es un presentación de un shift sóco X La transformación shift en XG es denotada por shift sóco si X = XG para G para el es un grafo rotulado σG . El término sóco fue acuñado por Weiss, y se deriva de la palabra hebrea para nito. Es importante darse cuenta de que un shift sóco dado tiene muchas presentaciones diferentes. Por ejemplo, la gura ... muestra cuatro presentaciones del full 2-shift, ninguna de las cuales son isomorfas entre sí (aunque los grafos subyacentes de (b) y (c) son grafos isomorfos). Si X G = (G, L) y w es un bloque en B(X), decimos que presentación de w si L(π) = w. Un bloque w dado puede tener es un shift sóco presentado por un camino π en G es una varios caminos diferentes que lo presenten. Por ejemplo, en la gura ...(d), el bloque 010001 tiene tres presentaciones, una empezando en cada uno de los tres vértices. Si que un camino biinnito caminos, un punto de ξ XG en XG es una x ∈ XG , decimos presentación de x si L∞ (ξ) = x. Al igual que con los puede tener varias presentaciones diferentes. Nuestra denición de un shift sóco no requiere que sea un espacio shift. Sin embargo, siempre lo es. Teorema 3.4. Los shifts sócos son espacios shift. X un shift sóco sobre A, y G = (G, L) L : Σ → A induce un código monobloque L∞ : XG → XG , X = L∞ (XG ) es un espacio shift por teorema 1.61. Demostración. Sea Entonces una presentación de X. de modo que su imagen Nótese que los shifts de aristas son shifts sócos, pues podemos simplemente usar el conjunto de aristas L(e) = e. Σ como alfabeto y, como rotuladora, la función identidad L : Σ → Σ dada por El siguiente resultado extiende esta observación para mostrar que los shifts de tipo nito son sócos. Teorema 3.5. Todo shift de tipo nito es un shift sóco. 1. PRESENTACIONES DE SHIFTS SÓFICOS 39 M ≥ 0. Sea G el grafo construi[M +1] do según la demostración del teorema 2.28, de modo que X = XG . Recordemos que V (G) = BM (X), Σ(G) = BM +1 (X) y cada arista e1 . . . eM +1 va desde e1 . . . eM hasta e2 . . . eM +1 . Rotulemos la arista e1 . . . eM +1 con el símbolo e1 . Mostraremos que el grafo rotulado G = (G, L) es una presentación de X . [M +1] Sea βM +1 : X → X = XG el código de bloques dado por Demostración. Sea X un STF, digamos de memoria βM +1 (x)[i] = x[i,i+M ] L x[i,i+M ] = xi , vemos que L∞ (βM +1 (x)) = x para todo x ∈ X , probando que X ⊆ XG . [M +1] Recíprocamente, cada punto ξ ∈ XG = X tiene la forma ξ = βM +1 (x) para algún x ∈ X , así que L∞ (ξ) = L∞ (βM +1 (x)) = x ∈ X . Luego, XG = L∞ (XG ) ⊆ X , y entonces X = XG . Como Capítulo 4 ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT El objetivo de este capítulo es analizar a los espacios shift a través de sus características topológicas. Mediante la denición de una manera adecuada para medir distancias entre tirillas biinnitas, podremos ver a la full shift como un espacio métrico y estudiarla con las herramientas clásicas de la topología y el análisis. De ésto, resultará una caracterización de los espacios shift y de los códigos de ventana deslizante a través de propiedades topológicas. Esto forma parte de investigaciones más o menos recientes (alrededor de 1970) en el área de la Dinámica Simbólica, de modo que se trata de tópicos relativamente nuevos en Matemática, y en franco proceso de expansión. No se pretende dar aquí un estudio detallado de la teoría general de espacios métricos, sino más bien enunciar las deniciones y propiedades básicas de los mismos con el único objetivo de aplicarlos al estudio de los espacios shift. En el presente capítulo, primero deniremos una métrica para la full shift y veremos algunas propiedades básicas importantes de la misma, para luego estudiar la convergencia de sucesiones y arribar a la conclusión de que los espacios shift están caracterizados por ser subconjuntos compactos y shift-invariantes de la full shift. Luego analizaremos la continuidad de acuerdo a la métrica denida, encontrando que los códigos de ventana deslizante se caracterizan por ser las funciones entre espacios shift que son continuas y conmutan con la función shift. 1. Definición 4.1. Una d : X × X → R+ 0 1. 2. 3. métrica Una métrica para AZ o función distancia para un conjunto d (x, y) = 0 ⇔ x = y ∀x, y ∈ X, d (x, y) = d (y, x) (axioma de simetría) ∀x, y, z ∈ X, d (x, z) ≤ d (x, y) + d (y, z) (desigualdad El par (X, d) X es una función con las siguientes propiedades: se denomina triangular) espacio métrico. Para llevar adelante el objetivo planteado en la introducción, debemos dotar a AZ de una métrica adecuada. Para nuestros propósitos, adecuada va a querer decir que dos puntos x e y de AZ estarán tanto más cerca cuanto más grande sea el bloque central en que coinciden. Así, por ejemplo, · · · 00010.110101110000 · · · y · · · 10010.110101110010 · · · deberán estar entre sí a una distancia menor que la distancia que haya entre los puntos · · · 00010.1101110000 · · · y · · · 00011.11111111 · · · Para ello, deniremos d : AZ × AZ → R+ 0 mediante d (x, y) = 0 si − mı́n{|k|:xk 6=yk } 2 si x=y x 6= y En palabras, para encontrar la distancia entre dos puntos distintos coordenada entera −|k| y evaluar 2 . k (positiva o negativa) en la que x e y x e y , hay que detectar la dieren más cercana a la coordenada 0, Ejemplo 4.2. Encontremos la distancia entre los puntos x = · · · 00010.110101110000 · · · y = · · · 10010.110101110010 · · · 40 1. UNA MÉTRICA PARA AZ 41 A n de visualizar mejor, dispongamos ambos puntos uno debajo del otro, y marquemos con × las coordenadas en que xk 6= yk : −5 −4 −3 −2 −1 0 1 2 3 4 5 6 7 8 9 10 11 x ... 0 0 0 1 0 1 1 0 1 0 1 1 1 0 0 0 0 ... × × × y ... 1 0 0 0 0 1 1 0 1 0 1 1 1 0 0 1 0 ... × más = 1/4. La marca −|−2| 2 cercana a la coordenada 0 corresponde a k = −2, de modo que Notemos que, de acuerdo a esta denición, el mayor valor que puede tomar d d (x, y) = es 1, que corresponde al caso en que los dos puntos entre los que se está midiendo la distancia dieren en la coordenada 0. Justiquemos que la función d así denida es efectivamente una métrica para AZ : x e y en AZ , o bien son iguales o bien son distintos. En el primer + caso, es d (x, y) = 0 ∈ R0 . En el caso en que x 6= y , el conjunto {k : xk 6= yk } ⊆ Z es no vacío, de modo que el conjunto {|k| : xk 6= yk } ⊆ N tampoco es vacío, y entonces tiene −t un mínimo elemento N . Ya que la función exponencial 2 es estrictamente positiva + −N para t ∈ R, d (x, y) = 2 ∈ R0 . Esto muestra también que d (x, y) = 0 ⇔ x = y . Dados dos puntos El cumplimiento del axioma de simetría es directo de ver. Z Para la desigualdad triangular, sean x, y, z ∈ A dos a dos distintos. Llamemos Nxy = mı́n {|k| : xk 6= yk } Nyz = mı́n {|k| : yk 6= zk } Nxz = mı́n {|k| : xk 6= zk } N = mı́n {Nxy , Nyz }. N = 0, es y0 6= x0 o y0 6= z0 , de modo que d (x, y) = 1 o d (y, z) = 1, y por lo tanto es d (x, y) + d (y, z) ≥ 1 ≥ d (x, z). • Si N > 0, es x[−N +1,N −1] = z[−N +1,N −1] , pues si tomamos i tal que |i| < N , tenemos que |i| < Nxy y |i| < Nyz , de donde xi = yi e yi = zi , por lo que xi = zi . O sea que Nxz ≥ N . Por lo tanto, observando que 2−Nxz ≤ 2−N y que es N = Nxy o N = Nyz , Tomemos • Si se tiene d (x, z) = 2−Nxz ≤ 2−N ≤ 2−Nxy + 2−Nyz = d (x, y) + d (y, z) Es decir, en cualquier caso se verica la desigualdad triangular. La función distancia puede restringirse de de la full shift, y el par (X, d) AZ × AZ a X ×X para cualquier subconjunto X sigue siendo un espacio métrico. La métrica recientemente denida recibe el nombre de métrica usual para los espacios shift, y es a la que haremos referencia por defecto siempre que hablemos de distancia en espacios shift, a menos que especiquemos lo contrario. Una condición necesaria y suciente para que dos puntos distintos estén a distancia menor ε esrictamente positivo es que ambos coincidan en una ventana central de tamaño 2k +1, 1 en donde k = log (a menos que especiquemos otra cosa, log siempre signicará logaritmo ε en base 2; además, para r ∈ R, brc es la parte entera o piso de r , es decir, el mayor entero que no supera a r ). Para probar la armación, notemos que 1 d (x, y) < ε ⇔ 2− mı́n{|k|:xk 6=yk } < ε ⇔ mı́n {|k| : xk 6= yk } > log ε 1 ⇔ mı́n {|k| : xk 6= yk } > log ⇔ x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c] ε ε ε ε ε Juntando esto con el hecho de que dos puntos de la full shift que están a distancia 0 coinciden en el bloque central de tamaño 2k + 1 cualquiera sea k ∈ N, tenemos el siguiente resultado. que un Proposición 4.3. Sea ε > 0, y x e y dos puntos de AZ . Se tiene que d (x, y) < ε ⇐⇒ x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c] ε ε ε ε 42 4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT En particular, para cualquier K ∈ N, tenemos que d (x, y) < 2−K ⇔ x[−K,K] = y[−K,K] . (X, d) un espacio métrico, x ∈ X y r ∈ R+ . El entorno de radio r con centro en x, denotado Br (x), es el conjunto de puntos del espacio cuya distancia a x es menor que r . Definición 4.4. Sea En virtud de la Proposición 4.3, el entorno de radio ε con centro en x ∈ X ⊆ AZ , para la métrica usual, es Particularmente, n o Bε (x) = y ∈ X : x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c] ε ε ε ε para K ∈ N, B2−K (x) = y ∈ X : x[−K,K] = y[−K,K] . E de un espacio métrico (X, d), se dice que un punto x ∈ E es un punto interior a E si existe r > 0 tal que Br (x) ⊆ E . E es abierto en X si todos sus puntos son puntos interiores a E . Definición 4.5. Dado un subconjunto Como caso particular, los entornos de cualquier espacio métrico son conjuntos abiertos. Puede demostrarse que cualquier conjunto abierto de un espacio métrico es una unión de entornos, y viceversa. Además, la unión arbitraria de conjuntos abiertos es un conjunto abierto, y la intersección nita de conjuntos abiertos es también un conjunto abierto. En el caso particular de la full shift, a partir de la denición de conjunto abierto y de la Z caracterización de los entornos, se deduce que un subconjunto X de A es abierto si, y sólo si, Z para cada x ∈ X , existe K ∈ N tal que cualquier punto y ∈ A que satisface y[−K,K] = x[−K,K] pertenece también a X. Tal K dependerá, en general, de x. E de un espacio métrico (X, d), se dice que un punto x ∈ X es un punto de acumulación de E si todo entorno con centro en x tiene un punto de E − {x}. E es cerrado si contiene a todos sus puntos de acumulación. La clausura de E es la unión de E con el conjunto de sus puntos de acumulación. Definición 4.6. Dado un subconjunto Se tiene que E es cerrado si, y sólo si, su complemento es abierto. Además, y sólo si, la clausura de E coincide con E. E es cerrado si, Puede verse, usando las leyes de De Morgan, que la intersección arbitraria de conjuntos cerrados es un conjunto cerrado, así como la unión nita de conjuntos cerrados es también un conjunto cerrado. 2. Sucesiones (X, d) es una función de N en X . Denotaremos por xn al n-ésimo término de la sucesión, y por {xn }n∈N a la sucesión completa. Cuando el espacio (n) métrico en cuestión sea un espacio shift, denotaremos x al n-ésimo término de la sucesión, pues seguiremos usando xn para referirnos al símbolo que haya en la n-ésima coordenada de la tirilla biinnita x. Una sucesión en un espacio métrico {xn }n∈N en el espacio (X, d) se dice convergente en X si lı́mn→∞ d (xn , p) = 0. En este caso, escribimos lı́mn→∞ xn = p, o también Definición 4.7. Una sucesión p∈X xn −→ p existe tal que n→∞ Obsérvese que lı́mn→∞ xn = p si, y sólo si, ∀ε > 0, ∃N ∈ N : ∀n ≥ N, d (xn , p) < ε. Caracterizaremos ahora la convergencia de sucesiones en espacios shift. Básicamente, una (n) Z x en un espacio shift converge a x ∈ A cuando para cualquier K natural, n∈N por grande que sea, el bloque central de tamaño 2K + 1 de x coincide con el bloque central de (n) tamaño 2K + 1 de x , para todo n sucientemente grande. sucesión Proposición 4.8. Sea x(n) n∈N una sucesión en el espacio shift X con la métrica usual, (n) y x ∈ AZ . Se tiene que lı́mn→∞ x(n) = x si, y sólo si, ∀K ∈ N, ∃N ∈ N : ∀n ≥ N, x[−K,K] = x[−K,K] . 2. SUCESIONES 43 Demostración. Dado que la función exponencial a tasa menor que mente a 0, 1 tiende asintótica- por la Proposición 4.3 tenemos que: lı́m x(n) = x ⇔ ∀ε > 0, ∃N ∈ N : ∀n ≥ N, d x(n) , x < ε ⇔ n→∞ ∀K ∈ N, ∃N ∈ N : ∀n ≥ N, d x(n) , x < 2−K ⇔ (n) ∀K ∈ N, ∃N ∈ N : ∀n ≥ N, x[−K,K] = x[−K,K] Ejemplo 4.9. Estudiar la convergencia de la sucesión (n) xi = 1 0 si si x (n) n∈N en {0, 1} Z denida por |i| = n |i| = 6 n Veamos el siguiente cuadro: (0) x x(1) x(2) x(3) −4 −3 −2 −1 0 1 2 3 0 0 0 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 1 0 0 1 0 0 0 0 0 1 ··· ··· ··· ··· 4 0 0 0 0 ··· ··· ··· ··· . . . Rápidamente nos damos cuenta que la ventana central de tamaño puros 0, para todo 2K + 1 de x(n) consta de n ≥ K + 1. Luego, de acuerdo al criterio de convergencia en espacios shift, ∞ el límite de la sucesión es el punto 0 . Ejemplo 4.10. Estudiar la convergencia de la sucesión x(n) = (0001)∞ (01)∞ x(n) n∈N en {0, 1}Z denida por n es par n es impar si si Dispongamos los términos encolumnados, como antes: x(0) x(1) x(2) x(3) −4 −3 −2 −1 0 1 2 3 0 0 0 1 0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 1 0 0 0 1 0 1 0 1 0 1 0 1 ··· ··· ··· ··· 4 0 0 0 0 ··· ··· ··· ··· . . . 1, Aquí vemos que la coordenada tural y a en el alfabeto {0, 1}, por ejemplo, no se estabiliza nunca: para cualquier N na(n) n > N tal que x1 6= a. Entonces, esta sucesión no es existe convergente. {xn }n∈N y {zk }k∈N dos sucesiones en el espacio métrico (X, d). Se {zk }k∈N es subsucesión de {xn }n∈N si existe una sucesión de números naturales estrictamente creciente {nk }k∈N tal que para todo k ∈ N, es zk = xnk . Definición 4.11. Sean dice que (X, d) un espacio métrico. Un subconjunto K K posee subsucesión convergente en K . Definición 4.12. Sea si toda sucesión en Es bien sabido que un subconjunto que unidos cubren a K K de X se dice compacto es compacto si, y sólo si, cualquier familia de abiertos posee una subfamilia nita que también cubre a K. Además, todo subconjunto compacto de un espacio métrico es un conjunto cerrado, y si el espacio métrico es compacto, entonces la familia de los subconjuntos compactos del espacio es precisamente la de los subconjuntos cerrados. El siguiente resultado muestra que cualquier espacio shift (en particular la full shift) es compacto para la métrica usual. 44 4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT Sea X un espacio shift con la métrica usual. Entonces X es un subconjunto compacto de A . (n) Demostración. Sea x una sucesión en X . Ya que A es un conjunto nito, debe n∈N existir a0 ∈ A y un subconjunto innito B0 de números naturales tal que para todo n ∈ B0 , (n) x0 = a0 . Elijamos cualquier n0 ∈ B0 . Como A3 es nito, deben existir a−1 y a1 en A, (n) y un subconjunto innito B1 ⊆ B0 tal que para todo n ∈ B1 , x[−1,1] = a−1 a0 a1 . Elijamos n1 ∈ B1 tal que n1 > n0 (tal elección es posible, pues B1 es un conjunto innito de números naturales, y por tanto no acotado). Siguiendo de esta manera, para cada k ∈ N, como A2k+1 es nito, deben existir a−k y ak en A, y un subconjunto innito Bk ⊆ Bk−1 tal que (n) para todo n ∈ Bk , x[−k,k] = a−k · · · a0 · · · ak . Elijamos nk ∈ Bk tal que nk > nk−1 . De este modo, hemos denido (inductivamente) a−k , ak y nk para todo k ∈ N. Como {nk }k∈N es (n ) (n) creciente, x k es subsucesión de x . denamos x = (ak )k∈Z . Dado que todo blok∈N n∈N (nk ) que de x ocurre en algún x ∈ X , tenemos que x pertenece al espacio shift X . Además, lı́mk→∞ x(nk ) = x, pues dado K ∈ N, tomando N = K , tenemos que para todo k ≥ N es (nk ) = a−K a−K+1 · · · a0 · · · aK−1 aK = x[−K,K] . Entonces X es compacto. x[−K,K] Proposición 4.13. Z La sola compacidad no caracteriza completamente a los espacios shift: por ejemplo, el con∞ junto unitario {(01) } es un subconjunto compacto de la full {0, 1}-shift (como cualquier conjunto nito de cualquier espacio métrico) pero no es un espacio shift pues carece de la shift-invariancia. Precisamente, compacidad más shift-invariancia equivalen a tener carácter de espacio shift. Un subconjunto de AZ es un espacio shift si, y sólo si, es compacto (para la métrica usual de los espacios shift) y shift-invariante. Teorema 4.14. Demostración. La shift-invariancia de un espacio shift fue demostrada en el primer ca- pítulo, y la compacidad en la Proposición 4.13. Z es un subconjunto compacto y shift-invariante de A . c c Por ser compacto, X es cerrado, y entonces X es abierto. De allí que para cada y ∈ X existe c K (y) ∈ N tal que B2−K(y) (y) está contenido en X . Tomemos F = y[−K(y),K(y)] : y ∈ X c , y Recíprocamente, supongamos que veriquemos que X X = XF . c x ∈ X , entonces x[−K(x),K(x)] ∈ F , de donde x ∈ / XF . Luego, XF ⊆ X . Si x ∈ / XF , debe existir u ∈ F tal que u v x. Por denición de F , u debe ser de longitud impar, es decir, |u| = 2n + 1 para algún n ∈ N. Entonces u ocurre en x desde alguna 0 m+n posición m ∈ Z, es decir, x[m,m+2n] = u. Llamando x = σ (x), es x0[−n,n] = u. Como u ∈ F , hay un y ∈ X c tal que y[−K(y),K(y)] = u, debiendo entonces ser K(y) = n. Pero 0 0 c 0 entonces x[−n,n] = y[−n,n] , de donde x ∈ B2−K(y) (y) ⊆ X , o sea, x ∈ / X . Y, por la shift invariancia, x ∈ / X . Luego, X ⊆ XF . Si 3. AZ Cilindros. Conexidad puede ser visto como el producto cartesiano innito cartesiano, se dene un cilindro como un subconjunto C Xi∈Z A. Como en cualquier producto del producto para el cual un número nito de coordenadas están jas. En el caso particular de los espacios shift, nos van a interesar los cilindros en que un número nito de coordenadas consecutivas están jas. Formalmente: A, u ∈ A∗ y k ∈ Z. El cilindro en X asociado al bloque u en la posición k es el conjunto CkX (u) denido por CkX (u) = x ∈ X : x[k,k+|u|−1] = u Definición 4.15. Sea A un alfabeto, X un espacio shift sobre 4. CONTINUIDAD 45 X , el cilindro asociado a u en la posición k es el conjunto de puntos del espacio X tales que el bloque u ocurre en la posición k . Obsérvese que para cualquier X n / B (X). (u). Además, CkX (u) = ∅ si, y sólo si, u ∈ n ∈ Z, es σX CkX (u) = Ck−n Si x es un punto del espacio shift X y ε es un real positivo, entonces n o Bε (x) = y ∈ X : x[−blog 1 c,blog 1 c] = y[−blog 1 c,blog 1 c] = C−Xblog 1 c x[−blog 1 c,blog 1 c] En palabras, en el espacio shift ε En particular, para k ∈ N, ε ε ε ε ε ε se tiene que X B2−k (x) = y ∈ X : y[−k,k] = x[−k,k] = C−k x[−k,k] Como vemos, los entornos en un espacio shift son cilindros. La recíproca no es cierta en general: no todo cilindro es un entorno. Sin embargo, todo cilindro es un conjunto abierto. En efecto, X sea x ∈ Ck (u). Tomando N = máx {|k| , |k + |u| − 1|}, se tiene que −N ≤ k ≤ k + |u| − 1 ≤ N , de modo que X B2−N (x) = C−N x[−N,N ] = y ∈ X : y[−N,N ] = x[−N,N ] ⊆ y ∈ X : y[k,k+|u|−1] = x[k,k+|u|−1] = CkX (u) Pero además los cilindros son cerrados, pues c = x ∈ X : x[k,k+|u|−1] 6= u = CkX (u) [ x ∈ X : x[k,k+|u|−1] = v v∈A|u| −{u} [ = CkX (v) v∈A|u| −{u} Es decir, el complemento de un cilindro es una unión de conjuntos abiertos, y por lo tanto es un conjunto abierto; luego, el cilindro es cerrado. Entonces, los cilindros en un espacio shift son conjuntos a la vez abiertos y cerrados. Esto revela otra característica topológica de los espacios shift: son conjuntos nexos. totalmente disco- Recordamos que una forma de caracterizar a los conjuntos disconexos de un espacio métrico es como aquellos conjuntos que poseen un subconjunto propio no vacío que es a la vez abierto y cerrado. Y un conjunto totalmente disconexo es aquel para el cual todo subconjunto de más de un punto es disconexo. El conjunto clásico de Cantor en la recta real tiene esta misma estructura: se trata de una nube de puntos no aislados en la cual ningún par de puntos distintos pertenece a una misma pieza conexa. 4. Definición 4.16. Sean se dice (X, dX ) continua en x ∈ X e Continuidad (Y, dY ) φ:X →Y lı́mn→∞ xn = x, se dos espacios métricos. Una función si para toda sucesión {xn }n∈N en X tal que lı́mn→∞ φ (xn ) = φ (x). Si A ⊆ X , φ se dice continua en A si φ es continua en cada φ es continua en X , biyectiva y además su función inversa es también continua, φ se denomina un homeomorsmo entre X e Y , y los espacios X e Y se dicen homeomorfos. tiene que x ∈ A. Si Una función entre dos espacios métricos es continua en todo su dominio si, y sólo si, la preimagen de cualquier subconjunto abierto del codominio es un subconjunto abierto del dominio. La composición de funciones continuas es también una función continua. La denición de continuidad que hemos dado corresponde en realidad a la denición de la continuidad secuencial o sucesional, y equivale a la clásica denición ε − δ de continuidad: φ es continua en x si ∀ε > 0, ∃δ > 0 : dX (y, x) < δ ⇒ dY (φ (y) , φ (x)) < ε. Pero la continuidad desde el punto de vista de las sucesiones es más fácil de manejar cuando el espacio métrico es un espacio shift, ya que tenemos completamente caracterizadas a las sucesiones que convergen en un espacio shift. Todo código de ventana deslizante entre dos espacios shift es una función continua en todo su dominio. Proposición 4.17. 46 4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT Y dos espacios shift yφ : X → Y un CVD inducido por Φ con memoria y anticipación L ≥ 0. Sean x ∈ X y x(n) n∈N una sucesión en X tal que lı́mn→∞ x(n) = x. Debemos ver que ∀K ∈ N, ∃N ∈ N : ∀n ≥ N, φx(n) [−K,K] = (φx)[−K,K] . (n) Sea K ∈ N. Por la hipótesis de convergencia de x a x, tenemos que existe N ∈ N tal n∈N (n) (n) que ∀n ≥ N, x[−K−L,K+L] = x[−K−L,K+L] . Veamos que para todo n ≥ N es φx = [−K,K] (φx)[−K,K] : si i es un entero tal que −K ≤ i ≤ K , será −K − L ≤ i − L ≤ i + L ≤ K + L, por n lo que x[i−L,i+L] = x[i−L,i+L] , y entonces (n) φx(n) i = Φ x[i−L,i+L] = Φ x[i−L,i+L] = (φx)i (n) Luego, lı́mn→∞ φ x = φ (x), de donde se deduce que φ es continua en x, y ya que x es arbitrario, φ es continua en X . Demostración. Sean X e La sola continuidad de una función entre dos espacios shift no garantiza que sea un CVD. Hace falta algo más: la conmutabilidad de la función con las shifts de los respectivos espacios. Este resultado se obtuvo por Hedlund y otros en el año 1969. Antes de demostrarlo, enunciemos algunos resultados conocidos de la teoría general de espacios métricos, y cuyas demostraciones quedan de ejercicio. Proposición 4.18. Sean A y B dos subconjuntos compactos disjuntos no vacíos de un espacio métrico. Existe un número real estrictamente positivo δ tal que para todos a ∈ A y b ∈ B , d (a, b) ≥ δ . Sea {Ak }nk=1 una familia nita de subconjuntos compactos no vacíos de un espacio métrico, dos a dos disjuntos. Existe δ > 0 tal que si x ∈ Ai e y ∈ Aj con i 6= j , entonces d (x, y) ≥ δ . Corolario 4.19. Sea φ una función continua entre los espacios métricos X e Y , con X compacto, y sea F un subconjunto compacto de Y . Entonces, φ−1 (F ) es un subconjunto compacto de X . Proposición 4.20. Teorema 4.21. (Curtis, Lyndon, Hedlund) Sean X e Y dos espacios shift, y φ una función de X en Y . φ es un código de ventana deslizante si, y sólo si, φ es una función continua tal que φ ◦ σX = σY ◦ φ. Demostración. Sabemos, de los primeros capítulos, que si las σ, y la Proposición 4.17 muestra que φ φ es un CVD, conmuta con es continua. φ es un CVD si, y sólo si, x[−N,N ] . El hecho de conmutar con σ lo tenemos por hipótesis, así que sólo resta probar la existencia de un tal N , para lo cual usaremos la hipótesis de la continuidad de φ. Sea U = B1 (φ (X)), el conjunto de símbolos que aparecen en los transformados de los puntos de X . Obviamente, U es un subconjunto Y del alfabeto de Y . Para cada b ∈ U , el cilindro C0 (b) es un subconjunto cerrado de Y , y Y como Y es compacto, C0 (b) es compacto. Además, si b y c son elementos de U con b 6= c, es Y Y C0 (b) ∩ C0 (c) = ∅. Para cada b ∈ U , hagamos Eb = φ−1 C0Y (b) . Por su denición y por la Proposición 4.20, cada Eb es un subconjunto compacto no vacío de X , y si b 6= c, Eb ∩ Ec = ∅, Y pues si x ∈ Eb , es φ (x) ∈ C0 (b), luego φ (x) ∈ / C0Y (c), y entonces x ∈ / Ec . Además, cada x ∈ X pertenece a un único Eb . Así que la familia {Eb }b∈U es una familia de conjuntos compactos que constituye una partición para X . Luego, por el Corolario 4.19, existe δ > 0 tal que d (x, y) ≥ δ toda vez que x ∈ Eb e y ∈ Ec con b 6= c. Tomemos N ∈ N sucientemente grande como para −N que 2 < δ . Si x e y son puntos de X tales que x[−N,N ] = y[−N,N ] , entonces d (x, y) < 2−N < δ , por lo que x e y deben estar en un mismo Eb . Esto signica que existe b ∈ U tal que φ (x) y φ (y) están ambos en C0Y (b), o sea, φ (x)0 = b = φ (y)0 . Pero esto quiere decir que la coordenada 0 del transformado por φ de x ∈ X depende sólo de x[−N,N ] , como queríamos probar. Para la vuelta, recordemos otra caracterización de los CVD: conmuta con las σ y existe un N ∈ N tal que φ (x)0 es función de 5. SISTEMAS DINÁMICOS 5. 47 Sistemas dinámicos Los sistemas físicos pueden usualmente describirse a través de una cantidad nita de mediciones. Por ejemplo, un péndulo oscilante constituye un sistema que queda totalmente caracterizado por el ángulo respecto de la vertical y por la velocidad angular. Un gas se describe a través de la posición y momentum de cada molécula. A medida que transcurre el tiempo, esos valores cambian. Si denotamos por M al conjunto de todos los valores posibles para un dado sistema, el estado del mismo en un instante dado corresponde a uno de esos estados. Imaginemos que lmamos el sistema y que luego observamos los cuadros que corresponden al instante luego a t=1 seg, t=2 t = 0, seg, etc. Cada cuadro depende del anterior, de acuerdo a la manera en que el sistema evolucione durante cada intervalo de un segundo. Si suponemos que las leyes que gobiernan el sistema no cambian con el tiempo, la dependencia de cada cuadro respecto del anterior se traduce en una función estado del sistema en t = 0, T (x0 ) T :M →M x0 es el t = 1, T ◦ T (x0 ) en t = 2, que usualmente es continua. Así, si describe el estado del sistema en y así. Por lo tanto, estudiar el comportamiento del sistema en el tiempo se reduce a estudiar las iteraciones de T , es decir, la composición de T consigo misma. Para n ≥ 0, designaremos n 0 por T a la composición de T consigo misma n veces. Es decir, T es la identidad, y, para n > 0, T n = T ◦ T n−1 . Notar que T n es continua si T lo es, pues la continuidad se preserva por composición. sistema dinámico Definición 4.22. Un métrico compacto y T (M, T ), en donde M es un espacio M . Si T es un homeomorsmo, el es un par es una transformación continua en sistema dinámico se dice inversible. Para nosotros, los sistemas dinámicos más interesantes serán aquellos en los que el conjunto M X sea un espacio shift. En particular, si dinámico que denominamos (X, φ) es un espacio shift, el par sistema dinámico shift. φ Si (X, σX ) es un sistema X en X , el par es un CVD de es también un sistema dinámico. (M, T ), Definición 4.23. Para un sistema dinámico sucesión n {T x}n∈N . la Si el sistema es inversible, la órbita de x órbita de un punto x ∈ n es la sucesión {T x}n∈Z . M es la punto periódico es un punto x ∈ M tal que T x = x para algún n > 0, y tal n se llama un período de x. Si x es un punto n periódico, el menor de los n > 0 tales que T x = x se llama período mínimo de x. Una n órbita {T x} es periódica si x es un punto periódico. Definición 4.24. Para un sistema dinámico (M, T ), un n Un conjunto de problemas que interesan en relación a estos tópicos involucra el estudio del comportamiento de la órbita de puntos y de conjuntos en un dado sistema dinámico. Por ejemplo, si se tiene un sistema dinámico (M, T ) en particular, puede interesar saber cómo se distribuyen las órbitas de los puntos de un dado subconjunto abierto U de M, o si el conjunto de puntos periódicos del espacio es denso. Otro conjunto de problemas tiene que ver con problemas de clasicación de sistemas dinámicos: ¾Cuándo dos sistemas dinámicos aparentemente distintos son el mismo sistema? Definición 4.25. Sean (M, T ) a (N, S) (M, T ) y (N, S) dos sistemas dinámicos. Un homomorsmo θ de θ : M → N tal que θ ◦ T = S ◦ θ. Los homomorsmos es una función continua de un sistema dinámico a sí mismo se denominan Una simple inducción muestra que si θ endomorsmos del sistema dinámico. es un homomorsmo de n n para cualquier entero positivo n, se tiene que θ ◦ T = S ◦ θ . (M, T ) a (N, S), entonces, Notemos que, debido al Teorema de Curtis, Lyndon y Hedlund, los homomorsmos entre los sistemas dinámicos shift son precisamente los códigos de ventana deslizante. inmersión es un homomorsmo inyectivo, un factor es un homouna conjugación topológica es un homomorsmo biyectivo. Dos Definición 4.26. Una morsmo sobreyectivo, y 48 4. ASPECTOS TOPOLOGICOS Y DINAMICOS DE LOS ESPACIOS SHIFT sistemas dinámicos se dicen topológicamente conjugados si existe una conjugación topoló- gica entre ellos. Las nociones de inmersión, factor y conjugación conducen a problemas de clasicación de sistemas dinámicos. Dos sistemas dinámicos conjugados son esencialmente el mismo, pero la cuestión de si dos dados sistemas dinámicos son conjugados, o uno factor del otro, o uno inmerso en el otro, puede ser muy difícil de resolver. Para detectar si dos sistemas dinámicos no son conjugados, una estrategia es la siguiente: asociemos a cada sistema dinámico con alguna entidad (que puede ser un número, un conjunto, o lo que sea) de manera que dos sistemas conjugados tengan asociados la misma entidad. Luego, dados dos sistemas dinámicos en particular, obtengamos las entidades asociadas respectivas, y si éstas no coinciden sabremos que los sistemas no son conjugados (aunque puede ocurrir que no podamos deducir nada si vemos que ambas entidades coinciden). Dichas entidades reciben el nombre de invariantes por conjugación. Una de tales entidades es el conjunto de puntos periódicos de período n, donde n es un natural jo. Ya hemos visto, en el capítulo primero, la demostración para el caso en que los sistemas involucrados son sistemas dinámicos shift. Veamos el resultado en general. Proposición 4.27. Sea n un entero positivo. La cantidad de puntos periódicos de período n es un invariante por conjugación. (M, T ) y (N, S) sistemas dinámicos conjugados, y θ : M → N una conjugación. Denotemos por pn (T ) al cardinal del conjunto de puntos periódicos de período n para T , y pn (S) al de los puntos periódicos para S . Para x ∈ M , se tiene que Demostración. Sean T n x = x ⇔ θ (T n x) = θ (x) ⇔ S n (θ (x)) = θ (x) θ establece pn (T ) = pn (S). de modo que una biyección entre los puntos jos de Tn y los de S n. Por lo tanto, Un argumento similar al anterior muestra que el número de puntos periódicos de período mínimo n es también invariante por conjugación. Veamos ahora otro invariante por conjugación. (M, T ) es topológicamente transitivo V , existe n > 0 tal que (T n U ) ∩ V 6= ∅. Definición 4.28. Un sistema dinámico cualquier par de abiertos no vacíos U y si para Es decir, un sistema topológicamente transitivo mueve a cada conjunto abierto lo suciente como para que llegue a tocar a cualquier otro conjunto abierto, en alguna iteración. La denición implica que ese toque se producirá una cantidad innita de veces, según demostraremos a continuación. Sean (M, T ) un sistema topológicamente transitivo, U y V dos conjuntos abiertos no vacíos y m un natural arbitrario. Existe n > m tal que (T n U ) ∩ V 6= ∅. Lema 4.29. W = (T m )−1 (V ). T continua en M , W es k abierto, así que, por hipótesis de transitividad topológica, existe k > 0 tal que T U ∩ W 6= ∅. −1 k m Eso quiere decir que existe z ∈ T U tal que z ∈ (T ) (V ); lo primero signica que existe k m x ∈ U tal que T x = z , y lo segundo dice que T z ∈ V . Poniendo n = m + k , tendremos que n > m y que T n x = T m T k x = T m z ∈ V . Es decir, existe x ∈ U tal que T n x ∈ V , de donde (T n U ) ∩ V 6= ∅. Demostración. Sea Ya que V es abierto y De manera directa, se desprende de allí el siguiente resultado. Sean (M, T ) un sistema topológicamente transitivo, y U y V dos conjuntos abiertos no vacíos. Existe una sucesión {nk }k∈N de naturales estrictamente creciente tal que para todo k ∈ N, es (T nk U ) ∩ V 6= ∅. Proposición 4.30. Proposición 4.31. La transitividad topológica es invariante por conjugación. 5. SISTEMAS DINÁMICOS 49 (M, T ) y (N, S) sistemas dinámicos conjugados, con (M, T ) topológicamente transitivo, y θ : M → N una conjugación. Sean U y V abiertos en N . Denotemos U 0 = θ−1 (U ) y V 0 = θ−1 (V ). Como θ es continua, U 0 y V 0 son abiertos en M , por lo que existe n > 0 tal que (T n U 0 ) ∩ V 0 6= ∅, es decir, (T n (θ−1 (U ))) ∩ θ−1 (V ) 6= ∅. Por lo tanto, siendo θ una Demostración. Sean biyección, tenemos que ∅= 6 θ Entonces, (N, S) T n θ−1 (U ) ∩ θ−1 (V ) = θ T n θ−1 (U ) ∩ θ θ−1 (V ) = S n θ θ−1 (U ) ∩ V = (S n U ) ∩ V es también topológicamente transitivo. En el primer capítulo, hemos denido irreducibilidad: un espacio shift para cualquier par de palabras tal que uvw ∈ B (X). u w y en el lenguaje, hay una palabra v X es irreducible si también en B (X) Veremos ahora que en el contexto de los sistemas dinámicos shift, la irreducibilidad de un espacio shift X equivale a la transitividad topológica del sistema dinámico (X, σX ). Proposición 4.32. Un sistema dinámico shift es topológicamente transitivo si, y sólo si, el espacio shift es irreducible. (X, σX ) es topológicamente X X transitivo. Sean u y w en B (X). Hagamos U = C0 (u) y V = C0 (w). Ya que U y V son n abiertos y no vacíos, por Lema 4.29, existe n > |u| tal que (σX U ) ∩ V 6= ∅, es decir, hay un n X x ∈ X tal que x ∈ σX C0X (u) = C−n (u) y x ∈ C0X (w). Es decir que x[−n,−n+|u|−1] = u y x[0,|w|−1] = w. Como n > |u|, es −n + |u| − 1 < 0, de modo que podemos tomar v = x[−n+|u|,−1] Demostración. Supongamos que el sistema dinámico shift uvw ∈ B (X). X es un espacio shift irreducible, y sean U y V dos abiertos no vacíos en el espacio métrico X . Sean x ∈ U , y ∈ V , y tomemos k, l ∈ N tal que B2−k (x) ⊆ U X y B2−l (y) ⊆ V . Hagamos u = x[−k,k] y w = y[−l,l] . Sabemos que B2−k (x) = C−k (u) y que X B2−l (y) = C−l (w). Como X es irreducible, existe v ∈ B (X) tal que uvw ∈ B (X). Tomemos X z ∈ X tal que z[−k,−k+|u|+|v|+|w|−1] = uvw. Tenemos que z ∈ C−k (u) ⊆ U , y además, puesto que |u| = 2k + 1 y |w| = 2l + 1, k−|u|−|v|−l −k−1−|v|−l −k−1−|v|−l X X X z ∈ C−k+|u|+|v| (w) = σX C−l (w) = σX C−l (w) ⊆ σX (V ) para ver que uvw v x, es decir, Recíprocamente, supongamos que Es decir, z n que (σX U ) k+l+|v|+1 ∈ U y σX ∩ V 6= ∅. (z) ∈ V . Por lo tanto, tomando n = k + l + |v| + 1 > 0, tenemos De nuestros resultados anteriores, deducimos que, en el universo de los espacios shift, el carácter de irreducible es invariante por conjugación. Teorema 4.33. o ninguno lo es. Sean X e Y espacios shift conjugados. Entonces o ambos son irreducibles (X, σX ) es topológicamente transitivo (prop. 4.32), lo que, por ser e Y conjugados, equivale a que (Y, σY ) es topológicamente transitivo (prop. 4.31), lo que ocurre si, y sólo si, Y es irreducible. Demostración. X X es irreducible si, y sólo si, En el próximo capítulo deniremos e investigaremos un importante invariante por conjugación entre espacios shift: la entropía. Capítulo 5 ENTROPÍA X es observar la cantidad de los n en el lenguaje de X a medida que n crece; cuanto más grande es el número de n-bloques en B(X), más complejidad tiene el espacio X . Veremos que, conforme n aumenta, |Bn (X)| crece exponencialmente, es decir, se comporta como λn para algún real no negativo λ. Poniendo c = log λ (recordando nuestra convención de que log signica logaritmo en base 2), tendremos que, para n sucientemente grande, es |Bn (X)| ∼ = 2cn , de modo que c ∼ = n1 log |Bn (X)|. Esa tasa de crecimiento c, en el límite cuando n → ∞, recibe el nombre de entropía del espacio shift X , y es un invariante por conjugación entre espacios shift. El objetivo de este capítulo es Una manera de medir la complejidad de un espacio shift bloques de largo estudiar propiedades de esta entidad, y encontrar métodos para saber calcularla para distintas clases de espacios shift. 1. Definición 5.1. Sea X Denición y propiedades básicas un espacio shift. La entropía de X se dene como 1 log |Bn (X)| n→∞ n h(X) = lı́m con la convención de que log 0 = −∞. X = AZ , para todo n ∈ N es Bn (X) = An , así que log |Bn (X)| = log |An| = log |A| = n log |A|. Dividiendo por n y tomando límite cuando n → ∞, vemos que h AZ = log |A|. Es decir, la entropía de un full shift es el logaritmo de la cantidad de letras de su alfabeto. De la denición, se desprende también directamente que h(∅) = −∞. Por ejemplo, si n Nuestra primera tarea es ver que la entropía es un número bien denido, para lo cual debemos garantizar que ese límite que la dene efectivamente existe. Primero observemos que, siendo X no vacío, es |Bn (X)| ≥ 1 para todo n ∈ N, así que el límite, de existir, es un real no negativo. Sean m, n ∈ N y sea u ∈ Bm+n (X). Tal u debe ser la concatenación de un bloque v ∈ Bm (X) w ∈ Bn (X). Por lo tanto, Bm+n (X) ⊆ {vw : v ∈ Bm (X), w ∈ Bn (X)} (la contención y un bloque puede ser estricta, ya que la concatenación de dos bloques en el lenguaje de un espacio shift no necesariamente produce otro bloque en ese lenguaje). Entonces, por el principio fundamental del conteo, ocurre que |Bm+n (X)| ≤ |Bm (X)| · |Bn (X)| En consecuencia, log |Bm+n (X)| ≤ log |Bm (X)| + log |Bn (X)| Poniendo an = log |Bn (X)| para cada n ∈ N, resulta que la sucesión {an }n∈N es una sucesión subaditiva de reales no negativos, es decir, am+n ≤ am + an para todos m, n ∈ N. Una simple + inducción muestra que si an es cualquier sucesión subaditiva en R0 , entonces, para enteros positivos c y k cualesquiera, ack ≤ cak y, en particular, ar ≤ ra1 para cualquier entero positivo r. + Las sucesiones subaditivas en R0 poseen una interesante propiedad que establecemos en el siguiente resultado. Sea {an }n∈N una sucesión subaditiva de reales no negativos. Entonces lı́mn→∞ existe y vale ı́nf n≥1 ann . Lema 5.2. 50 an n 1. DEFINICIÓN Y PROPIEDADES BÁSICAS Demostración. Designemos n ≥ 1. Debemos ver que α = ı́nf n≥1 a an , teniéndose entonces que n n n 51 ≥ α para todo an ∀ε > 0, ∃N : ∀n ≥ N, α − < ε n k ≥ 1 tal que akk ≤ α + 2ε . Por otro lado, sea m cualquier entero positivo mayor que 2a1 /ε. Hagamos N = mk . Sea n ≥ N . Por el teorema de la división, existen naturales c y r tales que n = ck + r con 0 ≤ r < k . Ya que (c + 1)k > n ≥ N = mk , tenemos que (c + 1) > m, por lo que c ≥ m ≥ 1. Si fuese r = 0, Consideremos entonces ε>0 tendremos jo. Por propiedad de ínmo, existe an ack cak ak ε = ≤ = ≤ α + < α + ε, n ck ck k 2 r > 0, tendremos an ack+r ack + ar cak + ra1 ak a1 ak a1 ε ε = ≤ ≤ < + ≤ + <α+ + =α+ε n ck + r ck ck k c k m 2 2 a a decir, se cumple en cualquier caso que α − n = n − α < ε. mientras que si fuese Es n Aplicando el lema 5.2 al hecho de que n {log |Bn (X)|}n∈N es una sucesión subaditiva de reales no negativos, se deduce inmediatamente que la entropía de cualquier espacio shift es un número real no negativo bien denido. X e Y son espacios shift con X ⊆ Y , tendremos h(X) ≤ h(Y ), pues, para todo n ∈ N, es Bn (X) ⊆ Bn (Y ), de modo que |Bn (X)| ≤ |Bn (Y )|; aplicando logaritmos, dividiendo por n y tomando límite cuando n → ∞ tenemos el resultado. De la denición, resulta inmediato que si que Combinado con lo que ya sabemos de la entropía de los full shifts, esto nos dice que la entropía Z de un espacio shift X ⊆ A no supera a log |A|. Investigaremos ahora otras propiedades de la entropía. Proposición 5.3. Sean X, Y espacios shift. Si Y es factor de X , entonces h(Y ) ≤ h(X). φ : X → Y un código de ventana deslizante factor, inducido por Φ con memoria m y anticipación k . Cualquier bloque de tamaño n en el lenguaje de Y es la imagen de algún bloque de tamaño m + n + k en el lenguaje de X , por lo que |Bn (Y )| ≤ |Bm+n+k (X)|. Demostración. Sea Por lo tanto, 1 1 log |Bn (Y )| ≤ lı́m log |Bm+n+k (X)| n→∞ n n→∞ n m+n+k 1 = lı́m log |Bm+n+k (X)| n→∞ n m+n+k m+n+k 1 = lı́m lı́m log |Bm+n+k (X)| = h(X) n→∞ n→∞ n m+n+k h(Y ) = lı́m La entropía es un invariante por conjugación. Es decir, si X e Y son espacios shift conjugados, entonces h(X) = h(Y ). Corolario 5.4. Demostración. Siendo h(X) ≤ h(Y ) y X h(Y ) ≤ h(X), e Y conjugados, cada uno de ellos es un factor del otro, así que de donde se sigue el resultado. Esto permite ver rápidamente que dos full shifts con distinta cantidad de letras en sus alfabetos no pueden ser conjugados, pues sus entropías son diferentes. Debe notarse que, sin ∞ ∞ ∞ embargo, la entropía no es un invariante completo. Por ejemplo, si X = {0 } e Y = {0 , 1 }, ambos tienen entropía 0 (pruébelo) pero no son conjugados pues no poseen la misma cantidad de puntos jos para Corolario 5.5. h(Y ). σ. Si X es un espacio shift inmerso en un espacio shift Y , entonces h(X) ≤ 52 5. ENTROPÍA Demostración. Sea φ(X), que es un subshift φ : X → Y una inmersión. Entonces X de Y . Luego, h(X) = h(φ(X)) ≤ h(Y ). es conjugado al espacio shift Dedicaremos bastante de este capítulo a establecer métodos de cálculo de la entropía de shifts de aristas. Ya que cualquier shift de tipo nito es conjugado a uno de aristas, tendremos entonces un método para calcular la entropía de cualquier shift de tipo nito, y también la de cualquier shift sóco, en base al siguiente resultado. Proposición 5.6. h (XG ) = h (XG ). Sea G = (G, L) un grafo rotulado, con L resolvente a derecha. Entonces, L∞ es código factor de XG a XG , tenemos que h (XG ) ≤ h (XG ). G tiene k vértices. Cualquier bloque en B (XG ) tiene a lo sumo k presentaciones (pues hay a lo sumo una presentación comenzando en cada vértice). Luego, |Bn (XG )| ≤ k |Bn (XG )|, así que log |Bn (XG )| ≤ log k + log |Bn (XG )|. Dividiendo por n y tomando límite cuando n → ∞, concluimos que h (XG ) ≤ h (XG ), y el resultado queda establecido. Demostración. Como Supongamos que 2. Cálculo de la entropía de shifts sócos irreducibles Comenzaremos analizando métodos para calcular la entropía de shifts de aristas que sean irreducibles. Convendrá, a tal efecto, realizar algunas convenciones sobre notación matricial. estrictamente positiva (A > 0) si todos sus coecientes son positivos; similarmente, diremos que A es no negativa (A ≥ 0) si todos sus coecientes son reales no negativos. Más generalmente, si A y B son matrices de igual tamaño, escribimos A > B cuando cada coeciente de A es estrictamente mayor que el respectivo coeciente de B ; escribimos A ≥ B cuando cada coeciente de A es mayor o igual que el respectivo coeciente de B . Toda esta notación se aplica también a los vectores (por ser Diremos que una matriz A (no necesariamente cuadrada) es casos particulares de matrices rectangulares). G es esencial si desde cualquier vértice sale al menos una arista, y a G no tiene las nulas ni columnas nulas. Por otro lado, un grafo G es irreducible si desde cualquier vértice hay camino en G hasta cualquier otro vértice. Esto equivale a que para cualquier pareja n de vértices I, J , existe n ≥ 0 tal que (A )IJ > 0. Todo esto motiva las siguientes deniciones: Recordemos que un grafo cualquier vértice llega al menos una arista. Esto se traduce en que la matriz de adyacencia de Definición 5.7. Sea nulas ni columnas nulas. A ≥ 0 una matriz cuadrada. A se dice esencial si A se dice irreducible si ∀I, J, ∃n ≥ 0 : (An )IJ > 0. no contiene las Notar que un grafo es esencial si, y sólo si, su matriz de adyacencia es esencial. Similarmente, un grafo es irreducible si, y sólo si, su matriz de adyacencia es irreducible. 0 Convendremos que A = Id|A|×|A| cualquiera sea la matriz cuadrada A. Como caso particu0 lar, [0] = [1]; entonces, [0] es irreducible pero no esencial. Cualquier matriz distinta de [0] que no sea esencial no puede ser irreducible, ya que si A tiene alguna la nula, la correspondiente n la de A (cualquiera sea n ≥ 1) es también nula (y análogamente si A tiene alguna columna nula). Dicho de otro modo, toda matriz irreducible debe necesariamente ser esencial (salvo el caso excepcional de la matriz [0]). La matriz de adyacencia es una valiosa herramienta para computar la entropía de shifts G un grafo esencial de r vértices con matriz de adyacencia A. Sabemos que An de aristas. Sea contiene la información necesaria para calcular la cantidad de caminos de largo la cantidad de bloques de tamaño n en el lenguaje de |Bn (XG )| = r X r X n en G, es decir, XG : (An )IJ I=1 J=1 Por lo tanto, para conocer la entropía de XG , debemos averiguar cómo van variando los coeAn conforme crece n. Veremos a continuación que, para ello, el conocimiento de los cientes de autovalores de A es fundamental. 2. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS IRREDUCIBLES 53 Sea A ≥ 0 una matriz r × r no nula que posee un autovector v > 0. Entonces, el correspondiente autovalor λ es positivo, y existen constantes positivas c0 y d0 tales que r X r X n c0 λ ≤ (An )IJ ≤ d0 λn Proposición 5.8. I=1 J=1 En consecuencia, si G es un grafo cuya matriz de adyacencia es A, entonces h (XG ) = log λ. Demostración. Como Av = λv. Ya que A v es autovector correspondiente al autovalor posee al menos un coeciente de donde se deduce que λ AKL > 0, es (Av)K > 0, se cumple que es decir, λvK > 0, v tiene todos sus coecientes positivos. n n Una simple inducción muestra que, ya que Av = λv, se tiene que A v = λ v para cualquier Pr n n n ≥ 1. Entonces, para cualquier índice I , es (A v)I = (λ v)I , de donde J=1 (An )IJ vJ = λn vI . De allí que r X r r X X n n (A )IJ vJ = λ vI I=1 J=1 I=1 Designemos es positivo pues λ, c = mı́n{v1 , . . . , vr } d = máx{v1 , . . . , vr }. y Notemos que tanto c como d son estrictamente positivos. Por un lado, tendremos que r X r X n (A )IJ vJ ≥ I=1 J=1 r X r X n (A )IJ c = c r X r X I=1 J=1 (An )IJ I=1 J=1 y que n λ r X n vI ≤ λ I=1 Entonces r X d = λn rd I=1 r r X X rd n λ c (An )IJ ≤ I=1 J=1 Llamemos d0 = rd/c, resultando d0 > 0 r, d pues y c son positivos. Por otro lado, tendremos que r X r X n (A )IJ vJ ≤ I=1 J=1 r X r X n (A )IJ d = d I=1 J=1 r X r X (An )IJ I=1 J=1 y que n λ r X vI ≥ λ n I=1 Entonces r X c = λn rc I=1 r r X X (An )IJ ≥ I=1 J=1 Llamemos c0 = rc/d, , resultando c0 > 0 pues rc n λ d r, d y c son positivos. Juntando las dos desigualdades de más arriba, tenemos que, para cualquier c0 λ n ≤ r X r X n ∈ N, es (An )IJ ≤ d0 λn I=1 J=1 es un PrG P r Si I=1 grafo esencial que tiene matriz de adyacencia n J=1 (A )IJ . A, se cumple que Por nuestro resultado anterior, esto signica que c0 λn ≤ |Bn (XG )| ≤ d0 λn |Bn (XG )| = 54 5. ENTROPÍA de donde Tomando límites 1 1 1 1 1 log c0 + n log λ ≤ log |Bn (XG )| ≤ log d0 + n log λ n n n n n cuando n → ∞, resulta h (XG )) = log λ. Si una matriz no nula A a coecientes enteros admite un autovector positivo, todos los autovectores positivos de ella corresponden a un mismo autovalor. Corolario 5.9. 0 el shift de aristas correspondiente a A. Sean v, v autovectores 0 positivos correspondientes a autovalores λ, λ respectivamente. Aplicando la proposición 5.8, 0 0 concluimos que log λ = h (XG ) = log λ , de donde λ = λ . Demostración. Sea G Dada una matriz A ≥ 0 que admite un autovector positivo v correspondiente al autovalor λ > 0, cualquier autovalor µ de A cumple que |µ| ≤ λ. Corolario 5.10. r el tamaño de A. Sean µ un autovalor de A y v0 µ. Como A v = µn v0 y A ≥ 0, es, por un lado, r r r r X X X X n n 0 n 0 n 0 |vI0 | |(A v )I | = |(µ v )I | = |µ vI | = |µ| Demostración. Sea asociado a un autovector n 0 I=1 I=1 I=1 I=1 y, por otro lado, r r X r X r r X r X X X n 0 n 0 (A ) v ≤ |(A ) v | = (An )IJ |vJ0 | |(An v0 )I | = IJ J IJ J I=1 I=1 J=1 I=1 J=1 I=1 J=1 ! r r r X XX |vI0 | d0 λn (An )IJ ≤ ≤ máx |vI0 | r X 1≤I≤r donde d0 > 0 I=1 J=1 I=1 es el garantizado en la proposición 5.8. |µ|n ≤ d0 λn , Juntando todo esto, resulta que, para todo n ≥ 0, es 1/n Como d0 > 0, es lı́mn→∞ d0 = 1, y entonces |µ| ≤ λ. Dado un grafo esencial XG G con matriz de adyacencia A, Teorema de PerronFrobenius, 1/n |µ| ≤ d0 λ. para poder calcular la entropía de por aplicación de la proposición 5.8, necesitamos saber si Para ello, contamos con el es decir, A posee un autovector positivo. que enunciaremos sin demostración y que es válido para una clase especial de matrices que comprende a las matrices de adyacencia de los grafos irreducibles. Teorema 5.11. (PerronFrobenius) Sea A ≥ 0 una matriz irreducible no nula. Entonces A posee un autovector vA positivo con autovalor correspondiente λA positivo que es geométricamente y algebraicamente simple. Cualquier autovalor µ de A tiene módulo menor o igual que λA , y cualquier autovector positivo de A es un múltiplo positivo de vA . El autovalor λA del teorema anterior se denomina autovalor de Perron de A, y vA es autovector de Perron de A. El teorema muestra que vA es único salvo multiplicación por un un escalar. Por combinación de la proposición 5.8 con el teorema de PerronFrobenius, obtenemos el siguiente resultado principal. Teorema 5.12. 1. 2. Si G es un grafo irreducible con matriz de adyacencia A, entonces h(XG ) = log λA . Si X es un shift de tipo nito irreducible de memoria M y G es el grafo esencial con matriz de adyacencia A tal que X [M +1] = XG , entonces h(X) = log λA . Demostración. 3. LOS PUNTOS PERÍODICOS Y LA ENTROPÍA 1. Como G es irreducible, A 55 es irreducible, por lo que admite un autovector positivo que λA . Entonces, por proposición 5.8, h(XG ) = log λA . [M +1] X es conjugado a X , siendo la entropía invariante por conjugación, es [M +1] = h(XG ). Como X es irreducible, también lo es X [M ] (teor. 4.33), h(X) = h X de donde G es irreducible, lo que implica que A también lo es. Entonces, por el inciso anterior, h(X) = log λA . corresponde a 2. Ya que Sea X un shift sóco irreducible y G = (G, L) una presentación irreducible resolvente a derecha de X . Entonces h(X) = log λA , siendo A la matriz de adyacencia de G. Corolario 5.13. Demostración. Por proposición 5.6, el teorema 5.12, h(XG ) = log λA 3. h(X) = h(XG ) = h(XG ), y, siendo G irreducible, por Los puntos períodicos y la entropía Queremos ahora investigar cómo crece la cantidad de puntos periódicos de período hay en un espacio shift X, a medida que crece n. X un espacio shift y la cantidad de puntos periódicos (para σ) n que Veremos que existe una vinculación entre la tasa de crecimiento de esa cantidad y la entropía de Definición 5.14. Sea n X. un entero positivo. Designamos por de período n que hay en pn (X) a X. Z Por ejemplo, si X = {0, 1} y n es cualquier entero positivo, tomando cualquier bloque u ∈ An se tiene que u∞ es un punto periódico de X , y bloques diferentes generan puntos periódicos n diferentes, por lo que pn (X) = 2 . Como vemos, al igual que lo que ocurre con |Bn (X)|, pn (X) puede crecer sin cota, por lo que resulta pertinente considerar la tasa de crecimiento de pn (X), 1 log pn (X), y ver qué ocurre con esta sucesión cuando n → ∞. Debe advertirse, desde n un comienzo, que puede no existir el límite de dicha sucesión, ni siquiera restringiendo X a la es decir, familia de los shifts de tipo nito. Ejemplo 5.15. Sea X un shift de aristas con conjunto de vértices total de 6 aristas, de las cuales una es un rulo en I, 2 van de J a K y {I, J, K} teniendo un 3 de K a J . Su matriz de adyacencia es 1 0 0 A= 0 0 2 0 3 0 An y sumamos n/2 en cada paso los coecientes de su diagonal, obtenemos que, para n par, es pn (X) = 1 + 2 · 6 1 y, para n impar, es pn (X) = 1, así que la subsucesión de log pn (X) correspondiente a los n √ términos pares tiende a log 6, y la correspondiente a los impares tiende a 0. Por lo tanto, 1 log p (X) carece de límite. n n Por la proposición 2.24, sabemos que pn (X) es la traza de An . Si computamos 1 log pn (X) puede no existir, consideraremos lı́m supn→∞ n1 log pn (X), recorn dando que el límite superior de una sucesión es el mayor de sus puntos de acumulación, y Ya que lı́mn→∞ siempre existe (y coincide con el límite de la sucesión si éste existe). Proposición 5.16. Sea X un espacio shift. Entonces, lı́m supn→∞ Demostración. Cada punto por lo que x∈X de período n 1 n log pn (X) ≤ h(X). está determinado por x[0,n−1] ∈ Bn (X), pn (X) ≤ |Bn (X)|. En consecuencia, 1 1 1 lı́m sup log pn (X) ≤ lı́m sup log |Bn (X)| = lı́m log |Bn (X)| = h(X) n→∞ n n→∞ n n→∞ n 56 5. ENTROPÍA La proposición anterior muestra que la tasa de crecimiento de X pn (X) tiene a la entropía de como cota superior. Sin embargo, para muchos espacios shift esa tasa iguala a Proposición 5.17. h(X). Si X es un shift de aristas irreducible, entonces lı́m supn→∞ G = (V, Σ, i, t) J en G cualesquiera Demostración. Sea camino desde I hasta N = máx {mı́n {|π| : π I,J∈V un grafo irreducible tal que sean los vértices camino desde I I, J , hasta h(X). 1 n log pn (X) = X = XG . Como hay sea J en G}} I, J arbitrarios en G, hay un camino en G desde I hasta J de N. Sea π un bloque en Bn (X) (y, por lo tanto, un camino en G), y sea τ un camino en G desde t(π) hasta i(π) con |τ | ≤ N . Entonces, πτ es ciclo en G, por lo que (πτ )∞ determina un punto periódico en X , con período n + |τ | ≤ n + N . Así vemos cómo construir, para cada bloque en Bn (X), un punto periódico en X cuyo período está entre n y n + N . Notar que dos bloques diferentes en Bn (X) generan diferentes puntos periódicos. Por lo tanto, Por lo tanto, dados vértices longitud menor o igual que |Bn (X)| ≤ pn (X) + pn+1 (X) + · · · + pn+N (X) n, elijamos kn en el conjunto {0, 1, . . . , N } i ∈ {0, 1, . . . , N }. Tendremos que Para cada tal que pn+kn (X) ≥ pn+i (X) para cada |Bn (X)| ≤ (N + 1)pn+kn (X) por lo que 1 1 1 log |Bn (X)| ≤ log(N + 1) + log pn+kn (X) n n n En consecuencia, 1 1 log |Bn (X)| = lı́m sup log |Bn (X)| n→∞ n n→∞ n 1 1 n + kn 1 ≤ lı́m sup log(N + 1) + lı́m sup log pn+kn (X) = lı́m sup log pn+kn (X) n n + kn n→∞ n n→∞ n n→∞ n + kn 1 1 = lı́m sup lı́m sup log pn+kn (X) ≤ lı́m sup log pn (X) n n→∞ n→∞ n + kn n→∞ n h(X) = Es decir, lı́m h(X) ≤ lı́m supn→∞ 1 n log pn (X). Entonces, aplicando la proposición 5.16, tenemos la igualdad deseada. Si X es un shift de tipo nito irreducible, entonces lı́m supn→∞ Corolario 5.18. h(X). G log pn (X) = X tiene memoria M . Entonces existe un grafo XG = X [M +1] . Siendo X y X [M +1] conjugados, es 1 1 h(X) = h X [M +1] = h(XG ) = lı́m sup log pn (XG ) = lı́m sup log pn (X) n→∞ n n→∞ n Demostración. Supongamos que cible 1 n irredu- tal que pues, siendo la cantidad de puntos periódicos invariante por conjugación, es para todo n. Corolario 5.19. h(X). Si X es un shift sóco irreducible, entonces lı́m supn→∞ 1 n log pn (X) = G = (G, L) una presentación resolvente a derecha para X , con G h(X) = h(XG ) (prop. 5.6). Supongamos que G tiene r vértices. Por resolvente a derecha, cada punto en XG tiene a lo sumo r presentaciones Demostración. Sea irreducible. Sabemos que ser una presentación pn (XG ) = pn (X) 4. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS en XG . Como L 57 es código de ventana deslizante, transforma puntos de período n puntos de período de XG , n de XG en por lo que pn (XG ) ≤ r · pn (XG ) Entonces, 1 1 log pn (X) = lı́m sup log pn (XG ) n n→∞ n 1 1 1 1 ≥ lı́m sup log + lı́m sup log pn (XG ) = lı́m sup log pn (XG ) r n→∞ n n→∞ n n→∞ n = h(XG ) = h(X) lı́m sup n→∞ Es decir, h(X) ≤ lı́m supn→∞ 1 n log pn (X). Entonces, aplicando la proposición 5.16, tenemos la igualdad deseada. 4. Cálculo de la entropía de shifts sócos Previamente vimos cómo calcular la entropía de shifts sócos irreducibles: obtener una presentación resolvente a derecha irreducible, y tomar el logaritmo del autovalor de Perron de la matriz de adyacencia del grafo subyacente. Ahora generalizaremos el método de cálculo para el caso de shifts sócos en general (no necesariamente irreducibles). Como siempre, arrancaremos considerando los shifts de aristas, en este caso correspondientes a grafos arbitrarios (no necesariamente irreducibles). Veremos cómo, en este caso, el correspondiente grafo G la entropía de contiene ciertos subgrafos irreducibles cuya identicación nos permitirá obtener XG . La idea es reorganizar las las y columnas de la matriz de adyacencia A de G de modo de triangular por bloques, según veremos enseguida, y usar ciertas submatrices cercanas a la diagonal para calcular la entropía de XG . llevarla a una forma cuadradas Definición 5.20. Dado un grafo G = (V, Σ, i, t) con matriz de adyacencia A, y estados I, J ∈ V , decimos que I se comunica con J (denotado I J ) si existe camino en G desde I n hasta J ; equivalentemente, si existe n ≥ 0 tal que (A )IJ > 0. Decimos que I se intercomunica con J (denotado I ! J ) si I J y J I . Es fácil chequear que la intercomunicación establece una relación de equivalencia entre los clases de intercomunicación. Una clase de éstas consiste en un conjunto maximal de estados tal que desde cualquiera de vértices del grafo (ejercicio). Sus clases de equivalencia se llaman ellos se puede ir a cualquier otro de la clase por un camino en G. G es irreducible precisamente tiene una sola clase de intercomunicación. Una arista de G que sale de un estado perteneciente a una clase de intercomunicación y termina en un estado de una clase de intercomunicación transición de C1 a C2 . C1 ∪ C2 diferente se llama Debe notarse que si hay una arista de transición de puede haber al mismo tiempo arista de transición de estados en C2 C2 a C1 , C1 arista de C1 a C2 , no pues, en ese caso, todos los estarían intercomunicados, contradiciendo la maximalidad de las clases de intercomunicación. G se puede construir otro grafo H cuyos G, y hay una arista (única) desde un vértice Ci en G una arista de transición de Ci a Cj . Con las clases de intercomunicación de un grafo vértices son las clases de intercomunicación de en H si, y sólo si, hay Ejemplo 5.21. Sea G grafo mostrado a continuación, con su correspondiente matriz de hacia otro vértice adyacencia A: Cj 58 5. ENTROPÍA 1 2 3 4 5 6 7 8 Notar que 5 ! 4 1 0 1 0 0 0 0 0 0 2 1 0 0 0 0 0 1 0 3 0 1 0 0 0 0 0 0 4 0 1 1 0 2 0 0 0 5 0 0 0 1 1 0 0 0 6 0 0 0 0 0 2 0 0 7 1 0 0 0 0 0 0 0 8 0 0 0 1 0 1 1 0 y ningún otro vértice se intercomunica con 5 (ni con 4: por ejemplo, a pesar de haber camino de 1 a 4, es imposible en el grafo ir de 4 a 1). Luego, una clase de intercomunicación es C1 = {5, 4}. Análogamente se ve que hay otras cuatro clases: C2 = {8}, C3 = {1, 2, 7}, C4 = {6} y C5 = {3}, según puede observarse en la gura que sigue, que es básicamente el mismo grafo G excepto que con los vértices de cada clase agrupados según una línea discontinua. La arista de G que va de 4 a 8 es de transición de C1 a C2 . Hay también aristas de transición C3 a C1 , de C3 a C5 , de C3 a C2 , de C3 a C4 , de C5 a C1 y de C4 a C2 . Por lo tanto, el grafo H de las clases de intercomunicación tiene cinco vértices (C1 , C2 , C3 , C4 , C5 ) y siete aristas (C1 − C2 , C3 − C1 , C3 − C5 , C3 − C2 , C3 − C4 , C5 − C1 , C4 − C2 ), según se muestra a continuación. de Notar que el grafo H que se construye de esta manera no puede tener rulos (pues por denición las aristas de transición vinculan vértices de clases distintas) ni, más generalmente, ciclos, pues, en ese caso, habría nodos de una clase intercomunicados con nodos de otra clase distinta, lo que no puede ser por la maximalidad de las clases. Esto implica que no todo estado de H H ). Entonces, anterior, C2 es puede tener aristas salientes (si fuera ése el caso, se podría generar un ciclo en debe haber al menos un estado en H sin aristas salientes (en nuestro ejemplo sumideros. Análogamente debe haber al menos un estado en H sin aristas entrantes (C3 es el único del ejemplo anterior) y tales nodos se llaman fuentes. el único). Tales nodos se llaman 4. CÁLCULO DE LA ENTROPÍA DE SHIFTS SÓFICOS Si quitamos los sumideros de H 59 (y las aristas conectadas a ellos) de a uno por vez, recursi- vamente, hasta que no quede ninguno, obtendremos una manera de renombrar los vértices de H de acuerdo al orden en que se fueron quitando los vértices; así, el primer nodo quitado será C10 , el segundo C20 , y así sucesivamente. De este modo, las clases de intercomunicación quedarán 0 0 ordenadas de manera tal que sólo puede haber camino en H desde Ci hasta Cj cuando i > j . En nuestro ejemplo, el procedimiento anteriormente descripto tiene varias alternativas; una C10 = C2 = {8}, C20 = C1 = {5, 4}, C30 = C4 = {6}, C40 = C5 = {3} y C50 = C3 = {1, 2, 7}. de ellas es Este orden nos permite reescribir la matriz de adyacencia A de G usando el orden en que 0 0 aparecen los vértices de G en C1 , C2 , etc. Al hacer este reordenamiento, la matriz asume una forma triangular inferior por bloques que puede esquematizarse de la siguiente manera: C10 C20 C30 . . . Ck0 En ese esquema, 0 C10 C20 C30 A1 0 0 ∗ A2 0 ∗ ∗ A3 ··· ··· ··· ··· C 0k 0 0 0 . . . . . . . . . . . . .. ∗ ∗ ∗ ··· . Ak representa submatrices rectangulares nulas, y tangulares posiblemente no nulas. Cada una de las matrices ∗ Ai representa submatrices reccorresponde a la matriz de adyacencia del subgrafo irreducible Gi de G que se obtiene de considerar los vértices pertene0 cientes a la clase Ci con las aristas de G que inician y terminan en dichos vértices. Cada Gi se llama una G, y las Ai se llaman las componente irreducible de de A. También nos referiremos a los XGi componentes irreducibles como las componentes irreducibles de XG . Para el ejemplo 5.21, un posible reordenamiento siguiendo este proceso es el siguiente: 8 5 4 6 3 1 2 7 8 0 0 1 1 0 0 0 1 5 0 1 1 0 0 0 0 0 4 0 2 0 0 1 0 1 0 6 0 0 0 2 0 0 0 0 3 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 2 0 0 0 0 0 1 0 1 7 0 0 0 0 0 1 0 0 Ya que el polonomio característico de una matriz no cambia por una permutación simultánea de las y columnas, podemos calcular el polinomio característico χA (t) de la matriz A original más fácilmente usando la forma triangular por bloques. Al realizar la expansión (de Laplace) para obtener el determinante, cualquier producto que involucre un término debajo de la diagonal involucrará también un término Por ello, sólo los bloques de A, Ai ∗ de la porción por 0 de la porción por encima de la diagonal. sobre la diagonal importan al calcular el polinomio característico resultando éste ser el producto de los determinantes de las componentes irreducibles de A: χA (t) = χA1 (t)χA2 (t) · · · χAk (t) En consecuencia, los autovalores de A son exactamente los autovalores de las Ai . En particular, el mayor de los λAi (en valor absoluto) será también un autovalor de A. Esto sugiere la siguiente denición. Definición 5.22. Sea El A una matriz no negativa con componentes irreducibles autovalor de Perron de A es λA = máx{λAi : 1 ≤ i ≤ k}. Ya que el conjunto de autovalores de autovalor de A A es la unión de los autovalores de las tiene módulo acotado por alguno de los λAi . A1 , . . . , A k . Ai , cualquier Luego, el autovalor de Perron de 60 5. ENTROPÍA A es el más λA controla grande (en valor absoluto) de los autovalores de A. Veremos, a continuación, que n la tasa de crecimiento de A (y, en consecuencia, la entropía de XG corresponde al máximo de las entropías de sus componentes irreducibles XGi ), lo que es una extensión del teorema 5.12 a grafos en general. Teorema 5.23. Sea G un grafo con matriz de adyacencia A. Entonces, h (XG ) = log λA . A son A1 , . . . , Ak . Será λA = λAq para algún q ∈ {1, . . . , k}. Como XG ⊇ XGq , es h (XG ) ≥ h XGq = log λAq = log λA . Resta probar la desigualdad en el otro sentido. Si λA = 0, es porque cada λAi es 0, lo que implica que cada Ai es la matriz [0]. En ese caso, G no tiene caminos biinnitos, lo que implica que XG = ∅, quedando en ese caso el resultado establecido. Supongamos entonces que λA > 0. Probaremos la desigualdad deseada acotando el número de caminos de longitud n en G. Cualquiera de tales caminos se puede descomponer en subcaDemostración. Supongamos que las componentes irreducibles de minos dentro de clases de intercomunicación separados por aristas de transición entre clases. Es decir, cualquier π ∈ Bn (XG ) es de la forma π = τ (1) e(1) τ (2) e(2) · · · τ (j−1) e(j−1) τ (j) i ∈ {1, . . . , j}, τ (i) es camino (digamos de largo ni ) en alguno de los subgrafos (i) irreducibles de G (digamos Gqi ), y, para cada i ∈ {1, . . . , j − 1}, e es una arista en G desde algún estado en Gqi hasta algún estado de Gqi+1 . Observar que q1 > q2 > · · · > qj , y entonces j ≤ k . Sea M la cantidad total de aristas de transición entre clases que hay en G. Cada e(i) tiene a lo sumo M posibilidades, y a lo sumo n lugares en los que pueden ocurrir. O sea que k la cantidad total de maneras de acomodar aristas de transición es a lo sumo (M n) . Por cada (i) una de tales maneras, el número de opciones para cada τ es Bni XGq . i m Nótese que, siendo Gi irreducible para cada i entre 1 y k , es |Bm (XGi )| ≤ di λA para i + algún di ∈ R (prop. 5.8). Denamos entonces d = máx{di : 1 ≤ i ≤ k}. Tendremos que |Bm (XGi )| ≤ dλm A . Por lo tanto, siendo n1 + · · · + nk ≤ n, la cantidad de formas de elegir los (i) τ es, a lo sumo, Bn1 XGq × · · · × Bn XGq ≤ dj λn1 +···+nj ≤ dk λnA donde, para cada 1 j i A Luego, Aplicando logaritmos, |Bn (XG )| ≤ (M n)k dk λnA = (M d)k nk λnA dividiendo por n y tomando límite cuando n → ∞, log λA . resulta h (XG ) ≤ Con el resultado previo, ya estamos en condiciones de calcular la entropía de cualquier espacio shift sóco (posiblemente irreducible). Corolario 5.24. Sea X un shift sóco, y G = (G, L) una presentación resolvente a derecha para X . Entonces, h(X) = log λA , siendo A la matriz de adyacencia de G. Demostración. Por la proposición 5.6, sabemos que X = XG , se concluye el resultado. h (XG ) = h (XG ) = log λA . Como Capítulo 6 CÓDIGOS DE ESTADOS FINITOS A en X , y hacerlo de tal manera que exista algún modo de recuperar Por diversos motivos, puede interesar codicar sucesiones arbitrarias sobre un alfabeto sucesiones de algún shift sóco la sucesión original conociendo su imagen. Lo primero que interesa es saber si es posible tal ∞ operación. Por ejemplo, si A = {0, 1} y X = {0 } es evidente que no. En caso de ser posible, de los métodos disponibles investigaremos en este capítulo uno que se denomina nitos, código de estados en el que los símbolos de la sucesión imagen se obtienen de a uno por vez, a medida que se van leyendo uno por uno los símbolos de la sucesión original, los que son interpretados como una suerte de instrucciones. El método usa grafos rotulados con dos clases especiales de rotulaciones, una resolvente a derecha que además cumple otras condiciones, y una un poco más débil que resolvente a derecha. 1. Coloreo de rutas y presentaciones cerrantes a derecha Recordemos que una rotulación a derecha L:Σ→A para un grafo G = (V, Σ, i, t) se dice resolvente L|ΣI es si desde un mismo nodo no salen dos aristas con un mismo rótulo; es decir, inyectiva para cada I ∈ V. Si imponemos la condición más fuerte de que cada L|ΣI sea una biyección, tendremos un tipo especial de rotulaciones resolventes a derecha. G un grafo con conjunto de aristas Σ. Un coloreo de rutas de G es L : Σ → A que, para cada I ∈ V , establece una biyección entre las aristas que las letras del alfabeto. G se dice coloreable si admite un coloreo de rutas. Definición 6.1. Sea una rotulación salen de I y La gura 1 muestra un ejemplo de grafo coloreable con A = {0, 1}, y un ejemplo de coloreo. Figura 1. Ejemplo de coloreo de rutas Vemos entonces que, en un coloreo de rutas, por cada vértice I de G y cada letra a ∈ A, I cuyo rótulo es a. Esto obliga a que desde cada vértice |A| aristas. Entonces, G es coloreable si, y sólo si, tiene grado de salida sale exactamente una arista desde deban salir exactamente constante desde sus vértices, lo que, en términos de la matriz de adyacencia, signica que las las suman todas lo mismo. Un grafo con r estados y n aristas saliendo desde cada vértice r admite (n!) posibles coloreos de rutas (pues para cada uno de los r vértices hay que elegir una forma de asignar a n aristas las n letras del alfabeto, que es como ordenar las letras del alfabeto). Otra consecuencia de la denición es que si vértices, cada palabra sobre A L tiene exactamente 61 es un coloreo de rutas para r G que tiene r presentaciones, una empezando en cada 62 6. CÓDIGOS DE ESTADOS FINITOS w w = a1 a2 . . . am , cuyo rótulo es Si toma la símbolo I ∈ V w ∈ A∗ , hay un único camino comenzando en I Z (y, en consecuencia, un coloreo de rutas resulta una presentación para A ). vértice. Es decir, para cada y cada I se toma la única arista e1 ∈ Σ saliente con rótulo a1 , desde t(e1 ) se única arista e2 ∈ Σ saliente con rótulo a2 , y así sucesivamente. En este sentido, cada de A se interpreta como una instrucción de cuál arista tomar si se está en un dado desde vértice. Ahora veamos otro tipo de rotulaciones especiales para grafos, que satisfacen una condición más débil que la de ser resolventes a derecha. cerrante a derecha con demora D si cualquier Definición 6.2. Un grafo rotulado se dice pareja de caminos de longitud D+1 arrancando desde un mismo vértice y llevando el mismo rótulo usan la misma primera arista. Un grafo rotulado se dice cerrante a derecha con alguna demora cerrante a derecha si es D ≥ 0. Informalmente hablando, un grafo rotulado puede no ser resolvente a derecha (lo cual creará ambigüedad sobre cuál arista rotulada tomar para salir desde algunos estados) pero es cerrante a derecha si esa ambigüedad queda salvada mirando anticipadamente una cierta cantidad D de símbolos adicionales que vendrán después. Para los grafos resolventes a derecha, no hay que mirar anticipadamente nada, correspondiendo al caso en que la demora es D = 0. Ejemplo 6.3. Consideremos los grados rotulados (a)(d) mostrados en la gura 2. El grafo (a) tiene demora aristas rotuladas el bucle en I a J I a D = 1. Para verlo, consideremos el estado comenzando en I, I. Ya que hay dos el grafo no es resolvente a derecha. Sin embargo, a, mientras que la arista de b o c. Luego, el rótulo de un camino sólo puede ser seguido por una arista rotulada sólo puede ser seguida por una arista rotulada de longitud 2 empezando en I determina su arista inicial. Un análisis similar permite concluir lo mismo para el estado J, y el estado K es más fácil, dado que las aristas que salen de él llevan rótulos distintos. De manera análoga al inciso anterior, se puede vericar que el grafo rotulado (b) también es cerrante a derecha con demora 1. En el grafo rotulado (c), hay dos caminos con diferentes aristas iniciales rotulados ab, por lo que este grafo no tiene demora 1. Sin embargo, el siguiente símbolo determina cuál de los dos caminos debe tomarse, por lo que el grafo es cerrante a derecha con demora D = 2. En el grafo rotulado (d), para cualquier m, hay dos caminos comenzando en J que m presentan al bloque ab ; ya que estos caminos tienen distinta arista inicial, el grafo no es cerrante a derecha. Una manera equivalente, y a veces cómoda, de visualizar la propiedad de una rotuladora de ser cerrante a derecha con demora D es pensar que dos caminos de largo D+1 arrancando en un mismo vértice pero usando distinta primera arista no pueden llevar el mismo rótulo. Obviamente, así como el concepto de rotulación resolvente a derecha tiene su dual, que es el resolvente a izquierda (todas las aristas que llegan a un mismo nodo tienen rótulos diferentes), se puede denir la noción dual de cerrante a derecha que es la de rotulación cerrante a izquierda: todos los caminos de largo D + 1 que terminan en un mismo nodo y llevan el mismo rótulo de usan la misma última arista. Pero en el presente capítulo usaremos sólo la noción de cerrante a derecha. La propiedad de ser cerrante a derecha con demora caminos de largo D + 1: D tiene una consecuencia sobre los todos los caminos de esa longitud que arrancan en un mismo vértice y llevan igual rótulo, tienen la misma primera arista. La gura 3 ilustra ese hecho. Esto puede generalizarse a caminos más largos diciendo que todos los caminos de largo mayor que D arrancando de un mismo nodo y teniendo el mismo rótulo usan las mismas aristas, excepto quizás las últimas D de largo mayor que aristas. Es decir, dos caminos D) e0 e1 . . . ek y f0 f1 . . . fk con k≥D (o sea, que arrancan en el mismo vértice y llevan el mismo rótulo cumplen 1. COLOREO DE RUTAS Y PRESENTACIONES CERRANTES A DERECHA (a) 63 (b) (c) (d) Figura 2. Ejemplos de rotulaciones con o sin cierre a derecha Figura 3. Cierre por la arista inicial de caminos con igual rótulo ej = fj para cada j ∈ {0, . . . , k − D}: aplicando la denición a los dos bloques iniciales e0 . . . eD y f0 . . . fD , obtenemos que e0 = f0 , con lo cual e1 . . . ek y f1 . . . fk arrancan en un mismo vértice, y, en caso de tener largo al menos D + 1, aplicamos el mismo razonamiento para ver que e1 = f1 , y así sucesivamente. Visto así, la propiedad de cierre a derecha actúa a que la manera de un cierre de prenda de vestir, juntando todas las aristas de los caminos de largo mayor que D D que arrancan desde un mismo vértice y llevan un mismo rótulo, salvo las últimas aristas. Véase la gura 4. Figura 4. Cierre de todas excepto las últimas D aristas de caminos con igual rótulo 64 6. CÓDIGOS DE ESTADOS FINITOS Usando esta idea para caminos cada vez más largos, vemos que la ambigüedad se traslada cada vez más hacia la derecha; en un caso límite de caminos innitamente largos hacia la derecha, esa ambigüedad queda entonces expulsada al innito (o sea, no subsiste la ambigüedad). Es decir, veremos que, en un grafo rotulado cerrante a derecha, cualquier pareja de caminos innitos a derecha que empiezan en el mismo estado y llevan el mismo rótulo corresponden en realidad a un único camino en el grafo. Para formalizar esto, dado un espacio shift X cualquiera X + como el conjunto de todas las sucesiones innitas a derecha denimos su shift unilateral que aparecen en X. Es decir, X + = {x0 x1 x2 . . . : (xk )k∈Z ∈ X} En el caso del shift de aristas correspondiente al grafo G = (V, Σ, i, t), X+ G corresponde al conjunto de caminos innitos a derecha que pueden ser recorridos en el grafo: X+ G = {e0 e1 e2 . . . : ∀k ∈ N, ek ∈ Σ ∧ t(ek ) = i(ek+1 )} Si I es un estado de G, designamos por X+ G,I como el conjunto de caminos innitos a derecha que pueden ser recorridos en el grafo empezando en I: + X+ G,I = e0 e1 e2 . . . ∈ XG : i(e0 ) = I G = (G, L) es un grafo rotulado, X+ G es la familia de los rótulos de todos los caminos innitos + derecha en G. Si para cada e0 e1 e2 . . . ∈ XG designamos Si a tendremos que X+ G L+ (e0 e1 e2 . . .) = L(e0 )L(e1 )L(e2 ) . . . , + + + = L+ (X+ L (x) : x ∈ X+ : X+ G) = G , resultando que L G → XG es una función sobreyectiva. Proposición 6.4. Un grafo rotulado (G, L) es cerrante a derecha si, y sólo si, para cada vértice I del grafo, L+ |X+ es inyectiva. G,I Demostración. Supongamos primero que es cerrante a derecha, digamos con de- I un vértice cualquiera del grafo, y sean x = e0 e1 e2 . . . e y = f0 f1 f2 . . . caminos + + X+ G,I tales que L (x) = L (y). Entonces i(e0 ) = I = i(f0 ) y L(e0 )L(e1 ) . . . L(eD ) = L(e0 )L(e1 ) . . . L(eD ). Por ser el grafo rotulado cerrante a derecha con demora D, debe ser e0 = f0 y, en consecuencia, e1 y f1 comienzan en el mismo vértice t(e0 ). Como L(e1 )L(e2 ) . . . L(eD+1 ) = L(f1 )L(f2 ) . . . L(fD+1 ) y el grafo es cerrante a derecha, es e1 = f1 . Aplicando sucesivamente el mismo razonamiento, se cumple que para todo k ∈ N es ek = fk , es decir, x = y , y de este + + modo L es inyectiva si se la restringe a XG,I . Ahora probemos la vuelta por contrarreciprocidad. Supongamos entonces que (G, L) no es cerrante a derecha. Esto signica que para cada D ≥ 0, existe una pareja de caminos de largo D + 1, digamos π y τ , que comienzan en un mismo vértice, tienen distinta primera arista y 2 llevan ambos el mismo rótulo. Elijamos tales caminos para el caso en que D = |V | . Será mora D. (G, L) Sea innitos en π = e0 e1 . . . eD τ = f0 f1 . . . fD i(e0 ) = i(f0 ), e0 6= f0 y L(e0 )L(e1 ) . . . L(eD ) = L(f0 )L(f1 ) . . . L(fD ). Como D + 1 > |V |2 , debe haber índices i < j tales que la pareja ei , fi coincide con ej , fj , por lo que ei . . . ej y fi . . . fj son ambos ciclos en G comenzando en un mismo nodo; llamémosles β y γ respectivamente, 0 0 siendo |β| = |γ|. Hagamos α = e0 . . . ei−1 y α = f0 . . . fi−1 , siendo |α| = |α |. Notar que 0 L(α) = L(α ) por ser ambos subcaminos iniciales de π y τ con igual longitud; y, similarmente, L(β) = L(γ). Entonces αβ ∞ y α0 γ ∞ son dos caminos innitos a derecha arrancando en i(e0 ), + ambos distintos (pues e0 6= f0 ) y con rotulaciones iguales. Luego, L |X+ no es inyectiva. con G,i(e0 ) Una situación en la que podemos garantizar que un grafo rotulado es cerrante a derecha es aquella en la que la función rotuladora, como código de ventana deslizante que es, resulta ser una conjugación. 1. COLOREO DE RUTAS Y PRESENTACIONES CERRANTES A DERECHA 65 Sea G = (G, L) un grafo rotulado con L∞ : XG → XG conjugación cuya tiene anticipación n. Entonces el grafo rotulado es cerrante a derecha con demora Proposición 6.5. inversa n. L−1 ∞ Demostración. Podemos suponer que caminos comenzando en el mismo vértice I G es esencial. Sean e0 e1 . . . en y f0 f1 . . . fn dos y llevando el mismo rótulo. Debemos probar que e0 = f0 . m a la memoria de L−1 ∞ y Φ a la respectiva función de bloques, elijamos un camino π en G de largo m que termine en I (tal elección es posible por ser G esencial). Entonces L(πe0 e1 . . . en ) = L(π)L(e0 e1 . . . en ) = L(π)L(f0 f1 . . . fn ) = L(πf0 f1 . . . fn ). Luego, Φ (L(πe0 e1 . . . en )) = Φ (L(πf0 f1 . . . fn )), siendo el primer miembro de esta igualdad precisa−1 mente e0 , y el segundo f0 (por ser Φ la función inductora de L∞ ). Es decir, e0 = f0 . Llamando Recordemos que el desdoblamiento de salidas de un grafo rotulado corresponde a un desei con el mismo rótulo doblamiento de salidas del grafo subyacente, rotulando todas las aristas que en el grafo original tiene la arista e. Recordemos también que esto produce una nueva presentación del mismo shift sóco. Demostraremos ahora que si se desdobla un grafo rotulado resolvente a derecha con demora con demora D, el grafo desdoblado es también resolvente a derecha, aunque D + 1. Proposición 6.6. Sea G cerrante a derecha con demora D . Cualquier grafo rotulado obtenido por desdoblamiento de salidas de G es cerrante a derecha con demora D + 1. G = (G, L), y sea (H, L0 ) un grafo obtenido por desdoblamiento de i i i salidas de G . Recordar que H tiene estados I y aristas e , y que el código de amalgama e → e 0 0 i da una conjugación de XH a XG . Además, la rotuladora L en H está dada por L (e ) = L(e). 0 Veremos que (H, L ) es cerrante a derecha con demora D + 1. iD+1 jD+1 j0 j1 i0 i1 Sean e0 e1 . . . eD+1 y f0 f1 . . . fD+1 dos caminos de largo D +2 en H comenzando ambos en I i y teniendo el mismo rótulo (según L0 ). Aplicando el código amalgama, vemos que e0 e1 . . . eD+1 y f0 f1 . . . fD+1 son caminos de largo D + 2 en G comenzando en I y con el mismo rótulo (para L). Así que e0 e1 = f0 f1 . Ya que i0 está determinado por el elemento de la partición al que pertenece e1 , y similarmente j0 está determinado por el elemento de la partición al que j0 i0 0 pertenece f1 , concluimos que e0 = f0 , quedando establecido que L es cerrante a derecha con demora D + 1. Demostración. Sea Ejemplo 6.7. Consideremos el grafo rotulado (b) de la gura 2, que es cerrante a derecha 1 2 1 con demora 1. Hagamos un desdoblamiento elemental de salidas usando ΣI , ΣI y ΣJ , donde Σ1I consiste en el rulo en I rotulado a y la única arista de I a J rotulada b, Σ2I es el resto de 1 las aristas que salen de I , y ΣJ = ΣJ . El grafo rotulado desdoblado resultante se muestra en la 1 gura 5. En él, hay dos caminos comenzando en I rotulados aa que usan distinta arista inicial, por lo que el grafo no tiene demora 1. Sin embargo, la proposición muestra que tiene demora 2, como efectivamente puede vericarse. Figura 5. El desdoblamiento de grafos rotulados incrementa una unidad la demora 66 6. CÓDIGOS DE ESTADOS FINITOS Recordemos que, en un grafo rotulado, la entropía del shift de aristas del grafo subyacente y la del sóco coinciden si la rotulación es resolvente a derecha. Lo mismo es cierto para las rotulaciones cerrantes a derecha. Proposición 6.8. h (XG ). Sea G = (G, L) un grafo rotulado cerrante a derecha. Entonces, h (XG ) = h (XG ) ≤ h (XG ). Para probar la desigualdad en el otro sentido, supongamos que G es cerrante a derecha con demora D . Entonces, cada estado I de G y cada bloque de largo n + D en el lenguaje de XG determinan a lo sumo un camino de largo n en G, y todos los caminos en Bn (XG ) surgen de esta forma. Luego, |Bn (XG )| ≤ |V | × |Bn+D (XG )|. Aplicando logaritmos, dividiendo por n y tomando límite cuando n → ∞, resulta h (XG ) ≤ h (XG ). Demostración. Ya que XG es factor de 2. XG , tenemos que Códigos de estados nitos Introduciremos ahora una clase de dispositivos para transformar sucesiones arbitrarias (es decir, sin restricciones) sobre un alfabeto en sucesiones sujetas a determinadas restricciones (posiblemente sobre otro alfabeto). Analizaremos también desde el punto de vista teórico la factibilidad del método en lo que resta del capítulo. código de estados nitos (CEF) grafo codicador, I es un coloreo de Definición 6.9. Un es una terna (G, I, O), donde G rotulación de entradas y O es una rotulación cerrante a derecha de G llamada rotulación de salidas. es un grafo llamado Si todos los vértices de O∞ (XG ), G rutas de G llamado n y si X es un espacio shift que (X, n)-código de estados nitos. tienen grado de salida decimos que la terna (G, I, O) es un contiene a Representaremos grácamente a los CEF mediante el dibujo del correspondiente grafo y una leyenda de la forma a/b en cada arista e, en donde a representa I(e) y b representa O(e). Ejemplo 6.10. El grafo rotulado (b) de la gura 2 tiene grado de salida constante 4, de modo que proporciona una rotulación de salida para un CEF. La gura 6 muestra una posible elección de rotulación de entradas con alfabeto {0, 1, 2, 3}. Figura 6. Un ejemplo de CEF (G, I, O) (X, n)-CEF e I0 es un estado jo de G, podemos transformar cualquier + a0 a1 a2 . . . ∈ AZ en otra sucesión de salidas r0 r1 r2 . . . de X + del siguiente modo: identicamos la única arista e0 saliendo de I0 tal que I(e0 ) = a0 y denimos r0 = O(e0 ). Ahora desde el vértice terminal de e0 sale una única arista e1 tal que I(e1 ) = a1 y denimos r1 = O(e1 ). Continuando de esta manera, denimos rk para cualquier k ∈ N. Si es un sucesión arbitraria de entradas Obviamente, queremos ser capaces de recuperar la sucesión original a partir de la sucesión así obtenida. Es precisamente para ello que hemos requerido que proposición 6.4 nos garantiza que O O sea cerrante a derecha: la es inyectiva cuando se restringe a los caminos innitos en G que arrancan en I0 , lo que signica que hay un único camino innito e0 e1 e2 . . . en X+ G,I0 tal que O(e0 e1 e2 . . .) = r0 r1 r2 . . .; por lo tanto, cada ak se recupera viendo I(ek ). 3. AUTOVECTORES APROXIMADOS (G, O) r0 r1 . . . rD determina e0 , así que a0 = I(e0 ). Luego, r1 r2 . . . rD+1 es un camino rotulado (por O) en G que comienza en t(e0 ), y por lo tanto determina e1 , de donde a1 = I(e1 ). Continuando de este modo, obtenemos todos los ak . Concretamente, si tiene demora D, 67 el bloque En la práctica sólo podemos manejar sucesiones nitas de símbolos. En tal caso, a partir de una sucesión nita arbitraria a0 a1 . . . ak podemos generar, por el método arriba descripto, a0 a1 . . . ak−D (pues O es D). Si bien esto parece alarmante, una solución posible es agregar D símbolos arbitrarios a la derecha de a0 a1 . . . ak y codicar mediante el CEF esta sucesión más grande; obtendremos así una r0 r1 . . . rk . . . rk+D que nos permitirá recuperar a0 a1 . . . ak r0 r1 . . . rk . Pero el conocimiento de ésta sólo nos permite recuperar cerrante a derecha con demora completamente y sin ambigüedades. Ahora bien, dado un alfabeto de n símbolos para las sucesiones arbitrarias de entrada y un X , resta ver bajo qué condiciones existe un (X, n)-CEF. El teorema principal de los X tenga suciente capacidad de almacenamiento de información, o complejidad, la que es medida por la entropía. shift sóco códigos de estados nitos establece cuál es exactamente esa condición: que Teorema 6.11. (Teorema de los Códigos de Estados Finitos) Sean X un shift sóco y n un entero positivo. Entonces, hay un (X, n)-código de estados nitos si, y sólo si, h(X) ≥ log n. La dirección fácil de la demostración es la directa: si (G, I, O) es un (X, n)-CEF, por la proposición 6.8, que establece que las rotulaciones cerrantes a derecha preservan entropía, tenemos que shift de n h (I∞ (XG )) = h(XG ) = h (O∞ (XG )). Como (G, I) O∞ (XG ) ⊆ X , tenemos que es una presentación del full símbolos, y además log n = h (I∞ (XG )) = h (O∞ (XG )) ≤ h(X) La demostración de la implicación recíproca es mucho más delicada, y requiere de nuevas ideas que desarrollaremos en las secciones posteriores del capítulo. 3. Supongamos que n Autovectores aproximados es un entero positivo y que una presentación resolvente a derecha X es un shift sóco. Sabemos que X admite Si tenemos la suerte de que, en esa presentación, (X, n)-CEF simplemente n aristas salientes desde cada estado (borrando las otras) y restringiendo L a esas aristas elegidas (llamemos O a esa restricción). Obtenemos así un subgrafo G coloreable, al que dotamos de cualquier coloreo de rutas I . Tenemos que (G, I, O) constituye un (X, n)CEF, pues I y O son ambas resolventes a derecha (y entonces O es cerrante a derecha con demora D = 0) y O∞ (XG ) = L∞ (XG ) ⊆ L∞ (XH ) = X . El problema sería que H no tuviese al menos n aristas saliendo desde cada estado. Veremos, sin embargo, que si X satisface la condición h(X) ≥ log n, una cadena de desdoblamientos de estados convenientemente elegidos, aplicados sucesivamente a partir de (H, L), producirá una presentación de X en la que hay al menos n aristas saliendo desde cada vértice. A ella le aplisalen al menos n (H, L). aristas desde cada vértice, podemos diseñar un eligiendo exactamente caremos nuestras consideraciones previas, y de esta manera quedará completa la demostración del Teorema de los Códigos de Estados Finitos, que se hará en la sección posterior. Nos dedicaremos ahora a presentar la herramienta precisa que nos servirá de guía para elegir (H, L), para autovector aproximado, convenientemente la sucesión de desdoblamientos de estados a realizar, a partir de llegar a la presentación buscada. Esa herramienta recibe el nombre de y, para motivar su nombre y su denición, notemos que si un grafo con matriz de adyacencia A tiene al menos n aristas saliendo desde cada vértice, cada la de condición equivale a la desigualdad matricial dimensión igual al tamaño de columna v 6= 0 A A1 ≥ n1, 1 A suma al menos 1 n. Esa es el vector columna de y que tiene todos sus coecientes valiendo que, reemplazado en cuenta de recibirá un nombre especial. en donde 1. Cualquier vector en esa desigualdad, la siga satisfaciendo, 68 6. CÓDIGOS DE ESTADOS FINITOS Definición 6.12. Sea A una matriz a coecientes enteros no negativos, y n un entero (A, n)-autovector aproximado ((A, n)-AA) es un vector v 6= 0 con coecientes Av ≥ nv. 1 3 Ejemplo 6.13. Sean A = y n = 5. De la denición de autovector aproximado, 6 1 resulta que cualquier (A, 5)-AA u = (u1 , u2 ) debe satisfacer u1 + 3u2 ≥ 5u1 6u1 + u2 ≥ 5u2 positivo. Un enteros no negativos que satisface o, equivalentemente, −4u1 + 3u2 ≥ 0 6u1 − 4u2 ≥ 0 Este sistema determina un cono en el primer cuadrante; los puntos de ese cono que tienen ambas coordenadas enteras son precisamente los (A, 5)-autovectores aproximados. Entre ellos, tenemos 2 3 3 4 5 6 6 7 , , , , , , ,... 4 6 7 8 9 10 A de tamaño r y un n > 0, el conjunto de los (A, n)-AA es el conjunto de vectores (u1 , . . . , ur ) a coordenadas enteras no negativas que se encuentran en el cono poliédrico de dimensión r (o Pr menor) determinado por el sistema de inecuaciones { J=1 AIJ uJ ≥ nuI : 1 ≤ I ≤ r}. El ejemplo anterior es generalizable de manera directa al hecho de que dada una matriz Observación 6.14. Podemos caracterizar de diversas maneras a los autovectores aproxi- mados. v un (A, n)-autovector aproximado. Siendo A ≥ 0, es A2 v = A(Av) ≥ A(nv) = n(Av) ≥ n(nv) = n2 v. Una sencilla inducción muestra que, más generalmente, para k k todo k ≥ 0 se cumple que A v ≥ n v toda vez que v es un (A, n)-AA. + Por lo tanto, dados n ∈ Z , A y v 6= 0 a coecientes enteros no negativos, Sea v Sea A es (A, n)-AA ⇐⇒ ∀k ∈ N, Ak v ≥ nk v la matriz de adyacencia de un grafo G = (V, Σ, i, t), y v 6= 0 un vector a coe- cientes enteros no negativos de dimensión igual al tamaño de A. Consideremos cualquier S J ∈ V . Como ΣJ es la unión disjunta L∈V ΣLJ , se tiene que X X vt(e) = e∈ΣJ e∈ S L∈V vt(e) = XX vt(e) = L∈V e∈ΣL J ΣL J XX vL = L∈V e∈ΣL J X X ΣLJ vL = AJL vL L∈V Por otra parte, de la denición de autovector aproximado, se tiene que si, y sólo si, ∀J ∈ V, v P es L∈V AJL vJ ≥ nvJ . L∈V v es un (A, n)-AA Por lo dicho previamente, resulta que (A, n)-AA ⇐⇒ ∀J ∈ V, X vt(e) ≥ nvJ e∈ΣJ Cuando irreducible A es la matriz de adyacencia de un grafo G y posee un (A, n)-AA, hay un subgrafo H de G cuya matriz de adyacencia B admite un (B, n)-autovector aproximado estrictamente positivo. Lema 6.15. Sean G = (V, Σ, i, t) un grafo con matriz de adyacencia A. Existe un (A, n)-AA si, y sólo si, G posee un subgrafo irreducible H con matriz de adyacencia B tal que existe un (B, n)-AA estrictamente positivo. 3. AUTOVECTORES APROXIMADOS 69 Demostración. ⇒) v un (A, n)-AA. Designemos por K al subgrafo de G que resulta de quitar todos los I (y, obviamente, sus aristas incidentes) para los cuales vI = 0. Sea H una componente conexa de K que sea un sumidero, es decir, que no contenga aristas que terminen en un estado que no esté en H . Tal H es un subgrafo de G. Llamando VH al conjunto de vértices de H y B a su matriz de adyacencia, sea w la restricción de v a VH . Por su denición, es w > 0. Sea vértices Además, podemos observar que: J ∈ VH P, es wJ = vJ y AIJ = BIJ , por lo que BIJ wJ = AIJ vJ . De allí B w = IJ J J∈VH J∈VH AIJ vJ . Para cualquier J ∈ V − VH , puede ocurrir una de dos alternativas: 1. O bien J no es un vértice en el subgrafo K , lo que ocurre por ser vJ = 0. 2. O bien J es un vértice de K . En tal caso, todas las aristas de G incidentes con I y con J subsisten en K , y, por denición de H , no hay arista en K desde I hasta J , de donde se deduce que no hay arista en G desde I hasta J . Entonces, en este caso, AIJ = 0. Cualquiera sea esa alternativa, resulta entonces que AIJ vJ = 0. Siendo J arbitrario en P V − VH , tenemos que J∈V −VH AIJ vJ = 0. Para cualquier que P Entonces, X X BIJ wJ = X AIJ vJ ≥ nvI = nwI J∈V (B, n)-AA estrictamente positivo. ⇐) Sea w un (B, n)-AA para el subgrafo H = (V 0 , Σ0 , i0 , t0 ), y sea v el vector denido por wJ si J ∈ V 0 vJ = 0 si J ∈ V − V 0 P Sea I un vértice arbitrario de G. Si I ∈ / V 0 , siendo vI = 0, la desigualdad L∈V AIL vL ≥ nvI 0 se cumple trivialmente. Y para cualquier I ∈ V , resulta X X X X X AIL vL = AIL vL + AIL vL = AIL wL ≥ BIL wL ≥ nwI = nvI quedando así demostrado que L∈V 0 L∈V Ya que w AIJ vJ = J∈V −VH J∈VH J∈VH X AIJ vJ + v 6= 0 pues L∈V −V 0 w > 0, Dada una matriz A es un resulta que v L∈V 0 (A, n)-AA. es un n, y un entro positivo L∈V 0 ¾cuándo existe un (A, n)-AA? Teorema 6.16. Sean A ≥ 0 una matriz a coecientes enteros, y n un entero positivo. Entonces, hay un (A, n)-AA si, y sólo si, λA ≥ n. Si además suponemos que A es irreducible, entonces hay un (A, n)-AA estrictamente positivo. Demostración. Llamemos sea r al tamaño de A. Sea G un grafo cuya matriz de adyacencia A. A es irreducible y que admite un (A, n)-AA v > 0. Sean c = mı́n{vI : 1 ≤ I ≤ r} y d = máx{vI : 1 ≤ I ≤ r}, k k teniéndose que d ≥ c > 0. Para cualquier k ∈ N, es A v ≥ n v (observación 6.14), lo que k implica que para cualquier I ∈ {1, . . . , r} es A v ≥ nk vI , y entonces I Para la implicación directa, por el lema 6.15, podemos suponer que d r X r X k A I=1 J=1 Pr Pr IJ ≥ r X r X I=1 J=1 k k A IJ vJ ≥ r X I=1 k k n vI = n r X vI ≥ nk rc I=1 A IJ ≥ nk rc/d. Pero además, por la proposición 5.8 y el Teorema de J=1 P Pr r k k Perron-Frobenius, es I=1 J=1 A IJ ≤ d0 λA para alguna constante d0 > 0. Juntando todo rc 1/k esto, y llamando t = , resulta que, para cualquier k ∈ N, es λA ≥ t n. Haciendo tender k dd0 a innito, y considerando que t > 0, resulta que λA ≥ n. Es decir, I=1 70 6. CÓDIGOS DE ESTADOS FINITOS λA ≥ n. Usando una componente irreducible de G de entropía maximal, podemos suponer que A es irreducible. Su autovector de Perron vA es positivo, y satisface AvA = λA vA ≥ nvA . Si vA tuviese todos sus coecientes racionales, haciendo v = M vA (donde M es el producto de los denominadores de los coecientes de vA ) obtendríamos que Av = AM vA = M (AvA ) ≥ M nvA = nv, mostrando que v sería el (A, n)-AA que buscamos. Pero no tenemos garantía de que vA vaya a tener todos Para la implicación recíproca, supongamos que se cumple la condición sus coecientes racionales, así que debemos trabajar un poco más para asegurar que hay un (A, n)-AA. Distinguiremos dos casos: 1. λA = n. En este caso, resolvemos Av = nv la ecuación vectorial por eliminación gaus- siana (siendo el sistema consistente ya que admite al menos la solución A v tiene todos sus coecientes enteros, la solución λA racionales. Por el teorema de Perron-Frobenius, que v es múltiplo de vA . Multiplicando a v vA ), y, ya que debe tener todos sus coecientes es geométricamente simple, por lo por el producto de los denominadores de v0 > 0 que cumple sus coecientes (y eventualmente por −1), obtenemos un vector Av0 ≥ nv0 . Entonces, v0 es un (A, n)-AA. λA > n, 2. Si de modo que AvA > nvA , elijamos v con coordenadas racionales sucien- temente cercanas a las respectivas coordenadas de siga cumpliéndose. Apliquemos a tal vA tal que la desigualdad Av > nv v el proceso de multiplicar por el producto de 0 los denominadores (y eventualmente por −1) para obtener un vector v que satisfará 0 0 0 Av ≥ nv . Entonces, v es un (A, n)-AA. Veremos más adelante que, a la hora de construir necesario obtener explícitamente un vinculada al shift sóco λA ≥ n, condición X) existe un (A, n)-AA, y el entero positivo (A, n)-AA; (X, n)-códigos de estados nitos, es conociendo cierta matriz n. A (estrechamente El teorema anterior asegura que, bajo la sin embargo, no proporciona una manera explícita de encontrar uno. Afortunadamente, existe un algoritmo que permite hacerlo. Antes de presentarlo, 0 denimos una nueva notación: dados dos vectores v, v de igual tamaño r , designamos por mı́n(v, v0 ) al vector minimal componente a componente, es decir, (mı́n(v, v0 ))I = mı́n{vI , vI0 } para cada I ∈ {1, . . . , r}. Además, designamos por bvc al vector que se obtiene de tomar las partes enteras de las componentes de Teorema 6.17. v, es decir, bvcI = bvI c para cada I ∈ {1, . . . , r}. (Algoritmo del autovector aproximado) Sean A ≥ 0 una matriz a coecientes enteros, n un entero positivo y v 6= 0 un vector a coecientes enteros no negativos. Pongamos 1 0 Av v = mı́n v, n Si v0 = v, contestar v y nalizar. Si no, reemplazar v por v0 y repetir. Este proceso nalmente culmina, y su respuesta es o bien un (A, n)-autovector aproximado o bien el vector nulo. Demostración. Los sucesivos vectores que se van produciendo tienen coecientes enteros no negativos y monótonamente decrecientes componente a componente. Luego, el proceso debe terminar, pues el vector nulo 0 satisface la condición 1 0 = mı́n 0, A0 n si es que ésta no se produce antes. Sea v la respuesta. Se tiene que v es un vector a coecientes enteros no negativos. Si v = 0, se cumple el enunciado. Si no, notemos que 1 v = mı́n v, Av n por lo que Av ≥ nv con v 6= 0, es decir, v es un ≤ 1 Av n (A, n)-AA. 4. CONSTRUCCIÓN DE CÓDIGOS DE ESTADOS FINITOS 71 Típicamente, el algoritmo anterior se emplea del siguiente modo: comenzar con v siendo el vector cuyas componentes son todas 1 y aplicar el algoritmo; si la respuesta es un vector no nulo, ya tenemos el autovector aproximado que buscamos. En caso contrario, tomar v siendo el vector cuyas componentes son todas 2, y así sucesivamente. El teorema 6.17 asegura que en algún momento terminaremos con este procedimiento, pues existe un p = máxI vI , (A, n)-AA v. Si hacemos aplicando el algoritmo comenzando con el vector cuyas componentes son todas p, se obtendrá como respuesta un vector no nulo (ejercicio). Ejemplo 6.18. Apliquemos el algoritmo anterior a la matriz ejemplo 6.13. Comenzando con v= Comenzando con v= Comenzando con v= 2 2 del , obtenemos sucesivamente → 1 2 → 0 1 → 0 0 0 0 0 0 → 1 1 → 0 1 → → 0 0 , obtenemos sucesivamente 3 3 y hemos obtenido el más pequeño de los 4. n=5 , obtenemos sucesivamente → 3 3 y el 1 1 2 2 1 1 A= 1 3 6 1 → 2 3 → 2 3 (A, 5)-autovectores aproximados. Construcción de códigos de estados nitos En esta sección completaremos la demostración del Teorema de los Códigos de Estados Finitos. Lo haremos de manera constructiva, es decir, proporcionando también un método para construir el CEF, conocidos n y el shift sóco X con h(X) ≥ log n. (G0 , L0 ) para X . Luego, G = (G00 , L) con h (XG ) = El primer paso es obtener una presentación resolvente a derecha basados en el corolario 5.24, elegimos una componente irreducible h (XG0 ) = h(X) ≥ log n. A partir de G , y siguiendo una adecuada secuencia de desdoblamientos de estados de grafos rotulados, construimos una presentación de X en la que desde cada vértice salen al menos n aristas, y en esa presentación eliminamos algunas aristas para obtener un grafo G en el que, desde cada vértice, queden saliendo exactamente n aristas. La función rotuladora restringida a esas aristas será nuestra rotuladora de salidas O , y como rotuladora de entradas I elegimos cualquier coloreo de rutas del grafo que resulta. Así obtenemos el CEF (G, I, O) que buscamos. Para ello, necesitamos demostrar una proposición que constituye el corazón de la demostración de que efectivamente existe aquella secuencia de desdoblamientos de estados de grafos rotulados de la que hablamos más arriba. Y dicha proposición usa un sencillo hecho de teoría de números que enunciamos a continuación. n Sea {mP i }i=1 una sucesión de n enteros positivos. Entonces, existe S ⊆ {1, . . . , n} tal que n es factor de i∈S mi . P N Demostración. Para cada N ∈ {1, . . . , n}, sea pN = m mod n. i i=1 ∗ Si los pN son todos distintos, debe haber algún N tal que pN ∗ = 0 (pues los posibles restos PN ∗ de una división por n son 0, 1, . . . , n − 1) y, en ese caso n es factor de i=1 mi ; luego, basta ∗ tomar S = {1, . . . , N } para ver que el enunciado es cierto. Lema 6.19. 72 6. CÓDIGOS DE ESTADOS FINITOS N1 < N2 tales que pN1 = pN2 . Eso signica que PN2 P 2 mi mod n, es decir, i=N1 +1 mi = 0 mod n. De aquí que N i=1 mi = i=N1 +1 mi es múltiplo de n; luego, basta tomar S = {N1 + 1, . . . , N2 } para ver que el enunciado es cierto. Si no son todos distintos, debe haber P PN1 N2 i=1 Sean n un entero positivo, G = (V, Σ, i, t) un grafo irreducible con matriz de adyacencia A, y v > 0 un (A, n)-autovector aproximado. Supongamos que algún estado K ∗ ∈ V tiene menos de n aristas saliendo de él. Entonces, existe I ∈ V y una partición de ΣI en subconjuntos no vacíos Σ1I y Σ2I tal que el grafo G0 que resulta de desdoblar I en I 1 , I 2 usando esa partición posee matriz de adyacencia A0 que admite un (A0 , n)-autovector aproximado v0 > 0 con vI0 1 + vI0 2 = vI y vJ0 = vJ para todo J ∈ V − {I 1 , I 2 }. Proposición 6.20. p = máxJ∈V vJ . Notar que debe haber algún P estado K tal que P vK < p, pues, de lo contrario, tendríamos que ∀K ∈ V, vK = p y entonces L AK ∗ L vL = p L AK ∗ L = p |ΣK ∗ |; como v es (A, n)-AA, tendríamos que p |ΣK ∗ | ≥ nvK ∗ = np, es decir, |ΣK ∗ | ≥ n, ∗ contradiciendo la hipótesis de que desde K salen menos de n aristas. 0 Elijamos entonces I , K ∈ V tales que vK < p y vI 0 = p. Como G es irreducible, hay camino 0 en G desde I hasta K . Sea I el último estado en el recorrido de ese camino tal que vI = p, y ∗ e la arista de ese camino que sale del estado I . Observar que vt(e∗ ) < p. P ≥ nvI = np (observación 6.14). Designemos m = |ΣI |. Como v es (A, n)-AA, es e∈ΣI vt(e) P ∗ Además, ∀e ∈ ΣI , vt(e) ≤ p y ∃e ∈ ΣI : vt(e∗ ) < p. Luego, e∈ΣI vt(e) < p |ΣI | = pm. De lo anterior, tenemos que m > n, es decir, hay más de n aristas saliendo de I . Enumeremos ∗ las aristas de G que salen de I como e1 , . . . , en , . . . , em con e1 = e . Aplicando el lema 6.19 a P la sucesión vt(e1 ) , . . . , vt(en ) , vemos que existe S ⊆ {1, . . . , n} tal que i∈S vt(ei ) = qn para 1 1 2 + 1 6 Σ2I algún q ∈ Z . Designemos ΣI = {ei : i ∈ S} y ΣI = ΣI − ΣI . Tendremos que ΣI 6= ∅ = 0 0 0 0 0 1 (pues |ΣI | > |ΣI |). Sea G = (V , Σ , i , t ) el grafo que resulta de hacer un desdoblamiento 1 2 0 elemental de G por el estado I usando la partición ΣI = {ΣI , ΣI }, y llamemos A a su matriz 0 de adyacencia. Denamos v mediante: q si J = I 1 0 vI − q si J = I 2 vJ = vJ si J ∈ V − {I 1 , I 2 } Demostración. Sea 0 2 0 Veamos que v así denido es positivo. Para J 6= I , vJ > 0 pues q > 0 y vJ > 0. Y para Pn P 0 ver que vI 2 > 0, notemos que nq = i=1 vt(ei ) < np, pues vt(e1 ) = vt(e∗ ) < p y e∈Σ1I vt(e) ≤ P n vt(ei ) ≤ p para i ∈ {2, . . . , n} (así que i=1 vt(ei ) < np); de allí que q < p y, en consecuencia, vI0 2 = vI − q = p − q > 0. 0 Tengamos presente que cada arista e de G que no termina en I es también arista en G y 0 cumple que vt0 (e) = vt(e) ; en tanto, cada arista e de G que termina en I (incluidos los rulos en I ) aparece desdoblada en G0 como e1 y e2 , siendo vt0 0 (e1 ) + vt0 0 (e2 ) = vI0 1 + vI0 2 = vI = vt(e) . 0 0 Resta ver que v es (A , n)-AA. Lo haremos por la segunda caracterización dada en la observación 6.14. 1 1 2 1 2 Designemos ∆ a los rulos en I , ∆ a las aristas que van de I a I y ∆ a 1 1 2 1 0 las que salen de I y no terminan ni en I ni en I (siendo ∆ ⊂ ΣI ). Se tiene que ΣI 1 1 2 1 es la unión disjunta ∆ ∪ ∆ ∪ ∆ , y además ΣI es la unión disjunta de ∆ con los rulos 1 1 1 en I que están en ΣI . Por lo dicho más arriba, por cada arista e ∈ ∆ hay una arista e2 ∈ ∆2 y viceversa; y cada pareja e1 , e2 proviene de un rulo e ∈ ΣII ∩ Σ1I . Entonces, Si X J = I 1: vt0 0 (e) = X = X e∈Σ0 1 vt0 0 (e) + e∈∆ vt0 0 (e) + e∈∆1 e∈∆ I X vt(e) + X e∈ΣII ∩Σ1I X vt0 0 (e) = e∈∆2 vt(e) = X e∈Σ1I X e∈∆ X vt(e) + e∈ΣII ∩Σ1I vt(e) = nq = nvI0 1 vt0 0 (e) + vt0 0 (e) 4. CONSTRUCCIÓN DE CÓDIGOS DE ESTADOS FINITOS J = I 2: Si P Por análisis similar al realizado en el caso anterior, resulta vt(e) , e∈Σ2I 73 y, como Σ2I = ΣI − Σ1I , P e∈Σ0 2 I vt0 0 (e) = se tiene que ! X X 0 vt(e) = e∈Σ0 2 X vt(e) = e∈ΣI −Σ1I I vt(e) − nq ≥ nvI − nq = n(vI − q) = nvI0 2 e∈ΣI J ∈ / {I 1 , I 2 }: Designemos ∆1 a las aristas que van de J a I 1 , ∆2 a las que van de J a I 2 y ∆ a las que van de J hasta un vértice distinto de I 1 y de I 2 . Se tiene que Σ0J es la unión disjunta ∆ ∪ ∆1 ∪ ∆2 . Como antes, por cada arista e1 ∈ ∆1 hay una 2 2 1 2 arista e ∈ ∆ y viceversa; y cada pareja e , e proviene de una arista e en G desde J P 0 hasta I . Procediendo de manera análoga a lo anterior, se llega a ver que e∈Σ0J vt0 (e) = P 0 e∈ΣJ vt(e) ≥ nvJ = nvJ . Si 0 Es decir, para todos los vértices de G se cumple la desigualdad requerida en la observación 0 0 0 0 6.14 en cuanto a v , A y n, resultando entonces que v es un (A , n)-AA. Sean n ∈ Z+ y G un grafo irreducible con matriz de adyacencia A. Si λA ≥ n, entonces existe una sucesión de grafos G0 , G1 , . . . , Gm tales que G0 = G, Gm tiene al menos n aristas saliendo desde cada vértice, y para cada i ∈ {1, . . . , m}, Gi resulta de un desdoblamiento elemental de Gi−1 . Teorema 6.21. v > 0 un (A, n)-AA, cuya existencia está garantizada por el teorema G0 = G. Si desde cada estado de G salen al menos de n aristas, tomamos m = 0 y el enunciado se cumple. En caso contrario, sea G1 el grafo que resulta de aplicar a G0 la (1) proposición 6.20, cuya matriz de adyacencia tendrá un autovector aproximado v > 0 cuya dimensión es una unidad mayor que la de v pero cuya suma de componentes es igual a la suma de las componentes de v. Si G1 tampoco tiene al menos n aristas saliendo desde cada vértice, le aplicamos nuevamente la proposición 6.20 para obtener un grafo G2 cuya matriz de (2) adyacencia tiene autovector aproximado v > 0 con dimensión una unidad mayor que la de (1) v y suma de coecientes igual a la suma de los coecientes de v(1) , y así sucesivamente. El (i) proceso debe terminar, pues cada v que se obtiene en cada paso es estrictamente positivo y (i−1) tiene una coordenada más que v , pero sus respectivas sumas de coecientes son iguales. Entonces, el último Gm obtenido es el buscado. Demostración. Sea 6.16. Hagamos Ahora podemos completar la demostración del Teorema de los Códigos de Estados Finitos, cuya vuelta nos estaba faltando. Demostración. (X, n)-CEF.) (Suciencia de la condición de entropía para existencia de un Supongamos que X es un shift sóco con sentación resolvente a derecha para X. Sea G0 h(X) ≥ log n, y sea (H, L) una H tal una componente irreducible de preque h (XG0 ) = h (XG ), y sea A la matriz de adyacencia de G0 . Designemos L0 a la restricción de L a las aristas de G0 . Como h(X) = log λA ≥ log n, es λA ≥ n. Aplicando entonces a G0 el teorema 6.21, obtenemos la sucesión de grafos rotulados G0 = (G0 , L0 ), . . . , Gm = (Gm , Lm ) donde G1 , . . . , Gm son los que resultan del teorema, y cada grafo rotulado Gi es el correspondiente desdoblamiento (como grafo rotulado) de Gi−1 . Sabemos que X ⊇ XG0 = XGm , y, por proposición 6.6, Gm es cerrante a derecha con demora m. Como Gm tiene al menos n aristas saliendo desde cada vértice, elegimos exactamente n aristas saliendo desde cada vértice (eliminando las otras) para obtener así un subgrafo G coloreable al que dotamos de un coloreo de rutas I . Designando por O a la restricción de Lm a las aristas de G, resulta que la terna (G, I, O) es un (X, n)-CEF, pues O∞ (XG ) = (Lm )∞ (XG ) ⊆ (Lm )∞ (XGm ) = XGm ⊆ X . X el shift sóco mostrado en la (X, 3)-CEF, y, en caso armativo, veremos Ejemplo 6.22. Sea construir un gura 7. Analizaremos si es posible la aplicación del procedimiento que está implícito en las demostraciones anteriores para obtener tal código de estados nitos. 74 6. CÓDIGOS DE ESTADOS FINITOS Figura 7. Shift sóco X para construir un (X, 3)-CEF El grafo subyacente es irreducible y su matriz de adyacencia es 2 1 1 A= 0 1 1 2 1 0 Su autovalor de Perron es h(X) = log λA ≥ log 3. (X, 3)-CEF. λA = 3, 1149 . . ., y como la presentación es resolvente a derecha, es Entonces, de acuerdo al Teorema de los Códigos de Estados Finitos, existe un Como el grafo subyacente ya es irreducible y la presentación es resolvente a derecha, el grafo rotulado de la gura 7 será nuestro G0 de arranque. Como hay estados con menos de tres aristas salientes, deberemos seguir el procedimiento dado en la demostración de la proposición 6.20. Por aplicación del algoritmo de búsqueda de autovector aproximado, llegamos a que [3, 1, 2] es un (A, 3)-AA. De acuerdo a e∗ que arranque en un estado I v= la demostración de la proposición 6.20, buscamos una vI maximal, y termine en un estado J con vJ no ∗ maximal. Hay varias opciones; elegiremos I = 1 y e la arista de 1 a 3 que tiene rótulo a. 1 ∗ De acuerdo a la demostración, elegimos ΣI conteniendo e y la arista de 1 a 2 con rótulo d, 2 y ΣI son todas las otras aristas que salen de I (los dos rulos en 1, en este caso). Notar que P e∈Σ1I vt(e) = 3, así que el q de la demostración vale, en esta etapa, 1. Luego, el autovector aproximado correspondiente al grafo desdoblado G1 tendrá coecientes 1 y 2, respectivamente, para los dos estados en que se desdoblará I ; los otros estados conservarán el valor que tienen asociado en G0 . arista con En la gura 8, mostramos la sucesión de desdoblamientos de grafos rotulados que se produce. En cada paso, mostramos dentro de un hexágono al lado de cada estado el valor del coeciente del autovector aproximado que le corresponde en esa etapa, e indicamos con I el estado por el ∗ cual se produce el desdoblamiento, con (∗) la arista e , y con línea discontinua las aristas de 1 ΣI . El proceso para en G3 , pues hemos llegado a una presentación en la que desde cada vértice salen al menos tres aristas. Elegimos entonces exactamente tres aristas saliendo de cada vértice, eliminando las otras, y coloreamos el grafo rotulado resultante con el alfabeto de entradas gura 8 muestra, en la parte inferior, uno de los posibles Usando el hecho de que de tamaño N sin solape), h X N = N h(X) (donde A = {0, 1, 2}. (X, 3)-CEF. XN es la presentación de La misma X en bloques en los ejercicios se verá cómo se puede adaptar el Teorema de los Códigos de Estados Finitos para construir códigos aún sin cumplirse de manera directa la condición h(X) ≥ log n. 4. CONSTRUCCIÓN DE CÓDIGOS DE ESTADOS FINITOS G0 G1 G2 G3 Figura 8. Cadena de desdoblamientos y un (X, 3)-CEF resultante 75