• No se han encontrado resultados

Grado en matemáticas. Curso Códigos correctores de errores. Juan Jacobo Simón Pinero

N/A
N/A
Protected

Academic year: 2021

Share "Grado en matemáticas. Curso Códigos correctores de errores. Juan Jacobo Simón Pinero"

Copied!
90
0
0

Texto completo

(1)

odigos correctores de errores

Juan Jacobo Sim´

on Pinero

(2)

´

Indice general

1. Informaci´on y c´odigos 3

1.1. La transmisi´on de la informaci´on . . . 3

1.2. Medida de la incertidumbre y de la informaci´on . . . 6

1.3. Capacidad de un canal con interferencias . . . 12

1.4. C´odigos correctores de errores . . . 17

1.5. Teorema de Shannon . . . 20

2. Generalidades sobre C´odigos 21 2.1. Conceptos b´asicos . . . 21

2.2. Equivalencia y automorfismos de c´odigos . . . 29

2.3. Construcci´on de c´odigos a partir de otros . . . 30

3. C´odigos lineales 33 3.1. Conceptos b´asicos . . . 33

3.2. C´odigos duales u ortogonales . . . 37

3.3. Pesos y distancias . . . 37

3.4. Codificaci´on y decodificaci´on . . . 40

3.5. Construcciones con c´odigos lineales . . . 44

4. Cotas a los par´ametros 47 4.1. Generalidades . . . 47

4.2. Cota de Hamming . . . 49

4.3. Cota de Singleton y c´odigos MDS . . . 49

4.4. Otras cotas . . . 50

5. Tipos especiales de c´odigos lineales 52 5.1. C´odigos de Hamming y c´odigos simplex . . . 52

5.2. C´odigos de Golay . . . 54

5.3. C´odigos de Reed-Muller (binarios) . . . 56

6. Cuerpos finitos 59 6.1. Aritm´etica de cuerpos finitos . . . 59

6.2. Polinomios y n´umeros algebraicos . . . 61

(3)

6.3. Existencia y unicidad. . . 64 6.4. Ejemplos . . . 66 6.5. El anilloFq[X]/(Xn−1) . . . 68 6.6. Automorfismos . . . 73 7. C´odigos c´ıclicos 75 7.1. Conceptos b´asicos . . . 75

7.2. C´odigos c´ıclicos y anillos de polinomios . . . 76

7.3. Ceros de un c´odigo c´ıclico y matriz de control . . . 79

7.4. Codificaci´on y decodificaci´on en c´odigos c´ıclicos . . . 81

7.5. Cota BCH y la transformada discreta de Fourier . . . 84 8. C´odigos cl´asicos que se realizan como c´odigos c´ıclicos 88

(4)

Cap´ıtulo 1

Informaci´

on y c´

odigos

1.1.

La transmisi´

on de la informaci´

on

La transmisi´on de la informaci´on digital consiste en enviar mensajes, o ca-denas de “palabras” que son, a su vez, caca-denas de elementos de un “alfabeto” o conjunto de s´ımbolos, donde incluimos tambi´en a las se˜nales de cualquier tipo. As´ı, los mensajes ser´an cadenas de s´ımbolos que separaremos en palabras (tal vez una o tal vez, muchas).

Los s´ımbolos se env´ıan a trav´es de un canal. Un canal es cualquier medio de transmisi´on, como puede ser el cable de tel´efono, la fibra ´optica, las ondas de radio, el empleado del supermercado que “teclea” en la caja el c´odigo de barras de un producto cuando ha fallado el lector, etc´etera; aunque al final siempre trabajaremos con algunas restricciones. Desde el punto de vista de la fiabilidad de la transmisi´on hay dos tipos fundamentales de canales; a saber, los canales con interferencia (o ruido) y los canales sin interferencia. Nosotros solo nos ocuparemos del estudio de los canales con interferencia o ruido, que, obviamente, es el caso donde se pueden producir errores.

En este texto, adem´as, solo nos ocuparemos de la parte cuantitativa de la transmisi´on de la informaci´on y no del significado (si analizamos el contenido de los mensajes que normalmente se transmiten en el mundo, seguro que nos desanimamos).

El siguiente cuadro refleja el proceso directo de la transmisi´on de mensajes.

Figura 1.1.1: Esquema general

emisor - canal - receptor

Codificar mensajes es reescribirlos (en el caso no trivial) en forma diferen-te, incluso usando un alfabeto distinto, pero nosotros siempre lo haremos bajo

(5)

determinadas reglas. Una de ellas es que cada palabra no pueda tener m´as de una correspondiente en el c´odigo; formalmente, la codificaci´on es una aplicaci´on. Vamos a verlo. Para cualquier alfabetoA, denotamos con P al(A) el conjunto de todas sus palabras. A lo largo de todo el curso los alfabetos ser´an siempre conjuntos finitos.

1.1.1. Definici´on. Sean A,F alfabetos y sea M ⊆ P al(A) un subconjunto

finito.

1. Una codificaci´on del alfabeto es una aplicaci´on inyectivaC:A →P al(F).

2. Una codificaci´on de palabras de M es una aplicaci´on inyectiva C : M →

P al(F).

Llamamos c´odigo a la imagen deC y se llama palabra c´odigo o simplemente palabra a cada uno de sus elementos.

1.1.2. Observaci´on. SeanA,F alfabetos y seaM ⊆P al(A) un subconjunto

finito. Supongamos que estamos transmitiendo informaci´on codificada a trav´es de un canal. El proceso de decodificaci´on lo realizaremos siempre en dos pasos; a saber:

1. Separaremos (de alguna forma) la lista de s´ımbolos en partes a las que asignaremos palabras del c´odigo.

2. A cada palabra de c´odigo le asignaremos su imagen inversa (que es ´unica) bajoC.

1.1.3. Ejemplo. Supongamos que somos un GPS para un punto que se va a mover en un tablero. Partimos de una casilla “salida” y tenemos que mostrarle la ruta a la casilla “meta”. Nuestro alfabeto y palabras ser´anA={↑,↓,←,→}=

M.

Vamos a transmitir la ruta al punto de forma codificada; es decir, definiremos una aplicaci´onC:M →P al(F), para alg´un conjuntoF. Luego se decodificar´a y

entonces el punto seguir´a la ruta que aparece en el tablero.

s

m

Elegimos una ruta que se transmitir´a completa

↓,↓,→,→,↓,→,→,↓

Ahora codificamos. Lo haremos con tres c´odigos diferentes:

Codificaci´on 1: Hacemos F = Z2, y C(↑) = 0, C(↓) = 1, C(→) =

10, C(←) = 01.

Entonces enviamos la cadena 111010110101 que se transmite sin errores y ahora se tiene que decodificar. El problema es que, quien recibe la cadena tiene

(6)

CAP´ITULO 1. INFORMACI ´ON Y C ´ODIGOS 5

m´as posibilidades de decodificar que la contemplada por nosotros. Vamos a ver dos opciones m´as:

Una es: 1 1 1 01 01 10 10 1 que se decodifica: ↓ ↓ ↓ ← ← → → ↓

Otra: 1 1 1 0 1 0 1 1 0 1 0 1 que se decodifica: ↓ ↓ ↓ ↑ ↓ ↑ ↓ ↓ ↑ ↓ ↑ ↓

Como se puede apreciar, estas decodificaciones conducen a rutas no deseadas.

Para resolver este problema agregamos un s´ımbolo, el “STOP”, digamos], como en la Clave Morse.

Codificaci´on 2:HacemosF=Z2∪{]}, yC(↑) = 0], C(↓) = 1], C(→) =

10], C(←) = 01] con tres s´ımbolos, pero si solo podemos enviar binarios podr´ıamos que hacer algo comoF=Z2, yC(↑) = 01, C(↓) = 001, C(→) =

0001, C(←) = 00001, o sea que el n´umero de cifras “0” nos indica la direcci´on de la flecha y el “1” el STOP.

Entonces enviamos

1]1]10]10]1]10]10]1]

o, en binario,

0010010001000100100010001001

Estas codificaciones no dejan lugar a dudas sobre la decodificaci´on. A este tipo de c´odigos los llamaremos c´odigos de decodificaci´on ´unica.

Hay una tercera alternativa:

Codificaci´on 3:C(↑) = 00, C(↓) = 11, C(→) = 10, C(←) = 01 Esta decodificaci´on no necesita s´ımbolo de separaci´on porque tiene una pro-piedad permanente que de antemano sabr´a siempre el decodificador: que las palabras tienen longitud fija; a saber, longitud 2. As´ı que usa dos s´ımbolos y es de decodificaci´on ´unica.

Enviamos

1111101011101011 y tiene solo una interpretaci´on, la que queremos. Tipos de c´odigos

En general, el uso de los c´odigos abarca tres grandes objetivos en la trans-misi´on de la informaci´on:

1. Comprimir mensajes.

2. Detectar y corregir posibles errores. 3. Garantizar la privacidad.

(7)

En pocas palabras, hacer la transmisi´on r´apida, fiable y segura. La teor´ıa aborda por separado cada uno de estos objetivos, porque son, de hecho, inde-pendientes. As´ı, tenemos tres tipos diferentes de c´odigos; a saber,

1. Los c´odigos compresores.

2. Los c´odigos correctores de errores. 3. Los c´odigos criptogr´aficos o secretos.

Nosotros solo nos ocuparemos de los c´odigos correctores de errores. El pro-ceso de codificar, enviar y decodificar, modifica la Figura 1.1.1 a la Figura 1.1.2.

Figura 1.1.2: Transmisi´on codificada

emisor - canal - receptor

codificador decodificador

-6

-6

1.1.4. Definici´on. Decimos que un c´odigo es de decodificaci´on ´unica si cada vez que recibimos una cadena de s´ımbolos, o mensaje, ´esta corresponde con una ´

unica lista de palabras. 1.1.5. Definici´on.

1. Decimos que una palabra tiene longitud n ∈ N si utiliza exactamente n

s´ımbolos.

2. Decimos que un c´odigo es un c´odigo en bloques (o bloqueado) si existe

n∈N, tal que toda palabra es de longitudn.

Se tiene por supuesto la definici´on, obvia, de c´odigo de longitud variable. Nosotros solo nos ocuparemos del estudio de los c´odigos en bloques. Un ejemplo t´ıpico e importante de c´odigo de longitud variable es la Clave Morse. Uno de bloques es el c´odigo de barras donde, adem´as, todo mensaje tiene exactamente una palabra.

1.1.6. Observaci´on. Es claro que todo c´odigo en bloques es de decodificaci´on ´

unica.

1.2.

Medida de la incertidumbre y de la

informaci´

on

Vamos a comentar c´omo se lleva a cabo la cuantificaci´on de la informaci´on (que se va a transmitir a trav´es de un canal). En [9] y [11] se pueden

(8)

encon-CAP´ITULO 1. INFORMACI ´ON Y C ´ODIGOS 7

trar exposiciones m´as amplias de este tema. Nosotros s´olo vamos a hacer una exposici´on breve e intuitiva, tratando de no perder por ello claridad.

El criterio para cuantificar la informaci´on ser´a “m´as informa mientras m´as sorprende” o, en t´erminos m´as cercanos a la probabilidad, “m´as informac´on tiene mientras menos probable es que ocurra”. Por ejemplo, casi nunca veremos una noticia que diga “ma˜nana por la ma˜nana saldr´a el sol”; ya sabemos que va a ocurrir ma˜nana y muchos a˜nos pues no est´a previsto a corto plazo una colisi´on o que el sol se apague. Lo que es noticia es que en un d´ıa despejado el sol se esconda; es decir, que haya un eclipse de sol.

Vamos a transmitir informaci´on usando palabras; es decir, cadenas de s´ımbo-los (y se˜nales). Cada s´ımbolo tiene una probabilidad de aparecer; as´ı que, siA

es un alfabeto, podemos establecer una distribuci´on de probabilidades sobre el suceso “que aparezcaa∈ A(en una palabra o en un mensaje)”

Una fuente de informaci´on [9] (source of transmision [11]) es una pareja (A,P) formada por un alfabetoAjunto con una distribuci´on de probabilidades

P; es decir,P

a∈Ap(a) = 1. Se puede extender la fuente original; por ejemplo, si

A={a1, a2}(que normalmente denotamos conA={0,1}), podemos extenderla

a An, de la forma obvia. Entonces, volvemos a calcular la probabilidad. Por

ejemplo, si los sucesos son independientes entonces parav∈ An, se tienep(v) =

Qn

i=1p(v(i)) y as´ı seguimos con las palabras, etc´etera.

Cuando no se preste a confusi´on, escribiremosA= (A,P).

Lo anterior puede replantearse en t´erminos puramente probabil´ısticos y de-finir una fuente de informaci´on como una variable aleatoria sobre el espacio de sucesos de las palabras o los s´ımbolos.

1.2.1. Ejemplo. Vamos a construir una fuente para enviar palabras en binario, simplificando el c´odigo ASCII.

Supongamos que tenemos un canal binario para enviar mensajes de palabras en castellano. Podemos usar, por ejemplo, elC´odigo ASCII extendido(American Standard Code for Information Interchange).

Es una codificaci´on num´erica de la que escribimos su versi´on binaria, de 28 = 256 s´ımbolos (letras, n´umeros, etc.) pensado sobre todo para transmitir

textos en ingl´es. Cada s´ımbolo tiene asociada una cadena 8 d´ıgitos binarios. El c´odigo ASCII tiene dos tipos de caracteres, los imprimibles y los de con-trol. La tabla del c´odigo es muy larga y no podemos reproducirla completa aqu´ı. Lo que haremos es crear nuestra propia tabla s´olo para las letras del castellano y algunos s´ımbolos, como los par´entesis y el nuevo p´arrafo.

(9)

Imitaci´

on del c´

odigo ASCII

S´ımbolo Decimal Binario

t 00 00000 ( 01 00001 ) 02 00010 (salto) 03 00011 . 04 00100 A 05 00101 B 06 00110 C 07 00111 D 08 01000 E 09 01001 F 10 01010 G 11 01011 H 12 01100 I 13 01101 J 14 01110 K 15 01111

S´ımbolo Decimal Binario

L 16 10000 M 17 10001 N 18 10010 ˜ N 19 10011 O 20 10100 P 21 10101 Q 22 10110 R 23 10111 S 24 11000 T 25 11001 U 26 11010 V 27 11011 W 28 11100 X 29 11101 Y 30 11110 Z 31 11111

Ahora vamos a calcular la distribuci´on de la fuente paraA={0,1}. Si fu´esemos a usar estas letras para enviar mensajes en cualquier lengua, debemos obtener la distribuci´on de la fuente simplemente contando las frecuen-cias; es decir, asumiendo que las letras est´an distribuidas uniformemente. Es obvio que vuleve a salir equiprobable; es decirp(0) =p(1) = 12.

Ahora vamos a suponer que s´olo nos interesa enviar palabras en castellano. Entonces es conveniente tomar en cuenta la distribuci´on de las letras y dem´as caracteres del castellano, que aparecen a continuaci´on.

Distribuci´

on de las letras del castellano y el espacio

S´ım-bolo Proba-bilidad E 0,1460 t 0,1140 A 0,1041 O 0,0756 L 0,0729 S 0,0685 N 0,0610 D 0,0598 R 0,0430 U 0,0418 I 0,0361 S´ım-bolo Proba-bilidad T 0,0288 C 0,0254 P 0,0240 M 0,0185 Y 0,0134 Q 0,0133 . 0,0097 B 0,0080 H 0,0078 G 0,0064 F 0,0045 S´ım-bolo Proba-bilidad V 0,0034 0,0029 J 0,0027 ˜ N 0,0026 ( 0,0019 ) 0,0019 Z 0,0013 X 0,0005 K <0,0001 W <0,0001

(10)

CAP´ITULO 1. INFORMACI ´ON Y C ´ODIGOS 9

Esta tabla ya es una fuente, pues tiene sus s´ımbolos y su distribuci´on. No-sotros queremos una fuente EN BINARIO y que considere la aparici´on de 0 y 1 como sucesos independientes. Vamos a calcular la distribuci´on de la fuente para

A ={0,1} tomando la tabla de imitaci´on del c´odigo ASCII y la distribuci´on anterior.

Las cuentas para la nueva distribuci´on las haremos simplemente calculando las probabilidades del 0 y 1, de la forma habitual, por ejemplo,

p(0) = X

s´ımbolos

p(s´ımbolo)·p(0|s´ımbolo)

y lo mismo conp(1). As´ı obtenemos

Distribuci´on con la tabla binaria y las letras del castellano.

S´ımbolo Probabilidad 0 0,6137 1 0,3863 Un ejemplo m´as manejable es el siguiente.

1.2.2. Ejemplo. Supongamos que en la situaci´on del GPS (1.1.3), conocemos una distribuci´on.

S´ımbolo Probabilidad Codificaci´on

↑ 1/2 00

↓ 1/4 11

→ 1/16 10

← 3/16 01

Igual que antes, calculamos la nueva distribuci´on binaria. Distribuci´on con la tabla binaria y el GPS.

S´ımbolo Probabilidad

0 5/8

1 3/8

Medida de informaci´

on

En vista de lo anterior, queremos determinar la cantidad de informaci´on o grado de incertidumbre para un s´ımbolo o una palabra; o m´as bien, el suceso de que aparezca.

Supongamos que tomamos una muestra de una fuente de informaci´on (A,P); es decir, elegimos aleatoriamente un elemento de la fuente de acuerdo con la

(11)

distribuci´on de probabilidades que tiene. Entonces, ANTES de que el mues-treo tenga lugar existe una cantidad de INCERTIDUMBRE asociada con la aparici´on y, DESPU ´ES de recoger la muestra, hemos ganado cierta cantidad de INFORMACI ´ON. As´ı, aunque ambos conceptos tendr´an asociada la misma cantidad, que denotaremos conI(a)1, paraa∈ A, el grado de incertidumbre es un conceptoa priori mientras que la cantidad de informaci´on es un conceptoa posteriori.

Ahora queremos un modelo para calcular la cantidad de informaci´on. Lo haremos en dos pasos.

1. Como hemos visto, el concepto de cantidad de informaci´on est´a asociado con la probabilidad de tal forma que queremos que haya m´as informaci´on cuanto menos probable sea el suceso. En t´erminos de matem´aticas, que-remos una proporci´on inversa. As´ı que buscamos una funci´on de la forma

f(1/p), donde f ser´ıa una funci´on creciente (por lo pronto la identidad sirve, pero todav´ıa no terminamos con las exigencias).

2. Consideremos el caso en que los sucesos son independientes (el caso m´as simple). Nos interesa quela cantidad se comporte como tal, es decir que la cantidad de informaci´on asociada a la intersecci´on de sucesos sea la suma de sus cantidades. Como bien sabemos, la probabilidad de que ocurran dos o m´as sucesos, digamos p(a) = p y p(b) = q, es el producto de sus probabilidades; esto es pq; as´ı que necesitamos que cumpla la siguiente propiedad f 1 pq =f 1 p +f 1 q

De toda la vida conocemos el siguiente resultado. 1.2.3. Teorema. Seaf : (0,1]→Runa funci´on tal que:

1. f es decreciente y

2. f(xy) =f(x) +f(y)para todox, y∈(0,1].

Entonces existe una constantek <0 tal quef(x) =kln(x).

Demostraci´on. Por usar un libro de c´odigos, v´ease [6, Proposici´on 2.2.2], o cual-quier libro de c´alculo.

Esto nos lleva a la siguiente definici´on.

1.2.4. Definici´on. Sea (A,P) una fuente de informaci´on. El grado de incer-tidumbre o la cantidad de informaci´on (binaria) asociado al s´ımbolo a∈ A (al suceso de que ´este aparezca) est´a dado por

I(a) = log2

1

p(a)

siempre quep(a)6= 0. En el casop(a) = 0, diremos que no podemos determinar la informaci´on.

(12)

CAP´ITULO 1. INFORMACI ´ON Y C ´ODIGOS 11

En principio, la elecci´on del logaritmo en base 2 es arbitraria y se puede definir informaci´onn-aria. En base 2, la unidad queda establecida en un canal binario equiprobable.

Sea (A,P) una fuente de informaci´on donde A = {a, b} (puedes sustituir por 0 y 1 si quieres) yP =p= 12, q=12 . En este caso, es trivial queI(a) =

I(b) = 1; pues log21p= log2

1 (1 2) = log2(2) = 1. As´ı que

1.2.5. Definici´on. Un bit es la cantidad de informaci´on (binaria) que tiene un elemento de una fuente binaria y equiprobable.

N´otese que en una fuente equiprobable con tres elementos, la cantidad de informaci´on (binaria) que tiene cada s´ımbolo es MAYOR que un bit.

1.2.6. Ejemplos.

1. En la situaci´on de (1.2.1), podemos calcular algunas cantidades de infor-maci´on usando la fuente de las letras del castellano yu su paso a binario.

I(E) = 2,7760 bits.

I(I) = 5,1178 bits.

I(Z) = 9,5872 bits.

Adem´as, en la tabla de la distribuci´on binaria, I(0) = 0,7744 e I(1) = 1,3722.

2. En la situaci´on de la distribuci´on del GPS (1.2.2) se tiene: a) I(↑) = 1.

b) I(↓) = 2. c) I(→) = 4.

d) I(←) = 4−log2(3).

3. Ahora vamos a ver un caso trivial, que a veces ilustran. Sea (A,P) una fuente de informaci´on dondeA={a}, s´olo tiene un s´ımbolo. En este caso, trivialmente, I(a) = 0 y esto nos corrobora algo obvio. Si s´olo hay un s´ımbolo, no hay informaci´on.

Entrop´ıa

Seg´un el diccionario de la RAE, entrop´ıa tiene dos usos. El primero en f´ısica: medida del desorden de un sistema. El segundo en teor´ıa de la informaci´on: medida de incertidumbre (y en consecuencia, de informaci´on).

Formalmente, laentrop´ıa (binaria) de una fuente de informaci´on, digamos (A,P), es el promedio ponderado de la cantidad de informaci´on (cuando est´e de-finida, claro) de los s´ımbolos deA; es decir,

H(A,P) =X a∈A p(a)I(a) =X a∈A p(a) log2 1 p(a) ( bits ).

(13)

A efectos de c´alculo, usaremos la convenci´on de que si p(a) = 0 entonces

p(a)I(a) = 0 =p(a) log2p(1a)ya que 0 = l´ımx→0xlog2 1

x

. 1.2.7. Ejemplos.

1. En la situaci´on del castellano (1.2.1) se tiene que entrop´ıa del alfabeto y los s´ımbolos es 4,0665, mientras que la del binario es 0,9624.

2. En la situaci´on del GPS (1.2.2) se tiene que la entrop´ıa de las flechas es 2−3 log2(3)/16, mientras que la del binario correspondiente es 3−

(5 log2(5) + 3 log2(3))/8. La siguiente propiedad es crucial

1.2.8. Teorema. Sea(A,P)una fuente de informaci´on. Entonces0≤H(A,P)≤

log2(|A|).

A´un m´as,

1. H(A,P) = 0 si existep(a) = 1con a∈ Ay

2. H(A,P) = log2(|A|) si la distribuci´on es equiprobable.

Como caso particular, muy importante, tenemos la fuente A = {0,1} con distribuci´onP ={p,1−p}. En este caso

H(A,P) =plog2(1

p) + (1−p) log2(

1 1−p).

A´un m´as, se puede probar que H(An,P0) = nH(A,P). En [11] y [9] se

tienen cap´ıtulos completos dedicados a propiedades de la funci´on de entrop´ıa. La naturaleza de los s´ımbolos suele ser sustituida por la probabilidad de que aparezcan; por eso, cuando se es m´as formal, las funciones de entrop´ıa s´olo tienen como argumento la distribuci´on de probabilidades, como la binaria, H2(p) =

H2(p,1−p). De hecho, la entrop´ıa es un concepto puramente probabil´ıstico.

1.3.

Capacidad de un canal con interferencias

Sea (A,P) una fuente de informaci´on que se va a enviar a trav´es un canal, y seaSel conjunto de s´ımbolos de salida. Vamos a suponer que el canal es discreto y sin memoria; es decir, suponemos que los conjuntos de s´ımbolos Ay S son finitos y que la transmisi´on de un s´ımbolo no est´a influida por la transmisi´on anterior.

Entendemos por “enviar informaci´on por un canal”, como transmisiones completas; es decir, el env´ıo de un s´ımbolo del alfabeto de entrada implica la recepci´on (completa) de un s´ımbolo del de salida. Formalmente:

1.3.1. Definici´on.

Un canal discreto consiste en un alfabeto de entrada A, un alfabeto de salida S, ambos finitos, junto con una distribuci´on de probabilidades con-dicionadas{p(s|a) | (a, s)∈ A × S}.

(14)

CAP´ITULO 1. INFORMACI ´ON Y C ´ODIGOS 13

Le llamaremos adem´as sin memoria cuando se verifique que, sia=a1· · ·an

y s =s1· · ·sn son palabras de los alfabetos A y S, respectivamente,

en-toncesp(s|a) =Qn

i=1p(si|ai).

Transmitir un s´ımbolo (de entrada) a trav´es del canal significa asociar a dicho s´ımbolo, aleatoriamente, un s´ımbolo de salida seg´un la distribuci´on condicionada anterior.

Por su definici´on, todo canal discreto, una vez ordenados los s´ımbolos del alfabeto, tiene asociada una matriz cuyas entradas son las probabilidades con-dicionadas. Llamaremosmatriz del canal (seg´un cierto orden)a dicha matriz.

Al enviar informaci´on por un canal con interferencias ocurrir´a que entrar´a un s´ımboloa∈ A (o una palabra) y puede llegar al receptor uno (y s´olo uno) de los tres casos:

1. El s´ımbolo de salida deseado (por ejemplo el propioa) (acierto) 2. Un s´ımbolo no deseado (error)

3. Un s´ımbolo imposible de interpretar (borr´on o borradura,erasure). El hecho de que exista un s´ımbolo de salida deseado nos llevar´a finalmente a la idea de p´erdida de informaci´on (por falta de fiabilidad). Intuitivamente, po-demos darnos una idea de fiabilidad por medio de la probabilidad condicionada. La existencia de probabilidad condicionada implica que se genere informaci´on, cuya media ponderada, como siempre, ser´a llamada entrop´ıa condicionada y que veremos a continuaci´on.

Entrop´ıa condicionada y conjunta

Emitir un s´ımboloa∈ Ade la fuente de entrada y recibir un s´ımbolos∈ S

de salida tiene asociadas entonces las siguientes probabilidades:

1. La probabilidad, p(a), de que se env´ıe a ∈ A, con lo que hacemos una fuente (A,P) (ya conocemos la entrop´ıa asociada,H(A,P)).

2. La probabilidad condicionadap(s|a), cona∈ Ays∈ Sy al conocer ahora

p(a), obtenemos la otra probabilidad condicionadap(a|s), que interpreta-remos como “la probabilidad de que habiendo recibido s ∈ S se hubiese enviadoa∈ A”.

3. La probabilidad p(s) = P

a∈Ap(a)p(s|a) de que se reciba s ∈ S (luego

tambi´en podremos calcular su entrop´ıa).

4. Por ´ultimo, la probabilidad de que se emitaa, y se recibas, que denotamos

p(a∩s).

1.3.2. Observaci´on. Es sabido que, por definici´on, p(a∩s) = p(a)p(s|a) =

(15)

La situaci´on anterior determina tres informaciones nuevas a partir de las cuales se puede calcular entrop´ıa. Como la relaci´on entre informaci´on y entrop´ıa es muy clara y sencilla, vamos directamente a centrarnos en las tres nuevas entrop´ıas.

Primera. El suceso “se recibe (o asocia) s ∈ S a alg´un s´ımbolo de en-trada” determina una nueva fuente de informaci´on para los s´ımbolo de S, que denotamos (S,Q). As´ı, obtenemos una entrop´ıa que llamaremosH(S,Q).

La segunda es entrop´ıa propia de la transmisi´on a trav´es del canal o en-trop´ıa de lainformaci´on condicionada; es decir, la incertidumbre sobre el origen de cada s´ımbolos∈ S recibido o la incertidumbre sobre el s´ımbolo que se reci-bir´a al enviar una∈ A, que ya sabemos que coinciden.

1.3.3. Definici´on. Sean A= (A,P)y S = (S,Q)fuentes de informaci´on (o dos variables aleatorias).

1. La entrop´ıa condicionada para un elementos∈ S es la media

H(A|s) =X a∈A p(a|s) log2 1 p(a|s) .

2. La entrop´ıa condicionada es entonces

H(A|S) =X

s∈S

p(s)H(A|s).

An´alogamente se definen H(S|a)y H(S|A).

En t´erminos de la transmisi´on podemos decir en palabras, que la entrop´ıa condicionada mide la incertidumbre sobreA, una vez que se conoceS.

La terceraes la entrop´ıa conjunta, que proviene de la probabilidad conjunta

p(a∩s), que denotamos H(A,S) cuando las distribuciones est´en fijadas. La definici´on es obvia pero la escribimos.

1.3.4. Definici´on. SeanA= (A,P)y S = (S,Q) fuentes de informaci´on. La entrop´ıa conjunta es la media ponderada de la informaci´on conjunta; es decir,

H(A,S) = X a∈A,s∈S p(a∩s) log2 1 p(a∩s) .

Las siguientes propiedades son f´aciles de verificar y aparecen, por ejemplo, en [11, Cap´ıtulos 1 y 3]

1.3.5. Teorema. Sean A = (A,P) y S = (S,Q) fuentes de informaci´on (o m´as en general, variables aleatorias). Entonces:

1. H(A,S)≤H(A) +H(S) y la igualdad ocurre si y s´olo si las variables son independientes.

(16)

CAP´ITULO 1. INFORMACI ´ON Y C ´ODIGOS 15

3. H(A|S)≤H(A).

Ahora tenemos que llevar los conceptos anteriores a la situaci´on en que la probabilidad conjunta es la incertidumbre sobre el or´ıgen de un s´ımbolo, lo cual interpretaremos como p´erdida de la informaci´on.

Informaci´

on mutua y capacidad

Imaginemos que tomamos la muestraa∈ A y enviamos el s´ımbolo a trav´es del canal. Ahora el receptor tiene un s´ımbolo s ∈ S. Si el suceso de recibir s

implica que fue enviadoaentonces el emisor y el receptor tienen la misma infor-maci´on. Si el receptor no est´a seguro de que el s´ımbolo enviado fueaentonces el emisor (que tiene el s´ımbolo) tiene m´as informaci´onoriginalque el receptor. As´ı, podemos interpretar la entrop´ıa condicionada como “la informaci´on que se va a perder (por un problama de fiabilidad)” sobreAo como “puedes equivocarte” en la elecci´on del origen de un s´ımbolo y por tanto fallar en el conocimiento de la informaci´on original.

Probabil´ısticamente, la informaci´on mutua de dos fuentes de informaci´on,A

yS, esla cantidad de informaci´on que tieneAmenos la cantidad de informaci´on que queda deA una vez que se conoce S.Es decir, la cantidad de informaci´on sobreAen virtud del conocimiento deS.

1.3.6. Definici´on. Sean A= (A,P) y S = (S,Q) fuentes de informaci´on de un canal discreto y sin memoria. La informaci´on mutua entre las fuentes es

I(A,S) =H(A)−H(A|S) =H(S)−H(S|A)

Vamos a ver un par de ejemplos extremos que ilustren nustra interpretaci´on. 1.3.7. Ejemplos.

1. Supongamos que A,S son fuentes de informaci´on equiprobables de un canal donde la distribuci´on conjunta tambi´en es equiprobable (y por tanto independiente). Por (1.2.8) y (1.3.5) se tiene que H(A|S) = H(A) que nos indica queuna vez que conocesS tienes la misma incertidumbre sobre

A y por tanto la informaci´on mutua es I(A,S) = 0 (perdimos toda la informaci´on al transmitir).

2. El otro extremo. Supongamos que A = S y para todo a ∈ A se tiene que p(a|a) = 1, as´ı que p(a|s) = 0 si a 6= s. En este caso, la entrop´ıa condicionada vale H(A|S) = 0 y nos indica que una vez que recibimos, digamos a = s, ya no hay incertidumbre sobre el origen, seguro que el origen fue a y la informaci´on mutua es I(A,S) = H(A) (conservamos toda la informaci´on al transmitir).

Desde el punto de vista de la correcci´on de errores de transmisi´on, donde dado un s´ımboloa∈ Atenemos un “favorito” s∈ S, la informaci´on mutua da una medida de lafiabilidad de una transmisi´on.

Ahora vamos a definir la capacidad de un canal. Consideremos un canal con s´ımbolos de entradaAy de salidaS y todas las posibles fuentes AP = (A,P).

(17)

Cada fuente determina otraSP = (S,QP) y con ellas se tiene una informaci´on

mutua, que denotamosI(AP,SP).

1.3.8. Definici´on. La capacidad de un canal es el valor m´aximo de las infor-maciones mutuas; es decir,

C(A) = m´ax{I(AP,S) | P es una distribuci´on}

Desde el punto de vista de la transmisi´on, donde tenemos “favoritos” la capacidad de un canal ser´a su fiabilidad.

1.3.9. Ejemplo. Canales sim´etricos

Un canal decimos que es sim´etrico (por filas y columnas) si al formar la matriz del canal, los conjuntos de valores de las entradas de todas las filas son iguales y lo mismo ocurre con las columnas; es decir que, salvo el orden, todas las filas tienen las mismas entradas y lo mismo ocurre con las columnas.

En este caso, se puede probar que la capacidad del canal se alcanza con la distribuci´on equiprobable enAy es log2(|A|)−H(S|a) donde el sustraendo es constante para todoa∈ Ayp(a) = |A|1 .

Como caso particular, vamos a calcular la capacidad del canal sim´etrico binario. Aqu´ı se sigue el esquema

0 1−p -H H H H H H H H j p 0 1 1−p * p 1

dondep≤1/2. (Si fuesep≥1/2, hacemos que al recibir se cambie el d´ıgito.) La distribuci´on condicionada se refleja en la matriz

(pij) =

1−p p p 1−p

que llamaremos la matriz del canal.

Entonces, como el m´aximo se alcanza cuando la fuente es equiprobable, tomamosA={0,1}=S,P ={1/2,1/2}. Luego, H(A) = 1 2log2 1 2 +1 2log2 1 2 = 1 H(A|A) = 2 X i=1 1 2· 2 X j=1 pijlog2 1 pij = = −(1−p) log2(1−p)−plog2(p) y por tanto

(18)

CAP´ITULO 1. INFORMACI ´ON Y C ´ODIGOS 17

1.4.

odigos correctores de errores

Vamos a establecer el contexto que ser´a nuestra hip´otesis de trabajo. Te-nemos un canal discreto y sin memoria, digamos C y un conjunto (finito) de s´ımbolos de entrada al canal (el alfabeto),A, junto con una distribuci´on de pro-babilidades; la de que aparezcan al enviar mensajes. A la pareja del alfabeto y la distribuci´on de probabilidades se le llama una fuente de entrada. Por su par-te, tenemos tambi´en un conjunto de s´ımbolos de salida,Fcon una distribuci´on dada porp(F=v) =P

Ap(v|a)p(a=A), en la notaci´on habitual del c´alculo de

probabilidades.

Para cada entrada a ∈ A hemos elegido un ´unico s´ımbolo sa ∈ F, que

llamaremos el s´ımbolo correspondiente o deseado para a. Diremos que se ha producido un error de transmisi´on cuando habiendo enviado el s´ımbolo a, el s´ımbolo recibido no seasa. Supondremos que la correspondencia es biyectiva.

Vamos a hacer algunos c´alculos suponiendo que la correspondencia naterior es biyectiva.

1. La probabilidad de cometer un error habiendo enviado el s´ımboloa∈ A

a trav´es de C, es

pe,C(a) =

X

s∈S

p(s6=sa|a) = 1−p(sa|a). (1.4.1)

2. Entonces, la probabilidad de que se cometa un error al enviar alg´un sim-bolo es la media ponderada

Pe,C = X a∈A p(a)pe,C(a) = X a∈A p(a) (1−p(sa|a)) = X a∈A p(a)−X a∈A p(a∩sa) = 1− X a∈A p(a∩sa) = 1−X a∈A p(a|sa)p(sa).

De la lista de igualdades anteriores uno usa la que convenga.

1.4.1. Ejemplo. Supongamos que tenemos un cuerpo finito Fcomo conjunto de s´ımbolos de entrada y salida, con distribuciones equiprobables en un canal

C. Sip(x|x) = 1−pentonces peC(x) =pyPe,C=p.

Correcci´on de errores de transmisi´on. Esquemas y errores de decisi´on El objetivo de los c´odigos correctores de errores es a˜nadir informaci´on (re-dundancia) al mensaje para poder recuperarlo a´un cuando se hayan producido (no muchos) errores durante la transmisi´on. Como veremos, la clave est´a en la manera como agregamos la informaci´on; es decir, c´omo codificamos y tambi´en c´omo descodificamos. Es ah´ı donde interviene la matem´atica.

(19)

Figura 1.4.1: Correcci´on de errores emisor canal con interferencia receptor codificador decodificador -6 -6 correcci´on de errores 6

En la pr´actica, para trabajar con c´odigos en bloques podemos sustituir, respetando la distribuci´on de probabilidades, los s´ımbolos de entrada y salida por un cuerpo finito F al que seguiremos llamando alfabeto. Haremos M =

P alk(A) =Fk y la codificaci´on ser´a una aplicaci´onC :Fk →Fn y as´ı, nuestro

c´odigo en bloques ser´a ImC=C⊆Fn.

ConsideremosFn, el conjunto de las palabras de longitudn. Unesquema de

decisi´on es una funci´on parcial de Fn a las palabras del c´odigo; es decir, una

relaci´on donde no todo elemento del dominio tiene imagen (aquellas palabras, que no sepamos c´omo corregir, no tendr´an imagen). Para cadac∈C, definimos

Bc={v∈Fn | f(v) =c}. (1.4.2)

Comof es aplicaci´on parcial entonces los{Bc}c∈Cson disjuntos aunque tal vez

no sean una partici´on deFn.

Consid´erese, pues, un esquema de decisi´on f : Fn −−−−−−→parcial C. Para una

palabra s ∈ Fn, si f(s) est´a definido, entonces el esquema “decide” que la

palabra enviada fue f(s). Si f(s) no fue la palabra enviada decimos hemos cometido unerror de decisi´on.

A continuaci´on, vemos un gr´afico del proceso completo, donde denotamos

Fn C Fn la transmisi´on a trav´es del canalC. Fk−−−−−−−−→codificaci´on C⊆Fn C Fn

esquema

−−−−−−→C−−−−−−−−−−→decodificaci´on Fk

1.4.2. Observaci´on. Ya cuando estemos concentrados en los c´odigos, a estos errores los llamaremos errores de decodificaci´on. La raz´on es que se considera la decisi´on o correcci´on como parte de la decodificaci´on.

Vamos a calcular la probabilidad de cometer un error de decisi´on al “corre-gir” errores. Una vez fijado un c´odigo,C, tendremos que calcular la probabilidad

(20)

CAP´ITULO 1. INFORMACI ´ON Y C ´ODIGOS 19

de que una palabrac∈Csea enviada, y esto necesariamente determina una dis-tribuci´on de la fuente. N´otese que esto no influye en la probabilidad de cometer un error una vez que se tome una palabra, pues viene dado por la Igualdad 1.4.1. Por su parte, para cada vectorv ∈Fn tendremos que calcular la probabilidad

de que aparezca en una decodificaci´on. Se calcula comop(v) =P

c∈Cp(v|c)p(c).

Como el canal es sin memoria se tiene que, sic=c1. . . cn yv=v1. . . vn

enton-cesp(v|c) =Qn

i=1p(vi|ci), dondep(vi|ci) es la probabilidad condicionada de las

fuentes de entrada y salida de la Igualdad 1.4.1.

Por definici´on, decimos que hemos cometido un error de decisi´on cuando habiendo enviado la palabrac∈Crecibimos la palabrav6∈Bc; luego la

proba-bilidad condicionada que elegimos usar esp(v|c), y la calcularemos de diversas maneras. As´ı, para una palabrac∈C enviada, la probabilidad es

pe(c) = X v6∈Bc p(v|c) = 1− X b∈Bc p(b|c) !

y la probabilidad total de error de decisi´on es, en vista de que P

c∈Cp(c) = 1 Pe(C) = X c∈C p(c)pe(c) = X c∈C p(c)   X v6∈Bc p(v|c)   = 1−X c∈C X b∈Bc p(c)p(b|c) = 1− X v∈Fn p(v∩f(v))

ya que, sib ∈Bc entonces c =f(b) y as´ıp(c)p(b|c) =p(b∩f(b)). La suma se

completa a todov∈Fn asumiendo que siv6∈ ∪

c∈CBc entoncesp(v∩f(v)) = 0,

dado quef(v) no existe.

Para eliminar la suma doble quitamos la dependencia de que aparezca cada palabra y tomamos el error m´aximo; es decir, definimos

Pemax(C) = m´ax{pe(c) | c∈C}.

Claramente,

Pe(C)≤Pemax(C)

Entonces, para poder calcular la probabilidad total de error de decisi´on ne-cesitamos tres ingredientes: el primero es la distribuci´on{p(c) | c∈C}, el se-gundo es la distribuci´on{p(v|c) | (c, v)∈C×Fn}y el otro es la familia{Bc}.

1.4.3. Ejemplos. Vamos a ver algunos esquemas de decisi´on. Transmitimos en un canal discreto y sin memoria con s´ımbolos de entrada y salida F. Sea C ⊂ Fn un c´odigo con |C| =M. Consid´erense los siguientes esquemas de decisi´on

f :Fn−−−−−−→parcial C,

1. Supongamos que para cadac ∈C yv ∈Fn conocemosp(c|v). Con estos

datos definimos p(C|v) = {p(c|v) | c∈C} y podemos definir f(v) ∈C

como el vector tal que p(f(v)|v) = m´axp(C|v). Este esquema se conoce comoerror m´ınimo en la decodificaci´on de probabilidad a posterioriy tiene la propiedad de que minimiza el error de decisi´on medio.

(21)

2. Un esquema alternativo es considerar la otra probabilidad condicionada. En este caso, para cada v ∈Fn, definimos p(v|C) = {p(v|c) | c∈C} y

f(v) como el vector tal que p(v|f(v)) = m´axp(v|C). Este esquema se conoce comom´axima verosimilitud en la decodificaci´on de probabilidad a posteriori.

1.5.

Teorema de Shannon

Como hemos visto en la secci´on anterior, codificar implica, entre otras cosas, sumergir un c´odigoC en un conjunto “ambiente”Fn, tal que la longitud de sus

palabras, digamosn, sea mayor o igual que la longitud original de las palabras, digamosk.

En esta situaci´on, es claro que el canal tiene que transmitirn s´ımbolos del c´odigo para que podamos conocerks´ımbolos de la fuente; es decir, tenemos una tasa deR=k/n-s´ımbolos de la fuente por cada s´ımbolo del c´odigo ya que, con-forme a la definici´on usual de tasa, es el cociente del n´umero de s´ımbolos v´alidos que vamos a producir sobre el total de s´ımbolos que tenemos que transmitir.

N´otese quek= log|A|(|C|). As´ı llegamos al concepto de tasa de transmisi´on. 1.5.1. Definici´on. La tasa de trasmisi´on de un c´odigo C ⊆ An es el cociente

del n´umero de s´ımbolos que originalmente tiene una palabra sobre el n´umero necesario de s´ımbolos para transmitirla usando dicho c´odigo.

R(C) =log|A|(|C|)

n

Como veremos, el teorema de Shannon nos dice que mientras mantengamos la tasa de transmisi´on por debajo de la capacidad del canal, podemos compensar la p´erdida de informaci´on que se produce en el canal al grado de precisi´on que deseemos.

1.5.2. Teorema [Shannon]. Sea C un canal discreto y sin memoria, con ca-pacidadC(C) =C. Entonces, para cualquier n´umero R <C existe una sucesi´on

Cn de c´odigosq-arios, junto con sus esquemas de decisi´onfn, que cumplen:

1. Cn es un c´odigo de longitudn, y |Cn|=dqRneelementos; es decir, tiene

tasa al menosR.

2. La probabilidad de error m´axima de los esquemasfn tiende a0 cuandon

tiene a infinito; es decir,

l´ım

n→∞P

max

e (Cn) = 0.

(22)

Cap´ıtulo 2

Generalidades sobre

odigos

2.1.

Conceptos b´

asicos

Una vez que hemos fijado la intenci´on y el contexto del estudio de los c´odigos correctores de errores, vamos tambi´en a fijar un poco la notaci´on.

2.1.1. Definici´on. Sea Aun alfabeto (finito), con|A|=q, y consid´erese An,

como siempre. Llamamos c´odigo q-ario en bloques de longitud n a cualquier subconjunto no vac´ıo deAn. Al propio An lo llamamos el conjunto ambiente.

SeaM =|C|. Decimos queCtiene par´ametros(n, M), o queCes un(n, M )-c´odigo sobreA.

A los elementos deC les llamaramos palabras del c´odigo.

2.1.2. Notaci´on. A los largo de todo el texto, nuestros alfabetos ser´an siempre cuerpos finitos que denotaremos F o Fq, para q = pr, con p, r ∈ N y p primo

(cuando queramos hacer ´enfasis en el cardinal) y entenderemos por c´odigo un c´odigo corrector de errores definido en bloques. El conjunto ambiente ser´aFn,

a quien llamaremos el espacio ambiente.

2.1.3. Ejemplo. [C´odigos de repetici´on] Consideremos aF2y supongamos que

solo queremos enviar los mensajes “s´ı” y “no”. Vamos a suponer tambi´en que de alguna manera sabemos que el canal comete a lo m´as dos errores cada 5 emisiones. Usamos entonces 5 d´ıgitos como sigue.

s´ı7→00000. no7→11111.

El c´odigo es entoncesC={00000,11111}.

Para crear este c´odigo hemos hecho posiblemente lo m´as antiguo que se hace para eliminar errores, REPETIR la palabra (5 veces). Este tipo de c´odigos se llamanc´odigos de repetici´on.

(23)

Distancia m´ınima y correcci´

on

Vamos a abordar un nuevo esquema de decisi´on que tambi´en ser´a del tipo de m´axima verisimilitud. Esta noci´on corresponde a la idea “m´as cerca mientras menos errores se hayan cometido”, sin importar cu´ales fueron los d´ıgitos que se cambiaron.

Vamos a formalizar un poco a este esquema de decisi´on porque es el ´unico que usaremos en el curso.

2.1.4. Definici´on. Sea Fun cuerpo.

La distancia de Hamming entre dos vectoresu, v∈Fn es el n´umero natural:

d(u, v) =|{ı∈ {1, . . . , n} | u(ı)6=v(ı)}|.

La distancia m´ınima de un c´odigo,C⊆Fn es

d(C) = m´ın{d(u, v) | u, v ∈C}.

La siguiente definici´on es una variante ´util en algunos c´alculos, pero sobre todo lo ser´a cuando los c´odigos sean espacios vectoriales.

2.1.5. Definici´on. SeaF un cuerpo. Para un vector u∈Fn definimos el peso

deucomo

ω(u) =|supp(u)|=d(0, u).

2.1.6. Proposici´on. SeaCun c´odigo sobre un alfabetoF. Entonces la distancia

de Hamming cumple los axiomas de m´etrica; a saber, 1. d(u, v) = 0si y solo siu=v.

2. d(u, v) =d(v, u).

3. d(v, u)≤d(u, z) +d(z, v).

2.1.7. Observaci´on. Es f´acil comprobar las siguientes afirmaciones sobre la distancia y el peso. Seanu, v∈Fn.

1. d(u, v) =ω(u−v). 2. ω(v) +ω(u+v)≥ω(u).

3. SiF=F2; o sea, el caso binario,d(u, v) =ω(u) +ω(v)−2ω(u ? v), donde

“?” es el producto coordenada a coordenada.

4. En el caso no binario, hay contraejemplos al apartado anterior.

2.1.8. Ejemplo. El ISBN (International Standard Book Number) es un c´odigo de 11 s´ımbolos; a saber,{0,1, . . . ,9, X}, y palabras de longitud 10 divididas en 4 grupos de datos, que describimos a continuaci´on.

Todos los s´ımbolos, salvo posiblemente el ´ultimo, son num´ericos.

El primer grupo tiene un d´ıgito e indica el idioma en que est´a escrito el libro.

(24)

CAP´ITULO 2. GENERALIDADES SOBRE C ´ODIGOS 23

El siguiente grupo tiene 2 d´ıgitos e indica la editorial.

El tercer grupo tiene 6 d´ıgitos y los asigna la propia casa editorial. El cuarto grupo tiene un solo d´ıgito (num´erico o X). El d´ıgito de control (check sum).

El d´ıgito de “control” es lo que nos interesa. Se calcula con la forma “com-pleta a 10”; es decir, six1, . . . x9son los d´ıgitos, hacemos

−10x10≡x10≡ 9

X

i=1

i·xi m´od 11

porque 10≡ −1 m´od 11. Es decir quex10cumple que 10

X

i=0

i·xi≡0 m´od 11.

La parte izquierda de la congruencia se llamasuma de verificaci´on del pesado dex1. . . , x10.

El problema aqu´ı es quex10= 10 es un valor posible y solo podemos escribir

UN d´ıgito. Entonces, en ese caso hacemos x10 = X y a efectos de c´alculo ya

sabemos qu´e n´umero asignar.

Por ejemplo, el c´odigo 0−19−859617−0 (los guiones se pueden poner donde uno quiera). El primer d´ıgito nos dice 0, que es ingl´es. Los dos siguientes 19 son de Oxford University Press, el 859617 es el asignado por la Casa y

P9

i=1i·xi= 253≡0 m´od 11.

Vamos a ver los par´ametros de este c´odigo. El espacio ambiente es F10 11.

Los d´ıgitos x1, . . . , x9 solo tienen restricci´on en el alfabeto (no pueden ser 10

o X); as´ı que M = 109 seg´un la definici´on de c´odigo, y la distancia m´ınima es

d(ISBN) = 2, ya que lo menos que difieren dos palabras ANTES del d´ıgito de control es 1, pero luego van a diferir en el d´ıgito, as´ı que ser´an al menos 2. M´as adelante veremos que este c´odigo detecta un error pero no corrige error alguno. Por lo pronto, vamos a comprobar que si se comete un error entonces el c´odigo lo detecta. Seanx=x1. . . x10 y supongamos que se comete un error que

cambiaxi0poryi0. Hacemosyla palabra alterada. Entoncesx−y=i0(xi0−yi0). N´otese que nii0ni xi0−yi0 son m´ultiplos de 11, por lo que 11-y.

A partir de esta m´etrica, el esquema de decisi´on m´as simple que podemos definir es lo que llamaremos “ el esquema de la fuerza bruta”. A diferencia de otros esquemas, ´este es una aplicaci´on. Vamos a ver c´omo se construye. 2.1.9. Esquema de la fuerza bruta. Consid´erese un c´odigoC ≤Fn. Para

todo vector v ∈Fn se define mv = m´ın{d(v, c) | c∈ C} y a continuaci´on se

(25)

No hace falta esforzarse mucho para percibir claramente que el gasto en operaciones de este esquema es tan grande que lo hace inviable en cualquier c´odigo grande. Esto nos obliga a recurrir a esquemas que aunque resultan menos exhaustivos se pueden llevar a cabo.

Para determinar el siguiente esquema (v´ease la Ecuaci´on 1.4.2) usaremos bolas cerradas de alg´un radio con centro en las palabras del c´odigo; es decir, si

c∈C⊆Fyr∈N,

Br(c) ={w∈Fn | d(c, w)≤r}.

Es importante tomar en cuenta que si construimos un esquema de decisi´on, las bolas (cerradas) han de ser disjuntas dos a dos. Esto pone fuertes limitaciones al radio y nos hace detenernos en su estudio.

2.1.10. Lema. Sea C un c´odigo en Fn con distancia m´ınima d y sea r N.

Las bolas{Br(c) | c∈C} son disjuntas si y solo sir≤ bd−21c=t.

Demostraci´on. ⇒]. Primero, sean c, c0 ∈ C tales que d(c, c0) = d. Si r > d

entonces Br(c)∩Br(c0) 6= ∅ y hemos terminado. Entonces, podemos suponer

quer < d.

Supongamos quer > t. N´otese primero que sir >d−21 entonces 2r > d−1, as´ı quer+ 1> d−r, luegor≥d−r.

Seanc = (c1, . . . , cn) y c0 = (c01, . . . , c0n) como antes, tales que d(c, c0) =d,

concij 6=c

0

ij y los otros cik =c

0

ik, k6=j, conj= 1, . . . , d. Seav= (v1, . . . , vn)

tal quevij =cij para j = 1, . . . , r y vik =c

0

ik parak =r+ 1, . . . , d. El resto,

iguales. Entoncesd(c0, v) =ryd(c, v) =d−r≤r, por tantov∈Br(c)∩Br(c0),

lo cual es imposible.

⇐] Supongamos quev∈Br(c)∩Br(c0), conc, c0∈C. Entonces

d(c, c0)≤d(c, v) +d(v, c0)≤ bd−1

2 c+b

d−1

2 c ≤d−1< d, lo cual es imposible.

Por eso, al n´umerot=bd−1

2 cse le conoce tambi´en comoradio de

empaque-tado; es f´acil ver que es el m´aximo de los radios que hacen a las bolas disjuntas dos a dos (v´ease [11, 12]). Como veremos un poco m´as adelante, attambi´en se le conoce como lacapacidad de correcci´on.

2.1.11. Observaci´on. Entonces, para un c´odigo C ⊆Fn, se tiene que sir ≤

d−1 2

, el conjunto de bolas {Br(c) | c∈C} induce el esquema de decisi´on

f :Fn−−−−−−→parcial C tal quef(u) =c ⇔ d(u, c)≤r parac∈C yu∈Fn.

Este esquema es viable de implementar pues uno de antemano sabe, para cada v ∈ Fn, qui´en es su correspondiente f(v) en caso de existir y as´ı, por

ejemplo, se puede construir una tabla, aunque pueda ser gigante.

De la definici´on de nuestro esquema se puede deducir con facilidad la segunda parte del siguiente resultado.

(26)

CAP´ITULO 2. GENERALIDADES SOBRE C ´ODIGOS 25

1. C puede detectar hasta d(C)−1 errores. 2. C puede corregir hasta bd(C2)−1cerrores.

Demostraci´on. (1) Seacla palabra enviada yvla palabra recibida. Sivprovine de haber cometido menos ded(C)−1 errores al transmitircentoncesd(c, v)≤

d(C)−1 y por tantov6∈C.

(2) Sea de nuevo,c la palabra enviada yv la recibida. Si se han cometido a lo m´ast=bd(C2)−1cerrores entonces v∈Bt(c) y se corregir´a con ´exito.

2.1.13. Definici´on. Para un c´odigo C, se define la capacidad de correcci´on comot=bd(C2)−1c.

2.1.14. Definici´on. Un(n, M, d)-c´odigo es un c´odigo de longitudn, que con-tieneM palabras y tiene distancia m´ınimad.

Errores de decisi´on en el esquema de la distancia de Hamming Vamos a calcular la probabilidad de cometer un error en este esquema de decisi´on. Sea F un cuerpo finito y C ⊆ Fn un c´odigo con distancia m´ınima

d(C) =dy capacidad de correcci´ont=bd(C2)−1c. Ya sabemos que si se cometen a lo m´as terrores en la transmisi´on no habr´a error de decisi´on.

Vamos a calcular entonces la probabilidad de que se cometan m´as det erro-res. Eso depende de las probabilidades de cometer errores al enviar los s´ımbo-los. La probabilidad de que se cometa un error al enviar un s´ımbolox∈Fq es

p(Fq\ {x}|x) =p. As´ı que la probabilidad de que se cometan k≤nerrores en unas posiciones espec´ıficas de una palabra espk(1p)(n−k).

SeaSk(c) ={s∈Fn | d(c, s) =k}, conk≤t. EntoncesBt(c) =S t

k=0Sk(c)

(uni´on disjunta). Claramente|Sk(c)|= nk(q−1)k, luego

1−pe(c) = p(≤t errores) = X b∈Bt(c) p(b|c) = t X k=0 |Sk(c)|pk(1−p) n−k = t X k=0 n k (q−1)kpk(1−p)n−k.

Pero esto ´ultimo ocurre con cada palabra; as´ı que la probabilidad de error (o acierto) en el c´odigoC es independiente de las palabras y podremos sacarlo

(27)

como factor com´un. As´ı, Pe(C) = X c∈C p(c)pe(c) = X c∈C p(c) 1− t X k=0 n k (q−1)kpk(1−p)n−k ! = X c∈C p(c) ! 1− t X k=0 n k pk(q−1)k(1−p)n−k ! = 1− t X k=0 n k pk(q−1)k(1−p)n−k.

2.1.15. Ejemplo. Consideremos el c´odigo binario de repetici´on, de longitud 3.

C=

(

000 111 .

En este caso, la distancia m´ınima es d(C) = 3 y t = 1; luego las bolas sonB1(000) ={000,100,010,001}, B1(111) ={111,011,101,110}. N´otese que

B1(000)∪B1(111) =F3.

A´un m´as, seg´un lo visto en el cap´ıtulo anterior, si la probabilidad asociada aC es uniforme,Pe(C) = 1−P1k=0 3kpk(1−p)n−k = 3p2−2p3

2.1.16. Ejemplo. Volvamos al ejemplo en (1.1.3) del GPS. En ese caso, hab´ıamos definido el c´odigo C1=        ↑ 7→ 00 ↓ 7→ 11 → 7→ 10 ← 7→ 01

C1es un (2,4,1)-c´odigo binario y no detecta ni corrige error alguno.

Ahora vamos a agregar redundancia

C2=        ↑ 7→ 00|0 ↓ 7→ 11|0 → 7→ 10|1 ← 7→ 01|1

C2 es un (3,4,2)-c´odigo binario y detecta 1 error, pero no puede corregir.

Un c´odigo que solo detecta un error se llamac´odigo detector de un error. Mientras m´as redundancia agregamos, mejor para la correcci´on y peor para la tasa de trasmisi´on. Si agregamos dos d´ıgitos m´as,

C3=        ↑ 7→ 00|000 ↓ 7→ 11|011 → 7→ 10|110 ← 7→ 01|101

(28)

CAP´ITULO 2. GENERALIDADES SOBRE C ´ODIGOS 27

C3es un (5,4,3)-c´odigo binario que corrige un error y detecta 2, pero NO A

LA VEZ. Por ejemplo, si recibimos la palabra 00001. Tenemos dos posibilidades: 1. Si asumimos que solo se puede cometer un error, entonces corregimos

000017→00000.

2. Si asumimos que se puede cometer m´as de un error entonces 00001 pue-de provenir pue-de 01101 con dos errores o pue-de 00000 con un error. Entonces detectamos pero no corregimos.

Las bolas que determinaC3 que tiene t= 1, son

B1(00000) ={00000,10000,01000,00100,00010,00001}.

B1(11011) ={11011,01011,10011,11111,11001,11010}.

B1(10110) ={10110,00110,11110,10010,10100,10111}.

B1(01101) ={01101,11101,00101,01001,01111,01100}.

Fuera quedan{11000,00011,01110,10101,11100,00111,01010,10001}. Se deja como ejercicio calcularPe(C3).

2.1.17. Observaci´on. Normalmente tenemos que decidir si un c´odigo es de-tector o corrector, aunque los c´odigos detectores no los estudiaremos aparte. 2.1.18. Ejemplo. El c´odigo del ISBN (2.1.8), como vimos, tien distancia m´ıni-mad(ISBN) = 2, entonces detecta un error y no corrige ninguno.

2.1.19. Ejemplo. Todo c´odigoq-ario de longitudn, de repetici´on, es un (n, q, n )-c´odigo.

odigos perfectos y radio de recubrimiento

Los c´odigos perfectos son aquellos para los cuales el esquema de decisi´on inducido por las bolas cerradas tiene una aplicaci´on o funci´on (en el sentido habitual) en vez de una funci´on parcial. En [6] se llama c´odigo de decodificaci´on ´

unica a aquellos que verifican que su esquema es una aplicaci´on.

2.1.20. Definici´on. Un c´odigo C sobre un alfabeto F se llama perfecto si la distancia m´ınima es de la formad= 2t+ 1 y

Fn =

[

x∈C

Bt(x)

es decir, siFn es uni´on de las bolas de radio d−21 ∈Ny centro en las palabras.

Vamos ahora a dar un criterio meramente aritm´etico para determinar cu´ando un c´odigo es perfecto.

2.1.21. Lema. Sea Fq un cuerpo finito. EnFnq, una bola de radio r y centro

en un puntov tiene exactamente

|Br(v)|= r X j=0 n j (q−1)j elementos.

(29)

Demostraci´on. Ya hemos visto que paraSj(c) ={s∈Fn | d(c, s) =j}se tiene

que|Sj(c)|= nj

(q−1)j. El resultado se deduce entonces de la igualdadBt(c) =

St

j=0Sj(c) (uni´on disjunta).

Ahora caracterizaremos a los c´odigos perfectos.

2.1.22. Teorema. Un(n, M, d)-c´odigo q-ario es perfecto si y solo si

M · t X j=0 n j (q−1)j=qn, con t= d−1 2 .

Demostraci´on. Por hip´otesis, las bolas son disjuntas, as´ı que

[ u∈C Bt(u) =M· |Bt(x)|=M· t X j=0 n j (q−1)j

donde hemos fijado unx∈Ccualquiera. De aqu´ı, es inmediato el resultado. 2.1.23. Ejemplo. Para cualquier (5, M,3)-c´odigo binario se tiene entonces que

M(1 + 5)≤25, luegoM 5.

2.1.24. Ejemplos. Algunos c´odigos perfectos.

1. Todo c´odigo binario de repetici´on de longitud impar es perfecto (v´ease 2.1.15).

Efectivamente.Por la f´ormula del binomio y el hecho de que

n X k=n+12 n k = n−1 2 X k=0 n n−k se tiene 2n = (1 + 1)n= n X j=0 n j = n−1 2 X j=0 n j + n X k=n+1 2 n k = n−1 2 X j=0 n j + n n−j = n−1 2 X j=0 2· n j =M t X j=0 n j (2−1)j 2. El c´odigo total.

3. Los c´odigos binarios de longitud impar de la forma

c,1 +c .

Pero estos c´odigos son triviales. Un problema muy interesante es encontrar TODOS los c´odigos perfectos. Trataremos este problema m´as adelante. Por lo pronto solo mencionar que hay familias importantes de c´odigos perfectos como los c´odigos de Hamming.

(30)

CAP´ITULO 2. GENERALIDADES SOBRE C ´ODIGOS 29

Cuando un c´odigo no es perfecto, nos interesa saber cu´anto dista de serlo. Para ello usamos el siguiente concepto.

2.1.25. Definici´on. Sea C un (n, M, d)-c´odigo sobre F. El radio de recubri-miento deC es ρ(C) = m´ın ( r∈N | Fn= [ c∈C Br(c) ) .

Es decir, el menor natural tal que la familia de bolas con dicho n´umero cubre el espacio ambiente.

2.1.26. Observaci´on. Equivalentemente se puede ver que

ρ(C) = m´ax v∈Fn m´ın c∈C(d(v, c)) .

2.1.27. Definici´on. Sea C un (n, M, d)-c´odigo sobre F, con radio de

empa-quetamiento (o capacidad de correcci´on) t. Decimos queC es cuasi perfecto si

ρ(C) =t+ 1.

2.1.28. Ejemplo. El c´odigo C3 de (2.1.16) verifica bd−21c = 1 y ρ(C3) = 2.

Luego,C3es quasi perfecto.

2.2.

Equivalencia y automorfismos de c´

odigos

La definici´on tradicional de equivalencia de c´odigos es la siguiente (v´eanse, por ejemplo [6, 7, 11]).

2.2.1. Definici´on. Dos c´odigos C y D, q-arios decimos que son equivalentes si se puede obtener uno del otro a trav´es de una combinaci´on de operaciones de los siguientes tipos:

1. Permutaci´on de las posiciones.

2. Permutaci´on de los s´ımbolos de una posici´on fija.

Como aplicaci´on, un resultado muy ´util a la hora de hacer c´alculos.

2.2.2. Lema. Todo(n, M, d)-c´odigo sobreFes equivalente a un(n, M, d)-c´ odi-go sobreF, que contiene al vector0∈Fn.

Demostraci´on. Inmediato del hecho de que las traslaciones son isometr´ıas. A su vez, cada c´odigo tiene asociado su grupo de automorfismos o autoequi-valencias.

2.2.3. Definici´on. Sea F un cuerpo finito y C ⊆ Fn un c´odigo. El grupo de

automorfismos deC es

(31)

De especial inter´es es el grupo de aquellos automorfismos que solo hacen permutar a las coordenadas;

2.2.4. Definici´on. Dos c´odigosC, D⊂Fn, decimos que son permutaci´on

equi-valentes si existe una permutaci´onσ∈Sn, tal que Cσ=D.

2.2.5. Definici´on. Sea F un cuerpo finito y C ⊆ Fn un c´odigo. El grupo de

automorfismos de permutaci´on es

PAut(C) ={x∈Sn | Cx=C}.

2.3.

Construcci´

on de c´

odigos a partir de otros

odigos pinchados

2.3.1. Definici´on. Decimos que pinchamos un c´odigo C ⊂Fnq, cuando

elimi-namos una coordenada fija en todas las palabras; es decir, proyectamos sobre las otras.

Una pregunta importante desde el punto de vista de la teor´ıa de c´odigos es qu´e ocurre con los par´ametros. Es decir, si tenemos un (n, M, d)-c´odigo y denotamos conC?

i al c´odigo pinchado en lai-´esima corrdenada ¿podemos dar

directamente los nuevos par´ametros?

2.3.2. Proposici´on. Sea C un (n, M, d)-c´odigo sobre Fq y sea C?

i el c´odigo

pinchado en lai-´esima coordenada. Sid >1 entonces C?

i es un(n−1, M, d?i )-c´odigo, donde d?i = ( d−1 si existenu, v∈C, con d(u, v) =dy u(i)6=v(i) d otro caso.

Demostraci´on. Si |Ci?| < M =|C| entonces tendr´an que existir u, v ∈ C con

u6=v, perov?=u?lo cual implica qued(u, v) = 1. Imposible. Luego,|Ci?|=M. El c´alculo ded?i es inmediato.

Para los siguientes resultados, necesitamos el concepto de subgrupo de per-mutaciones transitivo.

2.3.3. Definici´on. Decimos que un subgrupo H ≤ Sn es transitivo si act´ua

transitivamente en {1, . . . , n}; es decir, para cualesquier 1 ≤ i, j ≤ n, existe

σ∈H tal queσ(i) =j (es decir, solo hay una ´orbita).

2.3.4. Proposici´on. SeaC un(n, M, d)-c´odigo. SiP Aut(C)es transitivo en-tonces losnc´odigos obtenidos de pincharCen cada coordenada son permutaci´on equivalentes.

Demostraci´on. Vamos a ver que C?

1 es equivalente a Cj? para j = 2, . . . , n.

Sea a ∈ C tal quea = (a1, . . . , aj, . . . , an) y sea b = aσ1j ∈ C (por la

tran-sitividad). Entonces b = (aj, a2, . . . , aj−1, a1, aj+1, . . . , an) y en consecuencia

b?

j = (aj, a2, . . . , aj−1, aj+1, . . . , an). Hacemosσ=σ12σ23. . . σj−2j−1 y se tiene

que b?

j = (a2, . . . , aj, . . . , an) = a?1. As´ı, (aσ1j)?jσ = a?1, pero aσ1j ∈ C, luego

(32)

CAP´ITULO 2. GENERALIDADES SOBRE C ´ODIGOS 31

2.3.5. Ejemplo. SeaC={00000,11000,00111,11111}. Se puede construirC1?

yC5?, y comprobar que no son equivalentes.

odigos extendidos

Esencialmente, extender c´odigos es agregar informaci´on, digamos en dos pa-sos. Hay muchas maneras (lineales) de hacerlo; una especial, es la que se llama “agragar el d´ıgito de control” (de paridad,parity check, en ingl´es). Se hace as´ı, 2.3.6. Definici´on. Sea C un (n, M, d)-c´odigo sobreFq. Hacemos

b C= ( (v1, . . . , vn, vn+1) | (v1, . . . , vn)∈C y n+1 X ı=1 vı= 0 )

Otra vez, queremos conocer los par´ametros por f´ormula.

2.3.7. Proposici´on. Sea C un (n, M, d)-c´odigo sobre Fq. Entonces Cb es un h

n+ 1, M,db i

-c´odigo, donde db=dod+ 1.

Demostraci´on. Trivial.

2.3.8. Observaci´on. Obtener leyes para los c´odigos extendidos en el caso bi-nario es muy simple. Aqu´ı, trivialmente,db=d+ 1 sides impar y es den caso

contrario.

Concatenaci´

on o suma directa

Es importante distinguir entre la suma directa del ´algebra lineal y la suma directa de c´odigos, que no coinciden.

2.3.9. Definici´on. SeanC1, C2 (n1, M1, d1) y (n2, M2.d2)c´odigos q-arios. La

concatenaci´on o suma directa es el c´odigo

{(u|v) | u∈C1, v∈C2}

El estudio de los par´ametros aqu´ı es muy sencillo y el propio lector puede completar la secci´on.

La construcci´

on de Plotkin

2.3.10. Definici´on. SeanCi dos(n, Mi, di)-c´odigos q-arios, coni= 1,2, pero

nfijo. Formamos un nuevo c´odigo que llamamos la construcci´on de Plotkin.

C1⊕C2={(u|u+v) | u∈C1, v∈C2}

2.3.11. Proposici´on. Sean Ci dos (n, Mi, di)-c´odigos q-arios, con i = 1,2.

(33)

Demostraci´on. Seanx= (u1|u1+v1) e y= (u2|u2+v2). Entonces

d(x, y) =d(u1, u2) +d(u1+v1, u2+v2) =ω(u1−u2) +ω(u1−u2+v1−v2).

Ahora separamos en casos. Siv16=v2entonces por (2.1.7),

d(x, y)≥ω(v1−v2)≥d2

y la igualdad se alcanza para palabrasv1 yv2 que tengan la distancia m´ınima

deC2 yu1=u2.

Si v1=v2 entoncesd(x, y) = 2d(u1, u2)≥2d1 y tambi´en hay palabras que

(34)

Cap´ıtulo 3

odigos lineales

3.1.

Conceptos b´

asicos

Como hemos comentado antes, la idea subyacente de los c´odigos correctores de errores es la redundancia en la informaci´on. En este cap´ıtulo comentaremos la manera algebraica de controlar dicha redundancia, y de hecho, la codificaci´on y decodificaci´on.

Como viene ocurriendo, F siempre denotar´a un cuerpo finito. Cuando se

quiera hacer ´enfasis en su cardinal, escribiremosFq, dondeq=|Fq|.

Por ejemplo, en el caso del c´odigo C1 = {00,10,01,11} del GPS (1.1.3 y

2.1.16) que vimos antes, lo ampliamos al c´odigo C2 = {000,101,011,110}. Es

f´acil ver que, la regla para ampliarlo es (x, y)7→ (x, y, x+y) en t´erminos del ´

algebra lineal; es decir, la redundancia puede obtenerse mediante aplicaciones lineales. Vamos a identificarlo. TenemosC1=F22y hacemosf :F22→F32, tal que

f(x, y) = (x, y, x+y). ClaramenteC1∼=C2. Llamaremosmatriz de codificaci´on

a la matriz asociada a la codificaci´on (en las bases can´onicas, como escalares opuestos). Se tiene, C2 =< M(f) >, la matriz en las bases can´onicas. M´as

adelante, llamaremos aM(f) (una) matriz generadora 1.

Ahora hacemos δ : C2 ∼=F22 → F52 tal que δ(x, y) = (x, y, x+y, x, y) y se

obtieneC3.

Esta forma de agregar la redundancia manteniendo fijas la primeras coor-denadas (y dejando intacto el c´odigo original) nos produce matrices del tipo

M(δ) = (Ik|A)

Vamos a formalizar la situaci´on.

3.1.1. Definici´on. SeaFun cuerpo finito. Un c´odigo lineal,C, es un subespacio

del espacio vectorialFn. Escribimos [n, k, d]-c´odigo para un c´odigo lineal deFn 1¿Generadora o generatriz? Las opiniones est´an divididas (v´eanse [6, 9]). Seg´un el

diccio-nario de la RAE,generadoraes “que genera”, mientras que generatriz los reserva para f´ısica y geometr´ıa. En todo caso, ambas est´an en el diccionario y aunque no estuvieran cada uno las usar´ıa como quisiera. Aqu´ı diremos generadora porquematriz generatriz, todo junto, no nos gusta.

(35)

con dimFC =k y distancia m´ınima d. Escribiremos solo [n, k]-c´odigo cuando no nos interese hacer ´enfasis en la distancia m´ınima.

3.1.2. Observaci´on. Un [n, k]-c´odigo sobreFqtiene exactamenteqkelementos.

Para la presentaci´on de los c´odigos lineales se usan dos tipos de matriz; a saber, la matriz generadora y la matriz de control (parity check matrix). Comencemos con la matriz generadora.

3.1.3. Definici´on. Sea C un [n, k]-c´odigo sobre F. Una matriz generadora de

C es cualquiera cuyas filas formen una base paraC. Se denota G(C).

Sea M una matriz de orden n×n. Denotamos M(i1, . . . , ir;j1, . . . , js) la

submatriz deM que proviene de la intersecci´on de las filas i1, . . . , ir y las

co-lumnasj1, . . . , js. Abreviemos,M(1, . . . , n;X) =M(−;X) yM(X; 1, . . . , n) =

M(X;−)

3.1.4. Definici´on. SeaCun[n, k]-c´odigo sobreF. Un conjunto de informaci´on o conjunto de posiciones de informaci´on, es un subconjunto I ⊂ {1, . . . , n} tal que, dada cualquier palabra del c´odigo,(c1, . . . , cn)∈Cy cualquier posici´onj =

1, . . . , nexiste un ´unico conjunto de coeficientes{ai,j}i∈I, tal que

P

i∈Iai,jci =

cj.

Es decir, que el c´odigo C puede obtenerse conociendo los valores de las po-sicionesI.

Por ejemplo, si se considera el c´odigoC={(x, y, z) | z=x+y}, entonces

I={2,3}es un conjunto de informaci´on. Vamos a comprobarlo. Sean (x, y, x+y) y (x0, y0, x0+y0) tales quey=y0 yx+y=x0+y0. Claramente x=x0.

3.1.5. Definici´on. Sea C un [n, k]-c´odigo sobre F con un conjunto de

in-formaci´on I. Se llama conjunto de redundancia o de posiciones de control a

{1, . . . , n} \ I.

El ejemplo m´as simple es lacodificaci´on sistem´atica. Decimos que un c´ odi-go es sistem´atico si al agregar la redundancia hemos mantenido las primeras filas intactas. As´ı, su matriz generadora ser´a de la forma G(C) =M(I|A). Las primeras columnas tienen la informaci´on y las siguientes la redundancia.

Un criterio sencillo y muy ´util para encontrar conjuntos de informaci´on se tiene en el siguiente toerema.

3.1.6. Teorema. Sea C un [n, k]-c´odigo sobre Fcon matriz generadora G. Si

G tiene k columnas linealmente independientes entonces los ´ındices de dichas columnas forman un conjunto de informaci´on. (N´otese que al menos seguro uno hay).

Rec´ıprocamente, si I ⊂ {1, . . . , n} es un conjunto de informaci´on enton-ces existe una matriz generadoraG tal que las columnas con ´ındices en I son linealmente independientes.

Demostraci´on. Supongamos primero queGes una matriz generadora y que tiene ciertas columnas con ´ındices {i1, . . . , ik}, que son linealmente independientes.

Consid´erese la submatriz de las columnasi1, . . . , ik, seaG(i1, . . . , ik). Entonces

existe una matriz de operaciones elementales por fila E tal que la submatriz

(36)

CAP´ITULO 3. C ´ODIGOS LINEALES 35

cualquier palabra. Entonces existe a∈Fk tal que aEG=c. Por la forma que

tieneEGes claro quecij =ajy que, para cualquierl= 1, . . . , n,cl=

P

rjlaj =

P

rjlcij.

Rec´ıprocamente, supongamos que I ={i1, . . . , ik} es un conjunto de

infor-maci´on. Seab1, . . . , bkuna base paraC y seana1, . . . , ak las proyecciones de los

bj en las coordenadas deI; es decir, aj = (bj(i1), . . . , bj(ik)).

Se afirma que a1, . . . , ak es linealmente independiente en Fk. Consid´erese

una combinaci´on linealPr

jaj = 0. Entonces, tomando cualquier componente,

se tienePr

jbj(il) = 0, lo cual implica que rj = 0 para todo j= 1, . . . , k pues

I es conjunto de informaci´on y por tanto las expresiones son ´unicas.

Finalmente, se considera la aplicaci´on inducida por la correspondenciaaj7→

bj. La matriz asociada a esta aplicaci´on en las bases{aj}y cualquier extensi´on

de{bj}nos vale.

Sea ahora C un [n, k]-c´odigo sobre F con matriz generadora G. Sabemos

que si las primeras k columnas de G forman un conjunto de informaci´on (o sea, son linealmente independientes) entonces existe una matriz de operaciones elementalesexclusivamente por filas, digamosE, tal queEG= (Ik|A). Es obvio

queEGtambi´en es matriz generadora deC. Esta forma tiene nombre propio. 3.1.7. Definici´on. Sea C un [n, k]-c´odigo sobre F con matriz generadora G.

Decimos queGest´a en forma t´ıpica (est´andar) siG= (Ik|A)para alguna matriz

adecuadaA.

3.1.8. Ahora consideremos la sucesi´on exacta 0→Fk −−→f Fn−−→η Coker(f)→

0. EntoncesC= Im(f), el c´odigo nos da la sucesi´on 0→C−−ι→Fn−−→η

Fn/C→

0.

El´ıjase, por lo pronto, una base cualquiera en el espacio cociente, digamos

γ. Hacemos

Hk×n=Mεγ(η) t.

Sabemos que C = kerf = {x∈Fn | Hxt= 0} y por tanto, dimF(C) =

n−rg(H). Desde el punto de vista deH, kerf es la nulidad a la derecha deH

y se denotaNd(H). Tambi´en hay, claro, la nulidad a la izquierda. A la matriz

H se la conoce comomatriz de control (parity check) deC.

3.1.9. Teorema. SiG= (Ik|A)k×n es la matriz generadora en forma t´ıpica de

un[n, k]-c´odigo lineal entoncesH = (−At|I

n−k)es una matriz de control deC.

Demostraci´on. Basta hacer las cuentas y luego considerar dimensiones.

El siguiente resultado nos muestra que esencialmente todo c´odigo puede suponerse con matriz en forma t´ıpica.

3.1.10. Teorema. Todo c´odigo linealCes permutaci´on equivalente a un c´odigo cuya matriz generadora est´a en forma t´ıpica.

Demostraci´on. SeaGla matriz generadora. Por ´algebra lineal (m´etodo de Gauss-Jordan) sabemos que existen matrices invertibles (de operaciones elementales),

(37)

adecuada. Tambi´en sabemos que podemos elegirF como solo producto de per-mutaci´on de los pivotes (o cualquier permutaci´on que pusiera en las primeras columnas un conjunto de informaci´on). EntoncesEG genera el mismo c´odigo

C y por tanto CF es permutaci´on equivalente y tiene la matriz de la forma deseada.

3.1.11. Ejemplos.

1. El c´odigo binario de repetici´onF2

f

−−→F5

2que vimos en (2.1.3) tiene matriz

de codificaci´on M(f) =    1 .. . 1    5×1 y la matriz generadora esG= (1|1111),

que est´a en forma t´ıpica.

En este caso, el conjunto de informaci´on es{1}y la redundancia es 6. La matriz de control es H= At|I4=    −1 .. . −1 I4   =    1 .. . 1 I4   porque estamos en F2.

2. M´as adelante, veremos con detalle un tipo de c´odigos llamados c´odigos de Hamming. Por lo pronto llamaremosH3al c´odigo con matriz generadora

G=     I4 0 1 1 1 0 1 1 1 0 1 1 1     y de control H =   0 −1 −1 −1 −1 0 −1 −1 −1 −1 0 −1 I3  . ´ Este es un [7,4]-c´odigo.

3. En el ejemplo del ISBN (2.1.8) tenemosC=F9

11y agregamos la

informa-ci´on (d´ıgito de control de pesos) con la aplicaci´on linealf :C→F10 11dada por f(x1, . . . , x10) = x1, . . . , x9,−P 9 i=1ixi

. En este caso, la matriz generadora es G(ISBN) =    I9 −1 .. . −9   .

Referencias

Documento similar

En tales circunstancias, una forma de proceder posible sería iniciar una fase preconstitucional de diálogo nacional, como sucedió en Sudáfrica, para reunir a

Indicadores municipales de sostenibilidad: Tasa de afiliación a

Gestionar un producto cultural es un arte que requiere habilidades especiales para combinar la dimensión creativa del producto cultural (en cualquiera de sus versiones,

La oferta existente en el Departamento de Santa Ana es variada, en esta zona pueden encontrarse diferentes hoteles, que pueden cubrir las necesidades básicas de un viajero que

en la conformación política dtl país, el autor dedica los dos últimos capí- tulos al estudio del impacto y la fun- ción del terror en la organización co- munista, y las

Este parón o bloqueo de las ventas españolas al resto de la Comunidad contrasta sin em- bargo con la evolución interior de ese mismo mercado en cuan- to a la demanda de hortalizas.

La poblaci´on es un conjunto de individuos y cada individuo se representa por una cadena de s´ımbolos, letras y/o n´ umeros, la forma de generar estos individuos es de forma

Separa y escribe en los recuadros las sílabas de cada dibujo y en la línea derecha coloca el nombre de la palabra según el número de sílabas que tienen.. Pronuncia las palabras,