Grado en matemáticas. Curso Códigos correctores de errores. Juan Jacobo Simón Pinero

(1)

C´

odigos correctores de errores

Juan Jacobo Sim´

on Pinero

(2)

´

_{Indice general}

1. Informaci´on y c´odigos 3

1.1. La transmisi´on de la informaci´on . . . 3

1.2. Medida de la incertidumbre y de la informaci´on . . . 6

1.3. Capacidad de un canal con interferencias . . . 12

1.4. C´odigos correctores de errores . . . 17

1.5. Teorema de Shannon . . . 20

2. Generalidades sobre C´odigos 21 2.1. Conceptos b´asicos . . . 21

2.2. Equivalencia y automorfismos de c´odigos . . . 29

2.3. Construcci´on de c´odigos a partir de otros . . . 30

3. C´odigos lineales 33 3.1. Conceptos b´asicos . . . 33

3.2. C´odigos duales u ortogonales . . . 37

3.3. Pesos y distancias . . . 37

3.4. Codificaci´on y decodificaci´on . . . 40

3.5. Construcciones con c´odigos lineales . . . 44

4. Cotas a los par´ametros 47 4.1. Generalidades . . . 47

4.2. Cota de Hamming . . . 49

4.3. Cota de Singleton y c´odigos MDS . . . 49

4.4. Otras cotas . . . 50

5. Tipos especiales de códigos lineales 52 5.1. Códigos de Hamming y códigos simplex . . . 52

5.2. C´odigos de Golay . . . 54

5.3. C´odigos de Reed-Muller (binarios) . . . 56

6. Cuerpos finitos 59 6.1. Aritm´etica de cuerpos finitos . . . 59

6.2. Polinomios y n´umeros algebraicos . . . 61

(3)

6.3. Existencia y unicidad. . . 64 6.4. Ejemplos . . . 66 6.5. El anilloFq[X]/(Xn−1) . . . 68 6.6. Automorfismos . . . 73 7. C´odigos c´ıclicos 75 7.1. Conceptos b´asicos . . . 75

7.2. C´odigos c´ıclicos y anillos de polinomios . . . 76

7.3. Ceros de un c´odigo c´ıclico y matriz de control . . . 79

7.4. Codificación y decodificación en códigos c´ıclicos . . . 81

7.5. Cota BCH y la transformada discreta de Fourier . . . 84 8. Códigos clásicos que se realizan como códigos c´ıclicos 88

(4)

Cap´ıtulo 1

Informaci´

on y c´

odigos

1.1. La transmisi´

on de la informaci´

on

La transmisión de la información digital consiste en enviar mensajes, o ca-denas de “palabras” que son, a su vez, caca-denas de elementos de un “alfabeto” o conjunto de s´ımbolos, donde incluimos también a las señales de cualquier tipo. As´ı, los mensajes serán cadenas de s´ımbolos que separaremos en palabras (tal vez una o tal vez, muchas).

Los s´ımbolos se env´ıan a través de un canal. Un canal es cualquier medio de transmisión, como puede ser el cable de teléfono, la fibra óptica, las ondas de radio, el empleado del supermercado que “teclea” en la caja el código de barras de un producto cuando ha fallado el lector, etcétera; aunque al final siempre trabajaremos con algunas restricciones. Desde el punto de vista de la fiabilidad de la transmisión hay dos tipos fundamentales de canales; a saber, los canales con interferencia (o ruido) y los canales sin interferencia. Nosotros solo nos ocuparemos del estudio de los canales con interferencia o ruido, que, obviamente, es el caso donde se pueden producir errores.

En este texto, además, solo nos ocuparemos de la parte cuantitativa de la transmisión de la información y no del significado (si analizamos el contenido de los mensajes que normalmente se transmiten en el mundo, seguro que nos desanimamos).

El siguiente cuadro refleja el proceso directo de la transmisi´on de mensajes.

Figura 1.1.1: Esquema general

emisor - _canal - receptor

Codificar mensajes es reescribirlos (en el caso no trivial) en forma diferen-te, incluso usando un alfabeto distinto, pero nosotros siempre lo haremos bajo

(5)

determinadas reglas. Una de ellas es que cada palabra no pueda tener más de una correspondiente en el código; formalmente, la codificación es una aplicación. Vamos a verlo. Para cualquier alfabetoA, denotamos con P al(A) el conjunto de todas sus palabras. A lo largo de todo el curso los alfabetos serán siempre conjuntos finitos.

1.1.1. Definici´on. Sean A,F alfabetos y sea M ⊆ P al(A) un subconjunto

finito.

1. Una codificaci´on del alfabeto es una aplicaci´on inyectivaC:A →P al(F).

2. Una codificaci´on de palabras de M es una aplicaci´on inyectiva C : M →

P al(F).

Llamamos c´odigo a la imagen deC y se llama palabra c´odigo o simplemente palabra a cada uno de sus elementos.

1.1.2. Observaci´on. SeanA,F alfabetos y seaM ⊆P al(A) un subconjunto

finito. Supongamos que estamos transmitiendo información codificada a través de un canal. El proceso de decodificación lo realizaremos siempre en dos pasos; a saber:

1. Separaremos (de alguna forma) la lista de s´ımbolos en partes a las que asignaremos palabras del c´odigo.

2. A cada palabra de c´odigo le asignaremos su imagen inversa (que es ´unica) bajoC.

1.1.3. Ejemplo. Supongamos que somos un GPS para un punto que se va a mover en un tablero. Partimos de una casilla “salida” y tenemos que mostrarle la ruta a la casilla “meta”. Nuestro alfabeto y palabras ser´anA={↑,↓,←,→}=

M.

Vamos a transmitir la ruta al punto de forma codificada; es decir, definiremos una aplicaciónC:M →P al(F), para algún conjuntoF. Luego se decodificará y

entonces el punto seguir´a la ruta que aparece en el tablero.

s

m

Elegimos una ruta que se transmitir´a completa

↓,↓,→,→,↓,→,→,↓

Ahora codificamos. Lo haremos con tres c´odigos diferentes:

Codificaci´on 1: Hacemos F = Z2, y C(↑) = 0, C(↓) = 1, C(→) =

10, C(←) = 01.

Entonces enviamos la cadena 111010110101 que se transmite sin errores y ahora se tiene que decodificar. El problema es que, quien recibe la cadena tiene

(6)

CAPÍTULO 1. INFORMACI ÓN Y C ÓDIGOS 5

m´as posibilidades de decodificar que la contemplada por nosotros. Vamos a ver dos opciones m´as:

Una es: 1 1 1 01 01 10 10 1 que se decodifica: ↓ ↓ ↓ ← ← → → ↓

Otra: 1 1 1 0 1 0 1 1 0 1 0 1 que se decodifica: ↓ ↓ ↓ ↑ ↓ ↑ ↓ ↓ ↑ ↓ ↑ ↓

Como se puede apreciar, estas decodificaciones conducen a rutas no deseadas.

Para resolver este problema agregamos un s´ımbolo, el “STOP”, digamos], como en la Clave Morse.

Codificaci´on 2:HacemosF=Z2∪{]}, yC(↑) = 0], C(↓) = 1], C(→) =

10], C(←) = 01] con tres s´ımbolos, pero si solo podemos enviar binarios podr´ıamos que hacer algo comoF=Z2, yC(↑) = 01, C(↓) = 001, C(→) =

0001, C(←) = 00001, o sea que el n´umero de cifras “0” nos indica la direcci´on de la flecha y el “1” el STOP.

Entonces enviamos

1]1]10]10]1]10]10]1]

o, en binario,

0010010001000100100010001001

Estas codificaciones no dejan lugar a dudas sobre la decodificación. A este tipo de códigos los llamaremos códigos de decodificación única.

Hay una tercera alternativa:

Codificación 3:C(↑) = 00, C(↓) = 11, C(→) = 10, C(←) = 01 Esta decodificación no necesita s´ımbolo de separación porque tiene una pro-piedad permanente que de antemano sabrá siempre el decodificador: que las palabras tienen longitud fija; a saber, longitud 2. As´ı que usa dos s´ımbolos y es de decodificación única.

Enviamos

1111101011101011 y tiene solo una interpretaci´on, la que queremos. Tipos de c´odigos

En general, el uso de los códigos abarca tres grandes objetivos en la trans-misión de la información:

1. Comprimir mensajes.

2. Detectar y corregir posibles errores. 3. Garantizar la privacidad.

(7)

En pocas palabras, hacer la transmisión rápida, fiable y segura. La teor´ıa aborda por separado cada uno de estos objetivos, porque son, de hecho, inde-pendientes. As´ı, tenemos tres tipos diferentes de códigos; a saber,

1. Los c´odigos compresores.

2. Los códigos correctores de errores. 3. Los códigos criptográficos o secretos.

Nosotros solo nos ocuparemos de los c´odigos correctores de errores. El pro-ceso de codificar, enviar y decodificar, modifica la Figura 1.1.1 a la Figura 1.1.2.

Figura 1.1.2: Transmisi´on codificada

emisor - _canal - receptor

codificador decodificador

-6

1.1.4. Definición. Decimos que un código es de decodificación única si cada vez que recibimos una cadena de s´ımbolos, o mensaje, ésta corresponde con una ´

unica lista de palabras. 1.1.5. Definici´on.

1. Decimos que una palabra tiene longitud n ∈ N si utiliza exactamente n

s´ımbolos.

2. Decimos que un c´odigo es un c´odigo en bloques (o bloqueado) si existe

n∈N, tal que toda palabra es de longitudn.

Se tiene por supuesto la definición, obvia, de código de longitud variable. Nosotros solo nos ocuparemos del estudio de los códigos en bloques. Un ejemplo t´ıpico e importante de código de longitud variable es la Clave Morse. Uno de bloques es el código de barras donde, además, todo mensaje tiene exactamente una palabra.

1.1.6. Observación. Es claro que todo código en bloques es de decodificación ´

unica.

1.2. Medida de la incertidumbre y de la

informaci´

on

Vamos a comentar cómo se lleva a cabo la cuantificación de la información (que se va a transmitir a través de un canal). En [9] y [11] se pueden

(8)

encon-CAPÍTULO 1. INFORMACI ÓN Y C ÓDIGOS 7

trar exposiciones más amplias de este tema. Nosotros sólo vamos a hacer una exposición breve e intuitiva, tratando de no perder por ello claridad.

El criterio para cuantificar la información será “más informa mientras más sorprende” o, en términos más cercanos a la probabilidad, “más informacón tiene mientras menos probable es que ocurra”. Por ejemplo, casi nunca veremos una noticia que diga “mañana por la mañana saldrá el sol”; ya sabemos que va a ocurrir mañana y muchos años pues no está previsto a corto plazo una colisión o que el sol se apague. Lo que es noticia es que en un d´ıa despejado el sol se esconda; es decir, que haya un eclipse de sol.

Vamos a transmitir informaci´on usando palabras; es decir, cadenas de s´ımbo-los (y se˜nales). Cada s´ımbolo tiene una probabilidad de aparecer; as´ı que, siA

es un alfabeto, podemos establecer una distribuci´on de probabilidades sobre el suceso “que aparezcaa∈ A(en una palabra o en un mensaje)”

Una fuente de informaci´on [9] (source of transmision [11]) es una pareja (A,P) formada por un alfabetoAjunto con una distribuci´on de probabilidades

P; es decir,P

a∈Ap(a) = 1. Se puede extender la fuente original; por ejemplo, si

A={a1, a2}(que normalmente denotamos conA={0,1}), podemos extenderla

a An_{, de la forma obvia. Entonces, volvemos a calcular la probabilidad. Por}

ejemplo, si los sucesos son independientes entonces parav∈ An_{, se tiene}_p₍_v_{) =}

Qn

i=1p(v(i)) y as´ı seguimos con las palabras, etc´etera.

Cuando no se preste a confusi´on, escribiremosA= (A,P).

Lo anterior puede replantearse en t´erminos puramente probabil´ısticos y de-finir una fuente de informaci´on como una variable aleatoria sobre el espacio de sucesos de las palabras o los s´ımbolos.

1.2.1. Ejemplo. Vamos a construir una fuente para enviar palabras en binario, simplificando el c´odigo ASCII.

Supongamos que tenemos un canal binario para enviar mensajes de palabras en castellano. Podemos usar, por ejemplo, elC´odigo ASCII extendido(American Standard Code for Information Interchange).

Es una codificación numérica de la que escribimos su versión binaria, de 28 _{= 256 s´ımbolos (letras, n´}_{umeros, etc.) pensado sobre todo para transmitir}

textos en inglés. Cada s´ımbolo tiene asociada una cadena 8 d´ıgitos binarios. El código ASCII tiene dos tipos de caracteres, los imprimibles y los de con-trol. La tabla del código es muy larga y no podemos reproducirla completa aqu´ı. Lo que haremos es crear nuestra propia tabla sólo para las letras del castellano y algunos s´ımbolos, como los paréntesis y el nuevo párrafo.

(9)

Imitaci´

on del c´

odigo ASCII

S´ımbolo Decimal Binario

t 00 00000 ( 01 00001 ) 02 00010 (salto) 03 00011 . 04 00100 A 05 00101 B 06 00110 C 07 00111 D 08 01000 E 09 01001 F 10 01010 G 11 01011 H 12 01100 I 13 01101 J 14 01110 K 15 01111

S´ımbolo Decimal Binario

L 16 10000 M 17 10001 N 18 10010 ˜ N 19 10011 O 20 10100 P 21 10101 Q 22 10110 R 23 10111 S 24 11000 T 25 11001 U 26 11010 V 27 11011 W 28 11100 X 29 11101 Y 30 11110 Z 31 11111

Ahora vamos a calcular la distribución de la fuente paraA={0,1}. Si fuésemos a usar estas letras para enviar mensajes en cualquier lengua, debemos obtener la distribución de la fuente simplemente contando las frecuen-cias; es decir, asumiendo que las letras están distribuidas uniformemente. Es obvio que vuleve a salir equiprobable; es decirp(0) =p(1) = 1₂.

Ahora vamos a suponer que sólo nos interesa enviar palabras en castellano. Entonces es conveniente tomar en cuenta la distribución de las letras y demás caracteres del castellano, que aparecen a continuación.

Distribuci´

on de las letras del castellano y el espacio

S´ım-bolo Proba-bilidad E 0,1460 t 0,1140 A 0,1041 O 0,0756 L 0,0729 S 0,0685 N 0,0610 D 0,0598 R 0,0430 U 0,0418 I 0,0361 S´ım-bolo Proba-bilidad T 0,0288 C 0,0254 P 0,0240 M 0,0185 Y 0,0134 Q 0,0133 . 0,0097 B 0,0080 H 0,0078 G 0,0064 F 0,0045 S´ım-bolo Proba-bilidad V 0,0034 0,0029 J 0,0027 ˜ N 0,0026 ( 0,0019 ) 0,0019 Z 0,0013 X 0,0005 K <0,0001 W <0,0001

(10)

Esta tabla ya es una fuente, pues tiene sus s´ımbolos y su distribución. No-sotros queremos una fuente EN BINARIO y que considere la aparición de 0 y 1 como sucesos independientes. Vamos a calcular la distribución de la fuente para

A ={0,1} tomando la tabla de imitación del código ASCII y la distribución anterior.

Las cuentas para la nueva distribuci´on las haremos simplemente calculando las probabilidades del 0 y 1, de la forma habitual, por ejemplo,

p(0) = X

s´ımbolos

p(s´ımbolo)·p(0|s´ımbolo)

y lo mismo conp(1). As´ı obtenemos

Distribuci´on con la tabla binaria y las letras del castellano.

S´ımbolo Probabilidad 0 0,6137 1 0,3863 Un ejemplo m´as manejable es el siguiente.

1.2.2. Ejemplo. Supongamos que en la situaci´on del GPS (1.1.3), conocemos una distribuci´on.

S´ımbolo Probabilidad Codificaci´on

↑ 1/2 00

↓ 1/4 11

→ 1/16 10

← 3/16 01

Igual que antes, calculamos la nueva distribuci´on binaria. Distribuci´on con la tabla binaria y el GPS.

S´ımbolo Probabilidad

0 5/8

1 3/8

Medida de informaci´

on

En vista de lo anterior, queremos determinar la cantidad de informaci´on o grado de incertidumbre para un s´ımbolo o una palabra; o m´as bien, el suceso de que aparezca.

Supongamos que tomamos una muestra de una fuente de informaci´on (A,P); es decir, elegimos aleatoriamente un elemento de la fuente de acuerdo con la

(11)

distribución de probabilidades que tiene. Entonces, ANTES de que el mues-treo tenga lugar existe una cantidad de INCERTIDUMBRE asociada con la aparición y, DESPU ÉS de recoger la muestra, hemos ganado cierta cantidad de INFORMACI ÓN. As´ı, aunque ambos conceptos tendrán asociada la misma cantidad, que denotaremos conI(a)1, paraa∈ A, el grado de incertidumbre es un conceptoa priori mientras que la cantidad de información es un conceptoa posteriori.

Ahora queremos un modelo para calcular la cantidad de informaci´on. Lo haremos en dos pasos.

1. Como hemos visto, el concepto de cantidad de información está asociado con la probabilidad de tal forma que queremos que haya más información cuanto menos probable sea el suceso. En términos de matemáticas, que-remos una proporción inversa. As´ı que buscamos una función de la forma

f(1/p), donde f ser´ıa una funci´on creciente (por lo pronto la identidad sirve, pero todav´ıa no terminamos con las exigencias).

2. Consideremos el caso en que los sucesos son independientes (el caso más simple). Nos interesa quela cantidad se comporte como tal, es decir que la cantidad de información asociada a la intersección de sucesos sea la suma de sus cantidades. Como bien sabemos, la probabilidad de que ocurran dos o más sucesos, digamos p(a) = p y p(b) = q, es el producto de sus probabilidades; esto es pq; as´ı que necesitamos que cumpla la siguiente propiedad f 1 pq =f 1 p +f 1 q

De toda la vida conocemos el siguiente resultado. 1.2.3. Teorema. Seaf : (0,1]→_Runa funci´on tal que:

1. f es decreciente y

2. f(xy) =f(x) +f(y)para todox, y∈(0,1].

Entonces existe una constantek <0 tal quef(x) =kln(x).

Demostración. Por usar un libro de códigos, véase [6, Proposición 2.2.2], o cual-quier libro de cálculo.

Esto nos lleva a la siguiente definici´on.

1.2.4. Definición. Sea (A,P) una fuente de información. El grado de incer-tidumbre o la cantidad de información (binaria) asociado al s´ımbolo a∈ A (al suceso de que éste aparezca) está dado por

I(a) = log₂

₁

p(a)

siempre quep(a)6= 0. En el casop(a) = 0, diremos que no podemos determinar la informaci´on.

(12)

En principio, la elecci´on del logaritmo en base 2 es arbitraria y se puede definir informaci´onn-aria. En base 2, la unidad queda establecida en un canal binario equiprobable.

Sea (A,P) una fuente de informaci´on donde A = {a, b} (puedes sustituir por 0 y 1 si quieres) yP =p= 1₂, q=1₂ . En este caso, es trivial queI(a) =

I(b) = 1; pues log₂1_p= log₂

1 (1 2) = log₂(2) = 1. As´ı que

1.2.5. Definici´on. Un bit es la cantidad de informaci´on (binaria) que tiene un elemento de una fuente binaria y equiprobable.

N´otese que en una fuente equiprobable con tres elementos, la cantidad de informaci´on (binaria) que tiene cada s´ımbolo es MAYOR que un bit.

1.2.6. Ejemplos.

1. En la situaci´on de (1.2.1), podemos calcular algunas cantidades de infor-maci´on usando la fuente de las letras del castellano yu su paso a binario.

I(E) = 2,7760 bits.

I(I) = 5,1178 bits.

I(Z) = 9,5872 bits.

Adem´as, en la tabla de la distribuci´on binaria, I(0) = 0,7744 e I(1) = 1,3722.

2. En la situaci´on de la distribuci´on del GPS (1.2.2) se tiene: a) I(↑) = 1.

b) I(↓) = 2. c) I(→) = 4.

d) I(←) = 4−log₂(3).

3. Ahora vamos a ver un caso trivial, que a veces ilustran. Sea (A,P) una fuente de información dondeA={a}, sólo tiene un s´ımbolo. En este caso, trivialmente, I(a) = 0 y esto nos corrobora algo obvio. Si sólo hay un s´ımbolo, no hay información.

Entrop´ıa

Según el diccionario de la RAE, entrop´ıa tiene dos usos. El primero en f´ısica: medida del desorden de un sistema. El segundo en teor´ıa de la información: medida de incertidumbre (y en consecuencia, de información).

Formalmente, laentrop´ıa (binaria) de una fuente de información, digamos (A,P), es el promedio ponderado de la cantidad de información (cuando esté de-finida, claro) de los s´ımbolos deA; es decir,

H(A,P) =X a∈A p(a)I(a) =X a∈A p(a) log₂ ₁ p(a) ( bits ).

(13)

A efectos de c´alculo, usaremos la convenci´on de que si p(a) = 0 entonces

p(a)I(a) = 0 =p(a) log₂_p₍1_a₎ya que 0 = l´ımx→0xlog2 1

x

. 1.2.7. Ejemplos.

1. En la situaci´on del castellano (1.2.1) se tiene que entrop´ıa del alfabeto y los s´ımbolos es 4,0665, mientras que la del binario es 0,9624.

2. En la situaci´on del GPS (1.2.2) se tiene que la entrop´ıa de las flechas es 2−3 log₂(3)/16, mientras que la del binario correspondiente es 3−

(5 log₂(5) + 3 log₂(3))/8. La siguiente propiedad es crucial

1.2.8. Teorema. Sea(A,P)una fuente de informaci´on. Entonces0≤H(A,P)≤

log2(|A|).

A´un m´as,

1. H(A,P) = 0 si existep(a) = 1con a∈ Ay

2. H(A,P) = log₂(|A|) si la distribuci´on es equiprobable.

Como caso particular, muy importante, tenemos la fuente A = {0,1} con distribuci´onP ={p,1−p}. En este caso

H(A,P) =plog₂(1

p) + (1−p) log2(

1 1−p).

A´un m´as, se puede probar que H(An_,_P0_{) =} _nH₍_A_,_P_{). En [11] y [9] se}

tienen cap´ıtulos completos dedicados a propiedades de la función de entrop´ıa. La naturaleza de los s´ımbolos suele ser sustituida por la probabilidad de que aparezcan; por eso, cuando se es más formal, las funciones de entrop´ıa sólo tienen como argumento la distribución de probabilidades, como la binaria, H2(p) =

H2(p,1−p). De hecho, la entrop´ıa es un concepto puramente probabil´ıstico.

1.3. Capacidad de un canal con interferencias

Sea (A,P) una fuente de información que se va a enviar a través un canal, y seaSel conjunto de s´ımbolos de salida. Vamos a suponer que el canal es discreto y sin memoria; es decir, suponemos que los conjuntos de s´ımbolos Ay S son finitos y que la transmisión de un s´ımbolo no está influida por la transmisión anterior.

Entendemos por “enviar informaci´on por un canal”, como transmisiones completas; es decir, el env´ıo de un s´ımbolo del alfabeto de entrada implica la recepci´on (completa) de un s´ımbolo del de salida. Formalmente:

1.3.1. Definici´on.

Un canal discreto consiste en un alfabeto de entrada A, un alfabeto de salida S, ambos finitos, junto con una distribuci´on de probabilidades con-dicionadas{p(s|a) | (a, s)∈ A × S}.

(14)

Le llamaremos adem´as sin memoria cuando se verifique que, sia=a1· · ·an

y s =s1· · ·sn son palabras de los alfabetos A y S, respectivamente,

en-toncesp(s|a) =Qn

i=1p(si|ai).

Transmitir un s´ımbolo (de entrada) a través del canal significa asociar a dicho s´ımbolo, aleatoriamente, un s´ımbolo de salida según la distribución condicionada anterior.

Por su definici´on, todo canal discreto, una vez ordenados los s´ımbolos del alfabeto, tiene asociada una matriz cuyas entradas son las probabilidades con-dicionadas. Llamaremosmatriz del canal (seg´un cierto orden)a dicha matriz.

Al enviar información por un canal con interferencias ocurrirá que entrará un s´ımboloa∈ A (o una palabra) y puede llegar al receptor uno (y sólo uno) de los tres casos:

1. El s´ımbolo de salida deseado (por ejemplo el propioa) (acierto) 2. Un s´ımbolo no deseado (error)

3. Un s´ımbolo imposible de interpretar (borrón o borradura,erasure). El hecho de que exista un s´ımbolo de salida deseado nos llevará finalmente a la idea de pérdida de información (por falta de fiabilidad). Intuitivamente, po-demos darnos una idea de fiabilidad por medio de la probabilidad condicionada. La existencia de probabilidad condicionada implica que se genere información, cuya media ponderada, como siempre, será llamada entrop´ıa condicionada y que veremos a continuación.

Entrop´ıa condicionada y conjunta

Emitir un s´ımboloa∈ Ade la fuente de entrada y recibir un s´ımbolos∈ S

de salida tiene asociadas entonces las siguientes probabilidades:

1. La probabilidad, p(a), de que se env´ıe a ∈ A, con lo que hacemos una fuente (A,P) (ya conocemos la entrop´ıa asociada,H(A,P)).

2. La probabilidad condicionadap(s|a), cona∈ Ays∈ Sy al conocer ahora

p(a), obtenemos la otra probabilidad condicionadap(a|s), que interpreta-remos como “la probabilidad de que habiendo recibido s ∈ S se hubiese enviadoa∈ A”.

3. La probabilidad p(s) = P

a∈Ap(a)p(s|a) de que se reciba s ∈ S (luego

tambi´en podremos calcular su entrop´ıa).

4. Por ´ultimo, la probabilidad de que se emitaa, y se recibas, que denotamos

p(a∩s).

1.3.2. Observaci´on. Es sabido que, por definici´on, p(a∩s) = p(a)p(s|a) =

(15)

La situación anterior determina tres informaciones nuevas a partir de las cuales se puede calcular entrop´ıa. Como la relación entre información y entrop´ıa es muy clara y sencilla, vamos directamente a centrarnos en las tres nuevas entrop´ıas.

Primera. El suceso “se recibe (o asocia) s ∈ S a alg´un s´ımbolo de en-trada” determina una nueva fuente de informaci´on para los s´ımbolo de S, que denotamos (S,Q). As´ı, obtenemos una entrop´ıa que llamaremosH(S,Q).

La segunda es entrop´ıa propia de la transmisión a través del canal o en-trop´ıa de lainformación condicionada; es decir, la incertidumbre sobre el origen de cada s´ımbolos∈ S recibido o la incertidumbre sobre el s´ımbolo que se reci-birá al enviar una∈ A, que ya sabemos que coinciden.

1.3.3. Definici´on. Sean A= (A,P)y S = (S,Q)fuentes de informaci´on (o dos variables aleatorias).

1. La entrop´ıa condicionada para un elementos∈ S es la media

H(A|s) =X a∈A p(a|s) log₂ ₁ p(a|s) .

2. La entrop´ıa condicionada es entonces

H(A|S) =X

s∈S

p(s)H(A|s).

An´alogamente se definen H(S|a)y H(S|A).

En t´erminos de la transmisi´on podemos decir en palabras, que la entrop´ıa condicionada mide la incertidumbre sobreA, una vez que se conoceS.

La terceraes la entrop´ıa conjunta, que proviene de la probabilidad conjunta

p(a∩s), que denotamos H(A,S) cuando las distribuciones est´en fijadas. La definici´on es obvia pero la escribimos.

1.3.4. Definición. SeanA= (A,P)y S = (S,Q) fuentes de información. La entrop´ıa conjunta es la media ponderada de la información conjunta; es decir,

H(A,S) = X a∈A,s∈S p(a∩s) log2 ₁ p(a∩s) .

Las siguientes propiedades son f´aciles de verificar y aparecen, por ejemplo, en [11, Cap´ıtulos 1 y 3]

1.3.5. Teorema. Sean A = (A,P) y S = (S,Q) fuentes de informaci´on (o m´as en general, variables aleatorias). Entonces:

1. H(A,S)≤H(A) +H(S) y la igualdad ocurre si y s´olo si las variables son independientes.

(16)

3. H(A|S)≤H(A).

Ahora tenemos que llevar los conceptos anteriores a la situación en que la probabilidad conjunta es la incertidumbre sobre el or´ıgen de un s´ımbolo, lo cual interpretaremos como pérdida de la información.

Informaci´

on mutua y capacidad

Imaginemos que tomamos la muestraa∈ A y enviamos el s´ımbolo a trav´es del canal. Ahora el receptor tiene un s´ımbolo s ∈ S. Si el suceso de recibir s

implica que fue enviadoaentonces el emisor y el receptor tienen la misma infor-mación. Si el receptor no está seguro de que el s´ımbolo enviado fueaentonces el emisor (que tiene el s´ımbolo) tiene más informaciónoriginalque el receptor. As´ı, podemos interpretar la entrop´ıa condicionada como “la información que se va a perder (por un problama de fiabilidad)” sobreAo como “puedes equivocarte” en la elección del origen de un s´ımbolo y por tanto fallar en el conocimiento de la información original.

Probabil´ısticamente, la informaci´on mutua de dos fuentes de informaci´on,A

yS, esla cantidad de información que tieneAmenos la cantidad de información que queda deA una vez que se conoce S.Es decir, la cantidad de información sobreAen virtud del conocimiento deS.

1.3.6. Definición. Sean A= (A,P) y S = (S,Q) fuentes de información de un canal discreto y sin memoria. La información mutua entre las fuentes es

I(A,S) =H(A)−H(A|S) =H(S)−H(S|A)

Vamos a ver un par de ejemplos extremos que ilustren nustra interpretaci´on. 1.3.7. Ejemplos.

1. Supongamos que A,S son fuentes de información equiprobables de un canal donde la distribución conjunta también es equiprobable (y por tanto independiente). Por (1.2.8) y (1.3.5) se tiene que H(A|S) = H(A) que nos indica queuna vez que conocesS tienes la misma incertidumbre sobre

A y por tanto la informaci´on mutua es I(A,S) = 0 (perdimos toda la informaci´on al transmitir).

2. El otro extremo. Supongamos que A = S y para todo a ∈ A se tiene que p(a|a) = 1, as´ı que p(a|s) = 0 si a 6= s. En este caso, la entrop´ıa condicionada vale H(A|S) = 0 y nos indica que una vez que recibimos, digamos a = s, ya no hay incertidumbre sobre el origen, seguro que el origen fue a y la informaci´on mutua es I(A,S) = H(A) (conservamos toda la informaci´on al transmitir).

Desde el punto de vista de la corrección de errores de transmisión, donde dado un s´ımboloa∈ Atenemos un “favorito” s∈ S, la información mutua da una medida de lafiabilidad de una transmisión.

Ahora vamos a definir la capacidad de un canal. Consideremos un canal con s´ımbolos de entradaAy de salidaS y todas las posibles fuentes AP = (A,P).

(17)

Cada fuente determina otraSP = (S,QP) y con ellas se tiene una informaci´on

mutua, que denotamosI(AP,SP).

1.3.8. Definici´on. La capacidad de un canal es el valor m´aximo de las infor-maciones mutuas; es decir,

C(A) = m´ax{I(AP,S) | P es una distribuci´on}

Desde el punto de vista de la transmisi´on, donde tenemos “favoritos” la capacidad de un canal ser´a su fiabilidad.

1.3.9. Ejemplo. Canales sim´etricos

Un canal decimos que es sim´etrico (por filas y columnas) si al formar la matriz del canal, los conjuntos de valores de las entradas de todas las filas son iguales y lo mismo ocurre con las columnas; es decir que, salvo el orden, todas las filas tienen las mismas entradas y lo mismo ocurre con las columnas.

En este caso, se puede probar que la capacidad del canal se alcanza con la distribuci´on equiprobable enAy es log₂(|A|)−H(S|a) donde el sustraendo es constante para todoa∈ Ayp(a) = _|A|1 .

Como caso particular, vamos a calcular la capacidad del canal sim´etrico binario. Aqu´ı se sigue el esquema

0 1−p -H H H H H H H H j p 0 1 1−p * p 1

dondep≤1/2. (Si fuesep≥1/2, hacemos que al recibir se cambie el d´ıgito.) La distribuci´on condicionada se refleja en la matriz

(pij) =

1−p p p 1−p

que llamaremos la matriz del canal.

Entonces, como el m´aximo se alcanza cuando la fuente es equiprobable, tomamosA={0,1}=S,P ={1/2,1/2}. Luego, H(A) = 1 2log2 ₁ 2 +1 2log2 ₁ 2 = 1 H(A|A) = 2 X i=1 1 2· 2 X j=1 pijlog2 ₁ pij = = −(1−p) log₂(1−p)−plog₂(p) y por tanto

(18)

1.4. C´

odigos correctores de errores

Vamos a establecer el contexto que será nuestra hipótesis de trabajo. Te-nemos un canal discreto y sin memoria, digamos C y un conjunto (finito) de s´ımbolos de entrada al canal (el alfabeto),A, junto con una distribución de pro-babilidades; la de que aparezcan al enviar mensajes. A la pareja del alfabeto y la distribución de probabilidades se le llama una fuente de entrada. Por su par-te, tenemos también un conjunto de s´ımbolos de salida,_Fcon una distribución dada porp(_F=v) =P

Ap(v|a)p(a=A), en la notaci´on habitual del c´alculo de

probabilidades.

Para cada entrada a ∈ A hemos elegido un ´unico s´ımbolo sa ∈ F, que

llamaremos el s´ımbolo correspondiente o deseado para a. Diremos que se ha producido un error de transmisi´on cuando habiendo enviado el s´ımbolo a, el s´ımbolo recibido no seasa. Supondremos que la correspondencia es biyectiva.

Vamos a hacer algunos c´alculos suponiendo que la correspondencia naterior es biyectiva.

1. La probabilidad de cometer un error habiendo enviado el s´ımboloa∈ A

a trav´es de C, es

pe,C(a) =

X

s∈S

p(s6=sa|a) = 1−p(sa|a). (1.4.1)

2. Entonces, la probabilidad de que se cometa un error al enviar alg´un sim-bolo es la media ponderada

Pe,C = X a∈A p(a)pe,C(a) = X a∈A p(a) (1−p(sa|a)) = X a∈A p(a)−X a∈A p(a∩sa) = 1− X a∈A p(a∩sa) = 1−X a∈A p(a|sa)p(sa).

De la lista de igualdades anteriores uno usa la que convenga.

1.4.1. Ejemplo. Supongamos que tenemos un cuerpo finito _Fcomo conjunto de s´ımbolos de entrada y salida, con distribuciones equiprobables en un canal

C. Sip(x|x) = 1−pentonces peC(x) =pyPe,C=p.

Corrección de errores de transmisión. Esquemas y errores de decisión El objetivo de los códigos correctores de errores es añadir información (re-dundancia) al mensaje para poder recuperarlo aún cuando se hayan producido (no muchos) errores durante la transmisión. Como veremos, la clave está en la manera como agregamos la información; es decir, cómo codificamos y también cómo descodificamos. Es ah´ı donde interviene la matemática.

(19)

Figura 1.4.1: Correcci´on de errores emisor canal con interferencia receptor codificador decodificador -6 -6 correcci´on de errores 6

En la práctica, para trabajar con códigos en bloques podemos sustituir, respetando la distribución de probabilidades, los s´ımbolos de entrada y salida por un cuerpo finito _F al que seguiremos llamando alfabeto. Haremos M =

P alk(A) =Fk y la codificación será una aplicaciónC :Fk →Fn y as´ı, nuestro

c´odigo en bloques ser´a ImC=C⊆_Fn_.

Consideremos_Fn_{, el conjunto de las palabras de longitud}_n_{. Un}_{esquema de}

decisión es una función parcial de Fn a las palabras del código; es decir, una

relación donde no todo elemento del dominio tiene imagen (aquellas palabras, que no sepamos cómo corregir, no tendrán imagen). Para cadac∈C, definimos

Bc={v∈Fn | f(v) =c}. (1.4.2)

Comof es aplicaci´on parcial entonces los{Bc}c∈Cson disjuntos aunque tal vez

no sean una partici´on deFn.

Consid´erese, pues, un esquema de decisi´on f : Fn −−−−−−→parcial C. Para una

palabra s ∈ Fn, si f(s) est´a definido, entonces el esquema “decide” que la

palabra enviada fue f(s). Si f(s) no fue la palabra enviada decimos hemos cometido unerror de decisi´on.

A continuaci´on, vemos un gr´afico del proceso completo, donde denotamos

Fn C Fn la transmisión a través del canalC. Fk−−−−−−−−→codificación C⊆Fn C Fn

esquema

−−−−−−→C−−−−−−−−−−→decodificaci´on _Fk

1.4.2. Observación. Ya cuando estemos concentrados en los códigos, a estos errores los llamaremos errores de decodificación. La razón es que se considera la decisión o corrección como parte de la decodificación.

Vamos a calcular la probabilidad de cometer un error de decisi´on al “corre-gir” errores. Una vez fijado un c´odigo,C, tendremos que calcular la probabilidad

(20)

de que una palabrac∈Csea enviada, y esto necesariamente determina una dis-tribuci´on de la fuente. N´otese que esto no influye en la probabilidad de cometer un error una vez que se tome una palabra, pues viene dado por la Igualdad 1.4.1. Por su parte, para cada vectorv ∈Fn tendremos que calcular la probabilidad

de que aparezca en una decodificaci´on. Se calcula comop(v) =P

c∈Cp(v|c)p(c).

Como el canal es sin memoria se tiene que, sic=c1. . . cn yv=v1. . . vn

enton-cesp(v|c) =Qn

i=1p(vi|ci), dondep(vi|ci) es la probabilidad condicionada de las

fuentes de entrada y salida de la Igualdad 1.4.1.

Por definici´on, decimos que hemos cometido un error de decisi´on cuando habiendo enviado la palabrac∈Crecibimos la palabrav6∈Bc; luego la

proba-bilidad condicionada que elegimos usar esp(v|c), y la calcularemos de diversas maneras. As´ı, para una palabrac∈C enviada, la probabilidad es

pe(c) = X v6∈Bc p(v|c) = 1− X b∈Bc p(b|c) !

y la probabilidad total de error de decisi´on es, en vista de que P

c∈Cp(c) = 1 Pe(C) = X c∈C p(c)pe(c) = X c∈C p(c)   X v6∈Bc p(v|c)   = 1−X c∈C X b∈Bc p(c)p(b|c) = 1− X v∈Fn p(v∩f(v))

ya que, sib ∈Bc entonces c =f(b) y as´ıp(c)p(b|c) =p(b∩f(b)). La suma se

completa a todov∈_Fn _{asumiendo que si}_v_{6∈ ∪}

c∈CBc entoncesp(v∩f(v)) = 0,

dado quef(v) no existe.

Para eliminar la suma doble quitamos la dependencia de que aparezca cada palabra y tomamos el error m´aximo; es decir, definimos

P_emax(C) = m´ax{pe(c) | c∈C}.

Claramente,

Pe(C)≤Pemax(C)

Entonces, para poder calcular la probabilidad total de error de decisión ne-cesitamos tres ingredientes: el primero es la distribución{p(c) | c∈C}, el se-gundo es la distribución{p(v|c) | (c, v)∈C×Fn}y el otro es la familia{Bc}.

1.4.3. Ejemplos. Vamos a ver algunos esquemas de decisión. Transmitimos en un canal discreto y sin memoria con s´ımbolos de entrada y salida F. Sea C ⊂ Fn un código con |C| =M. Considérense los siguientes esquemas de decisión

f :Fn−−−−−−→parcial C,

1. Supongamos que para cadac ∈C yv ∈Fn conocemosp(c|v). Con estos

datos definimos p(C|v) = {p(c|v) | c∈C} y podemos definir f(v) ∈C

como el vector tal que p(f(v)|v) = máxp(C|v). Este esquema se conoce comoerror m´ınimo en la decodificación de probabilidad a posterioriy tiene la propiedad de que minimiza el error de decisión medio.

(21)

2. Un esquema alternativo es considerar la otra probabilidad condicionada. En este caso, para cada v ∈Fn, definimos p(v|C) = {p(v|c) | c∈C} y

f(v) como el vector tal que p(v|f(v)) = máxp(v|C). Este esquema se conoce comomáxima verosimilitud en la decodificación de probabilidad a posteriori.

1.5. Teorema de Shannon

Como hemos visto en la secci´on anterior, codificar implica, entre otras cosas, sumergir un c´odigoC en un conjunto “ambiente”Fn, tal que la longitud de sus

palabras, digamosn, sea mayor o igual que la longitud original de las palabras, digamosk.

En esta situación, es claro que el canal tiene que transmitirn s´ımbolos del código para que podamos conocerks´ımbolos de la fuente; es decir, tenemos una tasa deR=k/n-s´ımbolos de la fuente por cada s´ımbolo del código ya que, con-forme a la definición usual de tasa, es el cociente del número de s´ımbolos válidos que vamos a producir sobre el total de s´ımbolos que tenemos que transmitir.

Nótese quek= log_|A|(|C|). As´ı llegamos al concepto de tasa de transmisión. 1.5.1. Definición. La tasa de trasmisión de un código C ⊆ An _{es el cociente}

del número de s´ımbolos que originalmente tiene una palabra sobre el número necesario de s´ımbolos para transmitirla usando dicho código.

R(C) =log|A|(|C|)

n

Como veremos, el teorema de Shannon nos dice que mientras mantengamos la tasa de transmisión por debajo de la capacidad del canal, podemos compensar la pérdida de información que se produce en el canal al grado de precisión que deseemos.

1.5.2. Teorema [Shannon]. Sea C un canal discreto y sin memoria, con ca-pacidadC(C) =C. Entonces, para cualquier n´umero R <C existe una sucesi´on

Cn de c´odigosq-arios, junto con sus esquemas de decisi´onfn, que cumplen:

1. Cn es un c´odigo de longitudn, y |Cn|=dqRneelementos; es decir, tiene

tasa al menosR.

2. La probabilidad de error m´axima de los esquemasfn tiende a0 cuandon

tiene a infinito; es decir,

l´ım

n→∞P

max

e (Cn) = 0.

(22)

Cap´ıtulo 2

Generalidades sobre

C´

odigos

2.1. Conceptos b´

asicos

Una vez que hemos fijado la intención y el contexto del estudio de los códigos correctores de errores, vamos también a fijar un poco la notación.

2.1.1. Definici´on. Sea Aun alfabeto (finito), con|A|=q, y consid´erese An_,

como siempre. Llamamos c´odigo q-ario en bloques de longitud n a cualquier subconjunto no vac´ıo deAn_{. Al propio} _An _{lo llamamos el conjunto ambiente.}

SeaM =|C|. Decimos queCtiene par´ametros(n, M), o queCes un(n, M )-c´odigo sobreA.

A los elementos deC les llamaramos palabras del c´odigo.

2.1.2. Notaci´on. A los largo de todo el texto, nuestros alfabetos ser´an siempre cuerpos finitos que denotaremos F o Fq, para q = pr, con p, r ∈ N y p primo

(cuando queramos hacer énfasis en el cardinal) y entenderemos por código un código corrector de errores definido en bloques. El conjunto ambiente será_Fn_,

a quien llamaremos el espacio ambiente.

2.1.3. Ejemplo. [C´odigos de repetici´on] Consideremos aF2y supongamos que

solo queremos enviar los mensajes “s´ı” y “no”. Vamos a suponer tambi´en que de alguna manera sabemos que el canal comete a lo m´as dos errores cada 5 emisiones. Usamos entonces 5 d´ıgitos como sigue.

s´ı7→00000. no7→11111.

El c´odigo es entoncesC={00000,11111}.

Para crear este código hemos hecho posiblemente lo más antiguo que se hace para eliminar errores, REPETIR la palabra (5 veces). Este tipo de códigos se llamancódigos de repetición.

(23)

Distancia m´ınima y correcci´

on

Vamos a abordar un nuevo esquema de decisión que también será del tipo de máxima verisimilitud. Esta noción corresponde a la idea “más cerca mientras menos errores se hayan cometido”, sin importar cuáles fueron los d´ıgitos que se cambiaron.

Vamos a formalizar un poco a este esquema de decisi´on porque es el ´unico que usaremos en el curso.

2.1.4. Definici´on. Sea _Fun cuerpo.

La distancia de Hamming entre dos vectoresu, v∈_Fn _{es el n´}_{umero natural:}

d(u, v) =|{ı∈ {1, . . . , n} | u(ı)6=v(ı)}|.

La distancia m´ınima de un c´odigo,C⊆Fn es

d(C) = m´ın{d(u, v) | u, v ∈C}.

La siguiente definición es una variante útil en algunos cálculos, pero sobre todo lo será cuando los códigos sean espacios vectoriales.

2.1.5. Definici´on. Sea_F un cuerpo. Para un vector u∈_Fn _{definimos el peso}

deucomo

ω(u) =|supp(u)|=d(0, u).

2.1.6. Proposici´on. SeaCun c´odigo sobre un alfabetoF. Entonces la distancia

de Hamming cumple los axiomas de m´etrica; a saber, 1. d(u, v) = 0si y solo siu=v.

2. d(u, v) =d(v, u).

3. d(v, u)≤d(u, z) +d(z, v).

2.1.7. Observaci´on. Es f´acil comprobar las siguientes afirmaciones sobre la distancia y el peso. Seanu, v∈Fn.

1. d(u, v) =ω(u−v). 2. ω(v) +ω(u+v)≥ω(u).

3. Si_F=_F2; o sea, el caso binario,d(u, v) =ω(u) +ω(v)−2ω(u ? v), donde

“?” es el producto coordenada a coordenada.

4. En el caso no binario, hay contraejemplos al apartado anterior.

2.1.8. Ejemplo. El ISBN (International Standard Book Number) es un c´odigo de 11 s´ımbolos; a saber,{0,1, . . . ,9, X}, y palabras de longitud 10 divididas en 4 grupos de datos, que describimos a continuaci´on.

Todos los s´ımbolos, salvo posiblemente el ´ultimo, son num´ericos.

El primer grupo tiene un d´ıgito e indica el idioma en que est´a escrito el libro.

(24)

CAP´ITULO 2. GENERALIDADES SOBRE C ´ODIGOS 23

El siguiente grupo tiene 2 d´ıgitos e indica la editorial.

El tercer grupo tiene 6 d´ıgitos y los asigna la propia casa editorial. El cuarto grupo tiene un solo d´ıgito (num´erico o X). El d´ıgito de control (check sum).

El d´ıgito de “control” es lo que nos interesa. Se calcula con la forma “com-pleta a 10”; es decir, six1, . . . x9son los d´ıgitos, hacemos

−10x10≡x10≡ 9

X

i=1

i·xi m´od 11

porque 10≡ −1 m´od 11. Es decir quex10cumple que 10

X

i=0

i·xi≡0 m´od 11.

La parte izquierda de la congruencia se llamasuma de verificaci´on del pesado dex1. . . , x10.

El problema aqu´ı es quex10= 10 es un valor posible y solo podemos escribir

UN d´ıgito. Entonces, en ese caso hacemos x10 = X y a efectos de c´alculo ya

sabemos qu´e n´umero asignar.

Por ejemplo, el c´odigo 0−19−859617−0 (los guiones se pueden poner donde uno quiera). El primer d´ıgito nos dice 0, que es ingl´es. Los dos siguientes 19 son de Oxford University Press, el 859617 es el asignado por la Casa y

P9

i=1i·xi= 253≡0 m´od 11.

Vamos a ver los par´ametros de este c´odigo. El espacio ambiente es _F10 11.

Los d´ıgitos x1, . . . , x9 solo tienen restricci´on en el alfabeto (no pueden ser 10

o X); as´ı que M = 109 _seg´_{un la definici´}_{on de c´}_{odigo, y la distancia m´ınima es}

d(ISBN) = 2, ya que lo menos que difieren dos palabras ANTES del d´ıgito de control es 1, pero luego van a diferir en el d´ıgito, as´ı que serán al menos 2. Más adelante veremos que este código detecta un error pero no corrige error alguno. Por lo pronto, vamos a comprobar que si se comete un error entonces el código lo detecta. Seanx=x1. . . x10 y supongamos que se comete un error que

cambiaxi0poryi0. Hacemosyla palabra alterada. Entoncesx−y=i0(xi0−yi0). N´otese que nii0ni xi0−yi0 son m´ultiplos de 11, por lo que 11-y.

A partir de esta métrica, el esquema de decisión más simple que podemos definir es lo que llamaremos “ el esquema de la fuerza bruta”. A diferencia de otros esquemas, éste es una aplicación. Vamos a ver cómo se construye. 2.1.9. Esquema de la fuerza bruta. Considérese un códigoC ≤Fn. Para

todo vector v ∈Fn se define mv = m´ın{d(v, c) | c∈ C} y a continuaci´on se

(25)

No hace falta esforzarse mucho para percibir claramente que el gasto en operaciones de este esquema es tan grande que lo hace inviable en cualquier c´odigo grande. Esto nos obliga a recurrir a esquemas que aunque resultan menos exhaustivos se pueden llevar a cabo.

Para determinar el siguiente esquema (véase la Ecuación 1.4.2) usaremos bolas cerradas de algún radio con centro en las palabras del código; es decir, si

c∈C⊆Fyr∈N,

Br(c) ={w∈Fn | d(c, w)≤r}.

Es importante tomar en cuenta que si construimos un esquema de decisi´on, las bolas (cerradas) han de ser disjuntas dos a dos. Esto pone fuertes limitaciones al radio y nos hace detenernos en su estudio.

2.1.10. Lema. Sea C un c´odigo en _Fn _{con distancia m´ınima} _d _{y sea} _r _∈ N.

Las bolas{Br(c) | c∈C} son disjuntas si y solo sir≤ bd−₂1c=t.

Demostraci´on. ⇒]. Primero, sean c, c0 ∈ C tales que d(c, c0) = d. Si r > d

entonces Br(c)∩Br(c0) 6= ∅ y hemos terminado. Entonces, podemos suponer

quer < d.

Supongamos quer > t. N´otese primero que sir >d−₂1 entonces 2r > d−1, as´ı quer+ 1> d−r, luegor≥d−r.

Seanc = (c1, . . . , cn) y c0 = (c01, . . . , c0n) como antes, tales que d(c, c0) =d,

concij 6=c

0

ij y los otros cik =c

0

ik, k6=j, conj= 1, . . . , d. Seav= (v1, . . . , vn)

tal quevij =cij para j = 1, . . . , r y vik =c

0

ik parak =r+ 1, . . . , d. El resto,

iguales. Entoncesd(c0, v) =ryd(c, v) =d−r≤r, por tantov∈Br(c)∩Br(c0),

lo cual es imposible.

⇐] Supongamos quev∈Br(c)∩Br(c0), conc, c0∈C. Entonces

d(c, c0)≤d(c, v) +d(v, c0)≤ bd−1

2 c+b

d−1

2 c ≤d−1< d, lo cual es imposible.

Por eso, al n´umerot=bd−1

2 cse le conoce tambi´en comoradio de

empaque-tado; es fácil ver que es el máximo de los radios que hacen a las bolas disjuntas dos a dos (véase [11, 12]). Como veremos un poco más adelante, attambién se le conoce como lacapacidad de corrección.

2.1.11. Observaci´on. Entonces, para un c´odigo C ⊆Fn, se tiene que sir ≤

d−1 2

, el conjunto de bolas {Br(c) | c∈C} induce el esquema de decisi´on

f :Fn−−−−−−→parcial C tal quef(u) =c ⇔ d(u, c)≤r parac∈C yu∈Fn.

Este esquema es viable de implementar pues uno de antemano sabe, para cada v ∈ Fn, qui´en es su correspondiente f(v) en caso de existir y as´ı, por

ejemplo, se puede construir una tabla, aunque pueda ser gigante.

De la definici´on de nuestro esquema se puede deducir con facilidad la segunda parte del siguiente resultado.

(26)

1. C puede detectar hasta d(C)−1 errores. 2. C puede corregir hasta bd(C₂)−1cerrores.

Demostraci´on. (1) Seacla palabra enviada yvla palabra recibida. Sivprovine de haber cometido menos ded(C)−1 errores al transmitircentoncesd(c, v)≤

d(C)−1 y por tantov6∈C.

(2) Sea de nuevo,c la palabra enviada yv la recibida. Si se han cometido a lo mást=bd(C₂)−1cerrores entonces v∈Bt(c) y se corregirá con éxito.

2.1.13. Definición. Para un código C, se define la capacidad de corrección comot=bd(C₂)−1c.

2.1.14. Definición. Un(n, M, d)-código es un código de longitudn, que con-tieneM palabras y tiene distancia m´ınimad.

Errores de decisi´on en el esquema de la distancia de Hamming Vamos a calcular la probabilidad de cometer un error en este esquema de decisi´on. Sea _F un cuerpo finito y C ⊆ _Fn _{un c´}_{odigo con distancia m´ınima}

d(C) =dy capacidad de correcciónt=bd(C₂)−1c. Ya sabemos que si se cometen a lo más terrores en la transmisión no habrá error de decisión.

Vamos a calcular entonces la probabilidad de que se cometan m´as det erro-res. Eso depende de las probabilidades de cometer errores al enviar los s´ımbo-los. La probabilidad de que se cometa un error al enviar un s´ımbolox∈Fq es

p(_Fq\ {x}|x) =p. As´ı que la probabilidad de que se cometan k≤nerrores en unas posiciones espec´ıficas de una palabra espk₍₁₋_p₎(n−k)_.

SeaSk(c) ={s∈Fn | d(c, s) =k}, conk≤t. EntoncesBt(c) =S t

k=0Sk(c)

(uni´on disjunta). Claramente|Sk(c)|= n_k(q−1)k, luego

1−pe(c) = p(≤t errores) = X b∈Bt(c) p(b|c) = t X k=0 |Sk(c)|pk(1−p) n−k = t X k=0 n k (q−1)kpk(1−p)n−k.

Pero esto ´ultimo ocurre con cada palabra; as´ı que la probabilidad de error (o acierto) en el c´odigoC es independiente de las palabras y podremos sacarlo

(27)

como factor com´un. As´ı, Pe(C) = X c∈C p(c)pe(c) = X c∈C p(c) 1− t X k=0 _n k (q−1)kpk(1−p)n−k ! = X c∈C p(c) ! 1− t X k=0 _n k pk(q−1)k(1−p)n−k ! = 1− t X k=0 _n k pk(q−1)k(1−p)n−k.

2.1.15. Ejemplo. Consideremos el c´odigo binario de repetici´on, de longitud 3.

C=

(

000 111 .

En este caso, la distancia m´ınima es d(C) = 3 y t = 1; luego las bolas sonB1(000) ={000,100,010,001}, B1(111) ={111,011,101,110}. N´otese que

B1(000)∪B1(111) =F3.

Aún más, según lo visto en el cap´ıtulo anterior, si la probabilidad asociada aC es uniforme,Pe(C) = 1−P1_k₌₀ 3_kpk(1−p)n−k = 3p2−2p3

2.1.16. Ejemplo. Volvamos al ejemplo en (1.1.3) del GPS. En ese caso, hab´ıamos definido el c´odigo C1=        ↑ 7→ 00 ↓ 7→ 11 → 7→ 10 ← 7→ 01

C1es un (2,4,1)-c´odigo binario y no detecta ni corrige error alguno.

Ahora vamos a agregar redundancia

C2=        ↑ 7→ 00|0 ↓ 7→ 11|0 → 7→ 10|1 ← 7→ 01|1

C2 es un (3,4,2)-c´odigo binario y detecta 1 error, pero no puede corregir.

Un código que solo detecta un error se llamacódigo detector de un error. Mientras más redundancia agregamos, mejor para la corrección y peor para la tasa de trasmisión. Si agregamos dos d´ıgitos más,

C3=        ↑ 7→ 00|000 ↓ 7→ 11|011 → 7→ 10|110 ← 7→ 01|101

(28)

C3es un (5,4,3)-c´odigo binario que corrige un error y detecta 2, pero NO A

LA VEZ. Por ejemplo, si recibimos la palabra 00001. Tenemos dos posibilidades: 1. Si asumimos que solo se puede cometer un error, entonces corregimos

000017→00000.

2. Si asumimos que se puede cometer m´as de un error entonces 00001 pue-de provenir pue-de 01101 con dos errores o pue-de 00000 con un error. Entonces detectamos pero no corregimos.

Las bolas que determinaC3 que tiene t= 1, son

B1(00000) ={00000,10000,01000,00100,00010,00001}.

B1(11011) ={11011,01011,10011,11111,11001,11010}.

B1(10110) ={10110,00110,11110,10010,10100,10111}.

B1(01101) ={01101,11101,00101,01001,01111,01100}.

Fuera quedan{11000,00011,01110,10101,11100,00111,01010,10001}. Se deja como ejercicio calcularPe(C3).

2.1.17. Observación. Normalmente tenemos que decidir si un código es de-tector o corrector, aunque los códigos detectores no los estudiaremos aparte. 2.1.18. Ejemplo. El código del ISBN (2.1.8), como vimos, tien distancia m´ıni-mad(ISBN) = 2, entonces detecta un error y no corrige ninguno.

2.1.19. Ejemplo. Todo códigoq-ario de longitudn, de repetición, es un (n, q, n )-código.

C´

odigos perfectos y radio de recubrimiento

Los códigos perfectos son aquellos para los cuales el esquema de decisión inducido por las bolas cerradas tiene una aplicación o función (en el sentido habitual) en vez de una función parcial. En [6] se llama código de decodificación ´

unica a aquellos que verifican que su esquema es una aplicaci´on.

2.1.20. Definici´on. Un c´odigo C sobre un alfabeto _F se llama perfecto si la distancia m´ınima es de la formad= 2t+ 1 y

Fn =

[

x∈C

Bt(x)

es decir, siFn es uni´on de las bolas de radio d−21 ∈Ny centro en las palabras.

Vamos ahora a dar un criterio meramente aritmético para determinar cuándo un código es perfecto.

2.1.21. Lema. Sea Fq un cuerpo finito. EnFnq, una bola de radio r y centro

en un puntov tiene exactamente

|Br(v)|= r X j=0 n j (q−1)j elementos.

(29)

Demostraci´on. Ya hemos visto que paraSj(c) ={s∈Fn | d(c, s) =j}se tiene

que|Sj(c)|= n_j

(q−1)j. El resultado se deduce entonces de la igualdadBt(c) =

St

j=0Sj(c) (uni´on disjunta).

Ahora caracterizaremos a los c´odigos perfectos.

2.1.22. Teorema. Un(n, M, d)-c´odigo q-ario es perfecto si y solo si

M · t X j=0 n j (q−1)j=qn, con t= d−1 2 .

Demostraci´on. Por hip´otesis, las bolas son disjuntas, as´ı que

[ u∈C Bt(u) =M· |Bt(x)|=M· t X j=0 _n j (q−1)j

donde hemos fijado unx∈Ccualquiera. De aqu´ı, es inmediato el resultado. 2.1.23. Ejemplo. Para cualquier (5, M,3)-c´odigo binario se tiene entonces que

M(1 + 5)≤25_{, luego}_M _≤_5.

2.1.24. Ejemplos. Algunos c´odigos perfectos.

1. Todo código binario de repetición de longitud impar es perfecto (véase 2.1.15).

Efectivamente.Por la f´ormula del binomio y el hecho de que

n X k=n+1₂ _n k = n−1 2 X k=0 _n n−k se tiene 2n = (1 + 1)n= n X j=0 n j = n−1 2 X j=0 n j + n X k=n+1 2 n k = n−1 2 X j=0 _n j + _n n−j = n−1 2 X j=0 2· _n j =M t X j=0 _n j (2−1)j 2. El c´odigo total.

3. Los c´odigos binarios de longitud impar de la forma

c,1 +c .

Pero estos códigos son triviales. Un problema muy interesante es encontrar TODOS los códigos perfectos. Trataremos este problema más adelante. Por lo pronto solo mencionar que hay familias importantes de códigos perfectos como los códigos de Hamming.

(30)

Cuando un c´odigo no es perfecto, nos interesa saber cu´anto dista de serlo. Para ello usamos el siguiente concepto.

2.1.25. Definici´on. Sea C un (n, M, d)-c´odigo sobre _F. El radio de recubri-miento deC es ρ(C) = m´ın ( r∈N | Fn= [ c∈C Br(c) ) .

Es decir, el menor natural tal que la familia de bolas con dicho n´umero cubre el espacio ambiente.

2.1.26. Observaci´on. Equivalentemente se puede ver que

ρ(C) = m´ax v∈Fn m´ın c∈C(d(v, c)) .

2.1.27. Definici´on. Sea C un (n, M, d)-c´odigo sobre F, con radio de

empa-quetamiento (o capacidad de correcci´on) t. Decimos queC es cuasi perfecto si

ρ(C) =t+ 1.

2.1.28. Ejemplo. El c´odigo C3 de (2.1.16) verifica bd−₂1c = 1 y ρ(C3) = 2.

Luego,C3es quasi perfecto.

2.2. Equivalencia y automorfismos de c´

odigos

La definición tradicional de equivalencia de códigos es la siguiente (véanse, por ejemplo [6, 7, 11]).

2.2.1. Definición. Dos códigos C y D, q-arios decimos que son equivalentes si se puede obtener uno del otro a través de una combinación de operaciones de los siguientes tipos:

1. Permutaci´on de las posiciones.

2. Permutaci´on de los s´ımbolos de una posici´on fija.

Como aplicación, un resultado muy útil a la hora de hacer cálculos.

2.2.2. Lema. Todo(n, M, d)-c´odigo sobre_Fes equivalente a un(n, M, d)-c´ odi-go sobre_F, que contiene al vector0∈Fn.

Demostraci´on. Inmediato del hecho de que las traslaciones son isometr´ıas. A su vez, cada c´odigo tiene asociado su grupo de automorfismos o autoequi-valencias.

2.2.3. Definici´on. Sea F un cuerpo finito y C ⊆ Fn un c´odigo. El grupo de

automorfismos deC es

(31)

De especial inter´es es el grupo de aquellos automorfismos que solo hacen permutar a las coordenadas;

2.2.4. Definición. Dos códigosC, D⊂Fn, decimos que son permutación

equi-valentes si existe una permutaci´onσ∈Sn, tal que Cσ=D.

2.2.5. Definici´on. Sea F un cuerpo finito y C ⊆ Fn un c´odigo. El grupo de

automorfismos de permutaci´on es

PAut(C) ={x∈Sn | Cx=C}.

2.3. Construcci´

on de c´

odigos a partir de otros

C´

odigos pinchados

2.3.1. Definici´on. Decimos que pinchamos un c´odigo C ⊂Fnq, cuando

elimi-namos una coordenada fija en todas las palabras; es decir, proyectamos sobre las otras.

Una pregunta importante desde el punto de vista de la teor´ıa de códigos es qué ocurre con los parámetros. Es decir, si tenemos un (n, M, d)-código y denotamos conC?

i al c´odigo pinchado en lai-´esima corrdenada ¿podemos dar

directamente los nuevos par´ametros?

2.3.2. Proposici´on. Sea C un (n, M, d)-c´odigo sobre _Fq y sea C?

i el c´odigo

pinchado en lai-´esima coordenada. Sid >1 entonces C?

i es un(n−1, M, d?i )-c´odigo, donde d?_i = ( d−1 si existenu, v∈C, con d(u, v) =dy u(i)6=v(i) d otro caso.

Demostraci´on. Si |C_i?| < M =|C| entonces tendr´an que existir u, v ∈ C con

u6=v, perov?=u?lo cual implica qued(u, v) = 1. Imposible. Luego,|C_i?|=M. El c´alculo ded?_i es inmediato.

Para los siguientes resultados, necesitamos el concepto de subgrupo de per-mutaciones transitivo.

2.3.3. Definici´on. Decimos que un subgrupo H ≤ Sn es transitivo si act´ua

transitivamente en {1, . . . , n}; es decir, para cualesquier 1 ≤ i, j ≤ n, existe

σ∈H tal queσ(i) =j (es decir, solo hay una ´orbita).

2.3.4. Proposición. SeaC un(n, M, d)-código. SiP Aut(C)es transitivo en-tonces losncódigos obtenidos de pincharCen cada coordenada son permutación equivalentes.

Demostraci´on. Vamos a ver que C?

1 es equivalente a Cj? para j = 2, . . . , n.

Sea a ∈ C tal quea = (a1, . . . , aj, . . . , an) y sea b = aσ1j ∈ C (por la

tran-sitividad). Entonces b = (aj, a2, . . . , aj−1, a1, aj+1, . . . , an) y en consecuencia

b?

j = (aj, a2, . . . , aj−1, aj+1, . . . , an). Hacemosσ=σ12σ23. . . σj−2j−1 y se tiene

que b?

j = (a2, . . . , aj, . . . , an) = a?1. As´ı, (aσ1j)?jσ = a?1, pero aσ1j ∈ C, luego

(32)

2.3.5. Ejemplo. SeaC={00000,11000,00111,11111}. Se puede construirC₁?

yC₅?, y comprobar que no son equivalentes.

C´

odigos extendidos

Esencialmente, extender códigos es agregar información, digamos en dos pa-sos. Hay muchas maneras (lineales) de hacerlo; una especial, es la que se llama “agragar el d´ıgito de control” (de paridad,parity check, en inglés). Se hace as´ı, 2.3.6. Definición. Sea C un (n, M, d)-código sobre_Fq. Hacemos

b C= ( (v1, . . . , vn, vn+1) | (v1, . . . , vn)∈C y n+1 X ı=1 vı= 0 )

Otra vez, queremos conocer los par´ametros por f´ormula.

2.3.7. Proposici´on. Sea C un (n, M, d)-c´odigo sobre _Fq. Entonces Cb es un h

n+ 1, M,db i

-c´odigo, donde db=dod+ 1.

Demostraci´on. Trivial.

2.3.8. Observaci´on. Obtener leyes para los c´odigos extendidos en el caso bi-nario es muy simple. Aqu´ı, trivialmente,db=d+ 1 sides impar y es den caso

contrario.

Concatenaci´

on o suma directa

Es importante distinguir entre la suma directa del ´algebra lineal y la suma directa de c´odigos, que no coinciden.

2.3.9. Definici´on. SeanC1, C2 (n1, M1, d1) y (n2, M2.d2)c´odigos q-arios. La

concatenaci´on o suma directa es el c´odigo

{(u|v) | u∈C1, v∈C2}

El estudio de los par´ametros aqu´ı es muy sencillo y el propio lector puede completar la secci´on.

La construcci´

on de Plotkin

2.3.10. Definici´on. SeanCi dos(n, Mi, di)-c´odigos q-arios, coni= 1,2, pero

nfijo. Formamos un nuevo c´odigo que llamamos la construcci´on de Plotkin.

C1⊕C2={(u|u+v) | u∈C1, v∈C2}

2.3.11. Proposici´on. Sean Ci dos (n, Mi, di)-c´odigos q-arios, con i = 1,2.

(33)

Demostraci´on. Seanx= (u1|u1+v1) e y= (u2|u2+v2). Entonces

d(x, y) =d(u1, u2) +d(u1+v1, u2+v2) =ω(u1−u2) +ω(u1−u2+v1−v2).

Ahora separamos en casos. Siv16=v2entonces por (2.1.7),

d(x, y)≥ω(v1−v2)≥d2

y la igualdad se alcanza para palabrasv1 yv2 que tengan la distancia m´ınima

deC2 yu1=u2.

Si v1=v2 entoncesd(x, y) = 2d(u1, u2)≥2d1 y tambi´en hay palabras que

(34)

Cap´ıtulo 3

C´

odigos lineales

3.1. Conceptos b´

asicos

Como hemos comentado antes, la idea subyacente de los códigos correctores de errores es la redundancia en la información. En este cap´ıtulo comentaremos la manera algebraica de controlar dicha redundancia, y de hecho, la codificación y decodificación.

Como viene ocurriendo, F siempre denotar´a un cuerpo finito. Cuando se

quiera hacer ´enfasis en su cardinal, escribiremosFq, dondeq=|Fq|.

Por ejemplo, en el caso del c´odigo C1 = {00,10,01,11} del GPS (1.1.3 y

2.1.16) que vimos antes, lo ampliamos al c´odigo C2 = {000,101,011,110}. Es

f´acil ver que, la regla para ampliarlo es (x, y)7→ (x, y, x+y) en t´erminos del ´

algebra lineal; es decir, la redundancia puede obtenerse mediante aplicaciones lineales. Vamos a identificarlo. TenemosC1=F22y hacemosf :F22→F32, tal que

f(x, y) = (x, y, x+y). ClaramenteC1∼=C2. Llamaremosmatriz de codificaci´on

a la matriz asociada a la codificación (en las bases canónicas, como escalares opuestos). Se tiene, C2 =< M(f) >, la matriz en las bases canónicas. Más

adelante, llamaremos aM(f) (una) matriz generadora 1_.

Ahora hacemos δ : C2 ∼=F22 → F52 tal que δ(x, y) = (x, y, x+y, x, y) y se

obtieneC3.

Esta forma de agregar la redundancia manteniendo fijas la primeras coor-denadas (y dejando intacto el c´odigo original) nos produce matrices del tipo

M(δ) = (Ik|A)

Vamos a formalizar la situaci´on.

3.1.1. Definici´on. SeaFun cuerpo finito. Un c´odigo lineal,C, es un subespacio

del espacio vectorialFn. Escribimos [n, k, d]-c´odigo para un c´odigo lineal deFn 1_{¿Generadora o generatriz? Las opiniones est´}_{an divididas (v´}_{eanse [6, 9]). Seg´}_{un el}

diccio-nario de la RAE,generadoraes “que genera”, mientras que generatriz los reserva para f´ısica y geometr´ıa. En todo caso, ambas est´an en el diccionario y aunque no estuvieran cada uno las usar´ıa como quisiera. Aqu´ı diremos generadora porquematriz generatriz, todo junto, no nos gusta.

(35)

con dim_FC =k y distancia m´ınima d. Escribiremos solo [n, k]-c´odigo cuando no nos interese hacer ´enfasis en la distancia m´ınima.

3.1.2. Observaci´on. Un [n, k]-c´odigo sobre_Fqtiene exactamenteqkelementos.

Para la presentaci´on de los c´odigos lineales se usan dos tipos de matriz; a saber, la matriz generadora y la matriz de control (parity check matrix). Comencemos con la matriz generadora.

3.1.3. Definici´on. Sea C un [n, k]-c´odigo sobre F. Una matriz generadora de

C es cualquiera cuyas filas formen una base paraC. Se denota G(C).

Sea M una matriz de orden n×n. Denotamos M(i1, . . . , ir;j1, . . . , js) la

submatriz deM que proviene de la intersecci´on de las filas i1, . . . , ir y las

co-lumnasj1, . . . , js. Abreviemos,M(1, . . . , n;X) =M(−;X) yM(X; 1, . . . , n) =

M(X;−)

3.1.4. Definición. SeaCun[n, k]-código sobre_F. Un conjunto de información o conjunto de posiciones de información, es un subconjunto I ⊂ {1, . . . , n} tal que, dada cualquier palabra del código,(c1, . . . , cn)∈Cy cualquier posiciónj =

1, . . . , nexiste un ´unico conjunto de coeficientes{ai,j}i∈I, tal que

P

i∈Iai,jci =

cj.

Es decir, que el c´odigo C puede obtenerse conociendo los valores de las po-sicionesI.

Por ejemplo, si se considera el c´odigoC={(x, y, z) | z=x+y}, entonces

I={2,3}es un conjunto de informaci´on. Vamos a comprobarlo. Sean (x, y, x+y) y (x0, y0, x0+y0) tales quey=y0 yx+y=x0+y0. Claramente x=x0.

3.1.5. Definici´on. Sea C un [n, k]-c´odigo sobre F con un conjunto de

in-formaci´on I. Se llama conjunto de redundancia o de posiciones de control a

{1, . . . , n} \ I.

El ejemplo más simple es lacodificación sistemática. Decimos que un c´ odi-go es sistemático si al agregar la redundancia hemos mantenido las primeras filas intactas. As´ı, su matriz generadora será de la forma G(C) =M(I|A). Las primeras columnas tienen la información y las siguientes la redundancia.

Un criterio sencillo y muy ´util para encontrar conjuntos de informaci´on se tiene en el siguiente toerema.

3.1.6. Teorema. Sea C un [n, k]-c´odigo sobre Fcon matriz generadora G. Si

G tiene k columnas linealmente independientes entonces los ´ındices de dichas columnas forman un conjunto de informaci´on. (N´otese que al menos seguro uno hay).

Rec´ıprocamente, si I ⊂ {1, . . . , n} es un conjunto de informaci´on enton-ces existe una matriz generadoraG tal que las columnas con ´ındices en I son linealmente independientes.

Demostraci´on. Supongamos primero queGes una matriz generadora y que tiene ciertas columnas con ´ındices {i1, . . . , ik}, que son linealmente independientes.

Consid´erese la submatriz de las columnasi1, . . . , ik, seaG(i1, . . . , ik). Entonces

existe una matriz de operaciones elementales por fila E tal que la submatriz

(36)

CAP´ITULO 3. C ´ODIGOS LINEALES 35

cualquier palabra. Entonces existe a∈Fk tal que aEG=c. Por la forma que

tieneEGes claro quecij =ajy que, para cualquierl= 1, . . . , n,cl=

P

rjlaj =

P

rjlcij.

Rec´ıprocamente, supongamos que I ={i1, . . . , ik} es un conjunto de

infor-maci´on. Seab1, . . . , bkuna base paraC y seana1, . . . , ak las proyecciones de los

bj en las coordenadas deI; es decir, aj = (bj(i1), . . . , bj(ik)).

Se afirma que a1, . . . , ak es linealmente independiente en Fk. Consid´erese

una combinaci´on linealP_r

jaj = 0. Entonces, tomando cualquier componente,

se tieneP_r

jbj(il) = 0, lo cual implica que rj = 0 para todo j= 1, . . . , k pues

I es conjunto de informaci´on y por tanto las expresiones son ´unicas.

Finalmente, se considera la aplicaci´on inducida por la correspondenciaaj7→

bj. La matriz asociada a esta aplicaci´on en las bases{aj}y cualquier extensi´on

de{bj}nos vale.

Sea ahora C un [n, k]-c´odigo sobre F con matriz generadora G. Sabemos

que si las primeras k columnas de G forman un conjunto de informaci´on (o sea, son linealmente independientes) entonces existe una matriz de operaciones elementalesexclusivamente por filas, digamosE, tal queEG= (Ik|A). Es obvio

queEGtambién es matriz generadora deC. Esta forma tiene nombre propio. 3.1.7. Definición. Sea C un [n, k]-código sobre F con matriz generadora G.

Decimos queGest´a en forma t´ıpica (est´andar) siG= (Ik|A)para alguna matriz

adecuadaA.

3.1.8. Ahora consideremos la sucesi´on exacta 0→Fk −−→f Fn−−→η Coker(f)→

0. EntoncesC= Im(f), el c´odigo nos da la sucesi´on 0→C−−ι→_Fn_−−→η

Fn/C→

0.

El´ıjase, por lo pronto, una base cualquiera en el espacio cociente, digamos

γ. Hacemos

Hk×n=Mεγ(η) t_.

Sabemos que C = kerf = {x∈Fn | Hxt= 0} y por tanto, dimF(C) =

n−rg(H). Desde el punto de vista deH, kerf es la nulidad a la derecha deH

y se denotaNd(H). Tambi´en hay, claro, la nulidad a la izquierda. A la matriz

H se la conoce comomatriz de control (parity check) deC.

3.1.9. Teorema. SiG= (Ik|A)_k_×_n es la matriz generadora en forma t´ıpica de

un[n, k]-c´odigo lineal entoncesH = (−At_|_I

n−k)es una matriz de control deC.

Demostraci´on. Basta hacer las cuentas y luego considerar dimensiones.

El siguiente resultado nos muestra que esencialmente todo c´odigo puede suponerse con matriz en forma t´ıpica.

3.1.10. Teorema. Todo código linealCes permutación equivalente a un código cuya matriz generadora está en forma t´ıpica.

Demostración. SeaGla matriz generadora. Por álgebra lineal (método de Gauss-Jordan) sabemos que existen matrices invertibles (de operaciones elementales),

(37)

adecuada. También sabemos que podemos elegirF como solo producto de per-mutación de los pivotes (o cualquier permutación que pusiera en las primeras columnas un conjunto de información). EntoncesEG genera el mismo código

C y por tanto CF es permutaci´on equivalente y tiene la matriz de la forma deseada.

3.1.11. Ejemplos.

1. El c´odigo binario de repetici´on_F2

f

−−→_F5

2que vimos en (2.1.3) tiene matriz

de codificaci´on M(f) =    1 .. . 1    5×1 y la matriz generadora esG= (1|1111),

que est´a en forma t´ıpica.

En este caso, el conjunto de informaci´on es{1}y la redundancia es 6. La matriz de control es H= At|I4=    −1 .. . −1 I4   =    1 .. . 1 I4   porque estamos en F2.

2. Más adelante, veremos con detalle un tipo de códigos llamados códigos de Hamming. Por lo pronto llamaremosH3al código con matriz generadora

G=     I4 0 1 1 1 0 1 1 1 0 1 1 1     y de control H =   0 −1 −1 −1 −1 0 −1 −1 −1 −1 0 −1 I3  . ´ Este es un [7,4]-c´odigo.

3. En el ejemplo del ISBN (2.1.8) tenemosC=_F9

11y agregamos la

informa-ci´on (d´ıgito de control de pesos) con la aplicaci´on linealf :C→_F10 11dada por f(x1, . . . , x10) = x1, . . . , x9,−P 9 i=1ixi

. En este caso, la matriz generadora es G(ISBN) =    I9 −1 .. . −9   .