Sea un alfabeto finito y sea un alfabeto llamado de código. denota al conjunto de palabras no-vacías con símbolos en . Una codificación es una función
. La imagen de se dice ser el conjunto de palabras de código (codewords). se extiende, mediante la mera concatenación de valores, a una función
, donde
, haciendo:
Sea un alfabeto de 70 símbolos, por ejemplo, podría ser el alfabeto que consta de las 26 letras minúsculas, las 26 mayúsculas, los 10 dígitos decimales y 8 símbolos de puntuación (entre los cuales está el ``blanco''). Sea el alfabeto de sólo dos símbolos y sea el conjunto de palabras de 8 bits en las que exactamente hay 4 bits con valor 1. Es claro que
y que el conjunto está ordenado con el orden usual de los enteros cuando cada palabra se lee como la representación en base-2 de un entero: El primer elemento es pues y el último . Sea
la función que asocia el -ésimo elemento de con el -ésimo elemento de . Una palabra de longitud en quedará entonces codificada por bits. Cada bloque de 8 bits contiguos, de la forma
, con
, contiene exactamente 4 1's. Naturalmente, de las palabras de 8 bits, hay
que no son palabras de código.
La decodificación es natural. Cada uno de los bloques de 8 bits contiguos determina un símbolo de .
Si existe una , , tal que , entonces el código se dice ser de bloques: cada símbolo se codifica mediante un bloque de símbolos.
Por otro lado, el código se dice ser instantáneo si no ocurre que el código de un símbolo sea un prefijo del código de otro símbolo:
|
El Código Morse es de decodificación única: ya que la codificación de cada símbolo termina con ``e'' (espacio), entre dos espacios contiguos cualesquiera se decodifica un único símbolo. También, al asignar códigos más cortos a símbolos más frecuentes, podrá esperarse que en el Código Morse los códigos de palabras serán de longitudes ``cortas''.
Los códigos instantáneos deben su nombre a un procedimiento ``natural'' para decodificarlos: Leyéndolos de izquierda a derecha, cada vez que se reconoce el código de un símbolo se escribe ese símbolo y se reinicia el proceso de reconocimiento.