En estadística y teoría de codificación , un espacio de Hamming es usualmente el conjunto de todas las cadenas binarias de longitud N , donde las diferentes cadenas binarias se consideran adyacentes cuando difieren solo en una posición. La distancia total entre dos cadenas binarias cualesquiera es entonces el número total de posiciones en las que los bits correspondientes son diferentes, llamada distancia de Hamming . [1] [2] Los espacios de Hamming reciben su nombre del matemático estadounidense Richard Hamming , quien introdujo el concepto en 1950. [3] Se utilizan en la teoría de codificación de señales y transmisión.
De manera más general, un espacio de Hamming puede definirse sobre cualquier alfabeto (conjunto) Q como el conjunto de palabras de una longitud fija N con letras de Q . [4] [5] Si Q es un cuerpo finito , entonces un espacio de Hamming sobre Q es un espacio vectorial N -dimensional sobre Q . En el caso binario típico, el cuerpo es entonces GF(2) (también denotado por Z 2 ). [4]
En teoría de codificación, si Q tiene q elementos, entonces cualquier subconjunto C (usualmente asumido de cardinalidad al menos dos) del espacio de Hamming N -dimensional sobre Q se llama código q-ario de longitud N ; los elementos de C se llaman palabras de código . [4] [5] En el caso donde C es un subespacio lineal de su espacio de Hamming, se llama código lineal . [4] Un ejemplo típico de código lineal es el código de Hamming . Los códigos definidos a través de un espacio de Hamming necesariamente tienen la misma longitud para cada palabra de código, por lo que se llaman códigos de bloque cuando es necesario distinguirlos de los códigos de longitud variable que se definen por factorización única en un monoide.
La distancia de Hamming otorga a un espacio de Hamming una métrica , que es esencial para definir nociones básicas de la teoría de codificación, como los códigos de detección de errores y de corrección de errores . [4]
También se han considerado espacios de Hamming sobre alfabetos no de campo, especialmente sobre anillos finitos (más notablemente sobre Z 4 ) dando lugar a módulos en lugar de espacios vectoriales y códigos lineales de anillo (identificados con submódulos ) en lugar de códigos lineales. La métrica típica utilizada en este caso es la distancia de Lee . Existe una isometría de Gray entre (es decir, GF(2 2m )) con la distancia de Hamming y (también denotada como GR(4,m)) con la distancia de Lee. [6] [7] [8]