Código de coma

Un código de coma es un tipo de código sin prefijo en el que una coma , un símbolo particular o una secuencia de símbolos, aparece al final de una palabra de código y nunca aparece en otro lugar. ^[1] Esta es una forma intuitiva de expresar matrices.

Por ejemplo, la codificación de Fibonacci es un código de coma en el que la coma es 11. 11y 1011son palabras de código de Fibonacci válidas, pero 101, 0111, y 11011no lo son.

Ejemplos

Codificación unaria , en la que la coma es 0. Esto permite valores NULL (cuando el código y la coma son un solo 0, el valor puede tomarse como NULL o como 0).
Codificación de Fibonacci , en la que la coma es 11.
Todos los códigos Huffman se pueden convertir en códigos de coma anteponiendo un 1a al código completo y usando un solo 0como código y la coma.

La definición de palabra es un conjunto de símbolos que terminan en coma, el equivalente a un carácter de espacio .

Axioma del 50% de comas en todos los datos: se puede demostrar que todos los datos implícitos, específicamente los datos biyectivos de longitud variable, constan exactamente de un 50% de comas.

Todos los datos codificados o datos de la misma longitud adecuadamente seleccionados exhiben la llamada probabilidad implícita.

Estos datos, que pueden denominarse "datos genéricos", pueden analizarse utilizando cualquier código unario entrelazado como encabezados donde los bits biyectivos adicionales (iguales a la longitud del código unario recién leído) se leen como datos mientras que el código unario sirve como introducción o encabezado para los datos. Este encabezado sirve como una coma. Los datos pueden leerse de manera entrelazada entre cada bit del encabezado o de manera posterior a la lectura cuando los datos solo se leen después de que se lea todo el código de encabezado unario, como la codificación Chen-Ho .

Se puede ver mediante técnicas de recorrido aleatorio y suma estadística que todos los datos genéricos tienen un encabezado o coma de un promedio de 2 bits y datos de 2 bits adicionales (mínimo 1).

Esto también permite un algoritmo económico de aumento de base antes de la transmisión en canales de comunicación no binarios, como los canales de comunicación base 3 o base 5.

Donde '?' es '1' o '2' para el valor del dígito biyectivo que no requiere procesamiento adicional.

Por supuesto, utilizamos una sola coma para separar cada campo de datos, lo que demuestra que todos los datos constan de un 50% de comas. Esto es bastante visible a partir de una probabilidad implícita del 50% para el 0código en códigos de base 3 de Huffman: 0, 10, 11(2/3 netos o 66,66% de comas) o el código de coma de base 5 que se muestra arriba. El cociente de costo por carácter de la comunicación de base superior tiene que mantener valores casi logarítmicos para los datos y menos de 2 bits para el carácter de coma para mantener la rentabilidad. ${\textstyle {\frac {log(base)}{log(2)}}}$

Este método tiene una garantía de un '1' o '2' después de cada '0' (coma) y esta propiedad puede ser útil al diseñar en torno a preocupaciones de tiempo en la transmisión. Puede ser algo costoso convertir un valor binario conocido a ternario a menos que los costos de bits ternarios se reduzcan a similares a los costos de bits binarios, por lo que este bit se puede multiplexar en un canal binario separado si los costos coinciden (esto puede requerir una lectura de una porción 'de cola'/final adicional de datos puros de 2 bits para el canal binario (desde después del primer bit del primer cambio ya que este no es un código decodificable instantáneamente, simplemente lea si se usa un código unario decodificable instantáneamente) para que sea similar a los 2 bits ternarios promedio restantes en el canal primario equivalentes a bits antes de que se tengan en cuenta las comparaciones de costos). ${\textstyle 2*{\frac {log(3)}{log(2)}}=3,17}$

Sin tener en cuenta la multiplexación, este método tiene una eficiencia de lectura de 3 dígitos ternarios para una lectura de 4 bits binarios o 1,33 bits. ${\textstyle {\frac {4/3}{\frac {log(3)}{log(2)}}}=84,12\%}$

Axioma del 66,66 % (2/3) de comas en todos los datos: se puede demostrar que todos los datos implícitos, específicamente los datos de longitud variable, constan exactamente de un 66,66 % (2/3) de comas.

Donde '?' es '1' o '2' para el valor del dígito biyectivo que no requiere procesamiento adicional. Este método da como resultado una similitud estadística con una simple 'lectura implícita' de códigos de Huffman base 3: 0, 10, 11(2/3 netos o 66,66 % comas).

Se puede ver mediante técnicas de recorrido aleatorio y suma estadística que todos los datos genéricos tienen un encabezado o coma de un promedio de 2 bits y datos de 1 bit adicional (mínimo 0).

Esto no garantiza que haya un '1' o '2' después de cada '0' (coma), una propiedad que puede ser útil al diseñar teniendo en cuenta las preocupaciones de tiempo en la transmisión.

Este método tiene una eficiencia de lectura de 2 dígitos ternarios para una lectura de 3 bits binarios o 1,5 bits binarios/dígito ternario. ${\textstyle {\frac {3/2}{\frac {log(3)}{log(2)}}}=94,64\%}$

34,375 % | 31,25 % (~ 1/3) escribe comas para ganar eficiencia usando particionamiento de números – Las lecturas y escrituras implícitas usando técnicas de particionamiento de números (números 'm' divididos en particiones 'n' dan como resultado n^m permutaciones) similares a la codificación Chen-Ho y Hertz muestran una mayor eficiencia tanto de lecturas como de escrituras similar a una distribución casi aleatoria. Por lo tanto, el uso de códigos tiene menos sentido y el uso de bases más altas se vuelve más importante. De manera similar, una coma de 'escritura' se convierte en cualquier número en la base, una coma de 'lectura' es el encabezado que se muestra a continuación, códigos de base 4 de Huffman: 0, 10, 110, 111.

La principal ventaja de esta técnica, aparte de una mayor eficiencia, es que no se requiere una conversión de base, lo que requeriría que primero se lea todo el flujo y luego se convierta. La desventaja es que la longitud promedio del número se vuelve más alta y, de manera similar a la generación de números aleatorios, las preocupaciones de tiempo que rigen la transmisión ternaria pasan a primer plano. Con m=2 y n=2, obtenemos, sin olvidar que un valor de '(2)' es esencialmente 0 bits:

Por lo tanto, este método tiene una eficiencia de lectura de 2 dígitos ternarios para una lectura de bits binarios o 1,5625 bits binarios/dígito ternario. O . ${\textstyle 50*3+25*3+12.5*4+12.5*3=3.125}$ ${\textstyle {\frac {3.125*{\frac {1}{2}}}{\frac {log(3)}{log(2)}}}=98.58\%}$

Una eficiencia de escritura de 2 dígitos ternarios para una escritura de bits o 1,61 bits binarios/dígito ternario, o ${\textstyle {\frac {4}{9}}*3+{\frac {2}{9}}*3+{\frac {2}{9}}*4+{\frac {1}{9 }}*3=3.22}$ ${\textstyle {\frac {\frac {log(3)}{log(2)}}{{\frac {29}{9}}*{\frac {1}{2}}}}=98,38\% }$

Números cardinales para una conversión de base eficiente: dado que se ha comprobado que los códigos de coma son muy similares a la conversión de base, siendo la única preocupación la eficiencia y el tiempo, la conversión/mapeo directo de números de 19 bits binarios a números trits ternarios de 12 permiten una eficiencia de o eficiencia según el método de cálculo. Esto funciona porque y ≃ . Por supuesto, esto es más una construcción teórica y no menciona el tiempo cuando se intenta aplicar esto a los métodos de transmisión ternaria. Sin embargo, deja que los códigos se diseñen en torno a las preocupaciones de tiempo. ${\textstyle 2^{19}=524288}$ ${\textstyle 3^{12}=531441}$ ${\textstyle {\frac {2^{19}}{3^{12}}}=98,65\%}$ ${\textstyle {\frac {log_{3}{2^{19}}}{12}}=99,9\%}$ ${\textstyle 2^{19}<3^{12}}$ ${\textstyle 2^{19}}$ ${\textstyle 3^{12}}$ ${\textstyle 531441-524288=7153}$

Véase también

Código de autosincronización

Referencias

^ Wade, Graham (8 de septiembre de 1994). Codificación y procesamiento de señales. Cambridge University Press. pág. 56. ISBN 978-0-521-42336-6.