stringtranslate.com

Algoritmo de Blahut-Arimoto

El término algoritmo de Blahut-Arimoto se utiliza a menudo para referirse a una clase de algoritmos para calcular numéricamente la capacidad teórica de información de un canal, la función de distorsión de velocidad de una fuente o una codificación de fuente (es decir, compresión para eliminar la redundancia). Son algoritmos iterativos que eventualmente convergen a uno de los máximos del problema de optimización asociado con estos conceptos de la teoría de la información.

Historia y aplicación

Para el caso de la capacidad del canal , el algoritmo fue inventado de forma independiente por Suguru Arimoto [1] y Richard Blahut . [2] Además, el tratamiento de Blahut proporciona algoritmos para calcular la distorsión de la tasa y la capacidad generalizada con restricciones de entrada (es decir, la función capacidad-costo, análoga a la distorsión de la tasa). Estos algoritmos son más aplicables al caso de fuentes de alfabeto finitas arbitrarias. Se ha trabajado mucho para extenderlo a casos de problemas más generales. [3] [4] Recientemente, se propuso una versión del algoritmo que tiene en cuenta salidas continuas y multivariadas con aplicaciones en señalización celular. [5] También existe una versión del algoritmo Blahut-Arimoto para información dirigida . [6]

Algoritmo para la capacidad del canal

Un canal discreto sin memoria (DMC) se puede especificar utilizando dos variables aleatorias con alfabeto y una ley de canal como distribución de probabilidad condicional . La capacidad del canal , definida como , indica la máxima eficiencia que un canal puede comunicar, en la unidad de bit por uso. [7] Ahora bien, si denotamos la cardinalidad , entonces es una matriz, que denotamos la entrada de fila y columna por . Para el caso de la capacidad del canal , el algoritmo fue inventado de forma independiente por Suguru Arimoto [8] y Richard Blahut . [9] Ambos encontraron la siguiente expresión para la capacidad de un DMC con ley de canal:

donde y se maximizan sobre los siguientes requisitos:

Luego , al elegir una distribución de probabilidad aleatoria , podemos generar una secuencia de forma iterativa de la siguiente manera:

Para .

Luego, utilizando la teoría de optimización, específicamente el descenso de coordenadas , Yeung [10] demostró que la secuencia efectivamente converge al máximo requerido. Eso es,

.

Entonces, dada una ley del canal , la capacidad se puede estimar numéricamente con precisión arbitraria.

Algoritmo de distorsión de velocidad

Supongamos que tenemos una fuente con probabilidad de cualquier símbolo dado. Deseamos encontrar una codificación que genere una señal comprimida a partir de la señal original mientras minimiza la distorsión esperada , donde la expectativa se toma sobre la probabilidad conjunta de y . Podemos encontrar una codificación que minimice la distorsión de velocidad funcional localmente repitiendo la siguiente iteración hasta la convergencia:

donde es un parámetro relacionado con la pendiente en la curva de tasa de distorsión a la que nos dirigimos y, por lo tanto, está relacionado con cuánto favorecemos la compresión frente a la distorsión (más alto significa menos compresión).

Referencias

  1. ^ Arimoto, Suguru (1972), "Un algoritmo para calcular la capacidad de canales arbitrarios discretos sin memoria", IEEE Transactions on Information Theory , 18 (1): 14–20, doi :10.1109/TIT.1972.1054753, S2CID  8408706.
  2. ^ Blahut, Richard (1972), "Cálculo de la capacidad del canal y funciones de distorsión de velocidad", IEEE Transactions on Information Theory , 18 (4): 460–473, CiteSeerX 10.1.1.133.7174 , doi :10.1109/TIT.1972.1054855 .
  3. ^ Vontobel, Pascal O. (2003). "Un algoritmo generalizado de Blahut-Arimoto". Actas del Simposio internacional IEEE sobre teoría de la información, 2003 . pag. 53. doi :10.1109/ISIT.2003.1228067. ISBN 0-7803-7728-1.
  4. ^ Iddo Naiss; Haim Permuter (2010). "Ampliación del algoritmo Blahut-Arimoto para maximizar la información dirigida". arXiv : 1012.5071v2 [cs.IT].
  5. ^ Tomasz Jetka; Karol Nienaltowski; Tomasz Winarski; Slawomir Blonski; Michal Komorowski (2019), "Análisis teórico de la información de respuestas de señalización unicelulares multivariadas", PLOS Computational Biology , 15 (7): e1007132, arXiv : 1808.05581 , Bibcode : 2019PLSCB..15E7132J, doi : 10.1371/journal.pcbi. 1007132 , PMC 6655862 , PMID  31299056 
  6. ^ Naiss, Iddo; Permuter, Haim H. (enero de 2013). "Extensión del algoritmo Blahut-Arimoto para maximizar la información dirigida". Transacciones IEEE sobre teoría de la información . 59 (1): 204–222. arXiv : 1012.5071 . doi :10.1109/TIT.2012.2214202. S2CID  3115749.
  7. ^ Portada, TM (2006). Elementos de la teoría de la información. Joy A. Thomas (2ª ed.). Hoboken, Nueva Jersey: Wiley-Interscience. ISBN 0-471-24195-4. OCLC  59879802.
  8. ^ Arimoto, Suguru (1972), "Un algoritmo para calcular la capacidad de canales arbitrarios discretos sin memoria", IEEE Transactions on Information Theory , 18 (1): 14–20, doi :10.1109/TIT.1972.1054753, S2CID  8408706.
  9. ^ Blahut, Richard (1972), "Cálculo de la capacidad del canal y funciones de distorsión de velocidad", IEEE Transactions on Information Theory , 18 (4): 460–473, CiteSeerX 10.1.1.133.7174 , doi :10.1109/TIT.1972.1054855 .
  10. ^ Yeung, Raymond W. (2008). Teoría de la información y codificación de redes. Nueva York: Springer. ISBN 978-0-387-79234-7. OCLC  288469056.