La distancia de Itakura-Saito (o divergencia de Itakura-Saito ) es una medida de la diferencia entre un espectro original y una aproximación de ese espectro. Aunque no es una medida perceptual, su objetivo es reflejar la (des) similitud perceptual . Fue propuesta por Fumitada Itakura y Shuzo Saito en la década de 1960 mientras trabajaban en NTT . [1]
La distancia se define como: [2]
La distancia de Itakura-Saito es una divergencia de Bregman generada por menos la función logarítmica, pero no es una métrica verdadera ya que no es simétrica [3] y no cumple la desigualdad triangular.
En la factorización de matrices no negativas , la divergencia de Itakura-Saito se puede utilizar como una medida de la calidad de la factorización: esto implica un modelo estadístico significativo de los componentes y se puede resolver a través de un método iterativo . [4]
La distancia de Itakura-Saito es la divergencia de Bregman asociada con la familia exponencial Gamma, donde la divergencia de información de una distribución en la familia de otro elemento en la familia está dada por la divergencia de Itakura-Saito del valor medio de la primera distribución del valor medio de la segunda distribución.
Véase también
Referencias
- ^ Itakura, F., y Saito, S. (1968). Análisis de telefonía de síntesis basada en el método de máxima verosimilitud. En Proc. 6.º Congreso Internacional de Acústica (pp. C–17–C–20). Los Alamitos, CA: IEEE.
- ^ Alan HS Chan; Sio-Iong Ao (2008). Avances en ingeniería industrial e investigación de operaciones. Springer. pág. 51. ISBN 978-0-387-74903-7.
- ^ A. Banerjee; et al. (2004). "Agrupamiento con divergencias de Bregman". En Michael W. Berry; Umeshwar Dayal; Chandrika Kamath ; David Skillicorn (eds.). Actas de la Cuarta Conferencia Internacional SIAM sobre Minería de Datos . SIAM. págs. 234–245. ISBN 978-0-89871-568-2.
- ^ Cédric Févotte; Nancy Bertin; Jean-Louis Durrieu (2009). "Factorización de matrices no negativas con la divergencia de Itakura-Saito: con aplicación al análisis musical". Computación neuronal . 21 (3): 793–830. doi :10.1162/neco.2008.04-08-771. PMID 18785855.