La distancia logarítmica espectral (LSD) , también denominada distorsión logarítmica espectral o distancia logarítmica espectral cuadrática media , es una medida de distancia entre dos espectros . [1] La distancia logarítmica espectral entre los espectros y se define como p-norma :
A diferencia de la distancia Itakura-Saito , la distancia logarítmica-espectral es simétrica. [2]
En la codificación de voz, la distorsión espectral logarítmica de un cuadro determinado se define como la diferencia cuadrática media entre el espectro de potencia logarítmica LPC original y el espectro de potencia logarítmica LPC cuantificado o interpolado. Por lo general, se calcula el promedio de la distorsión espectral en una gran cantidad de cuadros y se utiliza como medida del rendimiento de la cuantificación o la interpolación .
Al medir la distorsión entre señales, la escala o temporalidad/espacialidad de las señales puede tener diferentes niveles de importancia para las medidas de distorsión. Para incorporar el nivel de importancia adecuado, las señales se pueden transformar en un dominio diferente.
Cuando las señales se transforman en el dominio espectral con métodos de transformación como la transformada de Fourier y la DCT , la distancia espectral es la medida para comparar las señales transformadas. La LSD incorpora las características logarítmicas de los espectros de potencia y se vuelve efectiva cuando la tarea de procesamiento del espectro de potencia también tiene características logarítmicas, por ejemplo , cuando un ser humano escucha una señal de sonido con diferentes niveles de volumen.
Además, LSD es igual a la distancia cepstral, que es la distancia entre los cepstrums de las señales cuando los números p son los mismos según el teorema de Parseval .
Como LSD tiene la forma de p-norma, se puede representar con diferentes números p y escalas logarítmicas.
Por ejemplo, cuando se expresa en dB con norma L2, se define como: .
Cuando se representa en el espacio discreto se define como: donde y son espectros de potencia en el espacio discreto.