stringtranslate.com

Planicidad espectral

La máxima planitud espectral (cercana a 1) se logra mediante ruido blanco.

La planicidad espectral o coeficiente de tonalidad , [1] [2] también conocida como entropía de Wiener , [3] [4] es una medida utilizada en el procesamiento de señales digitales para caracterizar un espectro de audio . La planitud espectral generalmente se mide en decibeles y proporciona una manera de cuantificar en qué medida un sonido se parece a un tono puro , en lugar de ser parecido a un ruido . [2]

Interpretación

El significado de tonal en este contexto tiene el sentido de la cantidad de picos o estructura resonante en un espectro de potencia , a diferencia del espectro plano del ruido blanco . Una planitud espectral alta (que se aproxima a 1,0 para el ruido blanco) indica que el espectro tiene una cantidad similar de potencia en todas las bandas espectrales; esto sonaría similar al ruido blanco y el gráfico del espectro parecería relativamente plano y suave. Una planitud espectral baja (que se acerca a 0,0 para un tono puro) indica que la potencia espectral se concentra en un número relativamente pequeño de bandas; esto normalmente sonaría como una mezcla de ondas sinusoidales y el espectro parecería "puntiagudo". [5]

Dubnov [2] ha demostrado que la planitud espectral es equivalente al concepto teórico de información mutua de información que se conoce como correlación total dual .

Formulación

La planitud espectral se calcula dividiendo la media geométrica del espectro de potencia por la media aritmética del espectro de potencia, es decir:

donde x(n) representa la magnitud del número de contenedor n . Tenga en cuenta que un único (o más) contenedor vacío produce una planicidad de 0, por lo que esta medida es más útil cuando los contenedores generalmente no están vacíos.

La relación producida por este cálculo a menudo se convierte a una escala de decibeles para los informes, con un máximo de 0 dB y un mínimo de −∞ dB.

La planitud espectral también se puede medir dentro de una subbanda específica, en lugar de en toda la banda.

Aplicaciones

Esta medida es uno de los muchos descriptores de audio utilizados en el estándar MPEG-7 , en el que se denomina "AudioSpectralFlatness".

En la investigación del canto de los pájaros , se ha utilizado como una de las características medidas en el audio del canto de los pájaros, al probar la similitud entre dos extractos. [6] La planitud espectral también se ha utilizado en el análisis de diagnóstico e investigación de electroencefalografía (EEG) , [7] y psicoacústica en humanos. [8]

Referencias

  1. ^ JD Johnston (1988). "Transformar la codificación de señales de audio utilizando criterios de ruido perceptual". Revista IEEE sobre áreas seleccionadas de las comunicaciones . 6 (2): 314–332. doi :10.1109/49.608. S2CID  5999699.
  2. ^ abc Shlomo Dubnov (2004). "Generalización de la medida de planitud espectral para procesos lineales no gaussianos". Cartas de procesamiento de señales . 11 (8): 698–701. Código Bib : 2004ISPL...11..698D. doi :10.1109/LSP.2004.831663. ISSN  1070-9908. S2CID  14778866.
  3. ^ Características de la canción › Entropía de Wiener "definida como la relación entre la media geométrica y la media aritmética del espectro"
  4. ^ Parámetros de Luscinia "La entropía de Wiener es una medida alternativa del ruido de una señal. Se define como la relación entre la media geométrica y la media aritmética del espectro de potencia".
  5. ^ Un amplio conjunto de funciones de audio para descripción de sonido: informe técnico publicado por IRCAM en 2003. Sección 9.1
  6. ^ Tchernichovski, O., Nottebohm, F., Ho, CE, Pesaran, B., Mitra, PP, 2000. Un procedimiento para una medición automatizada de la similitud de canciones. Comportamiento animal 59 (6), 1167–1176, doi :10.1006/anbe.1999.1416.
  7. ^ Quemaduras, T.; Rajan, R. (2015). "Burns & Rajan (2015) Combinación de medidas de complejidad de datos de EEG: las medidas multiplicadas revelan información previamente oculta. F1000Research. 4:137". F1000Investigación . 4 : 137. doi : 10.12688/f1000research.6590.1 . PMC 4648221 . PMID  26594331. 
  8. ^ Quemaduras, T.; Rajan, R. (2019). "Un enfoque matemático para correlacionar características espectrotemporales objetivas de sonidos no lingüísticos con sus percepciones subjetivas en los humanos". Fronteras en Neurociencia . 13 : 794. doi : 10.3389/fnins.2019.00794 . PMC 6685481 . PMID  31417350.