stringtranslate.com

Análisis tiempo-frecuencia para señales musicales.

El análisis de tiempo-frecuencia para señales musicales es una de las aplicaciones del análisis de tiempo-frecuencia . El sonido musical puede ser más complicado que el sonido vocal humano y ocupa una banda de frecuencia más amplia. Las señales musicales son señales que varían en el tiempo; Si bien la clásica transformada de Fourier no es suficiente para analizarlos, el análisis tiempo-frecuencia es una herramienta eficaz para tal uso. El análisis tiempo-frecuencia es una extensión del enfoque clásico de Fourier. La transformada de Fourier de corto tiempo (STFT), la transformada de Gabor (GT) y la función de distribución de Wigner (WDF) son métodos famosos de tiempo-frecuencia, útiles para analizar señales musicales como notas tocadas en un piano, una flauta o una guitarra.

Conocimiento sobre señal musical.

La música es un tipo de sonido que tiene algunas frecuencias estables en un período de tiempo. La música se puede producir mediante varios métodos. Por ejemplo, el sonido de un piano se produce al golpear las cuerdas , y el sonido de un violín se produce al hacer un arco . Todos los sonidos musicales tienen su frecuencia y armónicos fundamentales . La frecuencia fundamental es la frecuencia más baja en la serie armónica. En una señal periódica, la frecuencia fundamental es la inversa de la duración del período. Los armónicos son múltiplos enteros de la frecuencia fundamental.

En teoría musical , el tono representa la frecuencia fundamental percibida de un sonido. Sin embargo, la frecuencia fundamental real puede diferir de la frecuencia fundamental percibida debido a los armónicos.

Transformada de Fourier de corto tiempo

Fig.1 Forma de onda del archivo de audio ""
Fig.2 Transformada de Gabor de ""
Fig. 3 Espectrograma de ""

STFT continuo

La transformada de Fourier de corto tiempo es un tipo básico de análisis tiempo-frecuencia. Si hay una señal continua x ( t ), podemos calcular la transformada de Fourier de corto tiempo mediante

donde w ( t ) es una función de ventana . Cuando w ( t ) es una función rectangular, la transformación se llama Rec-STFT. Cuando w ( t ) es una función gaussiana, la transformada se llama transformada de Gabor .

STFT discreto

Sin embargo, normalmente la señal musical que tenemos no es una señal continua. Se muestrea en una frecuencia de muestreo. Por lo tanto, no podemos usar la fórmula para calcular la transformada Rec de Fourier de tiempo corto. Cambiamos la forma original a

Sea , , y . Existen algunas limitaciones de la transformada de Fourier discreta de corto tiempo:

Ejemplo de STFT

La Figura 1 muestra la forma de onda de un archivo de audio "" con una frecuencia de muestreo de 44100 Hz. La Figura 2 muestra el gráfico tiempo-frecuencia de los resultados de la transformada de Fourier de corto tiempo (en particular, la transformada de Gabor ) del archivo de audio. En este gráfico, las líneas horizontales con frecuencias no superiores a 230 Hz representan las frecuencias fundamentales, mientras que las líneas horizontales con frecuencias superiores a 230 Hz representan los componentes armónicos. Observe que desde t  = 0 a 0,5 segundos, se toca un acorde que consta de tres notas (CEG). La cuerda luego cambió a CEA en t  = 0,5, y luego cambió nuevamente a DFA en  t  = 1.

espectrograma

La Figura 3 muestra el espectrograma del archivo de audio que se muestra en la Figura 1. El espectrograma es el cuadrado de STFT, representación espectral variable en el tiempo. El espectrograma de una señal s ( t ) se puede estimar calculando la magnitud al cuadrado de la STFT de la señal s ( t ), como se muestra a continuación:

Aunque el espectrograma es profundamente útil, todavía tiene un inconveniente. Muestra frecuencias en una escala uniforme. Sin embargo, las escalas musicales se basan en una escala logarítmica de frecuencias. Por lo tanto, deberíamos describir la frecuencia en una escala logarítmica relacionada con la audición humana.

Función de distribución de Wigner

La función de distribución Wigner también se puede utilizar para analizar señales musicales. La ventaja de la función de distribución de Wigner es la alta claridad de la salida; sin embargo, es computacionalmente costoso y tiene un problema de términos cruzados, por lo que es más adecuado para analizar señales sin más de una frecuencia al mismo tiempo.

Fórmula

La función de distribución de Wigner es:

donde x ( t ) es la señal y x *( t ) es el conjugado de la señal.

Ver también

Fuentes