stringtranslate.com

Transformada de Fourier de corto tiempo

La transformada de Fourier de corto tiempo ( STFT ) es una transformada relacionada con Fourier que se utiliza para determinar la frecuencia sinusoidal y el contenido de fase de las secciones locales de una señal a medida que cambia con el tiempo. [1] En la práctica, el procedimiento para calcular STFT es dividir una señal de tiempo más largo en segmentos más cortos de igual longitud y luego calcular la transformada de Fourier por separado en cada segmento más corto. Esto revela el espectro de Fourier en cada segmento más corto. Luego, generalmente se trazan los espectros cambiantes en función del tiempo, lo que se conoce como espectrograma o gráfico en cascada, como el que se usa comúnmente en las pantallas de espectro basadas en radio definida por software (SDR). Las pantallas de ancho de banda completo que cubren todo el rango de un SDR suelen utilizar transformadas rápidas de Fourier (FFT) con 2^24 puntos en las computadoras de escritorio.

Un espectrograma que visualiza los resultados de un STFT de las palabras "siglo XIX". Aquí las frecuencias se muestran aumentando en el eje vertical y el tiempo en el eje horizontal. La leyenda de la derecha muestra que la intensidad del color aumenta con la densidad.

STFT hacia adelante

STFT de tiempo continuo

Simplemente, en el caso de tiempo continuo, la función a transformar se multiplica por una función de ventana que es distinta de cero sólo durante un corto período de tiempo. Se toma la transformada de Fourier (una función unidimensional) de la señal resultante, luego se desliza la ventana a lo largo del eje de tiempo hasta el final dando como resultado una representación bidimensional de la señal. Matemáticamente esto se escribe como:

donde está la función de ventana , comúnmente una ventana de Hann o una ventana gaussiana centrada alrededor de cero, y es la señal a transformar (obsérvese la diferencia entre la función de ventana y la frecuencia ). es esencialmente la transformada de Fourier de , una función compleja que representa la fase y la magnitud de la señal en el tiempo y la frecuencia. A menudo, el desenvolvimiento de fase se emplea a lo largo de uno o ambos del eje de tiempo, y del eje de frecuencia, para suprimir cualquier discontinuidad de salto del resultado de fase del STFT. El índice de tiempo normalmente se considera tiempo " lento " y normalmente no se expresa con una resolución tan alta como el tiempo . Dado que la STFT es esencialmente una transformada de Fourier multiplicada por una función de ventana, la STFT también se denomina transformada de Fourier en ventana o transformada de Fourier dependiente del tiempo.

STFT en tiempo discreto

En el caso del tiempo discreto, los datos a transformar podrían dividirse en fragmentos o cuadros (que generalmente se superponen entre sí para reducir los artefactos en el límite). Cada fragmento se transforma de Fourier y el resultado complejo se agrega a una matriz, que registra la magnitud y la fase de cada punto en el tiempo y la frecuencia. Esto se puede expresar como:

así mismo, con señal y ventana . En este caso, m es discreta y ω es continua, pero en la mayoría de las aplicaciones típicas la STFT se realiza en una computadora usando la transformada rápida de Fourier , por lo que ambas variables son discretas y cuantificadas .

La magnitud al cuadrado de la STFT produce la representación espectrograma de la densidad espectral de potencia de la función:

Véase también la transformada de coseno discreta modificada (MDCT), que también es una transformada relacionada con Fourier que utiliza ventanas superpuestas.

DFT deslizante

Si solo se desea una pequeña cantidad de ω, o si se desea evaluar la STFT para cada desplazamiento m de la ventana, entonces la STFT se puede evaluar de manera más eficiente utilizando un algoritmo DFT deslizante . [2]

STFT inverso

El STFT es invertible , es decir, la señal original se puede recuperar de la transformada mediante el STFT inverso. La forma más aceptada de invertir el STFT es mediante el método de superposición y adición (OLA) , que también permite modificaciones en el espectro complejo de STFT. Esto lo convierte en un método de procesamiento de señales versátil, [3] conocido como método de superposición y adición con modificaciones .

STFT de tiempo continuo

Dado el ancho y la definición de la función de ventana w ( t ), inicialmente requerimos que el área de la función de ventana se escale de modo que

Se deduce fácilmente que

y

La transformada continua de Fourier es

Sustituyendo x ( t ) desde arriba:

Intercambio de orden de integración:

Por tanto, la transformada de Fourier puede verse como una especie de suma coherente de fase de todas las STFT de x ( t ). Dado que la transformada inversa de Fourier es

entonces x ( t ) se puede recuperar de X (τ,ω) como

o

Se puede ver, en comparación con lo anterior, que el "grano" u "wavelet" en ventana de x ( t ) es

la transformada de Fourier inversa de X (τ,ω) para τ fija.

Una definición alternativa que es válida sólo en las proximidades de τ, la transformada inversa es:

En general, la función de ventana tiene las siguientes propiedades:

(a) simetría par: ;
(b) no creciente (por tiempo positivo): si ;
(c) soporte compacto: es igual a cero cuando |t| es largo.

Problemas de resolución

Uno de los inconvenientes del STFT es que tiene una resolución fija. El ancho de la función de ventana se relaciona con cómo se representa la señal: determina si hay una buena resolución de frecuencia (los componentes de frecuencia que están muy juntos se pueden separar) o una buena resolución de tiempo (el momento en el que cambian las frecuencias). Una ventana amplia proporciona una mejor resolución de frecuencia pero una mala resolución de tiempo. Una ventana más estrecha proporciona una buena resolución temporal pero una resolución deficiente en frecuencia. Éstas se denominan transformadas de banda estrecha y de banda ancha, respectivamente.

Comparación de la resolución STFT. La izquierda tiene mejor resolución temporal y la derecha tiene mejor resolución de frecuencia.

Esta es una de las razones para la creación de la transformada wavelet y el análisis multiresolución , que pueden proporcionar una buena resolución temporal para eventos de alta frecuencia y una buena resolución de frecuencia para eventos de baja frecuencia, la combinación más adecuada para muchas señales reales.

Esta propiedad está relacionada con el principio de incertidumbre de Heisenberg , pero no directamente; consulte el límite de Gabor para una discusión. El producto de la desviación estándar en el tiempo y la frecuencia es limitado. El límite del principio de incertidumbre (la mejor resolución simultánea de ambos) se alcanza con una función de ventana gaussiana (o función de máscara), ya que la gaussiana minimiza el principio de incertidumbre de Fourier . Esto se llama transformada de Gabor (y con modificaciones para multiresolución se convierte en la transformada wavelet de Morlet ).

Se puede considerar el STFT para variar el tamaño de la ventana como un dominio bidimensional (tiempo y frecuencia), como se ilustra en el siguiente ejemplo, que se puede calcular variando el tamaño de la ventana. Sin embargo, esto ya no es una representación estrictamente de tiempo-frecuencia: el núcleo no es constante en toda la señal.

Ejemplos

Cuando la función original es:

Podemos tener un ejemplo sencillo:

w(t) = 1 para |t| menor o igual que B

w(t) = 0 en caso contrario

B = ventana

Ahora la función original de la transformada de Fourier de tiempo corto se puede cambiar como

Otro ejemplo:

Usando la siguiente señal de muestra que se compone de un conjunto de cuatro formas de onda sinusoidales unidas en secuencia. Cada forma de onda se compone únicamente de una de cuatro frecuencias (10, 25, 50, 100 Hz ). La definición de es:

Luego se muestrea a 400 Hz. Se produjeron los siguientes espectrogramas:

La ventana de 25 ms nos permite identificar un momento preciso en el que las señales cambian, pero las frecuencias precisas son difíciles de identificar. En el otro extremo de la escala, la ventana de 1000 ms permite ver las frecuencias con precisión, pero el tiempo entre cambios de frecuencia es borroso.

Otros ejemplos:

Normalmente llamamos función gaussiana o función de Gabor. Cuando la usamos, la transformada de Fourier de corto tiempo se llama "transformada de Gabor".

Explicación

También se puede explicar con referencia al muestreo y la frecuencia de Nyquist .

Tome una ventana de N muestras de una señal arbitraria de valor real a una frecuencia de muestreo f s . La transformada de Fourier produce N coeficientes complejos. De estos coeficientes sólo la mitad son útiles (el último N/2 es el conjugado complejo del primer N/2 en orden inverso, ya que se trata de una señal con valor real).

Estos coeficientes N/2 representan las frecuencias 0 a f s /2 (Nyquist) y dos coeficientes consecutivos están separados por f s / N Hz.

Para aumentar la resolución de frecuencia de la ventana, es necesario reducir el espaciado de frecuencia de los coeficientes. Solo hay dos variables, pero disminuir f s (y mantener N constante) hará que el tamaño de la ventana aumente, ya que ahora hay menos muestras por unidad de tiempo. La otra alternativa es aumentar N , pero esto nuevamente hace que aumente el tamaño de la ventana. Por lo tanto, cualquier intento de aumentar la resolución de frecuencia provoca un tamaño de ventana mayor y, por tanto, una reducción en la resolución temporal, y viceversa.

frecuencia de rayleigh

Así como la frecuencia de Nyquist es una limitación en la frecuencia máxima que puede analizarse de manera significativa, la frecuencia de Rayleigh también lo es una limitación en la frecuencia mínima.

La frecuencia de Rayleigh es la frecuencia mínima que puede resolverse mediante una ventana de tiempo de duración finita. [4] [5]

Dada una ventana de tiempo de Τ segundos de duración, la frecuencia mínima que se puede resolver es 1/Τ Hz.

La frecuencia de Rayleigh es una consideración importante en las aplicaciones de la transformada de Fourier de corto tiempo (STFT), así como en cualquier otro método de análisis armónico de una señal de longitud de registro finita. [6] [7]

Solicitud

Un STFT que se utiliza para analizar una señal de audio a lo largo del tiempo.

Para analizar música se utilizan con frecuencia STFT, así como transformadas estándar de Fourier y otras herramientas. El espectrograma puede, por ejemplo, mostrar la frecuencia en el eje horizontal, con las frecuencias más bajas a la izquierda y las más altas a la derecha. La altura de cada barra (aumentada por el color) representa la amplitud de las frecuencias dentro de esa banda. La dimensión de profundidad representa el tiempo, donde cada nueva barra era una transformación distinta e independiente. Los ingenieros de audio utilizan este tipo de imágenes para obtener información sobre una muestra de audio, por ejemplo, para localizar las frecuencias de ruidos específicos (especialmente cuando se usan con mayor resolución de frecuencia) o para encontrar frecuencias que pueden ser más o menos resonantes en el espacio donde se encuentran. La señal fue grabada. Esta información se puede utilizar para ecualizar o ajustar otros efectos de audio.

Implementación

función original

Convirtiendo a la forma discreta:

Suponer que

Entonces podemos escribir la función original en

Implementación directa

Restricciones

a. Criterio de Nyquist (evitando el efecto aliasing):

, ¿dónde está el ancho de banda de

Método basado en FFT

Restricción

a. , donde es un número entero

b.

C. Criterio de Nyquist (evitando el efecto aliasing):

, es el ancho de banda de

método recursivo

Restricción

a. , donde es un número entero

b.

C. Criterio de Nyquist (evitando el efecto aliasing):

, es el ancho de banda de

d. Sólo para implementar el STFT rectangular

La ventana rectangular impone la restricción.

La sustitución da:

Cambio de variable n -1 para n :

Calcular por la FFT de N puntos:

dónde

Aplicando la fórmula recursiva para calcular

Transformación chirrido Z

Restricción

entonces

Comparación de implementación

Ver también

Otras transformaciones tiempo-frecuencia:

Referencias

  1. ^ Sejdic E.; Djurović I.; Jiang J. (2009). "Representación de características de tiempo-frecuencia mediante concentración de energía: una descripción general de los avances recientes". Procesamiento de señales digitales . 19 (1): 153–183. Código Bib : 2009DSP....19..153S. doi :10.1016/j.dsp.2007.12.004.
  2. ^ E. Jacobsen y R. Lyons, El DFT deslizante, Revista de procesamiento de señales vol. 20, número 2, págs. 74–80 (marzo de 2003).
  3. ^ Jont B. Allen (junio de 1977). "Análisis, síntesis y modificación espectral de corto tiempo mediante transformada discreta de Fourier". Transacciones IEEE sobre acústica, voz y procesamiento de señales . ASSP-25 (3): 235–238. doi :10.1109/TASSP.1977.1162950.
  4. ^ Kleinfeld, David; Mitra, Partha P. (marzo de 2014). "Métodos espectrales para imágenes funcionales del cerebro". Protocolos de Cold Spring Harbor . 2014 (3): pdb.top081075. doi : 10.1101/pdb.top081075. PMID  24591695.
  5. ^ "¿Qué significa" relleno insuficiente para la resolución de frecuencia solicitada "? - Caja de herramientas FieldTrip".
  6. ^ Zeitler M, Fries P, Gielen S (2008). "Competencia sesgada a través de variaciones en la amplitud de las oscilaciones gamma". J Comput Neurosci . 25 (1): 89-107. doi :10.1007/s10827-007-0066-2. PMC 2441488 . PMID  18293071. 
  7. ^ Wingerden, Marijn van; Vinck, Martín; Lankelma, enero; Pennartz, Cyriel MA (19 de mayo de 2010). "Bloqueo de fase de banda theta de neuronas orbitofrontales durante la expectativa de recompensa". Revista de Neurociencia . 30 (20): 7078–7087. doi :10.1523/JNEUROSCI.3860-09.2010. ISSN  0270-6474. PMC 6632657 . PMID  20484650. 

enlaces externos