La transformada de Fourier de una función del tiempo, s(t), es una función de frecuencia de valor complejo, S(f), a menudo denominada espectro de frecuencia . Cualquier operación lineal invariante en el tiempo sobre s(t) produce un nuevo espectro de la forma H(f)•S(f), que cambia las magnitudes relativas y/o los ángulos ( fase ) de los valores distintos de cero de S(f). Cualquier otro tipo de operación crea nuevos componentes de frecuencia que pueden denominarse fugas espectrales en el sentido más amplio. El muestreo , por ejemplo, produce fugas, a las que llamamos alias del componente espectral original. Para los fines de la transformada de Fourier , el muestreo se modela como un producto entre s(t) y una función de peine de Dirac . El espectro de un producto es la convolución entre S(f) y otra función, que inevitablemente crea los nuevos componentes de frecuencia. Pero el término "fuga" suele referirse al efecto de la función ventana , que es el producto de s(t) con un tipo diferente de función, la función ventana . Las funciones de ventana tienen una duración finita, pero eso no es necesario para que se produzcan fugas. Basta con multiplicarlas por una función variable en el tiempo.
La transformada de Fourier de la función cos( ωt ) es cero, excepto en la frecuencia ± ω . Sin embargo, muchas otras funciones y formas de onda no tienen transformadas de forma cerrada convenientes. Alternativamente, uno podría estar interesado en su contenido espectral solo durante un cierto período de tiempo. En cualquier caso, la transformada de Fourier (o una transformada similar) se puede aplicar en uno o más intervalos finitos de la forma de onda. En general, la transformada se aplica al producto de la forma de onda y una función de ventana. Cualquier ventana (incluida la rectangular) afecta la estimación espectral calculada por este método.
Los efectos se caracterizan más fácilmente por su efecto sobre una función s(t) sinusoidal, cuya transformada de Fourier sin ventana es cero para todas las frecuencias excepto una. La frecuencia habitual de elección es 0 Hz, porque la transformada de Fourier con ventana es simplemente la transformada de Fourier de la propia función ventana (véase § Ejemplos de funciones ventana ) :
Cuando se aplican tanto el muestreo como el ventanaje a s(t), en cualquier orden, la fuga causada por el ventanaje es una dispersión relativamente localizada de los componentes de frecuencia, a menudo con un efecto de desenfoque, mientras que el aliasing causado por el muestreo es una repetición periódica de todo el espectro desenfocado.
La ventana de una forma de onda simple como cos( ωt ) hace que su transformada de Fourier desarrolle valores distintos de cero (comúnmente llamados fuga espectral) en frecuencias distintas de ω . La fuga tiende a ser peor (más alta) cerca de ω y menor en frecuencias más alejadas de ω .
Si la forma de onda que se analiza comprende dos sinusoides de diferentes frecuencias, la fuga puede interferir con nuestra capacidad para distinguirlas espectralmente. Los posibles tipos de interferencia a menudo se dividen en dos clases opuestas de la siguiente manera: si las frecuencias de los componentes son diferentes y un componente es más débil, entonces la fuga del componente más fuerte puede ocultar la presencia del más débil. Pero si las frecuencias son demasiado similares, la fuga puede hacer que no se puedan resolver incluso cuando las sinusoides tienen la misma fuerza. Las ventanas que son efectivas contra el primer tipo de interferencia, es decir, cuando los componentes tienen frecuencias y amplitudes diferentes, se denominan alto rango dinámico . Por el contrario, las ventanas que pueden distinguir componentes con frecuencias y amplitudes similares se denominan alta resolución .
La ventana rectangular es un ejemplo de una ventana de alta resolución pero de bajo rango dinámico , lo que significa que es buena para distinguir componentes de amplitud similar incluso cuando las frecuencias también están cerca, pero deficiente para distinguir componentes de diferente amplitud incluso cuando las frecuencias están lejos. Las ventanas de alta resolución y bajo rango dinámico, como la ventana rectangular, también tienen la propiedad de alta sensibilidad , que es la capacidad de revelar sinusoides relativamente débiles en presencia de ruido aleatorio aditivo. Esto se debe a que el ruido produce una respuesta más fuerte con ventanas de alto rango dinámico que con ventanas de alta resolución.
En el otro extremo de la gama de tipos de ventanas se encuentran las ventanas con un alto rango dinámico pero una baja resolución y sensibilidad. Las ventanas de alto rango dinámico suelen justificarse en aplicaciones de banda ancha , donde se espera que el espectro que se analiza contenga muchos componentes diferentes de diversas amplitudes.
Entre los extremos se encuentran las ventanas moderadas, como las de Hann y Hamming . Se utilizan habitualmente en aplicaciones de banda estrecha , como el espectro de un canal telefónico.
En resumen, el análisis espectral implica un equilibrio entre la resolución de componentes de fuerza comparables con frecuencias similares ( alta resolución/sensibilidad ) y la resolución de componentes de fuerza dispares con frecuencias diferentes ( alto rango dinámico ). Ese equilibrio se produce cuando se elige la función de ventana. [1] : p.90
Cuando la forma de onda de entrada se muestrea en el tiempo, en lugar de ser continua, el análisis se realiza generalmente aplicando una función de ventana y luego una transformada de Fourier discreta (DFT). Pero la DFT proporciona solo un muestreo disperso del espectro real de la transformada de Fourier discreta en el tiempo (DTFT). La Figura 2, fila 3, muestra una DTFT para una sinusoide con ventana rectangular. La frecuencia real de la sinusoide se indica como "13" en el eje horizontal. Todo lo demás es una fuga, exagerada por el uso de una presentación logarítmica. La unidad de frecuencia es "DFT bins"; es decir, los valores enteros en el eje de frecuencia corresponden a las frecuencias muestreadas por la DFT. [2] : p.56 eq.(16) Por lo tanto, la figura representa un caso en el que la frecuencia real de la sinusoide coincide con una muestra de DFT, y el valor máximo del espectro se mide con precisión por esa muestra. En la fila 4, no alcanza el valor máximo por 1 ⁄ 2 bin, y el error de medición resultante se conoce como pérdida festoneada (inspirada en la forma del pico). Para una frecuencia conocida, como una nota musical o una señal de prueba sinusoidal, la coincidencia de la frecuencia con un bin DFT se puede preorganizar mediante la elección de una frecuencia de muestreo y una longitud de ventana que dé como resultado un número entero de ciclos dentro de la ventana.
Los conceptos de resolución y rango dinámico tienden a ser algo subjetivos, dependiendo de lo que el usuario esté realmente tratando de hacer. Pero también tienden a estar altamente correlacionados con la fuga total, que es cuantificable. Generalmente se expresa como un ancho de banda equivalente, B. Se puede pensar en él como una redistribución de la DTFT en una forma rectangular con una altura igual al máximo espectral y un ancho B. [A] [3] Cuanto mayor sea la fuga, mayor será el ancho de banda. A veces se le llama ancho de banda equivalente de ruido o ancho de banda de ruido equivalente , porque es proporcional a la potencia promedio que registrará cada bin de DFT cuando la señal de entrada contiene un componente de ruido aleatorio (o es simplemente ruido aleatorio). Un gráfico del espectro de potencia , promediado en el tiempo, generalmente revela un piso de ruido plano , causado por este efecto. La altura del piso de ruido es proporcional a B. Por lo tanto, dos funciones de ventana diferentes pueden producir pisos de ruido diferentes, como se ve en las figuras 1 y 3.
En el procesamiento de señales , se eligen operaciones para mejorar algún aspecto de la calidad de una señal explotando las diferencias entre la señal y las influencias corruptoras. Cuando la señal es una sinusoide corrupta por ruido aleatorio aditivo, el análisis espectral distribuye los componentes de señal y ruido de manera diferente, lo que a menudo facilita la detección de la presencia de la señal o la medición de ciertas características, como la amplitud y la frecuencia. Efectivamente, la relación señal-ruido (SNR) se mejora distribuyendo el ruido de manera uniforme, mientras se concentra la mayor parte de la energía de la sinusoide alrededor de una frecuencia. La ganancia de procesamiento es un término que se usa a menudo para describir una mejora de la SNR. La ganancia de procesamiento del análisis espectral depende de la función de ventana, tanto de su ancho de banda de ruido (B) como de su posible pérdida por festoneado. Estos efectos se compensan parcialmente, porque las ventanas con menos festoneado naturalmente tienen la mayor fuga.
La figura 3 muestra los efectos de tres funciones de ventana diferentes en el mismo conjunto de datos, que comprende dos sinusoides de igual intensidad en ruido aditivo. Las frecuencias de las sinusoides se eligen de manera que una no presente festoneado y la otra presente festoneado máximo. Ambas sinusoides sufren menos pérdida de relación señal-ruido bajo la ventana de Hann que bajo la ventana de Blackman-Harris . En general (como se mencionó anteriormente), esto es un impedimento para el uso de ventanas de alto rango dinámico en aplicaciones de bajo rango dinámico.
Las fórmulas proporcionadas en § Ejemplos de funciones de ventana producen secuencias discretas, como si se hubiera "muestreado" una función de ventana continua. (Vea un ejemplo en Ventana de Kaiser .) Las secuencias de ventana para análisis espectral son simétricas o 1 muestra menos que simétricas (llamadas periódicas , [4] [5] DFT-par , o DFT-simétrica [2] : p.52 ). Por ejemplo, una secuencia simétrica verdadera, con su máximo en un único punto central, es generada por la función MATLABhann(9,'symmetric')
. Borrar la última muestra produce una secuencia idéntica a hann(8,'periodic')
. De manera similar, la secuencia hann(8,'symmetric')
tiene dos puntos centrales iguales. [6]
Algunas funciones tienen uno o dos puntos finales con valor cero, que son innecesarios en la mayoría de las aplicaciones. Eliminar un punto final con valor cero no tiene ningún efecto sobre su DTFT (fuga espectral). Pero la función diseñada para N + 1 o N + 2 muestras, en previsión de eliminar uno o ambos puntos finales, normalmente tiene un lóbulo principal ligeramente más estrecho, lóbulos laterales ligeramente más altos y un ancho de banda de ruido ligeramente menor. [7]
El predecesor de la DFT es la transformada de Fourier finita , y las funciones de ventana eran "siempre un número impar de puntos y exhibían simetría par sobre el origen". [2] : p.52 En ese caso, la DTFT es completamente de valor real. Cuando la misma secuencia se desplaza a una ventana de datos DFT , la DTFT se vuelve de valor complejo excepto en frecuencias espaciadas a intervalos regulares de [a] Por lo tanto, cuando se muestrean mediante una DFT de longitud, las muestras (llamadas coeficientes DFT ) siguen siendo de valor real. Una aproximación es truncar la secuencia de longitud N +1 (efectivamente ), y calcular una DFT de longitud. La DTFT (fuga espectral) se ve ligeramente afectada, pero las muestras siguen siendo de valor real. [8] [B] Los términos DFT-par y periódica se refieren a la idea de que si la secuencia truncada se repitiera periódicamente, sería par-simétrica y su DTFT sería completamente de valor real. Pero la DTFT real generalmente tiene valores complejos, excepto los coeficientes de la DFT. Los gráficos espectrales como los que se muestran en § Ejemplos de funciones de ventana se generan muestreando la DTFT a intervalos mucho más pequeños que y mostrando solo el componente de magnitud de los números complejos.
En DTFT § L=N+1 se describe un método exacto para muestrear la DTFT de una secuencia de longitud N +1 a intervalos de . Básicamente, se combina con (por adición), y se realiza una DFT de puntos en la secuencia truncada. De manera similar, el análisis espectral se realizaría combinando las muestras de datos y antes de aplicar la ventana simétrica truncada. Esa no es una práctica común, aunque las ventanas truncadas son muy populares. [2] [9] [10] [11] [12] [13] [b]
El atractivo de las ventanas simétricas DFT se explica por la popularidad del algoritmo de transformada rápida de Fourier (FFT) para la implementación de la DFT, porque el truncamiento de una secuencia de longitud impar da como resultado una secuencia de longitud par. Sus coeficientes DFT de valor real también son una ventaja en ciertas aplicaciones esotéricas [C] donde la creación de ventanas se logra mediante convolución entre los coeficientes DFT y una DFT sin ventanas de los datos. [14] [2] : p.62 [1] : p.85 En esas aplicaciones, se prefieren las ventanas DFT simétricas (de longitud par o impar) de la familia Coseno-suma, porque la mayoría de sus coeficientes DFT tienen valor cero, lo que hace que la convolución sea muy eficiente. [D] [1] : p.85
Al seleccionar una función de ventana adecuada para una aplicación, este gráfico de comparación puede resultar útil. El eje de frecuencia tiene unidades de "contenedores" de FFT cuando se aplica la ventana de longitud N a los datos y se calcula una transformación de longitud N. Por ejemplo, el valor en la frecuencia 1/2" bin" es la respuesta que se mediría en los bins k y k + 1 a una señal sinusoidal en la frecuencia k + 1/2 . Es relativo a la respuesta máxima posible, que ocurre cuando la frecuencia de la señal es un número entero de bins. El valor en la frecuencia 1/2 se denomina pérdida máxima de festoneado de la ventana, que es una métrica que se utiliza para comparar ventanas. La ventana rectangular es notablemente peor que las demás en términos de esa métrica.
Otras métricas que se pueden ver son el ancho del lóbulo principal y el nivel pico de los lóbulos laterales, que determinan respectivamente la capacidad de resolver señales de intensidad comparable y señales de intensidad dispar. La ventana rectangular (por ejemplo) es la mejor opción para la primera y la peor opción para la segunda. Lo que no se puede ver en los gráficos es que la ventana rectangular tiene el mejor ancho de banda de ruido, lo que la convierte en una buena candidata para detectar sinusoides de bajo nivel en un entorno que, por lo demás, sería de ruido blanco . Existen técnicas de interpolación, como el relleno de ceros y el desplazamiento de frecuencia, para mitigar su posible pérdida por festoneado.
Se puede demostrar que la técnica de muestreo DFT-even propuesta por Harris no es la más adecuada.
Las ventanas son secuencias pares (en torno al origen) con un número impar de puntos. Se descartará el punto más a la derecha de la ventana.