stringtranslate.com

Transformada wavelet

Un ejemplo de la transformada wavelet discreta 2D que se utiliza en JPEG2000 .

En matemáticas , una serie wavelet es una representación de una función integrable al cuadrado ( de valor real o complejo ) mediante una serie ortonormal determinada generada por una wavelet . Este artículo proporciona una definición matemática formal de una wavelet ortonormal y de la transformada wavelet integral . [1] [2] [3] [4] [5]

Definición

Una función se denomina wavelet ortonormal si puede utilizarse para definir una base de Hilbert , es decir, un sistema ortonormal completo , para el espacio de Hilbert de funciones integrables al cuadrado .

La base de Hilbert se construye como la familia de funciones mediante traslaciones y dilataciones diádicas de ,

para números enteros .

Si está bajo el producto interior estándar en ,

Esta familia es ortonormal, es un sistema ortonormal:

¿Dónde está el delta de Kronecker ?

La completitud se satisface si cada función puede expandirse en la base como

con convergencia de la serie entendida como convergencia en la norma . Una representación de f de este tipo se conoce como serie wavelet . Esto implica que una wavelet ortonormal es autodual .

La transformada wavelet integral es la transformada integral definida como

Los coeficientes wavelet se dan entonces por

Aquí, se llama dilatación binaria o dilatación diádica , y es la posición binaria o diádica .

Principio

La idea fundamental de las transformadas wavelet es que la transformación debe permitir únicamente cambios en la extensión temporal, pero no en la forma, lo que impone una restricción a la elección de funciones base adecuadas. Se espera que los cambios en la extensión temporal se ajusten a la frecuencia de análisis correspondiente de la función base. Con base en el principio de incertidumbre del procesamiento de señales,

donde representa el tiempo y la frecuencia angular ( , donde es la frecuencia ordinaria ).

Cuanto mayor sea la resolución requerida en el tiempo, menor deberá ser la resolución en frecuencia. Cuanto mayor sea la extensión de las ventanas de análisis elegidas, mayor será el valor de .

Cuando es grande,

  1. Mala resolución de tiempos
  2. Buena resolución de frecuencia
  3. Baja frecuencia, gran factor de escala

Cuando es pequeño

  1. Buena resolución temporal
  2. Mala resolución de frecuencia
  3. Alta frecuencia, pequeño factor de escala

En otras palabras, la función base puede considerarse como una respuesta al impulso de un sistema con el que se ha filtrado la función. La señal transformada proporciona información sobre el tiempo y la frecuencia. Por lo tanto, la transformada wavelet contiene información similar a la transformada de Fourier de tiempo corto , pero con propiedades especiales adicionales de los wavelets, que aparecen en la resolución en el tiempo a frecuencias de análisis más altas de la función base. La diferencia en la resolución temporal a frecuencias ascendentes para la transformada de Fourier y la transformada wavelet se muestra a continuación. Sin embargo, tenga en cuenta que la resolución de frecuencia disminuye para frecuencias crecientes mientras que la resolución temporal aumenta. Esta consecuencia del principio de incertidumbre de Fourier no se muestra correctamente en la Figura.

Esto demuestra que la transformación wavelet es buena en la resolución temporal de frecuencias altas, mientras que para funciones que varían lentamente, la resolución de frecuencia es notable.

Otro ejemplo: el análisis de tres señales sinusoidales superpuestas con STFT y transformación wavelet.

Compresión wavelet

La compresión wavelet es una forma de compresión de datos muy adecuada para la compresión de imágenes (a veces también para la compresión de vídeo y la compresión de audio ). Las implementaciones notables son JPEG 2000 , DjVu y ECW para imágenes fijas, JPEG XS , CineForm y Dirac de la BBC . El objetivo es almacenar datos de imágenes en el menor espacio posible en un archivo . La compresión wavelet puede ser sin pérdida o con pérdida . [6]

Mediante la utilización de una transformada wavelet, los métodos de compresión wavelet son adecuados para representar transitorios , como sonidos de percusión en audio, o componentes de alta frecuencia en imágenes bidimensionales, por ejemplo una imagen de estrellas en un cielo nocturno. Esto significa que los elementos transitorios de una señal de datos pueden representarse mediante una cantidad de información menor que la que se obtendría si se hubiera utilizado alguna otra transformada, como la transformada discreta del coseno , más extendida.

La transformada wavelet discreta se ha aplicado con éxito para la compresión de señales de electrocardiógrafo (ECG) [7]. En este trabajo, se utiliza la alta correlación entre los coeficientes wavelet correspondientes de señales de ciclos cardíacos sucesivos empleando predicción lineal.

La compresión wavelet no es eficaz para todo tipo de datos. La compresión wavelet maneja bien las señales transitorias. Pero las señales periódicas y suaves se comprimen mejor utilizando otros métodos, en particular el análisis armónico tradicional en el dominio de la frecuencia con transformadas relacionadas con Fourier . La compresión de datos que tienen características tanto transitorias como periódicas se puede realizar con técnicas híbridas que utilizan wavelets junto con el análisis armónico tradicional. Por ejemplo, el códec de audio Vorbis utiliza principalmente la transformada de coseno discreta modificada para comprimir audio (que generalmente es suave y periódico), sin embargo permite la adición de un banco de filtros wavelet híbrido para una mejor reproducción de transitorios. [8]

Consulte Diario de un desarrollador x264: Los problemas con wavelets (2010) para ver un análisis de cuestiones prácticas de los métodos actuales que utilizan wavelets para la compresión de vídeo.

Método

Primero se aplica una transformada wavelet. Esto produce tantos coeficientes como píxeles haya en la imagen (es decir, todavía no hay compresión ya que es solo una transformada). Estos coeficientes se pueden comprimir más fácilmente porque la información se concentra estadísticamente en solo unos pocos coeficientes. Este principio se llama codificación de transformada . Después de eso, los coeficientes se cuantifican y los valores cuantificados se codifican por entropía y/o por longitud de serie .

Algunas aplicaciones 1D y 2D de compresión de wavelets utilizan una técnica llamada "huellas de wavelets". [9] [10]

Evaluación

Requisito de compresión de imágenes

En la mayoría de las imágenes naturales, la densidad espectral de las frecuencias más bajas es mayor. [11] Como resultado, la información de la señal de baja frecuencia (señal de referencia) generalmente se conserva, mientras que la información de la señal de detalle se descarta. Desde la perspectiva de la compresión y reconstrucción de imágenes, una ondícula debe cumplir con los siguientes criterios al realizar la compresión de imágenes:

Requisito de variación de turno y comportamiento de timbre

El sistema de compresión de imágenes wavelet implica filtros y diezmado, por lo que puede describirse como un sistema de desplazamiento lineal variante. A continuación se muestra un diagrama típico de transformación wavelet:

El sistema de transformación contiene dos filtros de análisis (un filtro de paso bajo y un filtro de paso alto ), un proceso de diezmado, un proceso de interpolación y dos filtros de síntesis ( y ). El sistema de compresión y reconstrucción generalmente involucra componentes de baja frecuencia, que son los filtros de análisis para la compresión de imágenes y los filtros de síntesis para la reconstrucción. Para evaluar dicho sistema, podemos ingresar un impulso y observar su reconstrucción ; Los wavelets óptimos son aquellos que aportan una varianza de desplazamiento mínima y un lóbulo lateral a . Aunque los wavelets con una varianza de desplazamiento estricta no son realistas, es posible seleccionar wavelets con solo una varianza de desplazamiento leve. Por ejemplo, podemos comparar la varianza de desplazamiento de dos filtros: [12]

Al observar las respuestas al impulso de los dos filtros, podemos concluir que el segundo filtro es menos sensible a la ubicación de entrada (es decir, tiene menos variante de desplazamiento).

Otro aspecto importante para la compresión y reconstrucción de imágenes es el comportamiento oscilatorio del sistema, que puede provocar graves artefactos no deseados en la imagen reconstruida. Para lograrlo, los filtros wavelet deben tener una gran relación pico-lóbulo lateral.

Hasta ahora hemos hablado de la transformación unidimensional del sistema de compresión de imágenes. Esta cuestión se puede extender a las dos dimensiones, aunque se propone un término más general: transformaciones multiescala desplazables. [13]

Derivación de la respuesta al impulso

Como se mencionó anteriormente, la respuesta al impulso se puede utilizar para evaluar el sistema de compresión/reconstrucción de imágenes.

Para la secuencia de entrada , la señal de referencia después de un nivel de descomposición se diezma por un factor de dos, mientras que es un filtro de paso bajo. De manera similar, la siguiente señal de referencia se obtiene por se diezma por un factor de dos. Después de L niveles de descomposición (y diezma), la respuesta del análisis se obtiene reteniendo una de cada muestra: .

Por otra parte, para reconstruir la señal x(n), podemos considerar una señal de referencia . Si las señales de detalle son iguales a cero para , entonces la señal de referencia en la etapa anterior ( etapa ) es , que se obtiene interpolando y convolucionando con . De manera similar, se itera el procedimiento para obtener la señal de referencia en la etapa . Luego de L iteraciones, se calcula la respuesta al impulso de síntesis: , que relaciona la señal de referencia y la señal reconstruida.

Para obtener el sistema general de análisis/síntesis de nivel L, las respuestas de análisis y síntesis se combinan de la siguiente manera:

.

Finalmente, la relación entre el pico y el primer lóbulo lateral y el segundo lóbulo lateral promedio de la respuesta al impulso general se pueden utilizar para evaluar el rendimiento de compresión de imágenes wavelet.

Comparación con la transformada de Fourier y el análisis tiempo-frecuencia

Las wavelets tienen algunas ligeras ventajas sobre las transformadas de Fourier en la reducción de los cálculos al examinar frecuencias específicas. Sin embargo, rara vez son más sensibles y, de hecho, la wavelet de Morlet común es matemáticamente idéntica a una transformada de Fourier de tiempo corto que utiliza una función de ventana gaussiana. [14] La excepción es cuando se buscan señales de una forma conocida, no sinusoidal (por ejemplo, latidos del corazón); en ese caso, el uso de wavelets emparejados puede superar los análisis STFT/Morlet estándar. [15]

Otras aplicaciones prácticas

La transformada wavelet nos puede proporcionar la frecuencia de las señales y el tiempo asociado a esas frecuencias, lo que la hace muy conveniente para su aplicación en numerosos campos. Por ejemplo, el procesamiento de señales de aceleraciones para el análisis de la marcha, [16] para la detección de fallas, [17] para el análisis de desplazamientos estacionales de deslizamientos de tierra, [18] para el diseño de marcapasos de baja potencia y también en comunicaciones inalámbricas de banda ultra ancha (UWB). [19] [20] [21]

  1. Discretización del eje

    Se aplicó la siguiente discretización de frecuencia y tiempo:

    Dando lugar a wavelets de la forma, la fórmula discreta para el wavelet base:

    Estas wavelets discretas se pueden utilizar para la transformación:

  2. Implementación mediante la FFT (transformada rápida de Fourier)

    Como se desprende de la representación de la transformación wavelet (que se muestra a continuación)

    donde es el factor de escala, representa el factor de cambio de tiempo

    Y como ya se ha mencionado en este contexto, la transformación wavelet corresponde a una convolución de una función y una función wavelet. Una convolución puede implementarse como una multiplicación en el dominio de la frecuencia. Con esto, el siguiente enfoque de implementación resulta en:

    • Transformada de Fourier de la señal con la FFT
    • Selección de un factor de escala discreto
    • Escala de la función base wavelet por este factor y posterior FFT de esta función
    • Multiplicación con la señal transformada YFFT del primer paso
    • La transformación inversa del producto en el dominio del tiempo da como resultado para diferentes valores discretos de y un valor discreto de
    • Regrese al segundo paso, hasta que se procesen todos los valores de escala discretos.
    Existen muchos tipos diferentes de transformadas wavelet para propósitos específicos. Consulte también una lista completa de transformadas relacionadas con wavelet , pero las más comunes se enumeran a continuación: wavelet de sombrero mexicano , wavelet de Haar , wavelet de Daubechies y wavelet triangular.
  3. Detección de fallas en sistemas eléctricos de potencia. [22]
  4. Estimación estadística adaptativa local de funciones cuya suavidad varía sustancialmente en el dominio, o más específicamente, estimación de funciones que son escasas en el dominio wavelet. [23]

Ondículas causales en el tiempo

Para procesar señales temporales en tiempo real, es esencial que los filtros wavelet no accedan a valores de señales del futuro y que se puedan obtener latencias temporales mínimas. Szu et al [24] y Lindeberg [25] desarrollaron representaciones wavelet causales en el tiempo , y este último método también implica una implementación recursiva en el tiempo que ahorra memoria.

Transformación sincronizada y comprimida

La transformación sincronizada y comprimida puede mejorar significativamente la resolución temporal y de frecuencia de la representación tiempo-frecuencia obtenida utilizando la transformación wavelet convencional. [26] [27]

Véase también

Referencias

  1. ^ Meyer, Yves (1992), Wavelets y operadores, Cambridge, Reino Unido: Cambridge University Press, ISBN  0-521-42000-8
  2. ^ Chui, Charles K. (1992), Introducción a las wavelets, San Diego, CA: Academic Press, ISBN 0-12-174584-8 
  3. ^ Daubechies, Ingrid. (1992), Diez conferencias sobre wavelets, SIAM, ISBN 978-0-89871-274-2 
  4. ^ Akansu, Ali N.; Haddad, Richard A. (1992), Descomposición de señales multirresolución: transformadas, subbandas y wavelets, Boston, MA: Academic Press, ISBN 978-0-12-047141-6 
  5. ^ Ghaderpour, E.; Pagiatakis, SD; Hassan, QK (2021). "Una encuesta sobre detección de cambios y análisis de series temporales con aplicaciones". Applied Sciences . 11 (13): 6141. doi : 10.3390/app11136141 . hdl : 11573/1655273 .
  6. ^ JPEG 2000 , por ejemplo, puede utilizar un wavelet 5/3 para una transformación sin pérdida (reversible) y un wavelet 9/7 para una transformación con pérdida (irreversible).
  7. ^ Ramakrishnan, AG; Saha, S. (1997). "Codificación de ECG mediante predicción lineal basada en wavelets" (PDF) . IEEE Transactions on Biomedical Engineering . 44 (12): 1253–1261. doi :10.1109/10.649997. PMID  9401225. S2CID  8834327.
  8. ^ "Especificación Vorbis I". Fundación Xiph.Org . 4 de julio de 2020. Archivado desde el original el 3 de abril de 2022. Consultado el 10 de abril de 2022. Vorbis I es un CODEC de transformación monolítico adaptativo hacia delante basado en la Transformada de Coseno Discreta Modificada. El códec está estructurado para permitir la adición de un banco de filtros wavelet híbrido en Vorbis II para ofrecer una mejor respuesta y reproducción transitoria utilizando una transformación más adecuada para eventos temporales localizados.
  9. ^ N. Malmurugan, A. Shanmugam, S. Jayaraman y VV Dinesh Chander. "Un nuevo y novedoso algoritmo de compresión de imágenes que utiliza huellas wavelet"
  10. ^ Ho Tatt Wei y Jeoti, V. "Un esquema de compresión basado en huellas de ondículas para señales de ECG". Ho Tatt Wei; Jeoti, V. (2004). "Un esquema de compresión basado en huellas de ondículas para señales de ECG". Conferencia IEEE Región 10 de 2004 TENCON 2004. Vol. A. p. 283. doi :10.1109/TENCON.2004.1414412. ISBN 0-7803-8560-8.S2CID43806122  .​
  11. ^ J. Field, David (1987). "Relaciones entre las estadísticas de imágenes naturales y las propiedades de respuesta de las células corticales" (PDF) . J. Opt. Soc. Am. A . 4 (12): 2379–2394. Bibcode :1987JOSAA...4.2379F. doi :10.1364/JOSAA.4.002379. PMID  3430225.
  12. ^ Villasenor, John D. (agosto de 1995). "Evaluación de filtros wavelet para compresión de imágenes". IEEE Transactions on Image Processing . 4 (8): 1053–60. Bibcode :1995ITIP....4.1053V. doi :10.1109/83.403412. PMID  18291999.
  13. ^ Simoncelli, EP; Freeman, WT; Adelson, EH; Heeger, DJ (1992). "Transformadas multiescala desplazables". IEEE Transactions on Information Theory . 38 (2): 587–607. doi :10.1109/18.119725. S2CID  43701174.
  14. ^ Bruns, Andreas (2004). "Análisis de señales basado en Fourier, Hilbert y wavelet: ¿son realmente enfoques diferentes?". Journal of Neuroscience Methods . 137 (2): 321–332. doi :10.1016/j.jneumeth.2004.03.002. PMID  15262077. S2CID  21880274.
  15. ^ Krantz, Steven G. (1999). Un panorama del análisis armónico . Asociación Matemática de Estados Unidos. ISBN 0-88385-031-1.
  16. ^ Martin, E. (2011). "Nuevo método para la estimación de la longitud de la zancada con acelerómetros de red de área corporal". Conferencia temática IEEE de 2011 sobre tecnologías inalámbricas biomédicas, redes y sistemas de detección . págs. 79–82. doi :10.1109/BIOWIRELESS.2011.5724356. ISBN. 978-1-4244-8316-7. Número de identificación del sujeto  37689047.
  17. ^ Liu, Jie (2012). "Análisis del espectro wavelet de Shannon en señales de vibración truncadas para la detección de fallas incipientes en máquinas". Measurement Science and Technology . 23 (5): 1–11. Bibcode :2012MeScT..23e5604L. doi :10.1088/0957-0233/23/5/055604. S2CID  121684952.
  18. ^ Tomás, R.; Li, Z.; Lopez-Sanchez, JM; Liu, P.; Singleton, A. (1 de junio de 2016). "Uso de herramientas wavelet para analizar variaciones estacionales a partir de datos de series temporales InSAR: un estudio de caso del deslizamiento de tierra de Huangtupo". Deslizamientos de tierra . 13 (3): 437–450. Bibcode :2016Lands..13..437T. doi :10.1007/s10346-015-0589-y. ISSN  1612-5118.
  19. ^ Akansu, AN; Serdijn, WA; Selesnick, IW (2010). "Aplicaciones emergentes de wavelets: una revisión" (PDF) . Physical Communication . 3 : 1–18. doi :10.1016/j.phycom.2009.07.001.
  20. ^ Sheybani, E.; Javidi, G. (diciembre de 2009). "Reducción de dimensionalidad y eliminación de ruido en conjuntos de datos de redes de sensores inalámbricos". Segunda Conferencia Internacional de 2009 sobre Ingeniería Informática y Eléctrica . Vol. 2. págs. 674–677. doi :10.1109/ICCEE.2009.282. ISBN 978-1-4244-5365-8. Número de identificación del sujeto  17066179.
  21. ^ Sheybani, EO; Javidi, G. (mayo de 2012). "Bancos de filtros de resolución múltiple para imágenes SAR mejoradas". Conferencia internacional sobre sistemas e informática de 2012 (ICSAI2012) . págs. 2702–2706. doi :10.1109/ICSAI.2012.6223611. ISBN 978-1-4673-0199-2. Número de identificación del sujeto  16302915.
  22. ^ Silva, KM; Souza, BA; Brito, NSD (octubre de 2006). "Detección y clasificación de fallas en líneas de transmisión basadas en transformada wavelet y ANN". IEEE Transactions on Power Delivery . 21 (4): 2058–2063. doi :10.1109/TPWRD.2006.876659. S2CID  36881450.
  23. ^ Wasserman, LA (2005). Todas las estadísticas no paramétricas .
  24. ^ Szu, Harold H.; Telfer, Brian A.; Lohmann, Adolf W. (1992). "Transformada wavelet analítica causal". Ingeniería óptica . 31 (9): 1825. Bibcode :1992OptEn..31.1825S. doi :10.1117/12.59911.
  25. ^ Lindeberg, T. (23 de enero de 2023). "Una representación de escala-espacio covariante, recursiva en el tiempo y causal en el tiempo, de señales temporales y tiempo pasado". Cibernética biológica . 117 (1–2): 21–59. doi : 10.1007/s00422-022-00953-6 . PMC 10160219 . PMID  36689001. 
  26. ^ Daubechies, Ingrid; Lu, Jianfeng; Wu, Hau-Tieng (12 de diciembre de 2009). "Transformadas wavelet sincronizadas: una herramienta para la descomposición modal empírica". arXiv : 0912.2437 [math.NA].
  27. ^ Qu, Hongya; Li, Tiantian; Chen, Genda (1 de enero de 2019). "Transformada wavelet adaptativa sincronizada y comprimida con parámetros óptimos para series temporales arbitrarias". Sistemas mecánicos y procesamiento de señales . 114 : 366–377. Bibcode :2019MSSP..114..366Q. doi : 10.1016/j.ymssp.2018.05.020 . S2CID  126007150.

Lectura adicional

Enlaces externos