Técnica matemática utilizada en la compresión y análisis de datos.
En matemáticas , una serie wavelet es una representación de una función integrable al cuadrado ( de valor real o complejo ) mediante una serie ortonormal determinada generada por una wavelet . Este artículo proporciona una definición matemática formal de una wavelet ortonormal y de la transformada wavelet integral . [1] [2] [3] [4] [5]
La completitud se satisface si cada función puede expandirse en la base como
con convergencia de la serie entendida como convergencia en la norma . Una representación de f de este tipo se conoce como serie wavelet . Esto implica que una wavelet ortonormal es autodual .
Aquí, se llama dilatación binaria o dilatación diádica , y es la posición binaria o diádica .
Principio
La idea fundamental de las transformadas wavelet es que la transformación debe permitir únicamente cambios en la extensión temporal, pero no en la forma, lo que impone una restricción a la elección de funciones base adecuadas. Se espera que los cambios en la extensión temporal se ajusten a la frecuencia de análisis correspondiente de la función base. Con base en el principio de incertidumbre del procesamiento de señales,
Cuanto mayor sea la resolución requerida en el tiempo, menor deberá ser la resolución en frecuencia. Cuanto mayor sea la extensión de las ventanas de análisis elegidas, mayor será el valor de .
Cuando es grande,
Mala resolución de tiempos
Buena resolución de frecuencia
Baja frecuencia, gran factor de escala
Cuando es pequeño
Buena resolución temporal
Mala resolución de frecuencia
Alta frecuencia, pequeño factor de escala
En otras palabras, la función base puede considerarse como una respuesta al impulso de un sistema con el que se ha filtrado la función. La señal transformada proporciona información sobre el tiempo y la frecuencia. Por lo tanto, la transformada wavelet contiene información similar a la transformada de Fourier de tiempo corto , pero con propiedades especiales adicionales de los wavelets, que aparecen en la resolución en el tiempo a frecuencias de análisis más altas de la función base. La diferencia en la resolución temporal a frecuencias ascendentes para la transformada de Fourier y la transformada wavelet se muestra a continuación. Sin embargo, tenga en cuenta que la resolución de frecuencia disminuye para frecuencias crecientes mientras que la resolución temporal aumenta. Esta consecuencia del principio de incertidumbre de Fourier no se muestra correctamente en la Figura.
Esto demuestra que la transformación wavelet es buena en la resolución temporal de frecuencias altas, mientras que para funciones que varían lentamente, la resolución de frecuencia es notable.
Otro ejemplo: el análisis de tres señales sinusoidales superpuestas con STFT y transformación wavelet.
Mediante la utilización de una transformada wavelet, los métodos de compresión wavelet son adecuados para representar transitorios , como sonidos de percusión en audio, o componentes de alta frecuencia en imágenes bidimensionales, por ejemplo una imagen de estrellas en un cielo nocturno. Esto significa que los elementos transitorios de una señal de datos pueden representarse mediante una cantidad de información menor que la que se obtendría si se hubiera utilizado alguna otra transformada, como la más extendida transformada de coseno discreta .
La transformada wavelet discreta se ha aplicado con éxito para la compresión de señales de electrocardiógrafo (ECG) [7]. En este trabajo, se utiliza la alta correlación entre los coeficientes wavelet correspondientes de señales de ciclos cardíacos sucesivos empleando predicción lineal.
La compresión wavelet no es eficaz para todo tipo de datos. La compresión wavelet maneja bien las señales transitorias. Pero las señales periódicas y suaves se comprimen mejor utilizando otros métodos, en particular el análisis armónico tradicional en el dominio de la frecuencia con transformadas relacionadas con Fourier . La compresión de datos que tienen características tanto transitorias como periódicas se puede realizar con técnicas híbridas que utilizan wavelets junto con el análisis armónico tradicional. Por ejemplo, el códec de audio Vorbis utiliza principalmente la transformada de coseno discreta modificada para comprimir audio (que generalmente es suave y periódico), sin embargo permite la adición de un banco de filtros wavelet híbrido para una mejor reproducción de transitorios. [8]
Consulte Diario de un desarrollador x264: Los problemas con wavelets (2010) para ver un análisis de cuestiones prácticas de los métodos actuales que utilizan wavelets para la compresión de vídeo.
Método
Primero se aplica una transformada wavelet. Esto produce tantos coeficientes como píxeles haya en la imagen (es decir, todavía no hay compresión ya que es solo una transformada). Estos coeficientes se pueden comprimir más fácilmente porque la información se concentra estadísticamente en solo unos pocos coeficientes. Este principio se llama codificación de transformada . Después de eso, los coeficientes se cuantifican y los valores cuantificados se codifican por entropía y/o por longitud de serie .
Algunas aplicaciones 1D y 2D de compresión de wavelets utilizan una técnica llamada "huellas de wavelets". [9] [10]
Evaluación
Requisito de compresión de imágenes
En la mayoría de las imágenes naturales, la densidad espectral de las frecuencias más bajas es mayor. [11] Como resultado, la información de la señal de baja frecuencia (señal de referencia) generalmente se conserva, mientras que la información de la señal de detalle se descarta. Desde la perspectiva de la compresión y reconstrucción de imágenes, una wavelet debe cumplir con los siguientes criterios al realizar la compresión de imágenes:
Poder transformar más imagen original en la señal de referencia.
Reconstrucción de máxima fidelidad basada en la señal de referencia.
No debe provocar artefactos en la imagen reconstruida únicamente a partir de la señal de referencia.
Requisito de variación de turno y comportamiento de timbre
El sistema de compresión de imágenes wavelet implica filtros y diezmado, por lo que puede describirse como un sistema de desplazamiento lineal variante. A continuación se muestra un diagrama típico de transformación wavelet:
El sistema de transformación contiene dos filtros de análisis (un filtro de paso bajo y un filtro de paso alto ), un proceso de diezmado, un proceso de interpolación y dos filtros de síntesis ( y ). El sistema de compresión y reconstrucción generalmente involucra componentes de baja frecuencia, que son los filtros de análisis para la compresión de imágenes y los filtros de síntesis para la reconstrucción. Para evaluar dicho sistema, podemos ingresar un impulso y observar su reconstrucción ; Los wavelets óptimos son aquellos que aportan una varianza de desplazamiento mínima y un lóbulo lateral a . Aunque los wavelets con una varianza de desplazamiento estricta no son realistas, es posible seleccionar wavelets con solo una varianza de desplazamiento leve. Por ejemplo, podemos comparar la varianza de desplazamiento de dos filtros: [12]
Al observar las respuestas de impulso de los dos filtros, podemos concluir que el segundo filtro es menos sensible a la ubicación de entrada (es decir, tiene menos variante de desplazamiento).
Otro aspecto importante para la compresión y reconstrucción de imágenes es el comportamiento oscilatorio del sistema, que puede provocar graves artefactos no deseados en la imagen reconstruida. Para lograrlo, los filtros wavelet deben tener una gran relación pico-lóbulo lateral.
Hasta ahora hemos analizado la transformación unidimensional del sistema de compresión de imágenes. Esta cuestión se puede extender a dos dimensiones, aunque se propone un término más general: transformaciones multiescala desplazables. [13]
Derivación de la respuesta al impulso
Como se mencionó anteriormente, la respuesta al impulso se puede utilizar para evaluar el sistema de compresión/reconstrucción de imágenes.
Para la secuencia de entrada , la señal de referencia después de un nivel de descomposición se diezma por un factor de dos, mientras que es un filtro de paso bajo. De manera similar, la siguiente señal de referencia se obtiene por se diezma por un factor de dos. Después de L niveles de descomposición (y diezma), la respuesta del análisis se obtiene reteniendo una de cada muestra: .
Por otra parte, para reconstruir la señal x(n), podemos considerar una señal de referencia . Si las señales de detalle son iguales a cero para , entonces la señal de referencia en la etapa anterior ( etapa ) es , que se obtiene interpolando y convolucionando con . De manera similar, se itera el procedimiento para obtener la señal de referencia en la etapa . Luego de L iteraciones, se calcula la respuesta al impulso de síntesis: , que relaciona la señal de referencia y la señal reconstruida.
Para obtener el sistema general de análisis/síntesis de nivel L, las respuestas de análisis y síntesis se combinan de la siguiente manera:
.
Finalmente, la relación entre el pico y el primer lóbulo lateral y el segundo lóbulo lateral promedio de la respuesta al impulso general se pueden utilizar para evaluar el rendimiento de compresión de imágenes wavelet.
Comparación con la transformada de Fourier y el análisis tiempo-frecuencia
Las wavelets tienen algunas ligeras ventajas sobre las transformadas de Fourier en la reducción de los cálculos al examinar frecuencias específicas. Sin embargo, rara vez son más sensibles y, de hecho, la wavelet de Morlet común es matemáticamente idéntica a una transformada de Fourier de tiempo corto que utiliza una función de ventana gaussiana. [14] La excepción es cuando se buscan señales de una forma conocida, no sinusoidal (por ejemplo, latidos del corazón); en ese caso, el uso de wavelets emparejados puede superar los análisis STFT/Morlet estándar. [15]
Otras aplicaciones prácticas
La transformada wavelet nos puede proporcionar la frecuencia de las señales y el tiempo asociado a esas frecuencias, lo que la hace muy conveniente para su aplicación en numerosos campos. Por ejemplo, el procesamiento de señales de aceleraciones para el análisis de la marcha, [16] para la detección de fallas, [17] para el análisis de desplazamientos estacionales de deslizamientos de tierra, [18] para el diseño de marcapasos de baja potencia y también en comunicaciones inalámbricas de banda ultra ancha (UWB). [19] [20] [21]
Discretización del eje
Se aplicó la siguiente discretización de frecuencia y tiempo:
Dando lugar a wavelets de la forma, la fórmula discreta para el wavelet base:
Estas wavelets discretas se pueden utilizar para la transformación:
Implementación mediante la FFT (transformada rápida de Fourier)
Como se desprende de la representación de la transformación wavelet (que se muestra a continuación)
donde es el factor de escala, representa el factor de cambio de tiempo
Y como ya se ha mencionado en este contexto, la transformación wavelet corresponde a una convolución de una función y una función wavelet. Una convolución puede implementarse como una multiplicación en el dominio de la frecuencia. Con esto, el siguiente enfoque de implementación resulta en:
Transformada de Fourier de la señal con la FFT
Selección de un factor de escala discreto
Escala de la función base wavelet por este factor y posterior FFT de esta función
Multiplicación con la señal transformada YFFT del primer paso
La transformación inversa del producto en el dominio del tiempo da como resultado para diferentes valores discretos de y un valor discreto de
Regrese al segundo paso, hasta que se procesen todos los valores de escala discretos.
Detección de fallas en sistemas eléctricos de potencia. [22]
Estimación estadística adaptativa local de funciones cuya suavidad varía sustancialmente en el dominio, o más específicamente, estimación de funciones que son dispersas en el dominio wavelet. [23]
Ondículas causales en el tiempo
Para procesar señales temporales en tiempo real, es esencial que los filtros wavelet no accedan a valores de señales del futuro y que se puedan obtener latencias temporales mínimas. Szu et al [24] y Lindeberg [25] desarrollaron representaciones wavelet causales en el tiempo ; este último método también implica una implementación recursiva en el tiempo que ahorra memoria.
Transformación sincronizada y comprimida
La transformación sincronizada y comprimida puede mejorar significativamente la resolución temporal y de frecuencia de la representación tiempo-frecuencia obtenida utilizando la transformación wavelet convencional. [26] [27]
MrSID , el formato de imagen desarrollado a partir de la investigación original sobre compresión de wavelets en el Laboratorio Nacional de Los Álamos (LANL)
^ Meyer, Yves (1992), Wavelets y operadores, Cambridge, Reino Unido: Cambridge University Press, ISBN 0-521-42000-8
^ Chui, Charles K. (1992), Introducción a las wavelets, San Diego, CA: Academic Press, ISBN 0-12-174584-8
^ Daubechies, Ingrid. (1992), Diez conferencias sobre wavelets, SIAM, ISBN 978-0-89871-274-2
^ Akansu, Ali N.; Haddad, Richard A. (1992), Descomposición de señales multirresolución: transformadas, subbandas y wavelets, Boston, MA: Academic Press, ISBN 978-0-12-047141-6
^ Ghaderpour, E.; Pagiatakis, SD; Hassan, QK (2021). "Una encuesta sobre detección de cambios y análisis de series temporales con aplicaciones". Applied Sciences . 11 (13): 6141. doi : 10.3390/app11136141 . hdl : 11573/1655273 .
^ JPEG 2000 , por ejemplo, puede utilizar un wavelet 5/3 para una transformación sin pérdida (reversible) y un wavelet 9/7 para una transformación con pérdida (irreversible).
^ Ramakrishnan, AG; Saha, S. (1997). "Codificación de ECG mediante predicción lineal basada en wavelets" (PDF) . IEEE Transactions on Biomedical Engineering . 44 (12): 1253–1261. doi :10.1109/10.649997. PMID 9401225. S2CID 8834327.
^ "Especificación Vorbis I". Fundación Xiph.Org . 4 de julio de 2020. Archivado desde el original el 3 de abril de 2022. Consultado el 10 de abril de 2022. Vorbis I es un CODEC de transformación monolítico adaptativo hacia delante basado en la Transformada de Coseno Discreta Modificada. El códec está estructurado para permitir la adición de un banco de filtros wavelet híbrido en Vorbis II para ofrecer una mejor respuesta y reproducción transitoria utilizando una transformación más adecuada para eventos temporales localizados.
^ N. Malmurugan, A. Shanmugam, S. Jayaraman y VV Dinesh Chander. "Un nuevo y novedoso algoritmo de compresión de imágenes que utiliza huellas wavelet"
^ Ho Tatt Wei y Jeoti, V. "Un esquema de compresión basado en huellas de ondículas para señales de ECG". Ho Tatt Wei; Jeoti, V. (2004). "Un esquema de compresión basado en huellas de ondículas para señales de ECG". Conferencia IEEE Región 10 de 2004 TENCON 2004. Vol. A. p. 283. doi :10.1109/TENCON.2004.1414412. ISBN 0-7803-8560-8.S2CID43806122 .
^ J. Field, David (1987). "Relaciones entre las estadísticas de imágenes naturales y las propiedades de respuesta de las células corticales" (PDF) . J. Opt. Soc. Am. A . 4 (12): 2379–2394. Bibcode :1987JOSAA...4.2379F. doi :10.1364/JOSAA.4.002379. PMID 3430225.
^ Villasenor, John D. (agosto de 1995). "Evaluación de filtros wavelet para compresión de imágenes". IEEE Transactions on Image Processing . 4 (8): 1053–60. Bibcode :1995ITIP....4.1053V. doi :10.1109/83.403412. PMID 18291999.
^ Simoncelli, EP; Freeman, peso; Adelson, EH; Heeger, DJ (1992). "Transformaciones multiescala desplazables". Transacciones IEEE sobre teoría de la información . 38 (2): 587–607. doi :10.1109/18.119725. S2CID 43701174.
^ Bruns, Andreas (2004). "Análisis de señales basado en Fourier, Hilbert y wavelet: ¿son realmente enfoques diferentes?". Journal of Neuroscience Methods . 137 (2): 321–332. doi :10.1016/j.jneumeth.2004.03.002. PMID 15262077. S2CID 21880274.
^ Krantz, Steven G. (1999). Un panorama del análisis armónico . Asociación Matemática de Estados Unidos. ISBN0-88385-031-1.
^ Martin, E. (2011). "Nuevo método para la estimación de la longitud de la zancada con acelerómetros de red de área corporal". Conferencia temática IEEE de 2011 sobre tecnologías inalámbricas biomédicas, redes y sistemas de detección . págs. 79–82. doi :10.1109/BIOWIRELESS.2011.5724356. ISBN.978-1-4244-8316-7. Número de identificación del sujeto 37689047.
^ Liu, Jie (2012). "Análisis del espectro wavelet de Shannon en señales de vibración truncadas para la detección de fallas incipientes en máquinas". Measurement Science and Technology . 23 (5): 1–11. Bibcode :2012MeScT..23e5604L. doi :10.1088/0957-0233/23/5/055604. S2CID 121684952.
^ Tomás, R.; Li, Z.; Lopez-Sanchez, JM; Liu, P.; Singleton, A. (1 de junio de 2016). "Uso de herramientas wavelet para analizar variaciones estacionales a partir de datos de series temporales InSAR: un estudio de caso del deslizamiento de tierra de Huangtupo". Deslizamientos de tierra . 13 (3): 437–450. Bibcode :2016Lands..13..437T. doi :10.1007/s10346-015-0589-y. ISSN 1612-5118.
^ Akansu, AN; Serdijn, WA; Selesnick, IW (2010). "Aplicaciones emergentes de wavelets: una revisión" (PDF) . Physical Communication . 3 : 1–18. doi :10.1016/j.phycom.2009.07.001.
^ Sheybani, E.; Javidi, G. (diciembre de 2009). "Reducción de dimensionalidad y eliminación de ruido en conjuntos de datos de redes de sensores inalámbricos". Segunda Conferencia Internacional de 2009 sobre Ingeniería Informática y Eléctrica . Vol. 2. págs. 674–677. doi :10.1109/ICCEE.2009.282. ISBN978-1-4244-5365-8. Número de identificación del sujeto 17066179.
^ Sheybani, EO; Javidi, G. (mayo de 2012). "Bancos de filtros de resolución múltiple para imágenes SAR mejoradas". Conferencia internacional sobre sistemas e informática de 2012 (ICSAI2012) . págs. 2702–2706. doi :10.1109/ICSAI.2012.6223611. ISBN978-1-4673-0199-2. Número de identificación del sujeto 16302915.
^ Silva, KM; Souza, BA; Brito, NSD (octubre de 2006). "Detección y clasificación de fallas en líneas de transmisión basadas en transformada wavelet y ANN". IEEE Transactions on Power Delivery . 21 (4): 2058–2063. doi :10.1109/TPWRD.2006.876659. S2CID 36881450.
^ Wasserman, LA (2005). Todas las estadísticas no paramétricas .
^ Szu, Harold H.; Telfer, Brian A.; Lohmann, Adolf W. (1992). "Transformada wavelet analítica causal". Ingeniería óptica . 31 (9): 1825. Bibcode :1992OptEn..31.1825S. doi :10.1117/12.59911.
^ Lindeberg, T. (23 de enero de 2023). "Una representación de escala-espacio covariante, recursiva en el tiempo y causal en el tiempo, de señales temporales y tiempo pasado". Cibernética biológica . 117 (1–2): 21–59. doi : 10.1007/s00422-022-00953-6 . PMC 10160219 . PMID 36689001.
^ Daubechies, Ingrid; Lu, Jianfeng; Wu, Hau-Tieng (12 de diciembre de 2009). "Transformadas wavelet sincronizadas: una herramienta para la descomposición modal empírica". arXiv : 0912.2437 [math.NA].
^ Qu, Hongya; Li, Tiantian; Chen, Genda (1 de enero de 2019). "Transformada wavelet adaptativa sincronizada y comprimida con parámetros óptimos para series temporales arbitrarias". Sistemas mecánicos y procesamiento de señales . 114 : 366–377. Bibcode :2019MSSP..114..366Q. doi : 10.1016/j.ymssp.2018.05.020 . S2CID 126007150.
Lectura adicional
Maan, Jeetendrasingh; Prasad, Akhilesh (1 de mayo de 2024). "Transformada de paquetes de ondas y producto de convolución wavelet que involucra la transformada de índice de Whittaker". The Ramanujan Journal . 64 (1): 19–36. doi :10.1007/s11139-023-00793-3. ISSN 1572-9303.
Prasad, Akhilesh; Maan, Jeetendrasingh; Verma, Sandeep Kumar (2021). "Transformadas wavelet asociadas con la transformada de índice de Whittaker". Métodos matemáticos en las ciencias aplicadas . 44 (13): 10734–10752. Bibcode :2021MMAS...4410734P. doi :10.1002/mma.7440. ISSN 1099-1476. S2CID 235556542.
Enlaces externos
Wikimedia Commons alberga una categoría multimedia sobre Wavelets .
Amara Graps (junio de 1995). "Introducción a las wavelets". IEEE Computational Science and Engineering . 2 (2): 50–61. doi :10.1109/99.388960.
Robi Polikar (12 de enero de 2001). "El tutorial de Wavelet".
Breve introducción a las wavelets de René Puschinger