En el procesamiento de señales resulta útil analizar simultáneamente las características espaciales y de frecuencia de una señal. Si bien la transformada de Fourier proporciona la información de frecuencia de la señal, no está localizada. Esto significa que no podemos determinar qué parte de una señal (quizás larga) produjo una frecuencia particular. Es posible utilizar una transformada de Fourier de tiempo corto para este propósito, sin embargo, la transformada de Fourier de tiempo corto limita las funciones base a ser sinusoidales. Para proporcionar una descomposición de señal espacio-frecuencia más flexible, se han propuesto varios filtros (incluidos los wavelets). El filtro Log-Gabor [1] es uno de esos filtros que es una mejora del filtro Gabor original . [2] La ventaja de este filtro sobre las muchas alternativas es que se ajusta mejor a las estadísticas de imágenes naturales en comparación con los filtros Gabor y otros filtros wavelet .
El filtro Log-Gabor es capaz de describir una señal en términos de las respuestas de frecuencia locales. Debido a que se trata de una técnica fundamental de análisis de señales, tiene muchas aplicaciones en el procesamiento de señales. De hecho, cualquier aplicación que utilice filtros Gabor u otras funciones de base wavelet puede beneficiarse del filtro Log-Gabor. Sin embargo, puede que no haya ningún beneficio dependiendo de los detalles del problema de diseño. No obstante, se ha demostrado que el filtro Log-Gabor es particularmente útil en aplicaciones de procesamiento de imágenes, porque se ha demostrado que captura mejor las estadísticas de las imágenes naturales.
En el procesamiento de imágenes, existen algunos ejemplos de bajo nivel del uso de filtros Log-Gabor. La detección de bordes es una de esas operaciones primitivas, en las que se etiquetan los bordes de la imagen. Debido a que los bordes aparecen en el dominio de la frecuencia como frecuencias altas, es natural utilizar un filtro como el Log-Gabor para seleccionar estos bordes. [3] [4] Estos bordes detectados se pueden utilizar como entrada para un algoritmo de segmentación o un algoritmo de reconocimiento. Un problema relacionado es la detección de esquinas. En la detección de esquinas, el objetivo es encontrar puntos en la imagen que sean esquinas. Las esquinas son útiles porque representan ubicaciones estables que se pueden utilizar para problemas de coincidencia de imágenes. La esquina se puede describir en términos de información de frecuencia localizada utilizando un filtro Log-Gabor. [5]
En el reconocimiento de patrones , la imagen de entrada debe transformarse en una representación de características que permita a un algoritmo de clasificación separar las clases con mayor facilidad. Las características formadas a partir de la respuesta de los filtros Log-Gabor pueden formar un buen conjunto de características para algunas aplicaciones porque pueden representar localmente información de frecuencia. Por ejemplo, el filtro se ha utilizado con éxito en la clasificación de expresiones faciales. [6] Hay algunas pruebas de que el sistema visual humano procesa la información visual de forma similar. [7]
Hay muchas otras aplicaciones que requieren información de frecuencia localizada. El filtro Log-Gabor se ha utilizado en aplicaciones como mejora de imágenes, [8] análisis de voz, [9] detección de contornos, [10] síntesis de texturas [11] y eliminación de ruido de imágenes [12], entre otras.
Existen varios métodos para calcular información de frecuencia localizada. Estos métodos son ventajosos porque, a diferencia de la transformada de Fourier, estos filtros pueden representar discontinuidades en la señal con mayor facilidad. Por ejemplo, la transformada de Fourier puede representar un borde, pero solo mediante el uso de un número infinito de ondas sinusoidales.
Al considerar filtros que extraen información de frecuencia local, existe una relación entre la resolución de frecuencia y la resolución de tiempo/espacio. Cuando se toman más muestras, la resolución de la información de frecuencia es mayor, sin embargo, la resolución de tiempo/espacio será menor. Del mismo modo, tomar solo unas pocas muestras significa una resolución espacial/temporal mayor, pero esto es a costa de una menor resolución de frecuencia. Un buen filtro debe ser capaz de obtener la resolución de frecuencia máxima dada una resolución de tiempo/espacio establecida, y viceversa. El filtro de Gabor logra este límite. [2] Debido a esto, el filtro de Gabor es un buen método para localizar simultáneamente información espacial/temporal y de frecuencia. Un filtro de Gabor en el dominio del espacio (o tiempo) se formula como una envolvente gaussiana multiplicada por un exponencial complejo. Se encontró que las respuestas corticales en el sistema visual humano pueden ser modeladas por el filtro de Gabor. [7] [13] El filtro de Gabor fue modificado por Morlet para formar una transformada wavelet continua ortonormal. [14]
Aunque el filtro Gabor logra una sensación de optimalidad en términos del equilibrio espacio-frecuencia, en ciertas aplicaciones podría no ser un filtro ideal. En ciertos anchos de banda, el filtro Gabor tiene un componente DC distinto de cero. Esto significa que la respuesta del filtro depende del valor medio de la señal. Si la salida del filtro se va a utilizar para una aplicación como el reconocimiento de patrones, este componente DC no es deseable porque proporciona una característica que cambia con el valor medio. Como veremos pronto, el filtro Log-Gabor no presenta este problema. Además, el filtro Gabor original tiene una respuesta al impulso de longitud infinita. Finalmente, el filtro Gabor original, aunque óptimo en el sentido de incertidumbre, no se ajusta adecuadamente a las estadísticas de las imágenes naturales. Como se muestra en [1], es mejor elegir un filtro con una cola inclinada más larga en una tarea de codificación de imágenes.
En ciertas aplicaciones, otras descomposiciones tienen ventajas. Aunque existen muchas descomposiciones posibles, aquí presentamos brevemente dos métodos populares: las ondículas de sombrero mexicano y la pirámide orientable.
La wavelet de Ricker , comúnmente llamada wavelet de sombrero mexicano , es otro tipo de filtro que se utiliza para modelar datos. En múltiples dimensiones, esto se convierte en el laplaciano de una función gaussiana. Por razones de complejidad computacional, el laplaciano de una función gaussiana a menudo se aproxima utilizando una diferencia de gaussianas . Esta diferencia de función gaussiana ha encontrado uso en varias aplicaciones de visión por computadora, como la detección de puntos clave. [15] La desventaja de la wavelet de sombrero mexicano es que exhibe algo de aliasing y no representa bien las orientaciones oblicuas.
La descomposición en pirámide orientable [16] se presentó como una alternativa a las ondículas de Morlet (Gabor) y Ricker. Esta descomposición ignora la restricción de ortogonalidad de la formulación de ondículas y, al hacerlo, es capaz de construir un conjunto de filtros que son independientes tanto de la traslación como de la rotación. La desventaja de la descomposición en pirámide orientable es que es sobrecompleta. Esto significa que se utilizan más filtros de los verdaderamente necesarios para describir la señal.
Field introdujo el filtro Log-Gabor y demostró que es capaz de codificar mejor las imágenes naturales en comparación con el filtro Gabor original. [1] Además, el filtro Log-Gabor no tiene el mismo problema de CC que el filtro Gabor original. Una función Log-Gabor unidimensional tiene la respuesta de frecuencia:
donde y son los parámetros del filtro. dará la frecuencia central del filtro. afecta el ancho de banda del filtro. Es útil mantener la misma forma mientras se varía el parámetro de frecuencia. Para ello, la relación debe permanecer constante. La siguiente figura muestra la respuesta de frecuencia del Gabor en comparación con el Log-Gabor:
Otra definición del filtro Log-Gabor es considerarlo como una función de distribución de probabilidad , con una distribución normal , pero considerando el logaritmo de las frecuencias. Esto tiene sentido en contextos donde se aplica la ley de Weber-Fechner , como en la percepción visual o auditiva. Siguiendo la regla del cambio de variable, una función Log-Gabor unidimensional tiene, por lo tanto, la respuesta de frecuencia modificada:
Nótese que esto se extiende al origen y que todavía tenemos .
En ambas definiciones, debido al valor cero en la corriente continua, no es posible derivar una expresión analítica para el filtro en el dominio espacial. En la práctica, el filtro se diseña primero en el dominio de la frecuencia y luego una transformada de Fourier inversa proporciona la respuesta al impulso en el dominio del tiempo.
Al igual que el filtro Gabor, el filtro log-Gabor ha gozado de gran popularidad en el procesamiento de imágenes. [4] Por ello, resulta útil considerar la extensión bidimensional del filtro log-Gabor. Con esta dimensión añadida, el filtro no solo está diseñado para una frecuencia particular, sino que también está diseñado para una orientación particular. El componente de orientación es una función de distancia gaussiana según el ángulo en coordenadas polares (consulte [1] o [2]):
Aquí hay cuatro parámetros: la frecuencia central, el parámetro de ancho de la frecuencia, la orientación central y el parámetro de ancho de la orientación. A continuación se muestra un ejemplo de este filtro.
El ancho de banda en la frecuencia viene dado por:
Tenga en cuenta que el ancho de banda resultante está en unidades de octavas.
El ancho de banda angular viene dado por:
En muchas aplicaciones prácticas, se diseña un conjunto de filtros para formar un banco de filtros . Debido a que los filtros no forman un conjunto de bases ortogonales, el diseño del banco de filtros es un arte y puede depender de la tarea particular en cuestión. Los parámetros necesarios que se deben elegir son: las frecuencias mínima y máxima, el ancho de banda del filtro, el número de orientaciones, el ancho de banda angular, la escala del filtro y el número de escalas.