stringtranslate.com

Axiomas del espacio de escala

En el procesamiento de imágenes y la visión artificial , se puede utilizar un marco de espacio de escala para representar una imagen como una familia de imágenes gradualmente suavizadas. Este marco es muy general y existe una variedad de representaciones de espacio de escala . Un enfoque típico para elegir un tipo particular de representación de espacio de escala es establecer un conjunto de axiomas de espacio de escala , que describen las propiedades básicas de la representación de espacio de escala deseada y que a menudo se eligen de modo que la representación sea útil en aplicaciones prácticas. Una vez establecidos, los axiomas limitan las posibles representaciones de espacio de escala a una clase más pequeña, generalmente con solo unos pocos parámetros libres.

Un conjunto de axiomas de espacio de escala estándar, que se analizan a continuación, conduce al espacio de escala gaussiano lineal, que es el tipo de espacio de escala más común utilizado en el procesamiento de imágenes y la visión por computadora.

Axiomas del espacio de escala para la representación lineal del espacio de escala

La representación en el espacio de escala lineal de la señal obtenida mediante el suavizado con el núcleo gaussiano satisface una serie de propiedades ( axiomas del espacio de escala) que la convierten en una forma especial de representación multiescala:

linealidad
donde y son señales mientras que y son constantes,
invariancia de cambio
donde denota el operador de desplazamiento (traslación)
estructura de semigrupo
con la propiedad de suavizado en cascada asociada
Existencia de un generador infinitesimal
no creación de extremos locales (cruces por cero) en una dimensión,
No mejora de los extremos locales en cualquier número de dimensiones
en máximos espaciales y en mínimos espaciales,
simetría rotacional
para alguna función ,
invariancia de escala
para algunas funciones y donde denota la transformada de Fourier de ,
positividad
,
normalización
.

De hecho, se puede demostrar que el núcleo gaussiano es una elección única dadas varias combinaciones diferentes de subconjuntos de estos axiomas del espacio de escala: [1] [2] [3] [4] [5] [6] [7 ] [8] [9] [10] [11] la mayoría de los axiomas (linealidad, invariancia de desplazamiento, semigrupo) corresponden al escalamiento siendo un semigrupo de operador lineal invariante de desplazamiento, que es satisfecho por un número de familias de transformadas integrales , mientras que la "no creación de extremos locales" [4] para señales unidimensionales o la "no mejora de extremos locales" [4] [7] [10] para señales de dimensiones superiores son los axiomas cruciales que relacionan los espacios de escala con el suavizado (formalmente, ecuaciones diferenciales parciales parabólicas ), y por lo tanto seleccionan para el gaussiano.

El núcleo gaussiano también es separable en coordenadas cartesianas, es decir , . Sin embargo, la separabilidad no se considera un axioma del espacio de escala, ya que es una propiedad que depende de las coordenadas y está relacionada con cuestiones de implementación. Además, el requisito de separabilidad en combinación con la simetría rotacional en sí mismo fija el núcleo de suavizado como gaussiano.

Existe una generalización de la teoría del espacio de escala gaussiana a espacios de escala afines y espacio-temporales más generales. [10] [11] Además de las variabilidades a lo largo de la escala, que la teoría original del espacio de escala fue diseñada para manejar, esta teoría generalizada del espacio de escala también comprende otros tipos de variabilidades, incluyendo deformaciones de la imagen causadas por variaciones en la visión, aproximadas por transformaciones afines locales , y movimientos relativos entre objetos en el mundo y el observador, aproximados por transformaciones galileanas locales . En esta teoría, la simetría rotacional no se impone como un axioma necesario del espacio de escala y en su lugar se reemplaza por requisitos de covarianza afín y/o galileana. La teoría generalizada del espacio de escala conduce a predicciones sobre perfiles de campo receptivo en buen acuerdo cualitativo con perfiles de campo receptivo medidos por registros celulares en visión biológica. [12] [13] [14]

En la literatura sobre visión artificial , procesamiento de imágenes y procesamiento de señales existen muchos otros enfoques multiescala, que utilizan wavelets y una variedad de otros núcleos, que no explotan o requieren los mismos requisitos que las descripciones del espacio de escala ; consulte el artículo sobre enfoques multiescala relacionados . También se ha trabajado en conceptos de espacio de escala discreto que trasladan las propiedades del espacio de escala al dominio discreto; consulte el artículo sobre implementación del espacio de escala para obtener ejemplos y referencias.

Véase también

Referencias

  1. ^ Koenderink, Jan J. (agosto de 1984). "La estructura de las imágenes". Cibernética biológica . 50 (5): 363–370. doi :10.1007/bf00336961. PMID  6477978. S2CID  206775432.
  2. ^ Babaud, Jean; Witkin, Andrew P.; Baudin, Michel; Duda, Richard O. (1986). "Singularidad del núcleo gaussiano para el filtrado en el espacio de escala". IEEE Transactions on Pattern Analysis and Machine Intelligence . 8 (1): 26–33. doi :10.1109/TPAMI.1986.4767749. PMID  21869320. S2CID  18295906.
  3. ^ Yuille, Alan L.; Poggio, Tomaso A. (1986). "Teoremas de escalamiento para cruces por cero". IEEE Transactions on Pattern Analysis and Machine Intelligence . 8 (1): 15–25. doi :10.1109/TPAMI.1986.4767748. hdl : 1721.1/5655 . PMID  21869319. S2CID  14815630.
  4. ^ abc Lindeberg, T. (1990). "Espacio de escala para señales discretas". IEEE Transactions on Pattern Analysis and Machine Intelligence . 12 (3): 234–254. doi :10.1109/34.49051.
  5. ^ Lindeberg, Tony, Teoría del espacio de escala en visión por computadora, Kluwer, 1994,
  6. ^ Pauwels, EJ; Van Gool, LJ; Fiddelaers, P.; Moons, T. (1995). "Una clase extendida de filtros de espacio de escala recursivos e invariantes en escala". IEEE Transactions on Pattern Analysis and Machine Intelligence . 17 (7): 691–701. doi :10.1109/34.391411.
  7. ^ ab Lindeberg, Tony (mayo de 1996). "Sobre los fundamentos axiomáticos del espacio de escala lineal: Combinación de la estructura de semigrupo con causalidad frente a invariancia de escala". En Sporring, J.; et al. (eds.). Teoría del espacio de escala gaussiana: Proc. PhD School on Scale-Space Theory. Copenhague, Dinamarca: Kluwer Academic Publishers. págs. 75–98. urn : nbn:se:kth:diva-40221 .
  8. ^ Florack, Luc, Estructura de la imagen, Kluwer Academic Publishers, 1997.
  9. ^ Weickert, Joachim; Ishikawa, Seiji; Imiya, Atsushi (1999). "Se ha propuesto por primera vez en Japón la escala lineal del espacio". Journal of Mathematical Imaging and Vision . 10 (3): 237–252. doi :10.1023/A:1008344623873. S2CID  17835046.
  10. ^ abc Lindeberg, Tony (2011). "Axiomática generalizada de la escala espacial gaussiana que comprende la escala espacial lineal, la escala espacial afín y la escala espacial-temporal". Journal of Mathematical Imaging and Vision . 40 : 36–81. doi :10.1007/s10851-010-0242-2. S2CID  950099.
  11. ^ ab Lindeberg, Tony (2013). Teoría axiomática generalizada del espacio de escala. Avances en imágenes y física electrónica. Vol. 178. págs. 1–96. doi :10.1016/B978-0-12-407701-0.00001-7. ISBN 9780124077010.
  12. ^ Lindeberg, Tony (2013). "Una teoría computacional de los campos receptivos visuales". Cibernética biológica . 107 (6): 589–635. doi :10.1007/s00422-013-0569-z. PMC 3840297 . PMID  24197240. 
  13. ^ Lindeberg, Tony (2013). "Invariancia de las operaciones visuales a nivel de campos receptivos". PLOS ONE . ​​8 (7): e66990. arXiv : 1210.0754 . Bibcode :2013PLoSO...866990L. doi : 10.1371/journal.pone.0066990 . PMC 3716821 . PMID  23894283. 
  14. ^ Lindeberg, Tony (2021). "Teoría normativa de los campos receptivos visuales". Heliyon . 7 (1): e05897. Bibcode :2021Heliy...705897L. doi : 10.1016/j.heliyon.2021.e05897 . PMC 7820928 . PMID  33521348.