stringtranslate.com

Filtros, campos aleatorios y modelo de máxima entropía.

En el dominio de la física y la probabilidad , el modelo de filtros, campos aleatorios y máxima entropía (FRAME) [1] [2] es un modelo de campo aleatorio de Markov (o distribución de Gibbs ) de procesos espaciales estacionarios, en el que la función de energía es la suma de funciones potenciales invariantes de traducción que son transformaciones no lineales unidimensionales de respuestas de filtro lineal. El modelo FRAME fue desarrollado originalmente por Song-Chun Zhu , Ying Nian Wu y David Mumford para modelar patrones de textura estocásticos, como pastos, hojas de árboles, paredes de ladrillo, ondas de agua, etc. Este modelo es la distribución de entropía máxima que reproduce la observaron histogramas marginales de respuestas de un banco de filtros (como filtros Gabor o wavelets de Gabor), donde para cada filtro sintonizado a una escala y orientación específicas, el histograma marginal se agrupa sobre todos los píxeles en el dominio de la imagen. También se ha demostrado que el modelo FRAME es equivalente al conjunto microcanónico [3] , que recibió el nombre de conjunto Julesz. Se adopta el muestreador de Gibbs [4] para sintetizar imágenes de textura extrayendo muestras del modelo FRAME.

El modelo FRAME original es homogéneo para modelar texturas. Xie et al. propuso el modelo FRAME disperso, [5] [6] que es una generalización no homogénea del modelo FRAME original, con el fin de modelar patrones de objetos, como cuerpos de animales, caras, etc. Es un modelo de campo aleatorio de Markov no estacionario. que reproduce las propiedades estadísticas observadas de las respuestas de los filtros en un subconjunto de ubicaciones, escalas y orientaciones seleccionadas. El modelo FRAME disperso puede considerarse una plantilla deformable.

El modelo FRAME profundo [7] [8] es una generalización profunda del modelo FRAME original. En lugar de utilizar filtros lineales como en el modelo FRAME original, Lu et al. utiliza los filtros en una determinada capa convolucional de una ConvNet previamente aprendida. [7] En lugar de depender de los filtros previamente entrenados de una ConvNet existente, Xie et al. parametrizó la función de energía del modelo FRAME mediante una estructura ConvNet y aprendió todos los parámetros desde cero. [8] El modelo FRAME profundo es el primer marco que integra la red neuronal profunda moderna del aprendizaje profundo y la distribución de Gibbs de la física estadística. Los modelos FRAME profundos se generalizan aún más para modelar patrones de video, [9] [10] patrones de formas volumétricas 3D [11]

Referencias

  1. ^ Zhu, Song-Chun; Wu, Ying Nian; Mumford, David. "Filtros, campos aleatorios y máxima entropía (FRAME): hacia una teoría unificada para el modelado de texturas". Revista Internacional de Visión por Computadora : 1998.
  2. ^ Zhu, Song Chun; Wu, Ying Nian; Mumford, David (noviembre de 1997). "Principio de entropía Minimax y su aplicación al modelado de texturas". Computación neuronal . 9 (8): 1627–1660. doi :10.1162/neco.1997.9.8.1627. ISSN  0899-7667. S2CID  15926.
  3. ^ Ying Nian Wu; Song Chun Zhu; Xiuwen Liu (1999). "Equivalencia de conjuntos de texturas de Julesz y Gibbs". Actas de la Séptima Conferencia Internacional IEEE sobre Visión por Computadora . IEEE. págs. 1025-1032 vol.2. doi :10.1109/iccv.1999.790382. ISBN 0-7695-0164-8. S2CID  7550898.
  4. ^ Smith, Grahame B. (1987), "Stuart Geman y Donald Geman," Relajación estocástica, distribuciones de Gibbs y restauración bayesiana de imágenes "; Lecturas en visión por computadora , Elsevier, págs. 562–563, doi :10.1016 /b978-0-08-051581-6.50056-8, ISBN 978-0-08-051581-6
  5. ^ Xie, Jianwen; Hu, Wenze; Zhu, Song-Chun; Wu, Ying Nian (2 de octubre de 2014). "Aprendizaje de modelos FRAME dispersos para patrones de imágenes naturales". Revista Internacional de Visión por Computadora . 114 (2–3): 91–112. CiteSeerX 10.1.1.434.7360 . doi :10.1007/s11263-014-0757-x. ISSN  0920-5691. S2CID  8742525. 
  6. ^ Xie, Jianwen; Lu, Yang; Zhu, Song-Chun; Wu, Ying Nian (julio de 2016). "Inducir ondas en campos aleatorios mediante impulso generativo". Análisis Armónico Aplicado y Computacional . 41 (1): 4–25. doi :10.1016/j.acha.2015.08.004. ISSN  1063-5203. S2CID  521731.
  7. ^ ab Lu, Yang; Zhu, Song-Chun; Wu, Ying Nian (2016). "Aprendizaje de modelos FRAME utilizando filtros CNN". Actas de la Conferencia AAAI sobre Inteligencia Artificial . 30 . arXiv : 1509.08379 . doi : 10.1609/aaai.v30i1.10238. S2CID  2387309.
  8. ^ ab Xie, Jianwen; Lu, Yang; Zhu, Song-Chun; Wu, Ying Nian (2016). "Una teoría de ConvNet generativa". Congreso Internacional sobre Aprendizaje Automático . arXiv : 1602.03264 .
  9. ^ Xie, Jianwen; Zhu, Song-Chun; Wu, Ying Nian (julio de 2017). "Sintetización de patrones dinámicos mediante ConvNet generativo espacio-temporal". Conferencia IEEE 2017 sobre visión por computadora y reconocimiento de patrones (CVPR) . IEEE. págs. 1061-1069. arXiv : 1606.00972 . doi :10.1109/cvpr.2017.119. ISBN 978-1-5386-0457-1. S2CID  763074.
  10. ^ Xie, Jianwen; Zhu, Song-Chun; Wu, Ying Nian (2019). "Aprendizaje de ConvNet generativo espacio-temporal basado en energía para patrones dinámicos". Transacciones IEEE sobre análisis de patrones e inteligencia artificial . 43 (2): 516–531. arXiv : 1909.11975 . doi :10.1109/TPAMI.2019.2934852. PMID  31425020. S2CID  201098397.
  11. ^ Xie, Jianwen; Zheng, Zilong; Gao, Ruiqi; Wang, Wenguan; Zhu, Song-Chun; Wu, Ying Nian (junio de 2018). "Aprendizaje de redes de descriptores para análisis y síntesis de formas 3D". Conferencia IEEE/CVF 2018 sobre visión por computadora y reconocimiento de patrones . IEEE. págs. 8629–8638. arXiv : 1804.00586 . doi :10.1109/cvpr.2018.00900. ISBN 978-1-5386-6420-9. S2CID  4564025.