La estadística de escenas es una disciplina dentro del campo de la percepción . Se ocupa de las regularidades estadísticas relacionadas con las escenas . Se basa en la premisa de que un sistema perceptivo está diseñado para interpretar escenas .
Los sistemas perceptivos biológicos han evolucionado en respuesta a las propiedades físicas de los entornos naturales. [1] Por lo tanto, las escenas naturales reciben mucha atención. [2]
Geisler (2008) [4] distingue entre cuatro tipos de dominios: (1) Entornos físicos, (2) Imágenes/Escenas, (3) Respuestas neuronales y (4) Comportamiento.
Dentro del dominio de las imágenes/escenas, se pueden estudiar las características de la información relacionadas con la redundancia y la codificación eficiente.
Las estadísticas interdominio determinan cómo un sistema autónomo debe realizar inferencias sobre su entorno, procesar información y controlar su comportamiento. Para estudiar estas estadísticas, es necesario muestrear o registrar información en varios dominios simultáneamente.
Aplicaciones
Predicción de la calidad de imagen y vídeo
Una de las aplicaciones más exitosas de los modelos de estadísticas de escenas naturales ha sido la predicción de la calidad perceptual de imágenes y videos. Por ejemplo, el algoritmo Visual Information Fidelity (VIF), que se utiliza para medir el grado de distorsión de imágenes y videos, es ampliamente utilizado por las comunidades de procesamiento de imágenes y videos para evaluar la calidad perceptual, a menudo después del procesamiento, como la compresión, que puede degradar la apariencia de una señal visual. La premisa es que las estadísticas de la escena cambian por la distorsión y que el sistema visual es sensible a los cambios en las estadísticas de la escena. VIF se utiliza mucho en la industria de la televisión en streaming. Otros modelos de calidad de imagen populares que utilizan estadísticas de escenas naturales incluyen BRISQUE [5] y NIQE [6], ambos sin referencia, ya que no requieren ninguna imagen de referencia para medir la calidad.
Referencias
^ Geisler, WS y Diehl, RL (2003). Un enfoque bayesiano para la evolución de los sistemas perceptuales y cognitivos. Cognitive Science, 27, 379-402.
^ Simoncelli, EP y BA Olshausen (2001). Estadísticas de imágenes naturales y representación neuronal. Revista anual de neurociencia 24: 1193-1216.
^ Geisler, WS, Perry, JS e Ing, AD (2008) Análisis de sistemas naturales. En: B. Rogowitz y T. Pappas (Eds.), Visión humana e imágenes electrónicas. Actas de SPIE, vol. 6806, 68060M
^ Geisler, WS (2008) Percepción visual y propiedades estadísticas de escenas naturales. Revista Anual de Psicología, 59, 167–192.
^ A Mittal, AK Moorthy y AC Bovik, “Evaluación de la calidad de imagen sin referencia en el dominio espacial”, IEEE Transactions on Image Processing, 21 (12), 4695-4708, 2012
^ A Mittal, R Soundararajan y AC Bovik, “Un analizador de calidad de imagen 'completamente ciego'”, IEEE Signal Processing Letters 20 (3), 209-212, 2013.
Bibliografía
Field, DJ (1987). Relaciones entre las estadísticas de imágenes naturales y las propiedades de respuesta de las células corticales. Journal of the Optical Society of America A 4, 2379–2394.
Ruderman, DL y Bialek, W. (1994). Estadísticas de imágenes naturales: escalamiento en el bosque. Physical Review Letters, 73(6), 814–817.
Brady, N., y Field, DJ (2000). Contraste local en imágenes naturales: normalización y eficiencia de codificación. Perception, 29, 1041–1055.
Frazor, RA, Geisler, WS (2006) Luminancia local y contraste en imágenes naturales. Vision Research, 46, 1585–1598.
Mante et al. (2005) Independencia de la luminancia y el contraste en escenas naturales y en el sistema visual primitivo. Nature Neuroscience, 8 (12) 1690–1697.
Bell, AJ y Sejnowski, TJ (1997). Los "componentes independientes" de las escenas naturales son filtros de borde. Vision Research, 37, 3327–3338.
Olshausen, BA, y Field, DJ (1997). Codificación dispersa con un conjunto de base sobrecompleto: ¿Una estrategia de V1? Vision Research, 37(23), 3311–3325.
Sigman, M., Cecchi, GA, Gilbert, CD, & Magnasco, MO (2001). Sobre un círculo común: Escenas naturales y reglas de la Gestalt. PNAS, 98(4), 1935–1940.
Hoyer, PO y Hyvärinen, A. Una red de codificación dispersa multicapa aprende codificación de contornos a partir de imágenes naturales, Vis. Res., vol. 42, núm. 12, págs. 1593–1605, 2002.
Geisler, WS, Perry, JS, Super, BJ y Gallogly, DP (2001). La coocurrencia de bordes en imágenes naturales predice el rendimiento de la agrupación de contornos. Vision Research, 41, 711–724.
Elder JH, Goldberg RM. (2002) Estadísticas ecológicas para las leyes de la Gestalt de la organización perceptual de los contornos. J. Vis. 2:324–53.
Krinov, E. (1947). Propiedades de reflectancia espectral de formaciones naturales (traducción técnica n.° TT-439). Ottawa: Consejo Nacional de Investigación de Canadá.
Ruderman, DL, Cronin, TW y Chiao, C. (1998). Estadísticas de las respuestas de los conos a imágenes naturales: implicaciones para la codificación visual. Journal of the Optical Society of America A, 15, 2036–2045.
Stockman, A., MacLeod, DIA y Johnson, NE (1993). Sensibilidades espectrales de los conos humanos. J Opt Soc Am A Opt Image Sci Vis, 10, 1396–1402.
Lee TW, Wachtler, T, Sejnowski, TJ. (2002) La oponencia del color es una representación eficiente de las propiedades espectrales en escenas naturales. Vision Research 42:2095–2103.
Fine, I., MacLeod, DIA y Boynton, GM (2003). Segmentación de superficies basada en las estadísticas de luminancia y color de escenas naturales. Revista de la Sociedad Óptica de América a-Optics Image Science and Vision, 20(7), 1283–1291.
Lewis A, Zhaoping L. (2006) ¿Las sensibilidades de los conos están determinadas por las estadísticas de color natural? Journal of Vision. 6:285–302.
Lovell PG et al. (2005) Estabilidad de las señales de color opuesto bajo cambios de iluminante en escenas naturales. J. Opt. Soc. Am. A 22:10.
Endler, JA 1993. El color de la luz en los bosques y sus implicaciones. Monografías ecológicas 63:1–27.
Wachtler T, Lee TW, Sejnowski TJ (2001) Estructura cromática de escenas naturales. J. Opt. Soc. Am. A 18(1):65–77.
Long F, Yang Z, Purves D. Las estadísticas espectrales en escenas naturales predicen el tono, la saturación y el brillo. PNAS 103(15):6013–6018.
Van Hateren, JH, y Ruderman, DL (1998). El análisis de componentes independientes de secuencias de imágenes naturales produce filtros espaciotemporales similares a células simples en la corteza visual primaria. Actas de la Royal Society of London B, 265, 2315–2320.
Potetz, B., y Lee, TS (2003). Correlaciones estadísticas entre imágenes bidimensionales y estructuras tridimensionales en escenas naturales. Revista de la Sociedad Óptica de América a-Optics Image Science and Vision, 20(7), 1292–1303.
Howe, CQ y Purves, D. (2002). Las estadísticas de imágenes de rango pueden explicar la percepción anómala de la longitud. Actas de la Academia Nacional de Ciencias de los Estados Unidos de América, 99(20), 13184–13188. Howe, CQ y Purves, D. (2005a). La geometría de la escena natural predice la percepción de ángulos y la orientación de las líneas. Actas de la Academia Nacional de Ciencias de los Estados Unidos de América, 102(4), 1228–1233.
Howe, CQ y Purves, D. (2004). Contraste de tamaño y asimilación explicados por las estadísticas de la geometría de la escena natural. Journal of Cognitive Neuroscience, 16(1), 90–102.
Howe, CQ y Purves, D. (2005b). La ilusión de Muller-Lyer explicada por las estadísticas de las relaciones entre la imagen y la fuente. Actas de la Academia Nacional de Ciencias de los Estados Unidos de América, 102(4), 1234–1239.
Howe, CQ, Yang, ZY y Purves, D. (2005). La ilusión de Poggendorff explicada por la geometría de la escena natural. Actas de la Academia Nacional de Ciencias de los Estados Unidos de América, 102(21), 7707–7712.
Kalkan, S. Woergoetter, F. y Krueger, N., Análisis estadístico de la estructura 3D local en imágenes 2D, Conferencia IEEE sobre visión artificial y reconocimiento de patrones (CVPR) 2006.
Kalkan, S. Woergoetter, F. y Krueger, N., Análisis estadístico de primer y segundo orden de estructuras 3D y 2D, Red: Computación en sistemas neuronales, 18(2), págs. 129–160, 2007.