stringtranslate.com

Análisis de componentes principales multilineal.

El análisis de componentes principales multilineal ( MPCA ) es una extensión multilineal del análisis de componentes principales (PCA) que se utiliza para analizar matrices de M vías, también denominadas informalmente "tensores de datos". Las matrices de M vías se pueden modelar mediante modelos de tensor lineal, como CANDECOMP/Parafac, o mediante modelos de tensor multilineal, como el análisis de componentes principales multilineal (MPCA) o el análisis de componentes independientes multilineal (MICA). El origen de MPCA se remonta a la descomposición de rangos tensoriales introducida por Frank Lauren Hitchcock en 1927; [1] a la descomposición de Tucker ; [2] y al trabajo "3-mode PCA" de Peter Kroonenberg. [3] En 2000, De Lathauwer et al. Reformuló el trabajo de Tucker y Kroonenberg en términos computacionales numéricos claros y concisos en su artículo SIAM titulado "Multilinear Singular Value Decomposition", [4] (HOSVD) y en su artículo "On the Best Rank-1 and Rank-(R 1 , R 2 , ..., R N ) Aproximación de tensores de orden superior". [5]

Alrededor de 2001, Vasilescu y Terzopoulos reformularon los problemas de análisis, reconocimiento y síntesis de datos como problemas de tensor multilineal. El análisis de factores tensoriales es la consecuencia composicional de varios factores causales de la formación de datos y es muy adecuado para el análisis de tensores de datos multimodal. El poder del marco tensorial se demostró analizando los ángulos de las articulaciones del movimiento humano, las imágenes faciales o las texturas en términos de sus factores causales de formación de datos en los siguientes trabajos: Human Motion Signatures [6] (CVPR 2001, ICPR 2002), reconocimiento facial – TensorFaces, [7] [8] (ECCV 2002, CVPR 2003, etc.) y gráficos por computadora – TensorTextures [9] (Siggraph 2004).

Históricamente, se ha hecho referencia a MPCA como "PCA en modo M", una terminología acuñada por Peter Kroonenberg en 1980. [3] En 2005, Vasilescu y Terzopoulos introdujeron la terminología PCA multilineal [10] como una forma de diferenciar mejor entre descomposición del tensor lineal y multilineal, así como para diferenciar mejor entre el trabajo [6] [7] [8] [9] que calculó las estadísticas de segundo orden asociadas con cada modo (eje) del tensor de datos y el trabajo posterior en el componente independiente multilineal Análisis [10] que calculó estadísticas de orden superior asociadas con cada modo/eje tensor.

El PCA multilineal se puede aplicar para calcular los factores causales de la formación de datos, o como herramienta de procesamiento de señales en tensores de datos cuyas observaciones individuales han sido vectorizadas, [6] [7] [8] [9] o cuyas observaciones se tratan como una colección. de observaciones de columna/fila, "matriz de datos" y concatenada en un tensor de datos. La principal desventaja de este enfoque es que en lugar de calcular todas las combinaciones posibles

MPCA calcula un conjunto de matrices ortonormales asociadas con cada modo del tensor de datos que son análogas al espacio ortonormal de filas y columnas de una matriz calculada por la matriz SVD. Esta transformación tiene como objetivo capturar la mayor varianza posible, representando la mayor variabilidad en los datos asociados con cada modo (eje) del tensor de datos.

el algoritmo

La solución MPCA sigue el enfoque de mínimos cuadrados alternos (ALS). Es de naturaleza iterativa. Al igual que en PCA, MPCA trabaja con datos centrados. El centrado es un poco más complicado para los tensores y depende del problema.

Selección de características

Características de MPCA: la MPCA supervisada se emplea en el análisis de factores causales que facilita el reconocimiento de objetos [11], mientras que una selección de características de MPCA semisupervisada se emplea en tareas de visualización. [12]

Extensiones

Varias extensiones de MPCA:

Referencias

  1. ^ FL Hitchcock (1927). "La expresión de un tensor o poliádico como suma de productos". Revista de Matemáticas y Física . 6 (1–4): 164–189. doi : 10.1002/sapm192761164.
  2. ^ Tucker, Ledyard R (septiembre de 1966). "Algunas notas matemáticas sobre el análisis factorial de tres modos". Psicometrika . 31 (3): 279–311. doi :10.1007/BF02289464. PMID  5221127.
  3. ^ ab PM Kroonenberg y J. de Leeuw, Análisis de componentes principales de datos de tres modos mediante algoritmos de mínimos cuadrados alternos, Psychometrika, 45 (1980), págs.
  4. ^ Lathauwer, LD; Moro, BD; Vandewalle, J. (2000). "Una descomposición multilineal de valores singulares". Revista SIAM sobre Análisis y Aplicaciones de Matrices . 21 (4): 1253-1278. doi :10.1137/s0895479896305696.
  5. ^ Lathauwer, LD; Moro, BD; Vandewalle, J. (2000). "Sobre la mejor aproximación de rango 1 y rango (R1, R2, ..., RN) de tensores de orden superior". Revista SIAM sobre Análisis y Aplicaciones de Matrices . 21 (4): 1324-1342. doi :10.1137/s0895479898346995.
  6. ^ abc MAO Vasilescu (2002) "Firmas de movimiento humano: análisis, síntesis, reconocimiento", Actas de la conferencia internacional sobre reconocimiento de patrones (ICPR 2002), vol. 3, Ciudad de Quebec, Canadá, agosto de 2002, 456–460.
  7. ^ abc MAO Vasilescu, D. Terzopoulos (2002) "Análisis multilineal de conjuntos de imágenes: TensorFaces", Proc. Séptima Conferencia Europea sobre Visión por Computador (ECCV'02), Copenhague, Dinamarca, mayo de 2002, en Computer Vision – ECCV 2002, Lecture Notes in Computer Science, vol. 2350, A. Heyden et al. (Eds.), Springer-Verlag, Berlín, 2002, 447–460.
  8. ^ abc MAO Vasilescu, D. Terzopoulos (2003) "Análisis subespacial multilineal para conjuntos de imágenes, MAO Vasilescu, D. Terzopoulos, Proc. Conf. de reconocimiento de patrones y visión por computadora (CVPR '03), Vol.2, Madison, WI, junio , 2003, 93–99.
  9. ^ abc MAO Vasilescu, D. Terzopoulos (2004) "TensorTextures: representación multilineal basada en imágenes", MAO Vasilescu y D. Terzopoulos, Proc. Conferencia ACM SIGGRAPH 2004 Los Ángeles, CA, agosto de 2004, en Computer Graphics Proceedings, Serie de conferencias anuales, 2004, 336–342.
  10. ^ ab MAO Vasilescu, D. Terzopoulos (2005) "Análisis de componentes independientes multilineales", "Actas de la conferencia IEEE sobre visión por computadora y reconocimiento de patrones (CVPR'05), San Diego, CA, junio de 2005, vol.1, 547– 553."
  11. ^ MAO Vasilescu, D. Terzopoulos (2003) "Análisis subespacial multilineal de conjuntos de imágenes", "Actas de la conferencia IEEE sobre visión por computadora y reconocimiento de patrones (CVPR'03), Madison, WI, junio de 2003"
  12. ^ H. Lu, H.-L. Eng, M. Thida y KN Plataniotis, "Visualization and Clustering of Crowd Video Content in MPCA Subspace", en Actas de la 19ª Conferencia ACM sobre Gestión de la Información y el Conocimiento (CIKM 2010), Toronto, ON, Canadá, octubre de 2010.
  13. ^ K. Inoue, K. Hara, K. Urahama, "Análisis robusto de componentes principales multilineal", Proc. Conferencia IEEE sobre visión por computadora, 2009, págs. 591–597.
  14. ^ Khan, Suleiman A.; Leppäaho, Eemeli; Kaski, Samuel (10 de junio de 2016). "Factorización bayesiana de tensores múltiples". Aprendizaje automático . 105 (2): 233–253. arXiv : 1412.4679 . doi :10.1007/s10994-016-5563-y. ISSN  0885-6125.

enlaces externos