stringtranslate.com

Análisis de componentes principales multilineales

El análisis de componentes principales multilineal ( MPCA ) es una extensión multilineal del análisis de componentes principales (PCA) que se utiliza para analizar matrices M-way, también denominadas informalmente como "tensores de datos". Las matrices M-way pueden modelarse mediante modelos tensoriales lineales, como CANDECOMP/Parafac, o mediante modelos tensoriales multilineales, como el análisis de componentes principales multilineal (MPCA) o el análisis de componentes independientes multilineal (MICA). El origen del MPCA se remonta a la descomposición de rangos tensoriales introducida por Frank Lauren Hitchcock en 1927; [1] a la descomposición de Tucker ; [2] y al trabajo "PCA de 3 modos" de Peter Kroonenberg. [3] En 2000, De Lathauwer et al. Reafirmaron el trabajo de Tucker y Kroonenberg en términos computacionales numéricos claros y concisos en su artículo SIAM titulado "Descomposición en valores singulares multilineales", [4] (HOSVD) y en su artículo "Sobre la mejor aproximación de rango 1 y rango (R 1 , R 2 , ..., R N ) de tensores de orden superior". [5]

Hacia 2001, Vasilescu y Terzopoulos reformularon los problemas de análisis, reconocimiento y síntesis de datos como problemas tensoriales multilineales. El análisis factorial tensorial es la consecuencia compositiva de varios factores causales de la formación de datos y es muy adecuado para el análisis tensorial de datos multimodales. El poder del marco tensorial se demostró mediante el análisis de los ángulos de las articulaciones del movimiento humano, las imágenes faciales o las texturas en términos de sus factores causales de formación de datos en los siguientes trabajos: Human Motion Signatures [6] (CVPR 2001, ICPR 2002), reconocimiento facial: TensorFaces, [7] [8] (ECCV 2002, CVPR 2003, etc.) y gráficos por computadora: TensorTextures [9] (Siggraph 2004).

Históricamente, MPCA se ha denominado "PCA en modo M", una terminología acuñada por Peter Kroonenberg en 1980. [3] En 2005, Vasilescu y Terzopoulos introdujeron la terminología PCA multilineal [10] como una forma de diferenciar mejor entre la descomposición tensorial lineal y multilineal, así como para diferenciar mejor entre el trabajo [6] [7] [8] [9] que calculó estadísticas de segundo orden asociadas con cada modo tensorial de datos (eje), y el trabajo posterior sobre Análisis de componentes independientes multilineales [10] que calculó estadísticas de orden superior asociadas con cada modo tensorial/eje.

El PCA multilineal se puede aplicar para calcular los factores causales de la formación de datos, o como herramienta de procesamiento de señales en tensores de datos cuyas observaciones individuales han sido vectorizadas, [6] [7] [8] [9] o cuyas observaciones se tratan como una colección de observaciones de columnas/filas, "matriz de datos" y concatenadas en un tensor de datos. La principal desventaja de este enfoque es que, en lugar de calcular todas las combinaciones posibles,

MPCA calcula un conjunto de matrices ortonormales asociadas con cada modo del tensor de datos que son análogas al espacio de filas y columnas ortonormal de una matriz calculada por la matriz SVD. Esta transformación tiene como objetivo capturar la mayor varianza posible, teniendo en cuenta la mayor parte de la variabilidad en los datos asociados con cada modo (eje) del tensor de datos.

El algoritmo

La solución MPCA sigue el método de mínimos cuadrados alternados (ALS). Es de naturaleza iterativa. Al igual que en PCA, MPCA trabaja con datos centrados. El centrado es un poco más complicado para los tensores y depende del problema.

Selección de funciones

Características de MPCA: el MPCA supervisado se emplea en el análisis de factores causales que facilita el reconocimiento de objetos [11], mientras que una selección de características de MPCA semisupervisada se emplea en tareas de visualización. [12]

Extensiones

Varias extensiones de MPCA:

Referencias

  1. ^ FL Hitchcock (1927). "La expresión de un tensor o un poliádico como suma de productos". Revista de Matemáticas y Física . 6 (1–4): 164–189. doi :10.1002/sapm192761164.
  2. ^ Tucker, Ledyard R (septiembre de 1966). "Algunas notas matemáticas sobre el análisis factorial de tres modos". Psychometrika . 31 (3): 279–311. doi :10.1007/BF02289464. PMID  5221127.
  3. ^ ab PM Kroonenberg y J. de Leeuw, Análisis de componentes principales de datos de tres modos mediante algoritmos de mínimos cuadrados alternos, Psychometrika, 45 (1980), págs. 69-97.
  4. ^ Lathauwer, LD; Moor, BD; Vandewalle, J. (2000). "Una descomposición en valores singulares multilineales". Revista SIAM sobre análisis de matrices y aplicaciones . 21 (4): 1253–1278. doi :10.1137/s0895479896305696.
  5. ^ Lathauwer, LD; Moor, BD; Vandewalle, J. (2000). "Sobre la mejor aproximación de rango 1 y rango (R1, R2, ..., RN) de tensores de orden superior". Revista SIAM sobre análisis de matrices y aplicaciones . 21 (4): 1324–1342. doi :10.1137/s0895479898346995.
  6. ^ abc MAO Vasilescu (2002) "Firmas de movimiento humano: análisis, síntesis, reconocimiento", Actas de la Conferencia internacional sobre reconocimiento de patrones (ICPR 2002), vol. 3, Ciudad de Quebec, Canadá, agosto de 2002, 456–460.
  7. ^ abc MAO Vasilescu, D. Terzopoulos (2002) "Análisis multilineal de conjuntos de imágenes: TensorFaces", Proc. 7.ª Conferencia Europea sobre Visión Artificial (ECCV'02), Copenhague, Dinamarca, mayo de 2002, en Computer Vision – ECCV 2002, Lecture Notes in Computer Science, vol. 2350, A. Heyden et al. (Eds.), Springer-Verlag, Berlín, 2002, 447–460.
  8. ^ abc MAO Vasilescu, D. Terzopoulos (2003) "Análisis de subespacios multilineales para conjuntos de imágenes", MAO Vasilescu, D. Terzopoulos, Proc. Computer Vision and Pattern Recognition Conf. (CVPR '03), Vol. 2, Madison, WI, junio de 2003, 93–99.
  9. ^ abc MAO Vasilescu, D. Terzopoulos (2004) "TensorTextures: Multilinear Image-Based Rendering", MAO Vasilescu y D. Terzopoulos, Proc. Conferencia ACM SIGGRAPH 2004 Los Ángeles, CA, agosto de 2004, en Actas de Computer Graphics, Serie de conferencias anuales, 2004, 336–342.
  10. ^ ab MAO Vasilescu, D. Terzopoulos (2005) "Análisis de componentes independientes multilineales", "Actas de la Conferencia IEEE sobre visión artificial y reconocimiento de patrones (CVPR'05), San Diego, CA, junio de 2005, vol. 1, 547–553".
  11. ^ MAO Vasilescu, D. Terzopoulos (2003) "Análisis de subespacios multilineales de conjuntos de imágenes", "Actas de la Conferencia IEEE sobre visión artificial y reconocimiento de patrones (CVPR'03), Madison, WI, junio de 2003"
  12. ^ H. Lu, H.-L. Eng, M. Thida y KN Plataniotis, "Visualización y agrupamiento de contenido de video de multitudes en el subespacio MPCA", en Actas de la 19.ª Conferencia ACM sobre gestión de la información y el conocimiento (CIKM 2010), Toronto, ON, Canadá, octubre de 2010.
  13. ^ K. Inoue, K. Hara, K. Urahama, "Análisis de componentes principales multilineales robustos", Proc. Conferencia IEEE sobre Visión por Computador, 2009, págs. 591–597.
  14. ^ Khan, Suleiman A.; Leppäaho, Eemeli; Kaski, Samuel (10 de junio de 2016). "Factorización multitensorial bayesiana". Aprendizaje automático . 105 (2): 233–253. arXiv : 1412.4679 . doi :10.1007/s10994-016-5563-y. ISSN  0885-6125.

Enlaces externos