stringtranslate.com

Análisis canónico

En estadística , el análisis canónico (del griego antiguo : κανων barra, vara de medir , regla) pertenece a la familia de métodos de regresión para el análisis de datos. El análisis de regresión cuantifica una relación entre una variable predictora y una variable de criterio mediante el coeficiente de correlación r , el coeficiente de determinación r 2 y el coeficiente de regresión estándar β . El análisis de regresión múltiple expresa una relación entre un conjunto de variables predictoras y una única variable de criterio mediante la correlación múltiple  R , el coeficiente de determinación múltiple R 2 y un conjunto de pesos de regresión parcial estándar β 1 , β 2 , etc. El análisis de variables canónicas captura una relación entre un conjunto de variables predictoras y un conjunto de variables de criterio mediante las correlaciones canónicas ρ 1 , ρ 2 , ..., y mediante los conjuntos de pesos canónicos C y D.

Análisis canónico

El análisis canónico pertenece a un grupo de métodos que implican resolver la ecuación característica para sus raíces latentes y vectores. Describe estructuras formales en el hiperespacio invariantes con respecto a la rotación de sus coordenadas. En este tipo de solución, la rotación deja muchas propiedades optimizadoras preservadas, siempre que tenga lugar de ciertas maneras y en un subespacio de su hiperespacio correspondiente. Esta rotación de la estructura de correlación intervariante máxima a una estructura diferente, más simple y más significativa aumenta la interpretabilidad de los pesos canónicos C y D. En esto, el análisis canónico difiere del análisis de variables canónicas de Harold Hotelling (1936) (también llamado análisis de correlación canónica ), diseñado para obtener correlaciones máximas (canónicas) entre las variables canónicas predictoras y de criterio. La diferencia entre el análisis de variables canónicas y el análisis canónico es análoga a la diferencia entre el análisis de componentes principales y el análisis factorial , cada uno con su conjunto característico de puntos en común, valores propios y vectores propios .

Análisis canónico (simple)

El análisis canónico es una técnica multivariable que se ocupa de determinar las relaciones entre grupos de variables en un conjunto de datos. El conjunto de datos se divide en dos grupos X e Y , en función de algunas características comunes. El propósito del análisis canónico es entonces encontrar la relación entre X e Y , es decir, ¿puede alguna forma de X representar a Y ? Funciona encontrando la combinación lineal de variables X , es decir, X 1 , X 2 etc., y la combinación lineal de variables Y , es decir, Y 1 , Y 2 etc., que están más altamente correlacionadas. Esta combinación se conoce como las "primeras variables canónicas" que generalmente se denotan U 1 y V 1 , y el par de U 1 y V 1 se denomina "función canónica". Las siguientes funciones canónicas, U 2 y V 2 , se restringen de modo que no estén correlacionadas con U 1 y V 1 . Todo se escala de modo que la varianza sea igual a 1.

También se pueden construir relaciones que se ajusten a las restricciones que surgen de la teoría o al sentido común o la intuición. Estos se denominan modelos de correlación máxima (Tofallis, 1999).

Matemáticamente, el análisis canónico maximiza U X YV sujeto a U X XU  =  I y V Y YV  =  I , donde X e Y son las matrices de datos (fila para la instancia y columna para la característica).

Véase también

Referencias