stringtranslate.com

Cuadrado de relaciones

En estadística, el cuadrado de relación es una representación gráfica que se utiliza en el análisis factorial de una tabla individuos x variables . Esta representación completa las representaciones clásicas proporcionadas por el análisis de componentes principales (ACP) o el análisis de correspondencias múltiples (ACM), a saber, las de los individuos, las de las variables cuantitativas (círculo de correlación) y las de las categorías de las variables cualitativas (en el baricentro de los individuos que las poseen). Es especialmente importante en el análisis factorial de datos mixtos (ACM) y en el análisis factorial múltiple (AFM).

Definición deCuadrado de relacionesen el marco del MCA

El primer interés del plano factorial es representar las variables en sí mismas, no sus categorías, lo que es tanto más valioso cuanto que hay muchas variables. Para ello, calculamos para cada variable cualitativa y cada factor ( , factor de rango, es el vector de coordenadas de los individuos a lo largo del eje de rango ; en PCA, se llama componente principal de rango ), el cuadrado de la razón de correlación entre la y la variable , habitualmente denotada : Así, a cada plano factorial, podemos asociar una representación de las propias variables cualitativas. Al estar sus coordenadas entre 0 y 1, las variables aparecen en el cuadrado que tiene como vértices los puntos (0,0), ( 0,1), (1,0) y (1,1).

Ejemplo en MCA

Seis individuos ( se describen mediante tres variables que tienen respectivamente 3, 2 y 3 categorías. Ejemplo: el individuo posee la categoría de , de y de .

Aplicada a estos datos, la función MCA incluida en el paquete R FactoMineR proporciona el gráfico clásico de la Figura 1.

El cuadro de relaciones (Figura 2) facilita la lectura del plano factorial clásico. Indica que:

Todo esto se ve en el gráfico clásico, pero no con tanta claridad. La función del cuadrado de relaciones es, en primer lugar, ayudar a leer un gráfico convencional. Esto resulta muy valioso cuando las variables son numerosas y poseen numerosas coordenadas.

Extensiones

Esta representación puede completarse con las de variables cuantitativas, siendo las coordenadas de estas últimas el cuadrado de los coeficientes de correlación (y no de los cocientes de correlación). Así, la segunda ventaja del cuadrado de relación reside en la capacidad de representar simultáneamente variables cuantitativas y cualitativas. [1]

El cuadrado de la relación se puede construir a partir de cualquier análisis factorial de una tabla de individuos x variables . En particular, se utiliza (o debería utilizarse) sistemáticamente:

Una extensión de este gráfico a grupos de variables (¿cómo representar un grupo de variables mediante un único punto?) se utiliza en el Análisis Factorial Múltiple (MFA).

Historia

La idea de representar las variables cualitativas en sí mismas mediante un punto (y no las categorías) se debe a Brigitte Escofier. [3] El gráfico tal como se utiliza actualmente fue introducido por Brigitte Escofier y Jérôme Pagès en el marco del análisis factorial múltiple [4].

Conclusión

En el ACM, el cuadrado de relaciones proporciona una visión sintética de las conexiones entre variables mixtas, lo que resulta aún más valioso porque hay muchas variables que tienen muchas categorías. Esta representación puede ser útil en cualquier análisis factorial cuando hay numerosas variables mixtas, activas y/o complementarias.

Referencias

  1. ^ Hay varios ejemplos con dos tipos de variables en Pagès Jérôme (2014). Análisis factorial múltiple por ejemplo utilizando R. Chapman & Hall/CRC The R Series London 272 p
  2. ^ Husson F., Lê S. y Pagès J. (2009). Análisis multivariante exploratorio por ejemplo utilizando R. Chapman & Hall/CRC The R Series, Londres. ISBN  978-2-7535-0938-2
  3. ^ Escofier Brigitte (1979). Una representación de variables en el análisis de correspondencias múltiplos. Revista de estadística aplicada . vol. XXVII, n°4, págs. 37–47. http://archive.numdam.org/ARCHIVE/RSA/RSA_1979__27_4/RSA_1979__27_4_37_0/RSA_1979__27_4_37_0.pdf
  4. ^ Escofier B. & Pagès J. (1988 1.ª ed. 2008 4.ª ed.) Analiza factorielles simples y múltiples; Objetivos, métodos e interpretación . Dunod, París, 318 p ISBN 978-2-10-051932-3 

Enlaces externos