stringtranslate.com

Diagrama de bisectriz

Diagrama de dispersión de rayos del conjunto de datos del iris de Fisher . Los puntos dispersos son las puntuaciones de entrada de las observaciones y las flechas muestran la contribución de cada característica a los vectores de carga de entrada.
Diagrama de dispersión de espectros del conjunto de datos del iris de Anderson
Análisis discriminante de la curva de dispersión de rayos de Fisher (Greenacre, 2010)

Los biplots son un tipo de gráfico exploratorio utilizado en estadística , una generalización del diagrama de dispersión simple de dos variables . Un biplot superpone un gráfico de puntuación con un gráfico de carga . Un biplot permite que la información sobre las muestras y las variables de una matriz de datos se muestre gráficamente. Las muestras se muestran como puntos, mientras que las variables se muestran como vectores, ejes lineales o trayectorias no lineales. En el caso de las variables categóricas, se pueden utilizar puntos de nivel de categoría para representar los niveles de una variable categórica. Un biplot generalizado muestra información sobre variables continuas y categóricas.

El biplot fue introducido por K. Ruben Gabriel (1971). [1]

Construcción

Un biplot se construye utilizando la descomposición en valores singulares (SVD) para obtener una aproximación de bajo rango a una versión transformada de la matriz de datos X , cuyas n filas son las muestras (también llamadas casos u objetos), y cuyas p columnas son las variables. La matriz de datos transformada Y se obtiene de la matriz original X centrando y estandarizando opcionalmente las columnas (las variables). Usando la SVD, podemos escribir Y  = Σ k =1,... p d k u k v k T ;, donde u k son vectores columna n -dimensionales, v k son vectores columna p -dimensionales, y d k son una secuencia no creciente de escalares no negativos. El biplot se forma a partir de dos diagramas de dispersión que comparten un conjunto común de ejes y tienen una interpretación de producto escalar entre conjuntos . El primer diagrama de dispersión se forma a partir de los puntos ( d 1 α u 1 i ,   d 2 α u 2 i ), para i  = 1,..., n . El segundo diagrama se forma a partir de los puntos ( d 1 1−α v 1 jd 2 1−α v 2 j ), para j  = 1,..., p . Este es el diagrama de dispersión formado por los dos términos dominantes de la SVD, que luego se puede representar en una visualización bidimensional. Las opciones típicas de α son 1 (para dar una interpretación de distancia a la visualización de filas) y 0 (para dar una interpretación de distancia a la visualización de columnas), y en algunos casos raros α = 1/2 para obtener un diagrama de dispersión simétricamente escalado (que no da interpretación de distancia a las filas o las columnas, sino solo la interpretación del producto escalar). El conjunto de puntos que representan las variables se puede dibujar como flechas desde el origen para reforzar la idea de que representan ejes biplot sobre los que se pueden proyectar las muestras para aproximar los datos originales.

Referencias

  1. ^ 'Gabriel, KR (1971). La representación gráfica biplot de matrices con aplicación al análisis de componentes principales. Biometrika , 58 (3), 453–467.

Fuentes