stringtranslate.com

Matriz de centrado

En matemáticas y estadística multivariada , la matriz de centrado [1] es una matriz simétrica e idempotente , que cuando se multiplica por un vector tiene el mismo efecto que restar la media de los componentes del vector de cada componente de ese vector.

Definición

La matriz de centrado de tamaño n se define como la matriz n por n

donde es la matriz identidad de tamaño n y es una matriz n por n de todos los 1 .

Por ejemplo

,
,

Propiedades

Dado un vector columna de tamaño n , la propiedad de centrado de se puede expresar como

donde es un vector columna de unos y es la media de los componentes de .

es simétrica positiva semidefinida .

es idempotente , de modo que , para . Una vez que se ha eliminado la media, es cero y eliminarla nuevamente no tiene efecto.

es singular . Los efectos de aplicar la transformación no se pueden revertir.

tiene el valor propio 1 de multiplicidad n  − 1 y el valor propio 0 de multiplicidad 1.

tiene un espacio nulo de dimensión 1, a lo largo del vector .

es una matriz de proyección ortogonal . Es decir, es una proyección de sobre el subespacio de dimensión ( n  − 1) que es ortogonal al espacio nulo . (Este es el subespacio de todos los n -vectores cuyos componentes suman cero).

El rastro de es .

Solicitud

Aunque la multiplicación por la matriz de centrado no es una forma computacionalmente eficiente de eliminar la media de un vector, es una herramienta analítica conveniente. Puede utilizarse no solo para eliminar la media de un único vector, sino también de múltiples vectores almacenados en las filas o columnas de una matriz de m por n .

La multiplicación por la izquierda resta un valor medio correspondiente de cada una de las n columnas, de modo que cada columna del producto tiene una media cero. De manera similar, la multiplicación por la derecha resta un valor medio correspondiente de cada una de las m filas, y cada fila del producto tiene una media cero. La multiplicación por ambos lados crea una matriz doblemente centrada , cuyas medias de fila y columna son iguales a cero.

La matriz de centrado proporciona en particular una forma sucinta de expresar la matriz de dispersión , de una muestra de datos , donde es la media de la muestra . La matriz de centrado nos permite expresar la matriz de dispersión de forma más compacta como

es la matriz de covarianza de la distribución multinomial , en el caso especial donde los parámetros de esa distribución son , y .

Referencias

  1. ^ John I. Marden, Análisis y modelado de datos de rango , Chapman & Hall, 1995, ISBN  0-412-99521-2 , página 59.