Transformación blanqueadora

Una transformación de blanqueamiento o transformación de esferización es una transformación lineal que transforma un vector de variables aleatorias con una matriz de covarianza conocida en un conjunto de nuevas variables cuya covarianza es la matriz identidad , lo que significa que no están correlacionadas y cada una tiene una varianza de 1. ^[1] La transformación se llama "blanqueamiento" porque cambia el vector de entrada en un vector de ruido blanco .

Hay otras transformaciones estrechamente relacionadas con el blanqueamiento:

La transformación de decorrelación elimina solo las correlaciones pero deja intactas las variaciones.
La transformación de estandarización establece las varianzas en 1 pero deja intactas las correlaciones.
Una transformación de coloración transforma un vector de variables aleatorias blancas en un vector aleatorio con una matriz de covarianza especificada. ^[2]

Definición

Supongamos que es un vector aleatorio (columna) con una matriz de covarianza no singular y una media . Entonces, la transformación con una matriz de blanqueamiento que satisface la condición produce el vector aleatorio blanqueado con covarianza diagonal unitaria. ${\estilo de visualización X}$ ${\estilo de visualización \Sigma}$ ${\estilo de visualización 0}$ $Y=WX$ ${\estilo de visualización W}$ $W^{\mathrm {T} }W=\Sigma ^{-1}$ ${\estilo de visualización Y}$

Existen infinitas matrices de blanqueamiento posibles que satisfacen todas la condición anterior. Las opciones más utilizadas son (blanqueamiento Mahalanobis o ZCA), donde es la descomposición de Cholesky de (blanqueamiento Cholesky), ^[3] o el sistema propio de (blanqueamiento PCA). ^[4] ${\estilo de visualización W}$ $W=\Sigma ^{-1/2}$ $Estilo de visualización W=L^{T}}$ ${\estilo de visualización L}$ $\Sigma ^{-1}$ ${\estilo de visualización \Sigma}$

Las transformaciones de blanqueamiento óptimas se pueden identificar investigando la covarianza cruzada y la correlación cruzada de y . ^[3] Por ejemplo, la única transformación de blanqueamiento óptima que logra la correlación máxima entre componentes entre el original y el blanqueado se produce mediante la matriz de blanqueamiento donde es la matriz de correlación y la matriz de varianza diagonal. ${\estilo de visualización X}$ ${\estilo de visualización Y}$ ${\estilo de visualización X}$ ${\estilo de visualización Y}$ $W=P^{-1/2}V^{-1/2}$ ${\estilo de visualización P}$ ${\estilo de visualización V}$

Blanqueamiento de una matriz de datos

El blanqueamiento de una matriz de datos sigue la misma transformación que para las variables aleatorias. Una transformación de blanqueamiento empírica se obtiene estimando la covarianza (por ejemplo, mediante máxima verosimilitud ) y construyendo posteriormente una matriz de blanqueamiento estimada correspondiente (por ejemplo, mediante descomposición de Cholesky ).

Blanqueamiento de alta dimensión

Esta modalidad es una generalización del procedimiento de preblanqueo extendido a espacios más generales donde se supone usualmente que es una función aleatoria u otros objetos aleatorios en un espacio de Hilbert . Uno de los principales problemas de extender el blanqueamiento a dimensiones infinitas es que el operador de covarianza tiene una inversa ilimitada en . Sin embargo, si uno supone que la condición de Picard se cumple para en el espacio de rango del operador de covarianza, el blanqueamiento se vuelve posible. ^[5] Un operador de blanqueamiento puede entonces definirse a partir de la factorización de la inversa de Moore–Penrose del operador de covarianza, que tiene un mapeo efectivo en expansiones de tipo Karhunen–Loève de . La ventaja de estas transformaciones de blanqueamiento es que pueden optimizarse de acuerdo con las propiedades topológicas subyacentes de los datos, produciendo así representaciones de blanqueamiento más robustas. Las características de alta dimensión de los datos pueden explotarse a través de regresores de kernel o sistemas de funciones base. ^[6] ${\estilo de visualización X}$ ${\estilo de visualización H}$ ${\estilo de visualización H}$ ${\estilo de visualización X}$ ${\estilo de visualización X}$

Implementación de R

Una implementación de varios procedimientos de blanqueamiento en R , incluyendo blanqueamiento ZCA y blanqueamiento PCA pero también blanqueamiento CCA , está disponible en el paquete R "whitening" ^[7] publicado en CRAN . El paquete R "pfica" ^[8] permite el cálculo de representaciones de blanqueamiento de alta dimensión utilizando sistemas de funciones base ( B-splines , base de Fourier , etc.).

Véase también

Decorrelación
Análisis de componentes principales
Mínimos cuadrados ponderados
Correlación canónica
Distancia de Mahalanobis (es euclidiana después de la transformación W.).

Referencias

^ Koivunen, AC; Kostinski, AB (1999). "La viabilidad del blanqueamiento de datos para mejorar el rendimiento del radar meteorológico". Revista de meteorología aplicada . 38 (6): 741–749. Bibcode :1999JApMe..38..741K. doi : 10.1175/1520-0450(1999)038<0741:TFODWT>2.0.CO;2 . ISSN 1520-0450.
^ Hossain, Miliha. "Transformaciones de blanqueamiento y coloración para variables aleatorias gaussianas multivariadas". Proyecto Rhea . Consultado el 21 de marzo de 2016 .
^ ab Kessy, A.; Lewin, A.; Strimmer, K. (2018). "Blanqueamiento óptimo y decorrelación". The American Statistician . 72 (4): 309–314. arXiv : 1512.00809 . doi :10.1080/00031305.2016.1277159. S2CID 55075085.
^ Friedman, J. (1987). "Exploratory Projection Pursuit" (PDF) . Revista de la Asociación Estadounidense de Estadística . 82 (397): 249–266. doi :10.1080/01621459.1987.10478427. ISSN 0162-1459. JSTOR 2289161. OSTI 1447861.
^ Vidal, M.; Aguilera, AM (2022). "Nuevos enfoques de blanqueamiento en entornos funcionales". STAT . 12 (1): e516. doi : 10.1002/sta4.516 . hdl : 1854/LU-8770510 .
^ Ramsay, JO; Silverman, JO (2005). Análisis de datos funcionales. Springer Nueva York, NY. doi :10.1007/b98888. ISBN 978-0-387-40080-8.
^ "paquete blanqueador R" . Consultado el 25 de noviembre de 2018 .
^ "paquete pfica R" . Consultado el 11 de febrero de 2023 .

Enlaces externos

http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf
La transformación de blanqueamiento de ZCA. Apéndice A de Aprendizaje de múltiples capas de características a partir de imágenes diminutas de A. Krizhevsky.