En estadística , la matriz de proyección , [1] a veces también llamada matriz de influencia [2] o matriz de sombrero , asigna el vector de valores de respuesta (valores de la variable dependiente) al vector de valores ajustados (o valores predichos). Describe la influencia que tiene cada valor de respuesta en cada valor ajustado. [3] [4] Los elementos diagonales de la matriz de proyección son los apalancamientos , que describen la influencia que tiene cada valor de respuesta en el valor ajustado para esa misma observación.
Definición
Si el vector de valores de respuesta se denota por y el vector de valores ajustados por ,
Como generalmente se pronuncia "y-hat", la matriz de proyección también se llama matriz hat porque "pone un sombrero " .
Solicitud de residuos
La fórmula para el vector de residuos también se puede expresar de forma compacta utilizando la matriz de proyección:
donde es la matriz identidad . A veces, a esta matriz se la denomina matriz generadora de residuos o matriz aniquiladora .
De la figura se desprende claramente que el punto más cercano del vector al espacio columna de , es , y es uno en el que podemos trazar una línea ortogonal al espacio columna de . Un vector que es ortogonal al espacio columna de una matriz está en el espacio nulo de la matriz transpuesta, por lo que
.
A partir de ahí, uno reordena, así
.
Por lo tanto, dado que está en el espacio de columnas de , la matriz de proyección, que se asigna a es simplemente , o .
Modelo lineal
Supongamos que deseamos estimar un modelo lineal mediante mínimos cuadrados lineales. El modelo puede escribirse como
Cuando los pesos de cada observación son idénticos y los errores no están correlacionados, los parámetros estimados son
Por lo tanto, los valores ajustados son
Por lo tanto, la matriz de proyección (y la matriz de sombrero) está dada por
Mínimos cuadrados ponderados y generalizados
Lo anterior se puede generalizar a los casos en los que los pesos no son idénticos y/o los errores están correlacionados. Supongamos que la matriz de covarianza de los errores es Σ . Entonces, como
.
La matriz del sombrero es así
y nuevamente se puede ver que , aunque ahora ya no es simétrico.
Propiedades
La matriz de proyección tiene varias propiedades algebraicas útiles. [5] [6] En el lenguaje del álgebra lineal , la matriz de proyección es la proyección ortogonal sobre el espacio columna de la matriz de diseño . [4] (Tenga en cuenta que es la pseudoinversa de X ). Algunos hechos de la matriz de proyección en este contexto se resumen a continuación: [4]
y
es simétrico, y también lo es .
es idempotente: , y también lo es .
Si es una matriz n × r con , entonces
Los valores propios de consisten en r unos y n − r ceros, mientras que los valores propios de consisten en n − r unos y r ceros. [7]
Para los modelos lineales , la traza de la matriz de proyección es igual al rango de , que es el número de parámetros independientes del modelo lineal. [8] Para otros modelos como LOESS que todavía son lineales en las observaciones , la matriz de proyección se puede utilizar para definir los grados de libertad efectivos del modelo.
Las aplicaciones prácticas de la matriz de proyección en el análisis de regresión incluyen el apalancamiento y la distancia de Cook , que tienen como objetivo identificar observaciones influyentes , es decir, observaciones que tienen un gran efecto en los resultados de una regresión.
Fórmula por bloques
Supongamos que la matriz de diseño se puede descomponer por columnas como . Definamos el operador de proyección o sombrero como . De manera similar, definamos el operador residual como . Entonces la matriz de proyección se puede descomponer de la siguiente manera: [9]
donde, por ejemplo, y . Hay varias aplicaciones de esta descomposición. En la aplicación clásica , es una columna de todos unos, que permite analizar los efectos de añadir un término de intersección a una regresión. Otro uso es en el modelo de efectos fijos , donde es una matriz dispersa grande de las variables ficticias para los términos de efectos fijos. Se puede utilizar esta partición para calcular la matriz hat de sin formar explícitamente la matriz , que podría ser demasiado grande para caber en la memoria de la computadora.
Historia
La matriz de sombrero fue introducida por John Wilder en 1972. Un artículo de Hoaglin, DC y Welsch, RE (1978) presenta las propiedades de la matriz y también muchos ejemplos de su aplicación.
^ Basilevsky, Alexander (2005). Álgebra matricial aplicada a las ciencias estadísticas. Dover. pp. 160–176. ISBN 0-486-44538-0.
^ "Asimilación de datos: diagnóstico de la influencia de la observación en un sistema de asimilación de datos" (PDF) . Archivado desde el original (PDF) el 2014-09-03.
^ ab Hoaglin, David C.; Welsch, Roy E. (febrero de 1978). "La matriz Hat en regresión y ANOVA" (PDF) . The American Statistician . 32 (1): 17–22. doi :10.2307/2683469. hdl : 1721.1/1920 . JSTOR 2683469.