En estadística , la matriz de proyección , [1] a veces también llamada matriz de influencia [2] o matriz sombrero , asigna el vector de valores de respuesta (valores de variables dependientes) al vector de valores ajustados (o valores predichos). Describe la influencia que cada valor de respuesta tiene sobre cada valor ajustado. [3] [4] Los elementos diagonales de la matriz de proyección son los apalancamientos , que describen la influencia que cada valor de respuesta tiene en el valor ajustado para esa misma observación.
Definición
Si el vector de valores de respuesta se denota por y el vector de valores ajustados por ,
Como suele pronunciarse "y-hat", la matriz de proyección también se denomina matriz de sombrero porque "se pone un sombrero " .
Solicitud de residuos
La fórmula del vector de residuos también se puede expresar de forma compacta utilizando la matriz de proyección:
¿Dónde está la matriz identidad ? A veces se hace referencia a la matriz como matriz creadora residual o matriz aniquiladora .
De la figura, queda claro que el punto más cercano desde el vector al espacio columna de , es , y es aquel en el que podemos dibujar una línea ortogonal al espacio columna de . Un vector que es ortogonal al espacio columna de una matriz está en el espacio nulo de la transpuesta de la matriz, por lo que
.
A partir de ahí, uno reorganiza, así
.
Por lo tanto, dado que está en el espacio de columnas de , la matriz de proyección, que se asigna a es solo , o .
Modelo lineal
Supongamos que deseamos estimar un modelo lineal utilizando mínimos cuadrados lineales. El modelo se puede escribir como
Cuando los pesos para cada observación son idénticos y los errores no están correlacionados, los parámetros estimados son
entonces los valores ajustados son
Por lo tanto, la matriz de proyección (y la matriz hat) viene dada por
Mínimos cuadrados ponderados y generalizados
Lo anterior puede generalizarse a los casos en los que los pesos no son idénticos y/o los errores están correlacionados. Supongamos que la matriz de covarianza de los errores es Σ . Entonces desde
.
la matriz del sombrero es así
y nuevamente se puede ver que , aunque ahora ya no es simétrico.
Propiedades
La matriz de proyección tiene varias propiedades algebraicas útiles. [5] [6] En el lenguaje del álgebra lineal , la matriz de proyección es la proyección ortogonal sobre el espacio columna de la matriz de diseño . [4] (Tenga en cuenta que es la pseudoinversa de X. ) Algunos hechos de la matriz de proyección en este entorno se resumen a continuación: [4]
y
es simétrico, y también lo es .
es idempotente: , y también lo es .
Si es una matriz n × r con , entonces
Los valores propios de constan de r unos y n - r ceros, mientras que los valores propios de constan de n - r unos y r ceros. [7]
Para los modelos lineales , la traza de la matriz de proyección es igual al rango de , que es el número de parámetros independientes del modelo lineal. [8] Para otros modelos como LOESS que aún son lineales en las observaciones , la matriz de proyección se puede utilizar para definir los grados de libertad efectivos del modelo.
Las aplicaciones prácticas de la matriz de proyección en el análisis de regresión incluyen el apalancamiento y la distancia de Cook , que se ocupan de identificar observaciones influyentes , es decir, observaciones que tienen un gran efecto en los resultados de una regresión.
Fórmula en bloque
Supongamos que la matriz de diseño se puede descomponer en columnas como . Defina el operador de sombrero o proyección como . De manera similar, defina el operador residual como . Entonces la matriz de proyección se puede descomponer de la siguiente manera: [9]
donde, por ejemplo, y . Hay varias aplicaciones de tal descomposición. En la aplicación clásica hay una columna de todos unos, que permite analizar los efectos de agregar un término de intersección a una regresión. Otro uso es en el modelo de efectos fijos , donde hay una matriz dispersa y grande de variables ficticias para los términos de efectos fijos. Se puede utilizar esta partición para calcular la matriz hat sin formar explícitamente la matriz , que podría ser demasiado grande para caber en la memoria de la computadora.
Historia
La matriz hat fue introducida por John Wilder en 1972. Un artículo de Hoaglin, DC y Welsch, RE (1978) da las propiedades de la matriz y también muchos ejemplos de su aplicación.
^ Basilevsky, Alejandro (2005). Álgebra matricial aplicada en las ciencias estadísticas. Dover. págs. 160-176. ISBN 0-486-44538-0.
^ "Asimilación de datos: la observación influye en el diagnóstico de un sistema de asimilación de datos" (PDF) . Archivado desde el original (PDF) el 3 de septiembre de 2014.
^ ab Hoaglin, David C.; Welsch, Roy E. (febrero de 1978). "The Hat Matrix en regresión y ANOVA" (PDF) . El estadístico estadounidense . 32 (1): 17–22. doi :10.2307/2683469. hdl : 1721.1/1920 . JSTOR 2683469.