stringtranslate.com

Suma residual de cuadrados

En estadística , la suma de cuadrados residuales ( RSS ), también conocida como suma de residuos al cuadrado ( SSR ) o suma de estimaciones de errores al cuadrado ( SSE ), es la suma de los cuadrados de los residuos (desviaciones predichas a partir de los valores empíricos reales). de datos). Es una medida de la discrepancia entre los datos y un modelo de estimación, como una regresión lineal . Un RSS pequeño indica un ajuste perfecto del modelo a los datos. Se utiliza como criterio de optimización en la selección de parámetros y selección de modelos .

En general, suma de cuadrados total = suma de cuadrados explicada + suma de cuadrados residual. Para ver una prueba de esto en el caso multivariado de mínimos cuadrados ordinarios (MCO), consulte partición en el modelo general MCO .

Una variable explicativa

En un modelo con una única variable explicativa, RSS viene dado por: [1]

donde y i es el i- ésimo valor de la variable a predecir, x i es el i -ésimo valor de la variable explicativa y es el valor predicho de y i (también denominado ). En un modelo de regresión lineal simple estándar , donde y son coeficientes , y y x son el regresor y el regresor , respectivamente, y ε es el término de error . La suma de los cuadrados de los residuos es la suma de los cuadrados de ; eso es

donde es el valor estimado del término constante y es el valor estimado del coeficiente de pendiente .

Expresión matricial para la suma residual de cuadrados de MCO

El modelo de regresión general con n observaciones y k explicadores, el primero de los cuales es un vector unitario constante cuyo coeficiente es la intersección de la regresión, es

donde y es un vector n × 1 de observaciones de variables dependientes, cada columna de la matriz X n × k es un vector de observaciones en uno de los k explicadores, es un vector k × 1 de coeficientes verdaderos y e es un vector n × 1 vector de los verdaderos errores subyacentes. El estimador de mínimos cuadrados ordinarios para es

El vector residual ; entonces la suma residual de cuadrados es:

,

(equivalente al cuadrado de la norma de los residuos). En su totalidad:

,

donde H es la matriz hat o la matriz de proyección en regresión lineal.

Relación con la correlación producto-momento de Pearson

La línea de regresión de mínimos cuadrados está dada por

,

dónde y , dónde y

Por lo tanto,

dónde

La correlación producto-momento de Pearson viene dada por , por tanto,

Ver también

Referencias

  1. ^ Archidiácono, Thomas J. (1994). Análisis de correlación y regresión: una guía para el historiador . Prensa de la Universidad de Wisconsin. págs. 161-162. ISBN 0-299-13650-7. OCLC  27266095.