El método MCO, siempre y cuando se cumplan los supuestos clave, será consistente cuando los regresores sean exógenos y no haya perfecta multicolinealidad, este será óptimo en la clase de parámetros lineales cuando los errores sean homocedásticos y además no haya autocorrelación.
Supongamos que los datos se componen de n observaciones { yi, xi }ni=1.
Cada observación incluye una respuesta yi escalar y un vector de regresores o predictores xi.
Como regla general, el término constante se incluye siempre en el conjunto de regresores X, por ejemplo, mediante la adopción dexi1 = 1 para todo i = 1, …, n. El coeficiente β1 correspondiente a este regresor se le llama el intercepto.
Existen tres supuestos que deben cumplirse para llevar a cabo una regresión lineal, estos son: Hay varios diferentes marcos en los que el modelo de regresión lineal pueden ser tratado con el fin de hacer que la técnica de MCO sea aplicable.
En el primer caso ("diseño aleatorio) los regresores de xi son aleatorios y se toman muestras del conjunto con los yi de alguna población, como en un estudio observacional.
En la otra interpretación (diseño fijo), los regresores de X se tratan como constantes conocidas establecidas por un diseño, e y se muestrea condicionalmente en los valores de X como en un experimento.
Todos los resultados consignados en este artículo se encuentran dentro del marco de diseño aleatorio.
En algunas aplicaciones, especialmente con datos de corte transversal, un supuesto adicional es impuesto - que todas las observaciones son independientes e idénticamente distribuidas (iid).
(L es un "matriz de centrado", que es equivalente a la regresión en una constante;.
En ese caso, R2 siempre será un número entre 0 y 1, con valores cercanos a 1 que indica un buen grado de ajuste.
[9] Este caso se considera a menudo en las clases de estadísticas para principiantes, ya que ofrece mucho más simple fórmulas incluso adecuados para el cálculo manual.