En caso de que no se pueda aplicar un modelo de regresión a un estudio, se dice que no hay correlación entre las variables estudiadas.
es el número de parámetros independientes a tener en cuenta en la regresión.
El término regresión se utilizó por primera vez en el estudio de variables antropométricas: al comparar la estatura de padres e hijos, donde resultó que los hijos cuyos padres tenían una estatura muy superior al valor medio, tendían a igualarse a este, mientras que aquellos cuyos padres eran muy bajos tendían a reducir su diferencia respecto a la estatura media; es decir, "regresaban" al promedio.
Los modelos lineales son una explicación simplificada de la realidad, mucho más ágiles y con un soporte teórico mucho más extenso por parte de la matemática y la estadística.
El modelo de regresión lineal será aplicado en aquellos casos en los que la variable independiente X sea continua.
En el caso más sencillo, con una sola variable explícita, el hiperplano es una recta: El problema de la regresión consiste en elegir unos valores determinados para los parámetros desconocidos
Ei es el residuo e indica la bondad del ajuste realizado para cada punto.
Se calcula de la siguiente forma: Una vez se ha obtenido la recta de regresión, es necesario comprobar la bondad del ajuste realizado mediante el siguiente análisis ANOVA:
Por su parte, β0 es el resultado de la siguiente ecuación en la que aparecen los valores medios correspondientes a ambas variables y el estimador β1 obtenido anteriormente.
son constantes desconocidas, estas deben estimarse mediante los datos de la muestra, supóngase que se tiene
, se estimarán los parámetros utilizando el método de mínimos cuadrados.
Este modelo cuenta con varias variables regresoras, por lo que cuenta con varios parámetros, para la regresión lineal múltiple, se asume que la variable de respuesta
Para estimar los parámetros del modelo, se puede utilizar el método de mínimos cuadrados, en este caso, la función de error cuadrático está dada por la cual deseamos minimizar.
Puede verificarse que la condición anterior se reduce a Si la matriz inversa
Si r es cercano o igual a 1, el ajuste será bueno y las predicciones realizadas a partir del modelo obtenido serán muy fiables (el modelo obtenido resulta verdaderamente representativo); si r es cercano o igual a 0, se tratará de un ajuste malo en el que las predicciones que se realicen a partir del modelo obtenido no serán fiables (el modelo obtenido no resulta representativo de la realidad).
En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco[7] vinieron de estudios que utilizaban la regresión lineal.
En el caso del tabaquismo, los investigadores incluyeron el estado socioeconómico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educación o posición económica.
No obstante, es imposible incluir todas las variables posibles en un estudio de regresión.
Por esta razón, en la actualidad las pruebas controladas aleatorias son consideradas mucho más confiables que los análisis de regresión.
[10] En esta rama se utiliza la Regresión Lineal entre otros para ajustar la recta de Paris , una ecuación que sirve para estudiar elementos sometidos a fatiga en función del número de ciclos a los que se somete un material.
La bondad del ajuste se comprueba representando el conjunto de valores discretos a-Nm obtenidos experimentalmente, frente a la curva correspondiente a la recta de Paris definida por los valores “C” y “m”.
Se estudia la forma en que varía la temperatura de un líquido al calentarlo.
Mediante técnicas de regresión lineal se elaboran las rectas que relacionan estos parámetros con la separación entre el hilo y la zona a soldar.
[15] Con la metodología 2k es posible mejorar un proceso mediante la realización de experimentos, determinando qué variables tienen un efecto significativo.
Por ejemplo se podría obtener la relación entre la temperatura y la presión en un proceso industrial.
[16] Mediante técnicas de regresión lineal se caracterizarán diversas cualidades del hormigón.
[17] Ejemplo en JavaScript para regresión lineal: Ejemplo de una rutina que utiliza una recta de regresión lineal para proyectar un valor futuro: Código escrito en PHP
Es también posible formar un regresor lineal en Python, utilizando la librería sklearn:[18] En la práctica, con mucha frecuencia es necesario resolver problemas que implican conjuntos de variables, cuando se sabe que existe alguna relación inherente entre ellas.
Por ejemplo, en un caso industrial se puede saber que la pintura, para partes automotrices, está relacionada con la cantidad de pigmentación con la que se lleva a cabo.
La significancia del efecto de cada Xi se probara a partir de la prueba 1, basada en una prueba “t”, dicho análisis se presenta a continuación: