En estadística , la fracción de varianza no explicada ( FVU ) en el contexto de una tarea de regresión es la fracción de varianza del regresado (variable dependiente) Y que no puede explicarse, es decir, que no se predice correctamente, por las variables explicativas X.
Supongamos que se nos da una función de regresión que produce para cada una una estimación donde es el vector de las i -ésimas observaciones de todas las variables explicativas. [1] : 181 Definimos la fracción de varianza no explicada (FVU) como:
donde R 2 es el coeficiente de determinación y VAR err y VAR tot son la varianza de los residuos y la varianza muestral de la variable dependiente. SS err (la suma de los cuadrados de los errores de predicción, equivalente a la suma de los cuadrados de los residuos ), SS tot (la suma total de los cuadrados ) y SS reg (la suma de los cuadrados de la regresión, equivalente a la suma explicada de los cuadrados ) se dan por
Alternativamente, la fracción de varianza no explicada se puede definir de la siguiente manera:
donde MSE( f ) es el error cuadrático medio de la función de regresión ƒ .
Es útil considerar la segunda definición para comprender la FVU. Cuando intentamos predecir Y , la función de regresión más ingenua que podemos pensar es la función constante que predice la media de Y , es decir, . De ello se deduce que el MSE de esta función es igual a la varianza de Y ; es decir, SS err = SS tot y SS reg = 0. En este caso, no se puede explicar ninguna variación en Y y la FVU tiene entonces su valor máximo de 1.
En términos más generales, la FVU será 1 si las variables explicativas X no nos dicen nada sobre Y en el sentido de que los valores predichos de Y no covarían con Y . Pero a medida que la predicción mejora y el MSE se puede reducir, la FVU disminuye. En el caso de una predicción perfecta donde para todos los i , el MSE es 0, SS err = 0, SS reg = SS tot , y la FVU es 0.