stringtranslate.com

Validación de regresión

En estadística , la validación de regresión es el proceso de decidir si los resultados numéricos que cuantifican las relaciones hipotéticas entre las variables, obtenidos a partir del análisis de regresión , son aceptables como descripciones de los datos. El proceso de validación puede implicar analizar la bondad del ajuste de la regresión, analizar si los residuos de regresión son aleatorios y verificar si el rendimiento predictivo del modelo se deteriora sustancialmente cuando se aplica a datos que no se utilizaron en la estimación del modelo.

Bondad de ajuste

Una medida de la bondad del ajuste es el coeficiente de determinación , a menudo denotado como R 2 . En los mínimos cuadrados ordinarios con una intersección, varía entre 0 y 1. Sin embargo, un R 2 cercano a 1 no garantiza que el modelo se ajuste bien a los datos. Por ejemplo, si la forma funcional del modelo no coincide con los datos, R 2 puede ser alto a pesar de un ajuste deficiente del modelo. El cuarteto de Anscombe consta de cuatro conjuntos de datos de ejemplo con valores R 2 igualmente altos , pero datos que a veces claramente no se ajustan a la línea de regresión. En cambio, los conjuntos de datos incluyen valores atípicos , puntos de alto apalancamiento o no linealidades.

Un problema con el R 2 como medida de validez del modelo es que siempre se puede aumentar añadiendo más variables al modelo, excepto en el caso improbable de que las variables adicionales no estén correlacionadas exactamente con la variable dependiente en la muestra de datos que se está utilizando. Este problema se puede evitar haciendo una prueba F de la significancia estadística del aumento en el R 2 o utilizando en su lugar el R 2 ajustado .

Análisis de residuos

Los residuos de un modelo ajustado son las diferencias entre las respuestas observadas en cada combinación de valores de las variables explicativas y la predicción correspondiente de la respuesta calculada utilizando la función de regresión. Matemáticamente, la definición del residuo para la i- ésima observación en el conjunto de datos se escribe

Gráfico de un ajuste y residuos para ilustrar cómo el trazado de residuos nos permite evaluar qué tan bueno es un ajuste.
Gráfico ilustrativo de un ajuste a los datos (curva verde en el panel superior, datos en rojo) más un gráfico de residuos: puntos rojos en el gráfico inferior. La curva discontinua en el panel inferior es un ajuste de línea recta a los residuos. Si la forma funcional es correcta, entonces debería haber poca o ninguna tendencia a los residuos, como se ve aquí.

donde y i denota la i- ésima respuesta en el conjunto de datos y x i el vector de variables explicativas, cada una establecida en los valores correspondientes encontrados en la i- ésima observación en el conjunto de datos.

Si el ajuste del modelo a los datos fuera correcto, los residuos se aproximarían a los errores aleatorios que hacen que la relación entre las variables explicativas y la variable de respuesta sea una relación estadística. Por lo tanto, si los residuos parecen comportarse de manera aleatoria, esto sugiere que el modelo se ajusta bien a los datos. Por otro lado, si se evidencia una estructura no aleatoria en los residuos, es una señal clara de que el modelo se ajusta mal a los datos. La siguiente sección detalla los tipos de gráficos que se deben utilizar para probar diferentes aspectos de un modelo y ofrece las interpretaciones correctas de los diferentes resultados que se podrían observar para cada tipo de gráfico.

Análisis gráfico de residuos

Una forma básica, aunque no cuantitativamente precisa, de comprobar si hay problemas que hacen que un modelo sea inadecuado es realizar un examen visual de los residuos (las predicciones erróneas de los datos utilizados para cuantificar el modelo) para buscar desviaciones obvias de la aleatoriedad. Si un examen visual sugiere, por ejemplo, la posible presencia de heterocedasticidad (una relación entre la varianza de los errores del modelo y el tamaño de las observaciones de una variable independiente), entonces se pueden realizar pruebas estadísticas para confirmar o rechazar esta intuición; si se confirma, se requieren diferentes procedimientos de modelado.

Diferentes tipos de gráficos de los residuos de un modelo ajustado proporcionan información sobre la idoneidad de los diferentes aspectos del modelo.

  1. Suficiencia de la parte funcional del modelo: diagramas de dispersión de residuos versus predictores
  2. variación no constante a través de los datos: gráficos de dispersión de residuos versus predictores; para datos recopilados a lo largo del tiempo, también gráficos de residuos versus tiempo
  3. Desviación de los errores (datos recopilados a lo largo del tiempo): ejecutar gráficos de la respuesta y los errores en función del tiempo
  4. Independencia de errores: gráfico de retardo
  5. Normalidad de los errores: histograma y gráfico de probabilidad normal

Los métodos gráficos tienen una ventaja sobre los métodos numéricos para la validación de modelos porque ilustran fácilmente una amplia gama de aspectos complejos de la relación entre el modelo y los datos.

Análisis cuantitativo de residuos

Los métodos numéricos también desempeñan un papel importante en la validación de modelos. Por ejemplo, la prueba de falta de ajuste para evaluar la corrección de la parte funcional del modelo puede ayudar a interpretar un gráfico de residuos límite. Una situación común en la que los métodos de validación numérica tienen prioridad sobre los métodos gráficos es cuando el número de parámetros que se estiman es relativamente cercano al tamaño del conjunto de datos. En esta situación, los gráficos de residuos suelen ser difíciles de interpretar debido a las restricciones sobre los residuos impuestas por la estimación de los parámetros desconocidos. Un área en la que esto suele suceder es en las aplicaciones de optimización que utilizan experimentos diseñados . La regresión logística con datos binarios es otra área en la que el análisis gráfico de residuos puede resultar difícil.

La correlación serial de los residuos puede indicar una especificación incorrecta del modelo y se puede comprobar con la estadística de Durbin-Watson . El problema de la heterocedasticidad se puede comprobar de varias maneras .

Evaluación fuera de muestra

La validación cruzada es el proceso de evaluar cómo los resultados de un análisis estadístico se generalizarán a un conjunto de datos independiente. Si el modelo se ha estimado sobre algunos, pero no todos, los datos disponibles, entonces el modelo que utiliza los parámetros estimados se puede utilizar para predecir los datos retenidos. Si, por ejemplo, el error cuadrático medio fuera de la muestra , también conocido como error cuadrático medio de predicción , es sustancialmente mayor que el error cuadrático medio dentro de la muestra, esto es un signo de deficiencia en el modelo.

Un avance en las estadísticas médicas es el uso de técnicas de validación cruzada fuera de la muestra en el metanálisis. Forma la base de la estadística de validación, Vn , que se utiliza para probar la validez estadística de las estimaciones resumidas del metanálisis. Esencialmente, mide un tipo de error de predicción normalizado y su distribución es una combinación lineal de variables χ 2 de grado 1. [1]

Véase también

Referencias

  1. ^ Willis BH, Riley RD (2017). "Medición de la validez estadística de los resultados resumidos de metanálisis y metarregresión para su uso en la práctica clínica". Estadísticas en Medicina . 36 (21): 3283–3301. doi :10.1002/sim.7372. PMC  5575530 . PMID  28620945.

Lectura adicional

Enlaces externos

Dominio público Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.