stringtranslate.com

Estadística de prensa

Ilustración de cómo ajustar un modelo y encontrar el estadístico PRESS para n=8 observaciones

En estadística , la suma de cuadrados del error residual previsto ( PRESS ) es una forma de validación cruzada utilizada en el análisis de regresión para proporcionar una medida resumida del ajuste de un modelo a una muestra de observaciones que no se utilizaron para estimar el modelo. Se calcula como la suma de los cuadrados de los residuos de predicción para esas observaciones. [1] [2] [3] Específicamente, la estadística PRESS es una forma exhaustiva de validación cruzada, ya que prueba todas las formas posibles en que los datos originales se pueden dividir en un conjunto de entrenamiento y validación.

Una vez producido un modelo ajustado , se elimina cada observación por turno y el modelo se reajusta utilizando las observaciones restantes (similar a la validación cruzada de dejar una ). El valor predicho fuera de la muestra se calcula para la observación omitida en cada caso, y la estadística PRESS se calcula como la suma de los cuadrados de todos los errores de predicción resultantes: [4]

Dado este procedimiento, la estadística PRESS se puede calcular para varias estructuras modelo candidatas para el mismo conjunto de datos, donde los valores más bajos de PRESS indican las mejores estructuras. Los modelos que están sobreparametrizados ( sobreajustados ) tenderían a dar residuos pequeños para las observaciones incluidas en el ajuste del modelo, pero residuos grandes para las observaciones que están excluidas. La estadística PRESS se ha utilizado ampliamente en el aprendizaje diferido y en el aprendizaje lineal local para acelerar la evaluación y la selección del tamaño del vecindario. [5] [6]

Ver también

Referencias

  1. ^ "Libro de texto de estadística electrónica de Statsoft - Glosario de estadística". Archivado desde el original el 10 de mayo de 2016 . Consultado el 13 de mayo de 2016 .
  2. ^ Allen, DM (1974), "La relación entre la selección de variables y el aumento de datos y un método de predicción", Technometrics , 16, 125-127
  3. ^ Tarpey, Thaddeus (2000) "Una nota sobre la estadística de predicción de suma de cuadrados para mínimos cuadrados restringidos", The American Statistician , vol. 54, núm. 2, mayo, págs. 116-118
  4. ^ "Manual gráfico de R: estadística PRESS (suma de cuadrados de predicción) de Allen, también conocida como P-cuadrado". Archivado desde el original el 27 de febrero de 2018 . Consultado el 27 de febrero de 2018 .
  5. ^ Atkeson, Christopher G.; Moore, Andrew W.; Schaal, Stefan (1 de febrero de 1997). "Aprendizaje ponderado localmente". Revisión de inteligencia artificial . 11 (1): 11–73. doi :10.1023/A:1006559212014. ISSN  1573-7462. S2CID  9219592. Archivado desde el original el 6 de mayo de 2021 . Consultado el 25 de septiembre de 2020 .
  6. ^ Bontempi, Gianluca; Birattari, Mauro; Bersini, Hugues (1 de enero de 1999). "Aprendizaje diferido para el diseño de control y modelado local". Revista Internacional de Control . 72 (7–8): 643–658. doi :10.1080/002071799220830.