stringtranslate.com

Modelo de caja gris

En matemáticas , estadística y modelado computacional , un modelo de caja gris [1] [2] [3] [4] combina una estructura teórica parcial con datos para completar el modelo. La estructura teórica puede variar desde información sobre la suavidad de los resultados hasta modelos que solo necesitan valores de parámetros de los datos o la literatura existente. [5] Por lo tanto, casi todos los modelos son modelos de caja gris en oposición a la caja negra donde no se asume ninguna forma de modelo o modelos de caja blanca que son puramente teóricos. Algunos modelos asumen una forma especial como una regresión lineal [6] [7] o una red neuronal . [8] [9] Estos tienen métodos de análisis especiales. En particular, las técnicas de regresión lineal [10] son ​​mucho más eficientes que la mayoría de las técnicas no lineales. [11] [12] El modelo puede ser determinista o estocástico (es decir, que contiene componentes aleatorios) dependiendo de su uso planificado.

Formulario modelo

El caso general es un modelo no lineal con una estructura teórica parcial y algunas partes desconocidas derivadas de los datos. Los modelos con estructuras teóricas diferentes deben evaluarse individualmente, [1] [13] [14] posiblemente utilizando recocido simulado o algoritmos genéticos .

Dentro de una estructura de modelo particular, puede ser necesario encontrar parámetros [14] [15] o relaciones de parámetros variables [5] [16] . Para una estructura particular, se supone arbitrariamente que los datos consisten en conjuntos de vectores de alimentación f , vectores de producto p y vectores de condición de operación c . [5] Normalmente c contendrá valores extraídos de f , así como otros valores. En muchos casos, un modelo se puede convertir en una función de la forma: [5] [17] [18]

m(f,p,q)

donde la función vectorial m proporciona los errores entre los datos p y las predicciones del modelo. El vector q proporciona algunos parámetros variables que son las partes desconocidas del modelo.

Los parámetros q varían con las condiciones de operación c de una manera a determinar. [5] [17] Esta relación puede especificarse como q = Ac donde A es una matriz de coeficientes desconocidos, y c como en la regresión lineal [6] [7] incluye un término constante y posiblemente valores transformados de las condiciones de operación originales para obtener relaciones no lineales [19] [20] entre las condiciones de operación originales y q . Entonces es una cuestión de seleccionar qué términos en A son distintos de cero y asignar sus valores. La finalización del modelo se convierte en un problema de optimización para determinar los valores distintos de cero en A que minimizan los términos de error m(f,p,Ac) sobre los datos. [1] [16] [21] [22] [23]

Finalización del modelo

Una vez que se realiza una selección de valores distintos de cero, los coeficientes restantes en A se pueden determinar minimizando m ( f , p , Ac ) sobre los datos con respecto a los valores distintos de cero en A , típicamente mediante mínimos cuadrados no lineales . La selección de los términos distintos de cero se puede realizar mediante métodos de optimización como recocido simulado y algoritmos evolutivos . Además, los mínimos cuadrados no lineales pueden proporcionar estimaciones de precisión [11] [15] para los elementos de A que se pueden usar para determinar si son significativamente diferentes de cero, proporcionando así un método de selección de términos . [24] [25]

A veces es posible calcular valores de q para cada conjunto de datos, directamente o mediante mínimos cuadrados no lineales . Luego, se puede utilizar la regresión lineal más eficiente para predecir q utilizando c, seleccionando así los valores distintos de cero en A y estimando sus valores. Una vez que se encuentran los valores distintos de cero, se pueden utilizar mínimos cuadrados no lineales en el modelo original m(f,p,Ac) para refinar estos valores. [16] [21] [22]

Un tercer método es la inversión del modelo , [5] [17] [18] que convierte la m no lineal ( f , p , Ac ) en una forma lineal aproximada en los elementos de A , que se puede examinar utilizando una selección de términos eficiente [24] [25] y la evaluación de la regresión lineal. [10] Para el caso simple de un único valor q ( q = a T c ) y una estimación q* de q . Poniendo d q  =  a T c  −  q* se obtiene

m(f,p,a T c) = m(f,p,q* + d q) ≈ ​​m(f,pq*) + d q m'(f,p,q*) = m(f,pq*) + (a T c − q*) m'(f,p,q*)

de modo que una T está ahora en una posición lineal con todos los demás términos conocidos, y por lo tanto puede ser analizada mediante técnicas de regresión lineal . Para más de un parámetro el método se extiende de manera directa. [5] [18] [17] Después de comprobar que el modelo ha sido mejorado este proceso puede repetirse hasta la convergencia. Este enfoque tiene las ventajas de que no necesita que los parámetros q puedan determinarse a partir de un conjunto de datos individual y la regresión lineal se realiza sobre los términos de error originales [5]

Validación del modelo

Cuando se dispone de datos suficientes, se recomienda dividir los datos en un conjunto de construcción de modelos independiente y uno o dos conjuntos de evaluación . Esto se puede repetir utilizando múltiples selecciones del conjunto de construcción y los modelos resultantes se pueden promediar o utilizar para evaluar las diferencias de predicción.

Una prueba estadística como la prueba de chi-cuadrado sobre los residuos no es particularmente útil. [26] La prueba de chi-cuadrado requiere desviaciones estándar conocidas que rara vez están disponibles, y las pruebas fallidas no dan ninguna indicación de cómo mejorar el modelo. [11] Hay una variedad de métodos para comparar modelos anidados y no anidados. Estos incluyen la comparación de predicciones del modelo con datos repetidos.

Un intento de predecir los residuos m(, ) con las condiciones de operación c mediante regresión lineal mostrará si los residuos pueden predecirse. [21] [22] Los residuos que no pueden predecirse ofrecen pocas perspectivas de mejorar el modelo utilizando las condiciones de operación actuales. [5] Los términos que predicen los residuos son términos prospectivos para incorporar al modelo para mejorar su desempeño. [21]

La técnica de inversión del modelo anterior se puede utilizar como método para determinar si un modelo se puede mejorar. En este caso, la selección de términos distintos de cero no es tan importante y la predicción lineal se puede realizar utilizando los vectores propios significativos de la matriz de regresión . Los valores en A determinados de esta manera deben sustituirse en el modelo no lineal para evaluar las mejoras en los errores del modelo. La ausencia de una mejora significativa indica que los datos disponibles no pueden mejorar la forma actual del modelo utilizando los parámetros definidos. [5] Se pueden insertar parámetros adicionales en el modelo para que esta prueba sea más completa.

Véase también

Referencias

  1. ^ abc Bohlin, Torsten P. (7 de septiembre de 2006). Identificación práctica de procesos de caja gris: teoría y aplicaciones. Springer Science & Business Media. ISBN 978-1-84628-403-8.
  2. ^ "Estimación del modelo de caja gris". Mathworks 2. 2012.
  3. ^ Kroll, Andreas (2000). Modelos de caja gris: conceptos y aplicaciones. En: New Frontiers in Computational Intelligence and its Applications, vol. 57 de Frontiers in artificial intelligence and applications, pp. 42-51. IOS Press, Ámsterdam.
  4. ^ Sohlberg, B., y Jacobsen, EW, 2008. Modelado de caja gris: ramas y experiencias, Actas del 17.° Congreso Mundial, Federación Internacional de Control Automático, Seúl, págs. 11415-11420
  5. ^ abcdefghij Whiten, B., 2013. Finalización y validación de modelos utilizando inversión de modelos de caja gris, ANZIAM J.,54 (CTAC 2012) pp C187–C199.
  6. ^ ab Draper, Norman R.; Smith, Harry (25 de agosto de 2014). Análisis de regresión aplicado. John Wiley & Sons. págs. 657–. ISBN 978-1-118-62568-2.
  7. ^ ab Weisberg, Sanford (25 de noviembre de 2013). Regresión lineal aplicada. Wiley. ISBN 978-1-118-59485-8.
  8. ^ Heaton, J., 2012. Introducción a las matemáticas de las redes neuronales, Heaton Research Inc. (Chesterfield, MO), ISBN 978-1475190878 
  9. ^ Stergiou, C.; Siganos, D. (2013). «Neural networks». Archivado desde el original el 2009-12-16 . Consultado el 2013-07-03 .
  10. ^ ab Lawson, Charles L.; J. Hanson, Richard (1 de diciembre de 1995). Solución de problemas de mínimos cuadrados. SIAM. ISBN 978-0-89871-356-5.
  11. ^ abc Press, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007). Recetas numéricas (3.ª ed.). Cambridge University Press. ISBN 978-0-521-88068-8.
  12. ^ Gelman, Andrew; Carlin, John B.; Stern, Hal S.; Dunson, David B.; Vehtari, Aki; Rubin, Donald B. (1 de noviembre de 2013). Análisis de datos bayesianos, tercera edición. CRC Press. ISBN 978-1-4398-4095-5.
  13. ^ Mathworks, 2013. Modelos de caja gris admitidos
  14. ^ ab Hauth, J. (2008), Modelado de caja gris para sistemas no lineales (PDF) (tesis doctoral, Universidad Tecnológica de Kaiserslautern ).
  15. ^ ab Nash, JC y Walker-Smith, M. 1987. Estimación de parámetros no lineales, Marcel Dekker, Inc. (Nueva York).
  16. ^ abc Whiten, WJ, 1971. Técnicas de construcción de modelos aplicadas a procesos de tratamiento de minerales, Symp. on Automatic Control Systems in Mineral Processing Plants, (Australas. Inst. Min. Metall., S. Queensland Branch, Brisbane), 129-148.
  17. ^ abcd Whiten, WJ, 1994. Determinación de relaciones de parámetros dentro de modelos no lineales, Boletín SIGNUM, 29(3–4,) 2–5. 10.1145/192527.192535.
  18. ^ abc Whiten, B., 2014. Determinación de la forma de ecuaciones diferenciales ordinarias usando inversión de modelos, ANZIAM J. 55 (EMAC2013) pp.C329–C347.
  19. ^ Polinomio
  20. ^ Spline (matemáticas)
  21. ^ abcd Kojovic, T. y Whiten WJ, 1994. Evaluación de la calidad de los modelos de simulación, Innovaciones en el procesamiento de minerales, (Lauretian University, Sudbury) pp 437–446. ISBN 088667025X 
  22. ^ abc Kojovic, T., 1989. El desarrollo y la aplicación de Model: un generador de modelos automatizado para el procesamiento de minerales, tesis doctoral, Universidad de Queensland.
  23. ^ Xiao, J., 1998. Extensiones de las técnicas de construcción de modelos y sus aplicaciones en el procesamiento de minerales, tesis doctoral, Universidad de Queensland.
  24. ^ ab Linhart, H.; Zucchini, W. (1986). Selección de modelos. Wiley. ISBN 978-0-471-83722-0.
  25. ^ ab Miller, Alan (15 de abril de 2002). Selección de subconjuntos en regresión. CRC Press. ISBN 978-1-4200-3593-3.
  26. ^ Deming, William Edwards (2000). Salir de la crisis, pág. 272. MIT Press. ISBN 978-0-262-54115-2.