stringtranslate.com

Metodología de modelado de respuesta

La metodología de modelado de respuesta (RMM) es una plataforma general para el modelado estadístico de una relación lineal/no lineal entre una variable de respuesta ( variable dependiente ) y un predictor lineal (una combinación lineal de predictores/efectos/factores/ variables independientes ), a menudo denominado función predictora lineal . En general, se supone que la relación modelada es monótona-convexa (que proporciona una función convexa monótona ) o monótona-cóncava (que proporciona una función cóncava monótona ). Sin embargo, muchas funciones no monótonas, como la ecuación cuadrática , son casos especiales del modelo general.

RMM se desarrolló inicialmente como una serie de extensiones de la transformación Box-Cox inversa original : donde y es un percentil de la respuesta modelada, Y (la variable aleatoria modelada ), z es el percentil respectivo de una variable normal y λ es el parámetro Box-Cox. A medida que λ tiende a cero, la transformación Box-Cox inversa se convierte en: un modelo exponencial . Por lo tanto, la transformación Box-Cox inversa original contiene un trío de modelos: lineal ( λ  = 1), potencia ( λ  ≠ 1, λ  ≠ 0) y exponencial ( λ  = 0). Esto implica que al estimar λ, utilizando datos de muestra, el modelo final no se determina de antemano (antes de la estimación) sino como resultado de la estimación. En otras palabras, los datos por sí solos determinan el modelo final.

Shore (2001a [1] ) desarrolló extensiones de la transformación inversa de Box-Cox, denominadas Transformaciones Normalizadoras Inversas (INT, por sus siglas en inglés). Se habían aplicado para modelar relaciones monótonas-convexas en diversas áreas de ingeniería, principalmente para modelar propiedades físicas de compuestos químicos (Shore et al. , 2001a, [1] y referencias allí citadas). Una vez que se comprendió que los modelos INT pueden percibirse como casos especiales de un enfoque general mucho más amplio para modelar relaciones monótonas-convexas no lineales, se inició y desarrolló la nueva Metodología de Modelado de Respuestas (Shore, 2005a, [2] 2011 [3] y referencias allí citadas).

El modelo RMM expresa la relación entre una respuesta, Y (la variable aleatoria modelada), y dos componentes que aportan variación a Y:

El modelo RMM básico describe Y en términos del LP, dos errores normales de media cero posiblemente correlacionados, ε 1 y ε 2 (con correlación ρ y desviaciones estándar σ ε 1 y σ ε 2 , respectivamente) y un vector de parámetros { α , λ , μ } (Shore, 2005a, [2] 2011 [3] ):

y ε 1 representa la incertidumbre (imprecisión de la medición o de otro tipo) en las variables explicativas (incluidas en el LP). Esto se suma a la incertidumbre asociada con la respuesta ( ε 2 ). Expresando ε 1 y ε 2 en términos de las variables normales estándar, Z 1 y Z 2 , respectivamente, que tienen correlación ρ , y condicionando Z 2 | Z 1 = z 1 ( Z 2 dado que Z 1 es igual a un valor dado z 1 ), podemos escribir en términos de un solo error,  ε :

donde Z es una variable normal estándar, independiente tanto de Z 1 como de Z 2 , ε es un error de media cero y d es un parámetro. A partir de estas relaciones, la función cuantil RMM asociada es (Shore, 2011 [3] ):

o, después de la re-parametrización:

donde y es el percentil de la respuesta ( Y ), z es el percentil normal estándar respectivo, ε es el error normal de media cero del modelo con varianza constante, σ , { a,b,c,d } son parámetros y M Y es la mediana de la respuesta ( z  = 0), que depende de los valores de los parámetros y del valor del LP, η :

donde μ (o m ) es un parámetro adicional.

Si se puede suponer que cz<<η, el modelo anterior para la función cuantil RMM se puede aproximar mediante:

El parámetro “c” no puede ser “absorbido” en los parámetros de la PL (η) ya que “c” y la PL se estiman en dos etapas separadas (como se explica a continuación).

Si los datos de respuesta utilizados para estimar el modelo contienen valores que cambian de signo, o si el valor de respuesta más bajo está lejos de cero (por ejemplo, cuando los datos se truncan a la izquierda), se puede agregar un parámetro de ubicación, L , a la respuesta para que las expresiones para la función cuantil y para la mediana se conviertan, respectivamente:

Convexidad monótona continua

Como se ha mostrado anteriormente, la transformación inversa de Box-Cox depende de un único parámetro, λ , que determina la forma final del modelo (ya sea lineal, exponencial o de potencia). Los tres modelos constituyen, por tanto, meros puntos en un espectro continuo de convexidad monótona, abarcado por λ. Esta propiedad, en la que diferentes modelos conocidos se convierten en meros puntos en un espectro continuo, abarcado por los parámetros del modelo, se denomina propiedad de convexidad monótona continua (CMC). Esta última caracteriza a todos los modelos RMM y permite que el ciclo básico “lineal-potencial-exponencial” (subyacente a la transformación inversa de Box-Cox) se repita hasta el infinito, lo que permite derivar cada vez más modelos convexos. Algunos ejemplos de estos modelos son un modelo exponencial-potencial o un modelo exponencial-exponencial-potencial (véanse los modelos explícitos que se exponen más adelante). Dado que la forma final del modelo está determinada por los valores de los parámetros RMM, esto implica que los datos utilizados para estimar los parámetros determinan la forma final del modelo RMM estimado (como ocurre con la transformación inversa de Box-Cox). La propiedad CMC otorga a los modelos RMM una gran flexibilidad para acomodar los datos utilizados para estimar los parámetros. Las referencias que se indican a continuación muestran resultados publicados de comparaciones entre modelos RMM y modelos existentes. Estas comparaciones demuestran la eficacia de la propiedad CMC.

Ejemplos de modelos RMM

Ignorando los errores RMM (ignorando los términos cz , dz y e en el modelo de percentil), obtenemos los siguientes modelos RMM, presentados en un orden creciente de convexidad monótona:

Al agregar dos nuevos parámetros introduciendo para η (en el modelo de percentil): , se itera un nuevo ciclo de “lineal-potencia-exponencial” para producir modelos con una convexidad monótona más fuerte (Shore, 2005a, [2] 2011, [3] 2012 [4] ):

Se comprende que esta serie de modelos convexos monótonos, presentados tal como aparecen en un orden jerárquico en la “Escalera de funciones convexas monótonas” (Shore, 2011 [3] ), es ilimitada desde arriba. Sin embargo, todos los modelos son meros puntos en un espectro continuo, abarcado por parámetros RMM. Observe también que numerosos modelos de crecimiento, como la función de Gompertz , son casos especiales exactos del modelo RMM.

Momentos

El k -ésimo momento no central de Y es (suponiendo L  = 0; Shore, 2005a, [2] 2011 [3] ):

Desarrollando Y k , como se da en el lado derecho, en una serie de Taylor alrededor de cero, en términos de potencias de Z (la variable normal estándar), y luego tomando la expectativa en ambos lados, asumiendo que cZ  ≪  η de modo que η  +  cZ  ≈  η , una expresión simple aproximada para el k -ésimo momento no central, basada en los primeros seis términos en la expansión, es:

Se puede derivar una expresión análoga sin suponer que cZ  ≪  η . Esto daría como resultado una expresión más precisa (aunque larga y complicada). Una vez que se descuida cZ en la expresión anterior, Y se convierte en una variable aleatoria log-normal (con parámetros que dependen de  η ).

Ajuste y estimación

Los modelos RMM pueden usarse para modelar la variación aleatoria (como una plataforma general para el ajuste de distribuciones) o para modelar la variación sistemática (de manera análoga a los modelos lineales generalizados , GLM).

En el primer caso (sin variación sistemática, es decir, η  = constante), la función cuantil RMM se ajusta a distribuciones conocidas. Si la distribución subyacente es desconocida, la función cuantil RMM se estima utilizando los datos de muestra disponibles. El modelado de la variación aleatoria con RMM se aborda y demuestra en Shore (2011 [3] y referencias allí).

En el último caso (modelado de variación sistemática), los modelos RMM se estiman asumiendo que la variación en el predictor lineal (generada a través de la variación en las variables regresoras) contribuye a la variación general de la variable de respuesta modelada ( Y ). Este caso se aborda y demuestra en Shore (2005a, [2] 2012 [4] y referencias relevantes allí). La estimación se realiza en dos etapas. Primero se estima la mediana minimizando la suma de las desviaciones absolutas (del modelo ajustado a partir de los puntos de datos de muestra). En la segunda etapa, se estiman los dos parámetros restantes (no estimados en la primera etapa, a saber, { c , d }). En Shore (2012 [4] ) se presentan tres enfoques de estimación : máxima verosimilitud , coincidencia de momentos y regresión cuantil no lineal .

Revisión de literatura

A partir de 2021, la literatura sobre RMM aborda tres áreas:

(1) Desarrollo de INT y posteriormente del enfoque RMM, con métodos de estimación aliados;

(2) Explorar las propiedades del RMM y comparar su eficacia con otros enfoques de modelado actuales (para el ajuste de distribución o para el modelado de la variación sistemática);

(3) Aplicaciones.

Shore (2003a [5] ) desarrolló Transformaciones Normalizadoras Inversas (INTs) en los primeros años del siglo XXI y las ha aplicado a varias disciplinas de ingeniería como el control estadístico de procesos (Shore, 2000a, [1] b, [6] 2001a, [7] b, [8] 2002a [9] ) e ingeniería química (Shore et al. , 2002 [10] ). Posteriormente, a medida que la nueva Metodología de Modelado de Respuesta (RMM) había ido surgiendo y desarrollándose hasta convertirse en una plataforma completa para modelar relaciones convexas monótonas (finalmente presentada en un libro, Shore, 2005a [2] ), se exploraron las propiedades de RMM (Shore, 2002b, [11] 2004a, [12] b, [13] 2008a, [14 ] 2011 [3] ), se desarrollaron procedimientos de estimación (Shore, 2005a, [2] b, [15] 2012 [4] ) y se comparó la nueva metodología de modelado con otros enfoques, para modelar la variación aleatoria (Shore 2005c, [16] 2007, [17] 2010; [18] Shore y A'wad 2010 [19] ), y para modelar la variación sistemática (Shore, 2008b [20] ).

Al mismo tiempo, el RMM se ha aplicado a diversas disciplinas científicas y de ingeniería y se ha comparado con los modelos y enfoques de modelado actuales que se practican en ellas. Por ejemplo, la ingeniería química (Shore, 2003b; [21] Benson-Karhi et al. , 2007; [22] Shacham et al. , 2008; [23] Shore y Benson-Karhi, 2010 [24] ), el control estadístico de procesos (Shore, 2014; [25] Shore et al. , 2014; [26] Danoch y Shore, 2016 [27] ), la ingeniería de confiabilidad (Shore, 2004c; [28] Ladany y Shore, 2007 [29] ), la previsión (Shore y Benson-Karhi, 2007 [30] ), la ecología (Shore, 2014 [25] ) y la profesión médica (Shore et al., 2014; [26] Benson-Karhi et al. , 2017 [31] ).

Referencias

  1. ^ abc Shore, Haim (1 de diciembre de 2000). "Tres enfoques para analizar datos de calidad originados en poblaciones no normales". Quality Engineering . 13 (2): 277–291. doi :10.1080/08982110108918651. ISSN  0898-2112. S2CID  120209267.
  2. ^ abcdefg Haim., Shore (1 de enero de 2006). Metodología de modelado de respuesta: modelado empírico para ingeniería y ciencia . World Scientific. ISBN 978-9812561022.OCLC 949697181  .
  3. ^ abcdefgh Shore, Haim (2011). "Metodología de modelado de respuesta". WIREs Comput Stat . 3 (4): 357–372. doi :10.1002/wics.151. S2CID  62021374.
  4. ^ abcd Shore, Haim (2012). "Metodología de estimación de modelos de respuesta". WIREs Comput Stat . 4 (3): 323–333. doi :10.1002/wics.1199. S2CID  122366147.
  5. ^ Shore, Haim (24 de abril de 2003). "Transformaciones normalizadoras inversas y una transformación normalizadora extendida". Avances en aspectos teóricos y metodológicos de probabilidad y estadística . CRC Press. págs. 131–145. doi :10.1201/9780203493205.ch9. ISBN. 9781560329817.
  6. ^ Shore, Haim (1 de mayo de 2000). "Gráficos de control general para variables". Revista Internacional de Investigación en Producción . 38 (8): 1875–1897. doi :10.1080/002075400188645. ISSN  0020-7543. S2CID  120647313.
  7. ^ Shore, Haim (1 de enero de 2001). "Control de procesos para poblaciones no normales basado en una transformación normalizadora inversa". Frontiers in Statistical Quality Control 6 . Physica, Heidelberg. págs. 194–206. doi :10.1007/978-3-642-57590-7_12. ISBN 978-3-7908-1374-6.
  8. ^ Shore, H. (1 de enero de 2001). "Modelado de una respuesta no normal para la mejora de la calidad". Revista Internacional de Investigación en Producción . 39 (17): 4049–4063. doi :10.1080/00207540110072245. ISSN  0020-7543. S2CID  110083024.
  9. ^ Shore, Haim (18 de junio de 2002). "Modelado de una respuesta con fuentes de variación generadas externamente y autogeneradas". Quality Engineering . 14 (4): 563–578. doi :10.1081/QEN-120003559. ISSN  0898-2112. S2CID  120494823.
  10. ^ Shore, Haim; Brauner, Neima; Shacham, Mordechai (1 de febrero de 2002). "Modelado de propiedades físicas y termodinámicas mediante transformaciones normalizadoras inversas". Investigación en química industrial e ingeniería . 41 (3): 651–656. doi :10.1021/ie010039s. ISSN  0888-5885.
  11. ^ Shore, Haim (31 de diciembre de 2002). "Metodología de modelado de respuesta (rmm): exploración de las propiedades de la distribución de error implícita". Communications in Statistics - Theory and Methods . 31 (12): 2225–2249. doi :10.1081/STA-120017223. ISSN  0361-0926. S2CID  119599987.
  12. ^ Shore, Haim (2004). "Metodología de modelado de respuesta (RMM): distribuciones actuales, transformaciones y aproximaciones como casos especiales de la distribución de error RMM". Communications in Statistics - Theory and Methods . 33 (7): 1491–1510. doi :10.1081/STA-120017223. S2CID  119599987. Archivado (PDF) desde el original el 13 de julio de 2022.
  13. ^ Shore, Haim (2004). "Metodología de modelado de respuesta que valida la evidencia de la ingeniería y las ciencias". Qual. Reliab. Eng. Int . 20 : 61–79. doi :10.1002/qre.547. S2CID  120932424.
  14. ^ Shore, Haim (1 de enero de 2008). "Ajuste de distribución con metodología de modelado de respuesta (RMM): algunos resultados recientes". Revista estadounidense de ciencias matemáticas y de gestión . 28 (1–2): 3–18. doi : 10.1080/01966324.2008.10737714 . ISSN  0196-6324. S2CID  119890008.
  15. ^ Shore, Haim (15 de junio de 2005). "Metodología de modelado de respuesta (RMM): procedimientos de estimación de máxima verosimilitud". Computational Statistics & Data Analysis . 49 (4): 1148–1172. doi :10.1016/j.csda.2004.07.006.
  16. ^ Shore, Haim (1 de marzo de 2005). "Aproximaciones precisas basadas en RMM para la CDF de la distribución normal". Communications in Statistics - Theory and Methods . 34 (3): 507–513. doi :10.1081/STA-200052102. ISSN  0361-0926. S2CID  122148043.
  17. ^ Shore, Haim (9 de noviembre de 2007). "Comparación de la distribución lambda generalizada (GLD) y la metodología de modelado de respuesta (RMM) como plataformas generales para el ajuste de distribuciones". Communications in Statistics - Theory and Methods . 36 (15): 2805–2819. doi :10.1080/03610920701386885. ISSN  0361-0926. S2CID  121278971.
  18. ^ Shore, Haim (1 de octubre de 2010). "Ajuste de distribuciones con la función cuantil de la metodología de modelado de respuesta (RMM)". Manual de ajuste de distribuciones estadísticas con R . Chapman y Hall/CRC. págs. 537–556. doi :10.1201/b10159-17. ISBN 9781584887119.
  19. ^ Shore, Haim; A'wad, Fatina (12 de mayo de 2010). "Comparación estadística de la bondad de ajuste proporcionada por cinco familias de distribuciones utilizadas en el ajuste de distribuciones". Communications in Statistics - Theory and Methods . 39 (10): 1707–1728. doi :10.1080/03610920902887707. ISSN  0361-0926. S2CID  121490873.
  20. ^ Shore, Haim (2008). "Comparación de predictores lineales obtenidos mediante transformación de datos, modelos lineales generalizados (GLM) y metodología de modelado de respuesta (RMM)". Qual. Reliab. Eng. Int . 24 (4): 389–399. doi :10.1002/qre.898. S2CID  2696320.
  21. ^ Shore, Haim (15 de mayo de 2003). "Metodología de modelado de respuesta (RMM): un nuevo enfoque para modelar una respuesta química para una relación monótona convexa/cóncava". Computers & Chemical Engineering . 27 (5): 715–726. doi :10.1016/S0098-1354(02)00255-7.
  22. ^ Benson-Karhi, Diamanta; Shore, Haim; Shacham, Mordechai (1 de mayo de 2007). "Modelado de propiedades dependientes de la temperatura del agua mediante la metodología de modelado de respuesta (RMM) y comparación con modelos aceptables". Investigación en química industrial e ingeniería . 46 (10): 3446–3463. doi :10.1021/ie061252x. ISSN  0888-5885.
  23. ^ Shacham, Mordechai; Brauner, Neima; Shore, Haim; Benson-Karhi, Diamanta (1 de julio de 2008). "Predicción de propiedades dependientes de la temperatura mediante correlaciones basadas en similitudes de estructuras moleculares: aplicación a la densidad de líquidos". Investigación en química industrial e ingeniería . 47 (13): 4496–4504. doi :10.1021/ie701766m. ISSN  0888-5885.
  24. ^ Shore, Haim; Benson-Karhi, Diamanta (6 de octubre de 2010). "Modelado de propiedades dependientes de la temperatura de oxígeno, argón y nitrógeno mediante la metodología de modelado de respuesta (RMM) y comparación con modelos aceptables". Investigación en química industrial e ingeniería . 49 (19): 9469–9485. doi :10.1021/ie100981y. ISSN  0888-5885.
  25. ^ ab Shore, Haim (2014). "Modelado y monitoreo de sistemas ecológicos: un enfoque de control de procesos estadísticos". Ingeniería de calidad y confiabilidad internacional . 30 (8): 1233–1248. doi :10.1002/qre.1544. S2CID  9841735.
  26. ^ ab Shore, Haim; Benson-Karhi, Diamanta; Malamud, Maya; Bashiri, Asher (3 de julio de 2014). "Modelado y monitoreo personalizado del crecimiento fetal: un enfoque de control estadístico de procesos". Ingeniería de calidad . 26 (3): 290–310. doi :10.1080/08982112.2013.830742. ISSN  0898-2112. S2CID  111061936.
  27. ^ Danoch, Revital; Shore, Haim (2016). "Esquema SPC para monitorear predictores lineales integrados en perfiles no lineales". Qual. Reliab. Eng. Int . 32 (4): 1453–1466. doi :10.1002/qre.1856. S2CID  43167469.
  28. ^ "Carta al editor". Comunicaciones en Estadística - Simulación y Computación . 33 (2): 537–539. 2004-01-02. doi :10.1081/SAC-120037902. ISSN  0361-0918. S2CID  218568529.
  29. ^ Ladany, Shaul; Shore, Haim (2007). "Período de garantía que maximiza las ganancias con ventas expresadas por una función de demanda". Qual. Reliab. Eng. Int . 23 (3): 291–301. doi :10.1002/qre.790. S2CID  11187814.
  30. ^ Shore, H.; Benson-Karhi, D. (1 de junio de 2007). "Pronóstico de procesos de difusión en forma de S mediante una metodología de modelado de respuesta". Revista de la Sociedad de Investigación Operativa . 58 (6): 720–728. doi :10.1057/palgrave.jors.2602187. ISSN  0160-5682. S2CID  205131178.
  31. ^ Benson-Karhi, Diamanta; Shore, Haim; Malamud, Maya (23 de enero de 2017). "Modelado de la biometría del crecimiento fetal con la metodología de modelado de respuesta (RMM) y comparación con los modelos actuales". Communications in Statistics - Simulation and Computation . 47 : 129–142. doi :10.1080/03610918.2017.1280160. ISSN  0361-0918. S2CID  46801213.