stringtranslate.com

Kriging

Ejemplo de interpolación de datos unidimensionales mediante kriging, con intervalos creíbles . Los cuadrados indican la ubicación de los datos. La interpolación de kriging, que se muestra en rojo, se ejecuta a lo largo de las medias de los intervalos creíbles distribuidos normalmente que se muestran en gris. La curva discontinua muestra una spline que es suave, pero se aleja significativamente de los valores esperados proporcionados por esas medias.

En estadística , originalmente en geoestadística , kriging o Kriging , ( / ˈkr iːɡɪŋ / ) también conocido como regresión del proceso gaussiano , es un método de interpolación basado en el proceso gaussiano regido por covarianzas previas . Bajo supuestos adecuados de lo anterior, kriging da la mejor predicción lineal insesgada (BLUP) en ubicaciones no muestreadas. [1] Los métodos de interpolación basados ​​en otros criterios como la suavidad (por ejemplo, spline de suavizado ) pueden no producir la BLUP. El método se usa ampliamente en el dominio del análisis espacial y los experimentos informáticos . La técnica también se conoce como predicción de Wiener-Kolmogorov , en honor a Norbert Wiener y Andrey Kolmogorov .

La base teórica del método fue desarrollada por el matemático francés Georges Matheron en 1960, basándose en la tesis de maestría de Danie G. Krige , el pionero trazador de leyes de oro promedio ponderadas por distancia en el complejo de arrecifes de Witwatersrand en Sudáfrica . Krige buscó estimar la distribución más probable de oro basándose en muestras de unos pocos pozos. El verbo inglés es to krige y el sustantivo más común es kriging . La palabra a veces se escribe con mayúscula como Kriging en la literatura.

Aunque su formulación básica implica un uso intensivo de recursos computacionales, el kriging se puede escalar a problemas más grandes utilizando diversos métodos de aproximación .

Principios fundamentales

Términos y técnicas relacionados

El kriging predice el valor de una función en un punto dado calculando un promedio ponderado de los valores conocidos de la función en la vecindad del punto. El método está estrechamente relacionado con el análisis de regresión . Ambas teorías derivan un mejor estimador lineal insesgado basado en suposiciones sobre covarianzas , hacen uso del teorema de Gauss-Markov para demostrar la independencia de la estimación y el error, y utilizan fórmulas muy similares. Aun así, son útiles en diferentes marcos: el kriging se realiza para la estimación de una única realización de un campo aleatorio, mientras que los modelos de regresión se basan en múltiples observaciones de un conjunto de datos multivariados.

La estimación de kriging también puede verse como un spline en un espacio de Hilbert de núcleo reproductor , con el núcleo reproductor dado por la función de covarianza. [2] La diferencia con el enfoque kriging clásico es proporcionada por la interpretación: mientras que el spline está motivado por una interpolación de norma mínima basada en una estructura de espacio de Hilbert, el kriging está motivado por un error de predicción cuadrático esperado basado en un modelo estocástico.

El kriging con superficies de tendencia polinomiales es matemáticamente idéntico al ajuste de curvas polinomiales de mínimos cuadrados generalizados .

El kriging también puede entenderse como una forma de optimización bayesiana . [3] El kriging comienza con una distribución previa sobre funciones . Esta distribución previa toma la forma de un proceso gaussiano: las muestras de una función se distribuirán normalmente , donde la covarianza entre dos muestras cualesquiera es la función de covarianza (o kernel ) del proceso gaussiano evaluado en la ubicación espacial de dos puntos. Luego se observa un conjunto de valores, cada valor asociado con una ubicación espacial. Ahora, se puede predecir un nuevo valor en cualquier nueva ubicación espacial combinando la distribución previa gaussiana con una función de verosimilitud gaussiana para cada uno de los valores observados. La distribución posterior resultante también es gaussiana, con una media y una covarianza que se pueden calcular simplemente a partir de los valores observados, su varianza y la matriz kernel derivada de la distribución previa.

Estimador geoestadístico

En los modelos geoestadísticos, los datos muestreados se interpretan como resultado de un proceso aleatorio. El hecho de que estos modelos incorporen incertidumbre en su conceptualización no significa que el fenómeno –el bosque, el acuífero, el yacimiento mineral– sea resultado de un proceso aleatorio, sino que permite construir una base metodológica para la inferencia espacial de cantidades en lugares no observados y cuantificar la incertidumbre asociada al estimador.

En el contexto de este modelo, un proceso estocástico es simplemente una forma de abordar el conjunto de datos recopilados de las muestras. El primer paso en la modulación geoestadística es crear un proceso aleatorio que describa mejor el conjunto de datos observados.

Un valor de localización (denominación genérica de un conjunto de coordenadas geográficas ) se interpreta como una realización de la variable aleatoria . En el espacio , donde se encuentra disperso el conjunto de muestras, existen realizaciones de las variables aleatorias , correlacionadas entre sí.

El conjunto de variables aleatorias constituye una función aleatoria, de la que sólo se conoce una realización: el conjunto de datos observados. Con una única realización de cada variable aleatoria, es teóricamente imposible determinar ningún parámetro estadístico de las variables individuales o de la función. La solución propuesta en el formalismo geoestadístico consiste en suponer diversos grados de estacionariedad en la función aleatoria, con el fin de hacer posible la inferencia de algunos valores estadísticos.

Por ejemplo, si uno supone, basándose en la homogeneidad de las muestras en el área donde se distribuye la variable, la hipótesis de que el primer momento es estacionario (es decir, todas las variables aleatorias tienen la misma media), entonces se está asumiendo que la media puede estimarse mediante la media aritmética de los valores muestreados.

La hipótesis de estacionariedad relacionada con el segundo momento se define de la siguiente manera: la correlación entre dos variables aleatorias depende únicamente de la distancia espacial entre ellas y es independiente de su ubicación. Por lo tanto, si y , entonces:

Para simplificar, definimos y .

Esta hipótesis permite inferir esas dos medidas – el variograma y el covariograma:

dónde:

;
denota el conjunto de pares de observaciones tales que , y es el número de pares en el conjunto.

En este conjunto, y denotan el mismo elemento. Generalmente se utiliza una "distancia aproximada" , implementada utilizando una cierta tolerancia.

Estimación lineal

La inferencia espacial, o estimación, de una cantidad , en una ubicación no observada , se calcula a partir de una combinación lineal de los valores y pesos observados :

Los pesos pretenden resumir dos procedimientos extremadamente importantes en un proceso de inferencia espacial:

Al calcular los pesos , hay dos objetivos en el formalismo geoestadístico: imparcialidad y varianza mínima de la estimación .

Si se grafica la nube de valores reales frente a los valores estimados , el criterio de imparcialidad global, estacionariedad intrínseca o estacionariedad en sentido amplio del campo implica que la media de las estimaciones debe ser igual a la media de los valores reales.

El segundo criterio dice que la media de las desviaciones al cuadrado debe ser mínima, lo que significa que cuando la nube de valores estimados versus la nube de valores reales es más dispersa, el estimador es más impreciso.

Métodos

Dependiendo de las propiedades estocásticas del campo aleatorio y de los distintos grados de estacionariedad asumidos, se pueden deducir diferentes métodos para calcular los pesos, es decir, se aplican diferentes tipos de kriging. Los métodos clásicos son:

Kriging ordinario

El valor desconocido se interpreta como una variable aleatoria ubicada en , así como los valores de las muestras vecinas . El estimador también se interpreta como una variable aleatoria ubicada en , resultado de la combinación lineal de variables.

Kriging busca minimizar el valor cuadrático medio del siguiente error en la estimación , sujeto a la falta de sesgo:

Los dos criterios de calidad mencionados anteriormente ahora pueden expresarse en términos de la media y la varianza de la nueva variable aleatoria :

Falta de sesgo

Dado que la función aleatoria es estacionaria, los pesos deben sumar 1 para garantizar que el modelo sea imparcial. Esto se puede ver de la siguiente manera:

Varianza mínima

Dos estimadores pueden tener , pero la dispersión en torno a su media determina la diferencia entre la calidad de los estimadores. Para encontrar un estimador con varianza mínima, necesitamos minimizar .

Consulte la matriz de covarianza para obtener una explicación detallada.

¿Dónde se encuentran los literales ?

Una vez definido el modelo de covarianza o variograma , o , válido en todo el campo de análisis de , entonces podemos escribir una expresión para la varianza de estimación de cualquier estimador en función de la covarianza entre las muestras y las covarianzas entre las muestras y el punto a estimar:

De esta expresión se pueden sacar algunas conclusiones. La varianza de la estimación:

Sistema de ecuaciones

La solución de este problema de optimización (ver multiplicadores de Lagrange ) da como resultado el sistema kriging :

El parámetro adicional es un multiplicador de Lagrange utilizado en la minimización del error de kriging para respetar la condición de imparcialidad.

Kriging simple

El kriging simple puede verse como la media y la envolvente de los recorridos aleatorios brownianos que pasan por los puntos de datos.

El kriging simple es matemáticamente el más simple, pero el menos general. [9] Supone que se conoce la expectativa del campo aleatorio y se basa en una función de covarianza . Sin embargo, en la mayoría de las aplicaciones ni la expectativa ni la covarianza se conocen de antemano.

Los supuestos prácticos para la aplicación del kriging simple son:

La función de covarianza es una opción de diseño crucial, ya que estipula las propiedades del proceso gaussiano y, por lo tanto, el comportamiento del modelo. La función de covarianza codifica información sobre, por ejemplo, la uniformidad y la periodicidad, que se refleja en la estimación producida. Una función de covarianza muy común es la exponencial al cuadrado, que favorece en gran medida las estimaciones de funciones uniformes. [10] Por esta razón, puede producir estimaciones deficientes en muchas aplicaciones del mundo real, especialmente cuando la función subyacente real contiene discontinuidades y cambios rápidos.

Sistema de ecuaciones

Los pesos de kriging del kriging simple no tienen condición de imparcialidad y están dados por el sistema de ecuaciones de kriging simple :

Esto es análogo a una regresión lineal de por otro lado .

Estimación

La interpolación por kriging simple viene dada por

El error de kriging viene dado por

lo que conduce a la versión generalizada de mínimos cuadrados del teorema de Gauss-Markov (Chiles y Delfiner 1999, p. 159):

Kriging bayesiano

Véase también Caos polinomial bayesiano

Propiedades

Aplicaciones

Aunque el kriging se desarrolló originalmente para aplicaciones en geoestadística, es un método general de interpolación estadística y se puede aplicar en cualquier disciplina a datos muestreados de campos aleatorios que cumplan con los supuestos matemáticos apropiados. Se puede utilizar cuando se han recopilado datos relacionados espacialmente (en 2D o 3D) y se desean estimaciones de datos "de relleno" en las ubicaciones (espacios vacíos) entre las mediciones reales.

Hasta la fecha, el kriging se ha utilizado en una variedad de disciplinas, incluidas las siguientes:

Diseño y análisis de experimentos informáticos

Otro campo de aplicación muy importante y de rápido crecimiento, en ingeniería , es la interpolación de datos que salen como variables de respuesta de simulaciones por computadora deterministas, [28] por ejemplo, simulaciones por método de elementos finitos (FEM). En este caso, kriging se utiliza como una herramienta de metamodelado , es decir, un modelo de caja negra construido sobre un conjunto diseñado de experimentos por computadora . En muchos problemas prácticos de ingeniería, como el diseño de un proceso de conformado de metales , una única simulación FEM puede durar varias horas o incluso algunos días. Por lo tanto, es más eficiente diseñar y ejecutar un número limitado de simulaciones por computadora y luego usar un interpolador kriging para predecir rápidamente la respuesta en cualquier otro punto de diseño. Por lo tanto, kriging se utiliza muy a menudo como un llamado modelo sustituto , implementado dentro de rutinas de optimización . [29] . Los modelos sustitutos basados ​​en kriging también se pueden utilizar en el caso de entradas enteras mixtas [30] .

Véase también

Referencias

  1. ^ Chung, Sang Yong; Venkatramanan, S.; Elzain, Hussam Eldin; Selvam, S.; Prasanna, MV (2019). "Suplemento de datos faltantes en variaciones del nivel de agua subterránea de tipo pico utilizando métodos geoestadísticos". SIG y técnicas geoestadísticas para la ciencia de las aguas subterráneas . Elsevier. págs. 33–41. doi :10.1016/b978-0-12-815413-7.00004-3. ISBN 978-0-12-815413-7.S2CID189989265  .​
  2. ^ Wahba, Grace (1990). Modelos spline para datos observacionales . Vol. 59. SIAM. doi :10.1137/1.9781611970128. ISBN . 978-0-89871-244-5.
  3. ^ Williams, CKI (1998). "Predicción con procesos gaussianos: de la regresión lineal a la predicción lineal y más allá". Aprendizaje en modelos gráficos . págs. 599–621. doi :10.1007/978-94-011-5014-9_23. ISBN 978-94-010-6104-9.
  4. ^ Lee, Se Yoon; Mallick, Bani (2021). "Modelado jerárquico bayesiano: aplicación a los resultados de producción en Eagle Ford Shale del sur de Texas". Sankhya B . 84 : 1–43. doi : 10.1007/s13571-020-00245-8 .
  5. ^ Le Gratiet, Loic; Garnier, Josselin (2014). "Modelo recursivo de co-kriging para el diseño de experimentos informáticos con múltiples niveles de fidelidad". Revista internacional de cuantificación de la incertidumbre . 4 (5): 365–386. doi : 10.1615/Int.J.UncertaintyQuantification.2014006914 . ISSN  2152-5080. S2CID  14157948.
  6. ^ ab Ranftl, Sascha; Melito, Gian Marco; Badeli, Vahid; Reinbacher-Köstinger, Alice; Ellermann, Katrin; Linden, Wolfgang von der (9 de diciembre de 2019). "Sobre el diagnóstico de disección aórtica con cardiografía de impedancia: un marco de estudio de viabilidad bayesiano con datos de simulación de fidelidad múltiple". Actas . 33 (1): 24. doi : 10.3390/proceedings2019033024 . ISSN  2504-3900.
  7. ^ ab Ranftl, Sascha; Melito, Gian Marco; Badeli, Vahid; Reinbacher-Köstinger, Alice; Ellermann, Katrin; von der Linden, Wolfgang (31 de diciembre de 2019). "Cuantificación de la incertidumbre bayesiana con datos de fidelidad múltiple y procesos gaussianos para cardiografía de impedancia de disección aórtica". Entropy . 22 (1): 58. Bibcode :2019Entrp..22...58R. doi : 10.3390/e22010058 . ISSN  1099-4300. PMC 7516489 . PMID  33285833. 
  8. ^ Ranftl, Sascha; von der Linden, Wolfgang (13 de noviembre de 2021). "Análisis sustituto bayesiano y propagación de la incertidumbre". Physical Sciences Forum . 3 (1): 6. arXiv : 2101.04038 . doi : 10.3390/psf2021003006 . ISSN  2673-9984.
  9. ^ Olea, Ricardo A. (1999). Geoestadística para ingenieros y científicos de la Tierra . Kluwer Academic. ISBN 978-1-4615-5001-3.
  10. ^ Rasmussen, Carl Edward; Williams, Christopher KI (23 de noviembre de 2005). Procesos gaussianos para el aprendizaje automático. doi :10.7551/mitpress/3206.001.0001. ISBN 978-0-262-25683-4.
  11. ^ Cressie 1993, Chiles y Delfiner 1999, Wackernagel 1995.
  12. ^ Bayraktar, Hanefi; Sezer, Turalioglu (2005). "Un enfoque basado en Kriging para localizar un sitio de muestreo en la evaluación de la calidad del aire". SERRA . 19 (4): 301–305. Bibcode :2005SERRA..19..301B. doi :10.1007/s00477-005-0234-8. S2CID  122643497.
  13. ^ Chiles, J.-P. y P. Delfiner (1999) Geoestadística, Modelado de incertidumbre espacial , Series de Wiley en probabilidad y estadística.
  14. ^ Zimmerman, DA; De Marsily, G.; Gotway, CA ; Marietta, MG; Axness, CL; Beauheim, RL; Bras, RL; Carrera, J.; Dagan, G.; Davies, PB; Gallegos, DP; Galli, A.; Gómez-Hernández, J.; Grindrod, P.; Gutjahr, AL; Kitanidis, PK; Lavenue, AM; McLaughlin, D.; Neuman, SP; Ramarao, BS; Ravenne, C.; Rubin, Y. (1998). "Una comparación de siete enfoques inversos basados ​​en geoestadística para estimar transmisividades para modelar el transporte advectivo por flujo de agua subterránea" (PDF) . Investigación de recursos hídricos . 34 (6): 1373–1413. Código Bibliográfico :1998WRR....34.1373Z. doi : 10.1029/98WR00003 .
  15. ^ Tonkin, MJ; Larson, SP (2002). "Niveles de agua mediante kriging con una deriva regional lineal y puntual logarítmica". Agua subterránea . 40 (2): 185–193. Código Bibliográfico :2002GrWat..40..185T. doi :10.1111/j.1745-6584.2002.tb02503.x. PMID  11916123. S2CID  23008603.
  16. ^ Journel, AG; Huijbregts, CJ (1978). Geoestadística minera . Londres: Academic Press. ISBN 0-12-391050-1.
  17. ^ Richmond, A. (2003). "Selecciones de mineral económicamente eficientes que incorporan incertidumbre de calidad". Geología matemática . 35 (2): 195–215. doi :10.1023/A:1023239606028. S2CID  116703619.
  18. ^ Goovaerts (1997) Geoestadística para la evaluación de recursos naturales , OUP. ISBN 0-19-511538-4 
  19. ^ Emery, X. (2005). "Kriging multigaussiano simple y ordinario para estimar reservas recuperables". Geología matemática . 37 (3): 295–319. Código Bibliográfico :2005MatGe..37..295E. doi :10.1007/s11004-005-1560-6. S2CID  92993524.
  20. ^ Papritz, A.; Stein, A. (2002). "Predicción espacial mediante kriging lineal". Estadística espacial para teledetección . Teledetección y procesamiento de imágenes digitales. Vol. 1. pág. 83. doi :10.1007/0-306-47647-9_6. ISBN 0-7923-5978-X.
  21. ^ Barris, J.; Garcia Almirall, P. (2010). "Una función de densidad del valor de tasación" (PDF) . European Real Estate Society .
  22. ^ Oghenekarho Okobiah, Saraju Mohanty y Elias Kougianos (2013) Optimización rápida de diseño inspirada en geoestadística de un sensor térmico nano-CMOS . Archivado el 14 de julio de 2014 en Wayback Machine , IET Circuits, Devices and Systems (CDS), vol. 7, n.º 5, septiembre de 2013, págs. 253-262.
  23. ^ Koziel, Slawomir (2011). "Modelado preciso de dispositivos de microondas utilizando sustitutos de mapeo espacial corregidos por kriging". Revista internacional de modelado numérico: redes electrónicas, dispositivos y campos . 25 : 1–14. doi :10.1002/jnm.803. S2CID  62683207.
  24. ^ Pastorello, Nicola (2014). "El sondeo SLUGGS: explorando los gradientes de metalicidad de galaxias cercanas de tipo temprano hasta grandes radios". Monthly Notices of the Royal Astronomical Society . 442 (2): 1003–1039. arXiv : 1405.2338 . Bibcode :2014MNRAS.442.1003P. doi : 10.1093/mnras/stu937 . S2CID  119221897.
  25. ^ Foster, Caroline; Pastorello, Nicola; Roediger, Joel; Brodie, Jean; Forbes, Duncan; Kartha, Sreeja; Pota, Vincenzo; Romanowsky, Aaron; Spitler, Lee; Strader, Jay; Usher, Christopher; Arnold, Jacob (2016). "El sondeo SLUGGS: cinemática estelar, cinemetría y tendencias en grandes radios en 25 galaxias de tipo temprano". Monthly Notices of the Royal Astronomical Society . 457 (1): 147–171. arXiv : 1512.06130 . Código Bibliográfico :2016MNRAS.457..147F. doi : 10.1093/mnras/stv2947 . S2CID  53472235.
  26. ^ Bellstedt, Sabine; Forbes, Duncan; Foster, Caroline; Romanowsky, Aaron; Brodie, Jean; Pastorello, Nicola; Alabi, Adebusola; Villaume, Alexa (2017). "El sondeo SLUGGS: utilizando cinemática estelar extendida para desentrañar las historias de formación de galaxias S) de baja masa". Monthly Notices of the Royal Astronomical Society . 467 (4): 4540–4557. arXiv : 1702.05099 . Código Bibliográfico :2017MNRAS.467.4540B. doi : 10.1093/mnras/stx418 . S2CID  54521046.
  27. ^ Lee, Se Yoon; Mallick, Bani (2021). "Modelado jerárquico bayesiano: aplicación a los resultados de producción en Eagle Ford Shale del sur de Texas". Sankhya B . 84 : 1–43. doi : 10.1007/s13571-020-00245-8 .
  28. ^ Sacks, J.; Welch, W. J.; Mitchell, T. J.; Wynn, HP (1989). "Diseño y análisis de experimentos informáticos". Ciencia estadística . 4 (4): 409–435. doi : 10.1214/ss/1177012413 . JSTOR  2245858.
  29. ^ Strano, M. (marzo de 2008). "Una técnica para la optimización FEM bajo restricciones de confiabilidad de variables de proceso en el conformado de chapa metálica". Revista internacional de conformado de materiales . 1 (1): 13–20. doi :10.1007/s12289-008-0001-8. S2CID  136682565.
  30. ^ Saves, Paul; Diouane, Youssef; Bartoli, Nathalie; Lefebvre, Thierry; Morlier, Joseph (2023). "Un núcleo de correlación categórico mixto para el proceso gaussiano". Neurocomputing . 550 : 126472. arXiv : 2211.08262 . doi :10.1016/j.neucom.2023.126472.

Lectura adicional

Referencias históricas

  1. Chilès, Jean-Paul; Desassis, Nicolas (2018). "Cincuenta años de kriging". Manual de geociencias matemáticas . Cham: Springer International Publishing. págs. 589–612. doi :10.1007/978-3-319-78999-6_29. ISBN . 978-3-319-78998-9.S2CID125362741  .​
  2. Agterberg, FP, Geomatemáticas, antecedentes matemáticos y aplicaciones en geociencias , Elsevier Scientific Publishing Company, Ámsterdam, 1974.
  3. Cressie, NAC, Los orígenes del kriging, Geología matemática , v. 22, págs. 239–252, 1990.
  4. Krige, DG, Un enfoque estadístico para algunas valoraciones de minas y problemas afines en Witwatersrand , tesis de maestría de la Universidad de Witwatersrand, 1951.
  5. Link, RF y Koch, GS, Diseños experimentales y análisis de superficies de tendencia, Geoestadística , Un coloquio, Plenum Press, Nueva York, 1970.
  6. Matheron, G., "Principios de geoestadística", Economic Geology , 58, págs. 1246–1266, 1963.
  7. Matheron, G., "Las funciones aleatorias intrínsecas y sus aplicaciones", Adv. Appl. Prob. , 5, págs. 439–468, 1973.
  8. Merriam, DF (editor), Geoestadística , un coloquio, Plenum Press, Nueva York, 1970.
  9. Mockus, J., "Sobre los métodos bayesianos para la búsqueda del extremo". Actas de la Conferencia Técnica de la IFIP. 1974.

Libros