stringtranslate.com

kriging

Ejemplo de interpolación de datos unidimensionales mediante kriging, con intervalos creíbles . Los cuadrados indican la ubicación de los datos. La interpolación kriging, que se muestra en rojo, recorre la media de los intervalos creíbles normalmente distribuidos que se muestran en gris. La curva discontinua muestra una spline suave, pero que se aleja significativamente de los valores esperados dados por esos medios.

En estadística , originalmente en geoestadística , kriging o Kriging , ( / ˈk r ɡ ɪ ŋ / ), también conocido como regresión del proceso gaussiano , es un método de interpolación basado en el proceso gaussiano regido por covarianzas previas . Bajo los supuestos adecuados de lo anterior, el kriging proporciona la mejor predicción lineal insesgada (BLUP) en ubicaciones no muestreadas. [1] Es posible que los métodos de interpolación basados ​​en otros criterios como la suavidad (p. ej., suavizado spline ) no produzcan el BLUP. El método se utiliza ampliamente en el ámbito del análisis espacial y los experimentos informáticos . La técnica también se conoce como predicción de Wiener-Kolmogorov , en honor a Norbert Wiener y Andrey Kolmogorov .

La base teórica del método fue desarrollada por el matemático francés Georges Matheron en 1960, basándose en la tesis de maestría de Danie G. Krige , el trazador pionero de las leyes de oro promedio ponderadas por distancia en el complejo de arrecifes de Witwatersrand en Sudáfrica . Krige intentó estimar la distribución más probable del oro basándose en muestras de algunos pozos. El verbo inglés es krige y el sustantivo más común es kriging . La palabra a veces se escribe con mayúscula como Kriging en la literatura.

Aunque requiere mucha computación en su formulación básica, el kriging se puede escalar a problemas más grandes utilizando varios métodos de aproximación .

Principios fundamentales

Términos y técnicas relacionados

Kriging predice el valor de una función en un punto dado calculando un promedio ponderado de los valores conocidos de la función en las proximidades del punto. El método está estrechamente relacionado con el análisis de regresión . Ambas teorías derivan un mejor estimador lineal insesgado basado en supuestos sobre covarianzas , utilizan el teorema de Gauss-Markov para demostrar la independencia de la estimación y el error, y utilizan fórmulas muy similares. Aun así, son útiles en diferentes marcos: el kriging se realiza para la estimación de una única realización de un campo aleatorio, mientras que los modelos de regresión se basan en múltiples observaciones de un conjunto de datos multivariados.

La estimación de kriging también puede verse como una spline en un espacio de Hilbert del núcleo reproductor , con el núcleo reproductor dado por la función de covarianza. [2] La diferencia con el enfoque de kriging clásico la proporciona la interpretación: mientras que el spline está motivado por una interpolación de norma mínima basada en una estructura de espacio de Hilbert, el kriging está motivado por un error de predicción cuadrático esperado basado en un modelo estocástico.

El kriging con superficies de tendencia polinomiales es matemáticamente idéntico al ajuste de curvas polinomiales de mínimos cuadrados generalizados .

Kriging también puede entenderse como una forma de optimización bayesiana . [3] Kriging comienza con una distribución previa de funciones . Esto a priori toma la forma de un proceso gaussiano: las muestras de una función se distribuirán normalmente , donde la covarianza entre dos muestras cualesquiera es la función de covarianza (o núcleo ) del proceso gaussiano evaluado en la ubicación espacial de dos puntos. Luego se observa un conjunto de valores, cada valor asociado con una ubicación espacial. Ahora, se puede predecir un nuevo valor en cualquier ubicación espacial nueva combinando el valor previo gaussiano con una función de probabilidad gaussiana para cada uno de los valores observados. La distribución posterior resultante también es gaussiana, con una media y una covarianza que pueden calcularse simplemente a partir de los valores observados, su varianza y la matriz central derivada de la anterior.

Estimador geoestadístico

En los modelos geoestadísticos, los datos muestreados se interpretan como el resultado de un proceso aleatorio. El hecho de que estos modelos incorporen incertidumbre en su conceptualización no significa que el fenómeno –el bosque, el acuífero, el depósito mineral– haya resultado de un proceso aleatorio, sino que permite construir una base metodológica para la inferencia espacial de cantidades en ubicaciones no observadas y cuantificar la incertidumbre asociada con el estimador.

Un proceso estocástico es, en el contexto de este modelo, simplemente una forma de abordar el conjunto de datos recopilados de las muestras. El primer paso en la modulación geoestadística es crear un proceso aleatorio que describa mejor el conjunto de datos observados.

Un valor de ubicación (denominación genérica de un conjunto de coordenadas geográficas ) se interpreta como una realización de la variable aleatoria . En el espacio donde se dispersa el conjunto de muestras, existen realizaciones de las variables aleatorias , correlacionadas entre sí.

El conjunto de variables aleatorias constituye una función aleatoria, de la que sólo se conoce una realización: el conjunto de datos observados. Con una sola realización de cada variable aleatoria, es teóricamente imposible determinar cualquier parámetro estadístico de las variables individuales o de la función. La solución propuesta en el formalismo geoestadístico consiste en asumir varios grados de estacionariedad en la función aleatoria, para hacer posible la inferencia de algunos valores estadísticos.

Por ejemplo, si se supone, basándose en la homogeneidad de las muestras en el área donde se distribuye la variable, la hipótesis de que el primer momento es estacionario (es decir, todas las variables aleatorias tienen la misma media), entonces se supone que la media se puede estimar. por la media aritmética de los valores muestreados.

La hipótesis de estacionariedad relacionada con el segundo momento se define de la siguiente manera: la correlación entre dos variables aleatorias depende únicamente de la distancia espacial entre ellas y es independiente de su ubicación. Así, si y , entonces:

Por simplicidad, definimos y .

Esta hipótesis permite inferir esas dos medidas: el variograma y el covariograma:

dónde:

;
denota el conjunto de pares de observaciones tales que y es el número de pares en el conjunto.

En este conjunto, y denota el mismo elemento. Generalmente se utiliza una "distancia aproximada", implementada utilizando una cierta tolerancia.

Estimación lineal

La inferencia espacial, o estimación, de una cantidad , en una ubicación no observada , se calcula a partir de una combinación lineal de los valores y pesos observados :

Los pesos pretenden resumir dos procedimientos extremadamente importantes en un proceso de inferencia espacial:

Al calcular los pesos , existen dos objetivos en el formalismo geoestadístico: insesgo y varianza mínima de estimación .

Si la nube de valores reales se traza contra los valores estimados , el criterio de insesgo global, estacionariedad intrínseca o estacionariedad de sentido amplio del campo, implica que la media de las estimaciones debe ser igual a la media de los valores reales.

El segundo criterio dice que la media de las desviaciones al cuadrado debe ser mínima, lo que significa que cuando la nube de valores estimados versus la nube de valores reales está más dispersa, el estimador es más impreciso.

Métodos

Dependiendo de las propiedades estocásticas del campo aleatorio y de los distintos grados de estacionariedad supuestos, se pueden deducir diferentes métodos para calcular los pesos, es decir, se aplican diferentes tipos de kriging. Los métodos clásicos son:

kriging ordinario

El valor desconocido se interpreta como una variable aleatoria ubicada en , así como los valores de las muestras vecinas . El estimador también se interpreta como una variable aleatoria ubicada en , resultado de la combinación lineal de variables.

Kriging busca minimizar el valor cuadrático medio del siguiente error en la estimación , sujeto a la falta de sesgo:

Los dos criterios de calidad mencionados anteriormente ahora se pueden expresar en términos de la media y la varianza de la nueva variable aleatoria :

Falta de sesgo

Dado que la función aleatoria es estacionaria, los pesos deben sumar 1 para garantizar que el modelo sea insesgado. Esto se puede ver de la siguiente manera:

Variación mínima

Dos estimadores pueden tener , pero la dispersión alrededor de su media determina la diferencia entre la calidad de los estimadores. Para encontrar un estimador con varianza mínima, necesitamos minimizar .

Consulte la matriz de covarianza para obtener una explicación detallada.

donde los literales representan

Una vez definido el modelo de covarianza o variograma , válido en todo campo de análisis , entonces podemos escribir una expresión para la varianza de estimación de cualquier estimador en función de la covarianza entre las muestras y las covarianzas entre las muestras y el punto a estimar. :

De esta expresión se pueden extraer algunas conclusiones. La varianza de la estimación:

Sistema de ecuaciones

Resolver este problema de optimización (ver multiplicadores de Lagrange ) da como resultado el sistema kriging :

El parámetro adicional es un multiplicador de Lagrange utilizado en la minimización del error de kriging para cumplir con la condición de imparcialidad.

kriging sencillo

El kriging simple puede verse como la media y la envolvente de los recorridos aleatorios brownianos que pasan por los puntos de datos.

El kriging simple es matemáticamente el más simple, pero el menos general. [9] Asume que se conoce la expectativa del campo aleatorio y se basa en una función de covarianza . Sin embargo, en la mayoría de las aplicaciones ni la expectativa ni la covarianza se conocen de antemano.

Los supuestos prácticos para la aplicación del kriging simple son:

La función de covarianza es una elección de diseño crucial, ya que estipula las propiedades del proceso gaussiano y, por tanto, el comportamiento del modelo. La función de covarianza codifica información sobre, por ejemplo, suavidad y periodicidad, que se refleja en la estimación producida. Una función de covarianza muy común es la exponencial al cuadrado, que favorece en gran medida las estimaciones suaves de la función. [10] Por esta razón, puede producir estimaciones deficientes en muchas aplicaciones del mundo real, especialmente cuando la verdadera función subyacente contiene discontinuidades y cambios rápidos.

Sistema de ecuaciones

Los pesos de kriging del kriging simple no tienen condición de insesgamiento y están dados por el sistema de ecuaciones de kriging simple :

Esto es análogo a una regresión lineal de, por otro lado .

Estimacion

La interpolación por kriging simple viene dada por

El error de kriging viene dado por

lo que conduce a la versión generalizada de mínimos cuadrados del teorema de Gauss-Markov (Chiles y Delfiner 1999, p. 159):

kriging bayesiano

Véase también Caos polinomial bayesiano

Propiedades

Aplicaciones

Aunque kriging se desarrolló originalmente para aplicaciones en geoestadística, es un método general de interpolación estadística y se puede aplicar dentro de cualquier disciplina para muestrear datos de campos aleatorios que satisfagan los supuestos matemáticos apropiados. Se puede utilizar cuando se han recopilado datos relacionados espacialmente (en 2-D o 3-D) y se desean estimaciones de datos de "relleno" en las ubicaciones (espacios espaciales) entre las mediciones reales.

Hasta la fecha, el kriging se ha utilizado en una variedad de disciplinas, incluidas las siguientes:

Diseño y análisis de experimentos informáticos.

Otro campo de aplicación muy importante y de rápido crecimiento en ingeniería es la interpolación de datos que surgen como variables de respuesta de simulaciones deterministas por computadora, [28] por ejemplo, simulaciones por el método de elementos finitos (FEM). En este caso, el kriging se utiliza como una herramienta de metamodelado , es decir, un modelo de caja negra construido sobre un conjunto diseñado de experimentos por computadora . En muchos problemas prácticos de ingeniería, como el diseño de un proceso de conformado de metales , una sola simulación FEM puede durar varias horas o incluso unos días. Por lo tanto, es más eficiente diseñar y ejecutar un número limitado de simulaciones por computadora y luego usar un interpolador kriging para predecir rápidamente la respuesta en cualquier otro punto de diseño. Por lo tanto, Kriging se utiliza muy a menudo como el llamado modelo sustituto , implementado dentro de rutinas de optimización . [29]

Ver también

Referencias

  1. ^ Chung, Sang Yong; Venkatramanan, S.; Elzain, Hussam Eldin; Selvam, S.; Prasanna, MV (2019). "Suplemento de datos faltantes en las variaciones del nivel del agua subterránea del tipo de pico utilizando métodos geoestadísticos". SIG y técnicas geoestadísticas para la ciencia de las aguas subterráneas . Elsevier. págs. 33–41. doi :10.1016/b978-0-12-815413-7.00004-3. ISBN 978-0-12-815413-7. S2CID  189989265.
  2. ^ Wahba, gracia (1990). Modelos spline para datos observacionales . vol. 59. SIAM. doi :10.1137/1.9781611970128. ISBN 978-0-89871-244-5.
  3. ^ Williams, CKI (1998). "Predicción con procesos gaussianos: de la regresión lineal a la predicción lineal y más". Aprendizaje en Modelos Gráficos . págs. 599–621. doi :10.1007/978-94-011-5014-9_23. ISBN 978-94-010-6104-9.
  4. ^ Lee, Se Yoon; Mallick, Bani (2021). "Modelado jerárquico bayesiano: aplicación a resultados de producción en Eagle Ford Shale del sur de Texas". Sankhya B. 84 : 1–43. doi : 10.1007/s13571-020-00245-8 .
  5. ^ Le Gratiet, Loic; Garnier, Josselin (2014). "Modelo recursivo de co-kriging para el diseño de experimentos informáticos con múltiples niveles de fidelidad". Revista internacional para la cuantificación de la incertidumbre . 4 (5): 365–386. doi : 10.1615/Int.J.UncertaintyQuantification.2014006914 . ISSN  2152-5080. S2CID  14157948.
  6. ^ ab Ranftl, Sascha; Melito, Gian Marco; Badeli, Vahid; Reinbacher-Köstinger, Alice; Ellermann, Katrin; Linden, Wolfgang von der (9 de diciembre de 2019). "Sobre el diagnóstico de disección aórtica con cardiografía de impedancia: un marco de estudio de viabilidad bayesiano con datos de simulación de fidelidad múltiple". Procedimientos . 33 (1): 24. doi : 10.3390/procedimientos2019033024 . ISSN  2504-3900.
  7. ^ ab Ranftl, Sascha; Melito, Gian Marco; Badeli, Vahid; Reinbacher-Köstinger, Alice; Ellermann, Katrin; von der Linden, Wolfgang (31 de diciembre de 2019). "Cuantificación de la incertidumbre bayesiana con datos de fidelidad múltiple y procesos gaussianos para la cardiografía de impedancia de la disección aórtica". Entropía . 22 (1): 58. Bibcode : 2019Entrp..22...58R. doi : 10.3390/e22010058 . ISSN  1099-4300. PMC 7516489 . PMID  33285833. 
  8. ^ Ranftl, Sascha; Von der Linden, Wolfgang (13 de noviembre de 2021). "Análisis sustituto bayesiano y propagación de la incertidumbre". Foro de Ciencias Físicas . 3 (1): 6. arXiv : 2101.04038 . doi : 10.3390/psf2021003006 . ISSN  2673-9984.
  9. ^ Olea, Ricardo A. (1999). Geoestadística para ingenieros y geocientíficos . Académico Kluwer. ISBN 978-1-4615-5001-3.
  10. ^ Rasmussen, Carl Edward; Williams, Christopher KI (23 de noviembre de 2005). Procesos gaussianos para el aprendizaje automático. doi :10.7551/mitpress/3206.001.0001. ISBN 978-0-262-25683-4.
  11. ^ Cressie 1993, Chiles y Delfiner 1999, Wackernagel 1995.
  12. ^ Bayraktar, Hanefi; Sezer, Turalioglu (2005). "Un enfoque basado en Kriging para localizar un sitio de muestreo en la evaluación de la calidad del aire". SERRA . 19 (4): 301–305. doi :10.1007/s00477-005-0234-8. S2CID  122643497.
  13. ^ Chiles, J.-P. y P. Delfiner (1999) Geoestadística, Modelado de incertidumbre espacial , Serie Wiley en probabilidad y estadística.
  14. ^ Zimmerman, fiscal del distrito; De Marsily, G.; Gotway, California ; Marieta, MG; Axness, CL; Beauheim, RL; Sujetadores, RL; Carrera, J.; Dagán, G.; Davies, PB; Gallegos, DP; Galli, A.; Gómez-Hernández, J.; Grindrod, P.; Gutjahr, AL; Kitanidis, PK; Lavenue, AM; McLaughlin, D.; Neuman, SP; Ramarao, BS; Rávena, C.; Rubin, Y. (1998). "Una comparación de siete enfoques inversos con base geoestadística para estimar las transmisividades para modelar el transporte advectivo por el flujo de agua subterránea" (PDF) . Investigación de recursos hídricos . 34 (6): 1373-1413. Código Bib : 1998WRR....34.1373Z. doi : 10.1029/98WR00003 .
  15. ^ Tonkin, MJ; Larson, SP (2002). "Kriging de niveles de agua con una deriva regional lineal y logarítmica puntual". Agua Subterránea . 40 (2): 185-193. Código Bib : 2002GrWat..40..185T. doi :10.1111/j.1745-6584.2002.tb02503.x. PMID  11916123. S2CID  23008603.
  16. ^ Diario, AG; Huijbregts, CJ (1978). Geoestadística Minera . Londres: Academic Press. ISBN 0-12-391050-1.
  17. ^ Richmond, A. (2003). "Selecciones de minerales financieramente eficientes que incorporan incertidumbre sobre la ley". Geología Matemática . 35 (2): 195–215. doi :10.1023/A:1023239606028. S2CID  116703619.
  18. ^ Goovaerts (1997) Geoestadística para la evaluación de recursos naturales , OUP. ISBN 0-19-511538-4 
  19. ^ Emery, X. (2005). "Kriging multigaussiano simple y ordinario para estimar reservas recuperables". Geología Matemática . 37 (3): 295–319. doi :10.1007/s11004-005-1560-6. S2CID  92993524.
  20. ^ Papritz, A.; Stein, A. (2002). "Predicción espacial mediante kriging lineal". Estadísticas Espaciales para la Teledetección . Teledetección y Procesamiento Digital de Imágenes. vol. 1. pág. 83. doi :10.1007/0-306-47647-9_6. ISBN 0-7923-5978-X.
  21. ^ Barris, J.; García Almirall, P. (2010). «Una función de densidad del valor de tasación» (PDF) . Sociedad Europea de Bienes Raíces .
  22. ^ Oghenekarho Okobiah, Saraju Mohanty y Elias Kougianos (2013) Optimización rápida del diseño de un sensor térmico nano-CMOS inspirada en la geoestadística . Archivado el 14 de julio de 2014 en Wayback Machine , Circuitos, dispositivos y sistemas (CDS) IET, vol. 7, núm. 5, septiembre de 2013, págs.
  23. ^ Koziel, Slawomir (2011). "Modelado preciso de dispositivos de microondas utilizando sustitutos de mapeo espacial corregidos por kriging". Revista internacional de modelado numérico: redes, dispositivos y campos electrónicos . 25 : 1–14. doi :10.1002/jnm.803. S2CID  62683207.
  24. ^ Pastorello, Nicola (2014). "El estudio SLUGGS: exploración de los gradientes de metalicidad de galaxias cercanas de tipo temprano a radios grandes". Avisos mensuales de la Real Sociedad Astronómica . 442 (2): 1003–1039. arXiv : 1405.2338 . Código Bib : 2014MNRAS.442.1003P. doi :10.1093/mnras/stu937. S2CID  119221897.
  25. ^ Fomentar, Carolina; Pastorello, Nicola; Roediger, Joel; Brodie, Jean; Forbes, Duncan; Kartha, Sreeja; Pota, Vincenzo; Romanowsky, Aarón; Spitler, Lee; Strader, Jay; Usher, Cristóbal; Arnold, Jacob (2016). "El estudio SLUGGS: cinemática estelar, cinemetría y tendencias en grandes radios en 25 galaxias de tipo temprano". Avisos mensuales de la Real Sociedad Astronómica . 457 (1): 147-171. arXiv : 1512.06130 . Código Bib : 2016MNRAS.457..147F. doi :10.1093/mnras/stv2947. S2CID  53472235.
  26. ^ Bellstedt, Sabine; Forbes, Duncan; Fomentar, Carolina; Romanowsky, Aarón; Brodie, Jean; Pastorello, Nicola; Alabi, Adebusola; Villaume, Alexa (2017). "El estudio SLUGGS: uso de cinemática estelar extendida para desenredar las historias de formación de galaxias S) de baja masa". Avisos mensuales de la Real Sociedad Astronómica . 467 (4): 4540–4557. arXiv : 1702.05099 . Código bibliográfico : 2017MNRAS.467.4540B. doi :10.1093/mnras/stx418. S2CID  54521046.
  27. ^ Lee, Se Yoon; Mallick, Bani (2021). "Modelado jerárquico bayesiano: aplicación a resultados de producción en Eagle Ford Shale del sur de Texas". Sankhya B. 84 : 1–43. doi : 10.1007/s13571-020-00245-8 .
  28. ^ Sacos, J.; Welch, WJ; Mitchell, TJ; Wynn, HP (1989). "Diseño y análisis de experimentos informáticos". Ciencia estadística . 4 (4): 409–435. doi : 10.1214/ss/1177012413 . JSTOR  2245858.
  29. ^ Strano, M. (marzo de 2008). "Una técnica para la optimización FEM bajo restricciones de confiabilidad de las variables del proceso en el conformado de chapa". Revista internacional de formación de materiales . 1 (1): 13–20. doi :10.1007/s12289-008-0001-8. S2CID  136682565.

Otras lecturas

Referencias históricas

  1. Chilès, Jean-Paul; Desassis, Nicolás (2018). "Cincuenta años de Kriging". Manual de geociencias matemáticas . Cham: Editorial Internacional Springer. págs. 589–612. doi :10.1007/978-3-319-78999-6_29. ISBN 978-3-319-78998-9. S2CID  125362741.
  2. Agterberg, FP, Geomatemáticas, antecedentes matemáticos y aplicaciones de geociencias , Elsevier Scientific Publishing Company, Ámsterdam, 1974.
  3. Cressie, NAC, Los orígenes del kriging, Geología matemática , v. 22, págs. 239–252, 1990.
  4. Krige, DG, Un enfoque estadístico para algunas valoraciones de minas y problemas relacionados en Witwatersrand , tesis de maestría de la Universidad de Witwatersrand, 1951.
  5. Link, RF y Koch, GS, Diseños experimentales y análisis de tendencias de superficie, Geoestadística , coloquio, Plenum Press, Nueva York, 1970.
  6. Matheron, G., "Principios de geoestadística", Geología económica , 58, págs. 1246-1266, 1963.
  7. Matheron, G., "Las funciones aleatorias intrínsecas y sus aplicaciones", Adv. Aplica. Prob. , 5, págs. 439–468, 1973.
  8. Merriam, DF (editor), Geostatistics , coloquio, Plenum Press, Nueva York, 1970.

Libros