stringtranslate.com

Aproximación de Vecchia

La aproximación de Vecchia es una técnica de aproximación de procesos gaussianos desarrollada originalmente por Aldo Vecchia, estadístico del Servicio Geológico de Estados Unidos . [1] Es uno de los primeros intentos de utilizar procesos gaussianos en entornos de alta dimensión. Desde entonces se ha generalizado ampliamente dando lugar a muchas aproximaciones contemporáneas.

Intuición

Una distribución de probabilidad conjunta para eventos , y , denotada , se puede expresar como

La aproximación de Vecchia toma la forma, por ejemplo,

y es preciso cuando los eventos y están cerca del conocimiento dado de condicionalmente independiente . Por supuesto, se podría haber elegido alternativamente la aproximación

y, por lo tanto, el uso de la aproximación requiere cierto conocimiento de qué eventos son casi condicionalmente independientes dados otros. Además, podríamos haber elegido un orden diferente, por ejemplo

Afortunadamente, en muchos casos existen buenas heurísticas que toman decisiones sobre cómo construir la aproximación.

Más técnicamente, las versiones generales de la aproximación conducen a un factor de Cholesky escaso de la matriz de precisión. El uso de la factorización estándar de Cholesky produce entradas que pueden interpretarse [2] como correlaciones condicionales con ceros que indican que no hay independencia (ya que el modelo es gaussiano). Estas relaciones de independencia se pueden expresar alternativamente utilizando modelos gráficos y existen teoremas que vinculan la estructura del gráfico y el orden de los vértices con ceros en el factor de Cholesky. En particular, se sabe [3] que las independencias que están codificadas en un gráfico moral conducen a factores de Cholesky de la matriz de precisión que no tienen relleno .

Descripción formal

El problema

Sea un proceso gaussiano indexado por con función media y función de covarianza . Supongamos que es un subconjunto finito de y es un vector de valores de evaluados en , es decir, para . Supongamos además que se observa dónde con . En este contexto, las dos tareas de inferencia más comunes incluyen evaluar la probabilidad

o hacer predicciones de valores de for y , es decir, calcular

Formulación original

El método Vecchia original comienza con la observación de que la densidad conjunta de observaciones se puede escribir como un producto de distribuciones condicionales.

La aproximación de Vecchia supone en cambio que para algunos

Vecchia también sugirió que la aproximación anterior se aplique a observaciones que se reordenan lexicográficamente utilizando sus coordenadas espaciales. Si bien su método simple tiene muchas debilidades, redujo la complejidad computacional a . Muchas de sus deficiencias fueron abordadas por las generalizaciones posteriores.

formulación general

Si bien es conceptualmente simple, el supuesto de la aproximación de Vecchia a menudo resulta bastante restrictivo e inexacto. [4] Esto inspiró importantes generalizaciones y mejoras introducidas en la versión básica a lo largo de los años: la inclusión de variables latentes, un condicionamiento más sofisticado y un mejor ordenamiento. Se pueden describir diferentes casos especiales de la aproximación general de Vecchia en términos de cómo se seleccionan estos tres elementos. [5]

Variables latentes

Para describir extensiones del método Vecchia en su forma más general, defina y observe que se cumple lo mismo que en la sección anterior.

porque dadas todas las demás variables son independientes de .

Realizar pedidos

Se ha observado ampliamente que el orden lexicográfico original basado en coordenadas cuando es bidimensional produce malos resultados. [6] Más recientemente se han propuesto otros ordenamientos, algunos de los cuales aseguran que los puntos se ordenen de forma casi aleatoria. Altamente escalables, se ha demostrado que también mejoran drásticamente la precisión. [4]

Acondicionamiento

De manera similar a la versión básica descrita anteriormente, para un orden dado, una aproximación general de Vecchia se puede definir como

dónde . Dado que se deduce que desde sugiere que los términos se reemplacen con . Sin embargo, resulta que a veces el condicionamiento de algunas de las observaciones aumenta la escasez del factor de Cholesky de la matriz de precisión de . Por lo tanto, uno podría considerar conjuntos y tales que y expresar como

Se han propuesto múltiples métodos de elección , en particular el proceso gaussiano del vecino más cercano (NNGP), [7] el proceso gaussiano mallado [8] y los enfoques de aproximación de resolución múltiple (MRA) que utilizan Vecchia estándar y Sparse General Vecchia donde ambos y no están vacíos. [5]

Software

Se han desarrollado varios paquetes que implementan algunas variantes de la aproximación de Vecchia.

Notas

  1. ^ Vecchia, AV (1988). "Estimación e identificación de modelos para procesos espaciales continuos". Revista de la Royal Statistical Society, Serie B (Metodológica) . 50 (2): 297–312. doi :10.1111/j.2517-6161.1988.tb01729.x.
  2. ^ Pourahmadi, M. (2007). "Descomposiciones de Cholesky y estimación de una matriz de covarianza: ortogonalidad de los parámetros de correlación de varianza". Biometrika . 94 (4): 1006-1013. doi :10.1093/biomet/asm073. ISSN  0006-3444.
  3. ^ Khare, Kshitij; Rajaratnam, Bala (2011). "Distribuciones de Wishart para modelos de gráficos de covarianza descomponibles". Los anales de la estadística . 39 (1): 514–555. arXiv : 1103.1768 . doi : 10.1214/10-AOS841 . ISSN  0090-5364.
  4. ^ ab Guinness, Joseph (2018). "Métodos de permutación y agrupación para afinar las aproximaciones del proceso gaussiano". Tecnometría . 60 (4): 415–429. doi :10.1080/00401706.2018.1437476. ISSN  0040-1706. PMC 6707751 . PMID  31447491. 
  5. ^ ab Katzfuss, Matías; Guinness, José (2021). "Un marco general para las aproximaciones de Vecchia de los procesos gaussianos". Ciencia estadística . 36 . arXiv : 1708.06302 . doi :10.1214/19-STS755. S2CID  88522976.
  6. ^ Sudipto Banerjee; Bradley P. Carlin; Alan E. Gelfand (12 de septiembre de 2014). Modelado y análisis jerárquico de datos espaciales, segunda edición. Prensa CRC. ISBN 978-1-4398-1917-3.
  7. ^ Datta, Abhirup; Banerjee, Sudipto; Finley, Andrés; Gelfand, Alan (2016). "Modelos de procesos gaussianos jerárquicos del vecino más cercano para grandes datos espaciales". Revista de la Asociación Estadounidense de Estadística . 111 (514): 800–812. doi :10.1080/01621459.2015.1044091. PMC 5927603 . PMID  29720777. 
  8. ^ Peruzzi, Michele; Banerjee, Sudipto; Finley, Andrés (2020). "Modelado geoestadístico bayesiano altamente escalable mediante procesos gaussianos mallados en dominios particionados". Revista de la Asociación Estadounidense de Estadística . 117 (538): 969–982. arXiv : 2003.11208 . doi : 10.1080/01621459.2020.1833889. PMC 9354857 . PMID  35935897.