La ponderación de distancia inversa ( IDW ) es un tipo de método determinista para la interpolación multivariante con un conjunto conocido de puntos dispersos. Los valores asignados a puntos desconocidos se calculan con un promedio ponderado de los valores disponibles en los puntos conocidos. Este método también se puede utilizar para crear matrices de ponderaciones espaciales en análisis de autocorrelación espacial (por ejemplo, I de Moran ). [1]
El nombre dado a este tipo de método fue motivado por el promedio ponderado aplicado, ya que recurre a la inversa de la distancia a cada punto conocido ("cantidad de proximidad") al momento de asignar pesos.
El resultado esperado es una asignación discreta de la función desconocida en una región de estudio:
¿Dónde está la región de estudio?
El conjunto de puntos de datos conocidos se puede describir como una lista de tuplas :
La función debe ser "suave" (continua y diferenciable en algún momento), exacta ( ) y cumplir con las expectativas intuitivas del usuario sobre el fenómeno investigado. Además, la función debe ser adecuada para una aplicación informática a un coste razonable (hoy en día, una implementación básica probablemente hará uso de recursos paralelos ).
En el Laboratorio de Gráficos Computacionales y Análisis Espacial de Harvard, a partir de 1965, un variado grupo de científicos convergió para repensar, entre otras cosas, lo que hoy se denomina sistemas de información geográfica . [2]
El impulsor del laboratorio, Howard Fisher , concibió un programa de mapeo computacional mejorado al que llamó SYMAP, y desde el principio Fisher quiso mejorar la interpolación. Mostró a los estudiantes de primer año de Harvard College su trabajo sobre SYMAP, y muchos de ellos participaron en eventos del laboratorio. Un estudiante de primer año, Donald Shepard, decidió revisar la interpolación en SYMAP, lo que dio como resultado su famoso artículo de 1968. [3]
El algoritmo de Shepard también estuvo influenciado por el enfoque teórico de William Warntz y otros en el laboratorio que trabajaban con análisis espacial. Realizó una serie de experimentos con el exponente de la distancia y optó por algo más cercano al modelo de gravedad (exponente de -2). Shepard implementó no solo la ponderación de distancia inversa básica, sino que también permitió barreras (permeables y absolutas) para la interpolación.
En esa época, otros centros de investigación trabajaban en interpolación, en particular la Universidad de Kansas y su programa SURFACE II. Aun así, las características de SYMAP eran de última generación, a pesar de que había sido programado por un estudiante universitario.
Dado un conjunto de puntos de muestra , la función de interpolación IDW se define como:
dónde
es una función de ponderación IDW simple, según lo definido por Shepard, [3] x denota un punto interpolado (arbitrario), x i es un punto de interpolación (conocido), es una distancia dada ( operador métrico ) desde el punto conocido x i al punto desconocido x , N es el número total de puntos conocidos utilizados en la interpolación y es un número real positivo, llamado parámetro de potencia.
Aquí el peso disminuye a medida que aumenta la distancia desde los puntos interpolados. Los valores mayores de asignan mayor influencia a los valores más cercanos al punto interpolado, con el resultado convirtiéndose en un mosaico de teselas (un diagrama de Voronoi ) con un valor interpolado casi constante para valores grandes de p . Para dos dimensiones, los parámetros de potencia hacen que los valores interpolados estén dominados por puntos lejanos, ya que con una densidad de puntos de datos y puntos vecinos entre distancias a , el peso sumado es aproximadamente
que diverge para y . Para dimensiones M , el mismo argumento es válido para . Para la elección del valor de p , se puede considerar el grado de suavizado deseado en la interpolación, la densidad y distribución de las muestras que se interpolan y la distancia máxima sobre la cual se permite que una muestra individual influya en las que la rodean.
El método de Shepard es una consecuencia de la minimización de un funcional relacionado con una medida de desviaciones entre tuplas de puntos interpolados { x , u } e i tuplas de puntos interpolados { x i , u i }, definido como:
derivado de la condición de minimización:
El método se puede extender fácilmente a otros espacios dimensionales y, de hecho, es una generalización de la aproximación de Lagrange a espacios multidimensionales. Robert J. Renka [4] desarrolló una versión modificada del algoritmo diseñado para la interpolación trivariada y está disponible en Netlib como algoritmo 661 en la biblioteca TOMS .
Otra modificación del método de Shepard calcula el valor interpolado utilizando únicamente los vecinos más próximos dentro de la esfera R (en lugar de la muestra completa). En este caso, los pesos se modifican ligeramente:
Cuando se combina con una estructura de búsqueda espacial rápida (como kd-tree ), se convierte en un método de interpolación N log N eficiente y adecuado para problemas de gran escala.