El análisis espacial es cualquiera de las técnicas formales que estudian entidades utilizando sus propiedades topológicas , geométricas o geográficas . El análisis espacial incluye una variedad de técnicas que utilizan diferentes enfoques analíticos, especialmente la estadística espacial . Puede aplicarse en campos tan diversos como la astronomía , con sus estudios de la ubicación de las galaxias en el cosmos , o la ingeniería de fabricación de chips, con su uso de algoritmos de "ubicación y ruta" para construir estructuras de cableado complejas. En un sentido más restringido, el análisis espacial es el análisis geoespacial , la técnica aplicada a las estructuras a escala humana, más notablemente en el análisis de datos geográficos . También puede aplicarse a la genómica, como en los datos transcriptómicos .
En el análisis espacial surgen cuestiones complejas, muchas de las cuales no están claramente definidas ni completamente resueltas, pero que forman la base de la investigación actual. La más fundamental de ellas es el problema de definir la ubicación espacial de las entidades que se estudian. La clasificación de las técnicas de análisis espacial es difícil debido a la gran cantidad de campos de investigación diferentes involucrados, los diferentes enfoques fundamentales que se pueden elegir y las múltiples formas que pueden adoptar los datos.
El análisis espacial comenzó con los primeros intentos de cartografía y topografía . La topografía se remonta al menos al año 1400 a. C. en Egipto: las dimensiones de las parcelas imponibles se medían con cuerdas de medición y plomadas. [1] Muchos campos han contribuido a su surgimiento en forma moderna. La biología contribuyó a través de estudios botánicos de distribuciones vegetales globales y ubicaciones de plantas locales, estudios etológicos del movimiento animal, estudios ecológicos del paisaje de bloques de vegetación, estudios ecológicos de dinámicas poblacionales espaciales y el estudio de la biogeografía . La epidemiología contribuyó con trabajos tempranos sobre mapeo de enfermedades, en particular el trabajo de John Snow de mapear un brote de cólera, con investigaciones sobre mapeo de la propagación de enfermedades y con estudios de ubicación para la prestación de servicios de salud. Las estadísticas han contribuido en gran medida a través del trabajo en estadísticas espaciales. La economía ha contribuido notablemente a través de la econometría espacial . El sistema de información geográfica es actualmente un contribuyente importante debido a la importancia del software geográfico en la caja de herramientas analíticas modernas. La teledetección ha contribuido ampliamente en el análisis morfométrico y de agrupamiento. La informática ha contribuido enormemente a través del estudio de algoritmos, en particular en la geometría computacional . Las matemáticas siguen proporcionando las herramientas fundamentales para el análisis y para revelar la complejidad del ámbito espacial, por ejemplo, con trabajos recientes sobre fractales e invariancia de escala . El modelado científico proporciona un marco útil para nuevos enfoques. [ cita requerida ]
El análisis espacial se enfrenta a numerosos problemas fundamentales en la definición de sus objetos de estudio, en la construcción de las operaciones analíticas que se van a utilizar, en el uso de ordenadores para el análisis, en las limitaciones y particularidades de los análisis conocidos y en la presentación de los resultados analíticos. Muchos de estos problemas son objeto de estudio activo en la investigación moderna. [ cita requerida ]
En el análisis espacial suelen surgir errores comunes, algunos debidos a las matemáticas del espacio, otros a las formas particulares de presentación de los datos espacialmente, otros a las herramientas disponibles. Los datos del censo, dado que protegen la privacidad individual al agregar datos en unidades locales, plantean una serie de problemas estadísticos. La naturaleza fractal de la línea de costa hace que las mediciones precisas de su longitud sean difíciles, si no imposibles. Un software informático que ajuste líneas rectas a la curva de una línea de costa puede calcular fácilmente las longitudes de las líneas que define. Sin embargo, estas líneas rectas pueden no tener un significado inherente en el mundo real, como se demostró en el caso de la línea de costa de Gran Bretaña . [ cita requerida ]
Estos problemas representan un desafío en el análisis espacial debido al poder de los mapas como medio de presentación. Cuando los resultados se presentan como mapas, la presentación combina datos espaciales que generalmente son precisos con resultados analíticos que pueden ser inexactos, lo que genera la impresión de que los resultados analíticos son más precisos de lo que los datos indicarían. [2]
El problema de la unidad de área modificable (MAUP) es una fuente de sesgo estadístico que puede afectar significativamente los resultados de las pruebas de hipótesis estadísticas . El MAUP afecta los resultados cuando las medidas basadas en puntos de fenómenos espaciales se agregan en particiones espaciales o unidades de área (como regiones o distritos ), como en, por ejemplo, la densidad de población o las tasas de enfermedades . [3] [4] Los valores de resumen resultantes (por ejemplo, totales, tasas, proporciones, densidades) están influenciados tanto por la forma como por la escala de la unidad de agregación. [5]
Por ejemplo, los datos del censo pueden agruparse en distritos de condado, áreas censales, áreas de código postal, comisarías de policía o cualquier otra partición espacial arbitraria. Por lo tanto, los resultados de la agrupación de datos dependen de la elección del cartógrafo de qué "unidad de área modificable" utilizar en su análisis. Un mapa coroplético censal que calcule la densidad de población utilizando los límites estatales arrojará resultados radicalmente diferentes a los de un mapa que calcule la densidad basándose en los límites de los condados. Además, los límites de los distritos censales también están sujetos a cambios con el tiempo, [6] lo que significa que se debe tener en cuenta la MAUP al comparar los datos pasados con los datos actuales.En la teoría de la complejidad computacional , el problema del viajante de comercio (TSP) plantea la siguiente pregunta: "Dada una lista de ciudades y las distancias entre cada par de ciudades, ¿cuál es la ruta más corta posible que visita cada ciudad exactamente una vez y regresa a la ciudad de origen?" Es un problema NP-hard en optimización combinatoria , importante en informática teórica e investigación de operaciones .
El problema del comprador viajero , el problema de enrutamiento del vehículo y el problema de la estrella en anillo [15] son tres generalizaciones del TSP.
La versión de decisión del TSP (donde, dada una longitud L , la tarea consiste en decidir si el grafo tiene un recorrido cuya longitud sea como máximo L ) pertenece a la clase de problemas NP-completos . Por lo tanto, es posible que el tiempo de ejecución en el peor de los casos para cualquier algoritmo del TSP aumente de manera superpolinómica (pero no más que exponencial ) con el número de ciudades.
El problema se formuló por primera vez en 1930 y es uno de los problemas de optimización que se han estudiado más intensamente. Se utiliza como punto de referencia para muchos métodos de optimización. Aunque el problema es computacionalmente difícil, se conocen muchas heurísticas y algoritmos exactos , de modo que algunos casos con decenas de miles de ciudades se pueden resolver por completo, e incluso los problemas con millones de ciudades se pueden aproximar con una pequeña fracción del 1%. [16]En geometría , el problema de Weber , llamado así por Alfred Weber , es uno de los problemas más famosos de la teoría de la localización . Requiere encontrar un punto en el plano que minimice la suma de los costos de transporte desde este punto hasta n puntos de destino, donde los diferentes puntos de destino están asociados con diferentes costos por unidad de distancia.
El problema de Weber generaliza la mediana geométrica , que supone que los costes de transporte por unidad de distancia son los mismos para todos los puntos de destino, y el problema de calcular el punto de Fermat , la mediana geométrica de tres puntos. Por esta razón, a veces se lo denomina problema de Fermat-Weber, aunque también se ha utilizado el mismo nombre para el problema de la mediana geométrica no ponderada. El problema de Weber se generaliza a su vez mediante el problema de atracción-repulsión, que permite que algunos de los costes sean negativos, de modo que es mejor que haya una mayor distancia desde algunos puntos.La definición de la presencia espacial de una entidad restringe el posible análisis que se puede aplicar a esa entidad e influye en las conclusiones finales a las que se puede llegar. Si bien esta propiedad es fundamentalmente cierta en todos los análisis , es particularmente importante en el análisis espacial porque las herramientas para definir y estudiar entidades favorecen caracterizaciones específicas de las entidades que se estudian. Las técnicas estadísticas favorecen la definición espacial de los objetos como puntos porque hay muy pocas técnicas estadísticas que operen directamente sobre elementos de línea, área o volumen. Las herramientas informáticas favorecen la definición espacial de los objetos como elementos homogéneos y separados debido al número limitado de elementos de bases de datos y estructuras computacionales disponibles, y la facilidad con la que se pueden crear estas estructuras primitivas. [ cita requerida ]
La dependencia espacial es la relación espacial de los valores de las variables (para temas definidos en el espacio, como la lluvia ) o las ubicaciones (para temas definidos como objetos, como las ciudades). La dependencia espacial se mide como la existencia de dependencia estadística en una colección de variables aleatorias , cada una de las cuales está asociada con una ubicación geográfica diferente . La dependencia espacial es importante en aplicaciones donde es razonable postular la existencia de un conjunto correspondiente de variables aleatorias en ubicaciones que no se han incluido en una muestra. Por lo tanto, la lluvia puede medirse en un conjunto de ubicaciones de pluviómetros, y dichas mediciones pueden considerarse como resultados de variables aleatorias, pero la lluvia ocurre claramente en otras ubicaciones y nuevamente sería aleatoria. Debido a que la lluvia exhibe propiedades de autocorrelación , se pueden utilizar técnicas de interpolación espacial para estimar las cantidades de lluvia en ubicaciones cercanas a las ubicaciones medidas. [32]
Al igual que con otros tipos de dependencia estadística, la presencia de dependencia espacial generalmente conduce a que las estimaciones de un valor promedio de una muestra sean menos precisas que si las muestras hubieran sido independientes, aunque si existe una dependencia negativa, un promedio de muestra puede ser mejor que en el caso independiente. Un problema diferente al de la estimación de un promedio general es el de la interpolación espacial : aquí el problema es estimar los resultados aleatorios no observados de las variables en ubicaciones intermedias a los lugares donde se realizan las mediciones, en los que existe una dependencia espacial entre las variables aleatorias observadas y no observadas. [ cita requerida ]
Las herramientas para explorar la dependencia espacial incluyen: correlación espacial , funciones de covarianza espacial y semivariogramas . Los métodos para la interpolación espacial incluyen Kriging , que es un tipo de predicción lineal imparcial óptima . El tema de la dependencia espacial es importante para la geoestadística y el análisis espacial. [ cita requerida ]
La dependencia espacial es la covariación de propiedades dentro del espacio geográfico: las características en ubicaciones próximas parecen estar correlacionadas, ya sea positiva o negativamente. [33] La dependencia espacial conduce al problema de la autocorrelación espacial en las estadísticas, ya que, al igual que la autocorrelación temporal, viola las técnicas estadísticas estándar que suponen la independencia entre las observaciones. Por ejemplo, los análisis de regresión que no compensan la dependencia espacial pueden tener estimaciones de parámetros inestables y producir pruebas de significancia poco fiables. Los modelos de regresión espacial (véase más adelante) capturan estas relaciones y no sufren estas debilidades. También es adecuado considerar la dependencia espacial como una fuente de información en lugar de algo que debe corregirse. [34]
Los efectos de localización también se manifiestan como heterogeneidad espacial , o la variación aparente de un proceso con respecto a la ubicación en el espacio geográfico. A menos que un espacio sea uniforme e ilimitado, cada ubicación tendrá cierto grado de singularidad en relación con las otras ubicaciones. Esto afecta las relaciones de dependencia espacial y, por lo tanto, el proceso espacial. La heterogeneidad espacial significa que los parámetros generales estimados para todo el sistema pueden no describir adecuadamente el proceso en una ubicación determinada. [ cita requerida ]
La asociación espacial es el grado en el que las cosas están dispuestas de manera similar en el espacio. El análisis de los patrones de distribución de dos fenómenos se realiza mediante la superposición de mapas. Si las distribuciones son similares, entonces la asociación espacial es fuerte, y viceversa. [35] En un Sistema de Información Geográfica , el análisis se puede realizar de forma cuantitativa. Por ejemplo, un conjunto de observaciones (como puntos o extraídos de celdas raster) en ubicaciones coincidentes se pueden intersecar y examinar mediante análisis de regresión .
Al igual que la autocorrelación espacial , esta puede ser una herramienta útil para la predicción espacial. En el modelado espacial, el concepto de asociación espacial permite el uso de covariables en una ecuación de regresión para predecir el campo geográfico y, de esta manera, producir un mapa.
La segunda dimensión de la asociación espacial (SDA) revela la asociación entre variables espaciales mediante la extracción de información geográfica en ubicaciones fuera de las muestras. La SDA utiliza de manera eficaz la información geográfica faltante fuera de las ubicaciones de las muestras en los métodos de la primera dimensión de la asociación espacial (FDA), que exploran la asociación espacial utilizando observaciones en ubicaciones de muestra. [36]
La escala de medición espacial es un problema persistente en el análisis espacial; se puede obtener más información en la entrada del tema sobre el problema de la unidad de área modificable (MAUP). Los ecólogos del paisaje desarrollaron una serie de métricas invariantes de escala para aspectos de la ecología que son de naturaleza fractal . [37] En términos más generales, no existe un consenso generalizado sobre ningún método de análisis independiente de la escala para las estadísticas espaciales. [ cita requerida ]
El muestreo espacial implica determinar un número limitado de ubicaciones en el espacio geográfico para medir fielmente fenómenos que están sujetos a dependencia y heterogeneidad. [ cita requerida ] La dependencia sugiere que, dado que una ubicación puede predecir el valor de otra ubicación, no necesitamos observaciones en ambos lugares. Pero la heterogeneidad sugiere que esta relación puede cambiar a lo largo del espacio y, por lo tanto, no podemos confiar en un grado observado de dependencia más allá de una región que puede ser pequeña. Los esquemas básicos de muestreo espacial incluyen el aleatorio, el agrupado y el sistemático. Estos esquemas básicos se pueden aplicar en múltiples niveles en una jerarquía espacial designada (por ejemplo, área urbana, ciudad, vecindario). También es posible explotar datos auxiliares, por ejemplo, utilizando valores de propiedad como guía en un esquema de muestreo espacial para medir el logro educativo y los ingresos. Los modelos espaciales como las estadísticas de autocorrelación, la regresión y la interpolación (ver más abajo) también pueden dictar el diseño de la muestra. [ cita requerida ]
Las cuestiones fundamentales del análisis espacial dan lugar a numerosos problemas de análisis, entre ellos sesgos, distorsiones y errores evidentes en las conclusiones alcanzadas. Estas cuestiones suelen estar interrelacionadas, pero se han hecho varios intentos de separarlas unas de otras. [38]
Al analizar la línea costera de Gran Bretaña , Benoit Mandelbrot demostró que ciertos conceptos espaciales son inherentemente absurdos a pesar de la presunción de su validez. Las longitudes en ecología dependen directamente de la escala en la que se miden y experimentan. Así, aunque los topógrafos suelen medir la longitud de un río, esta longitud solo tiene sentido en el contexto de la relevancia de la técnica de medición para la cuestión en estudio. [39]
La falacia ubicacional se refiere al error debido a la caracterización espacial particular elegida para los elementos de estudio, en particular la elección de la ubicación para la presencia espacial del elemento. [39]
Las caracterizaciones espaciales pueden ser simplistas o incluso erróneas. Los estudios sobre seres humanos suelen reducir la existencia espacial de los seres humanos a un único punto, por ejemplo, su dirección de domicilio. Esto puede conducir fácilmente a un análisis deficiente, por ejemplo, cuando se considera la transmisión de enfermedades que puede ocurrir en el trabajo o en la escuela y, por lo tanto, lejos del hogar. [39]
La caracterización espacial puede limitar implícitamente el objeto de estudio. Por ejemplo, el análisis espacial de los datos sobre delincuencia se ha vuelto popular recientemente, pero estos estudios sólo pueden describir los tipos particulares de delito que pueden describirse espacialmente. Esto conduce a muchos mapas de asaltos, pero no a ningún mapa de malversación de fondos con consecuencias políticas en la conceptualización del delito y el diseño de políticas para abordar el problema. [39]
Esto describe errores debidos a tratar los elementos como 'átomos' separados fuera de su contexto espacial. [39] La falacia trata de transferir conclusiones individuales a unidades espaciales. [40]
La falacia ecológica describe los errores que se producen al realizar análisis sobre datos agregados cuando se intenta llegar a conclusiones sobre las unidades individuales. [39] [41] Los errores se producen en parte por la agregación espacial. Por ejemplo, un píxel representa las temperaturas superficiales promedio dentro de un área. La falacia ecológica sería suponer que todos los puntos dentro del área tienen la misma temperatura.
Existe un espacio matemático siempre que tengamos un conjunto de observaciones y medidas cuantitativas de sus atributos. Por ejemplo, podemos representar los ingresos o los años de educación de los individuos dentro de un sistema de coordenadas donde la ubicación de cada individuo puede especificarse con respecto a ambas dimensiones. La distancia entre individuos dentro de este espacio es una medida cuantitativa de sus diferencias con respecto a los ingresos y la educación. Sin embargo, en el análisis espacial, nos interesan tipos específicos de espacios matemáticos, a saber, el espacio geográfico. En el espacio geográfico, las observaciones corresponden a ubicaciones en un marco de medición espacial que captura su proximidad en el mundo real. Las ubicaciones en un marco de medición espacial a menudo representan ubicaciones en la superficie de la Tierra, pero esto no es estrictamente necesario. Un marco de medición espacial también puede capturar la proximidad con respecto, por ejemplo, al espacio interestelar o dentro de una entidad biológica como un hígado. El principio fundamental es la Primera Ley de Geografía de Tobler : si la interrelación entre entidades aumenta con la proximidad en el mundo real, entonces la representación en el espacio geográfico y la evaluación mediante técnicas de análisis espacial son apropiadas.
La distancia euclidiana entre ubicaciones suele representar su proximidad, aunque esta es solo una posibilidad. Hay una cantidad infinita de distancias además de la euclidiana que pueden respaldar el análisis cuantitativo. Por ejemplo, las distancias de "Manhattan" (o " Taxi ") donde el movimiento está restringido a rutas paralelas a los ejes pueden ser más significativas que las distancias euclidianas en entornos urbanos. Además de las distancias, otras relaciones geográficas como la conectividad (por ejemplo, la existencia o el grado de fronteras compartidas) y la dirección también pueden influir en las relaciones entre entidades. También es posible calcular rutas de costo mínimo a través de una superficie de costo; por ejemplo, esto puede representar la proximidad entre ubicaciones cuando el viaje debe realizarse a través de un terreno accidentado.
Los datos espaciales se presentan en muchas variedades y no es fácil llegar a un sistema de clasificación que sea al mismo tiempo exclusivo, exhaustivo, imaginativo y satisfactorio. -- G. Upton y B. Fingelton [42]
Los estudios urbanos y regionales se ocupan de grandes tablas de datos espaciales obtenidos a partir de censos y encuestas. Es necesario simplificar la enorme cantidad de información detallada para poder extraer las tendencias principales. El análisis multivariable (o análisis factorial , FA) permite un cambio de variables, transformando las muchas variables del censo, normalmente correlacionadas entre sí, en menos "Factores" o "Componentes Principales" independientes que son, en realidad, los vectores propios de la matriz de correlación de datos ponderados por la inversa de sus valores propios. Este cambio de variables tiene dos ventajas principales:
El análisis factorial depende de la medición de distancias entre observaciones: la elección de una métrica significativa es crucial. La métrica euclidiana (análisis de componentes principales), la distancia de chi-cuadrado (análisis de correspondencias) o la distancia de Mahalanobis generalizada (análisis discriminante) se encuentran entre las más utilizadas. [43] Se han propuesto modelos más complejos que utilizan comunalidades o rotaciones. [44]
El uso de métodos multivariados en el análisis espacial comenzó realmente en la década de 1950 (aunque algunos ejemplos se remontan a principios de siglo) y culminó en la década de 1970, con el aumento de la potencia y la accesibilidad de las computadoras. Ya en 1948, en una publicación seminal, dos sociólogos, Wendell Bell y Eshref Shevky, [45] habían demostrado que la mayoría de las poblaciones de las ciudades de los Estados Unidos y del mundo podían representarse con tres factores independientes: 1- el «estatus socioeconómico» que opone distritos ricos y pobres y se distribuye en sectores que corren a lo largo de las autopistas desde el centro de la ciudad, 2- el «ciclo de vida», es decir, la estructura de edad de los hogares, distribuida en círculos concéntricos, y 3- la «raza y etnicidad», que identifica los grupos de migrantes ubicados dentro de la ciudad. En 1961, en un estudio pionero, los geógrafos británicos utilizaron el AF para clasificar las ciudades británicas. [46] Brian J Berry, de la Universidad de Chicago, y sus estudiantes hicieron un amplio uso del método, [47] aplicándolo a las ciudades más importantes del mundo y exhibiendo estructuras sociales comunes. [48] El uso del Análisis Factorial en Geografía, hecho tan fácil por las computadoras modernas, ha sido muy amplio pero no siempre muy sabio. [49]
Como los vectores extraídos están determinados por la matriz de datos, no es posible comparar los factores obtenidos de diferentes censos. Una solución consiste en fusionar varias matrices censales en una única tabla que, a continuación, puede analizarse. Sin embargo, esto supone que la definición de las variables no ha cambiado con el tiempo y produce tablas muy grandes, difíciles de manejar. Una solución mejor, propuesta por los psicometristas [50] , agrupa los datos en una «matriz cúbica», con tres entradas (por ejemplo, lugares, variables, períodos de tiempo). Un análisis factorial de tres vías produce entonces tres grupos de factores relacionados por una pequeña «matriz central» cúbica. [51] Este método, que muestra la evolución de los datos a lo largo del tiempo, no ha sido ampliamente utilizado en geografía. [52] Sin embargo , en Los Ángeles [53] ha exhibido el papel, tradicionalmente ignorado, del Downtown como centro organizador de toda la ciudad durante varias décadas.
Las estadísticas de autocorrelación espacial miden y analizan el grado de dependencia entre las observaciones en un espacio geográfico. Las estadísticas clásicas de autocorrelación espacial incluyen la de Moran , la de Geary , la de Getis y la elipse de desviación estándar. Estas estadísticas requieren medir una matriz de ponderaciones espaciales que refleje la intensidad de la relación geográfica entre las observaciones en un vecindario, por ejemplo, las distancias entre vecinos, las longitudes de la frontera compartida o si caen en una clase direccional específica como "oeste". Las estadísticas clásicas de autocorrelación espacial comparan las ponderaciones espaciales con la relación de covarianza en pares de ubicaciones. La autocorrelación espacial que es más positiva de lo esperado a partir del azar indica la agrupación de valores similares en el espacio geográfico, mientras que la autocorrelación espacial negativa significativa indica que los valores vecinos son más diferentes de lo esperado por casualidad, lo que sugiere un patrón espacial similar a un tablero de ajedrez.
Las estadísticas de autocorrelación espacial, como las de Moran y Geary, son globales en el sentido de que estiman el grado general de autocorrelación espacial de un conjunto de datos. La posibilidad de heterogeneidad espacial sugiere que el grado estimado de autocorrelación puede variar significativamente en el espacio geográfico. Las estadísticas de autocorrelación espacial local proporcionan estimaciones desagregadas al nivel de las unidades de análisis espacial, lo que permite la evaluación de las relaciones de dependencia en el espacio. Las estadísticas comparan los vecindarios con un promedio global e identifican regiones locales de fuerte autocorrelación. También hay disponibles versiones locales de las estadísticas y .
Los modelos de interacción espacial o " modelos de gravedad " estiman el flujo de personas, material o información entre ubicaciones en el espacio geográfico. Los factores pueden incluir variables propulsoras del origen, como la cantidad de viajeros en áreas residenciales, variables de atractivo del destino, como la cantidad de espacio de oficina en áreas de empleo, y relaciones de proximidad entre las ubicaciones medidas en términos como la distancia en automóvil o el tiempo de viaje. Además, se deben identificar las relaciones topológicas o conectivas entre áreas, en particular considerando la relación a menudo conflictiva entre la distancia y la topología; por ejemplo, dos vecindarios espacialmente cercanos pueden no mostrar ninguna interacción significativa si están separados por una autopista. Después de especificar las formas funcionales de estas relaciones, el analista puede estimar los parámetros del modelo utilizando datos de flujo observados y técnicas de estimación estándar, como los mínimos cuadrados ordinarios o la máxima verosimilitud. Las versiones de destinos competitivos de los modelos de interacción espacial incluyen la proximidad entre los destinos (u orígenes) además de la proximidad origen-destino; esto captura los efectos de la agrupación de destinos (origen) en los flujos.
Los métodos de interpolación espacial estiman las variables en ubicaciones no observadas en el espacio geográfico en función de los valores en las ubicaciones observadas. Los métodos básicos incluyen la ponderación de la distancia inversa : esto atenúa la variable a medida que disminuye la proximidad a la ubicación observada. Kriging es un método más sofisticado que interpola en el espacio de acuerdo con una relación de desfase espacial que tiene componentes sistemáticos y aleatorios. Esto puede dar cabida a una amplia gama de relaciones espaciales para los valores ocultos entre las ubicaciones observadas. Kriging proporciona estimaciones óptimas dada la relación de desfase hipotética, y las estimaciones de error se pueden mapear para determinar si existen patrones espaciales.
Los métodos de regresión espacial capturan la dependencia espacial en el análisis de regresión , evitando problemas estadísticos como parámetros inestables y pruebas de significancia poco confiables, así como proporcionando información sobre las relaciones espaciales entre las variables involucradas. Dependiendo de la técnica específica, la dependencia espacial puede entrar en el modelo de regresión como relaciones entre las variables independientes y las dependientes, entre las variables dependientes y un rezago espacial de sí misma, o en los términos de error. La regresión ponderada geográficamente (GWR) es una versión local de la regresión espacial que genera parámetros desagregados por las unidades espaciales de análisis. [54] Esto permite la evaluación de la heterogeneidad espacial en las relaciones estimadas entre las variables independientes y dependientes. El uso del modelado jerárquico bayesiano [55] junto con los métodos de Monte Carlo de cadena de Markov (MCMC) han demostrado recientemente ser eficaces en el modelado de relaciones complejas utilizando Poisson-Gamma-CAR, Poisson-lognormal-SAR o modelos logit sobredispersados. Los paquetes estadísticos para implementar dichos modelos bayesianos utilizando MCMC incluyen WinBugs , CrimeStat y muchos paquetes disponibles a través del lenguaje de programación R. [56]
Los procesos estocásticos espaciales, como los procesos gaussianos , también se están utilizando cada vez más en el análisis de regresión espacial. Las versiones basadas en modelos de GWR, conocidas como modelos de coeficientes de variación espacial, se han aplicado para realizar inferencias bayesianas. [55] Los procesos estocásticos espaciales pueden convertirse en modelos de procesos gaussianos escalables y computacionalmente eficaces, como los procesos predictivos gaussianos [57] y los procesos gaussianos del vecino más cercano (NNGP). [58]
Los modelos de interacción espacial son agregados y de arriba hacia abajo: especifican una relación de gobierno general para el flujo entre ubicaciones. Esta característica también la comparten los modelos urbanos, como los basados en programación matemática, los flujos entre sectores económicos o la teoría de la renta de oferta. Una perspectiva de modelado alternativa es representar el sistema en el nivel más alto posible de desagregación y estudiar el surgimiento de abajo hacia arriba de patrones y relaciones complejos a partir del comportamiento y las interacciones a nivel individual. [ cita requerida ]
La teoría de sistemas adaptativos complejos aplicada al análisis espacial sugiere que las interacciones simples entre entidades proximales pueden conducir a entidades espaciales intrincadas, persistentes y funcionales a niveles agregados. Dos métodos de simulación espacial fundamentalmente son los autómatas celulares y el modelado basado en agentes. El modelado de autómatas celulares impone un marco espacial fijo, como celdas de cuadrícula, y especifica reglas que dictan el estado de una celda en función de los estados de sus celdas vecinas. A medida que avanza el tiempo, surgen patrones espaciales a medida que las celdas cambian de estado en función de sus vecinas; esto altera las condiciones para períodos de tiempo futuros. Por ejemplo, las celdas pueden representar ubicaciones en un área urbana y sus estados pueden ser diferentes tipos de uso de la tierra. Los patrones que pueden surgir de las interacciones simples de los usos de la tierra locales incluyen distritos de oficinas y expansión urbana . El modelado basado en agentes utiliza entidades de software (agentes) que tienen un comportamiento determinado (objetivos) y pueden reaccionar, interactuar y modificar su entorno mientras buscan sus objetivos. A diferencia de las celdas en los autómatas celulares, los simulistas pueden permitir que los agentes sean móviles con respecto al espacio. Por ejemplo, se podría modelar el flujo y la dinámica del tráfico utilizando agentes que representan vehículos individuales que intentan minimizar el tiempo de viaje entre orígenes y destinos específicos. Mientras buscan tiempos de viaje mínimos, los agentes deben evitar colisiones con otros vehículos que también buscan minimizar sus tiempos de viaje. Los autómatas celulares y el modelado basado en agentes son estrategias de modelado complementarias. Pueden integrarse en un sistema de autómatas geográficos común donde algunos agentes son fijos mientras que otros son móviles.
La calibración desempeña un papel fundamental en los enfoques de simulación y modelado tanto de CA como de ABM. Los enfoques iniciales de CA propusieron enfoques de calibración robustos basados en métodos estocásticos de Monte Carlo. [62] [63] Los enfoques de ABM se basan en las reglas de decisión de los agentes (en muchos casos extraídas de métodos de base de investigación cualitativa como cuestionarios). [64] Los algoritmos de aprendizaje automático recientes calibran utilizando conjuntos de entrenamiento, por ejemplo, para comprender las cualidades del entorno construido. [65]
El análisis espacial de un modelo geológico conceptual es el objetivo principal de cualquier algoritmo MPS. El método analiza las estadísticas espaciales del modelo geológico, denominadas imagen de entrenamiento, y genera realizaciones de los fenómenos que respetan esas estadísticas de puntos múltiples de entrada.
Un algoritmo MPS reciente utilizado para llevar a cabo esta tarea es el método basado en patrones de Honarkhah. [66] En este método, se emplea un enfoque basado en la distancia para analizar los patrones en la imagen de entrenamiento. Esto permite la reproducción de las estadísticas de puntos múltiples y las características geométricas complejas de la imagen de entrenamiento. Cada salida del algoritmo MPS es una realización que representa un campo aleatorio. En conjunto, se pueden utilizar varias realizaciones para cuantificar la incertidumbre espacial.
Uno de los métodos más recientes es el presentado por Tahmasebi et al. [67], que utiliza una función de correlación cruzada para mejorar la reproducción de patrones espaciales. Llaman a su método de simulación MPS algoritmo CCSIM. Este método es capaz de cuantificar la conectividad espacial, la variabilidad y la incertidumbre. Además, el método no es sensible a ningún tipo de datos y es capaz de simular escenarios tanto categóricos como continuos. El algoritmo CCSIM se puede utilizar para cualquier sistema estacionario, no estacionario y multivariado y puede proporcionar un modelo de atractivo visual de alta calidad., [68] [69]
El análisis geoespacial e hidroespacial , o simplemente análisis espacial , [70] es un enfoque para aplicar el análisis estadístico y otras técnicas analíticas a datos que tienen un aspecto geográfico o espacial. Este análisis normalmente emplearía software capaz de generar mapas, procesar datos espaciales y aplicar métodos analíticos a conjuntos de datos terrestres o geográficos , incluido el uso de sistemas de información geográfica y geomática . [71] [72] [73]
Los sistemas de información geográfica (SIG), un amplio dominio que proporciona una variedad de capacidades diseñadas para capturar, almacenar, manipular, analizar, gestionar y presentar todo tipo de datos geográficos, utilizan análisis geoespacial e hidroespacial en una variedad de contextos, operaciones y aplicaciones.
El análisis geoespacial e hidroespacial, utilizando SIG , fue desarrollado para problemas en las ciencias ambientales y de la vida, en particular ecología , geología y epidemiología . Se ha extendido a casi todas las industrias, incluidas la defensa, la inteligencia, los servicios públicos, los recursos naturales (es decir, petróleo y gas, silvicultura, etc.), las ciencias sociales, la medicina y la seguridad pública (es decir, la gestión de emergencias y la criminología), la reducción y gestión del riesgo de desastres (DRRM) y la adaptación al cambio climático (CCA). Las estadísticas espaciales generalmente resultan principalmente de la observación en lugar de la experimentación. El hidroespacial se utiliza particularmente para el lado acuático y los miembros relacionados con la superficie del agua, la columna, el fondo, el subsuelo y las zonas costeras.
Los SIG basados en vectores suelen estar relacionados con operaciones como la superposición de mapas (combinar dos o más mapas o capas de mapas según reglas predefinidas), el almacenamiento en búfer simple (identificar regiones de un mapa dentro de una distancia específica de una o más entidades, como ciudades, carreteras o ríos) y operaciones básicas similares. Esto refleja (y se refleja en) el uso del término análisis espacial dentro del Consorcio Geoespacial Abierto ( OGC ) "especificaciones de entidades simples". Para los SIG basados en ráster, ampliamente utilizados en las ciencias ambientales y la teledetección, esto generalmente significa una serie de acciones aplicadas a las celdas de la cuadrícula de uno o más mapas (o imágenes) que a menudo implican filtrado y/o operaciones algebraicas (álgebra de mapas). Estas técnicas implican el procesamiento de una o más capas ráster según reglas simples que dan como resultado una nueva capa de mapa, por ejemplo, reemplazando cada valor de celda con alguna combinación de los valores de sus vecinos, o calculando la suma o diferencia de valores de atributos específicos para cada celda de la cuadrícula en dos conjuntos de datos ráster coincidentes. Las estadísticas descriptivas, como los recuentos de células, las medias, las varianzas, los máximos, los mínimos, los valores acumulados, las frecuencias y una serie de otras medidas y cálculos de distancia también se incluyen a menudo en este término genérico de análisis espacial. El análisis espacial incluye una gran variedad de técnicas estadísticas ( estadísticas descriptivas, exploratorias y explicativas ) que se aplican a los datos que varían espacialmente y que pueden variar con el tiempo. Algunas técnicas estadísticas más avanzadas incluyen Getis-ord Gi* o Anselin Local Moran's I, que se utilizan para determinar patrones de agrupamiento de datos referenciados espacialmente.
El análisis geoespacial e hidroespacial va más allá de las operaciones de mapeo 2D y 3D y las estadísticas espaciales. Es multidimensional y también temporal e incluye:
Tradicionalmente, la computación geoespacial e hidroespacial se ha realizado principalmente en computadoras personales (PC) o servidores. Sin embargo, debido a las crecientes capacidades de los dispositivos móviles, la computación geoespacial en dispositivos móviles es una tendencia de rápido crecimiento. [74] La naturaleza portátil de estos dispositivos, así como la presencia de sensores útiles, como los receptores del Sistema Global de Navegación por Satélite (GNSS) y los sensores de presión barométrica, los hacen útiles para capturar y procesar información geoespacial e hidroespacial en el campo. Además del procesamiento local de información geoespacial en dispositivos móviles, otra tendencia creciente es la computación geoespacial basada en la nube. En esta arquitectura, los datos se pueden recopilar en el campo utilizando dispositivos móviles y luego transmitirlos a servidores basados en la nube para su posterior procesamiento y almacenamiento final. De manera similar, la información geoespacial e hidroespacial se puede poner a disposición de dispositivos móviles conectados a través de la nube, lo que permite el acceso a vastas bases de datos de información geoespacial e hidroespacial en cualquier lugar donde haya una conexión de datos inalámbrica disponible.
Los sistemas de información geográfica (SIG) y la ciencia de la información geográfica subyacente que hace avanzar estas tecnologías tienen una fuerte influencia en el análisis espacial. La creciente capacidad de capturar y manejar datos geográficos significa que el análisis espacial se está produciendo en entornos cada vez más ricos en datos. Los sistemas de captura de datos geográficos incluyen imágenes captadas por teledetección, sistemas de monitoreo ambiental como sistemas de transporte inteligentes y tecnologías que reconocen la ubicación como dispositivos móviles que pueden informar la ubicación casi en tiempo real. Los SIG proporcionan plataformas para gestionar estos datos, calcular relaciones espaciales como distancia, conectividad y relaciones direccionales entre unidades espaciales y visualizar tanto los datos brutos como los resultados analíticos espaciales dentro de un contexto cartográfico. Los subtipos incluyen: