El análisis espacial es cualquiera de las técnicas formales que estudian entidades utilizando sus propiedades topológicas , geométricas o geográficas . El análisis espacial incluye una variedad de técnicas que utilizan diferentes enfoques analíticos, especialmente la estadística espacial . Puede aplicarse en campos tan diversos como la astronomía , con sus estudios de la ubicación de las galaxias en el cosmos , o la ingeniería de fabricación de chips, con su uso de algoritmos de "lugar y ruta" para construir estructuras de cableado complejas. En un sentido más restringido, el análisis espacial es el análisis geoespacial , la técnica aplicada a estructuras a escala humana, sobre todo en el análisis de datos geográficos . También se puede aplicar a la genómica, como en los datos de transcriptómica .
En el análisis espacial surgen cuestiones complejas, muchas de las cuales no están claramente definidas ni completamente resueltas, pero forman la base de la investigación actual. El más fundamental de ellos es el problema de definir la ubicación espacial de las entidades que se estudian. La clasificación de las técnicas de análisis espacial es difícil debido al gran número de diferentes campos de investigación involucrados, los diferentes enfoques fundamentales que pueden elegirse y las muchas formas que pueden adoptar los datos.
El análisis espacial comenzó con los primeros intentos de cartografía y topografía . La agrimensura se remonta al menos al año 1.400 a. C. en Egipto: las dimensiones de los terrenos sujetos a impuestos se medían con cuerdas de medir y plomadas. [1] Muchos campos han contribuido a su surgimiento en su forma moderna. La biología contribuyó a través de estudios botánicos de distribuciones globales de plantas y ubicaciones de plantas locales, estudios etológicos del movimiento de animales, estudios ecológicos del paisaje de bloques de vegetación, estudios ecológicos de la dinámica espacial de las poblaciones y el estudio de la biogeografía . La epidemiología contribuyó con los primeros trabajos sobre mapeo de enfermedades, en particular el trabajo de John Snow de mapear un brote de cólera, con investigaciones sobre mapeo de la propagación de enfermedades y con estudios de ubicación para la prestación de atención médica. La estadística ha contribuido en gran medida a través del trabajo en estadística espacial. La economía ha contribuido notablemente a través de la econometría espacial . El sistema de información geográfica es actualmente un contribuyente importante debido a la importancia del software geográfico en la caja de herramientas analíticas modernas. La teledetección ha contribuido ampliamente al análisis morfométrico y de agrupamiento. La informática ha contribuido ampliamente a través del estudio de algoritmos, especialmente en geometría computacional . Las matemáticas continúan proporcionando herramientas fundamentales para el análisis y revelando la complejidad del ámbito espacial, por ejemplo, con trabajos recientes sobre fractales e invariancia de escala . El modelado científico proporciona un marco útil para nuevos enfoques. [ cita necesaria ]
El análisis espacial enfrenta muchas cuestiones fundamentales en la definición de sus objetos de estudio, en la construcción de las operaciones analíticas a utilizar, en el uso de computadoras para el análisis, en las limitaciones y particularidades de los análisis que se conocen y en la presentación. de resultados analíticos. Muchas de estas cuestiones son temas activos de la investigación moderna. [ cita necesaria ]
A menudo surgen errores comunes en el análisis espacial, algunos debido a las matemáticas del espacio, otros debido a las formas particulares en que se presentan los datos espacialmente, otros debido a las herramientas disponibles. Los datos del censo, debido a que protegen la privacidad individual al agregar datos en unidades locales, plantean una serie de cuestiones estadísticas. La naturaleza fractal de la costa hace que sea difícil, si no imposible, medir con precisión su longitud. Un software que ajuste líneas rectas a la curva de una línea costera puede calcular fácilmente las longitudes de las líneas que define. Sin embargo, estas líneas rectas pueden no tener ningún significado inherente en el mundo real, como se demostró en el caso de la costa de Gran Bretaña . [ cita necesaria ]
Estos problemas representan un desafío en el análisis espacial debido al poder de los mapas como medio de presentación. Cuando los resultados se presentan como mapas, la presentación combina datos espaciales que generalmente son precisos con resultados analíticos que pueden ser inexactos, lo que da la impresión de que los resultados analíticos son más precisos de lo que los datos indican. [2]
El problema de la unidad de área modificable (MAUP) es una fuente de sesgo estadístico que puede afectar significativamente los resultados de las pruebas de hipótesis estadísticas . MAUP afecta los resultados cuando las medidas puntuales de fenómenos espaciales se agregan en particiones espaciales o unidades de área (como regiones o distritos ) como, por ejemplo, en la densidad de población o las tasas de enfermedad . [3] [4] Los valores resumidos resultantes (por ejemplo, totales, tasas, proporciones, densidades) están influenciados tanto por la forma como por la escala de la unidad de agregación. [5]
Por ejemplo, los datos del censo pueden agregarse en distritos de condado, sectores censales, áreas de códigos postales, distritos policiales o cualquier otra partición espacial arbitraria. Por lo tanto, los resultados de la agregación de datos dependen de la elección del cartógrafo de qué "unidad de área modificable" utilizar en su análisis. Un mapa de coropletas del censo que calcula la densidad de población utilizando los límites estatales producirá resultados radicalmente diferentes a los de un mapa que calcula la densidad basándose en los límites del condado. Además, los límites de los distritos censales también están sujetos a cambios con el tiempo, [6] lo que significa que se debe considerar el MAUP al comparar datos pasados con datos actuales.El problema del viajante , también conocido como problema del viajante (TSP), plantea la siguiente pregunta: "Dada una lista de ciudades y las distancias entre cada par de ciudades, ¿cuál es la ruta más corta posible que visita cada ciudad exactamente una vez y regresa? a la ciudad de origen?" Es un problema NP-difícil en optimización combinatoria , importante en informática teórica e investigación de operaciones .
El problema del comprador viajero , el problema de las rutas de vehículos y el problema de la estrella anular [15] son tres generalizaciones del TSP.
En la teoría de la complejidad computacional , la versión de decisión del TSP (donde dada una longitud L , la tarea es decidir si el gráfico tiene un recorrido cuya longitud sea como máximo L ) pertenece a la clase de problemas NP-completos . Por lo tanto, es posible que el tiempo de ejecución en el peor de los casos para cualquier algoritmo para el TSP aumente superpolinomialmente (pero no más que exponencialmente ) con el número de ciudades.
El problema se formuló por primera vez en 1930 y es uno de los problemas de optimización más estudiados. Se utiliza como punto de referencia para muchos métodos de optimización. Aunque el problema es computacionalmente difícil, se conocen muchas heurísticas y algoritmos exactos , de modo que algunos casos con decenas de miles de ciudades pueden resolverse completamente, e incluso problemas con millones de ciudades pueden aproximarse dentro de una pequeña fracción del 1%. [16]En geometría , el problema de Weber , que lleva el nombre de Alfred Weber , es uno de los problemas más famosos de la teoría de la localización . Requiere encontrar un punto en el avión que minimice la suma de los costos de transporte desde este punto hasta n puntos de destino, donde diferentes puntos de destino están asociados con diferentes costos por unidad de distancia.
El problema de Weber generaliza la mediana geométrica , que supone que los costos de transporte por unidad de distancia son los mismos para todos los puntos de destino, y el problema de calcular el punto de Fermat , la mediana geométrica de tres puntos. Por esta razón, a veces se le llama problema de Fermat-Weber, aunque también se ha utilizado el mismo nombre para el problema de la mediana geométrica no ponderada. El problema de Weber, a su vez, se generaliza mediante el problema de atracción-repulsión, que permite que algunos de los costos sean negativos, de modo que una mayor distancia desde algunos puntos es mejor.La definición de la presencia espacial de una entidad limita el posible análisis que se puede aplicar a esa entidad e influye en las conclusiones finales a las que se puede llegar. Si bien esta propiedad es fundamentalmente cierta en todo análisis , es particularmente importante en el análisis espacial porque las herramientas para definir y estudiar entidades favorecen caracterizaciones específicas de las entidades que se estudian. Las técnicas estadísticas favorecen la definición espacial de objetos como puntos porque hay muy pocas técnicas estadísticas que operen directamente sobre elementos de línea, área o volumen. Las herramientas informáticas favorecen la definición espacial de objetos como elementos homogéneos y separados debido al número limitado de elementos de bases de datos y estructuras computacionales disponibles, y a la facilidad con la que se pueden crear estas estructuras primitivas. [ cita necesaria ]
La dependencia espacial es la relación espacial de valores variables (para temas definidos en el espacio, como la lluvia ) o ubicaciones (para temas definidos como objetos, como las ciudades). La dependencia espacial se mide como la existencia de dependencia estadística en un conjunto de variables aleatorias , cada una de las cuales está asociada con una ubicación geográfica diferente . La dependencia espacial es importante en aplicaciones donde es razonable postular la existencia de un conjunto correspondiente de variables aleatorias en ubicaciones que no han sido incluidas en una muestra. Por lo tanto, la lluvia puede medirse en un conjunto de ubicaciones de pluviómetros, y dichas mediciones pueden considerarse como resultados de variables aleatorias, pero la lluvia claramente ocurre en otras ubicaciones y nuevamente sería aleatoria. Debido a que la lluvia exhibe propiedades de autocorrelación , se pueden utilizar técnicas de interpolación espacial para estimar las cantidades de lluvia en ubicaciones cercanas a las ubicaciones medidas. [32]
Al igual que con otros tipos de dependencia estadística, la presencia de dependencia espacial generalmente conduce a que las estimaciones de un valor promedio de una muestra sean menos precisas que si las muestras hubieran sido independientes, aunque si existe una dependencia negativa, un promedio de muestra puede ser mejor que en el caso independiente. . Un problema diferente al de estimar un promedio general es el de la interpolación espacial : aquí el problema es estimar los resultados aleatorios no observados de variables en ubicaciones intermedias a los lugares donde se realizan las mediciones, de ahí que exista una dependencia espacial entre los resultados aleatorios observados y no observados. variables. [ cita necesaria ]
Las herramientas para explorar la dependencia espacial incluyen: correlación espacial , funciones de covarianza espacial y semivariogramas . Los métodos de interpolación espacial incluyen Kriging , que es un tipo de mejor predicción lineal insesgada . El tema de la dependencia espacial es de importancia para la geoestadística y el análisis espacial. [ cita necesaria ]
La dependencia espacial es la covariación de propiedades dentro del espacio geográfico: las características en ubicaciones próximas parecen estar correlacionadas, ya sea positiva o negativamente. [33] La dependencia espacial conduce al problema de la autocorrelación espacial en estadística ya que, al igual que la autocorrelación temporal, esto viola las técnicas estadísticas estándar que asumen independencia entre las observaciones. Por ejemplo, los análisis de regresión que no compensan la dependencia espacial pueden tener estimaciones de parámetros inestables y generar pruebas de significancia poco confiables. Los modelos de regresión espacial (ver más abajo) capturan estas relaciones y no adolecen de estas debilidades. También es apropiado ver la dependencia espacial como una fuente de información más que como algo que debe corregirse. [34]
Los efectos de ubicación también se manifiestan como heterogeneidad espacial , o la variación aparente en un proceso con respecto a la ubicación en el espacio geográfico. A menos que un espacio sea uniforme e ilimitado, cada ubicación tendrá cierto grado de singularidad en relación con las demás ubicaciones. Esto afecta las relaciones de dependencia espacial y por tanto el proceso espacial. La heterogeneidad espacial significa que los parámetros generales estimados para todo el sistema pueden no describir adecuadamente el proceso en un lugar determinado. [ cita necesaria ]
La asociación espacial es el grado en que las cosas están dispuestas de manera similar en el espacio. El análisis de los patrones de distribución de dos fenómenos se realiza mediante superposición de mapas. Si las distribuciones son similares, entonces la asociación espacial es fuerte y viceversa. [35] En un Sistema de Información Geográfica , el análisis se puede hacer de forma cuantitativa. Por ejemplo, un conjunto de observaciones (como puntos o extraídas de celdas ráster) en ubicaciones coincidentes se puede cruzar y examinar mediante análisis de regresión .
Al igual que la autocorrelación espacial , esta puede ser una herramienta útil para la predicción espacial. En el modelado espacial, el concepto de asociación espacial permite el uso de covariables en una ecuación de regresión para predecir el campo geográfico y así producir un mapa.
La segunda dimensión de asociación espacial (SDA) revela la asociación entre variables espaciales mediante la extracción de información geográfica en ubicaciones fuera de las muestras. SDA utiliza eficazmente la información geográfica faltante fuera de las ubicaciones de muestra en métodos de la primera dimensión de asociación espacial (FDA), que exploran la asociación espacial utilizando observaciones en ubicaciones de muestra. [36]
La escala de medición espacial es un problema persistente en el análisis espacial; Hay más detalles disponibles en la entrada del tema Problema de unidad de área modificable (MAUP). Los ecologistas del paisaje desarrollaron una serie de métricas invariantes de escala para aspectos de la ecología que son de naturaleza fractal . [37] En términos más generales, no existe un acuerdo generalizado sobre ningún método de análisis independiente de la escala para las estadísticas espaciales. [ cita necesaria ]
El muestreo espacial implica determinar un número limitado de ubicaciones en el espacio geográfico para medir fielmente fenómenos que están sujetos a dependencia y heterogeneidad. [ cita necesaria ] La dependencia sugiere que dado que una ubicación puede predecir el valor de otra ubicación, no necesitamos observaciones en ambos lugares. Pero la heterogeneidad sugiere que esta relación puede cambiar a través del espacio y, por lo tanto, no podemos confiar en un grado observado de dependencia más allá de una región que puede ser pequeña. Los esquemas básicos de muestreo espacial incluyen aleatorio, agrupado y sistemático. Estos esquemas básicos se pueden aplicar en múltiples niveles en una jerarquía espacial designada (por ejemplo, área urbana, ciudad, vecindario). También es posible explotar datos auxiliares, por ejemplo, utilizando los valores de las propiedades como guía en un esquema de muestreo espacial para medir el nivel educativo y los ingresos. Los modelos espaciales como las estadísticas de autocorrelación, la regresión y la interpolación (ver más abajo) también pueden dictar el diseño de la muestra. [ cita necesaria ]
Las cuestiones fundamentales del análisis espacial conducen a numerosos problemas en el análisis, incluidos sesgos, distorsiones y errores absolutos en las conclusiones alcanzadas. Estas cuestiones suelen estar interrelacionadas, pero se han hecho varios intentos de separar determinadas cuestiones entre sí. [38]
Al analizar la costa de Gran Bretaña , Benoit Mandelbrot demostró que ciertos conceptos espaciales son inherentemente absurdos a pesar de la presunción de su validez. Las longitudes en ecología dependen directamente de la escala en la que se miden y experimentan. Entonces, si bien los topógrafos suelen medir la longitud de un río, esta longitud sólo tiene significado en el contexto de la relevancia de la técnica de medición para la cuestión en estudio. [39]
La falacia de ubicación se refiere al error debido a la caracterización espacial particular elegida para los elementos de estudio, en particular la elección de ubicación para la presencia espacial del elemento. [39]
Las caracterizaciones espaciales pueden ser simplistas o incluso erróneas. Los estudios sobre humanos a menudo reducen la existencia espacial de los humanos a un solo punto, por ejemplo la dirección de su casa. Esto puede conducir fácilmente a un análisis deficiente, por ejemplo, cuando se considera la transmisión de enfermedades que puede ocurrir en el trabajo o en la escuela y, por lo tanto, lejos del hogar. [39]
La caracterización espacial puede limitar implícitamente el tema de estudio. Por ejemplo, el análisis espacial de los datos sobre delitos se ha vuelto popular recientemente, pero estos estudios sólo pueden describir los tipos particulares de delitos que pueden describirse espacialmente. Esto conduce a muchos mapas de agresión, pero no a mapas de malversación de fondos con consecuencias políticas en la conceptualización del crimen y el diseño de políticas para abordar el problema. [39]
Esto describe errores debidos al tratamiento de elementos como "átomos" separados fuera de su contexto espacial. [39] La falacia consiste en transferir conclusiones individuales a unidades espaciales. [40]
La falacia ecológica describe errores debidos a la realización de análisis de datos agregados al intentar llegar a conclusiones sobre unidades individuales. [39] [41] Los errores se producen en parte debido a la agregación espacial. Por ejemplo, un píxel representa las temperaturas superficiales promedio dentro de un área. La falacia ecológica sería suponer que todos los puntos dentro del área tienen la misma temperatura.
Un espacio matemático existe siempre que tenemos un conjunto de observaciones y medidas cuantitativas de sus atributos. Por ejemplo, podemos representar los ingresos de los individuos o los años de educación dentro de un sistema de coordenadas donde la ubicación de cada individuo se puede especificar con respecto a ambas dimensiones. La distancia entre los individuos dentro de este espacio es una medida cuantitativa de sus diferencias con respecto a los ingresos y la educación. Sin embargo, en el análisis espacial nos ocupamos de tipos específicos de espacios matemáticos, a saber, el espacio geográfico. En el espacio geográfico, las observaciones corresponden a ubicaciones en un marco de medición espacial que captura su proximidad en el mundo real. Las ubicaciones en un marco de medición espacial a menudo representan ubicaciones en la superficie de la Tierra, pero esto no es estrictamente necesario. Un marco de medición espacial también puede capturar la proximidad con respecto a, por ejemplo, el espacio interestelar o dentro de una entidad biológica como un hígado. El principio fundamental es la Primera Ley de la Geografía de Tobler : si la interrelación entre entidades aumenta con la proximidad en el mundo real, entonces la representación en el espacio geográfico y la evaluación mediante técnicas de análisis espacial son apropiadas.
La distancia euclidiana entre ubicaciones a menudo representa su proximidad, aunque ésta es sólo una posibilidad. Hay una infinidad de distancias además de las euclidianas que pueden soportar el análisis cuantitativo. Por ejemplo, las distancias "Manhattan" (o " Taxi ") donde el movimiento está restringido a caminos paralelos a los ejes pueden ser más significativas que las distancias euclidianas en entornos urbanos. Además de las distancias, otras relaciones geográficas como la conectividad (por ejemplo, la existencia o el grado de fronteras compartidas) y la dirección también pueden influir en las relaciones entre entidades. También es posible calcular trayectorias de costos mínimos a lo largo de una superficie de costos; por ejemplo, esto puede representar la proximidad entre ubicaciones cuando el viaje debe realizarse a través de un terreno accidentado.
Los datos espaciales existen en muchas variedades y no es fácil llegar a un sistema de clasificación que sea a la vez exclusivo, exhaustivo, imaginativo y satisfactorio. -- G. Upton y B. Fingelton [42]
Los estudios urbanos y regionales se ocupan de grandes tablas de datos espaciales obtenidos de censos y encuestas. Es necesario simplificar la enorme cantidad de información detallada para poder extraer las principales tendencias. El análisis multivariable (o análisis factorial , FA) permite un cambio de variables, transformando las numerosas variables del censo, normalmente correlacionadas entre sí, en menos "Factores" o "Componentes Principales" independientes que son, en realidad, los vectores propios de la correlación de datos. matriz ponderada por la inversa de sus valores propios. Este cambio de variables tiene dos ventajas principales:
El análisis factorial depende de medir distancias entre observaciones: la elección de una métrica significativa es crucial. Entre las más utilizadas se encuentran la métrica euclidiana (Análisis de Componentes Principales), la distancia Chi-Cuadrado (Análisis de Correspondencias) o la distancia Generalizada de Mahalanobis (Análisis Discriminante). [43] Se han propuesto modelos más complicados, que utilizan comunalidades o rotaciones. [44]
El uso de métodos multivariados en el análisis espacial comenzó realmente en la década de 1950 (aunque algunos ejemplos se remontan a principios de siglo) y culminó en la década de 1970, con el creciente poder y accesibilidad de las computadoras. Ya en 1948, en una publicación fundamental, dos sociólogos, Wendell Bell y Eshref Shevky, [45] habían demostrado que la mayoría de las poblaciones urbanas de Estados Unidos y del mundo podían representarse mediante tres factores independientes: 1- el « estatus socioeconómico » oponer distritos ricos y pobres y distribuirlos en sectores que discurren a lo largo de las autopistas desde el centro de la ciudad, 2- el « ciclo de vida », es decir, la estructura por edades de los hogares, distribuidos en círculos concéntricos, y 3- « raza y etnia », identificando parches de inmigrantes ubicados dentro de la ciudad. En 1961, en un estudio innovador, los geógrafos británicos utilizaron FA para clasificar las ciudades británicas. [46] Brian J Berry, de la Universidad de Chicago, y sus estudiantes hicieron un amplio uso del método, [47] aplicándolo a las ciudades más importantes del mundo y exhibiendo estructuras sociales comunes. [48] El uso del Análisis Factorial en Geografía, tan fácil gracias a las computadoras modernas, ha sido muy amplio pero no siempre muy inteligente. [49]
Dado que los vectores extraídos están determinados por la matriz de datos, no es posible comparar factores obtenidos de diferentes censos. Una solución consiste en fusionar varias matrices censales en una única tabla que, luego, pueda ser analizada. Sin embargo, esto supone que la definición de las variables no ha cambiado con el tiempo y produce tablas muy grandes, difíciles de gestionar. Una solución mejor, propuesta por psicometristas [50] , agrupa los datos en una «matriz cúbica», con tres entradas (por ejemplo, ubicaciones, variables, períodos de tiempo). Un análisis factorial de tres vías produce entonces tres grupos de factores relacionados por una pequeña «matriz central» cúbica. [51] Este método, que muestra la evolución de los datos a lo largo del tiempo, no se ha utilizado ampliamente en geografía. [52] En Los Ángeles, [53] sin embargo, ha exhibido el papel, tradicionalmente ignorado, del Downtown como centro organizador de toda la ciudad durante varias décadas.
Las estadísticas de autocorrelación espacial miden y analizan el grado de dependencia entre observaciones en un espacio geográfico. Las estadísticas de autocorrelación espacial clásicas incluyen la de Moran , la de Geary , la de Getis y la elipse de desviación estándar. Estas estadísticas requieren medir una matriz de pesos espaciales que refleje la intensidad de la relación geográfica entre observaciones en un vecindario, por ejemplo, las distancias entre vecinos, las longitudes de la frontera compartida o si caen en una clase direccional específica como "oeste". Las estadísticas clásicas de autocorrelación espacial comparan los pesos espaciales con la relación de covarianza en pares de ubicaciones. La autocorrelación espacial que es más positiva de lo esperado por azar indica la agrupación de valores similares en todo el espacio geográfico, mientras que una autocorrelación espacial negativa significativa indica que los valores vecinos son más diferentes de lo esperado por azar, lo que sugiere un patrón espacial similar a un tablero de ajedrez.
Las estadísticas de autocorrelación espacial como las de Moran y Geary son globales en el sentido de que estiman el grado general de autocorrelación espacial de un conjunto de datos. La posibilidad de heterogeneidad espacial sugiere que el grado estimado de autocorrelación puede variar significativamente a lo largo del espacio geográfico. Las estadísticas de autocorrelación espacial local proporcionan estimaciones desglosadas al nivel de las unidades de análisis espacial, lo que permite evaluar las relaciones de dependencia en el espacio. Las estadísticas comparan los vecindarios con un promedio global e identifican regiones locales con fuerte autocorrelación. También están disponibles versiones locales de y estadísticas.
La interacción espacial o " modelos de gravedad " estiman el flujo de personas, materiales o información entre ubicaciones en el espacio geográfico. Los factores pueden incluir variables propulsoras del origen, como el número de viajeros en áreas residenciales, variables de atractivo del destino, como la cantidad de espacio para oficinas en las áreas de empleo, y relaciones de proximidad entre las ubicaciones medidas en términos como la distancia de conducción o el tiempo de viaje. Además, se deben identificar las relaciones topológicas o conectivas entre áreas, particularmente considerando la relación a menudo conflictiva entre distancia y topología; por ejemplo, dos vecindarios espacialmente cercanos pueden no mostrar ninguna interacción significativa si están separados por una carretera. Después de especificar las formas funcionales de estas relaciones, el analista puede estimar los parámetros del modelo utilizando datos de flujo observado y técnicas de estimación estándar, como mínimos cuadrados ordinarios o máxima verosimilitud. Las versiones de destinos en competencia de modelos de interacción espacial incluyen la proximidad entre los destinos (u orígenes) además de la proximidad origen-destino; esto captura los efectos de la agrupación de destino (origen) en los flujos.
Los métodos de interpolación espacial estiman las variables en ubicaciones no observadas en el espacio geográfico en función de los valores en ubicaciones observadas. Los métodos básicos incluyen ponderación de distancia inversa : esto atenúa la variable con una proximidad decreciente desde la ubicación observada. Kriging es un método más sofisticado que interpola a través del espacio de acuerdo con una relación de retraso espacial que tiene componentes tanto sistemáticos como aleatorios. Esto puede acomodar una amplia gama de relaciones espaciales para los valores ocultos entre ubicaciones observadas. Kriging proporciona estimaciones óptimas dada la relación de retraso hipotética, y las estimaciones de error se pueden mapear para determinar si existen patrones espaciales.
Los métodos de regresión espacial capturan la dependencia espacial en el análisis de regresión , evitando problemas estadísticos como parámetros inestables y pruebas de significancia poco confiables, además de proporcionar información sobre las relaciones espaciales entre las variables involucradas. Dependiendo de la técnica específica, la dependencia espacial puede ingresar al modelo de regresión como relaciones entre las variables independientes y las dependientes, entre las variables dependientes y un rezago espacial de sí mismo, o en términos de error. La regresión ponderada geográficamente (GWR) es una versión local de la regresión espacial que genera parámetros desagregados por las unidades espaciales de análisis. [54] Esto permite evaluar la heterogeneidad espacial en las relaciones estimadas entre las variables independientes y dependientes. El uso del modelado jerárquico bayesiano [55] junto con los métodos Monte Carlo de cadena de Markov (MCMC) ha demostrado recientemente ser eficaz en el modelado de relaciones complejas utilizando modelos Poisson-Gamma-CAR, Poisson-lognormal-SAR o logit sobredispersado. Los paquetes estadísticos para implementar dichos modelos bayesianos usando MCMC incluyen WinBugs , CrimeStat y muchos paquetes disponibles a través del lenguaje de programación R. [56]
Los procesos estocásticos espaciales, como los procesos gaussianos, también se utilizan cada vez más en el análisis de regresión espacial. Se han aplicado versiones basadas en modelos de GWR, conocidas como modelos de coeficientes de variación espacial, para realizar inferencia bayesiana. [55] El proceso estocástico espacial puede convertirse en modelos de procesos gaussianos computacionalmente efectivos y escalables, como los procesos predictivos gaussianos [57] y los procesos gaussianos del vecino más cercano (NNGP). [58]
Los modelos de interacción espacial son agregados y de arriba hacia abajo: especifican una relación de gobierno general para el flujo entre ubicaciones. Esta característica también es compartida por modelos urbanos como los basados en programación matemática, flujos entre sectores económicos o teoría de oferta y renta. Una perspectiva de modelado alternativa es representar el sistema al nivel más alto posible de desagregación y estudiar el surgimiento de abajo hacia arriba de patrones y relaciones complejos a partir del comportamiento y las interacciones a nivel individual. [ cita necesaria ]
La teoría de sistemas adaptativos complejos aplicada al análisis espacial sugiere que interacciones simples entre entidades próximas pueden conducir a entidades espaciales intrincadas, persistentes y funcionales a niveles agregados. Dos métodos de simulación fundamentalmente espacial son los autómatas celulares y el modelado basado en agentes. El modelado de autómatas celulares impone un marco espacial fijo, como celdas de cuadrícula, y especifica reglas que dictan el estado de una celda en función de los estados de sus celdas vecinas. A medida que avanza el tiempo, surgen patrones espaciales a medida que las células cambian de estado en función de sus vecinas; esto altera las condiciones para períodos de tiempo futuros. Por ejemplo, las celdas pueden representar ubicaciones en un área urbana y sus estados pueden ser diferentes tipos de uso del suelo. Los patrones que pueden surgir de las simples interacciones de los usos locales del suelo incluyen distritos de oficinas y expansión urbana . El modelado basado en agentes utiliza entidades de software (agentes) que tienen un comportamiento determinado (metas) y pueden reaccionar, interactuar y modificar su entorno mientras buscan sus objetivos. A diferencia de las células de los autómatas celulares, los simultistas pueden permitir que los agentes sean móviles con respecto al espacio. Por ejemplo, se podría modelar el flujo y la dinámica del tráfico utilizando agentes que representen vehículos individuales que intenten minimizar el tiempo de viaje entre orígenes y destinos específicos. Al tiempo que persiguen tiempos mínimos de viaje, los agentes deben evitar colisiones con otros vehículos buscando también minimizar sus tiempos de viaje. Los autómatas celulares y el modelado basado en agentes son estrategias de modelado complementarias. Pueden integrarse en un sistema de autómata geográfico común donde algunos agentes son fijos mientras que otros son móviles.
La calibración juega un papel fundamental en los enfoques de modelado y simulación de CA y ABM. Los enfoques iniciales de CA propusieron enfoques de calibración sólidos basados en métodos estocásticos de Monte Carlo. [62] [63] Los enfoques ABM se basan en las reglas de decisión de los agentes (en muchos casos extraídas de métodos básicos de investigación cualitativa, como los cuestionarios). [64] Los algoritmos de aprendizaje automático recientes se calibran utilizando conjuntos de entrenamiento, por ejemplo, para comprender las cualidades del entorno construido. [65]
El análisis espacial de un modelo geológico conceptual es el objetivo principal de cualquier algoritmo MPS. El método analiza las estadísticas espaciales del modelo geológico, denominada imagen de entrenamiento, y genera realizaciones de los fenómenos que respetan esas estadísticas de múltiples puntos de entrada.
Un algoritmo MPS reciente utilizado para realizar esta tarea es el método basado en patrones de Honarkhah. [66] En este método, se emplea un enfoque basado en la distancia para analizar los patrones en la imagen de entrenamiento. Esto permite la reproducción de estadísticas de múltiples puntos y las características geométricas complejas de la imagen de entrenamiento. Cada salida del algoritmo MPS es una realización que representa un campo aleatorio. En conjunto, se pueden utilizar varias realizaciones para cuantificar la incertidumbre espacial.
Uno de los métodos recientes es presentado por Tahmasebi et al. [67] utiliza una función de correlación cruzada para mejorar la reproducción del patrón espacial. Llaman a su método de simulación MPS algoritmo CCSIM. Este método es capaz de cuantificar la conectividad espacial, la variabilidad y la incertidumbre. Además, el método no es sensible a ningún tipo de datos y es capaz de simular escenarios tanto categóricos como continuos. El algoritmo CCSIM se puede utilizar para cualquier sistema estacionario, no estacionario y multivariado y puede proporcionar un modelo de atractivo visual de alta calidad. [68] [69]
El análisis geoespacial e hidroespacial , o simplemente análisis espacial , [70] es un enfoque para aplicar análisis estadístico y otras técnicas analíticas a datos que tienen un aspecto geográfico o espacial. Dicho análisis normalmente emplearía software capaz de representar mapas, procesar datos espaciales y aplicar métodos analíticos a conjuntos de datos terrestres o geográficos , incluido el uso de sistemas de información geográfica y geomática . [71] [72] [73]
Los sistemas de información geográfica (SIG), un gran dominio que proporciona una variedad de capacidades diseñadas para capturar, almacenar, manipular, analizar, gestionar y presentar todo tipo de datos geográficos, utilizan análisis geoespaciales e hidroespaciales en una variedad de contextos, operaciones y aplicaciones. .
El análisis geoespacial e hidroespacial, utilizando SIG , se desarrolló para problemas de las ciencias ambientales y de la vida, en particular ecología , geología y epidemiología . Se ha extendido a casi todas las industrias, incluidas defensa, inteligencia, servicios públicos, recursos naturales (es decir, petróleo y gas, silvicultura, etc.), ciencias sociales, medicina y seguridad pública (es decir, gestión de emergencias y criminología), reducción y gestión del riesgo de desastres. (DRRM) y adaptación al cambio climático (ACC). Las estadísticas espaciales suelen resultar principalmente de la observación más que de la experimentación. Hidroespacial se utiliza particularmente para el lado acuático y los miembros relacionados con la superficie del agua, la columna, el fondo, el subfondo y las zonas costeras.
Los SIG basados en vectores suelen estar relacionados con operaciones como la superposición de mapas (combinar dos o más mapas o capas de mapas de acuerdo con reglas predefinidas), el almacenamiento en zonas intermedias simples (identificar regiones de un mapa dentro de una distancia específica de una o más entidades, como ciudades, carreteras o ríos) y operaciones básicas similares. Esto refleja (y se refleja en) el uso del término análisis espacial dentro del Open Geospatial Consortium ( OGC ) “especificaciones de características simples”. Para los SIG basados en ráster, ampliamente utilizados en las ciencias ambientales y la teledetección, esto normalmente significa una serie de acciones aplicadas a las celdas de la cuadrícula de uno o más mapas (o imágenes) que a menudo implican filtrado y/u operaciones algebraicas (álgebra de mapas). Estas técnicas implican procesar una o más capas ráster de acuerdo con reglas simples que dan como resultado una nueva capa de mapa, por ejemplo reemplazando cada valor de celda con alguna combinación de los valores de sus vecinas, o calculando la suma o diferencia de valores de atributos específicos para cada celda de la cuadrícula en dos conjuntos de datos ráster coincidentes. Las estadísticas descriptivas, como recuentos de células, medias, varianzas, máximos, mínimos, valores acumulativos, frecuencias y una serie de otras medidas y cálculos de distancia también se incluyen a menudo en este término genérico de análisis espacial. El análisis espacial incluye una gran variedad de técnicas estadísticas ( estadística descriptiva, exploratoria y explicativa ) que se aplican a datos que varían espacialmente y que pueden variar con el tiempo. Algunas técnicas estadísticas más avanzadas incluyen Getis-ord Gi* o Anselin Local Moran's I, que se utilizan para determinar patrones de agrupación de datos referenciados espacialmente.
El análisis geoespacial e hidroespacial va más allá de las operaciones cartográficas 2D y 3D y las estadísticas espaciales. Es multidimensional y también temporal e incluye:
Tradicionalmente, la computación geoespacial e hidroespacial se ha realizado principalmente en computadoras personales (PC) o servidores. Sin embargo, debido a las crecientes capacidades de los dispositivos móviles, la computación geoespacial en dispositivos móviles es una tendencia de rápido crecimiento. [74] La naturaleza portátil de estos dispositivos, así como la presencia de sensores útiles, como los receptores del Sistema Global de Navegación por Satélite (GNSS) y los sensores de presión barométrica, los hacen útiles para capturar y procesar información geoespacial e hidroespacial en el campo. Además del procesamiento local de información geoespacial en dispositivos móviles, otra tendencia creciente es la computación geoespacial basada en la nube. En esta arquitectura, los datos se pueden recopilar en el campo utilizando dispositivos móviles y luego transmitirlos a servidores basados en la nube para su posterior procesamiento y almacenamiento final. De manera similar, la información geoespacial e hidroespacial puede estar disponible para dispositivos móviles conectados a través de la nube, permitiendo el acceso a vastas bases de datos de información geoespacial e hidroespacial en cualquier lugar donde esté disponible una conexión de datos inalámbrica.
Los sistemas de información geográfica (SIG) y la ciencia de la información geográfica subyacente que promueve estas tecnologías tienen una fuerte influencia en el análisis espacial. La creciente capacidad de capturar y manejar datos geográficos significa que el análisis espacial se produce en entornos cada vez más ricos en datos. Los sistemas de captura de datos geográficos incluyen imágenes de sensores remotos, sistemas de monitoreo ambiental , como sistemas de transporte inteligentes, y tecnologías con reconocimiento de ubicación, como dispositivos móviles que pueden informar la ubicación casi en tiempo real. Los SIG proporcionan plataformas para gestionar estos datos, calcular relaciones espaciales como distancia, conectividad y relaciones direccionales entre unidades espaciales, y visualizar tanto los datos sin procesar como los resultados analíticos espaciales dentro de un contexto cartográfico. Los subtipos incluyen: