La topología geoespacial es el estudio y la aplicación de relaciones espaciales cualitativas entre características geográficas , o entre representaciones de dichas características en información geográfica , como en los sistemas de información geográfica (SIG). [1] Por ejemplo, el hecho de que dos regiones se superpongan o que una contenga a la otra son ejemplos de relaciones topológicas. Es, por tanto, la aplicación de las matemáticas de la topología a los SIG, y es distinta, pero complementaria, de los muchos aspectos de la información geográfica que se basan en mediciones espaciales cuantitativas a través de la geometría de coordenadas . La topología aparece en muchos aspectos de la ciencia de la información geográfica y la práctica de los SIG, incluido el descubrimiento de relaciones inherentes a través de consultas espaciales , superposición vectorial y álgebra de mapas ; la aplicación de relaciones esperadas como reglas de validación almacenadas en datos geoespaciales; y el uso de relaciones topológicas almacenadas en aplicaciones como el análisis de redes . [2] [3] [4] La topología espacial es la generalización de la topología geoespacial para dominios no geográficos, por ejemplo, software CAD .
De acuerdo con la definición de topología , una relación topológica entre dos fenómenos geográficos es cualquier relación espacial que no sea sensible a aspectos mensurables del espacio, incluidas las transformaciones del espacio (por ejemplo, la proyección de mapas ). Por lo tanto, incluye la mayoría de las relaciones espaciales cualitativas, como dos características que son "adyacentes", "superpuestas", "disjuntas" o que una está "dentro" de otra; por el contrario, una característica que está "a 5 km" de otra, o una característica que está "al norte" de otra son relaciones métricas . Uno de los primeros desarrollos de la Ciencia de la Información Geográfica a principios de la década de 1990 fue el trabajo de Max Egenhofer, Eliseo Clementini, Peter di Felice y otros para desarrollar una teoría concisa de tales relaciones comúnmente llamada el Modelo de 9 Intersecciones , que caracteriza el rango de relaciones topológicas basadas en las relaciones entre los interiores, exteriores y límites de las características. [5] [6] [7] [8]
Estas relaciones también se pueden clasificar semánticamente:
La topología fue una preocupación muy temprana para los SIG. Los primeros sistemas vectoriales, como el Sistema de Información Geográfica Canadiense , no manejaban relaciones topológicas, y proliferaron problemas como los polígonos de franjas, especialmente en operaciones como la superposición vectorial . [9] En respuesta, se desarrollaron modelos de datos vectoriales topológicos , como GBF/DIME (Oficina del Censo de EE. UU., 1967) y POLYVRT ( Universidad de Harvard , 1976). [10] La estrategia del modelo de datos topológicos es almacenar relaciones topológicas (principalmente adyacencia) entre entidades y usar esa información para construir entidades más complejas. Los nodos (puntos) se crean donde las líneas se cruzan y se les atribuye una lista de las líneas de conexión. Los polígonos se construyen a partir de cualquier secuencia de líneas que forme un bucle cerrado. Estas estructuras tenían tres ventajas sobre los datos vectoriales no topológicos (a menudo llamados "datos espagueti"): primero, eran eficientes (un factor crucial dadas las capacidades de almacenamiento y procesamiento de la década de 1970), porque el límite compartido entre dos polígonos adyacentes solo se almacenaba una vez; segundo, facilitaban la aplicación de la integridad de los datos al prevenir o resaltar errores topológicos , como polígonos superpuestos, nodos colgantes (una línea que no está conectada correctamente con otras líneas) y polígonos sliver (pequeños polígonos espurios creados donde dos líneas deberían coincidir pero no lo hacen); y tercero, simplificaban los algoritmos para operaciones como la superposición de vectores . [11] Su principal desventaja era su complejidad, siendo difícil de entender para muchos usuarios y requiriendo un cuidado adicional durante la entrada de datos. Estos se convirtieron en el modelo de datos vectoriales dominante de la década de 1980.
En la década de 1990, la combinación de un almacenamiento más barato y nuevos usuarios que no se preocupaban por la topología condujo a un resurgimiento de las estructuras de datos espagueti, como el shapefile . Sin embargo, todavía existe la necesidad de almacenar relaciones topológicas y aplicar la integridad. Un enfoque común en los datos actuales es almacenar como una capa extendida sobre datos que no son inherentemente topológicos. Por ejemplo, la geodatabase de Esri almacena datos vectoriales ("clases de entidad") como datos espagueti, pero puede construir una estructura de "conjunto de datos de red" de conexiones sobre una clase de entidad de línea. La geodatabase también puede almacenar una lista de reglas topológicas, restricciones sobre las relaciones topológicas dentro y entre capas (por ejemplo, los condados no pueden tener huecos, los límites de los estados deben coincidir con los límites de los condados, los condados deben cubrir colectivamente los estados) que se pueden validar y corregir. [12] Otros sistemas, como PostGIS , adoptan un enfoque similar. Un enfoque muy diferente es no almacenar información topológica en los datos, sino construirla dinámicamente, generalmente durante el proceso de edición, para resaltar y corregir posibles errores; esta es una característica del software SIG como ArcGIS Pro y QGIS . [13]
Varias herramientas de análisis espacial se basan en última instancia en el descubrimiento de relaciones topológicas entre características:
Oracle y PostGIS proporcionan operadores topológicos fundamentales que permiten a las aplicaciones probar "relaciones tales como contiene, dentro, cubre, cubierto por, toca y se superpone con límites que se cruzan". [14] [15] A diferencia de la documentación de PostGIS, la documentación de Oracle establece una distinción entre "relaciones topológicas [que] permanecen constantes cuando el espacio de coordenadas se deforma, como por ejemplo mediante torsión o estiramiento" y "relaciones que no son topológicas [que] incluyen longitud de, distancia entre y área de". Las aplicaciones aprovechan estos operadores para garantizar que los conjuntos de datos se almacenen y procesen de una manera topológicamente correcta. Sin embargo, los operadores topológicos son inherentemente complejos y su implementación requiere que se tenga cuidado con la usabilidad y la conformidad con los estándares. [16]