Un modelo de datos geográficos , modelo de datos geoespaciales o simplemente modelo de datos en el contexto de los sistemas de información geográfica , es una estructura matemática y digital para representar fenómenos sobre la Tierra. Generalmente, tales modelos de datos representan varios aspectos de estos fenómenos por medio de datos geográficos , incluyendo ubicaciones espaciales , atributos, cambios a lo largo del tiempo e identidad. Por ejemplo, el modelo de datos vectoriales representa la geografía como colecciones de puntos, líneas y polígonos, y el modelo de datos ráster representa la geografía como matrices de celdas que almacenan valores numéricos. [1] Los modelos de datos se implementan en todo el ecosistema SIG, incluyendo las herramientas de software para la gestión de datos y el análisis espacial , los datos almacenados en una variedad de formatos de archivos SIG , especificaciones y estándares, y diseños específicos para instalaciones SIG.
Si bien la naturaleza única de la información espacial ha dado lugar a su propio conjunto de estructuras de modelos, gran parte del proceso de modelado de datos es similar al resto de la tecnología de la información, incluida la progresión de modelos conceptuales a modelos lógicos y modelos físicos , y la diferencia entre modelos genéricos y diseños específicos de la aplicación.
Historia
Los primeros sistemas informáticos que representaban fenómenos geográficos eran modelos de análisis cuantitativo desarrollados durante la revolución cuantitativa en geografía en los años 1950 y 1960; no podían llamarse sistemas de información geográfica porque no intentaban almacenar datos geográficos en una estructura permanente consistente, sino que eran generalmente modelos estadísticos o matemáticos. El primer software SIG verdadero modelaba información espacial utilizando modelos de datos que llegarían a conocerse como raster o vectoriales:
SYMAP (desarrollado por Howard Fisher , Harvard Laboratory for Computer Graphics and Spatial Analysis , 1963-1967) produjo mapas raster, aunque los datos generalmente se ingresaban como contornos de regiones vectoriales o puntos de muestra y luego se interpolaban en una estructura raster para la salida. [2] El paquete GRID, desarrollado en el laboratorio en 1969 por David Sinton, se basó en SYMAP pero estaba más enfocado en el almacenamiento permanente y el análisis de datos en cuadrícula, convirtiéndose así quizás en el primer software SIG raster de propósito general.
El Sistema de Información Geográfica Canadiense (por Roger Tomlinson , Inventario de Tierras de Canadá, desarrollado entre 1963 y 1968) almacenaba datos de recursos naturales como "caras" (polígonos vectoriales), aunque estos generalmente se derivaban de escaneos rasterizados de mapas en papel. [3]
Al igual que el CGIS, las primeras instalaciones de SIG en los Estados Unidos se centraron a menudo en los inventarios de uso de la tierra y recursos naturales, incluidos el Sistema de información de gestión de tierras de Minnesota (MLMIS, 1969), el Inventario de uso de la tierra y recursos naturales de Nueva York (LUNR, 1970) y el Sistema de información de modelado regional de Oak Ridge (ORRMIS, 1973). A diferencia del CGIS, todos estos eran sistemas ráster inspirados en SYMAP, aunque el MLMIS se basaba en subsecciones del Sistema de topografía pública , que no es una cuadrícula regular perfecta. [5]
La mayoría de los SIG de primera generación se diseñaron a medida para necesidades específicas, con modelos de datos diseñados para almacenarse y procesarse de manera más eficiente utilizando las limitaciones tecnológicas de la época (especialmente las tarjetas perforadas y el tiempo de procesamiento limitado de la computadora central). Durante la década de 1970, los primeros sistemas habían producido resultados suficientes para compararlos y evaluar la eficacia de sus modelos de datos subyacentes. [6] Esto llevó a que los esfuerzos en el Laboratorio de Harvard y en otros lugares se centraran en el desarrollo de una nueva generación de modelos de datos genéricos , como el modelo vectorial topológico POLYVRT que formaría la base para el software comercial y los datos como Esri Coverage. [7]
A medida que el software SIG comercial , las instalaciones SIG y los datos SIG proliferaron en la década de 1980, los académicos comenzaron a buscar modelos conceptuales de fenómenos geográficos que parecieran subyacer a los modelos de datos comunes, tratando de descubrir por qué los modelos de datos raster y vectoriales parecían tener sentido común y cómo medían y representaban el mundo real. [8] Este fue uno de los hilos conductores principales que formaron la subdisciplina de la ciencia de la información geográfica a principios de la década de 1990.
Los avances en el modelado de datos SIG en la década de 1990 fueron impulsados por el rápido aumento tanto de la base de usuarios como de la capacidad de cómputo de los SIG. Las tendencias principales incluyeron 1) el desarrollo de extensiones de los modelos de datos tradicionales para manejar necesidades más complejas, como el tiempo, las estructuras tridimensionales, la incertidumbre y la multimedia; y 2) la necesidad de gestionar de manera eficiente volúmenes exponencialmente crecientes de datos espaciales con necesidades empresariales de acceso y seguridad para múltiples usuarios. Estas tendencias finalmente culminaron en el surgimiento de bases de datos espaciales incorporadas a bases de datos relacionales y bases de datos relacionales de objetos .
Tipos de modelos de datos
Como el mundo es mucho más complejo de lo que se puede representar en una computadora, todos los datos geoespaciales son aproximaciones incompletas del mundo. [9] Por lo tanto, la mayoría de los modelos de datos geoespaciales codifican alguna forma de estrategia para recolectar una muestra finita de un dominio a menudo infinito, y una estructura para organizar la muestra de tal manera que permita la interpolación de la naturaleza de la porción no muestreada. Por ejemplo, un edificio consta de un número infinito de puntos en el espacio; un polígono vectorial lo representa con unos pocos puntos ordenados, que están conectados en un contorno cerrado por líneas rectas y asumiendo que todos los puntos interiores son parte del edificio; además, un atributo de "altura" puede ser la única representación de su volumen tridimensional.
El proceso de diseño de modelos de datos geoespaciales es similar al de modelado de datos en general, al menos en su patrón general. Por ejemplo, se puede segmentar en tres niveles distintos de abstracción de modelos: [10]
Modelo de datos conceptual , una especificación de alto nivel de cómo se organiza la información en la mente y en los procesos empresariales, sin tener en cuenta las restricciones de los SIG y otros sistemas informáticos. Es habitual desarrollar y representar un modelo conceptual de forma visual utilizando herramientas como un modelo entidad-relación .
Modelo lógico de datos , estrategia amplia para representar el modelo conceptual en la computadora, a veces novedosa pero a menudo dentro del marco de software, hardware y estándares existentes. El lenguaje de modelado unificado (UML), específicamente el diagrama de clases , se usa comúnmente para desarrollar visualmente modelos lógicos y físicos.
Modelo de datos físicos , la especificación detallada de cómo se estructurarán los datos en la memoria o en los archivos.
Cada uno de estos modelos puede diseñarse en una de dos situaciones o ámbitos :
Un modelo de datos genérico está pensado para ser empleado en una amplia variedad de aplicaciones, mediante el descubrimiento de patrones consistentes en las formas en que la sociedad en general conceptualiza la información y/o las estructuras que funcionan de manera más eficiente en las computadoras. Por ejemplo, el campo es un modelo conceptual genérico de fenómenos geográficos, el modelo de base de datos relacional y el vector son modelos lógicos genéricos, mientras que el formato shapefile es un modelo físico genérico. Estos modelos se implementan típicamente directamente en software de información y formatos de archivo SIG . En el pasado, estos modelos han sido diseñados por investigadores académicos, por organismos de normalización como el Open Geospatial Consortium y por proveedores de software como Esri . Si bien los modelos académicos y estándar son públicos (y a veces de código abierto ), las empresas pueden optar por mantener los detalles de su modelo en secreto (como Esri intentó hacer con la cobertura y la geodatabase de archivos) o publicarlos abiertamente (como Esri hizo con el shapefile). [11]
Un modelo de datos específico o diseño SIG es una especificación de los datos necesarios para una aplicación SIG de una empresa o proyecto en particular. Generalmente se crea dentro de las limitaciones de los modelos de datos genéricos elegidos, de modo que se pueda utilizar el software SIG existente. Por ejemplo, un modelo de datos para una ciudad incluiría una lista de capas de datos que se incluirán (por ejemplo, carreteras, edificios, parcelas, zonificación), y cada una se especificaría con el tipo de modelo de datos espaciales genérico que se utilizará (por ejemplo, ráster o vector), opciones de parámetros como el sistema de coordenadas y sus columnas de atributos.
Modelos espaciales conceptuales
Los modelos conceptuales geoespaciales genéricos intentan capturar tanto la naturaleza física de los fenómenos geográficos como la forma en que las personas piensan sobre ellos y trabajan con ellos. [12] A diferencia del proceso de modelado estándar descrito anteriormente, los modelos de datos sobre los que se construye el SIG no se diseñaron originalmente con base en un modelo conceptual general de los fenómenos geográficos, sino que se diseñaron en gran medida de acuerdo con la conveniencia técnica, probablemente influenciados por conceptualizaciones de sentido común que aún no se habían documentado.
Dicho esto, un marco conceptual temprano que fue muy influyente en el desarrollo temprano de los SIG fue el reconocimiento por parte de Brian Berry y otros de que la información geográfica se puede descomponer en la descripción de tres aspectos muy diferentes de cada fenómeno: espacio, tiempo y atributo/propiedad/tema. [13] Como desarrollo posterior en 1978, David Sinton presentó un marco que caracterizaba diferentes estrategias para la medición, los datos y el mapeo como mantener uno de los tres aspectos constante, controlar un segundo y medir el tercero. [14]
Durante los años 1980 y 1990, un conjunto de teorías de la información espacial emergió gradualmente como un subcampo importante de la ciencia de la información geográfica , incorporando elementos de la filosofía (especialmente la ontología ), la lingüística y las ciencias de la cognición espacial . A principios de los años 1990, había surgido una dicotomía básica de dos formas alternativas de dar sentido al mundo y sus contenidos:
Un objeto (también llamado característica o entidad ) es una "cosa" distinta, comprendida como un todo. Puede ser un objeto material visible, como un edificio o una carretera, o una entidad abstracta, como un condado o el área de mercado de una tienda minorista.
Un campo es una propiedad que varía en el espacio, de modo que potencialmente tiene un valor medible distinto en cualquier lugar dentro de su extensión. Puede ser una característica física, directamente medible de la materia, similar a las propiedades intensivas de la química, como la temperatura o la densidad; o puede ser un concepto abstracto definido a través de un modelo matemático, como la probabilidad de que una persona que viva en cada lugar use un parque local. [15]
Estos dos modelos conceptuales no tienen como objetivo representar fenómenos diferentes, sino que a menudo son formas diferentes de conceptualizar y describir el mismo fenómeno. Por ejemplo, un lago es un objeto, pero la temperatura, la claridad y la proporción de contaminación del agua del lago son campos (el agua en sí misma puede considerarse como un tercer concepto de una masa , pero esto no es tan ampliamente aceptado como los objetos y los campos). [16]
Modelo de datos vectoriales
El modelo lógico vectorial representa cada ubicación geográfica o fenómeno mediante una forma geométrica y un conjunto de valores para sus atributos. Cada forma geométrica se representa mediante geometría de coordenadas , mediante un conjunto estructurado de coordenadas (x,y) en un sistema de coordenadas geográficas , seleccionado de un conjunto de primitivas geométricas disponibles , como puntos, líneas y polígonos.
Aunque existen docenas de formatos de archivos vectoriales (es decir, modelos de datos físicos) utilizados en varios programas SIG, la mayoría se ajusta a la especificación Simple Feature Access (SFA) del Open Geospatial Consortium (OGC). Se desarrolló en la década de 1990 al encontrar puntos en común entre los modelos vectoriales existentes y ahora está consagrada como ISO 19125, el estándar de referencia para el modelo de datos vectoriales. OGC-SFA incluye las siguientes primitivas geométricas vectoriales : [17]
Punto : una única coordenada en un espacio bidimensional o tridimensional. Muchos formatos vectoriales permiten que una única entidad esté formada por varios puntos aislados y tenga una dimensión cero (un MultiPoint en OGC-SFA).
Curva (también llamada polilínea o cadena de líneas ): una línea incluye una cantidad infinita de puntos y tiene una dimensión, pero está representada por una muestra finita y ordenada de puntos (llamados vértices ), lo que permite que el software interpole los puntos intermedios. Tradicionalmente, se trataba de una interpolación lineal (OGC-SFA denomina a este caso una cadena de líneas ), pero algunos formatos vectoriales permiten curvas (normalmente arcos circulares o curvas de Bézier ) o que una única entidad consista en varias curvas disjuntas (una multicurva en OGC-SFA).
Polígono : una región también incluye un número infinito de puntos, por lo que el modelo vectorial representa su límite como una línea cerrada (llamada anillo en OGC-SFA), lo que permite que el software interpole el interior. El software SIG distingue el interior y el exterior al requerir que la línea se ordene en sentido contrario a las agujas del reloj, de modo que el interior siempre esté en el lado izquierdo del límite. En casi todos los formatos, un polígono puede tener "agujeros" (por ejemplo, una isla en un lago) al incluir anillos interiores, cada uno en orden en el sentido de las agujas del reloj (de modo que el interior siga estando a la izquierda). Al igual que con las líneas, se pueden permitir límites curvos; por lo general, una única entidad puede incluir varios polígonos, que OGC-SFA denomina colectivamente superficie .
Texto (también llamado anotación ): una minoría de formatos de datos vectoriales, incluidos la geodatabase de Esri y Autodesk .dwg , admiten el almacenamiento de texto en la base de datos. Una anotación suele representarse como un punto o una curva (la línea base ) con un conjunto de atributos que proporcionan al texto características de contenido y diseño (fuente, tamaño, espaciado, etc.).
La forma geométrica almacenada en un conjunto de datos vectoriales que representa un fenómeno puede o no tener la misma dimensión que el fenómeno del mundo real en sí. [18] Es común representar una característica con una dimensión menor que su naturaleza real, según la escala y el propósito de la representación. Por ejemplo, una ciudad (una región bidimensional) puede representarse como un punto, o una carretera (una estructura tridimensional) puede representarse como una línea. Siempre que el usuario sea consciente de que esto último es una elección de representación y una carretera no es realmente una línea, esta generalización puede ser útil para aplicaciones como el análisis de redes de transporte .
Basados en esta estrategia básica de formas geométricas y atributos, los modelos de datos vectoriales utilizan una variedad de estructuras para recopilarlos en un único conjunto de datos (a menudo llamado capa ), que generalmente contiene un conjunto de características relacionadas (por ejemplo, carreteras). Estos pueden clasificarse en varios enfoques:
El modelo de datos georrelacionales fue la base de la mayoría de los primeros programas SIG vectoriales. [19] Los datos geométricos y los datos de atributos se almacenan por separado; esto se debía originalmente a que los datos geométricos requerían un código específico de SIG para procesarlos, pero se podía utilizar el software de base de datos relacional (RDBMS) existente para gestionar los atributos. Por ejemplo, Esri ARC/INFO (posteriormente ArcInfo ) se componía originalmente de dos programas separados: ARC fue escrito por Esri para la gestión y el análisis espacial, mientras que INFO era un programa RDBMS comercial con licencia. Se lo denominó "georrelacional" porque, de acuerdo con los principios de las bases de datos relacionales, la geometría y los atributos se podían unir haciendo coincidir cada forma con una fila de la tabla utilizando una clave , como el número de fila o un número de identificación. [20]
La base de datos espacial (también llamada modelo basado en objetos [20] ) apareció por primera vez en la década de 1990. También aprovecha la madurez de los sistemas de gestión de bases de datos relacionales , especialmente por su capacidad para gestionar bases de datos empresariales extremadamente grandes. En lugar de almacenar datos geométricos por separado, la base de datos espacial define un tipo de datos de geometría, lo que permite almacenar las formas en una columna en la misma tabla que los atributos, creando un único conjunto de datos unificado para cada capa. La mayoría del software RDBMS (tanto comercial como de código abierto) tienen extensiones espaciales para permitir el almacenamiento y la consulta de datos geométricos, generalmente basados en el estándar Simple Features-SQL del Open Geospatial Consortium [21] . Algunos formatos de datos que no son de base de datos también integran datos geométricos y de atributos para cada objeto en una única estructura, como GeoJSON .
Las estructuras de datos vectoriales también se pueden clasificar según cómo gestionan las relaciones topológicas entre los objetos de un conjunto de datos: [22]
Un modelo de datos topológicos incorpora relaciones topológicas como parte central del diseño del modelo. [18] : 46 El formato GBF/DIME de la Oficina del Censo de los EE. UU. fue probablemente el primer modelo de datos topológicos; otro ejemplo temprano fue POLYVRT, desarrollado en el Laboratorio de Gráficos Informáticos y Análisis Espacial de Harvard en la década de 1970, que eventualmente evolucionó hacia el formato de Cobertura ARC/INFO de Esri. [7] [19] En esta estructura, las líneas se rompen en todos los puntos de intersección; estos nodos pueden almacenar información topológica sobre qué líneas se conectan allí. Los polígonos no se almacenan por separado, sino que se definen como un conjunto de líneas que se cierran colectivamente. Cada línea contiene información sobre los polígonos a su derecha e izquierda, almacenando así explícitamente la adyacencia topológica. Esta estructura fue diseñada para permitir estructuras compuestas de línea-polígono (por ejemplo, el bloque censal), geocodificación de direcciones y análisis de redes de transporte . También tenía el beneficio de una mayor eficiencia de almacenamiento y un error reducido, porque el borde compartido de cada par de polígonos adyacentes solo se digitalizaba una vez. Sin embargo, se trata de una estructura de datos bastante complicada. Casi todos los modelos de datos topológicos también son georrelacionales.
Un modelo de datos espagueti no incluye ninguna información sobre la topología (llamado así porque las hebras individuales en un tazón de espagueti pueden superponerse sin conectarse). [10] : 215 Era común en los primeros sistemas SIG, como el Map Overlay and Statistical System (MOSS), así como en los formatos de datos más recientes, como el shapefile de Esri , el lenguaje de marcado geográfico (GML) y casi todas las bases de datos espaciales . En este modelo, cada geometría de entidad se codifica por separado de cualquier otra en el conjunto de datos, independientemente de si pueden estar relacionadas topológicamente. Por ejemplo, el límite compartido entre dos regiones adyacentes se duplicaría en cada forma de polígono. A pesar del aumento del volumen de datos y el potencial de error sobre los datos topológicos, este modelo ha dominado los SIG desde 2000, en gran parte debido a su simplicidad conceptual. Algunos programas SIG tienen herramientas para validar las reglas de integridad topológica (por ejemplo, no permitir que los polígonos se superpongan o tengan huecos) en datos espagueti para prevenir y/o corregir errores topológicos.
Un modelo de datos topológicos híbrido tiene la opción de almacenar información de relaciones topológicas como una capa separada construida sobre un conjunto de datos espagueti. Un ejemplo es el conjunto de datos de red dentro de la geodatabase de Esri . [23]
Los datos vectoriales se utilizan habitualmente para representar objetos conceptuales (por ejemplo, árboles, edificios, condados), pero también pueden representar campos . Como ejemplo de esto último, un campo de temperatura podría representarse mediante una muestra irregular de puntos (por ejemplo, estaciones meteorológicas), o mediante isotermas , una muestra de líneas de igual temperatura. [10] : 89
Modelo de datos raster
El modelo lógico raster representa un campo utilizando una teselación del espacio geográfico en una matriz bidimensional de ubicaciones regularmente espaciadas (cada una llamada celda ), con un único valor de atributo para cada celda (o más de un valor en un ráster multibanda). Normalmente, cada celda representa una única muestra de punto central (en la que el modelo de medición para todo el ráster se denomina retícula ) o representa un resumen (normalmente la media) de la variable de campo sobre el área cuadrada (en la que el modelo se denomina cuadrícula ) . [9] : 86 El modelo de datos general es esencialmente el mismo que el utilizado para imágenes y otros gráficos raster , con la adición de capacidades para el contexto geográfico. A continuación se muestra un pequeño ejemplo:
Para representar una cuadrícula ráster en un archivo informático, se la debe serializar en una única lista (unidimensional) de valores. Si bien existen varios esquemas de ordenación posibles, el más utilizado es el de fila principal , en el que las celdas de la primera fila son seguidas inmediatamente por las celdas de la segunda fila, de la siguiente manera:
Para reconstruir la cuadrícula original, se requiere un encabezado con parámetros generales para la cuadrícula. Como mínimo, se requiere el número de filas en cada columna para saber dónde comenzar cada nueva fila y el tipo de datos de cada valor (es decir, el número de bits en cada valor antes de comenzar el siguiente valor). [24]
Si bien el modelo ráster está estrechamente vinculado al modelo conceptual de campo, los objetos también pueden representarse en ráster, esencialmente transformando un objeto X en un campo discreto ( booleano ) de presencia/ausencia de X. Alternativamente, una capa de objetos (generalmente polígonos) podría transformarse en un campo discreto de identificadores de objetos. En este caso, algunos formatos de archivos ráster permiten unir una tabla de atributos de tipo vectorial al ráster haciendo coincidir los valores de identificación. [18] Las representaciones ráster de objetos suelen ser temporales, solo se crean y se utilizan como parte de un procedimiento de modelado, en lugar de en un almacén de datos permanente. [20] : 135-137
Para que sea útil en SIG, un archivo ráster debe estar georreferenciado para corresponder a ubicaciones del mundo real, ya que un ráster sin procesar solo puede expresar ubicaciones en términos de filas y columnas. Esto generalmente se hace con un conjunto de parámetros de metadatos , ya sea en el encabezado del archivo (como el formato GeoTIFF ) o en un archivo sidecar (como un archivo mundial ). Como mínimo, los metadatos de georreferenciación deben incluir la ubicación de al menos una celda en el sistema de coordenadas elegido y la resolución o tamaño de celda , la distancia entre cada celda. Una transformación afín lineal es el tipo más común de georreferenciación, que permite la rotación y celdas rectangulares. [18] : 171 Los esquemas de georreferenciación más complejos incluyen transformaciones polinómicas y spline .
A partir de la década de 1990, a medida que los modelos de datos originales y el software SIG maduraban, uno de los focos principales de la investigación sobre modelado de datos fue el desarrollo de extensiones de los modelos tradicionales para manejar información geográfica más compleja.
Modelos espaciotemporales
El tiempo siempre ha desempeñado un papel importante en la geografía analítica, desde al menos la matriz de ciencia regional de Brian Berry (1964) y la geografía del tiempo de Torsten Hägerstrand (1970). [25] [13] En los albores de la era de la ciencia SIG a principios de los años 1990, el trabajo de Gail Langran abrió las puertas a la investigación de métodos para representar explícitamente el cambio a lo largo del tiempo en datos SIG; [26] esto llevó a que surgieran muchos modelos conceptuales y de datos en las décadas posteriores. [27] Algunas formas de datos temporales comenzaron a ser compatibles con el software SIG listo para usar en 2010.
Varios modelos comunes para representar el tiempo en datos SIG vectoriales y rasterizados incluyen: [28]
El modelo de instantáneas (también conocido como capas con sello de tiempo ), en el que un conjunto de datos completo está vinculado a un tiempo válido en particular. Es decir, es una "instantánea" del mundo en ese momento.
Características con marca de tiempo , en las que el conjunto de datos incluye características válidas en distintos momentos, y cada característica lleva la marca del momento en el que fue válida (es decir, las columnas de "fecha de inicio" y "fecha de finalización" en la tabla de atributos). Algunos programas SIG, como ArcGIS Pro, admiten este modelo de forma nativa, con funciones que incluyen animación.
Límites con marca de tiempo , utilizando el modelo de datos vectoriales topológicos para descomponer polígonos en segmentos de límite y marcando cada segmento con el tiempo durante el cual fue válido. Este método fue desarrollado por primera vez por el SIG histórico de Gran Bretaña .
Hechos con sello de tiempo , en los que cada dato individual (incluidos los valores de los atributos) puede tener su propio sello de tiempo, lo que permite que los atributos dentro de una sola característica cambien con el tiempo, o que una sola característica (con identidad constante) tenga diferentes formas geométricas en diferentes momentos. [29]
El tiempo como dimensión , que trata el tiempo como otra dimensión espacial (3.ª o 4.ª) y utiliza estructuras vectoriales o raster multidimensionales para crear geometrías que incorporan el tiempo. Hägerstrand visualizó su geografía del tiempo de esta manera, y algunos modelos SIG basados en ella utilizan este enfoque. El formato NetCDF admite la gestión de datos raster temporales como una dimensión. [30]
Una malla poligonal (relacionada con el poliedro matemático ) es una extensión lógica del modelo de datos vectoriales y es probablemente el tipo de modelo 3D más utilizado en los SIG. Un objeto volumétrico se reduce a su superficie exterior, que está representada por un conjunto de polígonos (a menudo triángulos) que, en conjunto, encierran por completo un volumen.
El modelo de vóxeles es la extensión lógica del modelo de datos raster, mediante la teselación del espacio tridimensional en cubos llamados vóxeles (un acrónimo de volumen y píxel , siendo este último a su vez un acrónimo). NetCDF es uno de los formatos de datos más comunes que admite celdas 3D. [30]
Los mapas de unidades apiladas basados en vectores representan la sucesión vertical de unidades geológicas hasta una profundidad específica (aquí, la base del diagrama de bloques ). Este enfoque de mapeo caracteriza las variaciones verticales de las propiedades físicas en cada unidad de mapa 3-D. En este ejemplo, un depósito aluvial (unidad "a") se superpone a un till glacial (unidad "t"), y la unidad apilada etiquetada como "a/t" indica esa relación, mientras que la unidad "t" indica que el till glacial se extiende hasta la profundidad especificada. De manera similar a la que se muestra en la figura 11, la ocurrencia de la unidad apilada (el afloramiento de la unidad de mapa), la geometría (los límites de la unidad de mapa) y los descriptores (las propiedades físicas de las unidades geológicas incluidas en la unidad apilada) se gestionan como lo son para un mapa geológico 2-D típico. [31]
Las superficies apiladas basadas en ráster representan la superficie de cada unidad geológica enterrada y pueden albergar datos sobre variaciones laterales de propiedades físicas. En este ejemplo de Soller y otros (1999), [32] la superficie superior de cada unidad geológica enterrada se representó en formato ráster como un archivo de cuadrícula de ArcInfo. La cuadrícula del medio es la superficie superior de un acuífero económicamente importante, la Arena Mahomet, que llena un valle preglacial e interglacial tallado en la superficie del lecho rocoso. Cada unidad geológica en formato ráster se puede gestionar en el modelo de datos, de una manera no muy diferente a la que se muestra para el mapa de unidades apiladas. La Arena Mahomet es continua en esta área y representa una ocurrencia de esta unidad en el modelo de datos. Cada ráster, o píxel, en la superficie de la Arena Mahomet tiene un conjunto de coordenadas de mapa que se registran en un SIG (en el contenedor del modelo de datos que está etiquetado como "coordenadas de píxel", que es el corolario ráster del contenedor "geometría" para datos de mapas vectoriales). Cada píxel puede tener un conjunto único de información descriptiva, como elevación de la superficie, espesor de la unidad, litología , transmisividad, etc.).
^ Robertson, JC (1967). "El programa Symap para la cartografía por ordenador". The Cartographic Journal . 4 (2): 108–113. Bibcode :1967CartJ...4..108R. doi :10.1179/caj.1967.4.2.108.
^ Tomlinson, Roger (1968). "Un sistema de información geográfica para la planificación regional". En Stewart, GA (ed.). Evaluación de tierras: Documentos de un simposio de CSIRO . Macmillan of Australia. págs. 200–210.
^ Cooke, Donald F. (1998). "Topología y TIGER: la contribución de la Oficina del Censo". En Foresman, Timothy W. (ed.). La historia de los sistemas de información geográfica: perspectivas de los pioneros . Prentice Hall. págs. 47–57.
^ Tomlinson, Roger F.; Calkins, Hugh W.; Marble, Duane F. (1976). Manejo informático de datos geográficos . UNESCO Press.
^ Dueker, Kenneth J. (1972). "Un marco para codificar datos espaciales". Análisis geográfico . 4 (1): 98–105. Bibcode :1972GeoAn...4...98D. doi : 10.1111/j.1538-4632.1972.tb00460.x .
^ ab Peucker, Thomas K.; Chrisman, Nicholas (1975). "Estructuras de datos cartográficos". El cartógrafo americano . 2 (1): 55–69. doi :10.1559/152304075784447289.
^ Peuquet, Donna J. (1988). "Representaciones del espacio geográfico: hacia una síntesis conceptual". Anales de la Asociación de Geógrafos Estadounidenses . 78 (3): 375–394. doi :10.1111/j.1467-8306.1988.tb00214.x.
^ ab Huisman, Otto; de By, Rolf A. (2009). Principios de los sistemas de información geográfica (PDF) . Enschede, Países Bajos: ITC. p. 64 . Consultado el 1 de noviembre de 2021 .
^ abcd Longley, Paul A.; Goodchild, Michael F.; Maguire, David J.; Rhind, David W. (2011). Sistemas de información geográfica y ciencia (3.ª ed.). Wiley. págs. 207–228.
^ Esri. «Descripción técnica de ESRI Shapefile» (PDF) . Biblioteca técnica de Esri . Consultado el 30 de octubre de 2021 .
^ Mennis, J.; Peuquet, DJ; Qian, L. (2000). "Un marco conceptual para incorporar principios cognitivos en la representación de bases de datos geográficas". Revista Internacional de Ciencias de la Información Geográfica . 14 (6): 501–520. Bibcode :2000IJGIS..14..501M. doi :10.1080/136588100415710. S2CID 7458359.
^ ab Berry, Brian JL (1964). "Enfoques para el análisis regional: una síntesis". Anales de la Asociación de Geógrafos Estadounidenses . 54 (1): 2–11. doi :10.1111/j.1467-8306.1964.tb00469.x. S2CID 128770492.
^ Sinton, David J. (1978). "La estructura inherente de la información como una restricción para el análisis: datos temáticos mapeados como estudio de caso". En Dutton, Geoff (ed.). Harvard Papers in GIS . Vol. 7. Universidad de Harvard.
^ Peuquet, Donna J.; Smith, Barry; Brogaard, Berit, eds. (1997). La ontología de los campos: Informe de una reunión de especialistas celebrada bajo los auspicios del Proyecto Varenius (PDF) .
^ Plewe, Brandon (2019). "Un caso de masas geográficas". En Timpf, Sabine; Schlieder, Christoff; Kattenbeck, Marco; Ludwig, Bernd (eds.). 14° Congreso Internacional sobre Teoría de la Información Espacial (COSIT 2019) . Schloss Dagstuhl-Leibniz-Zentrum für Informatik.
^ Open Geospatial Consortium (2010). Acceso simple a características - Parte 1: Arquitectura común. Págs. 20–32.
^ abcd Bolstad, Paul (2019). Fundamentos de SIG: un primer texto sobre sistemas de información geográfica (6.ª ed.). XanEdu. págs. 39–71.
^ ab Morehouse, Scott (1985). "ARC/INFO: Un modelo georrelacional para la información espacial" (PDF) . Actas del Simposio Internacional sobre Cartografía y Computación (Auto-Carto VII) : 388.
^ abc Jensen, John R.; Jensen, Ryan R. (2013). "5: Modelos de datos espaciales y bases de datos". Introducción a los sistemas de información geográfica . Pearson. págs. 125–147.
^ Open Geospatial Consortium. «Acceso simple a funciones - Parte 2: Opción SQL» . Consultado el 4 de noviembre de 2021 .
^ Peuquet, Donna J. (1984). "Un marco conceptual y comparación de modelos de datos espaciales". Cartographica . 21 (4): 66–113. doi :10.3138/D794-N214-221R-23R5.
^ Esri. "¿Qué es un dataset de red?". Documentación de ArcGIS Pro . Consultado el 4 de noviembre de 2021 .
^ Lo, CP; Yeung, Albert KW (2002). Conceptos y técnicas de los sistemas de información geográfica . Prentice Hall. pág. 81.
^ Hägerstrand, Torsten (1970). "¿Qué pasa con la gente en la ciencia regional?". Artículos de la Asociación de Ciencia Regional . 24 (1): 6–21. Bibcode :1970PRegS..24....6H. doi :10.1007/BF01936872. S2CID 198174673.
^ Langran, Gail (1992). Tiempo en sistemas de información geográfica . Taylor & Francis.
^ Peuquet, Donna J. (1994). "Ya era hora: un marco conceptual para la representación de la dinámica temporal en los sistemas de información geográfica". Anales de la Asociación de Geógrafos Estadounidenses . 84 (3): 441–461. doi :10.1111/j.1467-8306.1994.tb01869.x.
^ Gregory, Ian N. (2002). "Bases de datos SIG variables en el tiempo de límites administrativos históricos cambiantes: una comparación europea". Transactions in GIS . 6 (2): 161–178. Bibcode :2002TrGIS...6..161G. doi :10.1111/1467-9671.00103. S2CID 38450649.
^ Plewe, Brandon (2019). "Una base de datos de aserciones cualificadas para la historia de los lugares". Revista internacional de informática en humanidades y artes . 13 (1–2): 95–115. doi :10.3366/ijhac.2019.0233. S2CID 207941717.
^ de Esri. "Fundamentos del almacenamiento de datos NetCDF". Documentación de ArcGIS Pro . Consultado el 5 de noviembre de 2021 .
^ ab David R. Soller1 y Thomas M. Berg (2003). Proyecto de base de datos de mapas geológicos nacionales: descripción general y progreso, Informe de archivo abierto 03–471 del Servicio Geológico de Estados Unidos.
^ DR Soller et al. (1999). "Inclusión de productos cartográficos digitales en la base de datos de mapas geológicos nacionales". En Soller, DR, ed., Digital Mapping Techniques '99—Workshop Proceedings . Informe de archivo abierto del Servicio Geológico de Estados Unidos 99-386, págs. 35-38,
Lectura adicional
Wikimedia Commons tiene medios relacionados con Modelo de datos (SIG) .
BR Johnson et al. (1998). Modelo de datos de mapas geológicos digitales . v. 4.3: Informe del grupo de trabajo sobre modelos de datos de AASG/USGS, http://geology.usgs.gov/dm/.
Soller, DR, Berg, TM y Wahl, Ron (2000). "Desarrollo de la base de datos nacional de mapas geológicos, fase 3: una base de datos en línea y "viva" de información cartográfica". En Soller, DR, ed., Digital Mapping Techniques '00—Workshop Proceedings: US Geological Survey Open-File Report 00-325, págs. 49-52, http://pubs.usgs.gov/openfile/of00-325/soller4.html.
Soller, DR, y Lindquist, Taryn (2000). "Desarrollo y revisión pública del borrador de la "Norma cartográfica digital para la simbolización de mapas geológicos". En Soller, DR, ed., Digital Mapping Techniques '00—Workshop Proceedings: US Geological Survey Open-File Report 00-325, págs. 43–47, http://pubs.usgs.gov/openfile/of00-325/soller3.html.