stringtranslate.com

Modelo de datos (SIG)

Un modelo de datos geográficos , modelo de datos geoespaciales o simplemente modelo de datos en el contexto de los sistemas de información geográfica , es una estructura matemática y digital para representar fenómenos sobre la Tierra. Generalmente, tales modelos de datos representan varios aspectos de estos fenómenos por medio de datos geográficos , incluyendo ubicaciones espaciales , atributos, cambios a lo largo del tiempo e identidad. Por ejemplo, el modelo de datos vectoriales representa la geografía como colecciones de puntos, líneas y polígonos, y el modelo de datos ráster representa la geografía como matrices de celdas que almacenan valores numéricos. [1] Los modelos de datos se implementan en todo el ecosistema SIG, incluyendo las herramientas de software para la gestión de datos y el análisis espacial , los datos almacenados en una variedad de formatos de archivos SIG , especificaciones y estándares, y diseños específicos para instalaciones SIG.

Si bien la naturaleza única de la información espacial ha dado lugar a su propio conjunto de estructuras de modelos, gran parte del proceso de modelado de datos es similar al resto de la tecnología de la información, incluida la progresión de modelos conceptuales a modelos lógicos y modelos físicos , y la diferencia entre modelos genéricos y diseños específicos de la aplicación.

Historia

Los primeros sistemas informáticos que representaban fenómenos geográficos eran modelos de análisis cuantitativo desarrollados durante la revolución cuantitativa en geografía en los años 1950 y 1960; no podían llamarse sistemas de información geográfica porque no intentaban almacenar datos geográficos en una estructura permanente consistente, sino que eran generalmente modelos estadísticos o matemáticos. El primer software SIG verdadero modelaba información espacial utilizando modelos de datos que llegarían a conocerse como raster o vectoriales:

La mayoría de los SIG de primera generación se diseñaron a medida para necesidades específicas, con modelos de datos diseñados para almacenarse y procesarse de manera más eficiente utilizando las limitaciones tecnológicas de la época (especialmente las tarjetas perforadas y el tiempo de procesamiento limitado de la computadora central). Durante la década de 1970, los primeros sistemas habían producido resultados suficientes para compararlos y evaluar la eficacia de sus modelos de datos subyacentes. [6] Esto llevó a que los esfuerzos en el Laboratorio de Harvard y en otros lugares se centraran en el desarrollo de una nueva generación de modelos de datos genéricos , como el modelo vectorial topológico POLYVRT que formaría la base para el software comercial y los datos como Esri Coverage. [7]

A medida que el software SIG comercial , las instalaciones SIG y los datos SIG proliferaron en la década de 1980, los académicos comenzaron a buscar modelos conceptuales de fenómenos geográficos que parecieran subyacer a los modelos de datos comunes, tratando de descubrir por qué los modelos de datos raster y vectoriales parecían tener sentido común y cómo medían y representaban el mundo real. [8] Este fue uno de los hilos conductores principales que formaron la subdisciplina de la ciencia de la información geográfica a principios de la década de 1990.

Los avances en el modelado de datos SIG en la década de 1990 fueron impulsados ​​por el rápido aumento tanto de la base de usuarios como de la capacidad de cómputo de los SIG. Las tendencias principales incluyeron 1) el desarrollo de extensiones de los modelos de datos tradicionales para manejar necesidades más complejas, como el tiempo, las estructuras tridimensionales, la incertidumbre y la multimedia; y 2) la necesidad de gestionar de manera eficiente volúmenes exponencialmente crecientes de datos espaciales con necesidades empresariales de acceso y seguridad para múltiples usuarios. Estas tendencias finalmente culminaron en el surgimiento de bases de datos espaciales incorporadas a bases de datos relacionales y bases de datos relacionales de objetos .

Tipos de modelos de datos

Como el mundo es mucho más complejo de lo que se puede representar en una computadora, todos los datos geoespaciales son aproximaciones incompletas del mundo. [9] Por lo tanto, la mayoría de los modelos de datos geoespaciales codifican alguna forma de estrategia para recolectar una muestra finita de un dominio a menudo infinito, y una estructura para organizar la muestra de tal manera que permita la interpolación de la naturaleza de la porción no muestreada. Por ejemplo, un edificio consta de un número infinito de puntos en el espacio; un polígono vectorial lo representa con unos pocos puntos ordenados, que están conectados en un contorno cerrado por líneas rectas y asumiendo que todos los puntos interiores son parte del edificio; además, un atributo de "altura" puede ser la única representación de su volumen tridimensional.

El proceso de diseño de modelos de datos geoespaciales es similar al de modelado de datos en general, al menos en su patrón general. Por ejemplo, se puede segmentar en tres niveles distintos de abstracción de modelos: [10]

Cada uno de estos modelos puede diseñarse en una de dos situaciones o ámbitos :

Modelos espaciales conceptuales

Los modelos conceptuales geoespaciales genéricos intentan capturar tanto la naturaleza física de los fenómenos geográficos como la forma en que las personas piensan sobre ellos y trabajan con ellos. [12] A diferencia del proceso de modelado estándar descrito anteriormente, los modelos de datos sobre los que se construye el SIG no se diseñaron originalmente con base en un modelo conceptual general de los fenómenos geográficos, sino que se diseñaron en gran medida de acuerdo con la conveniencia técnica, probablemente influenciados por conceptualizaciones de sentido común que aún no se habían documentado.

Dicho esto, un marco conceptual temprano que fue muy influyente en el desarrollo temprano de los SIG fue el reconocimiento por parte de Brian Berry y otros de que la información geográfica se puede descomponer en la descripción de tres aspectos muy diferentes de cada fenómeno: espacio, tiempo y atributo/propiedad/tema. [13] Como desarrollo posterior en 1978, David Sinton presentó un marco que caracterizaba diferentes estrategias para la medición, los datos y el mapeo como mantener uno de los tres aspectos constante, controlar un segundo y medir el tercero. [14]

Durante los años 1980 y 1990, un conjunto de teorías de la información espacial emergió gradualmente como un subcampo importante de la ciencia de la información geográfica , incorporando elementos de la filosofía (especialmente la ontología ), la lingüística y las ciencias de la cognición espacial . A principios de los años 1990, había surgido una dicotomía básica de dos formas alternativas de dar sentido al mundo y sus contenidos:

Estos dos modelos conceptuales no tienen como objetivo representar fenómenos diferentes, sino que a menudo son formas diferentes de conceptualizar y describir el mismo fenómeno. Por ejemplo, un lago es un objeto, pero la temperatura, la claridad y la proporción de contaminación del agua del lago son campos (el agua en sí misma puede considerarse como un tercer concepto de una masa , pero esto no es tan ampliamente aceptado como los objetos y los campos). [16]

Modelo de datos vectoriales

Un conjunto de datos vectoriales simples con puntos, líneas y polígonos que representan características del agua.

El modelo lógico vectorial representa cada ubicación geográfica o fenómeno mediante una forma geométrica y un conjunto de valores para sus atributos. Cada forma geométrica se representa mediante geometría de coordenadas , mediante un conjunto estructurado de coordenadas (x,y) en un sistema de coordenadas geográficas , seleccionado de un conjunto de primitivas geométricas disponibles , como puntos, líneas y polígonos.

Aunque existen docenas de formatos de archivos vectoriales (es decir, modelos de datos físicos) utilizados en varios programas SIG, la mayoría se ajusta a la especificación Simple Feature Access (SFA) del Open Geospatial Consortium (OGC). Se desarrolló en la década de 1990 al encontrar puntos en común entre los modelos vectoriales existentes y ahora está consagrada como ISO 19125, el estándar de referencia para el modelo de datos vectoriales. OGC-SFA incluye las siguientes primitivas geométricas vectoriales : [17]

La forma geométrica almacenada en un conjunto de datos vectoriales que representa un fenómeno puede o no tener la misma dimensión que el fenómeno del mundo real en sí. [18] Es común representar una característica con una dimensión menor que su naturaleza real, según la escala y el propósito de la representación. Por ejemplo, una ciudad (una región bidimensional) puede representarse como un punto, o una carretera (una estructura tridimensional) puede representarse como una línea. Siempre que el usuario sea consciente de que esto último es una elección de representación y una carretera no es realmente una línea, esta generalización puede ser útil para aplicaciones como el análisis de redes de transporte .

Basados ​​en esta estrategia básica de formas geométricas y atributos, los modelos de datos vectoriales utilizan una variedad de estructuras para recopilarlos en un único conjunto de datos (a menudo llamado capa ), que generalmente contiene un conjunto de características relacionadas (por ejemplo, carreteras). Estos pueden clasificarse en varios enfoques:

Representación del modelo de datos de cobertura Arc/INFO, un modelo de datos vectoriales topológicos georrelacionales basado en el modelo de datos POLYVRT inicial

Las estructuras de datos vectoriales también se pueden clasificar según cómo gestionan las relaciones topológicas entre los objetos de un conjunto de datos: [22]

Los datos vectoriales se utilizan habitualmente para representar objetos conceptuales (por ejemplo, árboles, edificios, condados), pero también pueden representar campos . Como ejemplo de esto último, un campo de temperatura podría representarse mediante una muestra irregular de puntos (por ejemplo, estaciones meteorológicas), o mediante isotermas , una muestra de líneas de igual temperatura. [10] : 89 

Modelo de datos raster

Cuadrícula rasterizada de elevación

El modelo lógico raster representa un campo utilizando una teselación del espacio geográfico en una matriz bidimensional de ubicaciones regularmente espaciadas (cada una llamada celda ), con un único valor de atributo para cada celda (o más de un valor en un ráster multibanda). Normalmente, cada celda representa una única muestra de punto central (en la que el modelo de medición para todo el ráster se denomina retícula ) o representa un resumen (normalmente la media) de la variable de campo sobre el área cuadrada (en la que el modelo se denomina cuadrícula ) . [9] : 86  El modelo de datos general es esencialmente el mismo que el utilizado para imágenes y otros gráficos raster , con la adición de capacidades para el contexto geográfico. A continuación se muestra un pequeño ejemplo:

Para representar una cuadrícula ráster en un archivo informático, se la debe serializar en una única lista (unidimensional) de valores. Si bien existen varios esquemas de ordenación posibles, el más utilizado es el de fila principal , en el que las celdas de la primera fila son seguidas inmediatamente por las celdas de la segunda fila, de la siguiente manera:

6 7 10 9 8 6 7 8 6 8 9 10 8 7 7 7 7 8 9 10 9 8 7 6 8 8 9 11 10 9 9 7 . . .

Para reconstruir la cuadrícula original, se requiere un encabezado con parámetros generales para la cuadrícula. Como mínimo, se requiere el número de filas en cada columna para saber dónde comenzar cada nueva fila y el tipo de datos de cada valor (es decir, el número de bits en cada valor antes de comenzar el siguiente valor). [24]

Si bien el modelo ráster está estrechamente vinculado al modelo conceptual de campo, los objetos también pueden representarse en ráster, esencialmente transformando un objeto X en un campo discreto ( booleano ) de presencia/ausencia de X. Alternativamente, una capa de objetos (generalmente polígonos) podría transformarse en un campo discreto de identificadores de objetos. En este caso, algunos formatos de archivos ráster permiten unir una tabla de atributos de tipo vectorial al ráster haciendo coincidir los valores de identificación. [18] Las representaciones ráster de objetos suelen ser temporales, solo se crean y se utilizan como parte de un procedimiento de modelado, en lugar de en un almacén de datos permanente. [20] : 135-137 

Para que sea útil en SIG, un archivo ráster debe estar georreferenciado para corresponder a ubicaciones del mundo real, ya que un ráster sin procesar solo puede expresar ubicaciones en términos de filas y columnas. Esto generalmente se hace con un conjunto de parámetros de metadatos , ya sea en el encabezado del archivo (como el formato GeoTIFF ) o en un archivo sidecar (como un archivo mundial ). Como mínimo, los metadatos de georreferenciación deben incluir la ubicación de al menos una celda en el sistema de coordenadas elegido y la resolución o tamaño de celda , la distancia entre cada celda. Una transformación afín lineal es el tipo más común de georreferenciación, que permite la rotación y celdas rectangulares. [18] : 171  Los esquemas de georreferenciación más complejos incluyen transformaciones polinómicas y spline .

Los conjuntos de datos ráster pueden ser muy grandes, por lo que a menudo se utilizan técnicas de compresión de imágenes . Los algoritmos de compresión identifican patrones espaciales en los datos y luego transforman los datos en representaciones parametrizadas de los patrones, a partir de las cuales se pueden reconstruir los datos originales. En la mayoría de las aplicaciones SIG, se prefieren los algoritmos de compresión sin pérdida (por ejemplo, Lempel-Ziv ) a los que sí lo tienen (por ejemplo, JPEG ), porque se necesitan los datos originales completos, no una interpolación. [10]

Extensiones

A partir de la década de 1990, a medida que los modelos de datos originales y el software SIG maduraban, uno de los focos principales de la investigación sobre modelado de datos fue el desarrollo de extensiones de los modelos tradicionales para manejar información geográfica más compleja.

Modelos espaciotemporales

El tiempo siempre ha desempeñado un papel importante en la geografía analítica, desde al menos la matriz de ciencia regional de Brian Berry (1964) y la geografía del tiempo de Torsten Hägerstrand (1970). [25] [13] En los albores de la era de la ciencia SIG a principios de los años 1990, el trabajo de Gail Langran abrió las puertas a la investigación de métodos para representar explícitamente el cambio a lo largo del tiempo en datos SIG; [26] esto llevó a que surgieran muchos modelos conceptuales y de datos en las décadas posteriores. [27] Algunas formas de datos temporales comenzaron a ser compatibles con el software SIG listo para usar en 2010.

Varios modelos comunes para representar el tiempo en datos SIG vectoriales y rasterizados incluyen: [28]

Modelos tridimensionales

Existen varios enfoques para representar información cartográfica tridimensional y gestionarla en el modelo de datos . Algunos de ellos se desarrollaron específicamente para SIG, mientras que otros se adoptaron a partir de gráficos computacionales en 3D o dibujo asistido por computadora (CAD).

Enfoques para representar información de mapas tridimensionales y para gestionarla en el modelo de datos. [31]

Véase también

Referencias

  1. ^ Wade, T. y Sommer, S. eds. SIG de la A a la Z
  2. ^ Robertson, JC (1967). "El programa Symap para la cartografía por ordenador". The Cartographic Journal . 4 (2): 108–113. Bibcode :1967CartJ...4..108R. doi :10.1179/caj.1967.4.2.108.
  3. ^ Tomlinson, Roger (1968). "Un sistema de información geográfica para la planificación regional". En Stewart, GA (ed.). Evaluación de tierras: Documentos de un simposio de CSIRO . Macmillan of Australia. págs. 200–210.
  4. ^ Cooke, Donald F. (1998). "Topología y TIGER: la contribución de la Oficina del Censo". En Foresman, Timothy W. (ed.). La historia de los sistemas de información geográfica: perspectivas de los pioneros . Prentice Hall. págs. 47–57.
  5. ^ Tomlinson, Roger F.; Calkins, Hugh W.; Marble, Duane F. (1976). Manejo informático de datos geográficos . UNESCO Press.
  6. ^ Dueker, Kenneth J. (1972). "Un marco para codificar datos espaciales". Análisis geográfico . 4 (1): 98–105. Bibcode :1972GeoAn...4...98D. doi : 10.1111/j.1538-4632.1972.tb00460.x .
  7. ^ ab Peucker, Thomas K.; Chrisman, Nicholas (1975). "Estructuras de datos cartográficos". El cartógrafo americano . 2 (1): 55–69. doi :10.1559/152304075784447289.
  8. ^ Peuquet, Donna J. (1988). "Representaciones del espacio geográfico: hacia una síntesis conceptual". Anales de la Asociación de Geógrafos Estadounidenses . 78 (3): 375–394. doi :10.1111/j.1467-8306.1988.tb00214.x.
  9. ^ ab Huisman, Otto; de By, Rolf A. (2009). Principios de los sistemas de información geográfica (PDF) . Enschede, Países Bajos: ITC. p. 64 . Consultado el 1 de noviembre de 2021 .
  10. ^ abcd Longley, Paul A.; Goodchild, Michael F.; Maguire, David J.; Rhind, David W. (2011). Sistemas de información geográfica y ciencia (3.ª ed.). Wiley. págs. 207–228.
  11. ^ Esri. «Descripción técnica de ESRI Shapefile» (PDF) . Biblioteca técnica de Esri . Consultado el 30 de octubre de 2021 .
  12. ^ Mennis, J.; Peuquet, DJ; Qian, L. (2000). "Un marco conceptual para incorporar principios cognitivos en la representación de bases de datos geográficas". Revista Internacional de Ciencias de la Información Geográfica . 14 (6): 501–520. Bibcode :2000IJGIS..14..501M. doi :10.1080/136588100415710. S2CID  7458359.
  13. ^ ab Berry, Brian JL (1964). "Enfoques para el análisis regional: una síntesis". Anales de la Asociación de Geógrafos Estadounidenses . 54 (1): 2–11. doi :10.1111/j.1467-8306.1964.tb00469.x. S2CID  128770492.
  14. ^ Sinton, David J. (1978). "La estructura inherente de la información como una restricción para el análisis: datos temáticos mapeados como estudio de caso". En Dutton, Geoff (ed.). Harvard Papers in GIS . Vol. 7. Universidad de Harvard.
  15. ^ Peuquet, Donna J.; Smith, Barry; Brogaard, Berit, eds. (1997). La ontología de los campos: Informe de una reunión de especialistas celebrada bajo los auspicios del Proyecto Varenius (PDF) .
  16. ^ Plewe, Brandon (2019). "Un caso de masas geográficas". En Timpf, Sabine; Schlieder, Christoff; Kattenbeck, Marco; Ludwig, Bernd (eds.). 14° Congreso Internacional sobre Teoría de la Información Espacial (COSIT 2019) . Schloss Dagstuhl-Leibniz-Zentrum für Informatik.
  17. ^ Open Geospatial Consortium (2010). Acceso simple a características - Parte 1: Arquitectura común. Págs. 20–32.
  18. ^ abcd Bolstad, Paul (2019). Fundamentos de SIG: un primer texto sobre sistemas de información geográfica (6.ª ed.). XanEdu. págs. 39–71.
  19. ^ ab Morehouse, Scott (1985). "ARC/INFO: Un modelo georrelacional para la información espacial" (PDF) . Actas del Simposio Internacional sobre Cartografía y Computación (Auto-Carto VII) : 388.
  20. ^ abc Jensen, John R.; Jensen, Ryan R. (2013). "5: Modelos de datos espaciales y bases de datos". Introducción a los sistemas de información geográfica . Pearson. págs. 125–147.
  21. ^ Open Geospatial Consortium. «Acceso simple a funciones - Parte 2: Opción SQL» . Consultado el 4 de noviembre de 2021 .
  22. ^ Peuquet, Donna J. (1984). "Un marco conceptual y comparación de modelos de datos espaciales". Cartographica . 21 (4): 66–113. doi :10.3138/D794-N214-221R-23R5.
  23. ^ Esri. "¿Qué es un dataset de red?". Documentación de ArcGIS Pro . Consultado el 4 de noviembre de 2021 .
  24. ^ Lo, CP; Yeung, Albert KW (2002). Conceptos y técnicas de los sistemas de información geográfica . Prentice Hall. pág. 81.
  25. ^ Hägerstrand, Torsten (1970). "¿Qué pasa con la gente en la ciencia regional?". Artículos de la Asociación de Ciencia Regional . 24 (1): 6–21. Bibcode :1970PRegS..24....6H. doi :10.1007/BF01936872. S2CID  198174673.
  26. ^ Langran, Gail (1992). Tiempo en sistemas de información geográfica . Taylor & Francis.
  27. ^ Peuquet, Donna J. (1994). "Ya era hora: un marco conceptual para la representación de la dinámica temporal en los sistemas de información geográfica". Anales de la Asociación de Geógrafos Estadounidenses . 84 (3): 441–461. doi :10.1111/j.1467-8306.1994.tb01869.x.
  28. ^ Gregory, Ian N. (2002). "Bases de datos SIG variables en el tiempo de límites administrativos históricos cambiantes: una comparación europea". Transactions in GIS . 6 (2): 161–178. Bibcode :2002TrGIS...6..161G. doi :10.1111/1467-9671.00103. S2CID  38450649.
  29. ^ Plewe, Brandon (2019). "Una base de datos de aserciones cualificadas para la historia de los lugares". Revista internacional de informática en humanidades y artes . 13 (1–2): 95–115. doi :10.3366/ijhac.2019.0233. S2CID  207941717.
  30. ^ de Esri. "Fundamentos del almacenamiento de datos NetCDF". Documentación de ArcGIS Pro . Consultado el 5 de noviembre de 2021 .
  31. ^ ab David R. Soller1 y Thomas M. Berg (2003). Proyecto de base de datos de mapas geológicos nacionales: descripción general y progreso, Informe de archivo abierto 03–471 del Servicio Geológico de Estados Unidos.
  32. ^ DR Soller et al. (1999). "Inclusión de productos cartográficos digitales en la base de datos de mapas geológicos nacionales". En Soller, DR, ed., Digital Mapping Techniques '99—Workshop Proceedings . Informe de archivo abierto del Servicio Geológico de Estados Unidos 99-386, págs. 35-38,

Lectura adicional