stringtranslate.com

Formato de archivo SIG

Un formato de archivo SIG es un estándar para codificar información geográfica en un archivo de computadora , como un tipo especializado de formato de archivo para uso en sistemas de información geográfica (SIG) y otras aplicaciones geoespaciales. Desde la década de 1970, se han creado decenas de formatos basados ​​en diversos modelos de datos para diversos fines. Han sido creados por agencias cartográficas gubernamentales (como el USGS o la Agencia Nacional de Inteligencia Geoespacial ), proveedores de software SIG, organismos de normalización como el Open Geospatial Consortium , comunidades informales de usuarios e incluso desarrolladores individuales.

Historia

Las primeras instalaciones SIG de la década de 1960, como el Sistema de Información Geográfica de Canadá, se basaban en software hecho a medida y almacenaban datos en estructuras de archivos a medida diseñadas para las necesidades del proyecto en particular. A medida que aparecieran más, se podrían comparar para encontrar mejores prácticas y estructuras comunes. [1] Cuando se desarrolló software SIG de propósito general en la década de 1970 y principios de la de 1980, incluidos programas de laboratorios académicos como el Laboratorio de Gráficos por Computadora y Análisis Espacial de Harvard , las agencias gubernamentales (por ejemplo, el Sistema Estadístico y de Superposición de Mapas (MOSS) desarrollaron (por el Servicio de Pesca y Vida Silvestre de EE. UU. y la Oficina de Gestión de Tierras ) y nuevas empresas de software SIG como Esri e Intergraph , cada programa se creó en torno a su propio formato de archivo propietario (y a menudo secreto). [2] Dado que cada instalación SIG estaba efectivamente aislada de todas las demás, el intercambio entre ellas no fue una consideración importante.

A principios de la década de 1990, la proliferación de los SIG en todo el mundo y la creciente necesidad de compartir datos, pronto acelerada por el surgimiento de la World Wide Web y las infraestructuras de datos espaciales , llevaron a la necesidad de datos interoperables y formatos estándar. Uno de los primeros intentos de estandarización fue el Estándar de Transferencia de Datos Espaciales de EE. UU. , publicado en 1994 y diseñado para codificar una amplia variedad de datos del gobierno federal. [3] Aunque este formato en particular no logró obtener un apoyo generalizado, condujo a otros esfuerzos de estandarización, especialmente el Open Geospatial Consortium (OGC), que ha desarrollado o adoptado varios estándares neutrales para los proveedores, algunos de los cuales han sido adoptados por los Estándares Internacionales. Organización (ISO). [4]

Otro avance en la década de 1990 fue la publicación de formatos de archivos propietarios por parte de los proveedores de software SIG, lo que permitió que otros programas los utilizaran. El ejemplo más notable de esto fue la publicación del formato Esri Shapefile , [5] que a finales de la década de 1990 se había convertido en el estándar de facto más popular para el intercambio de datos por parte de toda la industria geoespacial. [6] Cuando los formatos propietarios no se compartían (por ejemplo, la cobertura de ESRI ARC/INFO), los desarrolladores de software frecuentemente los aplicaban ingeniería inversa para permitir la importación y exportación en otro software, facilitando aún más el intercambio de datos. Un resultado de esto fue la aparición de bibliotecas de software gratuitas y de código abierto , como la Biblioteca de abstracción de datos geoespaciales (GDAL) , que han facilitado enormemente la integración de datos espaciales en cualquier formato en una variedad de software. [7]

Durante la década de 2000, la necesidad de archivos espaciales especializados se redujo un poco con la aparición de bases de datos espaciales , que incorporaban datos espaciales en bases de datos relacionales de propósito general. Sin embargo, han seguido apareciendo nuevos formatos de archivos, especialmente con la proliferación de mapas web; Formatos como Keyhole Markup Language (KML) y GeoJSON se pueden integrar más fácilmente en lenguajes de desarrollo web que los archivos SIG tradicionales.

Características del formato

Se han creado más de cien formatos distintos para el almacenamiento de datos espaciales, de los cuales entre 20 y 30 son actualmente de uso común para diferentes propósitos. Estos se pueden distinguir de varias maneras:

Formatos ráster

Modelo de elevación digital, mapa (imagen) y datos vectoriales

Como cualquier imagen digital, los datos SIG rasterizados se basan en una teselación regular del espacio en una cuadrícula rectangular de filas y columnas de celdas (también conocidas como píxeles ), donde cada celda tiene un valor medido almacenado. La principal diferencia con una fotografía es que la cuadrícula está registrada en el espacio geográfico y no en un campo de visión. La resolución del conjunto de datos ráster es el ancho de celda en unidades terrestres.

Debido a que una cuadrícula es una muestra de un espacio continuo, los datos ráster se usan más comúnmente para representar campos geográficos , en los que una propiedad varía de forma continua o discreta en el espacio. Los ejemplos comunes incluyen imágenes de teledetección , terreno/elevación , densidad de población , tiempo y clima , propiedades del suelo y muchos otros. Los datos ráster pueden ser imágenes en las que cada píxel (o celda) contiene un valor de color. El valor registrado para cada celda puede ser de cualquier nivel de medición , incluido un valor cualitativo discreto, como el tipo de uso de la tierra, o un valor cuantitativo continuo, como la temperatura, o un valor nulo si no hay datos disponibles. Si bien una celda ráster almacena un valor único, se puede ampliar mediante el uso de bandas ráster para representar colores RGB (rojo, verde, azul), mapas de colores (un mapeo entre un código temático y un valor RGB) o una tabla de atributos extendida con una fila. para cada valor de celda único. También se puede utilizar para representar características geográficas discretas , pero normalmente sólo en circunstancias exigentes.

Los datos ráster se almacenan en varios formatos; desde una estructura estándar basada en archivos de TIFF, JPEG, etc. hasta datos de objetos binarios grandes (BLOB) almacenados directamente en un sistema de gestión de bases de datos relacionales (RDBMS) similar a otras clases de entidades basadas en vectores. El almacenamiento de la base de datos, cuando se indexa correctamente, normalmente permite una recuperación más rápida de los datos ráster, pero puede requerir el almacenamiento de millones de registros de tamaño significativo.

Ejemplos de formato ráster

Formatos vectoriales

Un mapa vectorial simple, usando cada uno de los elementos vectoriales: puntos para pozos, líneas para ríos y un polígono para el lago.

Un conjunto de datos vectoriales (a veces llamado conjunto de datos de características ) almacena información sobre objetos discretos, utilizando una codificación del modelo de datos lógicos vectoriales para representar la ubicación o geometría de cada objeto, y una codificación de sus otras propiedades que generalmente se basa en tecnología de bases de datos relacionales. . Normalmente, un único conjunto de datos recopila información sobre un conjunto de objetos similares o estrechamente relacionados, como todas las carreteras de una ciudad.

El modelo de datos vectoriales utiliza geometría de coordenadas para representar cada forma como una de varias primitivas geométricas , más comúnmente puntos (una coordenada única de dimensión cero ), líneas (una lista ordenada unidimensional de coordenadas conectadas por líneas rectas) y polígonos (una línea límite de cierre automático que encierra una región bidimensional). Se han desarrollado muchas estructuras de datos para codificar estas primitivas como datos digitales, pero la mayoría de los formatos de archivos vectoriales modernos se basan en la especificación de características simples del Open Geospatial Consortium (OGC) , y a menudo incorporan directamente su texto conocido (WKT) o su binario conocido. (WKB) codificaciones.

Además de la geometría de cada objeto, un conjunto de datos vectoriales también debe poder almacenar sus atributos . Por ejemplo, una base de datos que describe lagos puede contener la profundidad, la calidad del agua y el nivel de contaminación de cada lago. Desde la década de 1970, casi todos los formatos de archivos vectoriales han adoptado el modelo de base de datos relacional , ya sea en principio o incorporando directamente el software RDBMS . Por lo tanto, todo el conjunto de datos se almacena en una tabla , y cada fila representa un único objeto que contiene columnas para cada atributo. [12] : 256 

Se han utilizado dos estrategias para integrar la geometría y los atributos en una única estructura de formato de archivo vectorial: [13]

La topología geoespacial es a menudo una parte importante de los datos vectoriales, ya que representa las relaciones espaciales inherentes (especialmente la adyacencia) entre objetos. La topología se ha gestionado en formatos de archivos vectoriales de cuatro formas. En una estructura de datos topológicos , más notablemente POLYVRT de Harvard y su sucesor, la cobertura ARC/INFO , las conexiones topológicas entre puntos, líneas y polígonos son una parte inherente de la codificación de esas características. [8] : 46–49  Por el contrario, los datos no topológicos o espagueti (como Esri Shapefile y la mayoría de las bases de datos espaciales ) no incluyen información de topología, siendo cada geometría completamente independiente de todas las demás. Un conjunto de datos de topología (usado a menudo en análisis de redes ) aumenta los datos espaguetis con un archivo separado que codifica las conexiones topológicas. [12] : 218  Una base de reglas de topología es una lista de reglas de topología deseadas que se utilizan para imponer la integridad espacial en datos espaguetis, como "los polígonos de condado no deben superponerse" y "los polígonos de estado deben compartir límites con los polígonos de condado". [13]

Los conjuntos de datos vectoriales suelen representar características geográficas discretas , como edificios, árboles y condados. Sin embargo, también se pueden utilizar para representar campos geográficos almacenando ubicaciones donde se ha muestreado el campo espacialmente continuo. Los puntos de muestra (p. ej., estaciones meteorológicas y redes de sensores ), líneas de contorno y redes irregulares trianguladas (TIN) se utilizan para representar la elevación u otros valores que cambian continuamente en el espacio. Los TIN registran valores en ubicaciones de puntos, que están conectados por líneas para formar una malla irregular de triángulos. La cara de los triángulos representa la superficie del terreno.

Ejemplos de formatos de archivos vectoriales

Formatos comúnmente utilizados actualmente:

Formatos históricos que rara vez se utilizan en la actualidad:

Ventajas y desventajas

Existen algunas ventajas y desventajas importantes al utilizar un modelo de datos ráster o vectorial para representar la realidad:

Formatos de archivos integrados

Las bases de datos relacionales de objetos modernas ahora pueden almacenar una variedad de datos complejos utilizando el tipo de datos binario de objetos grandes , incluidas cuadrículas ráster y geometrías vectoriales. Esto permite que algunos sistemas de bases de datos espaciales almacenen datos de ambos modelos en la misma base de datos.

Ver también

Referencias

  1. ^ Tomlinson, Roger F.; Calkins, Hugh W.; Mármol, Duane F. (1976). Manejo informático de datos geográficos . Prensa de la UNESCO.
  2. ^ Chrisman, Nick (2006). Trazando lo desconocido: cómo la cartografía informática en Harvard se convirtió en SIG . Prensa Esri. ISBN 978-1-58948-118-3.
  3. ^ "Estándar de transferencia de datos espaciales". USGS. doi : 10.3133/fs07799 . Consultado el 6 de enero de 2023 .
  4. ^ "Estándares OGC". Consorcio Geoespacial Abierto . OGC . Consultado el 6 de enero de 2023 .
  5. ^ ab "Descripción técnica de ESRI Shapefile" (PDF) . Biblioteca técnica de Esri . Esri. Julio de 1998 . Consultado el 6 de enero de 2023 .
  6. ^ He aquí, Chor Pang; Yeung, Albert KW (2002). Conceptos y Técnicas de Sistemas de Información Geográfica . Prentice Hall. pag. 185.ISBN 0-13-080427-4.
  7. ^ "Software que utiliza GDAL". Biblioteca de abstracción de datos geográficos . OSGEO . Consultado el 6 de enero de 2023 .
  8. ^ ab Bolstad, Paul (2019). Fundamentos de SIG: un primer texto sobre sistemas de información geográfica . Ann Arbor, MI: XanEdu. pag. 69.ISBN 978-1-59399-552-2.
  9. ^ "Gráfico rasterizado digitalizado por arco (ADRG)". Preservación Digital . Biblioteca del Congreso . 25 de septiembre de 2011 . Consultado el 13 de marzo de 2014 .
  10. ^ "Varios formatos ráster GDAL compatibles".
  11. ^ "Formato de producto ráster". Preservación Digital . Biblioteca del Congreso . 2011-10-27 . Consultado el 13 de marzo de 2014 .
  12. ^ ab Longley, Paul A.; Goodchild, Michael F.; Maguire, David J.; Rind, David W. (2011). Ciencia y sistemas de información geográfica (3ª ed.). Wiley.
  13. ^ ab Chang, Kang-tsung (2014). Introducción a los Sistemas de Información Geográfica (7ª ed.). McGraw-Hill. págs. 50–57. ISBN 978-0-07-352290-6.
  14. ^ ab "La arquitectura de una geodatabase". Documentación de ArcGIS Pro . Esri . Consultado el 8 de enero de 2023 .
  15. ^ "Estándar de codificación OGC GeoPackage". Estándares abiertos del consorcio geoespacial . OGC . Consultado el 8 de enero de 2023 .