Geocodificar

Un geocódigo es un código que representa una entidad geográfica ( ubicación u objeto ). Es un identificador único de la entidad, para distinguirla de otras en un conjunto finito de entidades geográficas. En general, el código geográfico es un identificador corto y legible por humanos .

Códigos geográficos típicos y entidades representadas por él:

Código de país y código de subdivisión. Polígono de los límites administrativos de un país o una subdivisión.
Los principales ejemplos son los códigos ISO: código ISO 3166-1 alfa-2 (por ejemplo, AFpara Afganistán o BRBrasil ) y sus convenciones de subdivisión , como los códigos de subdivisión AF (por ejemplo, AF-GHOpara la provincia de Ghor ) o los códigos de subdivisión BR (por ejemplo, para el estado de Amazonas ). .BR-AM
ID de celda DGG . Identificador de una celda de una grilla global discreta : un código Geohash (por ejemplo, una celda de ~0,023 km ²6vjyngd en el centro de Brasil ) o un código OLC (por ejemplo, una celda de ~0,004 km ²58PJ642P+4 en el mismo punto).
Código Postal . Polígono de un área postal : un código CEP70040 (por ejemplo, representa el área central de distribución postal de Brasil).

La norma ISO 19112:2019 (sección 3.1.2) adoptó el término "identificador geográfico" en lugar de geocodificar, para abarcar etiquetas largas: referencia espacial en forma de etiqueta o código que identifica una ubicación . Por ejemplo, para ISO, el nombre del país "República Popular China" es una etiqueta.

Los geocódigos se utilizan principalmente (en general como un tipo de datos atómicos ) para etiquetado , integridad de datos , geoetiquetado e indexación espacial .

En informática teórica, un sistema de geocodificación es una función hash que preserva la localidad .

Clasificación

Geocodifica celdas de Geohash , con 8 (azul) y 9 (amarillo) dígitos, una *cuadrícula jerárquica* típica , en comparación con latitud-longitud (12 o más dígitos). Un museo es un lugar típico al que apunta un código geográfico; su puerta necesita ~20 metros de precisión.

Hay algunos aspectos comunes de muchos códigos geográficos (o sistemas de códigos geográficos) que pueden usarse como criterios de clasificación:

Propiedad : propietaria o libre , diferenciándose por sus licencias .
Formación : el geocódigo puede originarse a partir de un nombre (por ejemplo, abreviatura del nombre oficial del país) o de una función matemática ( algoritmo de codificación para comprimir latitud-longitud ). Consulte los tipos de sistemas de geocodificación a continuación (de nombres y de cuadrículas).
Jerarquía : jerarquía de sintaxis del geocódigo correspondiente a la jerarquía espacial de sus entidades representadas. Un sistema de geocodificación puede ser jerárquico (de nombre o cuadrícula) o no jerárquico.
Cobertura : global o parcial. Las entidades (representadas por los códigos geográficos) están en todo el mundo (por ejemplo, puntos geográficos) o están delimitadas por el tema (por ejemplo, solo áreas terrestres) o por la jurisdicción de la propiedad (por ejemplo, solo en un país).
Tipo de entidad representada : tipo de geometría . Punto (el geocódigo se puede traducir a un Geo URI ), celda de cuadrícula (el sistema de geocódigo está relacionado con un DGG ) o polígono (normalmente delimitaciones de límites administrativos).
- Las cuadrículas jerárquicas especiales, con cobertura global y celdas de áreas iguales, se pueden clasificar como celdas DGGS ^[1]
- Algunas entidades geográficas no estándar, pueden clasificarse también por su sistema de coordenadas y elipsoide de referencia (por ejemplo, UTM ). El estándar de facto es el WGS84 . ^[2]
Ámbito de uso : uso general versus especializado (por ejemplo, códigos geográficos de aeropuertos).

Sistema de geocodificación

El conjunto de todos los códigos geográficos utilizados como identificadores únicos de las celdas de una cobertura total de la superficie geográfica (o cualquier área bien definida como un país o los océanos), es un sistema de código geográfico (también llamado esquema de código geográfico ). La sintaxis y la semántica de los códigos geográficos también son componentes de la definición del sistema:

Sintaxis de geocodificación : los caracteres que se pueden utilizar, bloques de caracteres y su tamaño y orden. Ejemplo: los códigos de país utilizan dos letras del alfabeto (conjunto de caracteres AZ). La forma más común de describir formalmente es mediante expresiones regulares (p. ej /[A-Z]{2,2}/.).
Semántica del geocódigo : el significado del geocódigo, generalmente expresado asociando el código con un tipo de entidad geográfica. Puede describirse formalmente mediante una ontología , un diagrama de clases UML o cualquier modelo entidad-relación .
En general, la semántica se puede deducir por su formación o proceso de codificación/decodificación. Ejemplo: cada código Geohash se puede expresar mediante un área rectangular en el mapa, y las coordenadas del rectángulo se obtienen mediante su proceso de decodificación.

Muchas características sintácticas y semánticas también se resumen mediante clasificación.

Codificar y decodificar

Cualquier geocódigo se puede traducir a partir de una expresión formal (y ampliada) de la entidad geográfica, o viceversa, el geocódigo traducido a entidad. El primero se llama proceso de codificación , el segundo decodifica . Los actores y procesos involucrados, tal como los define OGC , ^[3] son:

geocodificador: Un agente de software que transforma la descripción de una entidad geográfica (por ejemplo, nombre de ubicación o coordenadas de latitud/longitud) en datos normalizados y los codifica como un código geográfico.

servicio de geocodificador: Un geocodificador implementado como servicio web (o interfaz de servicio similar), que acepta un conjunto de descriptores de entidades geográficas como entrada. La solicitud se "envía" al Servicio Geocoder, que procesa la solicitud y devuelve los códigos geográficos resultantes. Los servicios más generales también pueden devolver características geográficas (por ejemplo, objetos GeoJSON ) representadas por los códigos geográficos.

geocodificación: La geocodificación se refiere a la asignación de códigos geográficos o coordenadas a datos de referencia geográfica proporcionados en formato textual. Algunos ejemplos son los códigos de país de dos letras y las coordenadas calculadas a partir de direcciones.
Nota: cuando un esquema de direccionamiento físico (nombre de la calle y número de la casa) se expresa de forma estandarizada y simplificada, se puede concebir como un código geográfico. Por lo tanto, el término geocodificación (usado para direcciones) a veces se generaliza para códigos geográficos.

En aplicaciones de indexación espacial, el código geográfico también se puede traducir entre representaciones legibles por humanos (por ejemplo, hexadecimal ) e internas (por ejemplo, entero binario de 64 bits sin signo ).

Sistemas de nombres estándar.

Los códigos geográficos como códigos de país , códigos de ciudad, etc. provienen de una tabla de nombres oficiales y los códigos y geometrías oficiales correspondientes (normalmente polígonos de áreas administrativas). "Oficial" en el contexto de control y consenso, típicamente una mesa controlada por una organización de estándares o autoridad gubernamental. Entonces, el caso más general es una tabla de nombres estándar y los códigos estándar correspondientes (y sus geometrías oficiales).

Estrictamente hablando, el "nombre" relacionado con un código geográfico es un topónimo , y la tabla (por ejemplo, topónimo a código estándar) es el recurso para la resolución de topónimos : es el proceso de relación , generalmente efectuado por un agente de software, entre un topónimo y "un huella espacial inequívoca del mismo lugar". ^[4] Cualquier sistema estandarizado de resolución de topónimos, que tenga códigos o abreviaturas codificadas, puede utilizarse como sistema de geocodificación . El agente "resolvedor" en este contexto también es un geocodificador .

A veces los nombres se traducen a códigos numéricos, para que sean compactos o legibles por máquina. Dado que los números, en este caso, son identificadores de nombres, podemos considerar "nombres numéricos", por lo que este conjunto de códigos será una especie de "sistema de nombres estándar".

Nomenclatura jerárquica

En el contexto del geocódigo, la partición del espacio es el proceso de dividir un espacio geográfico en dos o más subconjuntos disjuntos , lo que da como resultado un mosaico de subdivisiones. Cada subdivisión se puede dividir nuevamente, de forma recursiva , lo que da como resultado un mosaico jerárquico.

Cuando los nombres de las subdivisiones se expresan como códigos, y la sintaxis del código se puede descomponer en relaciones padre-hijo, a través de un esquema sintáctico bien definido, el conjunto de códigos geográficos configura un sistema jerárquico. Un fragmento de geocodificación (asociado a un nombre de subdivisión) puede ser una abreviatura, un código numérico o alfanumérico.

Un ejemplo popular es el sistema de código geográfico ISO 3166-2 , que representa los nombres de los países y los nombres de las respectivas subdivisiones administrativas separados por guiones. Por ejemplo DEes Alemania , un código geográfico simple, y sus subdivisiones (ilustradas) son DE-BWpara Baden-Württemberg , DE-BYpara Bayern ,..., DE-NW para Nordrhein-Westfalen , etc. El alcance es sólo el primer nivel de la jerarquía. Para más niveles existen otras convenciones, como el código HASC. ^[5]^[6] Los códigos HASC son alfabéticos y sus fragmentos tienen longitud constante (2 letras). Ejemplos:

DE.NW- Norte de Rhine-Westphalia . Un código geográfico jerárquico de dos niveles.

DE.NW.CE- Distrito Coesfeld . Un geocódigo jerárquico de 3 niveles.

Dos códigos geográficos de un sistema de códigos geográficos jerárquicos con el mismo prefijo representan diferentes partes de la misma ubicación. Por ejemplo DE.NW.CE, y DE.NW.BNrepresenta partes geográficamente interiores de DE.NW, el prefijo común.

Cambiando los criterios de subdivisión podemos obtener otros sistemas jerárquicos. Por ejemplo, para los criterios hidrológicos existe un sistema de geocodificación, el código de unidad hidrológica de EE. UU. (HUC), que es una representación numérica de los nombres de las cuencas en un esquema de sintaxis jerárquica (se ilustra el primer nivel). Por ejemplo, el HUC 17es el identificador de la " cuenca del Pacífico Noroeste de Columbia "; HUC 1706de la " cuenca Lower Snake ", un subconjunto espacial de HUC 17y un superconjunto de 17060102("Río Imnaha").

Sistemas de rejillas regulares.

Inspirada en las clásicas cuadrículas alfanuméricas , una cuadrícula global discreta ( DGG ) es un mosaico regular que cubre toda la superficie de la Tierra (el globo). La regularidad del mosaico se define por el uso de celdas de la misma forma en toda la cuadrícula, o "casi de la misma forma y cerca de la misma área" en una región de interés, como un país.

Todas las celdas de la cuadrícula tienen un identificador (ID de celda de DGG) y el centro de la celda se puede utilizar como referencia para convertir el ID de celda en un punto geográfico. Cuando se estandariza una expresión compacta legible por humanos de la identificación de la celda, se convierte en un código geográfico.

Los códigos geográficos de diferentes sistemas de código geográfico pueden representar la misma posición en el mundo, con la misma forma y precisión, pero difieren en la longitud de la cadena , el alfabeto de los dígitos, los separadores, etc. Las cuadrículas no globales también difieren en su alcance y, en general, están optimizadas geométricamente. (evitar superposiciones, espacios o pérdida de uniformidad) para uso local.

Cuadrículas jerárquicas

Cada celda de una grilla se puede transformar en una nueva grilla local, en un proceso recurrente . En el ejemplo ilustrado, la celda TQ 2980es una subcelda de TQ 29, es decir, una subcelda de TQ. Un sistema de referencias geográficas regulares de cuadrícula es la base de un sistema de geocodificación jerárquico .

Dos códigos geográficos de un sistema de cuadrícula de códigos geográficos jerárquicos pueden utilizar la regla de prefijo: los códigos geográficos con el mismo prefijo representan diferentes partes de la misma ubicación más amplia . Usando nuevamente la ilustración lateral: TQ 28y TQ 61representa partes geográficamente interiores de TQ, el prefijo común.

El código geográfico jerárquico se puede dividir en claves. El Geohash 6vd23gq es la clave qde la celda 6vd23g, es decir, una celda de 6vd23(clave g), y así sucesivamente, claves por dígito. El OLC 58PJ642P es la clave 48de la celda 58PJ64, es decir una celda de 58Q8(clave 48), y así sucesivamente, claves de dos dígitos. En el caso de OLC existe un segundo esquema de clave, después del +separador: 58PJ642P+48es la clave 2de la celda 58PJ642P+4. Utiliza dos esquemas clave. Algunos sistemas de geocodificación (por ejemplo, geometría S2) también utilizan un prefijo inicial con un esquema de clave no jerárquico.

En general, como representación opcional técnica y no compacta, los sistemas de geocodificación (basados en cuadrículas jerárquicas) también ofrecen la posibilidad de expresar su identificador de celda con un esquema detallado, mediante un recorrido de claves más largo. Por ejemplo, Geohash 6vd2, que es un código base32 , se puede expandir a base4 0312312002 , que también es un esquema con claves por dígito. Geométricamente, cada celda de Geohash es un rectángulo que subdivide el espacio de forma recurrente en 32 nuevos rectángulos, por lo que base4 se subdivide en 4, es el límite de expansión de codificación. ^[7]

La uniformidad de la forma y el área de las celdas de una cuadrícula puede ser importante para otros usos, como las estadísticas espaciales . Existen formas estándar de construir una cuadrícula que cubra todo el mundo con celdas de igual área, forma regular y otras propiedades: Discrete Global Grid System (DGGS) es una serie de cuadrículas globales discretas que satisfacen todos los requisitos estandarizados definidos en 2017 por la OGC . ^[8] Cuando los códigos legibles por humanos obtenidos de los identificadores de celda de un DGGS también están estandarizados, se puede clasificar como un sistema de geocodificación basado en DGGS .

Sistemas de nombres y cuadrículas

También hay sistemas mixtos, que utilizan una partición sintáctica, donde por ejemplo la primera parte (prefijo de código) es un código de nombre y la otra parte (sufijo de código) es un código de cuadrícula. Ejemplo:

La entrada del código de mapa al ascensor de la Torre Eiffel en París es FR-4J.Q2, donde FRestá el código de nombre ^[9] y 4J.Q2el código de cuadrícula. Semánticamente Francia es el contexto para obtener su red local.

Para la semántica coherente mnemotécnica , en aplicaciones de geocodificación detallada, las soluciones mixtas son las más adecuadas.

Acortar códigos basados en cuadrículas por contexto

Cualquier sistema de geocodificación basado en una cuadrícula regular, en general, también es una forma más corta de expresar una coordenada latitudinal/longitudinal. Pero un código geográfico con más de 6 caracteres es difícil de recordar. Por otro lado, un código geográfico basado en un nombre estándar (o abreviatura o nombre completo) es más fácil de recordar.

Esto sugiere que un "código mixto" puede resolver el problema, reduciendo la cantidad de caracteres cuando un nombre puede usarse como "contexto" para el código geográfico basado en cuadrícula. Por ejemplo, en un libro donde el autor dice "todos los códigos geográficos aquí están contextualizados por la ciudad del capítulo". En el capítulo sobre París, donde todos los lugares tienen un Geohash con prefijo u09, ese código se puede eliminar —. Por ejemplo, Geohash u09tutse puede reducir a tuto mediante un código explícito para el contexto "FR-Paris tut". Esto sólo es posible cuando la resolución del contexto (por ejemplo, la traducción de "FR-París" al prefijo u09) es bien conocida.

De hecho, existe una metodología para códigos geográficos jerárquicos basados en cuadrículas con tamaño no variable, donde el prefijo del código describe un área más amplia, que puede asociarse con un nombre. Por lo tanto, es posible acortarlo reemplazando el prefijo por el contexto asociado. El contexto más habitual es un nombre oficial. Ejemplos:

Los ejemplos de la columna de referencia mixta son mucho más fáciles que recordar la columna de código DGG . Los métodos varían; por ejemplo, OLC se puede acortar eliminando sus primeros cuatro dígitos y adjuntando una localidad adecuada y suficientemente cercana. ^[10]

Cuando la referencia mixta también es corta (9 caracteres en el segundo ejemplo) y existe una convención de sintaxis para expresarla (supongamos CP‑PR~bgxed), esta convención genera un nuevo sistema de geocodificación de nombre y cuadrícula. No es el caso del primer ejemplo porque, estrictamente hablando, "Cabo Verde, Praia" no es un código.

Para ser a la vez un sistema de nombre y cuadrícula y también una convención de referencia mixta, el sistema debe ser reversible. Los sistemas puros de nombre y cuadrícula, como Mapcode , sin forma de transformarlo en un código global, no son una referencia mixta, porque no existe un algoritmo para transformar el geocódigo mixto en un geocódigo basado en cuadrícula.

Ejemplos catalogados

En uso, alcance general

Geocódigos en uso y con alcance general:

En uso, dirección alternativa

Los códigos geográficos se pueden utilizar en lugar de los nombres oficiales de calles y/o números de casas , especialmente cuando las autoridades no han asignado una dirección a una ubicación determinada. También se pueden utilizar como una "dirección alternativa" si se puede convertir a un Geo URI . Incluso si el código geográfico no es la designación oficial de una ubicación, puede usarse como un "estándar local" para permitir que los hogares reciban entregas, accedan a servicios de emergencia, se registren para votar, etc.

En uso, códigos postales

Geocódigos en uso, como códigos postales . Un código geográfico reconocido por la Unión Postal Universal y adoptado como "código postal oficial" por un país , también es un código postal válido. No todos los códigos postales son geográficos y, para algunos sistemas de códigos postales, hay códigos que no son códigos geográficos (por ejemplo, en el sistema del Reino Unido ). Ejemplos, no una lista completa:

En uso, telefonía y radio.

Geocódigos en uso para el ámbito de telefonía o radiodifusión:

Códigos de país UIT-R
Códigos de llamadas de países UIT-T
Códigos de llamadas móviles UIT-T
Sistema localizador Maidenhead (utilizado por radioaficionados)
Plazas de Marsden

En uso, otros

Geocódigos en uso y con alcance específico:

Histórico o menos utilizado

Otros ejemplos

Otros códigos geográficos:

S2 : un esquema de geocodificación que utiliza geometría esférica y la curva de Hilbert que llena el espacio , desarrollado en Google ^[18]^[19]
H3 : Índice espacial jerárquico hexagonal, un esquema de codificación geográfica desarrollado inicialmente en Uber ^[20] código fuente disponible ^[21] y documentado en h3geo ^[22]
Convención de Orientación de Munich : convierte lat/lon a códigos monopolares métricos para objetivos, cruces, estaciones, puntos de parada, puentes, túneles, ciudades, islas, volcanes, salidas de autopistas, etc. ^[23]
SALB (Límites del Segundo Nivel Administrativo), por la ONU ^[24]
OpenPostcode , algoritmo global de código abierto (adaptaciones locales como códigos postales de Irlanda y Hong Kong). ^[25]
WOEID
Enlace corto de OpenStreetMap , utilizado como enlace corto permanente para ubicar mapas ^[26]
Celdas de cuadrícula de un cuarto de grado
NAC (patentado), códigos de área (el área puede ser indefinidamente pequeña)
GEOID, el nombre de los identificadores geográficos de la Oficina del Censo de Estados Unidos . ^[27]
En los Estados Unidos, se utilizan con frecuencia los códigos del Instituto Nacional Estadounidense de Estándares (ANSI). ANSI INCITS 446-2008 se titula "Identificación de atributos para características geográficas físicas y culturales nombradas (excepto carreteras y autopistas) de los Estados Unidos, sus territorios, áreas periféricas y áreas libremente asociadas, y las aguas de las mismas hasta el límite del Zona estatutaria de doce millas ".
Sistema Topográfico Nacional en Canadá

Otros estándares

Algunos estándares y servidores de nombres incluyen: ISO 3166, FIPS, INSEE, Geonames, IATA e ICAO .

También se han propuesto una serie de soluciones comerciales:

WOEID (Dónde en la Tierra IDentifier) es un identificador de referencia único de 32 bits que identifica cualquier característica de la Tierra.
NAC Locator proporciona una dirección de codificación geográfica universal para todas las ubicaciones del planeta.

Ver también

Zona censal
Geolocalización
Geoetiquetado
Recuperación de información geográfica
Código de cuadrícula de navegación global (¿geocódigo de China?)
ISO 6709 , representación estándar de la ubicación de puntos geográficos por coordenadas
Código de lugar
Número de referencia de propiedad único
Número de referencia de calle único

Referencias

^ Definición estándar de "Sistemas de red globales discretos" de la OGS.
^ Para formatos y protocolos de Internet, el WGS84 es un estándar de facto y de juri : consulte el protocolo geo URI , formatos GeoJSON , GML y KML .
^ Definiciones del "Glosario de términos" de la OGC .
^ DeLozier, Jochen L. (2007). Resolución de topónimos en texto: anotación, evaluación y aplicaciones de la fundamentación espacial (Doctor). Universidad de Edimburgo. hdl : 1842/1849.
^ Ley Gwillim (2016). Subdivisiones administrativas de países: una referencia mundial completa, 1900 a 1998 . McFarland. ISBN 978-0-7864-0729-3.
^ "Códigos de subdivisión administrativa jerárquica". Estatoides .
^ Nota: en el uso práctico, Geohash se puede expandir a base2, pero geométricamente se basa en particiones de latitud y longitud (2+2), por lo que base2 puede provocar una pérdida de simetría. Estrictamente Geohash base32 también necesita claves de dos dígitos para la compatibilidad con base4.
^ "Tema 21: Especificación abstracta de sistemas de red globales discretos", Open Geospatial Consortium (2017). https://docs.opengeospatial.org/as/15-104r5/15-104r5.html
^ Consulte el uso formal de los códigos de país ISO en Mapcode en https://www.mapcode.com/territory
^ "Orientación para acortar códigos · google/Open-location-code Wiki". GitHub .
^ El enlace corto de OpenStreetMap , documentado en wiki.openstreetmap.org, fue lanzado en 2009 y tiene casi el mismo código fuente 10 años después. Está fuertemente basado en el algoritmo de entrelazado de Morton .
^ "Inicio". códigos.plus .
^ "What3words: busque y comparta ubicaciones muy precisas a través de Google Maps con solo 3 palabras". 2 de julio de 2013 . Consultado el 8 de julio de 2014 .
^ "Mongolia adopta what3words como sistema de direccionamiento nacional - Soluciones geoespaciales: Soluciones geoespaciales". Junio de 2016.
^ (8 de septiembre de 2016) "Correios de Cabo Verde testam novo sistema de endereçamento da Google", https://web.archive.org/web/20170209155133/http://aicep.pt/?%2Fnoticias%2F1% 2F2534
^ Departamento de Comunicaciones (28 de abril de 2014). "El ministro Rabbitte lanza Eircode, los nuevos códigos de ubicación para direcciones irlandesas". DCENR . Consultado el 15 de julio de 2015 .
^ "Términos de uso de Eircode".
^ "Descripción general". s2geometry.io . Consultado el 11 de mayo de 2018 .
^ Kreiss, Sven (27 de julio de 2016). "Celdas S2 y curvas que llenan el espacio: claves para crear mejores herramientas de mapas digitales para las ciudades". Medio . Consultado el 11 de mayo de 2018 .
^ "Blog de Uber anunciando h3". uber.com . Consultado el 8 de febrero de 2023 .
^ "Código fuente abierto h3". github.com . Consultado el 8 de febrero de 2023 .
^ "documentación h3". h3geo.org . Consultado el 8 de febrero de 2023 .
^ / ESA ^{[ enlace muerto permanente ]}
^ "Límites del segundo nivel administrativo". Archivado desde el original el 4 de abril de 2021 . Consultado el 9 de abril de 2020 .
^ "OpenPostcode.org" . Consultado el 10 de junio de 2012 .
^ "Enlace corto - OpenStreetMap Wiki".
^ "Comprensión de los identificadores geográficos (GEOID)". Oficina del Censo de Estados Unidos . Consultado el 3 de marzo de 2016 .

enlaces externos

Medios relacionados con códigos geográficos en Wikimedia Commons