Un geocódigo es un código que representa una entidad geográfica ( ubicación u objeto ). Es un identificador único de la entidad, para distinguirla de otras en un conjunto finito de entidades geográficas. En general, el código geográfico es un identificador corto y legible por humanos .
Códigos geográficos típicos y entidades representadas por él:
AF
para Afganistán o BR
Brasil ) y sus convenciones de subdivisión , como los códigos de subdivisión AF (por ejemplo, AF-GHO
para la provincia de Ghor ) o los códigos de subdivisión BR (por ejemplo, para el estado de Amazonas ). .BR-AM
6vjyngd
en el centro de Brasil ) o un código OLC (por ejemplo, una celda de ~0,004 km 258PJ642P+4
en el mismo punto).70040
(por ejemplo, representa el área central de distribución postal de Brasil).La norma ISO 19112:2019 (sección 3.1.2) adoptó el término "identificador geográfico" en lugar de geocodificar, para abarcar etiquetas largas: referencia espacial en forma de etiqueta o código que identifica una ubicación . Por ejemplo, para ISO, el nombre del país "República Popular China" es una etiqueta.
Los geocódigos se utilizan principalmente (en general como un tipo de datos atómicos ) para etiquetado , integridad de datos , geoetiquetado e indexación espacial .
En informática teórica, un sistema de geocodificación es una función hash que preserva la localidad .
Hay algunos aspectos comunes de muchos códigos geográficos (o sistemas de códigos geográficos) que pueden usarse como criterios de clasificación:
El conjunto de todos los códigos geográficos utilizados como identificadores únicos de las celdas de una cobertura total de la superficie geográfica (o cualquier área bien definida como un país o los océanos), es un sistema de código geográfico (también llamado esquema de código geográfico ). La sintaxis y la semántica de los códigos geográficos también son componentes de la definición del sistema:
/[A-Z]{2,2}/
.).Muchas características sintácticas y semánticas también se resumen mediante clasificación.
Cualquier geocódigo se puede traducir a partir de una expresión formal (y ampliada) de la entidad geográfica, o viceversa, el geocódigo traducido a entidad. El primero se llama proceso de codificación , el segundo decodifica . Los actores y procesos involucrados, tal como los define OGC , [3] son:
En aplicaciones de indexación espacial, el código geográfico también se puede traducir entre representaciones legibles por humanos (por ejemplo, hexadecimal ) e internas (por ejemplo, entero binario de 64 bits sin signo ).
Los códigos geográficos como códigos de país , códigos de ciudad, etc. provienen de una tabla de nombres oficiales y los códigos y geometrías oficiales correspondientes (normalmente polígonos de áreas administrativas). "Oficial" en el contexto de control y consenso, típicamente una mesa controlada por una organización de estándares o autoridad gubernamental. Entonces, el caso más general es una tabla de nombres estándar y los códigos estándar correspondientes (y sus geometrías oficiales).
Estrictamente hablando, el "nombre" relacionado con un código geográfico es un topónimo , y la tabla (por ejemplo, topónimo a código estándar) es el recurso para la resolución de topónimos : es el proceso de relación , generalmente efectuado por un agente de software, entre un topónimo y "un huella espacial inequívoca del mismo lugar". [4] Cualquier sistema estandarizado de resolución de topónimos, que tenga códigos o abreviaturas codificadas, puede utilizarse como sistema de geocodificación . El agente "resolvedor" en este contexto también es un geocodificador .
A veces los nombres se traducen a códigos numéricos, para que sean compactos o legibles por máquina. Dado que los números, en este caso, son identificadores de nombres, podemos considerar "nombres numéricos", por lo que este conjunto de códigos será una especie de "sistema de nombres estándar".
En el contexto del geocódigo, la partición del espacio es el proceso de dividir un espacio geográfico en dos o más subconjuntos disjuntos , lo que da como resultado un mosaico de subdivisiones. Cada subdivisión se puede dividir nuevamente, de forma recursiva , lo que da como resultado un mosaico jerárquico.
Cuando los nombres de las subdivisiones se expresan como códigos, y la sintaxis del código se puede descomponer en relaciones padre-hijo, a través de un esquema sintáctico bien definido, el conjunto de códigos geográficos configura un sistema jerárquico. Un fragmento de geocodificación (asociado a un nombre de subdivisión) puede ser una abreviatura, un código numérico o alfanumérico.
Un ejemplo popular es el sistema de código geográfico ISO 3166-2 , que representa los nombres de los países y los nombres de las respectivas subdivisiones administrativas separados por guiones. Por ejemplo DE
es Alemania , un código geográfico simple, y sus subdivisiones (ilustradas) son DE-BW
para Baden-Württemberg , DE-BY
para Bayern ,..., DE-NW
para Nordrhein-Westfalen , etc. El alcance es sólo el primer nivel de la jerarquía. Para más niveles existen otras convenciones, como el código HASC. [5] [6] Los códigos HASC son alfabéticos y sus fragmentos tienen longitud constante (2 letras). Ejemplos:
DE.NW
- Norte de Rhine-Westphalia . Un código geográfico jerárquico de dos niveles.DE.NW.CE
- Distrito Coesfeld . Un geocódigo jerárquico de 3 niveles.Dos códigos geográficos de un sistema de códigos geográficos jerárquicos con el mismo prefijo representan diferentes partes de la misma ubicación. Por ejemplo DE.NW.CE
, y DE.NW.BN
representa partes geográficamente interiores de DE.NW
, el prefijo común.
Cambiando los criterios de subdivisión podemos obtener otros sistemas jerárquicos. Por ejemplo, para los criterios hidrológicos existe un sistema de geocodificación, el código de unidad hidrológica de EE. UU. (HUC), que es una representación numérica de los nombres de las cuencas en un esquema de sintaxis jerárquica (se ilustra el primer nivel). Por ejemplo, el HUC 17
es el identificador de la " cuenca del Pacífico Noroeste de Columbia "; HUC 1706
de la " cuenca Lower Snake ", un subconjunto espacial de HUC 17
y un superconjunto de 17060102
("Río Imnaha").
Inspirada en las clásicas cuadrículas alfanuméricas , una cuadrícula global discreta ( DGG ) es un mosaico regular que cubre toda la superficie de la Tierra (el globo). La regularidad del mosaico se define por el uso de celdas de la misma forma en toda la cuadrícula, o "casi de la misma forma y cerca de la misma área" en una región de interés, como un país.
Todas las celdas de la cuadrícula tienen un identificador (ID de celda de DGG) y el centro de la celda se puede utilizar como referencia para convertir el ID de celda en un punto geográfico. Cuando se estandariza una expresión compacta legible por humanos de la identificación de la celda, se convierte en un código geográfico.
Los códigos geográficos de diferentes sistemas de código geográfico pueden representar la misma posición en el mundo, con la misma forma y precisión, pero difieren en la longitud de la cadena , el alfabeto de los dígitos, los separadores, etc. Las cuadrículas no globales también difieren en su alcance y, en general, están optimizadas geométricamente. (evitar superposiciones, espacios o pérdida de uniformidad) para uso local.
Cada celda de una grilla se puede transformar en una nueva grilla local, en un proceso recurrente . En el ejemplo ilustrado, la celda TQ 2980
es una subcelda de TQ 29
, es decir, una subcelda de TQ
. Un sistema de referencias geográficas regulares de cuadrícula es la base de un sistema de geocodificación jerárquico .
Dos códigos geográficos de un sistema de cuadrícula de códigos geográficos jerárquicos pueden utilizar la regla de prefijo: los códigos geográficos con el mismo prefijo representan diferentes partes de la misma ubicación más amplia . Usando nuevamente la ilustración lateral: TQ 28
y TQ 61
representa partes geográficamente interiores de TQ
, el prefijo común.
El código geográfico jerárquico se puede dividir en claves. El Geohash 6vd23gq
es la clave q
de la celda 6vd23g
, es decir, una celda de 6vd23
(clave g
), y así sucesivamente, claves por dígito. El OLC 58PJ642P
es la clave 48
de la celda 58PJ64
, es decir una celda de 58Q8
(clave 48
), y así sucesivamente, claves de dos dígitos. En el caso de OLC existe un segundo esquema de clave, después del +
separador: 58PJ642P+48
es la clave 2
de la celda 58PJ642P+4
. Utiliza dos esquemas clave. Algunos sistemas de geocodificación (por ejemplo, geometría S2) también utilizan un prefijo inicial con un esquema de clave no jerárquico.
En general, como representación opcional técnica y no compacta, los sistemas de geocodificación (basados en cuadrículas jerárquicas) también ofrecen la posibilidad de expresar su identificador de celda con un esquema detallado, mediante un recorrido de claves más largo. Por ejemplo, Geohash 6vd2
, que es un código base32 , se puede expandir a base4 0312312002
, que también es un esquema con claves por dígito. Geométricamente, cada celda de Geohash es un rectángulo que subdivide el espacio de forma recurrente en 32 nuevos rectángulos, por lo que base4 se subdivide en 4, es el límite de expansión de codificación. [7]
La uniformidad de la forma y el área de las celdas de una cuadrícula puede ser importante para otros usos, como las estadísticas espaciales . Existen formas estándar de construir una cuadrícula que cubra todo el mundo con celdas de igual área, forma regular y otras propiedades: Discrete Global Grid System (DGGS) es una serie de cuadrículas globales discretas que satisfacen todos los requisitos estandarizados definidos en 2017 por la OGC . [8] Cuando los códigos legibles por humanos obtenidos de los identificadores de celda de un DGGS también están estandarizados, se puede clasificar como un sistema de geocodificación basado en DGGS .
También hay sistemas mixtos, que utilizan una partición sintáctica, donde por ejemplo la primera parte (prefijo de código) es un código de nombre y la otra parte (sufijo de código) es un código de cuadrícula. Ejemplo:
FR-4J.Q2
, donde FR
está el código de nombre [9] y 4J.Q2
el código de cuadrícula. Semánticamente Francia es el contexto para obtener su red local.Para la semántica coherente mnemotécnica , en aplicaciones de geocodificación detallada, las soluciones mixtas son las más adecuadas.
Cualquier sistema de geocodificación basado en una cuadrícula regular, en general, también es una forma más corta de expresar una coordenada latitudinal/longitudinal. Pero un código geográfico con más de 6 caracteres es difícil de recordar. Por otro lado, un código geográfico basado en un nombre estándar (o abreviatura o nombre completo) es más fácil de recordar.
Esto sugiere que un "código mixto" puede resolver el problema, reduciendo la cantidad de caracteres cuando un nombre puede usarse como "contexto" para el código geográfico basado en cuadrícula. Por ejemplo, en un libro donde el autor dice "todos los códigos geográficos aquí están contextualizados por la ciudad del capítulo". En el capítulo sobre París, donde todos los lugares tienen un Geohash con prefijo u09
, ese código se puede eliminar —. Por ejemplo, Geohash u09tut
se puede reducir a tut
o mediante un código explícito para el contexto "FR-Paris tut
". Esto sólo es posible cuando la resolución del contexto (por ejemplo, la traducción de "FR-París" al prefijo u09
) es bien conocida.
De hecho, existe una metodología para códigos geográficos jerárquicos basados en cuadrículas con tamaño no variable, donde el prefijo del código describe un área más amplia, que puede asociarse con un nombre. Por lo tanto, es posible acortarlo reemplazando el prefijo por el contexto asociado. El contexto más habitual es un nombre oficial. Ejemplos:
Los ejemplos de la columna de referencia mixta son mucho más fáciles que recordar la columna de código DGG . Los métodos varían; por ejemplo, OLC se puede acortar eliminando sus primeros cuatro dígitos y adjuntando una localidad adecuada y suficientemente cercana. [10]
Cuando la referencia mixta también es corta (9 caracteres en el segundo ejemplo) y existe una convención de sintaxis para expresarla (supongamos CP‑PR~bgxed
), esta convención genera un nuevo sistema de geocodificación de nombre y cuadrícula. No es el caso del primer ejemplo porque, estrictamente hablando, "Cabo Verde, Praia" no es un código.
Para ser a la vez un sistema de nombre y cuadrícula y también una convención de referencia mixta, el sistema debe ser reversible. Los sistemas puros de nombre y cuadrícula, como Mapcode , sin forma de transformarlo en un código global, no son una referencia mixta, porque no existe un algoritmo para transformar el geocódigo mixto en un geocódigo basado en cuadrícula.
Geocódigos en uso y con alcance general:
Los códigos geográficos se pueden utilizar en lugar de los nombres oficiales de calles y/o números de casas , especialmente cuando las autoridades no han asignado una dirección a una ubicación determinada. También se pueden utilizar como una "dirección alternativa" si se puede convertir a un Geo URI . Incluso si el código geográfico no es la designación oficial de una ubicación, puede usarse como un "estándar local" para permitir que los hogares reciban entregas, accedan a servicios de emergencia, se registren para votar, etc.
Geocódigos en uso, como códigos postales . Un código geográfico reconocido por la Unión Postal Universal y adoptado como "código postal oficial" por un país , también es un código postal válido. No todos los códigos postales son geográficos y, para algunos sistemas de códigos postales, hay códigos que no son códigos geográficos (por ejemplo, en el sistema del Reino Unido ). Ejemplos, no una lista completa:
Geocódigos en uso para el ámbito de telefonía o radiodifusión:
Geocódigos en uso y con alcance específico:
Otros códigos geográficos:
Algunos estándares y servidores de nombres incluyen: ISO 3166, FIPS, INSEE, Geonames, IATA e ICAO .
También se han propuesto una serie de soluciones comerciales: