Un geocódigo es un código que representa una entidad geográfica ( ubicación u objeto ). Es un identificador único de la entidad, para distinguirla de otras en un conjunto finito de entidades geográficas. En general, el geocódigo es un identificador breve y legible para humanos .
Geocódigos típicos y entidades que representa:
AF
(p. ej. para Afganistán o BR
para Brasil ), y sus convenciones de subdivisión, como los códigos de subdivisión AF (p. ej. AF-GHO
para la provincia de Ghor ) o los códigos de subdivisión BR (p. ej. para el estado de Amazonas ).BR-AM
6vjyngd
en el centro de Brasil ) o un código OLC (por ejemplo, una celda de ~0,004 km 258PJ642P+4
en el mismo punto).70040
(por ejemplo, representa el área central de distribución postal de Brasil).La norma ISO 19112:2019 (sección 3.1.2) adoptó el término “identificador geográfico” en lugar de geocódigo, para englobar etiquetas largas: referencia espacial en forma de etiqueta o código que identifica una ubicación . Por ejemplo, para la ISO, el nombre del país “República Popular China” es una etiqueta.
Los geocódigos se utilizan principalmente (en general como un tipo de datos atómicos ) para etiquetado , integridad de datos , geoetiquetado e indexación espacial .
En informática teórica, un sistema de geocodificación es una función hash que preserva la localidad .
Hay algunos aspectos comunes de muchos geocódigos (o sistemas de geocódigos) que pueden utilizarse como criterios de clasificación:
El conjunto de todos los códigos geográficos utilizados como identificadores únicos de las celdas de una cobertura total de la superficie geográfica (o cualquier área bien definida como un país o los océanos), es un sistema de códigos geográficos (también llamado esquema de códigos geográficos ). La sintaxis y la semántica de los códigos geográficos también son componentes de la definición del sistema:
/[A-Z]{2,2}/
).Muchas características sintácticas y semánticas también se resumen mediante la clasificación.
Cualquier geocódigo puede traducirse a partir de una expresión formal (y expandida) de la entidad geográfica, o viceversa, el geocódigo traducido a entidad. El primero se denomina proceso de codificación y el segundo de decodificación . Los actores y procesos involucrados, según la definición de OGC [3] , son:
En aplicaciones de indexación espacial, el geocódigo también se puede traducir entre representaciones legibles para humanos (por ejemplo, hexadecimal ) e internas (por ejemplo, entero binario sin signo de 64 bits ).
Los códigos geográficos, como los códigos de países , códigos de ciudades, etc., provienen de una tabla de nombres oficiales y los códigos y geometrías oficiales correspondientes (normalmente polígonos de áreas administrativas). "Oficial" en el contexto del control y el consenso, normalmente una tabla controlada por una organización de normalización o una autoridad gubernamental. Por tanto, el caso más general es una tabla de nombres estándar y los códigos estándar correspondientes (y sus geometrías oficiales).
Estrictamente hablando, el "nombre" relacionado con un geocódigo es un topónimo , y la tabla (por ejemplo, de topónimo a código estándar) es el recurso para la resolución del topónimo : es el proceso de relación , generalmente efectuado por un agente de software, entre un topónimo y "una huella espacial inequívoca del mismo lugar". [4] Cualquier sistema estandarizado de resolución de topónimos, que tenga códigos o abreviaturas codificadas, puede usarse como sistema de geocódigo . El agente "resolutor" en este contexto también es un geocodificador .
A veces, los nombres se traducen en códigos numéricos para que sean compactos o legibles por máquina. Como los números, en este caso, son identificadores de nombres, podemos considerar "nombres numéricos", por lo que este conjunto de códigos será una especie de "sistema de nombres estándar".
En el contexto de la geocodificación, la partición espacial es el proceso de dividir un espacio geográfico en dos o más subconjuntos disjuntos , lo que da como resultado un mosaico de subdivisiones. Cada subdivisión se puede volver a particionar de forma recursiva , lo que da como resultado un mosaico jerárquico.
Cuando los nombres de las subdivisiones se expresan como códigos y la sintaxis de los códigos se puede descomponer en relaciones padre-hijo, mediante un esquema sintáctico bien definido, el conjunto de geocodificación configura un sistema jerárquico. Un fragmento de geocodificación (asociado a un nombre de subdivisión) puede ser una abreviatura, un código numérico o alfanumérico.
Un ejemplo popular es el sistema de geocodificación ISO 3166-2 , que representa los nombres de los países y los nombres de las respectivas subdivisiones administrativas separados por un guión. Por ejemplo , AlemaniaDE
es un geocódigo simple, y sus subdivisiones (ilustradas) son para Baden-Württemberg , para Bayern , ..., para Nordrhein-Westfalen , etc. El alcance es solo el primer nivel de la jerarquía. Para más niveles existen otras convenciones, como el código HASC. [5] [6] Los códigos HASC son alfabéticos y sus fragmentos tienen una longitud constante (2 letras). Ejemplos:DE-BW
DE-BY
DE-NW
DE.NW
- Renania del Norte-Westfalia . Geocodificación jerárquica de dos niveles.DE.NW.CE
- Distrito Coesfeld . Un geocódigo jerárquico de 3 niveles.Dos geocódigos de un sistema de geocódigo jerárquico con el mismo prefijo representan partes diferentes de la misma ubicación. Por ejemplo, DE.NW.CE
y DE.NW.BN
representa partes geográficamente interiores de DE.NW
, el prefijo común.
Cambiando los criterios de subdivisión podemos obtener otros sistemas jerárquicos. Por ejemplo, para los criterios hidrológicos existe un sistema de geocodificación, el código de unidad hidrológica de los Estados Unidos (HUC), que es una representación numérica de los nombres de las cuencas en un esquema de sintaxis jerárquica (primer nivel ilustrado). Por ejemplo, el HUC 17
es el identificador de la " cuenca del Pacífico Noroeste de Columbia "; el HUC 1706
de la " cuenca del Bajo Snake ", un subconjunto espacial del HUC 17
y un superconjunto del 17060102
("río Imnaha").
Inspirada en las cuadrículas alfanuméricas clásicas , una cuadrícula global discreta ( DGG ) es un mosaico regular que cubre toda la superficie de la Tierra (el globo). La regularidad del mosaico se define por el uso de celdas de la misma forma en toda la cuadrícula, o "casi de la misma forma y casi de la misma área" en una región de interés, como un país.
Todas las celdas de la cuadrícula tienen un identificador (ID de celda de DGG) y el centro de la celda se puede utilizar como referencia para la conversión de la ID de celda en un punto geográfico. Cuando se estandariza una expresión compacta y legible para humanos de la ID de celda, se convierte en un geocódigo.
Los geocódigos de diferentes sistemas de geocódigo pueden representar la misma posición en el globo, con la misma forma y precisión, pero difieren en la longitud de la cadena , el alfabeto de dígitos, los separadores, etc. Las cuadrículas no globales también difieren en su alcance y, en general, están optimizadas geométricamente (evitan superposiciones, espacios o pérdida de uniformidad) para el uso local.
Cada celda de una cuadrícula puede transformarse en una nueva cuadrícula local, en un proceso recurrente . En el ejemplo ilustrado, la celda TQ 2980
es una subcelda de TQ 29
, que es una subcelda de TQ
. Un sistema de referencias de cuadrículas geográficas regulares es la base de un sistema de geocodificación jerárquico .
Dos geocódigos de un sistema de cuadrícula de geocódigo jerárquico pueden utilizar la regla del prefijo: los geocódigos con el mismo prefijo representan partes diferentes de la misma ubicación más amplia . Utilizando nuevamente la ilustración lateral: TQ 28
y TQ 61
representa partes geográficamente interiores de TQ
, el prefijo común.
El geocódigo jerárquico se puede dividir en claves. El Geohash 6vd23gq
es la clave q
de la celda 6vd23g
, es decir, una celda de 6vd23
(clave g
), y así sucesivamente, claves por dígito. El OLC 58PJ642P
es la clave 48
de la celda 58PJ64
, es decir, una celda de 58Q8
(clave 48
), y así sucesivamente, claves de dos dígitos. En el caso de OLC hay un segundo esquema de clave, después del +
separador: 58PJ642P+48
es la clave 2
de la celda 58PJ642P+4
. Utiliza dos esquemas de clave. Algunos sistemas de geocódigos (por ejemplo, geometría S2) también utilizan un prefijo inicial con un esquema de clave no jerárquico.
En general, como representación opcional técnica y no compacta, los sistemas de geocodificación (basados en cuadrículas jerárquicas) también ofrecen la posibilidad de expresar su identificador de celda con un esquema de grano fino, mediante un camino más largo de claves. Por ejemplo, el Geohash 6vd2
, que es un código base32 , se puede expandir a base4 0312312002
, que también es un esquema con claves por dígito. Geométricamente, cada celda del Geohash es un rectángulo que subdivide el espacio recurrentemente en 32 nuevos rectángulos, por lo que, base4 subdividándose en 4, es el límite de expansión de la codificación. [7]
La uniformidad de la forma y el área de las celdas en una cuadrícula puede ser importante para otros usos, como las estadísticas espaciales . Existen formas estándar de construir una cuadrícula que cubra todo el globo con celdas de igual área, forma regular y otras propiedades: El sistema de cuadrícula global discreta (DGGS) es una serie de cuadrículas globales discretas que satisfacen todos los requisitos estandarizados definidos en 2017 por la OGC . [8] Cuando los códigos legibles por humanos obtenidos a partir de identificadores de celdas de un DGGS también están estandarizados, se puede clasificar como un sistema de geocodificación basado en DGGS .
También existen sistemas mixtos, que utilizan una partición sintáctica, donde por ejemplo la primera parte (prefijo del código) es un código de nombre y la otra parte (sufijo del código) es un código de cuadrícula. Ejemplo:
FR-4J.Q2
, donde FR
es el código del nombre [9] y 4J.Q2
es el código de la cuadrícula. Semánticamente, Francia es el contexto, para obtener su cuadrícula local.Para una semántica coherente mnemotécnica , en aplicaciones de geocodificación de grano fino, las soluciones mixtas son las más adecuadas.
Cualquier sistema de geocodificación basado en una cuadrícula regular, en general, también es una forma más corta de expresar una coordenada latitudinal/longitudinal. Sin embargo, un geocódigo con más de 6 caracteres es difícil de recordar. Por otro lado, un geocódigo basado en un nombre estándar (o abreviatura o el nombre completo) es más fácil de recordar.
Esto sugiere que un "código mixto" puede resolver el problema, reduciendo la cantidad de caracteres cuando se puede usar un nombre como "contexto" para el geocódigo basado en cuadrícula. Por ejemplo, en un libro donde el autor dice "todos los geocódigos aquí están contextualizados por la ciudad del capítulo". En el capítulo sobre París, donde todos los lugares tienen un Geohash con prefijo u09
, ese código se puede eliminar -. Por ejemplo, Geohash u09tut
se puede reducir a tut
, o, mediante un código explícito para el contexto "FR-París tut
". Esto solo es posible cuando la resolución del contexto (por ejemplo, la traducción de "FR-París" al prefijo u09
) es bien conocida.
De hecho, existe una metodología para geocodificaciones basadas en cuadrículas jerárquicas con tamaño no variable, donde el prefijo del código describe un área más amplia, que puede asociarse con un nombre. Por lo tanto, es posible acortarlo reemplazando el prefijo por el contexto asociado. El contexto más habitual es un nombre oficial. Ejemplos:
Los ejemplos de la columna de referencia mixta son significativamente más fáciles de recordar que la columna de código DGG . Los métodos varían, por ejemplo, el OLC se puede acortar eliminando sus primeros cuatro dígitos y adjuntando una localidad lo suficientemente cercana. [10]
Cuando la referencia mixta también es corta (9 caracteres en el segundo ejemplo) y existe una convención sintáctica para expresarla (supongamos CP‑PR~bgxed
), esta convención genera un nuevo sistema de geocodificación de nombre y cuadrícula. Este no es el caso del primer ejemplo porque, estrictamente hablando, "Cabo Verde, Praia" no es un código.
Para que sea a la vez un sistema de nombre y cuadrícula y también una convención de referencia mixta, el sistema debe ser reversible. Los sistemas de nombre y cuadrícula puros, como Mapcode , sin forma de transformarlos en un código global, no son una referencia mixta, porque no existe un algoritmo para transformar el geocódigo mixto en un geocódigo basado en cuadrícula.
Geocódigos en uso y con alcance general:
Los geocódigos se pueden utilizar en lugar de los nombres oficiales de calles y/o números de casas , en particular cuando las autoridades no han asignado una dirección a una ubicación determinada. También se pueden utilizar como una "dirección alternativa" si se puede convertir a un URI geográfico . Incluso si el geocódigo no es la designación oficial de una ubicación, se puede utilizar como un "estándar local" para permitir que los hogares reciban entregas, accedan a servicios de emergencia, se registren para votar, etc.
Códigos geográficos en uso, como códigos postales . Un código geográfico reconocido por la Unión Postal Universal y adoptado como "código postal oficial" por un país , también es un código postal válido. No todos los códigos postales son geográficos y, en algunos sistemas de códigos postales, hay códigos que no son códigos geográficos (por ejemplo, en el sistema del Reino Unido ). Ejemplos, no una lista completa:
Geocódigos en uso para el ámbito de telefonía o radiodifusión:
Geocódigos en uso y con alcance específico:
Otros geocódigos:
Algunos estándares y servidores de nombres incluyen: ISO 3166, FIPS, INSEE, Geonames, IATA y ICAO .
También se han propuesto varias soluciones comerciales: