stringtranslate.com

Geocodificación de direcciones

La geocodificación de direcciones , o simplemente geocodificación , es el proceso de tomar una descripción basada en texto de una ubicación, como una dirección o el nombre de un lugar , y devolver coordenadas geográficas , frecuentemente un par de latitud/longitud, para identificar una ubicación en la Tierra. superficie. [1] La geocodificación inversa , por otro lado, convierte las coordenadas geográficas en una descripción de una ubicación, generalmente el nombre de un lugar o una ubicación direccionable. La geocodificación se basa en una representación informática de los puntos de dirección, la red de calles/carreteras, junto con los límites postales y administrativos.

Las coordenadas geográficas que representan ubicaciones a menudo varían mucho en cuanto a precisión posicional. Los ejemplos incluyen centroides de edificios , centroides de parcelas de tierra , ubicaciones interpoladas basadas en rangos de vías públicas , centroides de segmentos de calles, centroides de códigos postales (por ejemplo, códigos postales , CEDEX ) y centroides de divisiones administrativas .

Historia

La geocodificación, un subconjunto del análisis espacial del Sistema de Información Geográfica (SIG) , ha sido un tema de interés desde principios de los años sesenta.

década de 1960

En 1960, el Dr. Roger Tomlinson , quien desde entonces ha sido reconocido como el padre del SIG, inventó el primer SIG operativo, denominado Sistema de Información Geográfica de Canadá (CGIS). El CGIS se utilizó para almacenar y analizar datos recopilados para el Inventario de Tierras de Canadá , que mapeó información sobre agricultura , vida silvestre y silvicultura a una escala de 1:50.000, con el fin de regular la capacidad de la tierra en las zonas rurales de Canadá . Sin embargo, el CGIS duró hasta la década de 1990 y nunca estuvo disponible comercialmente.

El 1 de julio de 1963, el Departamento de Correos de los Estados Unidos (USPOD) introdujo códigos postales de cinco dígitos en todo el país. En 1983, se crearon códigos ZIP+4 de nueve dígitos como identificador adicional para localizar direcciones con mayor precisión.

En 1964, el Laboratorio de Gráficos por Computadora y Análisis Espacial de Harvard desarrolló un código de software innovador (por ejemplo, GRID y SYMAP), todos los cuales fueron fuentes para el desarrollo comercial de SIG.

En 1967, un equipo de la Oficina del Censo, incluido el matemático James Corbett [3] y Donald Cooke [4] , inventó la codificación de mapas independiente dual (DIME), el primer modelo moderno de mapeo vectorial, que cifraba rangos de direcciones en archivos de redes de calles y incorporó el algoritmo de codificación geográfica "porcentaje a lo largo". [5] Aún en uso en plataformas como Google Maps y MapQuest , el algoritmo de "porcentaje a lo largo" denota dónde se encuentra una dirección coincidente a lo largo de una característica de referencia como un porcentaje de la longitud total de la característica de referencia. DIME estaba destinado al uso de la Oficina del Censo de los Estados Unidos e implicaba mapear con precisión las caras de los bloques, digitalizar nodos que representan intersecciones de calles y formar relaciones espaciales . New Haven, Connecticut, fue la primera ciudad del mundo con una base de datos de red de calles geocodificables.

década de 1980

A finales de la década de 1970, se estaban desarrollando dos plataformas principales de codificación geográfica de dominio público : GRASS GIS y MOSS. A principios de la década de 1980 surgieron muchos más proveedores comerciales de software de codificación geográfica, a saber, Intergraph , ESRI , CARIS , ERDAS y MapInfo Corporation . Estas plataformas fusionaron el enfoque de la década de 1960 de separar la información espacial con el enfoque de organizar esta información espacial en estructuras de bases de datos.

En 1986, el Sistema de análisis y visualización de mapas (MIDAS) se convirtió en el primer software de geocodificación de escritorio, diseñado para el sistema operativo DOS . La codificación geográfica pasó del departamento de investigación al mundo empresarial con la adquisición de MIDAS por parte de MapInfo. Desde entonces, MapInfo ha sido adquirida por Pitney Bowes y ha sido pionera en fusionar la codificación geográfica con la inteligencia empresarial; permitiendo que la inteligencia de ubicación brinde soluciones para los sectores público y privado .

década de 1990

A finales del siglo XX, la codificación geográfica se volvió más orientada al usuario, especialmente a través del software SIG de código abierto. Las aplicaciones cartográficas y los datos geoespaciales se habían vuelto más accesibles a través de Internet.

Debido a que la técnica de envío y devolución por correo tuvo tanto éxito en el censo de 1980 , la Oficina del Censo de EE. UU. pudo reunir una gran base de datos geoespacial, utilizando codificación geográfica de calles interpolada . [6] Esta base de datos – junto con la cobertura nacional de hogares del Censo – permitió el nacimiento de TIGER ( Codificación y Referenciación Geográfica Topológicamente Integrada ).

Desde entonces, TIGER, que contiene rangos de direcciones en lugar de direcciones individuales, se ha implementado en casi todas las plataformas de software de codificación geográfica que se utilizan en la actualidad. A finales del censo de 1990 , TIGER "contenía una coordenada de latitud/longitud para más de 30 millones de intersecciones y puntos finales de características y casi 145 millones de puntos de 'forma' de características que definían los más de 42 millones de segmentos de características que delineaban más de 12 millones polígonos." [7]

TIGER fue el gran avance para las soluciones geoespaciales de "grandes datos".

2000

A principios de la década de 2000, surgió la estandarización de direcciones del Sistema de soporte de precisión de codificación (CASS) . La certificación CASS se ofrece a todos los proveedores de software y remitentes de publicidad que desean que los Servicios Postales de los Estados Unidos (USPS) evalúen la calidad de su software de estandarización de direcciones. La certificación CASS que se renueva anualmente se basa en códigos de punto de entrega , códigos postales y códigos postales+4. La adopción de un software certificado CASS por parte de los proveedores de software les permite recibir descuentos en los costos de envío y correo masivo . Pueden beneficiarse de una mayor precisión y eficiencia en esos envíos masivos de correo, después de contar con una base de datos certificada. A principios de la década de 2000, las plataformas de codificación geográfica también podían admitir múltiples conjuntos de datos.

En 2003, las plataformas de geocodificación eran capaces de fusionar códigos postales con datos de calles, actualizados mensualmente. Este proceso se conoció como "combinación".

A partir de 2005, las plataformas de geocodificación incluían geocodificación de centroide de parcelas. La geocodificación de centroide de parcela permitió mucha precisión en la geocodificación de una dirección. Por ejemplo, el centroide de parcela permitió a un geocodificador determinar el centroide de un edificio o lote de terreno específico. Las plataformas ahora también podían determinar la elevación de parcelas específicas .

En 2005 también se introdujo el Número de Parcela del Tasador (APN) . El asesor fiscal de una jurisdicción pudo asignar este número a parcelas de bienes raíces. Esto permitió una identificación y un mantenimiento de registros adecuados. Un APN es importante para geocodificar un área cubierta por un contrato de arrendamiento de gas o petróleo e indexar la información de impuestos a la propiedad proporcionada al público.

En 2006, se introdujeron la codificación geográfica inversa y la búsqueda APN inversa en las plataformas de codificación geográfica. Esto implicó geocodificar la ubicación de un punto numérico, con longitud y latitud , en una dirección textual legible.

En 2008 y 2009 se produjo un crecimiento de las plataformas de geocodificación interactivas y orientadas al usuario, concretamente MapQuest, Google Maps, Bing Maps y los sistemas de posicionamiento global (GPS). Estas plataformas se hicieron aún más accesibles al público con el crecimiento simultáneo de la industria móvil, específicamente los teléfonos inteligentes.

década de 2010

En la década de 2010, los proveedores admitieron plenamente la codificación geográfica y la codificación geográfica inversa a nivel mundial. La interfaz de programación de aplicaciones (API) de geocodificación basada en la nube y la geocodificación local han permitido una mayor tasa de coincidencia, mayor precisión y mayor velocidad. Actualmente se ha vuelto popular la idea de que la geocodificación pueda influir en las decisiones comerciales. Esta es la integración entre el proceso de geocodificación y la inteligencia empresarial.

El futuro de la geocodificación también implica la geocodificación tridimensional, la geocodificación en interiores y los retornos en múltiples idiomas para las plataformas de geocodificación.

Proceso de geocodificación

La geocodificación es una tarea que involucra múltiples conjuntos de datos y procesos, todos los cuales funcionan juntos. Un geocodificador consta de dos componentes importantes: un conjunto de datos de referencia y el algoritmo de geocodificación. Cada uno de estos componentes se compone de suboperaciones y subcomponentes. Sin comprender cómo funcionan estos procesos de geocodificación, es difícil tomar decisiones comerciales informadas basadas en la geocodificación.

Datos de entrada

Los datos de entrada son información textual descriptiva (dirección o nombre del edificio) que el usuario desea convertir en datos espaciales numéricos (latitud y longitud), mediante el proceso de geocodificación.

Clasificación de datos de entrada

Los datos de entrada se clasifican en dos categorías: datos de entrada relativos y datos de entrada absolutos.

Datos de entrada relativos

Los datos de entrada relativos son descripciones textuales de una ubicación que, por sí solas, no pueden generar una representación espacial de esa ubicación. Dichos datos generan un código geográfico relativo, que es dependiente y geográficamente relativo de otras ubicaciones de referencia. Un ejemplo de código geográfico relativo es la interpolación de direcciones utilizando unidades de área o vectores de línea. "Al otro lado de la calle del Empire State Building" es un ejemplo de datos de entrada relativos. La ubicación que se busca no se puede determinar sin identificar el Empire State Building. Las plataformas de geocodificación a menudo no admiten dichas ubicaciones relativas, pero se están logrando avances en esta dirección.

Datos de entrada absolutos

Los datos de entrada absolutos son las descripciones textuales de una ubicación que, por sí solas, pueden generar una representación espacial de esa ubicación. Este tipo de datos genera una ubicación conocida absoluta independientemente de otras ubicaciones. Por ejemplo, códigos postales de USPS; Códigos postales USPS+4; direcciones postales completas y parciales; apartados de correos de USPS; rutas rurales; ciudades; condados; intersecciones; y se puede hacer referencia absoluta a los lugares con nombre en una fuente de datos.

Cuando hay mucha variabilidad en la forma en que se pueden representar las direcciones, como demasiados datos de entrada o muy pocos datos de entrada, los geocodificadores utilizan la normalización y la estandarización de direcciones para resolver este problema.

Interpolación de direcciones

Un método sencillo de geocodificación es la interpolación de direcciones . Este método utiliza datos de un sistema de información geográfica de calles donde la red de calles ya está mapeada dentro del espacio de coordenadas geográficas. A cada segmento de calle se le atribuyen rangos de direcciones (por ejemplo, números de casa de un segmento al siguiente). La codificación geográfica toma una dirección, la relaciona con una calle y un segmento específico (como una cuadra , en ciudades que usan la convención de "bloque"). Luego, la geocodificación interpola la posición de la dirección, dentro del rango a lo largo del segmento.

Ejemplo

Tomemos por ejemplo: 742 Evergreen Terrace

Digamos que este segmento (por ejemplo, una cuadra) de Evergreen Terrace va desde 700 hasta 799. Las direcciones pares se encuentran en el lado este de Evergreen Terrace, con las direcciones impares en el lado oeste de la calle. 742 Evergreen Terrace estaría (probablemente) ubicado a un poco menos de la mitad de la cuadra, en el lado este de la calle. Se mapearía un punto en esa ubicación a lo largo de la calle, quizás desplazado una distancia al este de la línea central de la calle.

Factores que complican

Sin embargo, este proceso no siempre es tan sencillo como en este ejemplo. Las dificultades surgen cuando

Si bien podría haber un 742 Evergreen Terrace en Springfield, también podría haber un 742 Evergreen Terrace en Shelbyville. Preguntar el nombre de la ciudad (y el estado, provincia, país, etc. según sea necesario) puede resolver este problema. Boston , Massachusetts [8] tiene múltiples ubicaciones de "100 Washington Street" porque se han anexado varias ciudades sin cambiar los nombres de las calles, lo que requiere el uso de códigos postales o nombres de distrito únicos para eliminar la ambiguación. La precisión de la codificación geográfica se puede mejorar enormemente si primero se utilizan buenas prácticas de verificación de direcciones . La verificación de la dirección confirmará la existencia de la dirección y eliminará ambigüedades. Una vez determinada la dirección válida, es muy fácil geocodificar y determinar las coordenadas de latitud/longitud. Finalmente, varias advertencias sobre el uso de la interpolación:

Un error muy común es creer en los índices de precisión de los atributos geocodificables de un mapa determinado. La precisión indicada por los proveedores no influye en que una dirección se atribuya al segmento correcto o al lado correcto del segmento, ni da como resultado una posición precisa a lo largo de ese segmento correcto. Con el proceso de codificación geográfica utilizado para los conjuntos de datos TIGER del censo de EE. UU. , entre el 5 % y el 7,5 % de las direcciones se pueden asignar a un sector censal diferente , mientras que un estudio del sistema similar a TIGER de Australia encontró que el 50 % de los puntos geocodificados se asignaron a la propiedad incorrecta. parcela. [9] La precisión de los datos geocodificados también puede influir en la calidad de la investigación que utiliza estos datos. Un estudio [10] realizado por un grupo de investigadores de Iowa encontró que el método común de geocodificación utilizando conjuntos de datos TIGER como se describe anteriormente puede causar una pérdida de hasta el 40% del poder de un análisis estadístico. Una alternativa es utilizar datos ortofotográficos o de imágenes codificados, como los datos de puntos de dirección de Ordnance Survey en el Reino Unido, pero estos conjuntos de datos son generalmente costosos.

Por este motivo, es muy importante evitar el uso de resultados interpolados excepto en aplicaciones no críticas. La codificación geográfica interpolada generalmente no es apropiada para tomar decisiones autorizadas, por ejemplo, si esa decisión afectará la seguridad humana. Los servicios de emergencia, por ejemplo, no toman una decisión autorizada basada en sus interpolaciones; Siempre se enviará una ambulancia o un camión de bomberos independientemente de lo que diga el mapa. [ cita necesaria ]

Otras técnicas

En áreas rurales u otros lugares que carecen de datos y direcciones de redes de calles de alta calidad, el GPS es útil para mapear una ubicación. Para accidentes de tráfico, la geocodificación de una intersección de calles o un punto medio a lo largo de la línea central de una calle es una técnica adecuada. La mayoría de las carreteras en los países desarrollados tienen marcadores de millas para ayudar en la respuesta a emergencias, el mantenimiento y la navegación. También es posible utilizar una combinación de estas técnicas de codificación geográfica, utilizando una técnica particular para ciertos casos y situaciones y otras técnicas para otros casos. A diferencia de la geocodificación de registros de direcciones postales estructurados, la resolución de topónimos asigna nombres de lugares en colecciones de documentos no estructurados a sus correspondientes huellas espaciales.

Investigación

La investigación ha introducido un nuevo enfoque para los aspectos de control y conocimiento de la geocodificación, mediante el uso de un paradigma basado en agentes. [12] Además del nuevo paradigma de geocodificación, se han desarrollado técnicas de corrección y algoritmos de control adicionales. [13] El enfoque representa los elementos geográficos que se encuentran comúnmente en las direcciones como agentes individuales. Esto proporciona puntos en común y dualidad al control y la representación geográfica. Además de la publicación científica, el nuevo enfoque y el posterior prototipo obtuvieron cobertura en los medios nacionales de Australia. [14] La investigación se llevó a cabo en la Universidad Curtin en Perth, Australia Occidental. [15]

Con el reciente avance en aprendizaje profundo y visión por computadora, se ha propuesto un nuevo flujo de trabajo de geocodificación, que aprovecha las técnicas de detección de objetos para extraer directamente el centroide de los tejados de los edificios como salida de geocodificación. [dieciséis]

Usos

Las ubicaciones geocodificadas son útiles en muchos análisis SIG, cartografía, flujo de trabajo de toma de decisiones, combinación de transacciones o se inyectan en procesos comerciales más grandes. En la web, la codificación geográfica se utiliza en servicios como enrutamiento y búsqueda local . La codificación geográfica, junto con el GPS , proporciona datos de ubicación para geoetiquetar medios, como fotografías o elementos RSS .

Preocupaciones sobre la privacidad

La proliferación y facilidad de acceso a los servicios de geocodificación (y geocodificación inversa ) plantea preocupaciones sobre la privacidad. Por ejemplo, al mapear los incidentes delictivos, las agencias encargadas de hacer cumplir la ley buscan equilibrar los derechos de privacidad de las víctimas y los delincuentes con el derecho del público a saber. Los organismos encargados de hacer cumplir la ley han experimentado con técnicas de codificación geográfica alternativas que les permiten enmascarar una parte de los detalles de la ubicación (por ejemplo, direcciones específicas que llevarían a identificar a una víctima o un delincuente). Además, al proporcionar al público mapas de delitos en línea , también incluyen exenciones de responsabilidad con respecto a la precisión de la ubicación de los puntos en el mapa, reconocen estas técnicas de enmascaramiento de ubicación e imponen términos de uso para la información.

Ver también

Referencias

  1. ^ Leidner, JL (2017). "Georreferenciación: de textos a mapas". Enciclopedia internacional de geografía: personas, la tierra, el medio ambiente y la tecnología . vi : 2897–2907. doi : 10.1002/9781118786352.wbieg0160. ISBN 9780470659632.
  2. ^ Término "Geocode" como verbo, según lo define el Oxford English Dictionary en https://en.oxforddictionaries.com/definition/geocode Archivado el 26 de abril de 2018 en Wayback Machine.
  3. ^ Corbett, James P. Principios topológicos en cartografía. vol. 48. Departamento de Comercio de Estados Unidos, Oficina del Censo, 1979.
  4. ^ "CV breve" (PDF) . Consultado el 9 de abril de 2023 .
  5. ^ Olivares, Miriam. "Sistemas de información geográfica en Yale: recursos de codificación geográfica". guías.library.yale.edu . Consultado el 22 de junio de 2016 .
  6. ^ "Habilitar espacialmente los datos: ¿Qué es la geocodificación?". Servicio Nacional de Referencia de Justicia Penal . Consultado el 22 de junio de 2016 .
  7. ^ "25 Aniversario de TIGRE". census.maps.arcgis.com . Consultado el 22 de junio de 2016 .
  8. ^ "Mapas de Google". Mapas de Google . Consultado el 9 de abril de 2023 .
  9. ^ Ratcliffe, Jerry H. (2001). "Sobre la precisión de los datos de direcciones geocodificadas tipo TIGER en relación con unidades de área catastral y censal" (PDF) . Revista Internacional de Ciencia de la Información Geográfica . 15 (5): 473–485. Código Bib : 2001IJGIS..15..473R. doi :10.1080/13658810110047221. S2CID  14061774. Archivado desde el original (PDF) el 23 de junio de 2006.
  10. ^ Mazumdar S, Rushton G, Smith B, et al. (2008). "Precisión de la geocodificación y recuperación de las relaciones entre exposiciones ambientales y salud". Revista Internacional de Geografía de la Salud . 7 : 1–13. doi : 10.1186/1476-072X-7-13 . PMC 2359739 . PMID  18387189. 
  11. ^ Rwerekane, Valentín; Ndashimye, Maurice (2017). "Esquema de códigos postales basado en codificación de áreas naturales" (PDF) . Revista Internacional de Ingeniería en Computación y Comunicaciones . 6 (3): 161-172. doi : 10.17706/IJCCE.2017.6.3.161-172 . Consultado el 25 de agosto de 2022 .
  12. ^ Hutchinson, Matthew J (2010). Desarrollo de un marco basado en agentes para la geocodificación inteligente (tesis doctoral). Universidad de Curtin.
  13. ^ Un marco basado en agentes para habilitar servicios de codificación geográfica inteligente
  14. ^ Jennifer Foresew (24 de noviembre de 2009). "Las direcciones difíciles no suponen ningún problema para IntelliGeoLocator". El australiano . Consultado el 9 de mayo de 2011 .
  15. ^ Departamento de Educación, Australia Occidental (abril de 2011). "X marca el lugar". Asuntos escolares . Consultado el 9 de mayo de 2011 .
  16. ^ Yin, Zhengcong; et al. (2019). "Un enfoque de aprendizaje profundo para la codificación geográfica de tejados". Transacciones en SIG . 23 (3): 495–514. Código Bib : 2019TrGIS..23..495Y. doi :10.1111/tgis.12536. S2CID  195804197.

enlaces externos