stringtranslate.com

Recuperación de información geográfica

Los sistemas de recuperación de información geográfica (GIR) son herramientas de búsqueda para buscar en la Web , documentos empresariales y búsquedas locales móviles que combinan consultas tradicionales basadas en texto con consultas de ubicación, como un mapa o nombres de lugares . Al igual que los sistemas de recuperación de información tradicionales , los sistemas GIR indexan texto e información de documentos estructurados y no estructurados , y también aumentan esos índices con información geográfica . El desarrollo y la ingeniería de los sistemas GIR apuntan a construir sistemas que puedan responder de manera confiable a consultas que incluyan una dimensión geográfica, como "¿Qué guerras se libraron en Grecia?" o "restaurantes en Beirut". [1] La similitud semántica y la desambiguación del sentido de las palabras son componentes importantes de GIR. [2] Para identificar los nombres de lugares, los sistemas GIR a menudo se basan en el procesamiento del lenguaje natural [3] u otros metadatos para asociar documentos de texto con ubicaciones. Tales herramientas de georreferenciación , geoetiquetado y geoanálisis a menudo necesitan bases de datos de nombres de ubicaciones, conocidas como diccionarios geográficos . [4] [5] [6] [7]

Arquitectura GIR

El GIR implica extraer y resolver el significado de las ubicaciones en texto no estructurado. Esto se conoce como análisis geográfico . [5] Después de identificar las menciones de lugares y ubicaciones en el texto, un sistema GIR indexa esta información para su búsqueda y recuperación. Los sistemas GIR se pueden dividir comúnmente en las siguientes etapas: análisis geográfico , indexación de texto y geográfica, almacenamiento de datos, clasificación de relevancia geográfica con respecto a una consulta geográfica y búsqueda de resultados, comúnmente con una interfaz de mapa.

Algunos sistemas GIR separan la indexación de texto de la indexación geográfica, lo que permite el uso de uniones de bases de datos genéricas , [8] o filtrado de múltiples etapas, [9] y otros los combinan para lograr mayor eficiencia. [10]

GIR debe gestionar varias formas de incertidumbre, incluida la ambigüedad semántica de las menciones de lugares en textos en lenguaje natural y la precisión de la posición. [11]

Sistemas GIR

Estudio y evaluación

El estudio de los sistemas GIR tiene una rica historia que se remonta a la década de 1970 y posiblemente antes. Véase el libro de Ray Larson, Geographic information retrieval and space browse [20], para obtener referencias a gran parte de la literatura sobre GIR anterior a la Web .

En 2005, el Foro de Evaluación Interlingüística añadió una rama geográfica, GeoCLEF. GeoCLEF fue el primer foro de evaluación al estilo TREC para sistemas GIR y brindó a los participantes la oportunidad de comparar sistemas. [21]

Aplicaciones

GIR tiene muchas aplicaciones en geoweb , neogeografía y búsqueda local móvil y ha sido el foco de muchas conferencias, incluidas las Conferencias de usuarios de ESRI y las conferencias Where 2.0 de O'Reilly . [22] [23]

Referencias

  1. ^ Purves, Ross; Jones, Christopher (1 de julio de 2011). "Recuperación de información geográfica". SIGSPATIAL Special . 3 (2): 2–4. CiteSeerX  10.1.1.130.3521 . doi :10.1145/2047296.2047297. ISSN  1946-7729. S2CID  1940653.
  2. ^ Kuhn, Werner; Raubal, Martin; Janowicz, Krzysztof (25 de mayo de 2011). "La semántica de la similitud en la recuperación de información geográfica | Janowicz | Journal of Spatial Information Science". Journal of Spatial Information Science . 2011 (2): 29–57. doi :10.5311/JOSIS.2011.2.26 (inactivo 2024-09-06) . Consultado el 12 de septiembre de 2015 .{{cite journal}}: CS1 maint: DOI inactivo a partir de septiembre de 2024 ( enlace )
  3. ^ "MetaCarta: poniendo el lenguaje natural en el mapa". GIS Monitor. 21 de agosto de 2003. Archivado desde el original el 3 de octubre de 2003.
  4. ^ Smith, Susan. "El espacio entre mapas, búsquedas y contenidos".
  5. ^ ab Dinan, Elizabeth (10 de noviembre de 2003). "Ware-Withal: MetaCarta, con base en el MIT, apuesta por su software de análisis geográfico automático".
  6. ^ "MetaCarta presenta la primera solución de georreferenciación compatible con los idiomas árabe y español". 20 de junio de 2007.
  7. ^ Frank, John; Warren, Bob. "Cómo localizar todo el contenido" (PDF) .
  8. ^ "Capítulo 15. Ajuste del rendimiento de las consultas". PostGIS In Action (segunda edición). Manning Publications.
  9. ^ "Apache Solr - Guía de referencia de Lucene - Búsqueda espacial" . Consultado el 3 de enero de 2021 .
  10. ^ "Índice de texto de búsqueda de mapas de CartaTrees". Archivado desde el original el 2 de abril de 2003.
  11. ^ Bordognaa, Gloria; Ghisalbertib, Giorgio; Psailac, Giuseppe (1 de junio de 2012). "Recuperación de información geográfica: modelado de la incertidumbre del contexto del usuario". Fuzzy Sets and Systems . 196 : 105–124. doi :10.1016/j.fss.2011.04.005. La recuperación de información geográfica (GIR) es hoy en día un tema de investigación candente que implica la gestión de la incertidumbre y la imprecisión y el modelado de las preferencias y el contexto del usuario. La indexación del contenido geográfico de los documentos implica lidiar con la ambigüedad, la sinonimia y la homonimia de los nombres geográficos en los textos. Por otro lado, la evaluación de consultas que especifican tanto las condiciones basadas en el contenido como las condiciones espaciales sobre el contenido de los documentos requiere representar la vaguedad y la dependencia del contexto de las condiciones espaciales y las preferencias personales del usuario.
  12. ^ Jennifer 8. Lee (14 de enero de 2002). "Los agentes federales buscan adaptar la tecnología privada". New York Times .{{cite news}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  13. ^ "La venganza de la geografía". The Economist . 13 de marzo de 2003. Archivado desde el original el 31 de diciembre de 2020.
  14. ^ Levy, Steven (7 de junio de 2004). "Creando el mapa definitivo: cuando la geografía digital se une a la tecnología inalámbrica y la Web, el mundo adquiere nuevas dimensiones". Newsweek . Archivado desde el original el 3 de junio de 2004.
  15. ^ EE.UU. concedió 7117199, Frank, John R.; Rauch , Erik M. y Donoghue, Karen, "Codificación y visualización espacial de información", concedida el 3 de octubre de 2006 
  16. ^ Erik Rauch ; Michael Bukatin; Kenneth Baker de MetaCarta . Un marco basado en la confianza para desambiguar términos geográficos (Speech) . Consultado el 3 de enero de 2021 .
  17. András Kornai , MetaCarta (2005). MetaCarta en GeoCLEF 2005 . GeoCLEF. En memoria de Erik Rauch
  18. ^ Adams, Benjamin; McKenzie, Grant; Gahegan, Mark (1 de enero de 2015). "Frankenplace". Actas de la 24.ª Conferencia Internacional sobre la World Wide Web. WWW '15. República y Cantón de Ginebra, Suiza: Comité Directivo de las Conferencias Internacionales sobre la World Wide Web. págs. 12-22. doi :10.1145/2736277.2741137. ISBN 978-1-4503-3469-3.S2CID 1639723  .
  19. ^ Amitay, Einat; Har'El, Nadav; Sivan, Ron; Soffer, Aya (julio de 2004). Web-a-where: geoetiquetado de contenido web . SIGIR '04: Actas de la 27.ª conferencia anual internacional ACM SIGIR sobre investigación y desarrollo en recuperación de información. pp. 273–280. doi :10.1145/1008992.1009040. Describimos Web-a-Where, un sistema para asociar la geografía con las páginas web. Web-a-Where localiza las menciones de lugares y determina el lugar al que se refiere cada nombre. Además, asigna a cada página un enfoque geográfico: una localidad que la página analiza en su conjunto.
  20. ^ Larson, Ray R. (1996). Recuperación de información geográfica y exploración espacial. Facultad de Bibliotecología y Ciencias de la Información, Universidad de Illinois en Urbana-Champaign. hdl :2142/416. ISBN 0878450971. ISSN  0069-4789.
  21. ^ Gey, Fredric; Larson, Ray; Sanderson, Mark; Joho, Hideo; Clough, Paul; Petras, Vivien (21 de septiembre de 2005). "GeoCLEF: descripción general de la ruta de recuperación de información geográfica entre idiomas de CLEF 2005". En Peters, Carol; Gey, Fredric C.; Gonzalo, Julio; Müller, Henning; Jones, Gareth JF; Kluck, Michael; Magnini, Bernardo; Rijke, Maarten de (eds.). Acceso a repositorios de información multilingüe . Apuntes de clase en informática. Vol. 4022. Springer Berlin Heidelberg. págs. 908–919. CiteSeerX 10.1.1.156.6368 . doi :10.1007/11878773_101. ISBN.  978-3-540-45697-1.
  22. ^ Local Search Faces Off - Craig Donato, Perry Evans, John Frank, Jeremy Kreitler, Shailesh Rao (Discurso). Where 2.0. 2005-06-29. Archivado desde el original el 2013-07-29 . Consultado el 2021-01-03 .
  23. ^ Himmelstein, Marty (2005). "Búsqueda local: Internet es como las Páginas Amarillas". Computer . 38 (2). Publicado por la IEEE Computer Society: 26–34. doi :10.1109/MC.2005.65. Cada día, millones de personas utilizan sus periódicos locales, anuncios clasificados, directorios de Páginas Amarillas, revistas regionales e Internet para encontrar información relacionada con las actividades de la vida diaria...

Véase también