stringtranslate.com

Recuperación de información geográfica

La recuperación de información geográfica (GIR) o los sistemas de recuperación de información geográfica son herramientas de búsqueda para buscar en la Web , documentos empresariales y búsqueda local móvil que combinan consultas tradicionales basadas en texto con consultas de ubicación, como un mapa o nombres de lugares . Al igual que los sistemas tradicionales de recuperación de información , los sistemas GIR indexan texto e información de documentos estructurados y no estructurados , y también aumentan esos índices con información geográfica . El desarrollo y la ingeniería de sistemas GIR tienen como objetivo construir sistemas que puedan responder de manera confiable consultas que incluyan una dimensión geográfica, como "¿Qué guerras se libraron en Grecia?" o "restaurantes en Beirut". [1] La similitud semántica y la desambiguación del sentido de las palabras son componentes importantes de GIR. [2] Para identificar nombres de lugares, los sistemas GIR a menudo se basan en el procesamiento del lenguaje natural [3] u otros metadatos para asociar documentos de texto con ubicaciones. Estas herramientas de georreferenciación , geoetiquetado y geoparsing a menudo necesitan bases de datos de nombres de ubicaciones, conocidas como nomenclátores . [4] [5] [6] [7]

arquitectura GIR

GIR implica extraer y resolver el significado de ubicaciones en texto no estructurado. Esto se conoce como geoparsing . [5] Después de identificar menciones de lugares y ubicaciones en el texto, un sistema GIR indexa esta información para su búsqueda y recuperación. Los sistemas GIR comúnmente se pueden dividir en las siguientes etapas: análisis geográfico , indexación geográfica y de texto, almacenamiento de datos, clasificación de relevancia geográfica con respecto a una consulta geográfica y búsqueda de resultados comúnmente con una interfaz de mapa.

Algunos sistemas GIR separan la indexación de texto de la indexación geográfica, lo que permite el uso de uniones de bases de datos genéricas , [8] o filtrado de múltiples etapas, [9] y otros los combinan para lograr eficiencia. [10]

GIR debe gestionar varias formas de incertidumbre, incluida la ambigüedad semántica de las menciones de lugares en textos en lenguaje natural y la precisión de la posición. [11]

sistemas GIR

Estudio y Evaluación

El estudio de los sistemas GIR tiene una rica historia que se remonta a la década de 1970 y posiblemente antes. Véase el libro de Ray Larson Recuperación de información geográfica y navegación espacial [20] para referencias a gran parte de la literatura anterior a la Web sobre GIR.

En 2005, el Foro de Evaluación Interlingüística añadió una vía geográfica, GeoCLEF. GeoCLEF fue el primer foro de evaluación estilo TREC para sistemas GIR y brindó a los participantes la oportunidad de comparar sistemas. [21]

Aplicaciones

GIR tiene muchas aplicaciones en geoweb , neogeografía y búsqueda local móvil y ha sido el foco de muchas conferencias, incluidas las conferencias de usuarios de ESRI y las conferencias Where 2.0 de O'Reilly . [22] [23]

Referencias

  1. ^ Purves, Ross; Jones, Christopher (1 de julio de 2011). "Recuperación de información geográfica". Especial SIGSPATIAL . 3 (2): 2–4. CiteSeerX  10.1.1.130.3521 . doi :10.1145/2047296.2047297. ISSN  1946-7729. S2CID  1940653.
  2. ^ Kuhn, Werner; Raubal, Martín; Janowicz, Krzysztof (25 de mayo de 2011). "La semántica de la similitud en la recuperación de información geográfica | Janowicz | Journal of Spatial Information Science". Revista de ciencia de la información espacial . 2011 (2): 29–57. doi :10.5311/JOSIS.2011.2.26 (inactivo el 31 de enero de 2024) . Consultado el 12 de septiembre de 2015 .{{cite journal}}: Mantenimiento CS1: DOI inactivo a partir de enero de 2024 ( enlace )
  3. ^ "MetaCarta: poner el lenguaje natural en el mapa". Monitor SIG. 2003-08-21. Archivado desde el original el 3 de octubre de 2003.
  4. ^ Smith, Susan. "El espacio entre mapas, búsqueda y contenido".
  5. ^ ab Dinan, Elizabeth (10 de noviembre de 2003). "Ware-Withal: MetaCarta, con sede en el MIT, apuesta por el software de geoparsing automático".
  6. ^ "MetaCarta presenta la primera solución de georreferenciación compatible con los idiomas árabe y español". 2007-06-20.
  7. ^ Franco, Juan; Warren, Bob. "Ubicación de todo el contenido" (PDF) .
  8. ^ "Capítulo 15. Ajuste del rendimiento de las consultas". PostGIS en acción (Segunda ed.). Publicaciones de Manning.
  9. ^ "Apache Solr - Guía de referencia de Lucene - Búsqueda espacial" . Consultado el 3 de enero de 2021 .
  10. ^ "Índice de texto de búsqueda de mapas de CartaTrees". Archivado desde el original el 2 de abril de 2003.
  11. ^ Bordognaa, Gloria; Ghisalbertib, Giorgio; Psailac, Giuseppe (1 de junio de 2012). "Recuperación de información geográfica: modelado de la incertidumbre del contexto del usuario". Conjuntos y sistemas difusos . 196 : 105-124. doi :10.1016/j.fss.2011.04.005. La recuperación de información geográfica (GIR) es hoy en día un tema de investigación candente que implica la gestión de la incertidumbre y la imprecisión y el modelado de las preferencias y el contexto del usuario. Indexar el contenido geográfico de los documentos implica abordar la ambigüedad, sinonimia y homonimia de los nombres geográficos en los textos. Por otro lado, la evaluación de consultas que especifican tanto condiciones basadas en contenido como condiciones espaciales en el contenido de los documentos requiere representar la vaguedad y la dependencia del contexto de las condiciones espaciales y las preferencias personales del usuario.
  12. ^ Jennifer 8. Lee (14 de enero de 2002). "Los agentes federales buscan adaptar la tecnología privada". New York Times .{{cite news}}: Mantenimiento CS1: nombres numéricos: lista de autores ( enlace )
  13. ^ "La venganza de la geografía". El economista . 2003-03-13. Archivado desde el original el 31 de diciembre de 2020.
  14. ^ Levy, Steven (7 de junio de 2004). "Creación del mapa definitivo: cuando la geografía digital se combina con la tecnología inalámbrica y la Web, el mundo adquiere nuevas dimensiones". Semana de noticias . Archivado desde el original el 3 de junio de 2004.
  15. ^ Estados Unidos concedió 7117199, Frank, John R.; Rauch , Erik M. & Donoghue, Karen, "Codificación espacial y visualización de información", publicado el 3 de octubre de 2006 
  16. ^ Erik Rauch ; Michael Bukatin; Kenneth Baker de MetaCarta . Un marco basado en la confianza para eliminar la ambigüedad de términos geográficos (discurso) . Consultado el 3 de enero de 2021 .
  17. András Kornai , MetaCarta (2005). MetaCarta en GeoCLEF 2005 . GeoCLEF. En memoria de Erik Rauch
  18. ^ Adams, Benjamín; McKenzie, subvención; Gahegan, Mark (1 de enero de 2015). "Frankenplace". Actas de la 24ª Conferencia Internacional sobre la World Wide Web. WWW'15. República y Cantón de Ginebra, Suiza: Comité Directivo de Conferencias Internacionales de la World Wide Web. págs. 12-22. doi :10.1145/2736277.2741137. ISBN 978-1-4503-3469-3. S2CID  1639723.
  19. ^ Amitay, Einat; Har'El, Nadav; Siván, Ron; Soffer, Aya (julio de 2004). Web-a-where: geoetiquetado de contenido web . SIGIR '04: Actas de la 27ª conferencia internacional anual ACM SIGIR sobre investigación y desarrollo en recuperación de información. págs. 273–280. doi :10.1145/1008992.1009040. Describimos Web-a-Where, un sistema para asociar geografía con páginas web. Web-a-Where localiza menciones de lugares y determina a qué lugar se refiere cada nombre. Además, asigna a cada página un enfoque geográfico: una localidad que la página analiza en su conjunto.
  20. ^ Larson, Ray R. (1996). Recuperación de información geográfica y navegación espacial. Escuela de Graduados en Bibliotecología y Ciencias de la Información, Universidad de Illinois en Urbana-Champaign. hdl :2142/416. ISBN 0878450971. ISSN  0069-4789.
  21. ^ Bueno, Fredric; Larson, Ray; Sanderson, Marcos; Joho, Hideo; Clough, Pablo; Petras, Vivien (21 de septiembre de 2005). "GeoCLEF: Descripción general del seguimiento de recuperación de información geográfica en varios idiomas de CLEF 2005". En Peters, Carol; Gey, Fredric C.; Gonzalo, Julio; Müller, Henning; Jones, Gareth JF; Kluck, Michael; Magnini, Bernardo; Rijke, Maarten de (eds.). Acceso a repositorios de información multilingües . Apuntes de conferencias sobre informática. vol. 4022. Springer Berlín Heidelberg. págs. 908–919. CiteSeerX 10.1.1.156.6368 . doi :10.1007/11878773_101. ISBN  978-3-540-45697-1.
  22. ^ La búsqueda local se enfrenta: Craig Donato, Perry Evans, John Frank, Jeremy Kreitler, Shailesh Rao (discurso). Donde 2.0. 2005-06-29. Archivado desde el original el 29 de julio de 2013 . Consultado el 3 de enero de 2021 .
  23. ^ Himmelstein, Marty (2005). "Búsqueda local: Internet son las páginas amarillas". Computadora . 38 (2). Publicado por la IEEE Computer Society: 26–34. doi :10.1109/MC.2005.65. Cada día, millones de personas utilizan sus periódicos locales, circulares de anuncios clasificados, directorios de páginas amarillas, revistas regionales e Internet para encontrar información relativa a las actividades de la vida diaria...

Ver también