stringtranslate.com

Software de recuperación

RetrievalWare es un motor de búsqueda empresarial que enfatiza el procesamiento del lenguaje natural y las redes semánticas , que estuvo disponible comercialmente entre 1992 y 2007 y es especialmente conocido por su uso por parte de agencias de inteligencia gubernamentales. [1]

Historia

RetrievalWare fue creado inicialmente por Paul Nelson, [2] Kenneth Clark, [3] y Edwin Addison [4] como parte de ConQuest Software. El desarrollo comenzó en 1989, pero el software no estuvo disponible comercialmente a gran escala hasta 1992. La financiación inicial fue proporcionada por Rome Laboratory a través de una subvención para la investigación de innovación para pequeñas empresas . [5]

El 6 de julio de 1995, ConQuest Software se fusionó con la empresa NASDAQ, Excalibur Technologies [6] y el producto fue rebautizado como RetrievalWare. El 21 de diciembre de 2000, Excalibur Technologies se fusionó con la división Interactive Media Services de Intel Corporation para formar Convera Corporation . [7] Finalmente, el 9 de abril de 2007, el software y el negocio de RetrievalWare fueron adquiridos por Fast Search & Transfer , momento en el que el producto fue retirado oficialmente. [8] Microsoft Corporation continúa manteniendo el producto para su base de clientes existente.

Los ingresos anuales de RetrievalWare alcanzaron su punto máximo en 2001, con alrededor de 40 millones de dólares estadounidenses. [9]

Uso de técnicas de lenguaje natural

RetrievalWare es un sistema de búsqueda de texto por relevancia con mejoras de procesamiento extraídas de los campos del procesamiento del lenguaje natural (PLN) y las redes semánticas . Los algoritmos de PNL incluyen la lematización basada en diccionarios y la identificación de frases basada en diccionarios. RetrievalWare utiliza redes semánticas para expandir las palabras de consulta ingresadas por el usuario a términos relacionados con pesos de términos determinados por la distancia a los términos originales del usuario. Además de la expansión automática, estaba disponible un modo de retroalimentación mediante el cual los usuarios podían elegir el significado de la palabra antes de realizar la expansión. Las primeras redes semánticas se construyeron utilizando WordNet .

Además, RetrievalWare implementó una forma de búsqueda de n-gramas (conocida como APRP - Adaptive Pattern Recognition Processing [10] ), diseñada para buscar en documentos con errores de OCR . Los términos de consulta se dividen en conjuntos de 2-gramas que se utilizan para localizar términos coincidentes de manera similar en el índice invertido . Las coincidencias resultantes se ponderan en función de medidas similares y luego se utilizan para buscar documentos.

Todas estas características estaban disponibles a más tardar en 1993 [11] y ConQuest software afirmó que fue el primer sistema de búsqueda de texto comercial en implementar estas técnicas. [12]

Otras características destacables

Otras características notables de RetrievalWare incluyen servidores de búsqueda distribuidos, [11] sincronizadores para indexar sistemas de gestión de contenido externo y bases de datos relacionales , [13] un modelo de seguridad heterogéneo, [13] categorización de documentos , [13] coincidencia de consultas de documentos en tiempo real (creación de perfiles), [11] búsquedas multilingües (consultas que contienen términos de varios idiomas que buscan documentos que contienen términos de varios idiomas) y búsquedas interlingües (consultas en un idioma que buscan documentos en un idioma diferente). [14]

Participación en TREC

RetrievalWare participó en la Conferencia de recuperación de texto en 1992 (TREC-1), 1993 (TREC-2) y 1995 (TREC-4). [15]

En TREC-1 [16] y TREC-4, [17] las ejecuciones de RetrievalWare para consultas ingresadas manualmente produjeron los mejores resultados según los promedios de 11 puntos en todos los motores de búsqueda que participaron en la categoría ad hoc donde a los motores de búsqueda se les permite una única oportunidad de procesar consultas previamente desconocidas contra una base de datos existente.

Referencias

  1. ^ Vise, David A. (3 de diciembre de 2004). "Las agencias encuentran lo que buscan". The Washington Post . Consultado el 22 de mayo de 2010 .[ enlace muerto ]
  2. ^ "Paul Nelson, director de innovación, análisis de contenido en Accenture Analytics" . Consultado el 1 de diciembre de 2020 .
  3. ^ "Arden & Ken". comcast.net. 23 de julio de 2011. Archivado desde el original el 23 de julio de 2011.
  4. ^ "Ed Addison, empresario en serie, capitalista de riesgo, ejecutivo de negocios, profesor".
  5. ^ . John McGrath se unió a la empresa en 1993 como vicepresidente de ventas y marketing. La empresa aumentó rápidamente sus ingresos gracias a contratos federales de EE. UU., editoriales y clientes empresariales que requerían una recuperación de textos precisa y de alto rendimiento. SOLICITUD DE SBIR PARA EL AÑO FISCAL 1991 - RESÚMENES DE PREMIOS DE LA FASE I - PROYECTOS DE LA FUERZA AÉREA - VOLUMEN III (PDF) , 1992-07-06, págs. 70–71, archivado desde el original (PDF) el 4 de junio de 2011- Tenga en cuenta que "Synchronetics" era el nombre original de ConQuest Software Incorporated.
  6. ^ "Excalibur Technologies se fusionará con ConQuest Software; los líderes en recuperación de información de texto y multimedia unen sus fuerzas para expandir sus productos, canales y mercados" (Comunicado de prensa). Business Wire. 6 de julio de 1995.
  7. ^ "Intel y Excalibur forman Convera Corporation". Silicon Valley / San Jose Business Journal. 21 de diciembre de 2000.
  8. ^ "FAST adquiere el negocio RetrievalWare de Convera". Information Today, Inc. 9 de abril de 2007. Si bien FAST seguirá brindando soporte a la plataforma RetrievalWare, no continuará con el desarrollo de la misma ni agregará nuevas funciones. A los clientes de RetrievalWare se les ofrecerá una ruta de actualización a la propia oferta de FAST.
  9. ^ Convera Corp · 10-K · Para el 1/1/01, 2001-01-01- Indica que los productos de Convera representaron el 85% de los ingresos totales de $51,5 millones.
  10. ^ Excalibur anuncia Excalibur RetrievalWare 6.5 con RetrievalWare FileRoom: contiene una descripción de APRP
  11. ^ abc Informe del sitio para la Conferencia de recuperación de texto de ConQuest Software Inc. (TREC2) - Encuentre las actas completas aquí
  12. ^ "Homework Helper debuta en Prodigy utilizando el motor de búsqueda ConQuest" (Nota de prensa). Business Wire. 9 de febrero de 1995. ConQuest es el único motor de búsqueda que utiliza diccionarios, tesauros y otros recursos léxicos para crear una base de conocimiento semántico de más de 440.000 significados de palabras y 1,6 millones de relaciones entre palabras.
  13. ^ abc "Excalibur RetrievalWare: más que recuperación de información". KMWorld. 1 de octubre de 1999.
  14. ^ "Búsqueda, recuperación y categorización multimedia". KMWorld. 25 de marzo de 2002.
  15. ^ Flank, Sharon (1998). "Un enfoque en capas para la recuperación de información basada en PNL". Actas de la 36.ª reunión anual de la Asociación de Lingüística Computacional. Vol. 1. dl.acm.org. pág. 397. doi :10.3115/980845.980913. S2CID  581537. Consultado el 1 de diciembre de 2020 .
  16. ^ Informe del sitio de la Conferencia sobre recuperación de textos de ConQuest Software Inc. (TREC-1) - Encuentre las actas completas aquí
  17. ^ El sistema TREC-4 de Excalibur, preparativos y resultados: una versión en PDF del mismo se puede encontrar aquí Archivado el 27 de noviembre de 2010 en Wayback Machine y las actas completas se pueden encontrar aquí

Enlaces externos