stringtranslate.com

Yo busco

Isearch es un software de recuperación de texto de código abierto [ se necesita más explicación ] desarrollado por primera vez en 1994 por Nassib Nassar como parte del marco de información Isite Z39.50 . El proyecto comenzó en el Clearinghouse for Networked Information Discovery and Retrieval (CNIDR) del centro de supercomputación MCNC de Carolina del Norte y fue financiado por la National Science Foundation para seguir los pasos de WAIS y desarrollar sistemas prototipo para redes de información distribuida que abarquen aplicaciones de Internet, catálogos de bibliotecas y otros recursos de información.

Las características principales de Isearch incluyen búsqueda de texto completo y de campo, clasificación por relevancia, consultas booleanas y soporte para muchos tipos de documentos como HTML, carpetas de correo, resúmenes de listas, MEDLINE, BibTeX, SGML/XML, metadatos FGDC, NASA DIF, metadatos ANZLIC, metadatos ISO 19115 y muchos otros tipos de recursos y formatos de documentos.

Fue el primer motor de búsqueda diseñado desde cero para admitir la búsqueda y recuperación de datos en formato SGML y Z39.50 . Incluía muchas innovaciones, como el modelo de "tipo de documento", que es simplemente un método (orientado a objetos) para asociar cada documento con una clase de funciones que proporcionan una interfaz estándar para acceder al documento. Fue uno de los primeros motores (si no el primero) en admitir XML.

Los algoritmos de búsqueda/indexación de texto de Isearch se basaron en el trabajo seminal de Gaston Gonnet sobre matrices y árboles PAT para la recuperación de texto, ideas que se desarrollaron para el New Oxford English Dictionary Project en la Universidad de Waterloo y proporcionaron las semillas para el motor PAT SGML de Tim Bray que formó la base de Open Text . Sin embargo, uno de los factores limitantes del diseño de Isearch fue que no era adecuado para manejar los conjuntos de datos extremadamente grandes que se hicieron populares a mediados y fines de la década de 1990. En muchos casos, Isearch se adaptó o modificó para usar algoritmos diferentes, pero generalmente mantuvo el modelo de tipo de documento y la relación arquitectónica con Isite.

Isearch fue ampliamente adoptado y utilizado en cientos de sitios de búsqueda públicos, incluidos muchos proyectos de alto perfil como la búsqueda de patentes de la Oficina de Patentes y Marcas de los Estados Unidos (USPTO), el Centro de Intercambio de Datos Geográficos Federales (FGDC), el Directorio Maestro de Cambio Global de la NASA , el Sistema de Guía EOS de la NASA, el Proyecto de Interoperabilidad del Catálogo de la NASA, el servicio de preimpresión astronómica con sede en el Instituto de Ciencia del Telescopio Espacial , la Gaceta Electrónica PCT de la Organización Mundial de la Propiedad Intelectual (OMPI), Linsearch (un motor de búsqueda de software de código abierto diseñado por Miles Efron), el Proyecto SAGE del Departamento de Colecciones Especiales de la Universidad Emory, Eco Companion Australasia (un catálogo de recursos geoespaciales ambientales), el Servicio Nacional de Información Genómica de Australia ( ANGIS ), el Proyecto de Directorio Abierto y numerosos portales gubernamentales en el contexto del mandato del Servicio de Localización de Información Gubernamental (GILS) GPO (¿finalizó en 2005?).

Entre 1994 y 1998, la mayor parte del desarrollo se centró en el Clearinghouse for Networked Information Discovery and Retrieval (CNIDR) de Carolina del Norte (núcleo Engine) y en BSn de Alemania (Doctypes). En 1998, gran parte de los desarrolladores del núcleo de código abierto de Isearch reorientaron el desarrollo hacia varias empresas independientes. En 1998, pasó a formar parte de la plataforma de software de referencia Advanced Search Facility, financiada por el Departamento de Comercio de los Estados Unidos.

A/WWW Enterprises mantiene actualmente la versión de código abierto para uso público, con el apoyo de clientes gubernamentales que pagan por el software, como la Oficina de Patentes y Marcas de los Estados Unidos, la NASA y el FGDC, que han brindado apoyo para mejorar la funcionalidad y la confiabilidad del software. El paquete de software se considera una implementación de referencia del software de servicio de catálogo.

A partir de 2010, la versión de código abierto de Isearch todavía se utiliza en más de 250 nodos de FGDC y por ANZLIC en Australia y colaboradores seleccionados de Geospatial OneStop para facilitar la recolección por parte de GOS, incluidos NOAA, la Oficina del Censo y la Oficina de Campo de Tennessee del Servicio de Pesca y Vida Silvestre de los EE. UU., entre otros.

Referencias