Recuperación de documentos
El texto generalmente no está estructurado y no necesariamente en un lenguaje natural, el sistema podría, por ejemplo, ser utilizado para procesar grandes conjuntos de representaciones químicas en biología molecular.La forma en que esto se hace es creando para cada archivo una firma, generalmente una versión codificada con hash.Se realiza un paso posterior al procesamiento para descartar las falsas alarmas.Como en la mayoría de los casos esta estructura es inferior a los archivos invertidos en términos de velocidad, tamaño y funcionalidad, no se usa ampliamente.Sin embargo, con los parámetros adecuados, puede vencer a los archivos invertidos en ciertos entornos.