La biblioteca Apache OpenNLP es un conjunto de herramientas basado en aprendizaje automático para el procesamiento de texto en lenguaje natural. Admite las tareas de procesamiento de lenguaje natural más comunes, como detección de lenguaje , tokenización , segmentación de oraciones , etiquetado de partes del discurso , extracción de entidades con nombre , fragmentación , análisis sintáctico y resolución de correferencia . Estas tareas suelen ser necesarias para crear servicios de procesamiento de texto más avanzados. [2] [3]