stringtranslate.com

Idioma Ware

LanguageWare es una tecnología de procesamiento del lenguaje natural (NLP) desarrollada por IBM , que permite que las aplicaciones procesen texto en lenguaje natural. Comprende un conjunto de bibliotecas Java que proporcionan una variedad de funciones de PNL : identificación de lenguaje , segmentación/tokenización de texto, normalización, extracción de entidades y relaciones , y análisis semántico y desambiguación. El motor de análisis utiliza el enfoque de máquina de estados finitos en múltiples niveles, lo que mejora sus características de rendimiento y, al mismo tiempo, mantiene una huella razonablemente pequeña.

El comportamiento del sistema está impulsado por un conjunto de recursos léxico-semánticos configurables que describen las características y el dominio del lenguaje procesado. Un conjunto predeterminado de recursos viene como parte de LanguageWare y estos describen las características del idioma nativo, como la morfología y el vocabulario básico del idioma. Se han creado recursos complementarios que capturan vocabularios, terminologías, reglas y gramáticas adicionales, que pueden ser genéricas del idioma o específicas de uno o más dominios.

Un conjunto de herramientas de personalización basadas en Eclipse , LanguageWare Resource Workbench, está disponible en el sitio alphaWorks [1] de IBM y permite compilar el conocimiento del dominio en estos recursos y, por lo tanto, incorporarlo al proceso de análisis.

LanguageWare se puede implementar como un conjunto de anotadores compatibles con UIMA , complementos de Eclipse o servicios web .

Ver también

Referencias

  1. ^ "Comunidad alphaWorks". alphaworks.ibm.com. 20 de octubre de 2009.

enlaces externos

Artículos relacionados