LanguageWare es una tecnología de procesamiento del lenguaje natural (NLP) desarrollada por IBM , que permite que las aplicaciones procesen texto en lenguaje natural. Comprende un conjunto de bibliotecas Java que proporcionan una variedad de funciones de PNL : identificación de lenguaje , segmentación/tokenización de texto, normalización, extracción de entidades y relaciones , y análisis semántico y desambiguación. El motor de análisis utiliza el enfoque de máquina de estados finitos en múltiples niveles, lo que mejora sus características de rendimiento y, al mismo tiempo, mantiene una huella razonablemente pequeña.
El comportamiento del sistema está impulsado por un conjunto de recursos léxico-semánticos configurables que describen las características y el dominio del lenguaje procesado. Un conjunto predeterminado de recursos viene como parte de LanguageWare y estos describen las características del idioma nativo, como la morfología y el vocabulario básico del idioma. Se han creado recursos complementarios que capturan vocabularios, terminologías, reglas y gramáticas adicionales, que pueden ser genéricas del idioma o específicas de uno o más dominios.
Un conjunto de herramientas de personalización basadas en Eclipse , LanguageWare Resource Workbench, está disponible en el sitio alphaWorks [1] de IBM y permite compilar el conocimiento del dominio en estos recursos y, por lo tanto, incorporarlo al proceso de análisis.
LanguageWare se puede implementar como un conjunto de anotadores compatibles con UIMA , complementos de Eclipse o servicios web .
Ver también
Referencias
- ^ "Comunidad alphaWorks". alphaworks.ibm.com. 20 de octubre de 2009.
enlaces externos
- Banco de trabajo de recursos IBM LanguageWare en alphaWorks
- IBM LanguageWare Miner para redes sociosemánticas multidimensionales en alphaWorks
- JumpStart Infocenter para IBM LanguageWare en IBM.com
- Página de inicio de UIMA en la Apache Software Foundation
- Marco UIMA en SourceForge
- IBM OmniFind Yahoo! Edición (motor de búsqueda empresarial GRATUITO) Archivado el 17 de febrero de 2007 en Wayback Machine.
- Grupo de Ingeniería de Sistemas de Información Semántica y del Lenguaje
- SemanticDesktop.org
Artículos relacionados
- Branimir K. Boguraev Procesamiento de estados finitos basado en anotaciones en una arquitectura de PNL a gran escala, Informe de investigación de IBM, 2004
- Alexander Troussov, Mikhail Sogrin, "IBM LanguageWare Ontological Network Miner"
- Sheila Kinsella, Andreas Harth, Alexander Troussov, Mikhail Sogrin, John Judge, Conor Hayes, John G. Breslin, "Navegación y anotación de redes de personas y objetos asociados habilitadas semánticamente"
- Mikhail Kotelnikov, Alexander Polonsky, Malte Kiesel, Max Völkel, Heiko Haller, Mikhail Sogrin, Pär Lannerö, Brian Davis, "Wikis semánticas interactivas" [ enlace muerto permanente ]
- Sebastian Trüg, Jos van den Oever, Stéphane Laurière, "El escritorio semántico social: Nepomuk"
- Séamus Lawless, Vincent Wade, "Descubrimiento, recolección y entrega de contenido dinámico" [ enlace muerto ]
- R. Mack, S. Mukherjea, A. Soffer, N. Uramoto, E. Brown, A. Coden, J. Cooper, A. Inokuchi, B. Iyer, Y. Mass, H. Matsuzawa y LV Subramaniam, "Texto análisis para ciencias biológicas utilizando la arquitectura de gestión de información no estructurada"
- Alex Nevidomsky, "UIMA Framework and Knowledge Discovery at IBM", 4º Simposio de minería de textos, Fraunhofer SCAI, 2006