NetOwl es un conjunto de productos de análisis de identidad y texto multilingües que analizan grandes datos en forma de datos de texto (informes, web, redes sociales , etc.) así como datos de entidades estructuradas sobre personas, organizaciones, lugares y cosas.
NetOwl utiliza enfoques basados en inteligencia artificial (IA), incluido el procesamiento del lenguaje natural (PLN), el aprendizaje automático (ML) y la lingüística computacional , para extraer entidades, relaciones y eventos; realizar análisis de sentimientos ; asignar latitud/longitud a referencias geográficas en el texto; traducir nombres escritos en idiomas extranjeros; y realizar coincidencias de nombres y resolución de identidad . [1] [2] [3] Los usos de NetOwl incluyen búsqueda y descubrimiento semántico, [4] análisis geoespacial, [5] análisis de inteligencia, [6] enriquecimiento de contenido, [7] monitoreo de cumplimiento, [8] monitoreo de amenazas cibernéticas, [9] gestión de riesgos, [10] y bioinformática. [11]
El primer producto de NetOwl fue NetOwl Extractor, que se lanzó inicialmente en 1996. [12] Desde entonces, Extractor ha añadido muchas nuevas capacidades, entre ellas la extracción de relaciones y eventos, la categorización, la traducción de nombres, el geoetiquetado y el análisis de sentimientos, así como la extracción de entidades en otros idiomas. Más tarde se añadieron otros productos a la suite NetOwl, a saber, TextMiner, NameMatcher y EntityMatcher.
NetOwl ha participado en varios eventos de evaluación comparativa de software de análisis de entidades y texto patrocinados por terceros. NetOwl Extractor fue el sistema de extracción de entidades con nombre que obtuvo la puntuación más alta en la Conferencia de comprensión de mensajes MUC-6 patrocinada por DARPA y el sistema de extracción de enlaces y eventos con la puntuación más alta en MUC-7. [13] [14] También fue el sistema con la puntuación más alta en varias de las tareas de evaluación de Extracción automática de contenido (ACE) patrocinadas por NIST . [15] NetOwl NameMatcher fue el sistema con la puntuación más alta en el Desafío MITRE para la coincidencia de nombres de personas multiculturales. [1]
La suite NetOwl incluye, entre otros, los siguientes productos de análisis de texto y entidades:
NetOwl Extractor realiza la extracción de entidades de textos no estructurados mediante el procesamiento del lenguaje natural (NLP), el aprendizaje automático (ML) y la lingüística computacional . Extractor también realiza la extracción de relaciones semánticas y eventos , así como el geoetiquetado de texto. [3] [5] Se utiliza para una variedad de fuentes de datos, incluidas las fuentes tradicionales (por ejemplo, noticias, informes, páginas web, correo electrónico) y las redes sociales (por ejemplo, Twitter, Facebook, chats, blogs). [8] Se ejecuta en una variedad de plataformas de análisis de Big Data, incluida la tecnología Apache Hadoop y High-Performance Computer Cluster ( HPCC ) de LexisNexis. [7] Se ha integrado con una serie de herramientas analíticas de terceros como Esri ArcGIS y Google Earth/Maps. [5]
NetOwl NameMatcher y EntityMatcher realizan la coincidencia de nombres y la resolución de identidad para grandes bases de datos de entidades multiculturales y multilingües utilizando enfoques de aprendizaje automático (ML) y lingüística computacional . [1] [2] Se utilizan para aplicaciones como lucha contra el lavado de dinero (AML), listas de vigilancia, cumplimiento normativo , detección de fraude, etc.