stringtranslate.com

Búho neto

NetOwl es un conjunto de productos de análisis de identidad y texto multilingües que analizan grandes datos en forma de datos de texto (informes, web, redes sociales , etc.) así como datos de entidades estructuradas sobre personas, organizaciones, lugares y cosas.

NetOwl utiliza enfoques basados ​​en inteligencia artificial (IA), incluido el procesamiento del lenguaje natural (PLN), el aprendizaje automático (ML) y la lingüística computacional , para extraer entidades, relaciones y eventos; realizar análisis de sentimientos ; asignar latitud/longitud a referencias geográficas en el texto; traducir nombres escritos en idiomas extranjeros; y realizar coincidencias de nombres y resolución de identidad . [1] [2] [3] Los usos de NetOwl incluyen búsqueda y descubrimiento semántico, [4] análisis geoespacial, [5] análisis de inteligencia, [6] enriquecimiento de contenido, [7] monitoreo de cumplimiento, [8] monitoreo de amenazas cibernéticas, [9] gestión de riesgos, [10] y bioinformática. [11]

Historia

El primer producto de NetOwl fue NetOwl Extractor, que se lanzó inicialmente en 1996. [12] Desde entonces, Extractor ha añadido muchas nuevas capacidades, entre ellas la extracción de relaciones y eventos, la categorización, la traducción de nombres, el geoetiquetado y el análisis de sentimientos, así como la extracción de entidades en otros idiomas. Más tarde se añadieron otros productos a la suite NetOwl, a saber, TextMiner, NameMatcher y EntityMatcher.

NetOwl ha participado en varios eventos de evaluación comparativa de software de análisis de entidades y texto patrocinados por terceros. NetOwl Extractor fue el sistema de extracción de entidades con nombre que obtuvo la puntuación más alta en la Conferencia de comprensión de mensajes MUC-6 patrocinada por DARPA y el sistema de extracción de enlaces y eventos con la puntuación más alta en MUC-7. [13] [14] También fue el sistema con la puntuación más alta en varias de las tareas de evaluación de Extracción automática de contenido (ACE) patrocinadas por NIST . [15] NetOwl NameMatcher fue el sistema con la puntuación más alta en el Desafío MITRE para la coincidencia de nombres de personas multiculturales. [1]

Productos

La suite NetOwl incluye, entre otros, los siguientes productos de análisis de texto y entidades:

Análisis de texto

NetOwl Extractor realiza la extracción de entidades de textos no estructurados mediante el procesamiento del lenguaje natural (NLP), el aprendizaje automático (ML) y la lingüística computacional . Extractor también realiza la extracción de relaciones semánticas y eventos , así como el geoetiquetado de texto. [3] [5] Se utiliza para una variedad de fuentes de datos, incluidas las fuentes tradicionales (por ejemplo, noticias, informes, páginas web, correo electrónico) y las redes sociales (por ejemplo, Twitter, Facebook, chats, blogs). [8] Se ejecuta en una variedad de plataformas de análisis de Big Data, incluida la tecnología Apache Hadoop y High-Performance Computer Cluster ( HPCC ) de LexisNexis. [7] Se ha integrado con una serie de herramientas analíticas de terceros como Esri ArcGIS y Google Earth/Maps. [5]

Análisis de identidad

NetOwl NameMatcher y EntityMatcher realizan la coincidencia de nombres y la resolución de identidad para grandes bases de datos de entidades multiculturales y multilingües utilizando enfoques de aprendizaje automático (ML) y lingüística computacional . [1] [2] Se utilizan para aplicaciones como lucha contra el lavado de dinero (AML), listas de vigilancia, cumplimiento normativo , detección de fraude, etc.

Véase también

Referencias

  1. ^ abc "SRA International". Washington Post. Consultado el 2 de julio de 2013.
  2. ^ ab Zelenko, Dmitry y Chinatsu Aone. “Métodos discriminatorios para la transliteración”. En Actas de la conferencia de 2006 Aplicaciones empíricas del procesamiento del lenguaje natural (2006). Consultado el 20 de mayo de 2013.
  3. ^ ab Maybury, Mark (2012). Multimedia Information Extraction, Hoboken, Nueva Jersey: John Wiley & Sons, Inc., pág. 18. Consultado el 2 de julio de 2013.
  4. ^ Jackson, Peter; Moulinier, Isabelle (2002). Procesamiento del lenguaje natural para aplicaciones en línea: recuperación, extracción y categorización de textos, Filadelfia: John Benjamins BV, pág. 117, ISBN  90-272-4989-X . Consultado el 2 de julio de 2013.
  5. ^ abc Smith, Susan. “Notas del Simposio GEOINT 2007”. GISCafe (29 de octubre de 2007). Consultado el 2 de julio de 2013.
  6. ^ Indurkhya, Nitin et al. (2005). Minería de texto: métodos predictivos para analizar información no estructurada, Nueva York: Springer, pág. 154-155, ISBN 0-387-95433-3 . Consultado el 2 de julio de 2013. 
  7. ^ ab Guess, Angela (19 de enero de 2012). "LexisNexis lanza una nueva versión de Lexis Advance". semanticweb.com. Consultado el 28 de julio de 2013.
  8. ^ ab Aone, Chinatsu, et al. “Assentor®: una solución basada en PNL para el monitoreo de correo electrónico”. En Actas de la Decimoséptima Conferencia Nacional sobre Inteligencia Artificial y la Duodécima Conferencia sobre Aplicaciones Innovadoras de Inteligencia Artificial (2000), págs. 945-540. Consultado el 20 de mayo de 2013.
  9. ^ "Dusty Rhoads y Jim McClave de la SRA: Cómo fortalecer la ciberseguridad de su empresa". ExecutiveBiz (2 de julio de 2009). Consultado el 6 de agosto de 2013.
  10. ^ “Nasdaq al acecho”. CNN Money (17 de septiembre de 1997). Consultado el 2 de julio de 2013.
  11. ^ Zaremba, Sam, et al. “Extracción de texto de resúmenes de PubMed mediante procesamiento de lenguaje natural para crear una base de conocimiento público sobre los mecanismos moleculares de los enteropatógenos bacterianos”. BMC Bioinformatics, 10:177 (10 de junio de 2009). Consultado el 20 de mayo de 2013.
  12. ^ Hudgins-Bonafield, Christine. “Filtrar conocimiento en la red es ahora más sencillo”. Archivado el 30 de marzo de 2003 en Wayback Machine. NetWork Computing (31 de mayo de 1996). Consultado el 3 de septiembre de 2013.
  13. ^ Sundheim, Beth M. "Resumen de los resultados de la evaluación MUC-6". Archivado el 12 de diciembre de 2006 en Wayback Machine . En Actas de la 6.ª Conferencia sobre comprensión de mensajes (1995), págs. 13-31. Consultado el 20 de mayo de 2013.
  14. ^ Aone, Chinatsu, et al. "SRA: Descripción del sistema IE2 utilizado para MUC-7". Archivado el 9 de diciembre de 2006 en Wayback Machine . En Actas de la 7.ª Conferencia sobre comprensión de mensajes (1998). Consultado el 20 de mayo de 2013.
  15. ^ Plan de evaluación del ACE 2005 (ACE'05). Consultado el 20 de mayo de 2013.

Enlaces externos