stringtranslate.com

Resolución de nombres (semántica y extracción de texto)

En semántica y extracción de texto, la resolución de nombres se refiere a la capacidad del software de minería de textos para determinar a qué persona, actor u objeto real se refiere un uso particular de un nombre. También puede denominarse resolución de entidad .

Resolución de nombres en texto simple

Por ejemplo, en el campo de la minería de textos , el software frecuentemente necesita interpretar el siguiente texto:

John le dio a Edward el libro. Luego se levantó y llamó a John para que volviera a la habitación.

En estas oraciones, el software debe determinar si el pronombre "él" se refiere a "John" o a "Edward" de la primera oración. El software también debe determinar si el "John" al que se hace referencia en la segunda frase es el mismo "John" de la primera frase, o una tercera persona cuyo nombre también resulta ser "John". Estos ejemplos se aplican a casi todos los idiomas, y no sólo al inglés.

Resolución de nombres entre documentos

Con frecuencia, este tipo de resolución de nombres también se utiliza en todos los documentos, por ejemplo, para determinar si el " George Bush " al que se hace referencia en un antiguo artículo de periódico como Presidente de los Estados Unidos ( George HW Bush ) es la misma persona que "George Bush". mencionado en un artículo de noticias separado años más tarde sobre un hombre que se postula para presidente ( George W. Bush ). Debido a que muchas personas pueden tener el mismo nombre, los analistas y el software deben tener en cuenta sustancialmente más información que solo un nombre para determinar si dos referencias idénticas ("George Bush") en realidad se refieren a la misma entidad o persona específica.

La resolución de nombres/entidades en la extracción de texto y la semántica es un problema notoriamente difícil, en parte porque en muchos casos no hay suficiente información para hacer una determinación precisa. Existen numerosas soluciones parciales que se basan en pistas contextuales específicas encontradas en los datos, pero actualmente no se conoce ninguna solución general.

A veces se hace referencia al problema como desambiguación de nombres y, en el caso de las bibliotecas digitales, desambiguación de autores.

Para ver ejemplos de software que podrían proporcionar beneficios de resolución de nombres, consulte también:

Ver también

Referencias