stringtranslate.com

Resumen de múltiples documentos

El resumen de múltiples documentos es un procedimiento automático que tiene como objetivo extraer información de múltiples textos escritos sobre el mismo tema. El informe resumido resultante permite a los usuarios individuales, como los consumidores de información profesionales, familiarizarse rápidamente con la información contenida en un gran conjunto de documentos. De esta manera, los sistemas de resumen de múltiples documentos complementan a los agregadores de noticias y dan el siguiente paso en la lucha contra la sobrecarga de información .

Principales ventajas y dificultades

El resumen de varios documentos crea informes de información que son a la vez concisos y completos. Al reunir y resumir diferentes opiniones, cada tema se describe desde múltiples perspectivas en un solo documento. Si bien el objetivo de un resumen breve es simplificar la búsqueda de información y reducir el tiempo señalando los documentos fuente más relevantes, el resumen completo de varios documentos debería, en teoría, contener la información requerida, lo que limita la necesidad de acceder a los archivos originales a los casos en que se requiere un refinamiento. En la práctica, es difícil resumir varios documentos con puntos de vista y sesgos conflictivos. De hecho, es casi imposible lograr un resumen extractivo claro de documentos con puntos de vista conflictivos. El resumen abstractivo es el método preferido en este caso.

Los resúmenes automáticos presentan información extraída de múltiples fuentes de forma algorítmica, sin ningún tipo de retoque editorial ni intervención humana subjetiva, lo que los hace completamente imparciales. Las dificultades persisten si se realizan resúmenes extractivos automáticos de documentos con opiniones contradictorias.

Desafíos tecnológicos

La tarea de resumen de múltiples documentos es más compleja que la de resumir un solo documento , incluso uno extenso. La dificultad surge de la diversidad temática dentro de un gran conjunto de documentos. Una buena tecnología de resumen apunta a combinar los temas principales con integridad, legibilidad y concisión. Las Conferencias de Comprensión de Documentos, [1] realizadas anualmente por el NIST , han desarrollado criterios de evaluación sofisticados para las técnicas que aceptan el desafío del resumen de múltiples documentos.

Un sistema ideal de resumen de múltiples documentos no solo acorta los textos fuente, sino que también presenta la información organizada en torno a los aspectos clave para representar diversos puntos de vista. El éxito produce una visión general de un tema determinado. Estas compilaciones de textos también deben cumplir con los requisitos básicos para un texto de visión general compilado por un ser humano. Los criterios de calidad del resumen de múltiples documentos son los siguientes:

El último punto merece una nota adicional. Se ha tomado la precaución de garantizar que la vista general automática muestre:

Sistemas de la vida real

La tecnología de resumen de múltiples documentos está alcanzando su madurez: una visión respaldada por una selección de sistemas avanzados basados ​​en la web que se encuentran actualmente disponibles.

A medida que los resúmenes de múltiples documentos generados automáticamente se parecen cada vez más a las descripciones generales escritas por un ser humano, el uso de fragmentos de texto extraídos puede enfrentar algún día problemas de derechos de autor en relación con el concepto de derechos de autor de uso justo .

Bibliografía

Véase también

Referencias

  1. ^ "Documento de comprensión de conferencias". Nlpir.nist.gov . 2014-09-09 . Consultado el 2016-01-10 .
  2. ^ "Generar informe de investigación". Ultimate Research Assistant . Consultado el 10 de enero de 2016 .
  3. ^ "Servicio iResearch Reporter". Iresearch-reporter.com . Archivado desde el original el 2013-06-09 . Consultado el 2016-01-10 .
  4. ^ [1] Archivado el 16 de abril de 2013 en Wayback Machine .
  5. ^ [2] Archivado el 11 de abril de 2011 en Wayback Machine .
  6. ^ "Investigador de fuentes de noticias | Cosas generales". Newsfeedresearcher.com . Consultado el 10 de enero de 2016 .
  7. ^ [3] Archivado el 19 de septiembre de 2009 en Wayback Machine .
  8. ^ [4] Archivado el 29 de mayo de 2013 en Wayback Machine .

Enlaces externos