Concepto en el procesamiento del lenguaje natural
En el procesamiento del lenguaje natural , la implicación textual ( TE ), también conocida como inferencia del lenguaje natural ( NLI ), es una relación direccional entre fragmentos de texto . La relación se cumple siempre que la verdad de un fragmento de texto se desprenda de otro texto.
Definición
En el marco de TE, los textos implicantes e implicados se denominan texto ( t ) e hipótesis ( h ), respectivamente. La implicación textual no es lo mismo que la implicación lógica pura ; tiene una definición más relajada: " t implica h " ( t ⇒ h ) si, típicamente, un humano que lea t inferiría que h es muy probablemente verdadero. [1] (Alternativamente: t ⇒ h si y solo si, típicamente, un humano que lea t estaría justificado en inferir la proposición expresada por h a partir de la proposición expresada por t . [2] ) La relación es direccional porque incluso si " t implica h ", la inversa " h implica t " es mucho menos segura. [3] [4]
Determinar si esta relación se cumple es una tarea informal, que a veces se superpone con las tareas formales de la semántica formal (satisfacer una condición estricta generalmente implicará la satisfacción de un condicionado menos estricto); además, la implicación textual subsume parcialmente la implicación de la palabra .
Ejemplos
La implicación textual se puede ilustrar con ejemplos de tres relaciones diferentes: [5]
Un ejemplo de una TE positiva (el texto implica una hipótesis) es:
- texto: Si ayudas a los necesitados, Dios te recompensará .
- Hipótesis: Dar dinero a un pobre tiene buenas consecuencias .
Un ejemplo de una TE negativa (el texto contradice la hipótesis) es:
- texto: Si ayudas a los necesitados, Dios te recompensará .
- Hipótesis: Dar dinero a un pobre no tiene consecuencias .
Un ejemplo de un texto no TE (no implica ni contradice) es:
- texto: Si ayudas a los necesitados, Dios te recompensará .
- Hipótesis: Darle dinero a un pobre te hará una mejor persona .
Ambigüedad del lenguaje natural
Una característica del lenguaje natural es que existen muchas maneras diferentes de expresar lo que uno quiere decir: varios significados pueden estar contenidos en un solo texto y el mismo significado puede ser expresado por diferentes textos. Esta variabilidad de la expresión semántica puede verse como el doble problema de la ambigüedad del lenguaje . Juntos, dan como resultado una correspondencia de muchos a muchos entre expresiones y significados del lenguaje. La tarea de parafrasear implica reconocer cuándo dos textos tienen el mismo significado y crear un texto similar o más corto que transmita casi la misma información. La implicación textual es similar [6] pero debilita la relación para que sea unidireccional. Las soluciones matemáticas para establecer la implicación textual pueden basarse en la propiedad direccional de esta relación, haciendo una comparación entre algunas similitudes direccionales de los textos involucrados. [4]
Aproches
La implicación textual mide la comprensión del lenguaje natural , ya que solicita una interpretación semántica del texto y, debido a su generalidad, sigue siendo un área activa de investigación. Se han considerado muchos enfoques y refinamientos de enfoques, como la incrustación de palabras , los modelos lógicos, los modelos gráficos, los sistemas de reglas, el enfoque contextual y el aprendizaje automático. [6] Las soluciones prácticas o de gran escala evitan estos métodos complejos y, en su lugar, utilizan solo sintaxis superficial o relaciones léxicas, pero son correspondientemente menos precisas. [3] A partir de 2005 [actualizar], los sistemas de última generación están lejos del desempeño humano; un estudio encontró que los humanos están de acuerdo con el conjunto de datos el 95,25% del tiempo. [7] Los algoritmos de 2016 aún no habían alcanzado el 90%. [8]
Aplicaciones
Muchas aplicaciones de procesamiento del lenguaje natural, como la respuesta a preguntas , la extracción de información , la elaboración de resúmenes , los resúmenes de múltiples documentos y la evaluación de sistemas de traducción automática, necesitan reconocer que un significado objetivo particular se puede inferir a partir de diferentes variantes del texto. Normalmente, la implicación se utiliza como parte de un sistema más grande, por ejemplo, en un sistema de predicción para filtrar predicciones triviales u obvias. [9] La implicación textual también tiene aplicaciones en la estilometría adversarial , que tiene el objetivo de eliminar el estilo textual sin cambiar el significado general de la comunicación.
Conjuntos de datos
Algunos de los conjuntos de datos NLI en inglés disponibles incluyen:
- SNLI [11]
- MultiNLI [12]
- Ciencia cola [13]
- ENFERMO [14]
- MedNLI [15]
- Control de calidad-NLI [16]
Además, hay varios conjuntos de datos NLI no ingleses, como los siguientes:
- XNLI [17]
- Cola lejana [18]
- OCNLI [19]
- ENFERMO-NL [20]
- IndoNLI [21]
Véase también
Referencias
- ^ Ido Dagan, Oren Glickman y Bernardo Magnini. The PASCAL Recognising Textual Entailment Challenge, p. 2 Archivado el 3 de marzo de 2012 en Wayback Machine en: Quiñonero-Candela, J.; Dagan, I.; Magnini, B.; d'Alché-Buc, F. (Eds.) Machine Learning Challenges. Lecture Notes in Computer Science , Vol. 3944, pp. 177–190, Springer, 2006.
- ^ Korman, Daniel Z.; Mack, Eric; Jett, Jacob; Renear, Allen H. (9 de marzo de 2018). "Definición de implicación textual". Revista de la Asociación de Ciencia y Tecnología de la Información . 69 (6): 763–772. doi :10.1002/asi.24007. ISSN 2330-1635. S2CID 46920779.
- ^ ab Dagan, I. y O. Glickman. 'Implicación textual probabilística: modelado genérico aplicado de la variabilidad del lenguaje' Archivado el 29 de marzo de 2012 en Wayback Machine en: Taller PASCAL sobre métodos de aprendizaje para la comprensión y minería de textos (2004) Grenoble.
- ^ ab Tătar, D. ea La vinculación textual como relación direccional
- ^ Portal de implicación textual en el wiki de la Asociación de Lingüística Computacional
- ^ ab Androutsopoulos, Ion; Malakasiotis, Pródromos (2010). "Un estudio sobre métodos de vinculación textual y paráfrasis" (PDF) . Revista de investigación en inteligencia artificial . 38 : 135–187. arXiv : 0912.3747 . doi :10.1613/jair.2985. S2CID 9234833. Archivado desde el original (PDF) el 9 de diciembre de 2017 . Consultado el 13 de febrero de 2017 .
- ^ Bos, Johan; Markert, Katja (6–8 de octubre de 2005). "Reconocimiento de implicación textual con inferencia lógica". En Raymond Mooney; Joyce Chai; et al. (eds.). Actas de la conferencia sobre tecnología del lenguaje humano y métodos empíricos en el procesamiento del lenguaje natural – HLT '05 . Vancouver: Asociación de Lingüística Computacional. págs. 628–635. doi : 10.3115/1220575.1220654 . S2CID 10202504.
- ^ Zhao, Kai; Huang, Liang; Ma, Mingbo (4 de enero de 2017). "Implicación textual con atenciones estructuradas y composición". arXiv : 1701.01126 [cs.CL].
- ^ Shani, Ayelett (25 de octubre de 2013). "Cómo la Dra. Kira Radinsky utilizó algoritmos para predecir disturbios en Egipto". Haaretz . Consultado el 13 de febrero de 2017 .
- ^ Bowman, Samuel R.; Angeli, Gabor; Potts, Christopher; Manning, Christopher D. (2015). Un gran corpus anotado para aprender inferencia del lenguaje natural (PDF) . En Actas de la Conferencia de 2015 sobre métodos empíricos en el procesamiento del lenguaje natural (EMNLP) . Asociación de Lingüística Computacional. págs. 632–642. doi :10.18653/v1/D15-1075.
- ^ Williams, Adina; Nangia, Nikita; Bowman, Samuel R. (2018). Un corpus de desafío de amplia cobertura para la comprensión de oraciones mediante inferencia (PDF) . En Actas de la Conferencia de 2018 del Capítulo norteamericano de la Asociación de Lingüística Computacional: Tecnologías del lenguaje humano, Volumen 1 (Artículos extensos) . Asociación de Lingüística Computacional. págs. 1112–1122. doi :10.18653/v1/N18-1101.
- ^ Khot, Tushar; Sabharwal, Ashish; Clark, Peter (2018). "SciTaiL: Un conjunto de datos de implicación textual de Science Question Answering". Actas de la Conferencia AAAI sobre Inteligencia Artificial . 32 (1). doi : 10.1609/aaai.v32i1.12022 .
- ^ Marelli, Marco; Bentivogli, Luisa; Baroni, Marco; Bernardi, Raffaella; Menini, Stefano; Zamparelli, Roberto (2014). SemEval-2014 Tarea 1: Evaluación de modelos semánticos distributivos compositivos en oraciones completas mediante la relación semántica y la implicación textual (PDF) . En Actas del 8º Taller internacional sobre evaluación semántica (SemEval 2014) . Dublín, Irlanda: Asociación de Lingüística Computacional. págs. 1–8. doi :10.3115/v1/S14-2001.
- ^ Romanov, Alexey; Shivade, Chaitanya (2018). Lecciones de la inferencia del lenguaje natural en el ámbito clínico (PDF) . En Actas de la Conferencia de 2018 sobre métodos empíricos en el procesamiento del lenguaje natural . Bruselas, Bélgica: Asociación de Lingüística Computacional. págs. 1586–1596. doi :10.18653/v1/D18-1187.
- ^ Demszky, Dorottya; Guu, Kelvin; Liang, Percy (2018). "Transformación de conjuntos de datos de preguntas y respuestas en conjuntos de datos de inferencia de lenguaje natural". arXiv : 1809.02922 [cs.CL].
- ^ Conneau, Alexis; Rinott, Ruty; Lample, Guillaume; Williams, Adina; Bowman, Samuel R.; Schwenk, Holger; Stoyanov, Veselin (2018). XNLI: Evaluación de representaciones de oraciones translingüísticas (PDF) . En Actas de la Conferencia de 2018 sobre métodos empíricos en el procesamiento del lenguaje natural . Bruselas, Bélgica: Asociación de Lingüística Computacional. págs. 2475–2485. doi :10.18653/v1/D18-1269.
- ^ Amirkhani, Hossein; AzariJafari, Mohammad; Faridan-Jahromi, Soroush; Kouhkan, Zeinab; Pourjafari, Zohreh; Amirak, Azadeh (7 de julio de 2023). "FarsTail: un conjunto de datos de inferencia del lenguaje natural persa". Computación blanda . arXiv : 2009.08820 . doi :10.1007/s00500-023-08959-3. ISSN 1433-7479. S2CID 221802461.
- ^ Hu, Hai; Richardson, Kyle; Xu, Liang; Li, Lu; Kübler, Sandra; Moss, Lawrence (2020). OCNLI: Inferencia de lenguaje natural en chino original (PDF) . En Hallazgos de la Asociación de Lingüística Computacional: EMNLP 2020 . págs. 3512–3526. doi :10.18653/v1/2020.findings-emnlp.314.
- ^ Wijnholds, Gijs; Moortgat, Michael (2021). SICK-NL: Un conjunto de datos para la inferencia del lenguaje natural holandés (PDF) . En Actas de la 16.ª Conferencia del Capítulo Europeo de la Asociación de Lingüística Computacional: Volumen principal . Asociación de Lingüística Computacional. págs. 1474–1479. doi :10.18653/v1/2021.eacl-main.126.
- ^ Mahendra, Rahmad; Aji, Alham Fikri; Louvan, Samuel; Rahman, Fahrurrozi; Vania, Clara (2021). IndoNLI: Un conjunto de datos de inferencia de lenguaje natural para indonesio (PDF) . En Actas de la Conferencia de 2021 sobre métodos empíricos en el procesamiento del lenguaje natural . Asociación de Lingüística Computacional. págs. 10511–10527. doi :10.18653/v1/2021.emnlp-main.821.
Bibliografía
- Potthast, Martin; Hagen, Matthias; Stein, Benno (2016). Obfuscación del autor: un ataque al estado del arte en la verificación de la autoría (PDF) . Conferencia y laboratorios del Foro de Evaluación.
Enlaces externos
- Fondo de recursos de implicación textual