Correferencia

En lingüística , la correferencia , a veces correferencia escrita , se produce cuando dos o más expresiones hacen referencia a la misma persona o cosa; tienen el mismo referente . Por ejemplo, en Bill dijo que Alice llegaría pronto, y lo hizo , las palabras Alice y ella se refieren a la misma persona. ^[1]

La correferencia a menudo no es fácil de determinar. Por ejemplo, en Bill dijo que vendría , la palabra puede referirse o no a Bill. Determinar qué expresiones son correferencias es una parte importante del análisis o la comprensión del significado y, a menudo, requiere información del contexto, conocimiento del mundo real, como las tendencias de algunos nombres a asociarse con especies particulares ("Rover"), tipos de artefactos. ("Titanic"), géneros gramaticales u otras propiedades.

Los lingüistas suelen utilizar índices para anotar la correferencia, como en Bill , _dije que _vendría . Se dice que tales expresiones están coindexadas , lo que indica que deben interpretarse como correferenciales.

Cuando las expresiones son correferenciales, la primera que aparece suele ser una forma completa o descriptiva (por ejemplo, un nombre personal completo, tal vez con un título y función), mientras que las apariciones posteriores utilizan formas más cortas (por ejemplo, solo un nombre de pila, apellido, o pronombre). La ocurrencia anterior se conoce como antecedente y la otra se llama proforma , anáfora o referencia. Sin embargo, los pronombres a veces pueden referirse hacia adelante, como en "Cuando llegó a casa, Alice se fue a dormir". En tales casos, la correferencia se denomina catafórica en lugar de anafórica.

La correferencia es importante para vincular fenómenos en el campo de la sintaxis. La teoría de la vinculación explora la relación sintáctica que existe entre expresiones correferenciales en oraciones y textos.

Tipos

Al explorar la correferencia, se pueden hacer numerosas distinciones, por ejemplo, anáfora , catáfora , antecedentes divididos, sintagmas nominales correferenciales, etc. ^[2] Aquí se ilustran varios de estos fenómenos más específicos:

Anáfora: a. La música _estaba tan alta que _no se podía disfrutar. –La anáfora sigue a la expresión a la que hace referencia (su antecedente).; b. A nuestros vecinos no _me gusta la música. Si están _enojados , la policía aparecerá pronto. – La anáfora sigue a la expresión a la que hace referencia (su antecedente).
catáfora: a. Si están _enojados por la música, los vecinos _llamaré a la policía. – La catáfora precede a la expresión a la que se refiere (su poscedente).; b. A pesar de sus _dificultades , Wilma _llegó a comprender el punto. – La catáfora ella precede a la expresión a la que se refiere (su poscedente)
Antecedentes divididos: a. Carol le dije _a Bob _que asistiera a la fiesta. Llegaron _juntos . – La anáfora ellos tiene un antecedente escindido, refiriéndose tanto a Carol como a Bob .; b. Cuando Carol _i ayuda a Bob _i y Bob _i ayuda a Carol _i , ellos _pueden realizar cualquier tarea. – La anáfora ellos tiene un antecedente escindido, refiriéndose tanto a Carol como a Bob .
Frases sustantivas referidas: a. El líder del proyecto _se niega a ayudar. El imbécil sólo _piensa en sí _mismo . – Sintagmas nominales correlativos, siendo el segundo sintagma nominal una predicación sobre el primero.; b. Algunos de nuestros colegas ₁ nos apoyarán. Este tipo de personas _se ganarán nuestra gratitud. – Sintagmas nominales correlativos, siendo el segundo sintagma nominal una predicación sobre el primero.

Relación con variables ligadas

Los semánticos y lógicos a veces hacen una distinción entre correferencia y lo que se conoce como variable ligada . ^[3] Las variables ligadas ocurren cuando el antecedente de la proforma es una expresión cuantificada indefinida, por ejemplo, ^[4]^{[ se necesita aclaración ]}

Cada estudiante _i ha recibido su _i calificación. – El pronombre his es un ejemplo de variable ligada
Ningún estudiante, _estaba molesto con su _{calificación} . – El pronombre his es un ejemplo de variable ligada

No se consideran referenciales expresiones cuantificadas como todos los alumnos y ningún alumno . Estas expresiones son gramaticalmente singulares pero no seleccionan referentes únicos en el discurso o en el mundo real. Por lo tanto, los antecedentes suyos en estos ejemplos no son propiamente referenciales, como tampoco lo es el suyo . En cambio, se considera una variable ligada por su antecedente. Su referencia varía según en cuál de los estudiantes del mundo del discurso se piensa. La existencia de variables ligadas quizás sea más evidente con el siguiente ejemplo:

Sólo a Jack _i le gusta su calificación _i . – El pronombre his puede ser una variable ligada.

Esta frase es ambigua. Puede significar que a Jack le gusta su calificación pero a todos los demás no les gusta la calificación de Jack; o que a nadie le gusta su propia calificación excepto a Jack. En el primer sentido, el suyo es correferencial; en el segundo, es una variable ligada porque su referencia varía en el conjunto de todos los estudiantes.

La notación Coindex se usa comúnmente para ambos casos. Es decir, cuando dos o más expresiones están coindexadas, no indica si se trata de correferencia o de una variable ligada (o, como en el último ejemplo, si depende de la interpretación).

Resolución de correferencia

En lingüística computacional , la resolución de correferencia es un problema del discurso bien estudiado . Para obtener la interpretación correcta de un texto, o incluso estimar la importancia relativa de varios temas mencionados, los pronombres y otras expresiones de referencia deben estar conectados a las personas adecuadas. Los algoritmos destinados a resolver correferencias suelen buscar primero el individuo precedente más cercano que sea compatible con la expresión de referencia. Por ejemplo, podría adjuntar a una expresión anterior como la mujer o Anne , pero no tan probablemente a Bill . Pronombres como él mismo tienen restricciones mucho más estrictas. Como ocurre con muchas tareas lingüísticas, existe un equilibrio entre precisión y recuerdo . Las métricas de calidad de clúster comúnmente utilizadas para evaluar los algoritmos de resolución de correferencia incluyen el índice de Rand , el índice de Rand ajustado y diferentes métodos basados en información mutua .

Un problema particular para la resolución de correferencias en inglés es el pronombre it , que tiene muchos usos. Puede referirse de manera muy similar a él y ella , excepto que generalmente se refiere a objetos inanimados (las reglas son en realidad más complejas: los animales pueden ser cualquiera de ellos , él o ella ; los barcos tradicionalmente son ella ; los huracanes generalmente lo son a pesar de tener nombres de género). ). También puede referirse a abstracciones en lugar de seres, por ejemplo, le pagaban el salario mínimo, pero no parecía importarle. Por último, también tiene usos pleonásticos , que no se refieren a nada concreto:

Está lloviendo.
Es realmente una pena.
Se necesita mucho trabajo para tener éxito.
A veces son los más ruidosos los que tienen mayor influencia.

Los usos pleonásticos no se consideran referenciales y, por lo tanto, no forman parte de la correferencia. ^[5]

Los enfoques para la resolución de correferencias se pueden separar en términos generales en algoritmos de pares de menciones, de clasificación de menciones o basados en entidades. Los algoritmos de pares de menciones implican decisiones binarias si un par de dos menciones dadas pertenecen a la misma entidad. No se consideran restricciones de toda la entidad, como el género , lo que conduce a la propagación de errores . Por ejemplo, los pronombres él o ella pueden tener una alta probabilidad de correferencia con el profesor , pero no pueden ser correferentes entre sí. Los algoritmos de clasificación de menciones amplían esta idea, pero en cambio estipulan que una mención sólo puede ser correferente con una mención (anterior). Como resultado, a cada mención anterior se le debe otorgar una puntuación y se vincula la mención con la puntuación más alta (o ninguna mención). Finalmente, en los métodos basados en entidades, las menciones se vinculan en función de la información de toda la cadena de correferencia en lugar de menciones individuales. La representación de una cadena de ancho variable es más compleja y costosa desde el punto de vista computacional que los métodos basados en menciones, lo que lleva a que estos algoritmos se basen principalmente en arquitecturas de redes neuronales .

Ver también

Anáfora (lingüística) – Uso de una expresión cuya interpretación depende del contexto
Antecedente – Expresión que da significado a una proforma en gramática.
Encuadernación – Distribución de elementos anafóricos.
Catáfora : uso de una expresión o palabra que se refiere a una expresión posterior, más específica.
Referente más cercano
Referencia de cambio – Concepto en lingüística
Desambiguación del sentido de la palabra : identificación del sentido de una palabra que se utiliza

Notas

^ Para definiciones de correferencia, véanse, por ejemplo, Crystal (1997:94) y Radford (2004:332).
^ Estas distinciones (anáfora, catáfora, antecedentes divididos, sintagmas nominales correferenciales, etc.) se analizan en Jurafsky y Martin (2000:669 y siguientes).
^ Para discusiones sobre variables ligadas, ver, por ejemplo, Portner (2005:102ff.).
^ Véase Jurafsky y Martin (2000:701) para ver un ejemplo de una variable ligada como las que se dan aquí.
^ Li y col. (2009) han demostrado una alta precisión en la clasificación pleonástica , y este éxito promete mejorar la precisión de la resolución de correferencia en general.

Referencias

Crystal, D. 1997. Diccionario de lingüística y fonética. 4ta edición. Cambridge, MA: Blackwell Publishing.
Jurafsky, D. y H. Martin 2000. Procesamiento del habla y el lenguaje: una introducción al procesamiento del lenguaje natural, la lingüística computacional y el reconocimiento del habla. Nueva Delhi, India: Pearson Education.
Portner, P. 2005. ¿Qué es la semántica?: Fundamentos de la semántica formal. Malden, MA: Blackwell Publishing.
Radford, A. 2004. Sintaxis inglesa: introducción. Cambridge, Reino Unido: Cambridge University Press.
Li, Y., P. Musilek, M. Reformat y L. Wyard-Scott 2009. Identificación del pleonástico mediante la web Archivado el 26 de octubre de 2022 en Wayback Machine . Revista de investigación en inteligencia artificial 34, 339–389.