stringtranslate.com

Colocación

En lingüística de corpus , una colocación es una serie de palabras o términos que coexisten con más frecuencia de lo que se esperaría por casualidad. En fraseología , una colocación es un tipo de frasema compositivo , es decir que puede entenderse a partir de las palabras que lo componen. Esto contrasta con un modismo , donde el significado del todo no puede inferirse de sus partes y puede no tener ninguna relación.

Hay alrededor de siete tipos principales de colocaciones: adjetivo + sustantivo, sustantivo + sustantivo (como los sustantivos colectivos ), sustantivo + verbo, verbo + sustantivo, adverbio + adjetivo, verbos + frase preposicional ( phrasal verbs ) y verbo + adverbio.

La extracción de colocaciones es una técnica computacional que encuentra colocaciones en un documento o corpus, utilizando varios elementos de lingüística computacional que se asemejan a la minería de datos .

Definición ampliada

Las colocaciones son expresiones parcial o totalmente fijas que se establecen mediante un uso repetido que depende del contexto. Términos como cristal claro , mando intermedio , familia nuclear y cirugía estética son ejemplos de pares de palabras colocadas.

Las colocaciones pueden estar en una relación sintáctica (como verbo-objeto : tomar y decidir ), una relación léxica (como antonimia ), o pueden no estar en una relación lingüísticamente definida. El conocimiento de las colocaciones es vital para el uso competente de una lengua: una oración gramaticalmente correcta resultará incómoda si se violan las preferencias de colocación. Esto hace que la colocación sea un área interesante para la enseñanza de idiomas.

Los lingüistas de corpus especifican una palabra clave en contexto ( KWIC ) e identifican las palabras que la rodean inmediatamente. Esto da una idea de la forma en que se usan las palabras.

El procesamiento de colocaciones implica una serie de parámetros, el más importante de los cuales es la medida de asociación , que evalúa si la coexistencia es puramente aleatoria o estadísticamente significativa . Debido a la naturaleza no aleatoria del lenguaje, la mayoría de las colocaciones se clasifican como significativas y las puntuaciones de asociación se utilizan simplemente para clasificar los resultados. Las medidas de asociación comúnmente utilizadas incluyen información mutua , puntuaciones t y probabilidad logarítmica . [1] [2]

En lugar de seleccionar una única definición, Gledhill [3] propone que la colocación implica al menos tres perspectivas diferentes: co-ocurrencia, una visión estadística, que ve la colocación como la aparición recurrente en un texto de un nodo y sus colocaciones; [4] [5] [6] construcción, que ve la colocación como una correlación entre un lexema y un patrón léxico-gramatical, [7] o como una relación entre una base y sus socios colocativos; [8] y expresión, una visión pragmática de la colocación como unidad de expresión convencional, independientemente de la forma. [9] [10] Estas diferentes perspectivas contrastan con la forma habitual de presentar la colocación en los estudios fraseológicos. Tradicionalmente hablando, la colocación se explica en términos de las tres perspectivas a la vez, en un continuo:

Combinación libre ↔ colocación encuadernada ↔ modismo congelado

En diccionarios

En 1933, el segundo informe provisional de Harold Palmer sobre colocaciones en inglés destacó la importancia de la colocación como clave para producir un lenguaje con sonido natural para cualquiera que esté aprendiendo un idioma extranjero . [11] Así, a partir de la década de 1940, la información sobre combinaciones de palabras recurrentes se convirtió en una característica estándar de los diccionarios para estudiantes monolingües . A medida que estos diccionarios se volvieron "menos centrados en palabras y más centrados en frases", [12] se prestó más atención a la colocación. Esta tendencia se vio respaldada, desde principios del siglo XXI, por la disponibilidad de grandes corpus de texto y software inteligente de consulta de corpus , lo que permitió proporcionar una explicación más sistemática de la colocación en los diccionarios. Utilizando estas herramientas, diccionarios como el Macmillan English Dictionary y el Longman Dictionary of Contemporary English incluyeron cuadros o paneles con listas de colocaciones frecuentes. [13]

También hay una serie de diccionarios especializados dedicados a describir las colocaciones frecuentes en un idioma. [14] Estos incluyen (para español) Redes: Diccionario combinatorio del español contemporaneo (2004), (para francés) Le Robert: Dictionnaire des combinaisons de mots (2007) y (para inglés) el Diccionario LTP de colocaciones seleccionadas (1997) y el Diccionario de colocaciones Macmillan (2010). [15]

Colocación estadísticamente significativa

La prueba t de Student se puede utilizar para determinar si la aparición de una colocación en un corpus es estadísticamente significativa. [16] Para un bigrama , sea la probabilidad incondicional de ocurrencia de en un corpus con tamaño , y sea la probabilidad incondicional de ocurrencia de en el corpus. La puntuación t para el bigram se calcula como:

donde es la media muestral de la aparición de , es el número de apariciones de , es la probabilidad de que, bajo la hipótesis nula, y aparezcan de forma independiente en el texto, y es la varianza muestral. Con un valor grande , la prueba t es equivalente a una prueba Z.

Ver también

Referencias

  1. ^ Dunning, Ted (1993): "Métodos precisos para las estadísticas de sorpresa y coincidencia Archivado el 5 de agosto de 2012 en la Wayback Machine ". Lingüística computacional 19, 1 (marzo de 1993), 61–74.
  2. ^ Dunning, Ted (21 de marzo de 2008). "Sorpresa y coincidencia". blogspot.com. Archivado desde el original el 20 de enero de 2012 . Consultado el 9 de abril de 2012 .
  3. ^ Gledhill C. (2000): Colocaciones en la escritura científica Archivado el 29 de junio de 2023 en Wayback Machine , Narr, Tübingen
  4. ^ Firth JR (1957): Artículos sobre lingüística 1934-1951. Oxford: Prensa de la Universidad de Oxford.
  5. ^ Sinclair J. (1996): "La búsqueda de unidades de significado", en Textus, IX, 75-106.
  6. ^ Smadja F. A & McKeown, KR (1990): "Extracción y representación automática de colocaciones para la generación de lenguaje Archivado el 6 de septiembre de 2015 en Wayback Machine ", Actas de ACL'90, 252–259, Pittsburgh, Pensilvania.
  7. ^ Hunston S. y Francis G. (2000): Gramática de patrones: un enfoque basado en corpus para la gramática léxica del inglés Archivado el 29 de junio de 2023 en Wayback Machine , Ámsterdam, John Benjamins
  8. ^ Hausmann FJ (1989): Le dictionnaire de colocations. En Hausmann FJ, Reichmann O., Wiegand HE, Zgusta L. (eds), Wörterbücher: ein internationales Handbuch zur Lexikographie. Diccionarios. Diccionarios. Berlín/Nueva York: De Gruyter. 1010-1019.
  9. ^ Moon R. (1998): Expresiones y modismos fijos, un enfoque basado en corpus. Oxford, prensa de la Universidad de Oxford.
  10. ^ Frath P. & Gledhill C. (2005): "¿Grupos criados al aire libre o fragmentos congelados? Referencia como criterio definitorio para unidades lingüísticas [ enlace muerto ] ", en Recherches anglaises et Nord-américaines, vol. 38:25–43
  11. ^ Cowie, AP, Diccionarios de inglés para estudiantes extranjeros, Oxford University Press 1999:54–56
  12. ^ Bejoint, H., La lexicografía del inglés, Oxford University Press 2010: 318
  13. ^ "MED Segunda edición - Funciones clave - Macmillan". macmillandictionaries.com . Archivado desde el original el 28 de septiembre de 2020 . Consultado el 24 de agosto de 2011 .
  14. ^ Herbst, T. y Klotz, M. 'Diccionarios sintagmáticos y fraseológicos' en Cowie, AP (Ed.) The Oxford History of English Lexicography, 2009: parte 2, 234–243
  15. ^ "Diccionario de colocación de Macmillan - Cómo se escribió - Macmillan". macmillandictionaries.com . Archivado desde el original el 21 de diciembre de 2018 . Consultado el 24 de agosto de 2011 .
  16. ^ Manning, Chris; Schütze, Hinrich (1999). Fundamentos del procesamiento estadístico del lenguaje natural . Cambridge, MA: MIT Press. págs. 163-166. ISBN 0262133601.

enlaces externos