Encuesta sobre el uso del inglés

El Survey of English Usage fue el primer centro de investigación de Europa en realizar investigaciones con corpus . La encuesta tiene su sede en el Departamento de Lengua y Literatura Inglesas del University College de Londres .

Historia

La Encuesta sobre el uso del inglés fue fundada como Encuesta sobre el inglés hablado en la Universidad de Durham en 1959 por Randolph Quirk , y se mudó con él al University College de Londres en 1960. ^[1] Muchos lingüistas de renombre han pasado tiempo investigando en la Encuesta, entre ellos Bas Aarts, Valerie Adams, John Algeo, Dwight Bolinger, Noël Burton-Roberts, David Crystal , Derek Davy, Jan Firbas, Sidney Greenbaum , Liliane Haegeman, Robert Ilson, Ruth Kempson, Geoffrey Leech , Jan Rusiecki, Jan Svartvik y Joe Taglicht . El director actual es Bas Aarts. ^[2]

El Survey Corpus original es anterior a la informática moderna. Fue grabado en cintas de carrete a carrete, transcrito en papel, archivado en archivadores e indexado en tarjetas de papel. Las transcripciones se anotaron con una anotación prosódica y paralingüística detallada desarrollada por Crystal y Quirk (1964). ^[3] Se anotaron manualmente conjuntos de tarjetas de papel para las estructuras gramaticales y se archivaron, de modo que, por ejemplo, todas las frases nominales se pudieran encontrar en el archivador de frases nominales de la Encuesta. Naturalmente, las búsquedas de corpus requirieron la visita a la Encuesta.

Este corpus ahora se conoce más ampliamente como London-Lund Corpus (LLC), ya que era responsabilidad de los compañeros de trabajo en Lund, Suecia, informatizar el corpus. Treinta y cuatro de los textos hablados se publicaron en forma de libro como Svartvik y Quirk (1980), ^[4] y el corpus se utilizó como base para el famoso libro A Comprehensive Grammar of the English Language (Quirk et al. 1985). ^[5]

La investigación actual

Construyendo corpus

En 1988 Sidney Greenbaum propuso un nuevo proyecto, ICE , el Corpus Internacional del Inglés . ICE iba a ser un proyecto internacional, llevado a cabo en centros de investigación de todo el mundo, para compilar corpus de variedades de inglés donde el inglés era el primer o segundo idioma oficial. Los textos de ICE contendrían inglés hablado y escrito en una muestra equilibrada de un millón de palabras por componente para que estas muestras pudieran compararse de diversas formas. El proyecto ICE continúa en todo el mundo hasta el día de hoy.

ICE-GB , el componente británico de ICE, fue compilado en la Encuesta. ICE-GB fue anotado a un nivel muy detallado, incluida la construcción de un análisis gramatical completo (análisis) para cada oración del corpus. El primer lanzamiento de ICE-GB tuvo lugar en 1998. ICE-GB se distribuyó con un software para buscar y explorar el corpus analizado llamado ICECUP. La versión 2 de ICE-GB ya ha sido lanzada y está disponible en CD.

Además de contrastar variedades de inglés, muchos investigadores están interesados en el desarrollo del lenguaje y sus cambios a lo largo del tiempo. Un proyecto reciente de Survey emprendió el análisis de una gran selección (400.000 palabras) de la parte hablada de LLC de una manera directamente comparable con ICE-GB, formando un nuevo corpus diacrónico de 800.000 palabras, llamado Corpus Diacrónico del Presente. Inglés hablado diurno ( DCPSE ). DCPSE ya ha sido publicado y está disponible en CD desde la Encuesta.

Estos dos corpus comprenden la mayor colección de datos del idioma inglés hablado analizados, corregidos y transcritos ortográficamente en el mundo, con más de un millón de palabras de inglés hablado en esta forma.

Explorando corpus

Los corpus analizados son grandes bases de datos que contienen estructuras de árbol gramaticales detalladas. Una de las consecuencias de formar grandes colecciones de datos lingüísticos valiosos es la necesidad apremiante de métodos y herramientas que ayuden a los investigadores y otros usuarios a aprovecharlos al máximo. Entonces, en paralelo con el análisis de datos del lenguaje natural, el equipo de Survey ha llevado a cabo investigación y desarrollo de herramientas de software para ayudar a los lingüistas a utilizar estos corpus. La plataforma de investigación ICECUP utiliza una representación de consulta gramatical intuitiva llamada Fragmentos de árbol difusos (FTF) para buscar corpus analizados.

Investigación lingüística con corpus

Además de distribuir corpus y herramientas a la comunidad de investigación en lingüística de corpus , la SEU lleva a cabo investigaciones en idioma inglés. Los proyectos recientes incluyen investigaciones sobre la frase nominal en inglés, la subordinación en inglés hablado y escrito y la frase verbal en inglés. La Encuesta también brinda apoyo a estudiantes de doctorado que realizan investigaciones sobre corpus de lengua inglesa.

Referencias

^ Negley Harte; John Northe; Georgina Brewis (2018). El mundo de la UCL (PDF) . Prensa de la UCL. págs. 239-240. doi : 10.14324/111.9781787352933. ISBN 9781787352933.
^ "Personal de encuesta". University College de Londres . Consultado el 14 de noviembre de 2016 .
^ Cristal, David y Quirk, Randolph (1964). Sistemas de características prosódicas y paralingüísticas en inglés . La Haya: Mouton.
^ Svartvik, Jan y Quirk, Randolph (1980) (eds.). Un corpus de conversaciones en inglés Lund: CWK Gleerup.
^ Quirk, Randolph, Greenbaum, Sidney, Leech, Geoffrey y Svartvik, enero (1985). Una gramática completa del idioma inglés Londres: Longman.

enlaces externos

Página web oficial