Encuesta sobre el uso del inglés

La Encuesta sobre el uso del inglés fue el primer centro de investigación de Europa que llevó a cabo investigaciones con corpus . La Encuesta tiene su sede en el Departamento de Lengua y Literatura Inglesas del University College de Londres .

Historia

La Encuesta de Uso del Inglés fue fundada como la Encuesta de Inglés Hablado en la Universidad de Durham en 1959 por Randolph Quirk , trasladándose con él al University College de Londres en 1960. ^[1] Muchos lingüistas conocidos han pasado tiempo haciendo investigación en la Encuesta, incluidos Bas Aarts, Valerie Adams, John Algeo, Dwight Bolinger, Noël Burton-Roberts, David Crystal , Derek Davy, Jan Firbas, Sidney Greenbaum , Liliane Haegeman, Robert Ilson, Ruth Kempson, Geoffrey Leech , Jan Rusiecki, Jan Svartvik y Joe Taglicht. El director actual es Bas Aarts. ^[2]

El Corpus Survey original precedió a la informática moderna. Se grababa en cintas de carrete, se transcribía en papel, se archivaba en archivadores y se indexaba en fichas de papel. Las transcripciones se anotaban con una anotación prosódica y paralingüística detallada desarrollada por Crystal y Quirk (1964). ^[3] Los conjuntos de fichas de papel se anotaban manualmente para las estructuras gramaticales y se archivaban, de modo que, por ejemplo, todas las frases nominales se podían encontrar en el archivador de frases nominales del Survey. Naturalmente, las búsquedas en el corpus requerían una visita al Survey.

Este corpus se conoce hoy en día más ampliamente como el Corpus de Londres-Lund (LLC), ya que fue responsabilidad de los colaboradores de Lund, Suecia, informatizar el corpus. Treinta y cuatro de los textos hablados se publicaron en forma de libro con el título de Svartvik y Quirk (1980), ^[4] y el corpus se utilizó como base para el famoso libro A Comprehensive Grammar of the English Language (Quirk et al. 1985). ^[5]

Investigación actual

Construcción de corpus

En 1988, Sidney Greenbaum propuso un nuevo proyecto, el ICE (Corpus Internacional del Inglés) . El ICE iba a ser un proyecto internacional, llevado a cabo en centros de investigación de todo el mundo, para recopilar corpus de variedades del inglés en las que el inglés fuera la primera o segunda lengua oficial. Los textos del ICE contendrían inglés hablado y escrito en una muestra equilibrada de un millón de palabras por componente, de modo que estas muestras pudieran compararse de diversas maneras. El proyecto ICE continúa en todo el mundo hasta el día de hoy.

El componente británico de ICE, ICE-GB , se compiló en la Encuesta. ICE-GB se anotó a un nivel muy detallado, incluida la construcción de un análisis gramatical completo (análisis sintáctico) para cada oración del corpus. La primera versión de ICE-GB tuvo lugar en 1998. ICE-GB se distribuyó con un software para buscar y explorar el corpus analizado llamado ICECUP. La versión 2 de ICE-GB ya se ha publicado y está disponible en CD.

Además de las variedades contrastantes del inglés, muchos investigadores están interesados en el desarrollo y el cambio del lenguaje a lo largo del tiempo. Un proyecto reciente del Survey emprendió el análisis sintáctico de una gran selección (400.000 palabras) de la parte hablada del LLC de una manera directamente comparable con el ICE-GB, formando un nuevo corpus diacrónico de 800.000 palabras, llamado el Corpus Diacrónico del Inglés Hablado Actual ( DCPSE ). El DCPSE ya se ha publicado y está disponible en CD en el Survey.

Estos dos corpus comprenden la colección más grande del mundo de datos analizados, corregidos y transcritos ortográficamente en inglés hablado, con más de un millón de palabras de inglés hablado en esta forma.

Explorando corpus

Los corpus analizados son grandes bases de datos que contienen estructuras gramaticales detalladas. Una de las consecuencias de formar grandes colecciones de datos lingüísticos valiosos es la necesidad apremiante de métodos y herramientas que ayuden a los investigadores y otros usuarios a aprovecharlos al máximo. Por ello, en paralelo al análisis de datos en lenguaje natural, el equipo de Survey ha llevado a cabo investigaciones y desarrollo de herramientas de software para ayudar a los lingüistas a utilizar estos corpus. La plataforma de investigación ICECUP utiliza una representación intuitiva de consultas gramaticales denominada fragmentos de árbol difuso (FTF) para buscar en los corpus analizados.

Investigación lingüística con corpus

Además de distribuir corpus y herramientas a la comunidad de investigación en lingüística de corpus , el SEU lleva a cabo investigaciones sobre el idioma inglés. Entre los proyectos recientes se incluyen investigaciones sobre el sintagma nominal en inglés, la subordinación en inglés hablado y escrito y el sintagma verbal en inglés. La encuesta también brinda apoyo a los estudiantes de doctorado que realizan investigaciones sobre corpus en inglés.

Referencias

^ Negley Harte; John Northe; Georgina Brewis (2018). El mundo de la UCL (PDF) . UCL Press. págs. 239-240. doi :10.14324/111.9781787352933. ISBN . 9781787352933.
^ "Personal de la encuesta". University College London . Consultado el 14 de noviembre de 2016 .
^ Crystal, David, y Quirk, Randolph (1964). Sistemas de características prosódicas y paralingüísticas en inglés . La Haya: Mouton.
^ Svartvik, Jan y Quirk, Randolph (1980) (eds.). Un corpus de conversación en inglés Lund: CWK Gleerup.
^ Quirk, Randolph, Greenbaum, Sidney, Leech, Geoffrey y Svartvik, Jan (1985). Una gramática completa de la lengua inglesa. Londres: Longman.

Enlaces externos

Sitio web oficial