stringtranslate.com

Corpus Lancaster-Oslo-Bergen

El Corpus Lancaster-Oslo/Bergen ( LOB ) es una colección de un millón de palabras de textos en inglés británico que se compiló en la década de 1970 en colaboración entre la Universidad de Lancaster , la Universidad de Oslo y el Centro Noruego de Computación para las Humanidades, Bergen , para proporcionar una contraparte británica al Corpus Brown compilado por Henry Kučera y W. Nelson Francis para el inglés estadounidense en la década de 1960. [1]

Su composición fue diseñada para coincidir lo más fielmente posible con el corpus Brown original en términos de tamaño y géneros, utilizando documentos publicados en el Reino Unido en 1961 por autores británicos. [2] Ambos corpus constan de 500 muestras, cada una de las cuales comprende alrededor de 2000 palabras en los siguientes géneros:

Los compiladores principales del corpus LOB fueron Geoffrey Leech (Universidad de Lancaster) y Stig Johansson (Universidad de Oslo); véase Leech y Johansson (2009) [3] .

El corpus también ha sido etiquetado , es decir, se han asignado categorías gramaticalmente distintas a cada palabra. [1]

Referencias

  1. ^ ab "CoRD | El corpus Lancaster-Oslo/Bergen (LOB)". varieng.helsinki.fi . Consultado el 12 de noviembre de 2024 .
  2. ^ Manual del corpus LOB
  3. ^ Leech, Geoffrey; Johansson, Stig (2009). "La llegada de ICAME" (PDF) . Revista ICAME . 33 : 5–20.

Enlaces externos