Corpus Lancaster-Oslo-Bergen

El Corpus Lancaster-Oslo/Bergen ( LOB ) es una colección de un millón de palabras de textos en inglés británico que se compiló en la década de 1970 en colaboración entre la Universidad de Lancaster , la Universidad de Oslo y el Centro Noruego de Computación para las Humanidades, Bergen , para proporcionar una contraparte británica al Corpus Brown compilado por Henry Kučera y W. Nelson Francis para el inglés estadounidense en la década de 1960.

Su composición fue diseñada para coincidir lo más fielmente posible con el corpus Brown original en términos de tamaño y géneros, utilizando documentos publicados en el Reino Unido en 1961 por autores británicos. ^[1] Ambos corpus constan de 500 muestras, cada una de las cuales comprende alrededor de 2000 palabras en los siguientes géneros:

El corpus también ha sido etiquetado , es decir, se han asignado categorías gramaticalmente distintas a cada palabra. ^[2]

Referencias

^ Manual del corpus LOB
^ Johansson, Stig. "CoRD | El corpus Lancaster-Oslo/Bergen (LOB)". varieng.helsinki.fi .

Enlaces externos

Manual del corpus LOB
Corpus LOB del Archivo de Textos de Oxford