Corpus Lancaster-Oslo-Bergen

El Corpus Lancaster-Oslo/Bergen ( LOB ) es una colección de un millón de palabras de textos en inglés británico que fue compilada en la década de 1970 en colaboración entre la Universidad de Lancaster , la Universidad de Oslo y el Centro Noruego de Computación para las Humanidades. Bergen , para proporcionar una contraparte británica del Brown Corpus compilado por Henry Kučera y W. Nelson Francis para el inglés americano en los años 1960.

Su composición fue diseñada para coincidir lo más posible con el corpus original de Brown en términos de tamaño y géneros utilizando documentos publicados en el Reino Unido en 1961 por autores británicos. ^[1] Ambos corpus constan de 500 muestras, cada una de las cuales comprende alrededor de 2000 palabras en los siguientes géneros:

El corpus también ha sido etiquetado , es decir, se han asignado categorías de parte del discurso a cada palabra. ^{[ cita necesaria ]}

Referencias

^ Manual de corpus LOB

enlaces externos

Manual del corpus LOB
Corpus LOB del Oxford Text Archive