stringtranslate.com

Corpus de inglés americano contemporáneo

El Corpus of Contemporary American English ( COCA ) es un corpus de mil millones de palabras [1] de inglés americano contemporáneo . Fue creado por Mark Davies , profesor jubilado de lingüística de corpus en la Universidad Brigham Young (BYU). [2] [3]

Contenido

El Corpus of Contemporary American English (COCA) está compuesto por mil millones de palabras en noviembre de 2021. [1] [2] [4] El corpus está en constante crecimiento: en 2009 contenía más de 385 millones de palabras; [5] En 2010, el corpus creció en tamaño a 400 millones de palabras; [6] En marzo de 2019, [7] el corpus había aumentado a 560 millones de palabras. [7]

A noviembre de 2021, el Corpus de inglés americano contemporáneo está compuesto por 485.202 textos. [4] Según el sitio web del corpus, [4] el corpus actual (noviembre de 2021) está compuesto por textos que incluyen entre 24 y 25 millones de palabras para cada año 1990-2019.

Para cada año contenido en el corpus (1990-2019), el corpus se divide uniformemente entre seis registros/géneros: televisión/películas, hablada, ficción, revistas, periódicos y académicos (consulte la página Textos y registros del sitio web de COCA). Además de los seis registros que se enumeraron anteriormente, COCA (a noviembre de 2021) también contiene 125,496,215 palabras de blogs y 129,899,426 de sitios web, lo que lo convierte en un corpus verdaderamente compuesto de inglés contemporáneo (consulte la página Textos y registros de COCA). . [4]


Los textos provienen de diversas fuentes:

Disponibilidad

El Corpus of Contemporary American English es de búsqueda gratuita para usuarios registrados.

Consultas

Relacionado

El corpus de inglés global basado en la Web (GloWbE; pronunciado "globo") contiene alrededor de 1.900 millones de palabras de texto de veinte países diferentes. Esto lo hace aproximadamente 100 veces más grande que otros corpus como el International Corpus of English, y permite muchos tipos de búsquedas que de otro modo no serían posibles. Además de esta interfaz en línea, también puede descargar datos de texto completo del corpus.

Es único en el sentido de que permite realizar comparaciones entre diferentes variedades de inglés. GloWbE está relacionado con muchos otros corpus de inglés. [8]

Ver también

Referencias

  1. ^ ab Milana, Prior (2021). Un estudio de corpus comparativo sobre el uso de intensificadores en registros en inglés americano (Tesis).
  2. ^ ab "Mark Davies, profesor de lingüística (de corpus), Universidad Brigham Young (BYU)". www.mark-davies.org . Consultado el 9 de noviembre de 2021 .
  3. ^ Kauhanen, Henri (21 de marzo de 2011). "El corpus del inglés americano contemporáneo: antecedentes e historia". VARIEDAD . Consultado el 13 de octubre de 2011 .
  4. ^ abcd "Página de inicio". corpus de inglés americano contemporáneo . Consultado el 24 de abril de 2022 .
  5. ^ Davies, Mark (1 de enero de 2009). "El corpus de más de 385 millones de palabras del inglés americano contemporáneo (1990-2008+): diseño, arquitectura y conocimientos lingüísticos". Revista Internacional de Lingüística de Corpus . 14 (2): 159-190. doi :10.1075/ijcl.14.2.02dav. ISSN  1384-6655.
  6. ^ Davies, Mark (1 de diciembre de 2010). "El Corpus del inglés americano contemporáneo como el primer corpus de seguimiento fiable del inglés". Computación Literaria y Lingüística . 25 (4): 447–464. doi :10.1093/llc/fqq018. ISSN  0268-1145.
  7. ^ ab Davies, Mark; Kim, Jong Bok (1 de marzo de 2019). "Las ventajas y desafíos del" big data ": conocimientos del corpus iWeb de 14 mil millones de palabras". Investigación Lingüística . 36 (1): 1–34. doi : 10.17250/khisli.36.1.201903.001 . ISSN  1229-1374. S2CID  133013527.
  8. ^ "Corpus de inglés global basado en la web". www.english-corpora.org . Consultado el 18 de diciembre de 2019 .

Otras lecturas

enlaces externos