stringtranslate.com

Palabras más comunes en español

A continuación se muestran dos estimaciones de las palabras más comunes en español moderno . Cada estimación proviene de un análisis de un corpus de texto diferente . Un corpus de texto es una gran colección de muestras de lenguaje escrito y/o hablado, que ha sido cuidadosamente preparada para su análisis lingüístico. Para determinar qué palabras son las más comunes, los investigadores crean una base de datos de todas las palabras encontradas en el corpus y las clasifican según el contexto en el que se utilizan.

La primera tabla enumera las 100 formas de palabras más comunes del Corpus de Referencia del Español Actual (CREA), un corpus de texto compilado por la Real Academia Española (RAE). La RAE es la institución oficial de España para la documentación, planificación y normalización de la lengua española. Una forma de palabra es cualquiera de las variaciones gramaticales de una palabra.

La segunda tabla es una lista de los 100 lemas más comunes que se encuentran en un corpus de texto compilado por Mark Davies y otros investigadores lingüísticos de la Universidad Brigham Young de Estados Unidos. Un lema es la forma primaria de una palabra, la que aparecería en un diccionario. El infinitivo español tener ("to have") es un lema, mientras que tiene ("has"), que es una conjugación de tener , es una forma de palabra.

Real Academia Española

La siguiente lista proviene de "1000 formas más frecuentes" ( transl.  1000 formas de palabras más frecuentes ) ", una lista publicada por la Real Academia Española (RAE) a partir del análisis de más de 160 millones de formas de palabras encontradas en el Corpus de Referencia del Español Actual ( trad.  Corpus de Referencia del Español Actual ), o CREA es un corpus informatizado de textos escritos en español, y de transcripciones de español hablado. Incluye libros, revistas y periódicos con una amplia variedad de contenidos, así como. transcripciones de lengua hablada de transmisiones de radio y televisión y otras fuentes. Todas las obras de la colección son de 1975 a 2004. CREA incluye muestras de todos los países de habla hispana [1] .

La lista de las "2000 formas de palabras más frecuentes" proviene de un análisis de CREA versión 3.2. [2] Los plurales , las conjugaciones verbales y otras inflexiones se clasifican por separado. Los homónimos , sin embargo, no se distinguen entre sí. CREA 3.2 se publicó en junio de 2008. [1]

Marcos Davis

En 2006, Mark Davies , profesor asociado de lingüística en la Universidad Brigham Young , publicó su estimación de las 5000 palabras más comunes en español moderno. Para hacer esta lista, recopiló muestras sólo de fuentes del siglo XX, especialmente de los años 1970 a 2000. La mayoría de las fuentes son de la década de 1990. De los 20 millones de palabras del corpus, aproximadamente un tercio (~6.750.000 palabras) provienen de transcripciones de español hablado: conversaciones, entrevistas, conferencias, sermones, conferencias de prensa, retransmisiones deportivas, etc. Entre las fuentes escritas se encuentran novelas, obras de teatro, cuentos, cartas, ensayos, periódicos y la enciclopedia Encarta . Las muestras, escritas y habladas, proceden de España y al menos de 10 países latinoamericanos. La mayoría de las muestras fueron compiladas previamente para el Corpus del Español (2001), un corpus de 100 millones de palabras que incluye obras del siglo XIII al XX. [3] [4]

Las 5000 palabras de la lista de Davies son lemas . [5] Un lema es la forma de la palabra tal como aparecería en un diccionario. [6] Los sustantivos singulares y plurales, por ejemplo, se tratan como la misma palabra, al igual que los infinitivos y las conjugaciones verbales. La siguiente tabla incluye las 100 palabras principales de la lista de 5000 de Davies. [7] [8] Esta lista distingue entre los artículos definidos lo y la y los pronombres lo y la ; todos están clasificados individualmente. Los adjetivos ese y esa se clasifican juntos (al igual que este y esta ), pero el pronombre eso está separado. Todas las conjugaciones de un verbo se clasifican juntas.

Una fila resaltada indica que se encontró que la palabra aparece con especial frecuencia en muestras de español hablado. [9]

Ver también

Notas

  1. ^ ab "CREA". RAE.es (en español). Real Academia Española . Consultado el 13 de julio de 2017 .
  2. ^ "Corpus de Referencia del Español Actual (CREA) - Listado de frecuencias". RAE.es (en español). Real Academia Española . Consultado el 13 de julio de 2017 .
  3. ^ Davies (2006), pág. 2–3
  4. ^ "El Corpus del Español". corpusdelespanol.org . Consultado el 13 de julio de 2017 .
  5. ^ Davies (2006), págs. 4-6
  6. ^ Davies (2006), pág. 4
  7. ^ Davies (2006), págs. 12-14
  8. ^ "Mejor vocabulario en español". Vistawide Idiomas y culturas del mundo . Consultado el 13 de julio de 2017 .
  9. ^ Davies (2006), pág. 9

Referencias

enlaces externos