En lingüística , la similitud léxica es una medida del grado en que los conjuntos de palabras de dos idiomas determinados son similares. Una similitud léxica de 1 (o 100%) significaría una superposición total entre vocabularios, mientras que 0 significa que no hay palabras en común.
Existen diferentes maneras de definir la similitud léxica y los resultados varían en consecuencia. Por ejemplo, el método de cálculo de Ethnologue consiste en comparar una lista de palabras estandarizada regionalmente (comparable a la lista Swadesh ) y contar aquellas formas que muestran similitud tanto en forma como en significado. Usando este método, se evaluó que el inglés tenía una similitud léxica del 60% con el alemán y del 27% con el francés .
La similitud léxica puede utilizarse para evaluar el grado de relación genética entre dos lenguas. Porcentajes superiores al 85% suelen indicar que es probable que las dos lenguas que se comparan sean dialectos relacionados . [1]
La similitud léxica es sólo un indicador de la inteligibilidad mutua de las dos lenguas, ya que ésta depende también del grado de similitud fonética, morfológica y sintáctica. Las variaciones debidas a las diferentes listas de palabras influyen en este aspecto. Por ejemplo, la similitud léxica entre el francés y el inglés es considerable en los ámbitos léxicos relacionados con la cultura, mientras que su similitud es menor en lo que se refiere a las palabras básicas (funcionales). A diferencia de la inteligibilidad mutua, la similitud léxica sólo puede ser simétrica.
Existen palabras tomadas del chino que se denominan vocabulario chino-coreano , y existen nuevas palabras coreanas creadas a partir de caracteres chinos , y también hay palabras tomadas del vocabulario chino-japonés . Según el Diccionario estándar del idioma coreano publicado por el Instituto Nacional de la Lengua Coreana (NIKL), el chino-coreano representa aproximadamente el 57% del vocabulario coreano. [2]
En cuanto al japonés, se ha estimado que alrededor del 60% de las palabras contenidas en los diccionarios japoneses modernos son chino-japonesas , [3] y que alrededor del 18-20% de las palabras utilizadas en el habla común son chino-japonesas, según lo medido por el Instituto Nacional de Lengua Japonesa en su estudio del uso del lenguaje en las transmisiones de NHK de abril a junio de 1989. [4] El uso de tales palabras chino-japonesas también aumenta en contextos formales o literarios, y en expresiones de ideas abstractas o complejas. [4]
A pesar de que el japonés y el coreano han tomado prestadas muchas palabras chinas, los hablantes de los tres idiomas no tienen la suficiente inteligibilidad mutua como para poder comunicarse entre sí. El japonés y el coreano no son idiomas tonales, pero los idiomas chinos sí lo son, lo que significa que la pronunciación correcta de una sílaba de una palabra es importante para la comunicación, así como el tono adecuado al pronunciar una palabra. Cuando se utilizan símbolos chinos (hanzi) para escribir en coreano (que se denominan "hanja") y en japonés (que se denominan "kanji"), a veces se pueden entender algunas palabras en una frase, pero es muy poco probable que se entienda una frase entera incluso por escrito. El japonés y el coreano tienen sus propios sistemas de escritura que son diferentes del hanzi, por lo que es poco probable que se escriban oraciones completas con símbolos chinos prestados.
Un estudio realizado por Mario Pei en 1949 que analizaba el grado de diferenciación de las lenguas respecto de su lengua madre (en el caso de las lenguas romances comparando con el latín fonología , flexión , discurso , sintaxis , vocabulario y entonación ) arrojó los siguientes porcentajes (a mayor porcentaje, mayor distancia respecto del latín): [5]
La siguiente tabla muestra algunos valores de similitud léxica para pares de lenguas romances, germánicas y eslavas seleccionadas, recopiladas y publicadas por Ethnologue . [6]
Notas: