stringtranslate.com

personajes CJK

Traducción de "Ese viejo tiene 72 años" en vietnamita , cantonés , mandarín (en caracteres simplificados y tradicionales ), japonés y coreano .

En internacionalización , los caracteres CJK son un término colectivo para los idiomas chino , japonés y coreano , todos los cuales incluyen caracteres chinos y derivados en sus sistemas de escritura, a veces combinados con otras escrituras. En conjunto, los caracteres CJK suelen incluir Hànzì en chino, Kanji y Kana en japonés, y Hanja y Hangul en coreano. Se puede incluir el vietnamita , creando la abreviatura CJKV , ya que los vietnamitas históricamente utilizaron caracteres chinos conocidos como chữ Hán y chữ Nôm en vietnamita ( Hán-Nôm en conjunto).

Repertorio de personajes

El chino mandarín estándar y el cantonés estándar se escriben casi exclusivamente en caracteres chinos. Se requieren más de 3.000 caracteres para la alfabetización general , con hasta 40.000 caracteres para una cobertura razonablemente completa. El japonés utiliza menos caracteres; se puede esperar una alfabetización general en japonés con 2136 caracteres. El uso de caracteres chinos en Corea es cada vez más raro, aunque el uso idiosincrásico de caracteres chinos en nombres propios requiere conocimiento (y por tanto disponibilidad) de muchos más caracteres. Sin embargo, aún hoy a los estudiantes surcoreanos se les enseñan 1.800 caracteres .

Otras escrituras utilizadas para estos idiomas, como bopomofo y el pinyin latino para chino, hiragana y katakana para japonés y hangul para coreano, no son estrictamente "caracteres CJK", aunque los conjuntos de caracteres CJK casi invariablemente los incluyen según sea necesario para una completa cobertura de los idiomas de destino.

El sinólogo Carl Leban (1971) realizó un estudio inicial de los sistemas de codificación CJK.

Hasta principios del siglo XX, el chino clásico era el idioma escrito del gobierno y la erudición en Vietnam. La literatura popular en vietnamita se escribió en la escritura chữ Nôm , que consta de caracteres chinos con muchos caracteres creados localmente. A partir de la década de 1920, la escritura utilizada desde entonces para registrar la literatura ha sido la latina chữ Quốc ngữ . [1] [2]

Codificación

La cantidad de caracteres necesarios para una cobertura completa de las necesidades de todos estos idiomas no cabe en el espacio de código de 256 caracteres de las codificaciones de caracteres de 8 bits , lo que requiere al menos una codificación de ancho fijo de 16 bits o codificaciones de longitud variable de varios bytes. Las codificaciones de ancho fijo de 16 bits, como las de Unicode hasta la versión 2.0 inclusive, ahora están en desuso debido al requisito de codificar más caracteres de los que una codificación de 16 bits puede acomodar (Unicode 5.0 tiene unos 70.000 caracteres Han) y la Requisito del gobierno chino de que el software en China admita el juego de caracteres GB 18030 .

Aunque las codificaciones CJK tienen conjuntos de caracteres comunes, las codificaciones que se utilizan a menudo para representarlas han sido desarrolladas por separado por diferentes gobiernos y empresas de software del este de Asia y son mutuamente incompatibles. Unicode ha intentado, con cierta controversia, unificar los conjuntos de caracteres en un proceso conocido como unificación Han .

Las codificaciones de caracteres CJK deben consistir como mínimo en caracteres Han más escrituras fonéticas específicas del idioma, como pinyin , bopomofo , hiragana, katakana y hangul.

Las codificaciones de caracteres CJK incluyen:

Los juegos de caracteres CJK ocupan la mayor parte del espacio de código Unicode asignado . Existe mucha controversia entre los expertos japoneses en caracteres chinos sobre la conveniencia y el mérito técnico del proceso de unificación Han utilizado para mapear múltiples conjuntos de caracteres chinos y japoneses en un solo conjunto de caracteres unificados. [ cita necesaria ]

Los tres idiomas se pueden escribir tanto de izquierda a derecha como de arriba a abajo (de derecha a izquierda y de arriba a abajo en documentos antiguos), pero generalmente se consideran escrituras de izquierda a derecha cuando se analizan cuestiones de codificación.

Estatus legal

Las bibliotecas cooperaron en los estándares de codificación de caracteres JACKPHY ​​a principios de los años 1980. Según Ken Lunde , la abreviatura "CJK" era una marca registrada de Research Libraries Group [3] (que se fusionó con OCLC en 2006). La marca registrada propiedad de OCLC entre 1987 y 2009 ya expiró. [4]

Ver también

Referencias

  1. ^ Coulmas (1991), págs. 113-115.
  2. ^ DeFrancis (1977).
  3. ^ Ken Lunde, 1996
  4. ^ Listado de Justia

Trabajos citados

Fuentes

enlaces externos