stringtranslate.com

Caracteres CJK

Traducción de "Ese anciano tiene 72 años" en vietnamita , cantonés , mandarín (en caracteres simplificados y tradicionales ), japonés y coreano .

En el ámbito de la internacionalización , los caracteres CJK son un término colectivo para los grafemas utilizados en los sistemas de escritura chino , japonés y coreano , que incluyen caracteres chinos . El término CJKV también incluye Chữ Nôm , la escritura logográfica de origen chino que se utilizaba anteriormente para el idioma vietnamita .

Repertorio de personajes

El chino mandarín estándar y el cantonés estándar se escriben casi exclusivamente en caracteres chinos. Se requieren más de 3000 caracteres para una alfabetización general , y hasta 40 000 caracteres para una cobertura razonablemente completa. El japonés utiliza menos caracteres: se puede esperar una alfabetización general en japonés con 2136 caracteres. El uso de caracteres chinos en Corea es cada vez menos frecuente, aunque el uso idiosincrásico de caracteres chinos en nombres propios requiere el conocimiento (y, por lo tanto, la disponibilidad) de muchos más caracteres. Sin embargo, incluso hoy en día, a los estudiantes surcoreanos se les enseñan 1800 caracteres .

Otros sistemas de escritura utilizados para estos idiomas, como el bopomofo y el pinyin, basado en el latín , para el chino, el hiragana y el katakana para el japonés, y el hangul para el coreano, no son estrictamente "caracteres CJK", aunque los conjuntos de caracteres CJK casi invariablemente los incluyen como necesarios para una cobertura completa de los idiomas de destino.

El sinólogo Carl Leban (1971) produjo un estudio temprano de los sistemas de codificación CJK.

Hasta principios del siglo XX, el chino clásico era el idioma escrito en el gobierno y en las escuelas de Vietnam. La literatura popular en vietnamita se escribía en la escritura chữ Nôm , que constaba de caracteres chinos y muchos caracteres creados localmente. Desde la década de 1920, la escritura que se ha utilizado para registrar la literatura ha sido el alfabeto vietnamita basado en el latín . [1] [2]

Codificación

La cantidad de caracteres necesarios para cubrir por completo las necesidades de todos estos idiomas no cabe en el espacio de código de 256 caracteres de las codificaciones de caracteres de 8 bits , por lo que se requiere una codificación de ancho fijo de al menos 16 bits o codificaciones de longitud variable de varios bytes. Las codificaciones de ancho fijo de 16 bits, como las de Unicode hasta la versión 2.0 inclusive, ahora están en desuso debido al requisito de codificar más caracteres de los que puede admitir una codificación de 16 bits (Unicode 5.0 tiene unos 70.000 caracteres Han) y al requisito del gobierno chino de que el software en China admita el conjunto de caracteres GB 18030 .

Aunque las codificaciones CJK tienen conjuntos de caracteres comunes, las codificaciones que se suelen utilizar para representarlas han sido desarrolladas por separado por diferentes gobiernos y empresas de software del este de Asia, y son incompatibles entre sí. Unicode ha intentado, con cierta controversia, unificar los conjuntos de caracteres en un proceso conocido como unificación Han .

Las codificaciones de caracteres CJK deben constar mínimamente de caracteres Han más escrituras fonéticas específicas del idioma, como pinyin , bopomofo , hiragana, katakana y hangul. [3]

Las codificaciones de caracteres CJK incluyen:

Los conjuntos de caracteres CJK ocupan la mayor parte del espacio asignado para el código Unicode . Existe mucha controversia entre los expertos japoneses en caracteres chinos sobre la conveniencia y el mérito técnico del proceso de unificación Han utilizado para mapear múltiples conjuntos de caracteres chinos y japoneses en un único conjunto de caracteres unificados. [ cita requerida ]

Los tres idiomas se pueden escribir de izquierda a derecha y de arriba a abajo (de derecha a izquierda y de arriba a abajo en documentos antiguos), pero generalmente se consideran escrituras de izquierda a derecha cuando se discuten cuestiones de codificación.

Estatus legal

Las bibliotecas colaboraron en la codificación de los caracteres JACKPHY ​​a principios de los años 1980. Según Ken Lunde , la abreviatura "CJK" era una marca registrada de Research Libraries Group [4] (que se fusionó con OCLC en 2006). La marca registrada que fue propiedad de OCLC entre 1987 y 2009 ya no existe. [5]

Véase también

Referencias

  1. ^ Coulmas (1991), págs. 113-115.
  2. ^ DeFrancis (1977).
  3. ^ Este artículo se basa en material tomado de CJK en el Diccionario gratuito en línea de informática antes del 1 de noviembre de 2008 e incorporado bajo los términos de "renovación de licencia" del GFDL , versión 1.3 o posterior.
  4. ^ Ken Lunde, 1996
  5. ^ Listado de Justia

Obras citadas

Fuentes

Enlaces externos