stringtranslate.com

JIS X 0212

JIS X 0212 es un estándar industrial japonés que define un conjunto de caracteres codificados para codificar caracteres suplementarios para su uso en japonés. Esta norma está destinada a complementar JIS X 0208 (página de códigos 952). Tiene el número 953 o 5049 como página de códigos de IBM (ver más abajo).

Es uno de los estándares fuente de los ideogramas unificados CJK de Unicode .

Historia

En 1990, la Asociación Japonesa de Estándares (JSA) publicó un estándar de juego de caracteres complementario: JIS X 0212-1990 Código del juego de caracteres gráficos japoneses suplementario para el intercambio de información (情報交換用漢字符号-補助漢字, Jōhō Kōkan'yō Kanji Fugō - Hojo Kanji ) . Este estándar tenía como objetivo aprovechar la gama de caracteres disponibles en el conjunto de caracteres principal JIS X 0208 y abordar las deficiencias en la cobertura de ese conjunto.

Características

Diagrama de Euler que compara repertorios de JIS X 0208 , JIS X 0212, JIS X 0213 , Windows-31J , el repertorio estándar de Microsoft y Unicode .

El estándar especificaba 6.067 caracteres, que comprenden:

Codificaciones

Las siguientes codificaciones o encapsulaciones se utilizan para permitir el uso de caracteres JIS X 0212 en archivos, etc.

No es posible encapsular caracteres JIS X 0212 en la popular codificación Shift JIS , ya que Shift JIS no tiene suficiente espacio de código no asignado para los caracteres.

Implementaciones

Codificación de JIS X 0212 en conformidad EUC-JP (izquierda) y página de códigos de Windows 20932 (derecha).

IBM denomina JIS X 0212 Página de códigos 953 , que incluye extensiones de proveedores. [2] [3] [4] El CCSID alternativo 5049 excluye estas extensiones. [5]

Como los caracteres JIS X 0212 no se pueden codificar en Shift JIS, el sistema de codificación que tradicionalmente ha dominado el procesamiento de información japonés, se han llevado a cabo pocas implementaciones prácticas del conjunto de caracteres. Como se mencionó anteriormente, se puede codificar en EUC-JP, que se usa comúnmente en sistemas Unix/Linux, y es aquí donde se han producido la mayoría de las implementaciones:

Muchos navegadores WWW, como la familia Netscape/Mozilla/ Firefox , Opera, etc. y aplicaciones relacionadas, como Mozilla Thunderbird, admiten la visualización de caracteres JIS X 0212 en codificación EUC-JP; sin embargo, Internet Explorer no admite caracteres JIS X 0212. Los paquetes de emulación de terminal modernos, como GNOME Terminal, también admiten caracteres JIS X 0212.

Las aplicaciones que admiten JIS X 0212 en la codificación EUC incluyen:

JIS X 0212 y Unicode

Los kanji en JIS X 0212 se tomaron como una de las fuentes para la unificación Han que condujo al conjunto unificado de caracteres CJK en el estándar ISO 10646 / Unicode inicial . Se incorporaron los 5.801 kanji.

El futuro

Aparte de las aplicaciones mencionadas anteriormente, el estándar JIS X 0212 está efectivamente muerto. 2.743 kanji se incluyeron en el estándar JIS X 0213 posterior . A largo plazo, su contribución probablemente serán los 5.801 kanji que se incorporaron en Unicode .

Ver también

Referencias

  1. ^ van Kesteren, Ana . "5. Índices (§ Índice jis0212)". Estándar de codificación . QUÉ WG .
  2. ^ "Documento informativo de la página de códigos 953". Archivado desde el original el 17 de marzo de 2016.
  3. ^ "Documento informativo CCSID 953". Archivado desde el original el 28 de marzo de 2016.
  4. ^ Página de códigos CPGID 00953 (pdf) (PDF) , IBM
  5. ^ "Documento informativo CCSID 5049". Archivado desde el original el 27 de marzo de 2016.

enlaces externos