stringtranslate.com

JIS X 0212

JIS X 0212 es una norma industrial japonesa que define un conjunto de caracteres codificados para codificar caracteres complementarios para su uso en japonés. Esta norma tiene como objetivo complementar JIS X 0208 (página de códigos 952). Tiene el número 953 o 5049 como página de códigos de IBM (consulte a continuación).

Es uno de los estándares fuente de los ideogramas unificados CJK de Unicode .

Historia

En 1990, la Asociación Japonesa de Normas (JSA) publicó un estándar de conjunto de caracteres suplementario: JIS X 0212-1990 Código del conjunto de caracteres gráficos japoneses suplementarios para el intercambio de información (情報交換用漢字符号-補助漢字, Jōhō Kōkan'yō Kanji Fugō - Hojo Kanji ) . Este estándar tenía como objetivo desarrollar la gama de caracteres disponibles en el conjunto de caracteres principal JIS X 0208 y abordar las deficiencias en la cobertura de ese conjunto.

Características

Diagrama de Euler que compara los repertorios de JIS X 0208 , JIS X 0212, JIS X 0213 , Windows-31J , el repertorio estándar de Microsoft y Unicode .

El estándar especificó 6.067 caracteres, que comprenden:

Codificaciones

Las siguientes codificaciones o encapsulaciones se utilizan para permitir el uso de caracteres JIS X 0212 en archivos, etc.

No es posible la encapsulación de caracteres JIS X 0212 en la popular codificación Shift JIS , ya que Shift JIS no tiene suficiente espacio de código no asignado para los caracteres.

Implementaciones

Codificación de JIS X 0212 en conformidad con EUC-JP (izquierda) y página de códigos de Windows 20932 (derecha).

IBM denomina a JIS X 0212 página de códigos 953 , que incluye extensiones de proveedores. [2] [3] [4] El CCSID alternativo 5049 excluye estas extensiones. [5]

Como los caracteres JIS X 0212 no se pueden codificar en Shift JIS, el sistema de codificación que tradicionalmente ha dominado el procesamiento de información japonés, se han producido pocas implementaciones prácticas de este conjunto de caracteres. Como se mencionó anteriormente, se puede codificar en EUC-JP, que se utiliza comúnmente en sistemas Unix / Linux , y es aquí donde se han producido la mayoría de las implementaciones:

Muchos navegadores WWW, como la familia Netscape / Mozilla / Firefox , Opera , etc. y aplicaciones relacionadas, como Mozilla Thunderbird, admiten la visualización de caracteres JIS X 0212 en codificación EUC-JP; sin embargo, Internet Explorer no admite caracteres JIS X 0212. Los paquetes de emulación de terminal modernos , como GNOME Terminal, también admiten caracteres JIS X 0212.

Las aplicaciones que admiten JIS X 0212 en la codificación EUC incluyen:

JIS X 0212 y Unicode

Los kanji de JIS X 0212 se tomaron como una de las fuentes para la unificación Han , que condujo al conjunto unificado de caracteres CJK en el estándar inicial ISO 10646 / Unicode . Se incorporaron los 5.801 kanji.

El futuro

Aparte de las aplicaciones mencionadas anteriormente, el estándar JIS X 0212 está prácticamente muerto. 2.743 kanji de él se incluyeron en el estándar JIS X 0213 posterior . A largo plazo, su contribución probablemente se verá en los 5.801 kanji que se incorporaron a Unicode .

Véase también

Referencias

  1. ^ van Kesteren, Ana . "5. Índices (§ Índice jis0212)". Estándar de codificación . QUÉ WG .
  2. ^ "Documento informativo de la página de códigos 953". Archivado desde el original el 17 de marzo de 2016.
  3. ^ "Documento informativo del CCSID 953". Archivado desde el original el 28 de marzo de 2016.
  4. ^ Página de códigos CPGID 00953 (pdf) (PDF) , IBM
  5. ^ "Documento informativo del CCSID 5049". Archivado desde el original el 27 de marzo de 2016.

Enlaces externos