La página de códigos 936 de Windows (abreviada MS936 , Windows-936 o ( ambiguamente ) CP936 ), [1] es la codificación de caracteres heredada (pre- Unicode ) de Microsoft para representar texto en chino simplificado en computadoras . Es uno de los cuatro DBCS de Windows para idiomas del este de Asia , que acompaña a las páginas de códigos 932 ( japonés ), 949 ( coreano ) y 950 ( chino tradicional ). Es una variante de la codificación Guójiā Biāozhǔn Kuòzhǎn (GBK) de chino continental , y corresponde aproximadamente a la página de códigos 1386 de IBM ( CP1386 o IBM-1386 ).
Originalmente, Windows-936 cubría GB 2312 (en su forma EUC-CN ), pero se amplió para cubrir la mayor parte de GBK con el lanzamiento de Windows 95. El símbolo del euro (€), no definido en GBK, está codificado como 0x80 en Windows-936 e IBM-1386. Por otro lado, los 95 caracteres definidos en GBK 1.0 inicialmente no se codificaron en Windows-936. Esto se resolvió en parte en versiones posteriores de Windows y, al igual que en Windows 7, todos los caracteres GBK que no están en el Área de uso privado BMP Unicode se pueden mostrar utilizando la página de códigos 936, pero la codificación de los 95 caracteres aún no se admitía a partir de 2014 [actualizar].
La página de códigos 936 de Windows fue reemplazada por la página de códigos 54936 ( GB 18030 ), pero a partir de 2014 [actualizar]todavía prevalecía en uso. La consola de Windows utiliza la página de códigos 936 como la página de códigos predeterminada para las instalaciones en chino simplificado, aunque parte de la GB 18030 se hizo obligatoria para todos los productos de software vendidos en China. En 2002, el nombre de Internet IANA GBK se registró con la asignación de Windows-936, [2] [3] convirtiéndolo en la definición GBK de facto en Internet.
El nombre "página de códigos 936" es ambiguo. La página de códigos 936 de IBM , [4] , una codificación IBM 5550 obsoleta, también es una codificación en chino simplificado, pero utiliza un método de codificación diferente para GB 2312 ( Shift GB ) y, por lo tanto, es completamente incompatible con la página de códigos 936 de Windows (en contraste con la página de códigos 932 de IBM que, en una primera aproximación, [a] es un subconjunto de la página de códigos 932 de Windows ), aunque International Components for Unicode no incluye un códec IBM-936 y utiliza la página de códigos de Windows para la cp936
etiqueta. [1] La página de códigos de IBM para la cobertura GBK es la página de códigos 1386, que se define como una combinación de la página de códigos 1114 de un solo byte y la página de códigos 1385 de dos bytes . [5]
Los conceptos de "Windows-936", "GBK", "GB2312" y "EUC-CN" se confunden a veces en varios productos de software. EUC-CN está registrado en la IANA como GB2312
, aunque es un formato de codificación específico, de ancho variable, de 8 bits y sin estado , de GB 2312 (que también tiene otros formatos de codificación menos utilizados, como HZ-GB-2312 , ISO-2022-CN o el mencionado Shift GB).
Dado que GBK es un superconjunto de EUC-CN (aunque no es en sí un código EUC) y reemplazó a GB 2312 hace mucho tiempo, y dado que el software de Microsoft siguió asignando la GB2312
etiqueta de codificación a la página de códigos 936 incluso después de ampliarla para implementar GBK en lugar de EUC-CN, la mayoría de los productos de software basados en Windows actuales implican un soporte parcial para GBK a través de Windows-936, en lugar de EUC-CN u otros formatos de codificación de GB 2312, cuando utilizan el término "GB 2312" como una opción de codificación de caracteres. Esto se puede observar en productos como Microsoft Internet Explorer y Notepad++.
Ventanas-936:
IBM-1386: