Página de código

En informática , una página de códigos es una codificación de caracteres y, como tal, es una asociación específica de un conjunto de caracteres imprimibles y caracteres de control con números únicos. Normalmente, cada número representa el valor binario en un único byte. (En algunos contextos, estos términos se utilizan con más precisión; consulte Codificación de caracteres § Terminología ).

El término "página de códigos" se originó a partir de los sistemas mainframe basados en EBCDIC de IBM , ^[1] pero Microsoft , SAP , ^[2] y Oracle Corporation ^[3] se encuentran entre los proveedores que utilizan este término. La mayoría de los proveedores identifican sus propios conjuntos de caracteres por un nombre. En el caso de que exista una gran cantidad de conjuntos de caracteres (como en IBM), identificar los conjuntos de caracteres mediante un número es una forma conveniente de distinguirlos. Originalmente, los números de página de códigos se referían a los números de página en el manual de conjuntos de caracteres estándar de IBM, ^[4]^[5]^[6] una condición que no se ha mantenido durante mucho tiempo. Los proveedores que utilizan un sistema de página de códigos asignan su propio número de página de códigos a una codificación de caracteres, incluso si es más conocida por otro nombre; por ejemplo, a UTF-8 se le han asignado los números de página 1208 en IBM, 65001 en Microsoft y 4110 en SAP.

Hewlett-Packard utiliza un concepto similar en su sistema operativo HP-UX y su protocolo Printer Command Language ^{[7] (PCL) para impresoras (ya sea para impresoras HP o no). Sin embargo, la terminología es diferente: lo que otros llaman un}conjunto de caracteres , HP lo llama un conjunto de símbolos , y lo que IBM o Microsoft llaman una página de códigos , HP lo llama un código de conjunto de símbolos . HP desarrolló una serie de conjuntos de símbolos, ^[8]^[9] cada uno con un código de conjunto de símbolos asociado, para codificar tanto sus propios conjuntos de caracteres como los conjuntos de caracteres de otros proveedores.

La multitud de conjuntos de caracteres lleva a muchos proveedores a recomendar Unicode .

El sistema de numeración de páginas de códigos

IBM introdujo el concepto de asignar sistemáticamente un número pequeño, pero globalmente único, de 16 bits a cada codificación de caracteres que un sistema informático o un conjunto de sistemas informáticos pudiera encontrar. El origen de IBM del esquema de numeración se refleja en el hecho de que los números más pequeños (los primeros) se asignan a variaciones de la codificación EBCDIC de IBM y los números ligeramente más grandes se refieren a variaciones de la codificación ASCII extendida de IBM , tal como se utiliza en su hardware para PC.

Con el lanzamiento de la versión 3.3 de PC DOS (y la casi idéntica MS-DOS 3.3) IBM introdujo el sistema de numeración de páginas de códigos a los usuarios habituales de PC, ya que los números de páginas de códigos (y la frase "página de códigos") se usaban en nuevos comandos para permitir que la codificación de caracteres utilizada por todas las partes del sistema operativo se estableciera de manera sistemática. ^[10]

Después de que IBM y Microsoft dejaron de cooperar en la década de 1990, las dos empresas han mantenido la lista de números de página de códigos asignados de forma independiente, lo que ha dado lugar a algunas asignaciones conflictivas. Al menos un proveedor externo ( Oracle ) también tiene su propia lista diferente de asignaciones numéricas. ^[3] Las asignaciones actuales de IBM se enumeran en su repositorio CCSID , mientras que las asignaciones de Microsoft están documentadas en MSDN . ^[11] Además, se puede encontrar una lista de los nombres y las abreviaturas aproximadas de IANA ( Internet Assigned Numbers Authority ) para las páginas de códigos instaladas en cualquier máquina Windows en el Registro de esa máquina (esta información es utilizada por programas de Microsoft como Internet Explorer ).

La mayoría de las páginas de códigos conocidas, excluidas las de los idiomas CJK y vietnamita , ajustan todos sus puntos de código en ocho bits y no implican nada más que asignar cada punto de código a un solo carácter; además, no se utilizan técnicas como combinación de caracteres, escrituras complejas, etc.

El modo de texto del hardware gráfico estándar de PC ( compatible con VGA ) se basa en el uso de una página de códigos de 8 bits, aunque es posible utilizar dos a la vez con cierto sacrificio de profundidad de color, y se pueden almacenar hasta ocho en el adaptador de pantalla para facilitar la conmutación. ^[12] Había una selección de fuentes de páginas de códigos de terceros que se podían cargar en dicho hardware. Sin embargo, ahora es habitual que los proveedores de sistemas operativos proporcionen sus propios sistemas de codificación y representación de caracteres que se ejecutan en un modo gráfico y evitan por completo esta limitación del hardware. Sin embargo, el sistema de referencia a las codificaciones de caracteres por un número de página de códigos sigue siendo aplicable, como una alternativa eficiente a los identificadores de cadena como los especificados por la IETF y la IANA para su uso en varios protocolos como el correo electrónico y las páginas web.

Relación con ASCII

La mayoría de las páginas de códigos que se utilizan actualmente son superconjuntos de ASCII , un código de 7 bits que representa 128 códigos de control y caracteres imprimibles. En el pasado lejano, las implementaciones de 8 bits del código ASCII establecían el bit superior en cero o lo utilizaban como bit de paridad en las transmisiones de datos de red. Cuando el bit superior estuvo disponible para representar datos de caracteres, se pudieron representar un total de 256 caracteres y códigos de control. La mayoría de los proveedores (incluido IBM) utilizaron este rango extendido para codificar caracteres utilizados por varios idiomas y elementos gráficos que permitían la imitación de gráficos primitivos en dispositivos de salida de solo texto. No existía un estándar formal para estos "conjuntos de caracteres ASCII extendidos" y los proveedores se referían a las variantes como páginas de códigos, como IBM siempre había hecho para las variantes de las codificaciones EBCDIC.

Relación con Unicode

Unicode es un esfuerzo por incluir todos los caracteres de todos los idiomas humanos utilizados en la actualidad e históricamente en una única enumeración de caracteres (efectivamente, una única página de códigos grande), eliminando la necesidad de distinguir entre diferentes páginas de códigos al manejar texto almacenado digitalmente. Unicode intenta mantener la compatibilidad con versiones anteriores de muchas páginas de códigos heredadas, copiando algunas páginas de códigos 1:1 en el proceso de diseño. Un objetivo de diseño explícito de Unicode era permitir la conversión de ida y vuelta entre todas las páginas de códigos heredadas comunes, aunque este objetivo no siempre se ha logrado. Algunos proveedores, a saber, IBM y Microsoft, han asignado anacrónicamente números de página de códigos a las codificaciones Unicode. Esta convención permite que los números de página de códigos se utilicen como metadatos para identificar el algoritmo de decodificación correcto cuando se encuentran datos binarios almacenados.

Páginas de códigos de IBM

Páginas de códigos basadas en EBCDIC

IBM utiliza estas páginas de códigos en sus conjuntos de caracteres EBCDIC para computadoras mainframe . ^[13]

1 – EE. UU. WP, original
2 – Estados Unidos
3 – Contabilidad de EE. UU., versión A
4 – Estados Unidos
5 – Estados Unidos
6 – América Latina
7 – Alemania FR / Austria
8 – Alemania FR
9 – Francia, Bélgica
10 – Canadá (inglés)
11 – Canadá (francés)
12 – Italia
13 – Países Bajos
14 – España
15 – Suiza (Francés)
16 – Suiza (francés/alemán)
17 – Suiza (alemán)
18 – Suecia / Finlandia
19 – Paquete de trabajo Suecia/Finlandia, versión 2
20 – Dinamarca/Noruega
21 – Brasil
22 – Portugal
23 – Reino Unido
24 – Reino Unido
25 – Japón (latín)
26 – Japón (latín)
27 – Grecia (latín)
29 – Islandia
30 – Turquía
31 – Sudáfrica
32 – Checoslovaquia (checo/eslovaco)
33 – Checoslovaquia
34 – Checoslovaquia
35 – Rumania
36 – Rumania
37 – EE. UU./Canadá - CECP (igual que el euro: 1140)
37-2 – La página de códigos APL 3279 real, tal como la utiliza C/370. Es muy parecida a 1047, excepto por el signo de intercalación y el signo de no-signal invertidos. IBM no la reconoce oficialmente, aunque SHARE ha señalado su existencia. ^[14]
38 – ASCII de EE. UU.
39 – Reino Unido / Israel
40 – Reino Unido
251 – China
252 – Polonia
254 – Hungría
256 – Internacional nº 1 (reemplazado por el nº 500)
257 – Internacional #2
258 – Internacional #3
259 – Símbolos, Serie 7
260 – Francés canadiense - 116
264 – Tren de impresión y procesamiento de texto ampliado
273 – Alemania FR/Austria - CECP (igual que el euro: 1141)
274 – Página de códigos de la antigua Bélgica
275 – Brasil – CECP
276 – Canadá (Francés) - 94
277 – Dinamarca, Noruega – CECP (igual que el euro: 1142)
278 – Finlandia, Suecia – CECP (igual que el euro: 1143)
279 – Francés - 94 ^[14]
280 – Italia – CECP (igual que el euro: 1144)
281 – Japón (latín) – CECP
282 – Portugal – CECP
283 – España – 190 ^[14]
284 – España/América Latina – CECP (igual que el euro: 1145)
285 – Reino Unido – CECP (igual que el euro: 1146)
286 – Austria / Alemania FR Alternativa
287 – Dinamarca / Noruega Alternativa
288 – Finlandia / Suecia Alternativa
289 – España Alternativa
290 – Japonés (Katakana) Ampliado
293 – APL
297 – Francia (igual que el euro: 1147) ^[14]
298 – Japón (Katakana)
300 – DBCS japonés (Kanji) (para JIS X 0213)
310 – Escape gráfico APL/TN
320 – Hungría
321 – Yugoslavia
322 – Turquía
330 – Internacional #4
340 – EBCDIC, OCR (igual que 893, reemplazado por 892 y 893)
351 – GDDM predeterminado
352 – Opción de impresión y publicación
353 – BCDIC-A
354 – BCDIC-B
355 – Opción estándar PTTC/BCD
357 – Opción PTTC/BCD H
358 – Opción de correspondencia PTTC/BCD
359 – Opción monocasco PTTC/BCD
360 – Opción de carcasa doble PTTC/BCD
361 – EBCDIC Publicaciones Internacionales
363 – Símbolos, conjunto 8
382 – EBCDIC Publishing Austria, Alemania FR Alternativa
383 – EBCDIC Publishing Bélgica
384 – EBCDIC Publishing Brasil
385 – EBCDIC Publishing Canada (en francés)
386 – EBCDIC Publishing Dinamarca, Noruega
387 – EBCDIC Publishing Finlandia, Suecia
388 – Ediciones EBCDIC Francia
389 – Editorial EBCDIC Italia
390 – EBCDIC Publishing Japón (Latín)
391 – EBCDIC Publicaciones Portugal
392 – EBCDIC Publishing España, Filipinas
393 – EBCDIC Publishing Latinoamérica (de habla hispana)
394 – EBCDIC Publishing China (Hong Kong), Reino Unido, Irlanda
395 – EBCDIC Publishing Australia, Nueva Zelanda, EE. UU., Canadá (inglés)
396 – Ofertas especiales de BookMaster
410 – Cirílico (revisiones: 880, 1025, 1154)
420 – Árabe
421 – Magreb/Francés
423 – Griego (reemplazado por 875)
424 – Hebreo (Código del Boletín)
425 – Árabe/Latín para OS/390 Open Edition
435 – Teletexto isomorfo
500 – Internacional #5 (ECECP; reemplaza al 256) (igual que el euro: 1148)
803 – Conjunto de caracteres hebreos A (Código antiguo)
829 – Símbolos matemáticos del host – Publicación
830 – Formato matemático
831 – Portugal (Alternativa) (igual que 37)
833 – Coreano ampliado (SBCS)
834 – Hangul coreano (KSC5601; DBCS con UDC)
835 – DBCS chino tradicional
836 – Chino simplificado ampliado
837 – DBCS chino simplificado
838 – Tailandés con marcas bajas y caracteres acentuados (igual que el euro: 1160)
839 – DBCS tailandés
870 – Latín 2 (igual que el euro: 1153) (revisión: 1110)
871 – Islandia (igual que el euro: 1149) ^[14]
875 – Griego (reemplaza a 423)
880 – Cirílico (revisión de 410) (revisiones: 1025, 1154)
881 – Estados Unidos – Sistema gráfico 5080
882 – Reino Unido – Sistema gráfico 5080
883 – Suecia – Sistema gráfico 5080
884 – Alemania – Sistema gráfico 5080
885 – Francia – Sistema gráfico 5080
886 – Italia – Sistema gráfico 5080
887 – Japón – Sistema gráfico 5080
888 – Francia AZERTY - Sistema gráfico 5080
889 – Tailandia
890 – Yugoslavia
892 – EBCDIC, OCR A
893 – EBCDIC, OCR B
905 – Latín 3
918 – Urdu Bilingüe
924 – Latín 9
930 – Japón MIX (290 + 300) (igual que el euro: 1390)
931 – MIX Japón (37 + 300)
933 – Corea MIX (833 + 834) (igual que el euro: 1364)
935 – Chino simplificado MIX (836 + 837) (igual que el euro: 1388)
937 – MEZCLA tradicional china (37 + 835) (igual que el euro: 1371)
939 – Japón MIX (1027 + 300) (igual que el euro: 1399)
1001 – MICR
1002 – Compatibilidad con EBCDIC DCF versión 2
1003 – EBCDIC DCF, subconjunto de texto de EE. UU.
1005 – Comunicación de texto isomorfo EBCDIC
1007 – EBCDIC árabe (XCOM2)
1024 – EBCDIC T.61
1025 – Cirílico, multilingüe (igual que el euro: 1154) (Revisión de 880)
1026 – EBCDIC Turquía (Latin 5) (igual que el euro: 1155) (reemplaza al 905 en ese país)
1027 – Japonés (latín) extendido (JIS X 0201 extendido)
1028 – Publicación EBCDIC en hebreo
1030 – Japonés (Katakana) Ampliado
1031 – Japonés (Latín) Ampliado
1032 – MICR, E13-B Combinado
1033 – MICR, CMC-7 Combinado
1037 – Corea – Sistema gráfico 5080/6090
1039 – Compatibilidad con GML
1047 – Latín 1/Sistemas abiertos ^[14]
1068 – Compatibilidad con DCF
1069 – Latín 4
1070 – Versión 0 para EE. UU. y Canadá (página de código 37, versión 0)
1071 – Alemania FR / Austria (página de código 273 versión 0)
1072 – Bélgica (Código de página 274 Versión 0)
1073 – Brasil (Código de página 275 Versión 0)
1074 – Dinamarca, Noruega (página de código 277 versión 0)
1075 – Finlandia, Suecia (página de código 278 versión 0)
1076 – Italia (Código de página 280 Versión 0)
1077 – Japón (Latín) (Código de página 281 Versión 0)
1078 – Portugal (Código de página 282 Versión 0)
1079 – España / Latinoamérica Versión 0 (Página de código 284 Versión 0)
1080 – Reino Unido (página de código 285 versión 0)
1081 – Francia Versión 0 (Página de código 297 Versión 0)
1082 – Israel (hebreo)
1083 – Israel (hebreo)
1084 – Versión internacional n.° 5 0 (página de código 500 versión 0)
1085 – Islandia (página de código 871 versión 0)
1087 – Conjunto de símbolos
1091 – Símbolos modificados, serie 7
1093 – Logotipo de IBM ^[15]
1097 – Bilingüe persa
1110 – Latín 2 (Revisión de 870)
1112 – Báltico multilingüe (igual que el euro: 1156)
1113 – Latín 6
1122 – Estonia (igual que el euro: 1157)
1123 – Cirílico, Ucrania (igual que el euro: 1158)
1130 – Vietnamita (igual que el euro: 1164)
1132 – Laos EBCDIC
1136 – Katakana de Hitachi
1137 – Devanagari EBCDIC
1140 – EE. UU., Canadá, etc. ECECP (lo mismo sin euro: 37) (versión en chino tradicional: 1159)
1141 – Austria, Alemania ECECP (lo mismo sin euro: 273)
1142 – Dinamarca, Noruega ECECP (lo mismo sin euro: 277)
1143 – Finlandia, Suecia ECECP (lo mismo sin euro: 278)
1144 – Italia ECECP (lo mismo sin el euro: 280)
1145 – España, América Latina (español) ECECP (lo mismo sin euro: 284)
1146 – ECECP del Reino Unido (lo mismo sin el euro: 285)
1147 – Francia ECECP con euro (lo mismo sin euro: 297)
1148 – ECECP internacional con euros (lo mismo sin euros: 500)
1149 – ECECP islandés con euro (lo mismo sin euro: 871)
1150 – Coreano ampliado con caracteres de recuadro
1151 – Chino simplificado ampliado con caracteres de recuadro
1152 – Chino tradicional ampliado con caracteres de recuadro
1153 – Latín 2 Multilingüe con euro (lo mismo sin euro: 870)
1154 – Cirílico, multilingüe con euro (lo mismo sin euro: 1025; una versión más antigua es * 1166)
1155 – Turquía con euro (lo mismo sin euro: 1026) (lo mismo con lira: 1175)
1156 – Baltic Multi con euro (lo mismo sin euro: 1112)
1157 – Estonia con euro (lo mismo sin euro: 1122)
1158 – Cirílico, Ucrania con euro (lo mismo sin euro: 1123)
1159 – T-Chinese EBCDIC (actualización del euro chino tradicional de *1140)
1160 – Tailandés con signos bajos y caracteres acentuados con euro (lo mismo sin euro: 838)
1164 – Vietnamita con euro (lo mismo sin euro: 1130)
1165 – Latín 2/Sistemas abiertos
1166 – Cirílico kazajo
1175 – Turquía con euro y lira (lo mismo sin lira: 1155)
1278 – Codificación estándar EBCDIC de Adobe (PostScript)
1279 – Host Katakana japonés Hitachi ^[6]
1300 – Código de barras genérico/OCR-B
1301 – Código Postal + 4 Código de Barras POSTNET
1302 – Marcas de identificación de frente
1303 – Código de barras EBCDIC
1364 – Corea MIX (833 + 834 + euro) (lo mismo sin euro: 933)
1371 – MIX chino tradicional (1159 + 835) (lo mismo sin el euro: 937)
1376 – Extensión de host DBCS en chino tradicional para HKSCS
1377 – Hospedador mixto HKSCS en crecimiento (37 + 1376)
1378 – Extensión de host DBCS de chino tradicional para HKSCS y chino simplificado (superconjunto de 1376)
1379 – Hospedador mixto HKSCS y cultivo en chino simplificado (37 + 1378) (superconjunto de 1377)
1388 – Chino simplificado MIX (lo mismo sin euro: 935) (836 + 837 + euro)
1390 – Chino simplificado MIX Japón MIX (lo mismo sin euros: 930) (290 + 300 + euros)
1399 – Japón MIX (1027 + 300 + euros) (lo mismo sin euros: 939)

Páginas de códigos DOS

Estas páginas de códigos son utilizadas por IBM en su sistema operativo PC DOS . Estas páginas de códigos originalmente estaban incorporadas directamente en el hardware de modo texto de los adaptadores gráficos utilizados con IBM PC y sus clones, incluidos los adaptadores MDA y CGA originales cuyos conjuntos de caracteres solo se podían cambiar reemplazando físicamente un chip ROM que contenía la fuente. La interfaz de esos adaptadores (emulados por todos los adaptadores posteriores, como VGA) estaba limitada típicamente a conjuntos de caracteres de un solo byte con solo 256 caracteres en cada fuente/codificación (aunque VGA agregó soporte parcial para conjuntos de caracteres ligeramente más grandes).

301 – IBM-PC Japón (Kanji) DBCS
437 – Página de códigos de hardware del IBM PC original
720 – Árabe (OSMO transparente)
737 – Griego
775 – Latín-7
808 – Ruso con euro (lo mismo sin euro: 866 )
848 – Ucraniano con euro (lo mismo sin euro: 1125 )
849 – Bielorruso con euro (igual sin euro: 1131 )
850 – Latín-1
851 – Griego
852 – Latín-2
853 – Latín-3
855 – Cirílico (igual que el euro: 872 )
856 – Hebreo
857 – Latín-5
858 – Latin-1 con símbolo del euro
859 – Latín-9
860 – Portugués
861 – Islandés
862 – Hebreo
863 – Francés canadiense
864 – Árabe
865 – Danés / Noruego
866 – Bielorruso, ruso, ucraniano (igual que el euro: 808 )
867 – Hebreo + euro (basado en CP862) (ID conflictiva: NEC checo (Kamenický) , que se creó antes de esta página de códigos)
868 – Urdú
869 – Griego
872 – Cirílico con euro (lo mismo sin euro: 855 )
874 – Tailandés con marcas de tono bajo y caracteres antiguos (ID conflictiva con Windows 874; versión con euro: 1161 Versión de Windows: es IBM 1162 )
876 – OCR A
877 – OCR B
878 – KOI8-R
891 – SBCS de PC de Corea
898 – IBM-PC WP Multilingüe
899 – Símbolo de IBM-PC
903 – SBCS de PC en chino simplificado
904 – SBCS de PC en chino tradicional
906 – Serie internacional n.° 5 3812/3820
907 – Código ASCII APL (3812)
909 – IBM-PC APL2 ampliado
910 – IBM PC APL2
911 – IBM-PC Japón n.° 1
926 – DBCS de PC coreano
927 – PC DBCS chino tradicional
928 – DBCS de PC en chino simplificado
929 – DBCS de PC tailandés
932 – IBM-PC Japan MIX (DOS/V) (DBCS) ( 897 + 301 ) (ID conflictiva con Windows 932; la versión de Windows es IBM 943)
934 – IBM-PC Korea Mix (DOS/V) (DBCS) ( 891 + 926 )
936 – IBM-PC Simplified Chinese MIX (gb2312) (DOS/V) (DBCS) ( 903 + 928 ) (ID conflictiva con Windows 936; la versión de Windows es IBM 1386)
938 – IBM-PC chino tradicional MIX (DOS/V, OS/2) ( 904 + 927)
942 – IBM-PC Japan MIX (SAA japonesa (OS/2)) ( 1041 + 301 )
943 – IBM-PC Japón ABIERTO ( 897 + 941 ) (Windows CP 932)
944 – IBM-PC Korea MIX (SAA coreano (OS/2)) ( 1040 + 926 )
946 – IBM-PC Chino simplificado (chino simplificado SAA (OS/2)) ( 1042 + 928 )
948 – IBM-PC Chino tradicional (chino tradicional SAA (OS/2)) ( 1043 + 927)
949 – Coreano (Wansung extendido (ks_c_5601-1987)) ( 1088 + 951 ) (ID conflictiva con Windows 949 (Código Hangul unificado); la versión de Windows es IBM 1363)
951 – DBCS coreano (código IBM KS) (identificación conflictiva con Windows 951, un hack de Windows 950 con asignaciones Unicode para algunos caracteres Unicode no deseados encontrados en HKSCS, según el nombre del archivo)
1034 – Aplicación de impresora: etiqueta de envío, juego n.° 2
1040 – Coreano extendido
1041 – Japonés extendido (JIS X 0201 extendido)
1042 – Chino simplificado ampliado
1043 – Chino tradicional ampliado
1044 – Aplicación de impresora: etiqueta de envío, juego n.° 1
1086 – IBM-PC Japón n.° 1
1088 – Versión coreana revisada (SBCS)
1092 – Símbolos modificados de IBM-PC
1098 – Persa
1108 – Compatibilidad de la base DITROFF
1109 – Compatibilidad de productos especiales DITROFF
1115 – IBM-PC República Popular China
1116 – Estonio
1117 – Letón
1118 – Lituano (implementación de IBM de la página de códigos 774 de Lika )
1119 – Lituano y ruso (implementación de IBM de la página de códigos 772 de Lika )
1125 – Cirílico, ucraniano (igual que el euro: 848 ) (modificación de IBM de RUSCII)
1127 – IBM-PC Árabe/Francés
1131 – Datos de IBM-PC, cirílico, bielorruso (igual que el euro: 849 )
1139 – Katakana alfanumérico de Japón
1161 – Tailandés con marcas de tono bajo y caracteres antiguos con euro (lo mismo sin euro: 874 )
1167 – KOI8-RU
1168 – KOI8-U
1370 – Chino tradicional MIX ( codificación Big5 ) ( 1114 + 947 + euro) (lo mismo sin euro: 950 )
1380 – IBM-PC Versión simplificada en chino GB PC-DATA (DBCS PC IBM GB 2312-80)
1381 – IBM-PC en chino simplificado ( 1115 + 1380 )
1393 – Norma japonesa JIS X 0213 DBCS
1394 – IBM-PC Japón (JIS X 0213) ( 897 + 1393)

Cuando se trabaja con hardware, protocolos y formatos de archivo más antiguos, a menudo es necesario soportar estas páginas de códigos, pero se recomiendan sistemas de codificación más nuevos, en particular Unicode, para diseños nuevos.

Las páginas de códigos DOS normalmente se almacenan en archivos .CPI. ^[16]^[17]^[18]^[19]^[20]

Páginas de códigos de IBM AIX

Estas páginas de códigos son utilizadas por IBM en su sistema operativo AIX y emulan varios conjuntos de caracteres, concretamente aquellos diseñados para su uso según la norma ISO, como los sistemas operativos tipo UNIX.

367 – Código ASCII estadounidense de 7 bits
371 – Código de barras APL US-ASCII de 7 bits
806 – Código CICI
813 – ISO 8859-7
819 – ISO 8859-1
895 – Latín japonés de 7 bits
896 – Katakana japonés de 7 bits ampliado
901 – ISO 8859-13 con euro (posteriormente ampliada) (lo mismo sin euro: 921 )
902 – ISO Estonia con euro (igual sin euro: 922 )
912 – ISO 8859-2 (ampliada en 1999)
913 – ISO 8859-3
914 – ISO 8859-4
915 – ISO 8859-5 (ampliada después de 1995)
916 – ISO 8859-8
919 – ISO 8859-10
920 – ISO 8859-9
921 – ISO 8859-13 (ampliada después de 1995) (igual que el euro: 901 )
922 – ISO estonio (igual que el euro: 902 )
923 – ISO 8859-15
952 – EUC japonés para JIS X 0208
953 – EUC japonés para JIS X 0212
954 – EUC Japonés ( 895 + 952 + 896 + 953 )
955 – TCP Japonés, JIS X 0208-1978
956 – TCP japonés ( 895 + 952 + 896 + 953 )
957 – TCP japonés ( 895 + 955 + 896 + 953 )
958 – TCP japonés ( 367 + 952 + 896 + 953 )
959 – TCP japonés ( 367 + 955 + 896 + 953 )
960 – Conjunto primario DBCS-EUC SICGCC chino tradicional (primer plano)
961 – Conjunto completo de DBCS-EUC SICGCC en chino tradicional + IBM Select + UDC
963 – TCP chino tradicional, CNS 11643, plano 2 únicamente
964 – EUC Chino tradicional ( 367 + 960 + 961)
965 – TCP Chino tradicional ( 367 + 960 + 963)
970 – EUC coreano ( 367 + 971 )
971 – EUC DBCS coreano (G1, KSC 5601 1989 (incluido 188 UDC))
1006 – Urdu ISO de 8 bits
1008 – ISO árabe de 8 bits
1009 – IRV ISO de 7 bits
1010 – Francia de 7 bits
1011 – 7 bits Alemania FR
1012 – Italia de 7 bits
1013 – Reino Unido de 7 bits
1014 – España de 7 bits
1015 – Portugal de 7 bits
1016 – Noruega de 7 bits
1017 – Dinamarca de 7 bits
1018 – Finlandia/Suecia de 7 bits
1019 – Países Bajos de 7 bits
1029 – Árabe ampliado
1036 – CCITT T.61
1046 – Árabe extendido (Euro)
1089 – ISO 8859-6
1111 – Variante de la norma ISO 8859-2
1124 – ISO ucraniano, similar a ISO 8859-5
1129 – ISO vietnamita (igual que el euro: 1163 )
1133 – Norma ISO Lao
1163 – ISO vietnamita con euro (lo mismo sin euro: 1129 )
1350 – EUC japonés (JISeucJP) ( 367 + 952 + 896 + 953 )
1382 – EUC Chino simplificado (DBCS PC GB 2312-80)
1383 – EUC Chino simplificado ( 367 + 1382 )

La página de códigos 819 es idéntica a la de Latin-1, ISO/IEC 8859-1 y, con comandos ligeramente modificados, permite que las máquinas MS-DOS utilicen esa codificación. Se utilizaba con las minicomputadoras IBM AS/400.

Páginas de códigos de IBM OS/2

IBM utiliza estas páginas de códigos en su sistema operativo OS/2 .

1004 – Latin-1 Extended, publicación de escritorio/Windows ^[21]

Páginas de códigos de emulación de Windows

IBM utiliza estas páginas de códigos para emular los conjuntos de caracteres de Microsoft Windows . La mayoría de estas páginas de códigos tienen el mismo número que las páginas de códigos de Microsoft, aunque no son exactamente idénticas. Sin embargo, algunas páginas de códigos son nuevas de IBM, no ideadas por Microsoft.

897 – IBM-PC SBCS Japonés (JIS X 0201-1976)
941 – IBM-PC DBCS japonés para entorno abierto
947 – IBM-PC DBCS para ( codificación Big5 )
950 – Chino tradicional MIX ( codificación Big5 ) ( 1114 + 947 ) (igual que el euro: 1370 )
1114 – IBM-PC SBCS (chino simplificado; GBK ; chino tradicional; codificación Big5 )
1126 – IBM-PC SBCS coreano
1162 – Windows Thai (extensión de 874 ; pero aún se llama así en Windows)
1169 – Windows cirílico asiático
1174 – Ventanas kazajas ^[22]
1250 – Windows Europa Central
1251 – Cirílico de Windows
1252 – Ventanas occidentales
1253 – Ventanas griegas
1254 – Windows en turco
1255 – Hebreo de Windows
1256 – Windows árabe
1257 – Ventanas Bálticas
1258 – Windows vietnamita
1360 – DBCS JOHAB coreano
1361 – Coreano (JOHAB)
1362 – Hangul coreano DBCS
1363 – Windows coreano ( 1126 + 1362 ) (Windows CP 949)
1372 – Codificación Big5 en chino de IBM-PC MS T (especial para DB2)
1373 – Windows chino tradicional (extensión de 950 )
1374 – Extensión de codificación IBM-PC DB Big5 para HKSCS
1375 – Extensión de codificación Big5 mixta para HKSCS (pensada para coincidir con 950 )
1385 – IBM-PC DBCS chino simplificado (CS creciente para GB18030, también utilizado para GBK PC-DATA).
1386 – IBM-PC GBK en chino simplificado ( 1114 + 1385 ) (Windows CP 936)
1391 – Chino simplificado de 4 bytes (CS en crecimiento para GB18030, también utilizado para GBK PC-DATA).
1392 – IBM-PC chino simplificado MIX ( 1252 + 1385 + 1391)

Páginas de códigos de emulación de Macintosh

IBM utiliza estas páginas de códigos al emular los conjuntos de caracteres de Apple Macintosh .

1275 – Manzana Romana
1280 – Manzana griega
1281 – Manzana Turca
1282 – Manzana de Europa Central
1283 – Cirílico de manzana
1284 – Manzana croata
1285 – Manzana rumana
1286 – Manzana islandesa

Páginas de códigos de emulación de Adobe

IBM utiliza estas páginas de códigos al emular los conjuntos de caracteres de Adobe .

1038 – Codificación de símbolos de Adobe
1276 – Codificación estándar de Adobe (PostScript)
1277 – Adobe (PostScript) Latín 1

Páginas de códigos de emulación de HP

IBM utiliza estas páginas de códigos al emular los conjuntos de caracteres de HP .

1050 – Extensión romana HP
1051 – HP Roman-8
1052 – HP Gótico Legal
1053 – HP Gothic-1 (casi igual que ISO 8859-1 )
1054 – HP ASCII
1055 – Línea de PC HP
1056 – Dibujo de línea HP
1057 – HP PC-8 (casi igual que la página de códigos 437 )
1058 – HP PC-8DN ( no es lo mismo que la página de códigos 865 )
1351 – Conjunto de caracteres DBCS HP japoneses
5039 – Mezcla japonesa ( 1041 + 1351)

Páginas de códigos de emulación DEC

IBM utiliza estas páginas de códigos al emular los conjuntos de caracteres DEC .

1020 – Conjunto NRC canadiense (francés) de 7 bits
1021 – Conjunto NRC de Suiza de 7 bits
1023 – Conjunto NRC en español de 7 bits
1090 – Conjunto de caracteres especiales y dibujos lineales
1100 – DEC Multinacional
1101 – Conjunto NRC británico de 7 bits
1102 – Conjunto de códigos NRC holandeses de 7 bits
1103 – Conjunto NRC finlandés de 7 bits
1104 – Conjunto NRC francés de 7 bits
1105 – Conjunto NRC noruego/danés de 7 bits
1106 – Conjunto NRC sueco de 7 bits
1107 – NRC noruego/danés alternativo de 7 bits
1287 – Dic Griego
1288 – Dic. Turco

Páginas de códigos Unicode de IBM

1200 – UTF-16BE Unicode ( big-endian ) con área de uso privado (PUA) de IBM ^[23]
1201 – UTF-16BE Unicode ( big-endian ) ^[23]
1202 – UTF-16LE Unicode ( little-endian ) con IBM PUA ^[23]
1203 – Unicode UTF-16LE ( little-endian ) ^[23]
1208 – UTF-8 Unicode con IBM PUA ^[23]
1209 – Código Unicode UTF-8 ^[23]
1400 – ISO 10646 UCS-BMP (basado en Unicode 6.0) ^[23]
1401 – ISO 10646 UCS-SMP (Basado en Unicode 6.0) ^[23]
1402 – ISO 10646 UCS-SIP (Basado en Unicode 6.0) ^[23]
1414 – ISO 10646 UCS-SSP (Basado en Unicode 4.0) ^[23]
1445 – IBM AFP PUA N.º 1
1446 – ISO 10646 UCS-PUP15 (Basado en Unicode 4.0) ^[23]
1447 – ISO 10646 UCS-PUP16 (Basado en Unicode 4.0) ^[23]
1448 – UCS-BMP (CDU genérico)
1449 – PUA predeterminada de IBM

Páginas de códigos de Microsoft

Páginas de códigos de Windows

Estas páginas de códigos son utilizadas por Microsoft en su propio sistema operativo Windows. Microsoft definió una serie de páginas de códigos conocidas como páginas de códigos ANSI (ya que la primera, 1252, se basó en un borrador apócrifo ANSI de lo que se convirtió en ISO 8859-1 ). La página de códigos 1252 se basa en ISO 8859-1 pero utiliza el rango 0x80-0x9F para caracteres imprimibles adicionales en lugar de los códigos de control C1 de ISO 6429 mencionados por ISO 8859-1. ^[24] Algunas de las otras se basan en parte en otras partes de ISO 8859, pero a menudo se reorganizan para acercarlas a 1252.

42 – Símbolo de Windows
874 – Windows tailandés
1250 – Windows Europa Central
1251 – Cirílico de Windows
1252 – Ventanas occidentales
1253 – Ventanas griegas
1254 – Windows en turco
1255 – Hebreo de Windows
1256 – Windows árabe
1257 – Ventanas Bálticas
1258 – Windows vietnamita

Microsoft recomienda que las nuevas aplicaciones utilicen UTF-8 o UCS-2/UTF-16 en lugar de estas páginas de códigos. ^[25]

Páginas de códigos DBCS

Estas páginas de códigos representan codificaciones de caracteres DBCS para varios idiomas CJK. En los sistemas operativos de Microsoft, se utilizan como páginas de códigos "OEM" y "Windows" para la configuración regional correspondiente.

932 – Admite el formato Shift-JIS japonés
936 – Admite chino simplificado GBK
949 – Admite el código Hangul unificado de Corea
950 – Compatible con chino tradicional Big5

Páginas de códigos MS-DOS

Estas páginas de códigos son utilizadas por Microsoft en su sistema operativo MS-DOS. Microsoft se refiere a ellas como páginas de códigos OEM porque fueron definidas por los fabricantes de equipos originales que licenciaron MS-DOS para su distribución con su hardware, no por Microsoft ni por una organización de estándares. La mayoría de estas páginas de códigos tienen el mismo número que las páginas de códigos equivalentes de IBM, aunque algunas no son exactamente idénticas. ^[26]

708 – Árabe (ASMO 708)
709 – Árabe ( ASMO 449+ /BCON V4)
710 – Árabe (Árabe transparente)
720 – Árabe (OSMO transparente)
737 – Griego
850 – Latín-1
851 – Griego
852 – Latín-2
855 – Cirílico
857 – Latín-5
858 – Latin-1 con símbolo del euro
859 – Latín-9
860 – Portugués
861 – Islandés
862 – Hebreo
863 – Francés canadiense
864 – Árabe
865 – Danés / Noruego
866 – Bielorruso, ruso, ucraniano
869 – Griego

Páginas de códigos de emulación de Macintosh

Microsoft utiliza estas páginas de códigos al emular los conjuntos de caracteres de Apple Macintosh .

10000 - Apple Macintosh Roman
10001 - Manzana japonesa
10002 - Manzana tradicional china (Big5)
10003 - Manzana coreana
10004 - Manzana árabe
10005 - Manzana Hebrea
10006 - Manzana griega
10007 - Apple Macintosh Cirílico
10008 - Apple chino simplificado (GB 2312)
10010 - Manzana rumana
10017 - Manzana ucraniana
10021 - Manzana tailandesa
10029 - Apple Macintosh Europa Central
10079 - Manzana islandesa
10081 - Manzana Turca
10082 - Manzana croata

Varias otras páginas de códigos de Microsoft

Los siguientes números de páginas de códigos son específicos de Microsoft Windows. IBM puede utilizar números diferentes para estas páginas de códigos. Emulan varios conjuntos de caracteres, concretamente aquellos diseñados para usarse de acuerdo con la norma ISO, ^{[ aclaración necesaria ]} como los sistemas operativos tipo UNIX.

20000 – Sistema nervioso central chino tradicional
20001 – TCA chino tradicional
20002 – ETEN chino tradicional
20003 – IBM5500 en chino tradicional
20004 – Teletexto en chino tradicional
20005 – Wang chino tradicional
20105 – IRV IA5 de 7 bits ^[27]^[28]^[29] ( CP 1009 )
20106 – IA5 alemán de 7 bits ( DIN 66003 ) ^[27]^[28]^[30]
20107 – IA5 sueco de 7 bits (SEN 850200 C) ^[27]^[28]^[31]
20108 - IA5 de 7 bits noruego (NS 4551-2) ^[27]^[28]^[32]
20127 – Código US-ASCII de 7 bits ^[27]^[28]^[33]
20261 – CCITT T.61
20269 – ISO 6937
20273
20277
20278
20284
20285
20290 - Idioma japonés en EBCDIC
20297
20420
20423
20424
20833
20838
20866 – KOI8-R
20871
20880 – EBCDIC Cirílico (880)
20905
20924
20932 - EUC-JP
20936
20949
21025 – EBCDIC Cirílico (1025)
21027
21866 – KOI8-U
28591 – ISO-8859-1
28592 – ISO-8859-2
28593 – ISO-8859-3
28594 – ISO-8859-4
28595 – ISO-8859-5
28596 – ISO-8859-6
28597 – ISO-8859-7
28598 – ISO-8859-8
28599 – ISO-8859-9
28600 – ISO-8859-10
28601 – ISO-8859-11
28602 – no utilizado (reservado para ISO-8859-12 )
28603 – ISO-8859-13
28604 – ISO-8859-14
28605 – ISO-8859-15
28606 – ISO-8859-16
38596 – ISO-8859-6
38598 – ISO-8859-8

Páginas de códigos Unicode de Microsoft

1200 – Unicode UTF-16LE ( little-endian )
1201 – UTF-16BE Unicode ( big-endian )
12000 – UTF-32LE Unicode ( little-endian )
12001 – UTF-32BE Unicode ( big-endian )
65000 – Código Unicode UTF-7
65001 – Código Unicode UTF-8
65520 – Plano Unicode vacío

Conjuntos de símbolos HP

HP desarrolló una serie de conjuntos de símbolos (cada uno con su código de conjunto de símbolos asociado) para codificar sus propios conjuntos de caracteres o los conjuntos de caracteres de otros proveedores. Normalmente son conjuntos de caracteres de 7 bits que, cuando se trasladan a la parte superior y se asocian con el conjunto de caracteres ASCII, forman conjuntos de caracteres de 8 bits.

Conjuntos de símbolos propios de HP

Conjunto de símbolos 0E — Extensión Roman de HP — conjunto de caracteres de 7 bits con letras acentuadas (codificado por IBM como página de códigos 1050 )
Conjunto de símbolos 0G: HP de 7 bits en alemán
Conjunto de símbolos 0L: línea de PC HP de 7 bits (codificada por IBM como página de códigos 1055 )
Conjunto de símbolos 0M — HP Math-7
Conjunto de símbolos 0T — HP Thai-8
Conjunto de símbolos 1S: HP 7 bits en español
Conjunto de símbolos 1U: HP Gothic Legal de 7 bits (codificado por IBM como página de códigos 1052 )
Conjunto de símbolos 4Q: dibujo de líneas HP (codificado por IBM como página de códigos 1056)
Conjunto de símbolos 4U: HP Roman-9 , Roman-8 + €
Conjunto de símbolos 7J — Computadora de escritorio HP
Conjunto de símbolos 7S: HP 7 bits, español europeo
Conjunto de símbolos 8E — HP East-8
Conjunto de símbolos 8G: HP Greek-8 (basado en IR 088; no en ELOT 927)
Conjunto de símbolos 8H — HP Hebrew-8
Conjunto de símbolos 8I: MS LineDraw (ASCII + HP PC Line)
Conjunto de símbolos 8K: HP Kana-8 (ASCII + Katakana japonés)
Conjunto de símbolos 8L: HP LineDraw (ASCII + HP Line Draw)
Conjunto de símbolos 8M — HP Math-8 (ASCII + HP Math-8)
Conjunto de símbolos 8R: HP Cyrillic-8
Conjunto de símbolos 8S: HP 7 bits, español latinoamericano
Conjunto de símbolos 8T — HP Turkish-8
Conjunto de símbolos 8U: HP Roman-8 (ASCII + extensión HP Roman; codificado por IBM como página de códigos 1051 )
Conjunto de símbolos 8V — HP Arabic-8
Conjunto de símbolos 9K — HP Korean-8
Conjunto de símbolos 9T — PC 8T (también conocido como página de códigos 437-T; esta no es la página de códigos 857 )
Conjunto de símbolos 9V: latín/árabe para Windows ( no se trata de la página de códigos 1256 )
Conjunto de símbolos 11U — PC 8D/N (también conocido como página de códigos 437-N; codificado por IBM como página de códigos 1058 ; esta no es la página de códigos 865 )
Conjunto de símbolos 14G — PC-8 Griego alternativo (también conocido como Página de códigos 437-G; casi lo mismo que la página de códigos 737 )
Conjunto de símbolos 18K —
Conjunto de símbolos 18T —
Conjunto de símbolos del siglo XIX
Conjunto de símbolos 19K —

Conjuntos de símbolos de otros proveedores

Conjunto de símbolos 0D — ISO 60: noruego de 7 bits
Conjunto de símbolos 0F — ISO 25: francés de 7 bits
Conjunto de símbolos 0H: hebreo HP de 7 bits: prácticamente igual que el estándar israelí SI 960
Conjunto de símbolos 0I — ISO 15: italiano de 7 bits
Conjunto de símbolos 0K — ISO 14: Katakana japonés de 7 bits
Conjunto de símbolos 0N: ISO 8859-1 Latin 1 (inicialmente llamado "Gothic-1"; codificado por IBM como página de códigos 1053)
Conjunto de símbolos 0R: ISO 8859-5 latino/cirílico (versión de 1986: IR 111)
Conjunto de símbolos 0S — ISO 11: sueco de 7 bits
Conjunto de símbolos 0U — ISO 6: 7 bits de EE. UU.
Conjunto de símbolos 0V — Árabe
Conjunto de símbolos 1D — ISO 61: noruego de 7 bits
Conjunto de símbolos 1E — ISO 4: 7 bits del Reino Unido
Conjunto de símbolos 1F — ISO 69: francés de 7 bits
Conjunto de símbolos 1G — ISO 21: alemán de 7 bits
Conjunto de símbolos 1K — ISO 13: latín japonés de 7 bits
Conjunto de símbolos 1T: Windows Thai (prácticamente el mismo que 874 )
Conjunto de símbolos 2K — ISO 57: chino latino simplificado de 7 bits
Conjunto de símbolos 2N — ISO 8859-2 Latín 2
Conjunto de símbolos 2S — ISO 17: español de 7 bits
Conjunto de símbolos 2U — ISO 2: versión de referencia internacional de 7 bits
Conjunto de símbolos 3N — ISO 8859-3 Latin 3
Conjunto de símbolos 3R — PC-866 Rusia (prácticamente el mismo que la página de códigos 866 )
Conjunto de símbolos 3S — ISO 10: sueco de 7 bits
Conjunto de símbolos 4N — ISO 8859-4 Latin 4
Conjunto de símbolos 4S — ISO 16: Portugués de 7 bits
Conjunto de símbolos 5M: Símbolo matemático de PS (prácticamente el mismo que los símbolos de Adobe)
Conjunto de símbolos 5N — ISO 8859-9 Latín 5
Conjunto de símbolos 5S — ISO 84: Portugués de 7 bits
Conjunto de símbolos 5T: Windows 3.1 Latin-5 (prácticamente el mismo que la página de códigos 1254 )
Conjunto de símbolos 6J — Microsoft Publishing
Conjunto de símbolos 6M — Ventura Math
Conjunto de símbolos 6N — ISO 8859-10 Latín 6
Conjunto de símbolos 6S — ISO 85: español de 7 bits
Conjunto de símbolos 7H — ISO 8859-8 Latín/Hebreo
Conjunto de símbolos 9E — Windows 3.1 Latin 2 (prácticamente el mismo que la página de códigos 1250 )
Conjunto de símbolos 9G: griego de Windows 98 (prácticamente el mismo que la página de códigos 1253 )
Conjunto de símbolos 9J — PC 1004
Conjunto de símbolos 9L — Ventura ITC Zapf Dingbats
Conjunto de símbolos 9N — ISO 8859-15 Latin 9
Conjunto de símbolos 9R: cirílico de Windows 98 (prácticamente el mismo que la página de códigos 1251 )
Conjunto de símbolos 9U: Windows 3.0
Conjunto de símbolos 10G — PC-851 Latín/Griego (prácticamente el mismo que la página de códigos 851 )
Conjunto de símbolos 10J: texto PS (prácticamente el mismo que el estándar de Adobe )
Conjunto de símbolos 10L: PS ITC Zapf Dingbats (prácticamente igual que Adobe Dingbats)
Conjunto de símbolos 10N: ISO 8859-5 latino/cirílico (versión de 1988: IR 144)
Conjunto de símbolos 10R — PC-855 cirílico (prácticamente el mismo que la página de códigos 855 )
Conjunto de símbolos 10T — Teletex
Conjunto de símbolos 10U — PC-8 (prácticamente el mismo que la página de códigos 437 ; codificado por IBM como página de códigos 1057 )
Conjunto de símbolos 10V — CP-864 (prácticamente el mismo que la página de códigos 864 )
Conjunto de símbolos 11G — CP-869 (prácticamente el mismo que la página de códigos 869 )
Conjunto de símbolos 11J: PS ISO Latin-1 (prácticamente el mismo que Adobe Latin-1)
Conjunto de símbolos 11N — ISO 8859-6 Latín/Árabe
Conjunto de símbolos 12G: PC Latin/Greek (prácticamente el mismo que la página de códigos 737 )
Conjunto de símbolos 12J: MC Text (prácticamente el mismo que Macintosh Roman )
Conjunto de símbolos 12N — ISO 8859-7 Latín/Griego
Conjunto de símbolos 12R — PC Gost (prácticamente el mismo que PC GOST Main)
Conjunto de símbolos 12U — PC-850 Latin 1 (prácticamente el mismo que la página de códigos 850 )
Conjunto de símbolos 13J — Ventura International
Conjunto de símbolos 13R — PC Búlgaro (prácticamente el mismo que MIK )
Conjunto de símbolos 13U — PC-858 Latin 1 + € (prácticamente igual que la página de códigos 858 )
Conjunto de símbolos 14J — Ventura US
Conjunto de símbolos 14L — Windows Dingbats
Conjunto de símbolos 14P — ABICOMP International (prácticamente el mismo que ABICOMP )
Conjunto de símbolos 14R — PC ucraniano (prácticamente el mismo que RUSCII )
Conjunto de símbolos 15H — PC-862 Israel (prácticamente el mismo que la página de códigos 862 )
Conjunto de símbolos 16U — PC-857 Latin 5 (prácticamente el mismo que la página de códigos 857 )
Conjunto de símbolos 17U — PC-852 Latin 2 (prácticamente el mismo que la página de códigos 852 )
Conjunto de símbolos 18N: UTF-8
Conjunto de símbolos 18U — PC-853 Latin 3 (prácticamente el mismo que la página de códigos 853 )
Conjunto de símbolos 19L: Windows 98 Baltic (prácticamente el mismo que la página de códigos 1257 )
Conjunto de símbolos 19M: Símbolo de Windows
Conjunto de símbolos 19U: Windows 3.1 Latin 1 (prácticamente el mismo que la página de códigos 1252 )
Conjunto de símbolos 20U — PC-860 Portugal (prácticamente el mismo que la página de códigos 860 )
Conjunto de símbolos 21U — PC-861 Islandia (prácticamente el mismo que la página de códigos 861 )
Conjunto de símbolos 23U — PC-863 Canadá - Francés (prácticamente el mismo que la página de códigos 863 )
Conjunto de símbolos 24Q — PC-Polish Mazowia (prácticamente el mismo que la codificación Mazovia )
Conjunto de símbolos 25U — PC-865 Dinamarca/Noruega (prácticamente igual que la página de códigos 865 )
Conjunto de símbolos 26U — PC-775 Latin 7 (prácticamente igual que la página de códigos 775 )
Conjunto de símbolos 27Q — PC-8 PC Nova (prácticamente igual que PC Nova )
Conjunto de símbolos 27U: PC Letón Ruso (también conocido como 866-Letón)
Conjunto de símbolos 28U: PC lituano/ruso (prácticamente el mismo que la página de códigos 774 )
Conjunto de símbolos 29U — PC-772 Lituano/Ruso (prácticamente el mismo que la página de códigos 772 )

Páginas de códigos de otros proveedores

Estas páginas de códigos son asignaciones independientes de proveedores externos. Dado que la página de códigos original de IBM PC ( número 437 ) no estaba realmente diseñada para uso internacional, surgieron varias variantes específicas de países o regiones parcialmente compatibles.

Estas asignaciones de números de páginas de códigos no son oficiales ni por parte de IBM ni de Microsoft y casi ninguna de ellas está considerada como un conjunto de caracteres utilizable por la IANA. Los números asignados a estas páginas de códigos son arbitrarios y pueden entrar en conflicto con los números registrados que utilizan IBM o Microsoft. Algunos de ellos pueden ser anteriores a la incorporación del cambio de páginas de códigos en DOS 3.3.

100 – Página de fuentes de hardware en hebreo DOS (no de IBM; HDOS ) ^[34]
111 – DOS Griego (No de IBM; AST Premium Exec DOS 5.0 ^[35]^[36]^[37] )
112 – DOS Turco (No de IBM; AST Premium Exec DOS 5.0 ^[35]^[36]^[37] )
113 – DOS yugoslavo (no de IBM; AST Premium Exec DOS 5.0 ^[35]^[36]^[37] )
151 – DOS Nafitha Árabe (No de IBM; ADOS )
152 – DOS Nafitha Árabe (No de IBM; ADOS )
161 – DOS árabe (no de IBM; ADOS ) ^[34]
162 – DOS Árabe con diacríticos vocálicos (No de IBM; ADOS)
163 – DOS árabe y francés (no de IBM; ADOS) ^[34]
164 – DOS Árabe y francés con diacríticos vocálicos (no de IBM; ADOS)
165 – DOS árabe (864 extendido) (no de IBM; ADOS) ^[34]
166 – IBM PC árabe (ADOS) ^[34]
190 – DEC DOS Alemán (parece ser idéntico a la página de códigos 437)
210 – DEC DOS Griego (impresoras NEC Jetmate)
220 – DEC DOS Español (No de IBM)
489 – Checoslovaquia [software OCR 1993]
620 – DOS polaco (Mazovia) (no de IBM)
667 – DOS Polaco (Mazovia) (No de IBM)
668 – DOS polaco (no de IBM)
706 – Servidor MS-DOS en árabe Sakhr (no de IBM; software Sakhr de MSX Computers)
707 – MS-DOS Arabic Sakhr (no de IBM; software Sakhr de MSX Computers)
711 – MS-DOS árabe Nafitha mejorado (no de IBM)
714 – MS-DOS Arabic Sakr (no de IBM)
715 – MS-DOS Árabe APTEC (No de IBM)
721 – MS-DOS Árabe Nafitha Internacional (No de IBM)
768 – Al-Arabi árabe (no de IBM)
770 – DOS Estonio, Letón, Lituano ^[38] (Del software lituano Lika; ^[39] Estándar nacional lituano RST 1095-89)
771 – DOS lituano/cirílico — KBL ^[40] (Del lituano Lika Software ^[39] )
772 – DOS Lituano/Cirílico ^[41] (Del software lituano Lika; ^[39] Estándar nacional lituano LST 1284:1993; adoptado por IBM como página de códigos 1119 )
773 – DOS Latin-7 — KBL (del software lituano Lika)
774 – DOS Lituano ^[42] (Del software lituano Lika; ^[39] Estándar nacional lituano LST 1283:1993; adoptado por IBM como página de códigos 1118 )
775 – DOS Latin-7 Baltic Rim (del lituano Lika Software; ^[39] estándar nacional lituano LST 1590-1; adoptado por IBM y Microsoft como página de códigos 775 )
776 – DOS Lituano (CP770 ampliado) ^[43] (Del software lituano Lika ^[39] )
777 – Lituano acentuado en DOS (antiguo) (CP773 ampliado) — KBL ^[43] (del software lituano Lika ^[39] )
778 – Lituano acentuado en DOS (CP775 ampliado) ^[43] (del software lituano Lika ^[39] )
790 – DOS Polaco (Mazovia) con comillas curvas
854 – Español ^[44]^[6]
881 – Latín 1 (no de IBM; AST Premium Exec DOS 5.0 ^[35]^[36]^[37] ) (ID conflictiva con IBM EBCDIC 881)
882 – Latín 2 (ISO 8859-2) (No de IBM; igual que la página de códigos 912; AST Premium Exec DOS 5.0 ^[35]^[36]^[37] ) (ID conflictiva con IBM EBCDIC 882)
883 – Latín 3 (no de IBM; AST Premium Exec DOS 5.0 ^[35]^[36]^[37] ) (ID conflictiva con IBM EBCDIC 883)
884 – Latin 4 (no de IBM; AST Premium Exec DOS 5.0 ^[35]^[36]^[37] ) (ID conflictiva con IBM EBCDIC 884)
885 – Latin 5 (no de IBM; AST Premium Exec DOS 5.0 ^[35]^[36]^[37] ) (ID conflictiva con IBM EBCDIC 885)
895 – Checo (Kamenický) , (No de IBM; ID conflictiva con IBM CP895 — EUC Roman japonés de 7 bits)
896 – Polaco DOS (Mazovia) (No de IBM; ID conflictiva con IBM CP896 — Katakana japonés EUC de 7 bits)
900 – DOS Ruso (MS-DOS 5.0 LCD.CPI Ruso)
928 – Griego (en impresoras Star ^[45] ); igual que el estándar nacional griego ELOT 928 (no de IBM; ID conflictiva con IBM CP928 — DBCS de PC en chino simplificado)
966 – Arabia Saudita (no de IBM)
972 – Hebreo (VT100) (No de IBM)
991 – DOS polaco (Mazovia) (no de IBM)
999 – DOS Serbocroata I (no de IBM); también conocido como PC Nova y CroSCII; la parte inferior es JUSI.B1.002, la parte superior es la página de códigos 437; admite esloveno y serbocroata (escritura latina)
1001 – Árabe (en impresoras Star ^[45] ) (No de IBM; identificación conflictiva con IBM CP1001 — MICR)
1261 – Windows coreano IBM-1261 LMBCS-17, similar a 1363
1270 – Windows Sami
1300 – ANSI [PTS-DOS 6.70, no 6.51] (No de IBM; ID conflictiva con IBM EBCDIC 1300 — Código de barras genérico/OCR-B)
2001 – KBL lituano (en impresoras Star ^[45] ); igual que la página de códigos 771
3001 – Estonio 1 (en impresoras Star ^{[45] ); igual que la página de códigos 1116}
3002 – Estonio 2 (en impresoras Star ^[45] ); igual que la página de códigos 922
3011 – Letón 1 (en impresoras Star ^[45] ); igual que la página de códigos 437-Letón
3012 – Letón-2 (en impresoras Star ^[45] ); igual que la página de códigos 866-Letón (norma nacional letona RST 1040-90)
3021 – Búlgaro (en impresoras Star ^[45] ); igual que MIK
3031 – Hebreo (en impresoras Star ^{[45] ); igual que la página de códigos 862}
3041 – Maltés (en impresoras Star ^[45] ); igual que ISO 646 Maltés
3840 – IBM-Ruso (en impresoras Star ^[45] ); casi igual que CP 866
3841 – Gost-Ruso (en impresoras Star ^[45] ); GOST 13052 más caracteres para idiomas de Asia Central
3843 – Polaco (en impresoras Star ^[45] ); igual que Mazovia
3844 – CS2 (en impresoras Star ^[45] ); igual que Kamenický
3845 – Húngaro (en impresoras Star ^[45] ); igual que CWI
3846 – Turco (en impresoras Star ^[45] ); igual que PC-8 Turco + antiguo símbolo de la lira turca (Tʟ) en el punto de código A8
3847 – Brasil-ABNT (sobre impresoras Star ^[45] ); igual que la Norma Nacional Brasileña NBR-9614:1986
3848 – Brasil-ABICOMP (en impresoras Star ^[45] ); igual que ABICOMP
3850 – KU estándar (en impresoras Star ^[45] ); variación de la codificación de la Universidad Kasetsart para tailandés
3860 – Rajvitee KU (en impresoras Star ^[45] ); variación de la codificación de la Universidad Kasetsart para tailandés
3861 – Microwiz KU (en impresoras Star ^[45] ); variación de la codificación de la Universidad Kasetsart para tailandés
3863 – STD988 TIS (en impresoras Star ^[45] ); variación de la codificación TIS 620 para tailandés
3864 – TIS popular (en impresoras Star ^[45] ); variación de la codificación TIS 620 para tailandés
3865 – Newsic TIS (en impresoras Star ^[45] ); variación de la codificación TIS 620 para tailandés
28799 – FOCAL (en impresoras Star ^[45] ); igual que el conjunto de caracteres FOCAL
28800 – HP RPL (en impresoras Star ^[45] ); igual que RPL
(falta el número) – CWI-2 (para DOS) admite húngaro
(falta número) – MIK (para DOS) admite búlgaro
(falta el número) – DOS Serbocroata II; compatible con esloveno y serbocroata (escritura latina)
(falta el número) — Página de códigos alternativos en ruso (para DOS); este es el origen de IBM CP 866

Lista de asignaciones de páginas de códigos

Lista de asignaciones de páginas de códigos conocidas (incompleta):

Crítica

Muchas codificaciones de caracteres antiguas (a diferencia de Unicode) sufren varios problemas. Algunos proveedores no documentan suficientemente el significado de todos los valores de puntos de código en sus páginas de códigos, lo que reduce la fiabilidad del manejo uniforme de datos textuales en varios sistemas informáticos. Algunos proveedores añaden extensiones propietarias a las páginas de códigos establecidas para añadir o cambiar ciertos valores de puntos de código: por ejemplo, el byte 0x5C en Shift JIS puede representar una barra invertida o un signo de yen según la plataforma. Por último, para admitir varios idiomas en un programa que no utiliza Unicode, es necesario almacenar la página de códigos utilizada para cada cadena o documento.

Las aplicaciones también pueden etiquetar incorrectamente el texto en Windows-1252 como ISO-8859-1 . La única diferencia entre estas páginas de códigos es que los valores de los puntos de código en el rango 0x80–0x9F, utilizados por ISO-8859-1 para caracteres de control, se utilizan en cambio como caracteres imprimibles adicionales en Windows-1252, en particular para las comillas , el símbolo del euro y el símbolo de marca registrada , entre otros. Los navegadores en plataformas que no sean Windows tenderían a mostrar cuadros vacíos o signos de interrogación para estos caracteres, lo que dificultaría la lectura del texto. La mayoría de los navegadores solucionaron esto ignorando el conjunto de caracteres e interpretándolo como Windows-1252 para que pareciera aceptable. En HTML5, tratar ISO-8859-1 como Windows-1252 está incluso codificado como un estándar W3C . ^[47] Aunque los navegadores generalmente se programaban para lidiar con este comportamiento, esto no siempre era así en otro software. En consecuencia, al recibir una transferencia de archivo desde un sistema Windows, las plataformas que no sean Windows ignorarían estos caracteres o los tratarían como caracteres de control estándar e intentarían realizar la acción de control especificada en consecuencia.

Debido a la extensa documentación de Unicode, su vasto repertorio de caracteres y su política de estabilidad de caracteres, los problemas enumerados anteriormente rara vez son una preocupación para Unicode. UTF-8 (que puede codificar más de un millón de puntos de código) ha reemplazado al método de página de códigos en términos de popularidad en Internet. ^[48]^[49]

Páginas de códigos privados

Cuando, al principio de la historia de las computadoras personales, los usuarios no veían satisfechos sus requisitos de codificación de caracteres, se creaban páginas de códigos privadas o locales mediante utilidades de terminación y permanencia o reprogramando las EPROM del BIOS . En algunos casos, se inventaron números de páginas de códigos no oficiales (por ejemplo, CP895).

Cuando se hizo disponible un soporte de conjuntos de caracteres más diversos, la mayoría de esas páginas de códigos cayeron en desuso, con algunas excepciones como la codificación Kamenický o KEYBCS2 para los alfabetos checo y eslovaco . Otro conjunto de caracteres es el estándar de codificación Iran System , creado por la corporación Iran System para el soporte del idioma persa . Este estándar se utilizaba en Irán en programas basados en DOS y, tras la introducción de la página de códigos 1256 de Microsoft, se volvió obsoleto. Sin embargo, algunos programas de Windows y DOS que utilizan esta codificación todavía se utilizan y existen algunas fuentes de Windows con esta codificación.

Para superar estos problemas, el nivel 2 de IBM Character Data Representation Architecture reserva específicamente rangos de identificadores de páginas de códigos para asignaciones definibles por el usuario y de uso privado. Siempre que se utilicen estos identificadores de páginas de códigos, el usuario no debe asumir que la misma funcionalidad y apariencia se pueden reproducir en otra configuración del sistema o en otro dispositivo o sistema a menos que el usuario se ocupe de esto específicamente. El rango de páginas de códigos 57344-61439 ( E000h - EFFFh ) está reservado oficialmente para páginas de códigos definibles por el usuario (o en realidad CCSID en el contexto de IBM CDRA ), mientras que el rango 65280-65533 ( FF00h - FFFDh ) está reservado para cualquier asignación de "uso privado" definible por el usuario. Por ejemplo, una variante personalizada no registrada de la página de códigos 437 ( 1B5h ) o 28591 ( 6FAF ) podría convertirse en 57781 ( E1B5h ) o 61359 ( EFAFh ), respectivamente, para evitar posibles conflictos con otras asignaciones y mantener la lógica numérica interna a veces existente en las asignaciones de las páginas de códigos originales. Una página de códigos privada no registrada que no se base en una página de códigos existente, una página de códigos específica del dispositivo como una fuente de impresora, que solo necesita un identificador lógico para volverse direccionable para el sistema, una fuente de descarga que cambia con frecuencia o un número de página de códigos con un significado simbólico en el entorno local podría tener una asignación en el rango privado como 65280 ( FF00h ).

Los identificadores de página de códigos 0, 65534 ( FFFEh ) y 65535 ( FFFFh ) están reservados para uso interno de sistemas operativos como DOS y no deben asignarse a ninguna página de códigos específica.

Véase también

Referencias

^ "Contenido". www.ibm.com .
^ "Página de códigos". sap.com . Archivado desde el original el 14 de noviembre de 2009. Consultado el 8 de agosto de 2009 .
^ ab "Glosario". oracle.com . Archivado desde el original el 2011-09-30 . Consultado el 2009-08-08 .
^ "VT510 Video Terminal Programmer Information". Digital Equipment Corporation (DEC). 7.1. Conjuntos de caracteres: descripción general. Archivado desde el original el 26 de enero de 2016. Consultado el 15 de febrero de 2017. Además de los conjuntos de caracteres DEC e ISO tradicionales , que se ajustan a la estructura y las reglas de ISO 2022 , el VT510 admite varias páginas de códigos de IBM PC ( números de página en el manual de conjuntos de caracteres estándar de IBM) en modo PCTerm para emular la terminal de consola de las PC estándar de la industria.
^ "7.1. Conjuntos de caracteres: descripción general". Información del programador de terminales de vídeo VT520/VT525 (PDF) . Digital Equipment Corporation (DEC). Julio de 1994. pág. 7-1. EK-VT520-RM. A01. Archivado (PDF) desde el original el 15 de febrero de 2017. Consultado el 15 de febrero de 2017. Además de los conjuntos de caracteres DEC e ISO tradicionales , el VT520 admite varias páginas de códigos de IBM PC (que hacen referencia a los números de página del manual de conjuntos de caracteres estándar de IBM) en modo PCTerm para emular la terminal de consola de las PC estándar de la industria.
^ abc Paul, Matthias R. (10 de junio de 2001) [1995]. "Descripción general de las páginas de códigos de DOS, OS/2 y Windows" (archivo CODEPAGE.LST) (edición preliminar 1.59). Archivado desde el original el 20 de abril de 2016. Consultado el 20 de agosto de 2016 .
^ "Conjuntos de símbolos del lenguaje de comandos de impresora". www.pclviewer.com . Archivado desde el original el 2020-07-31 . Consultado el 2021-05-25 .
^ "Conjuntos de símbolos HP". pclhelp.com . Archivado desde el original el 19 de febrero de 2015 . Consultado el 20 de febrero de 2017 .
^ "Guía de comparación de PCL5" (PDF) . Archivado (PDF) del original el 2017-02-21 . Consultado el 2017-02-20 .
^ Zbikowski, Mark ; Allen, Paul ; Ballmer, Steve ; Borman, Reuben; Borman, Rob; Butler, John; Carroll, Chuck; Chamberlain, Mark; Chell, David; Colee, Mike; Courtney, Mike; Dryfoos, Mike; Duncan, Rachel; Eckhardt, Kurt; Evans, Eric; Farmer, Rick; Gates, Bill ; Geary, Michael; Griffin, Bob; Hogarth, Doug; Johnson, James W.; Kermaani, Kaamel; King, Adrian; Koch, Reed; Landowski, James; Larson, Chris; Lennon, Thomas; Lipkie, Dan; McDonald, Marc ; McKinney, Bruce; Martin, Pascal; Mathers, Estelle; Matthews, Bob; Melin, David; Mergentime, Charles; Nevin, Randy; Newell, Dan; Newell, Tani; Norris, David; O'Leary, Mike; O'Rear, Bob ; Olsson, Mike; Osterman, Larry; Ostling, Ridge; Pai, Sunil; Paterson, Tim ; Pérez, Gary; Peters, Chris; Petzold, Charles ; Pollock, John; Reynolds, Aaron ; Rubin, Darryl; Ryan, Ralph; Schulmeisters, Karl; Shah, Rajen; Shaw, Barry; Short, Anthony; Slivka, Ben; Smirl, Jon; Stillmaker, Betty; Stoddard, John; Tillman, Dennis; Whitten, Greg; Yount, Natalie; Zeck, Steve (1988). "Asesores técnicos". La enciclopedia MS-DOS: versiones 1.0 a 3.2 . Por Duncan, Ray; Bostwick, Steve; Burgoyne, Keith; Byers, Robert A.; Hogan, Thom; Kyle, Jim; Letwin, Gordon ; Petzold, Charles ; Rabinowitz, Chip; Tomlin, Jim; Wilton, Richard; Wolverton, Van; Wong, William; Woodcock, JoAnne (edición completamente reelaborada). Redmond, Washington, EE. UU.: Microsoft Press . ISBN 1-55615-049-0. LCCN 87-21452. OCLC 16581341.[1] Archivado el 14 de octubre de 2018 en Wayback Machine. (xix+1570 páginas; 26 cm) (NB: Esta edición se publicó en 1988 después de una extensa reelaboración de la primera edición retirada de 1986 por un equipo diferente de autores).
^ "Identificadores de página de códigos". microsoft.com . Microsoft . Archivado desde el original el 2014-10-27 . Consultado el 2014-10-27 .
^ "Programación de video VGA/SVGA: funcionamiento en modo texto VGA". osdever.net . Archivado desde el original el 2010-09-01 . Consultado el 2006-09-23 .
^ "Globalización de IBM i: páginas de códigos". IBM. Archivado desde el original el 16 de julio de 2012.
^ abcdef xlate - Transliteración de contenido de registros, IBM Corporation , 2010 [1986], archivado desde el original el 16 de junio de 2019 , consultado el 18 de octubre de 2016
^ "Página de códigos CPGID 01093 (pdf)" (PDF) . Archivado desde el original (PDF) el 8 de julio de 2015.
^ Paul, Matthias R. (10 de junio de 2001) [1995]. "Descripción del formato de archivos .CPI de DOS, OS/2 y Windows NT, y .CP de Linux" (archivo CPI.LST) (1.30.ª ed.). Archivado desde el original el 20 de abril de 2016. Consultado el 20 de agosto de 2016 .
^ Elliott, John C. (14 de octubre de 2006). «Formato de archivo CPI». Seasip.info . Archivado desde el original el 22 de septiembre de 2016. Consultado el 22 de septiembre de 2016 .
^ Brouwer, Andries Evert (10 de febrero de 2001). «Fuentes CPI». 0.2. Archivado desde el original el 22 de septiembre de 2016. Consultado el 22 de septiembre de 2016 .
^ Haralambous, Yannis (septiembre de 2007). Fuentes y codificaciones . Traducido por Horne, P. Scott (1.ª ed.). Sebastopol, California, EE. UU.: O'Reilly Media, Inc., págs. 601–602, 611. ISBN 978-0-596-10242-5.
^ Referencia del programador de MS-DOS . Microsoft Press . 1991. ISBN 1-55615-329-5.
^ "Codepage 1004 - Windows Extended". IBM . 2001. Archivado desde el original el 2018-05-13 . Consultado el 2018-05-13 .
^ "Arquitectura de representación de datos de caracteres". IBM . Archivado desde el original el 23 de junio de 2019 . Consultado el 12 de octubre de 2019 .
^ abcdefghijkl "Identificador de conjunto de caracteres codificados (CCSID) de IBM". IBM . Archivado desde el original el 26 de noviembre de 2009.
^ ISO/IEC 8859-1:1998(E). ISO . 1998-04-15. p. 1. Archivado desde el original el 2020-10-30 . Consultado el 2020-10-30 . Los caracteres codificados de este conjunto se pueden utilizar junto con funciones de control codificadas seleccionadas de ISO/IEC 6429.
^ "Páginas de códigos". microsoft.com . Microsoft . Archivado desde el original el 27 de febrero de 2011 . Consultado el 21 de diciembre de 2010 .
^ "pentaho/pentaho-reporting". GitHub . Archivado desde el original el 2019-06-16 . Consultado el 2017-02-20 .
^ abcde «Identificadores de páginas de códigos». Microsoft Developer Network . Microsoft. 2014. Archivado desde el original el 19 de junio de 2016. Consultado el 19 de junio de 2016 .
^ abcde "Codificaciones web - Internet Explorer - Codificaciones". Wiki WHATWG . 23 de octubre de 2012. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ Foller, Antonin (2014) [2011]. "Codificación de Europa occidental (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ Foller, Antonin (2014) [2011]. "Codificación alemana (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ Foller, Antonin (2014) [2011]. "Codificación sueca (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ Foller, Antonin (2014) [2011]. "Codificación noruega (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ Foller, Antonin (2014) [2011]. "Codificación US-ASCII - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
^ abcdefg Paul, Matthias R. (5 de septiembre de 2002), Información técnica sobre información de país de DOS no documentada para registros LCASE, ARAMODE y CCTORC, lista de desarrollo de FreeDOS fd-dev en Topica, archivado desde el original el 27 de mayo de 2016 , consultado el 26 de mayo de 2016
^ abcdefgh Brown, Ralf D. (29 de diciembre de 2002). La lista de interrupciones x86 . 61.
^ abcdefgh Paul, Matthias R. (30 de julio de 1997). NWDOS-TIP: consejos y trucos para Novell DOS 7, con un clic para deshacer detalles, errores y soluciones. MPDOSTIP (en alemán) (3 ed.). Archivado desde el original el 22 de mayo de 2016 . Consultado el 11 de enero de 2012 .(NB. NWDOSTIP.TXT es un trabajo exhaustivo sobre Novell DOS 7 y OpenDOS 7.01 , que incluye la descripción de muchas características y componentes internos no documentados. Es parte de la colección MPDOSTIP.ZIP aún más grande del autor, mantenida hasta 2001 y distribuida en muchos sitios en ese momento. El enlace provisto apunta a una versión anterior convertida a HTML del archivo NWDOSTIP.TXT).
^ abcdefgh Paul, Matthias R. (9 de abril de 2001). NWDOS-TIP: consejos y trucos para Novell DOS 7, con un clic para deshacer detalles, errores y soluciones . MPDOSTIP (en alemán) (3 ed.).
^ "770". Archivado desde el original el 26 de febrero de 2017. Consultado el 25 de febrero de 2017 .Del software lituano Lika
^ abcdefgh "LIKIT". www.likit.lt . Archivado desde el original el 19 de abril de 2017 . Consultado el 25 de febrero de 2017 .
^ "771". Archivado desde el original el 26 de febrero de 2017. Consultado el 25 de febrero de 2017 .Del software lituano Lika
^ "772". Archivado desde el original el 26 de febrero de 2017. Consultado el 25 de febrero de 2017 .Del software lituano Lika
^ "774". Archivado desde el original el 26 de febrero de 2017. Consultado el 25 de febrero de 2017 .Del software lituano Lika
^ abc "lietuvybė.lt - Rašmenų koduotės" [lietuvybė.lt - Codificaciones de caracteres] (en lituano). Archivado desde el original el 28 de agosto de 2019 . Consultado el 28 de agosto de 2019 .
^ Hogan, Thom (1992). Die PC-Referenz für Programmierer (en alemán) (2 ed.). Systhema Verlag GmbH. ISBN 3-89390-272-4.(NB: Este libro es la traducción al alemán de "The Programmer's PC Sourcebook" de Microsoft Press. Menciona el código de página ID 854 para España.)
^ abcdefghijklmnopqrstu vwxyz "Manual del usuario de Star LC 8021" (PDF) . Archivado (PDF) del original el 29 de septiembre de 2020. Consultado el 20 de febrero de 2017 .
^ IBM. «Documento de información de la página de códigos SBCS - CPGID 00437». Archivado desde el original el 9 de junio de 2016. Consultado el 4 de julio de 2014 .
^ "Codificación". WHATWG . 2015-01-27. sec. 4.2 Nombres y etiquetas. Archivado desde el original el 2015-02-04 . Consultado el 2015-02-04 .
^ "Estadísticas de uso de codificaciones de caracteres para sitios web (actualizadas diariamente)". w3techs.com . Consultado el 6 de agosto de 2015 .
^ "Estadísticas de uso de UTF-8". trends.builtwith.com . Archivado desde el original el 24 de marzo de 2011 . Consultado el 28 de marzo de 2011 .

Enlaces externos

Glosario IBM CDRA
Páginas de códigos de IBM en Wayback Machine (archivadas el 5 de febrero de 2016)
Páginas de códigos de IBM por esquema de codificación en Wayback Machine (archivado el 6 de septiembre de 2009)
Información del conjunto de caracteres IBM/ICU
Identificadores de páginas de códigos de Microsoft (la lista de Microsoft contiene solo páginas de códigos utilizadas activamente por aplicaciones normales en Windows. Consulte también la lista de Torsten Mohrin para obtener la lista completa de páginas de códigos compatibles)
Lista más corta de Microsoft que contiene solo las páginas de códigos ANSI y OEM pero con enlaces a más detalles sobre cada una en Wayback Machine (archivada el 23 de octubre de 2012)
Conjuntos de caracteres y páginas de códigos con solo pulsar un botón
Comando Chcp de Microsoft: muestra y establece la página de códigos activa de la consola
Wikilibro sobre codificación de caracteres "Tablas de códigos"