stringtranslate.com

Página de código

En informática , una página de códigos es una codificación de caracteres y, como tal, es una asociación específica de un conjunto de caracteres imprimibles y caracteres de control con números únicos. Normalmente, cada número representa el valor binario en un único byte. (En algunos contextos, estos términos se utilizan con más precisión; consulte Codificación de caracteres § Terminología ).

El término "página de códigos" se originó a partir de los sistemas mainframe basados ​​en EBCDIC de IBM , [1] pero Microsoft , SAP , [2] y Oracle Corporation [3] se encuentran entre los proveedores que utilizan este término. La mayoría de los proveedores identifican sus propios conjuntos de caracteres por un nombre. En el caso de que exista una gran cantidad de conjuntos de caracteres (como en IBM), identificar los conjuntos de caracteres mediante un número es una forma conveniente de distinguirlos. Originalmente, los números de página de códigos se referían a los números de página en el manual de conjuntos de caracteres estándar de IBM, [4] [5] [6] una condición que no se ha mantenido durante mucho tiempo. Los proveedores que utilizan un sistema de página de códigos asignan su propio número de página de códigos a una codificación de caracteres, incluso si es más conocida por otro nombre; por ejemplo, a UTF-8 se le han asignado los números de página 1208 en IBM, 65001 en Microsoft y 4110 en SAP.

Hewlett-Packard utiliza un concepto similar en su sistema operativo HP-UX y su protocolo Printer Command Language [7] (PCL) para impresoras (ya sea para impresoras HP o no). Sin embargo, la terminología es diferente: lo que otros llaman un conjunto de caracteres , HP lo llama un conjunto de símbolos , y lo que IBM o Microsoft llaman una página de códigos , HP lo llama un código de conjunto de símbolos . HP desarrolló una serie de conjuntos de símbolos, [8] [9] cada uno con un código de conjunto de símbolos asociado, para codificar tanto sus propios conjuntos de caracteres como los conjuntos de caracteres de otros proveedores.

La multitud de conjuntos de caracteres lleva a muchos proveedores a recomendar Unicode .

El sistema de numeración de páginas de códigos

IBM introdujo el concepto de asignar sistemáticamente un número pequeño, pero globalmente único, de 16 bits a cada codificación de caracteres que un sistema informático o un conjunto de sistemas informáticos pudiera encontrar. El origen de IBM del esquema de numeración se refleja en el hecho de que los números más pequeños (los primeros) se asignan a variaciones de la codificación EBCDIC de IBM y los números ligeramente más grandes se refieren a variaciones de la codificación ASCII extendida de IBM , tal como se utiliza en su hardware para PC.

Con el lanzamiento de la versión 3.3 de PC DOS (y la casi idéntica MS-DOS 3.3) IBM introdujo el sistema de numeración de páginas de códigos a los usuarios habituales de PC, ya que los números de páginas de códigos (y la frase "página de códigos") se usaban en nuevos comandos para permitir que la codificación de caracteres utilizada por todas las partes del sistema operativo se estableciera de manera sistemática. [10]

Números de página de códigos de IBM (CPGID y CCSID) utilizados para codificaciones CJK. El uso que Microsoft hace de los números de página de códigos para codificaciones CJK difiere y se indica entre paréntesis cuando corresponde.

Después de que IBM y Microsoft dejaron de cooperar en la década de 1990, las dos empresas han mantenido la lista de números de página de códigos asignados de forma independiente, lo que ha dado lugar a algunas asignaciones conflictivas. Al menos un proveedor externo ( Oracle ) también tiene su propia lista diferente de asignaciones numéricas. [3] Las asignaciones actuales de IBM se enumeran en su repositorio CCSID , mientras que las asignaciones de Microsoft están documentadas dentro de MSDN . [11] Además, se puede encontrar una lista de los nombres y las abreviaturas aproximadas de IANA ( Internet Assigned Numbers Authority ) para las páginas de códigos instaladas en cualquier máquina Windows en el Registro de esa máquina (esta información es utilizada por programas de Microsoft como Internet Explorer ).

La mayoría de las páginas de códigos conocidas, excluidas las de los idiomas CJK y vietnamita , ajustan todos sus puntos de código en ocho bits y no implican nada más que asignar cada punto de código a un solo carácter; además, no se utilizan técnicas como la combinación de caracteres, escrituras complejas, etc.

El modo de texto del hardware gráfico estándar de PC ( compatible con VGA ) se basa en el uso de una página de códigos de 8 bits, aunque es posible utilizar dos a la vez con cierto sacrificio de profundidad de color, y se pueden almacenar hasta ocho en el adaptador de pantalla para facilitar la conmutación. [12] Había una selección de fuentes de páginas de códigos de terceros que se podían cargar en dicho hardware. Sin embargo, ahora es habitual que los proveedores de sistemas operativos proporcionen sus propios sistemas de codificación y representación de caracteres que se ejecutan en un modo gráfico y evitan por completo esta limitación del hardware. Sin embargo, el sistema de referencia a las codificaciones de caracteres por un número de página de códigos sigue siendo aplicable, como una alternativa eficiente a los identificadores de cadena como los especificados por la IETF y la IANA para su uso en varios protocolos como el correo electrónico y las páginas web.

Relación con ASCII

La mayoría de las páginas de códigos que se utilizan actualmente son superconjuntos de ASCII , un código de 7 bits que representa 128 códigos de control y caracteres imprimibles. En el pasado lejano, las implementaciones de 8 bits del código ASCII establecían el bit superior en cero o lo utilizaban como bit de paridad en las transmisiones de datos de red. Cuando el bit superior estuvo disponible para representar datos de caracteres, se pudieron representar un total de 256 caracteres y códigos de control. La mayoría de los proveedores (incluido IBM) utilizaron este rango extendido para codificar caracteres utilizados por varios idiomas y elementos gráficos que permitían la imitación de gráficos primitivos en dispositivos de salida de solo texto. No existía un estándar formal para estos "conjuntos de caracteres ASCII extendidos" y los proveedores se referían a las variantes como páginas de códigos, como IBM siempre había hecho para las variantes de las codificaciones EBCDIC.

Relación con Unicode

Unicode es un esfuerzo por incluir todos los caracteres de todos los idiomas humanos utilizados en la actualidad e históricamente en una única enumeración de caracteres (efectivamente, una única página de códigos grande), eliminando la necesidad de distinguir entre diferentes páginas de códigos al manejar texto almacenado digitalmente. Unicode intenta mantener la compatibilidad con versiones anteriores de muchas páginas de códigos heredadas, copiando algunas páginas de códigos 1:1 en el proceso de diseño. Un objetivo de diseño explícito de Unicode era permitir la conversión de ida y vuelta entre todas las páginas de códigos heredadas comunes, aunque este objetivo no siempre se ha logrado. Algunos proveedores, a saber, IBM y Microsoft, han asignado anacrónicamente números de página de códigos a las codificaciones Unicode. Esta convención permite que los números de página de códigos se utilicen como metadatos para identificar el algoritmo de decodificación correcto cuando se encuentran datos binarios almacenados.

Páginas de códigos de IBM

Páginas de códigos basadas en EBCDIC

IBM utiliza estas páginas de códigos en sus conjuntos de caracteres EBCDIC para computadoras mainframe . [13]

Páginas de códigos DOS

Estas páginas de códigos son utilizadas por IBM en su sistema operativo PC DOS . Estas páginas de códigos originalmente estaban incorporadas directamente en el hardware de modo texto de los adaptadores gráficos utilizados con IBM PC y sus clones, incluidos los adaptadores MDA y CGA originales cuyos conjuntos de caracteres solo se podían cambiar reemplazando físicamente un chip ROM que contenía la fuente. La interfaz de esos adaptadores (emulados por todos los adaptadores posteriores, como VGA) estaba limitada típicamente a conjuntos de caracteres de un solo byte con solo 256 caracteres en cada fuente/codificación (aunque VGA agregó soporte parcial para conjuntos de caracteres ligeramente más grandes).

Cuando se trabaja con hardware, protocolos y formatos de archivo más antiguos, a menudo es necesario soportar estas páginas de códigos, pero se recomiendan sistemas de codificación más nuevos, en particular Unicode, para diseños nuevos.

Las páginas de códigos DOS normalmente se almacenan en archivos .CPI. [16] [17] [18] [19] [20]

Páginas de códigos de IBM AIX

Estas páginas de códigos son utilizadas por IBM en su sistema operativo AIX y emulan varios conjuntos de caracteres, concretamente aquellos diseñados para su uso según la norma ISO, como los sistemas operativos tipo UNIX.

La página de códigos 819 es idéntica a la de Latin-1, ISO/IEC 8859-1 y, con comandos ligeramente modificados, permite que las máquinas MS-DOS utilicen esa codificación. Se utilizaba con las minicomputadoras IBM AS/400.

Páginas de códigos de IBM OS/2

IBM utiliza estas páginas de códigos en su sistema operativo OS/2 .

Páginas de códigos de emulación de Windows

IBM utiliza estas páginas de códigos para emular los conjuntos de caracteres de Microsoft Windows . La mayoría de estas páginas de códigos tienen el mismo número que las páginas de códigos de Microsoft, aunque no son exactamente idénticas. Sin embargo, algunas páginas de códigos son nuevas de IBM, no ideadas por Microsoft.

Páginas de códigos de emulación de Macintosh

IBM utiliza estas páginas de códigos al emular los conjuntos de caracteres de Apple Macintosh .

Páginas de códigos de emulación de Adobe

IBM utiliza estas páginas de códigos al emular los conjuntos de caracteres de Adobe .

Páginas de códigos de emulación de HP

IBM utiliza estas páginas de códigos al emular los conjuntos de caracteres de HP .

Páginas de códigos de emulación DEC

IBM utiliza estas páginas de códigos al emular los conjuntos de caracteres DEC .

Páginas de códigos Unicode de IBM

Páginas de códigos de Microsoft

Páginas de códigos de Windows

Estas páginas de códigos son utilizadas por Microsoft en su propio sistema operativo Windows. Microsoft definió una serie de páginas de códigos conocidas como páginas de códigos ANSI (ya que la primera, 1252, se basó en un borrador apócrifo ANSI de lo que se convirtió en ISO 8859-1 ). La página de códigos 1252 se basa en ISO 8859-1 pero utiliza el rango 0x80-0x9F para caracteres imprimibles adicionales en lugar de los códigos de control C1 de ISO 6429 mencionados por ISO 8859-1. [24] Algunas de las otras se basan en parte en otras partes de ISO 8859, pero a menudo se reorganizan para acercarlas a 1252.

Microsoft recomienda que las nuevas aplicaciones utilicen UTF-8 o UCS-2/UTF-16 en lugar de estas páginas de códigos. [25]

Páginas de códigos DBCS

Estas páginas de códigos representan codificaciones de caracteres DBCS para varios idiomas CJK. En los sistemas operativos de Microsoft, se utilizan como páginas de códigos "OEM" y "Windows" para la configuración regional correspondiente.

Páginas de códigos MS-DOS

Estas páginas de códigos son utilizadas por Microsoft en su sistema operativo MS-DOS. Microsoft se refiere a ellas como páginas de códigos OEM porque fueron definidas por los fabricantes de equipos originales que licenciaron MS-DOS para su distribución con su hardware, no por Microsoft ni por una organización de estándares. La mayoría de estas páginas de códigos tienen el mismo número que las páginas de códigos equivalentes de IBM, aunque algunas no son exactamente idénticas. [26]

Páginas de códigos de emulación de Macintosh

Microsoft utiliza estas páginas de códigos al emular los conjuntos de caracteres de Apple Macintosh .

Varias otras páginas de códigos de Microsoft

Los siguientes números de páginas de códigos son específicos de Microsoft Windows. IBM puede utilizar números diferentes para estas páginas de códigos. Emulan varios conjuntos de caracteres, concretamente aquellos diseñados para utilizarse de acuerdo con la norma ISO, [ aclaración necesaria ] como los sistemas operativos tipo UNIX.

Páginas de códigos Unicode de Microsoft

Conjuntos de símbolos HP

HP desarrolló una serie de conjuntos de símbolos (cada uno con su código de conjunto de símbolos asociado) para codificar sus propios conjuntos de caracteres o los conjuntos de caracteres de otros proveedores. Normalmente son conjuntos de caracteres de 7 bits que, cuando se trasladan a la parte superior y se asocian con el conjunto de caracteres ASCII, forman conjuntos de caracteres de 8 bits.

Conjuntos de símbolos propios de HP

Conjuntos de símbolos de otros proveedores

Páginas de códigos de otros proveedores

Estas páginas de códigos son asignaciones independientes de proveedores externos. Dado que la página de códigos original de IBM PC ( número 437 ) no estaba realmente diseñada para uso internacional, surgieron varias variantes específicas de países o regiones parcialmente compatibles.

Estas asignaciones de números de páginas de códigos no son oficiales ni por parte de IBM ni de Microsoft y casi ninguna de ellas está considerada como un conjunto de caracteres utilizable por la IANA. Los números asignados a estas páginas de códigos son arbitrarios y pueden entrar en conflicto con los números registrados que utilizan IBM o Microsoft. Algunos de ellos pueden ser anteriores a la incorporación del cambio de páginas de códigos en DOS 3.3.

Lista de asignaciones de páginas de códigos

Lista de asignaciones de páginas de códigos conocidas (incompleta):

Crítica

Muchas codificaciones de caracteres antiguas (a diferencia de Unicode) sufren varios problemas. Algunos proveedores no documentan suficientemente el significado de todos los valores de puntos de código en sus páginas de códigos, lo que reduce la fiabilidad del manejo uniforme de datos textuales en varios sistemas informáticos. Algunos proveedores añaden extensiones propietarias a las páginas de códigos establecidas para añadir o cambiar ciertos valores de puntos de código: por ejemplo, el byte 0x5C en Shift JIS puede representar una barra invertida o un signo de yen según la plataforma. Por último, para admitir varios idiomas en un programa que no utiliza Unicode, es necesario almacenar la página de códigos utilizada para cada cadena o documento.

Las aplicaciones también pueden etiquetar incorrectamente el texto en Windows-1252 como ISO-8859-1 . La única diferencia entre estas páginas de códigos es que los valores de los puntos de código en el rango 0x80–0x9F, utilizados por ISO-8859-1 para caracteres de control, se utilizan en cambio como caracteres imprimibles adicionales en Windows-1252, en particular para las comillas , el símbolo del euro y el símbolo de marca registrada , entre otros. Los navegadores en plataformas que no sean Windows tenderían a mostrar cuadros vacíos o signos de interrogación para estos caracteres, lo que dificultaría la lectura del texto. La mayoría de los navegadores solucionaron esto ignorando el conjunto de caracteres e interpretándolo como Windows-1252 para que pareciera aceptable. En HTML5, tratar ISO-8859-1 como Windows-1252 está incluso codificado como un estándar W3C . [47] Aunque los navegadores generalmente se programaban para lidiar con este comportamiento, esto no siempre era así en otro software. En consecuencia, al recibir una transferencia de archivo desde un sistema Windows, las plataformas que no sean Windows ignorarían estos caracteres o los tratarían como caracteres de control estándar e intentarían realizar la acción de control especificada en consecuencia.

Debido a la extensa documentación de Unicode, su vasto repertorio de caracteres y su política de estabilidad de caracteres, los problemas enumerados anteriormente rara vez son una preocupación para Unicode. UTF-8 (que puede codificar más de un millón de puntos de código) ha reemplazado al método de páginas de códigos en términos de popularidad en Internet. [48] [49]

Páginas de códigos privados

Cuando, al principio de la historia de las computadoras personales, los usuarios no veían satisfechos sus requisitos de codificación de caracteres, se creaban páginas de códigos privadas o locales mediante utilidades de terminación y permanencia residentes o reprogramando las EPROM del BIOS . En algunos casos, se inventaron números de páginas de códigos no oficiales (por ejemplo, CP895).

Cuando se hizo posible la compatibilidad con conjuntos de caracteres más diversos, la mayoría de esas páginas de códigos cayeron en desuso, con algunas excepciones como la codificación Kamenický o KEYBCS2 para los alfabetos checo y eslovaco . Otro conjunto de caracteres es el estándar de codificación Iran System , creado por la corporación Iran System para la compatibilidad con el idioma persa . Este estándar se utilizaba en Irán en programas basados ​​en DOS y, tras la introducción de la página de códigos 1256 de Microsoft, quedó obsoleto. Sin embargo, algunos programas de Windows y DOS que utilizan esta codificación todavía se utilizan y existen algunas fuentes de Windows con esta codificación.

Para superar estos problemas, el nivel 2 de IBM Character Data Representation Architecture reserva específicamente rangos de identificadores de páginas de códigos para asignaciones definibles por el usuario y de uso privado. Siempre que se utilicen dichos identificadores de páginas de códigos, el usuario no debe asumir que la misma funcionalidad y apariencia se pueden reproducir en otra configuración del sistema o en otro dispositivo o sistema a menos que el usuario se ocupe de esto específicamente. El rango de páginas de códigos 57344-61439 ( E000h - EFFFh ) está reservado oficialmente para páginas de códigos definibles por el usuario (o en realidad CCSID en el contexto de IBM CDRA ), mientras que el rango 65280-65533 ( FF00h - FFFDh ) está reservado para cualquier asignación de "uso privado" definible por el usuario. Por ejemplo, una variante personalizada no registrada de la página de códigos 437 ( 1B5h ) o 28591 ( 6FAF ) podría convertirse en 57781 ( E1B5h ) o 61359 ( EFAFh ), respectivamente, para evitar posibles conflictos con otras asignaciones y mantener la lógica numérica interna a veces existente en las asignaciones de las páginas de códigos originales. Una página de códigos privada no registrada que no se base en una página de códigos existente, una página de códigos específica del dispositivo como una fuente de impresora, que solo necesita un identificador lógico para volverse direccionable para el sistema, una fuente de descarga que cambia con frecuencia o un número de página de códigos con un significado simbólico en el entorno local podría tener una asignación en el rango privado como 65280 ( FF00h ).

Los identificadores de página de códigos 0, 65534 ( FFFEh ) y 65535 ( FFFFh ) están reservados para uso interno de sistemas operativos como DOS y no deben asignarse a ninguna página de códigos específica.

Véase también

Referencias

  1. ^ "Contenido". www.ibm.com .
  2. ^ "Página de códigos". sap.com . Archivado desde el original el 14 de noviembre de 2009. Consultado el 8 de agosto de 2009 .
  3. ^ ab "Glosario". oracle.com . Archivado desde el original el 2011-09-30 . Consultado el 2009-08-08 .
  4. ^ "VT510 Video Terminal Programmer Information". Digital Equipment Corporation (DEC). 7.1. Conjuntos de caracteres: descripción general. Archivado desde el original el 26 de enero de 2016. Consultado el 15 de febrero de 2017. Además de los conjuntos de caracteres DEC e ISO tradicionales , que se ajustan a la estructura y las reglas de ISO 2022 , el VT510 admite varias páginas de códigos de IBM PC ( números de página en el manual de conjuntos de caracteres estándar de IBM) en modo PCTerm para emular la terminal de consola de las PC estándar de la industria.
  5. ^ "7.1. Conjuntos de caracteres: descripción general". Información del programador de terminales de vídeo VT520/VT525 (PDF) . Digital Equipment Corporation (DEC). Julio de 1994. pág. 7-1. EK-VT520-RM. A01. Archivado (PDF) desde el original el 15 de febrero de 2017. Consultado el 15 de febrero de 2017. Además de los conjuntos de caracteres DEC e ISO tradicionales , el VT520 admite varias páginas de códigos de IBM PC (que hacen referencia a los números de página del manual de conjuntos de caracteres estándar de IBM) en modo PCTerm para emular la terminal de consola de las PC estándar de la industria.
  6. ^ abc Paul, Matthias R. (10 de junio de 2001) [1995]. "Descripción general de las páginas de códigos de DOS, OS/2 y Windows" (archivo CODEPAGE.LST) (edición preliminar 1.59). Archivado desde el original el 20 de abril de 2016. Consultado el 20 de agosto de 2016 .
  7. ^ "Conjuntos de símbolos del lenguaje de comandos de impresora". www.pclviewer.com . Archivado desde el original el 2020-07-31 . Consultado el 2021-05-25 .
  8. ^ "Conjuntos de símbolos HP". pclhelp.com . Archivado desde el original el 19 de febrero de 2015 . Consultado el 20 de febrero de 2017 .
  9. ^ "Guía de comparación de PCL5" (PDF) . Archivado (PDF) del original el 2017-02-21 . Consultado el 2017-02-20 .
  10. ^ Zbikowski, Mark ; Allen, Paul ; Ballmer, Steve ; Borman, Reuben; Borman, Rob; Butler, John; Carroll, Chuck; Chamberlain, Mark; Chell, David; Colee, Mike; Courtney, Mike; Dryfoos, Mike; Duncan, Rachel; Eckhardt, Kurt; Evans, Eric; Farmer, Rick; Gates, Bill ; Geary, Michael; Griffin, Bob; Hogarth, Doug; Johnson, James W.; Kermaani, Kaamel; King, Adrian; Koch, Reed; Landowski, James; Larson, Chris; Lennon, Thomas; Lipkie, Dan; McDonald, Marc ; McKinney, Bruce; Martin, Pascal; Mathers, Estelle; Matthews, Bob; Melin, David; Mergentime, Charles; Nevin, Randy; Newell, Dan; Newell, Tani; Norris, David; O'Leary, Mike; O'Rear, Bob ; Olsson, Mike; Osterman, Larry; Ostling, Ridge; Pai, Sunil; Paterson, Tim ; Pérez, Gary; Peters, Chris; Petzold, Charles ; Pollock, John; Reynolds, Aaron ; Rubin, Darryl; Ryan, Ralph; Schulmeisters, Karl; Shah, Rajen; Shaw, Barry; Short, Anthony; Slivka, Ben; Smirl, Jon; Stillmaker, Betty; Stoddard, John; Tillman, Dennis; Whitten, Greg; Yount, Natalie; Zeck, Steve (1988). "Asesores técnicos". La enciclopedia MS-DOS: versiones 1.0 a 3.2 . Por Duncan, Ray; Bostwick, Steve; Burgoyne, Keith; Byers, Robert A.; Hogan, Thom; Kyle, Jim; Letwin, Gordon ; Petzold, Charles ; Rabinowitz, Chip; Tomlin, Jim; Wilton, Richard; Wolverton, Van; Wong, William; Woodcock, JoAnne (edición completamente reelaborada). Redmond, Washington, EE. UU.: Microsoft Press . ISBN 1-55615-049-0. LCCN  87-21452. OCLC  16581341.[1] Archivado el 14 de octubre de 2018 en Wayback Machine. (xix+1570 páginas; 26 cm) (NB: Esta edición se publicó en 1988 después de una extensa reelaboración de la primera edición retirada de 1986 por un equipo diferente de autores).
  11. ^ "Identificadores de página de códigos". microsoft.com . Microsoft . Archivado desde el original el 2014-10-27 . Consultado el 2014-10-27 .
  12. ^ "Programación de video VGA/SVGA: funcionamiento en modo texto VGA". osdever.net . Archivado desde el original el 2010-09-01 . Consultado el 2006-09-23 .
  13. ^ "Globalización de IBM i: páginas de códigos". IBM. Archivado desde el original el 16 de julio de 2012.
  14. ^ abcdef xlate - Transliteración de contenido de registros, IBM Corporation , 2010 [1986], archivado desde el original el 16 de junio de 2019 , consultado el 18 de octubre de 2016
  15. ^ "Página de códigos CPGID 01093 (pdf)" (PDF) . Archivado desde el original (PDF) el 8 de julio de 2015.
  16. ^ Paul, Matthias R. (10 de junio de 2001) [1995]. "Descripción del formato de archivos .CPI de DOS, OS/2 y Windows NT, y .CP de Linux" (archivo CPI.LST) (1.30.ª ed.). Archivado desde el original el 20 de abril de 2016. Consultado el 20 de agosto de 2016 .
  17. ^ Elliott, John C. (14 de octubre de 2006). «Formato de archivo CPI». Seasip.info . Archivado desde el original el 22 de septiembre de 2016. Consultado el 22 de septiembre de 2016 .
  18. ^ Brouwer, Andries Evert (10 de febrero de 2001). «Fuentes CPI». 0.2. Archivado desde el original el 22 de septiembre de 2016. Consultado el 22 de septiembre de 2016 .
  19. ^ Haralambous, Yannis (septiembre de 2007). Fuentes y codificaciones . Traducido por Horne, P. Scott (1.ª ed.). Sebastopol, California, EE. UU.: O'Reilly Media, Inc., págs. 601–602, 611. ISBN 978-0-596-10242-5.
  20. ^ Referencia del programador de MS-DOS . Microsoft Press . 1991. ISBN 1-55615-329-5.
  21. ^ "Codepage 1004 - Windows Extended". IBM . 2001. Archivado desde el original el 2018-05-13 . Consultado el 2018-05-13 .
  22. ^ "Arquitectura de representación de datos de caracteres". IBM . Archivado desde el original el 23 de junio de 2019 . Consultado el 12 de octubre de 2019 .
  23. ^ abcdefghijkl "Identificador de conjunto de caracteres codificados (CCSID) de IBM". IBM . Archivado desde el original el 26 de noviembre de 2009.
  24. ^ ISO/IEC 8859-1:1998(E). ISO . 1998-04-15. p. 1. Archivado desde el original el 2020-10-30 . Consultado el 2020-10-30 . Los caracteres codificados de este conjunto se pueden utilizar junto con funciones de control codificadas seleccionadas de ISO/IEC 6429.
  25. ^ "Páginas de códigos". microsoft.com . Microsoft . Archivado desde el original el 27 de febrero de 2011 . Consultado el 21 de diciembre de 2010 .
  26. ^ "pentaho/pentaho-reporting". GitHub . Archivado desde el original el 2019-06-16 . Consultado el 2017-02-20 .
  27. ^ abcde «Identificadores de páginas de códigos». Microsoft Developer Network . Microsoft. 2014. Archivado desde el original el 19 de junio de 2016. Consultado el 19 de junio de 2016 .
  28. ^ abcde "Codificaciones web - Internet Explorer - Codificaciones". Wiki WHATWG . 23 de octubre de 2012. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
  29. ^ Foller, Antonin (2014) [2011]. "Codificación de Europa occidental (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016 . Consultado el 20 de junio de 2016 .
  30. ^ Foller, Antonin (2014) [2011]. "Codificación alemana (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
  31. ^ Foller, Antonin (2014) [2011]. "Codificación sueca (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
  32. ^ Foller, Antonin (2014) [2011]. "Codificación noruega (IA5) - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
  33. ^ Foller, Antonin (2014) [2011]. "Codificación US-ASCII - Conjuntos de caracteres de Windows". WUtils.com - Utilidad web en línea y ayuda . Motobit Software. Archivado desde el original el 20 de junio de 2016. Consultado el 20 de junio de 2016 .
  34. ^ abcdefg Paul, Matthias R. (5 de septiembre de 2002), Información técnica sobre información de país DOS no documentada para registros LCASE, ARAMODE y CCTORC, lista de desarrollo de FreeDOS fd-dev en Topica, archivado desde el original el 27 de mayo de 2016 , consultado el 26 de mayo de 2016
  35. ^ abcdefgh Brown, Ralf D. (29 de diciembre de 2002). La lista de interrupciones x86 . 61.
  36. ^ abcdefgh Paul, Matthias R. (30 de julio de 1997). NWDOS-TIP: consejos y trucos para Novell DOS 7, con un clic para deshacer detalles, errores y soluciones. MPDOSTIP (en alemán) (3 ed.). Archivado desde el original el 22 de mayo de 2016 . Consultado el 11 de enero de 2012 .(NB. NWDOSTIP.TXT es un trabajo exhaustivo sobre Novell DOS 7 y OpenDOS 7.01 , que incluye la descripción de muchas características y componentes internos no documentados. Es parte de la colección MPDOSTIP.ZIP aún más grande del autor, mantenida hasta 2001 y distribuida en muchos sitios en ese momento. El enlace provisto apunta a una versión anterior convertida a HTML del archivo NWDOSTIP.TXT).
  37. ^ abcdefgh Paul, Matthias R. (9 de abril de 2001). NWDOS-TIP: consejos y trucos para Novell DOS 7, con Blick auf desdokumentierte Detalles, errores y soluciones . MPDOSTIP (en alemán) (3 ed.).
  38. ^ "770". Archivado desde el original el 26 de febrero de 2017. Consultado el 25 de febrero de 2017 .Del software lituano Lika
  39. ^ abcdefgh "LIKIT". www.likit.lt . Archivado desde el original el 19 de abril de 2017 . Consultado el 25 de febrero de 2017 .
  40. ^ "771". Archivado desde el original el 26 de febrero de 2017. Consultado el 25 de febrero de 2017 .Del software lituano Lika
  41. ^ "772". Archivado desde el original el 26 de febrero de 2017. Consultado el 25 de febrero de 2017 .Del software lituano Lika
  42. ^ "774". Archivado desde el original el 26 de febrero de 2017. Consultado el 25 de febrero de 2017 .Del software lituano Lika
  43. ^ abc "lietuvybė.lt - Rašmenų koduotės" [lietuvybė.lt - Codificaciones de caracteres] (en lituano). Archivado desde el original el 28 de agosto de 2019 . Consultado el 28 de agosto de 2019 .
  44. ^ Hogan, Thom (1992). Die PC-Referenz für Programmierer (en alemán) (2 ed.). Systhema Verlag GmbH. ISBN 3-89390-272-4.(NB: Este libro es la traducción al alemán de "The Programmer's PC Sourcebook" de Microsoft Press. Menciona el código de página ID 854 para España.)
  45. ^ abcdefghijklmnopqrstu vwxyz "Manual del usuario de Star LC 8021" (PDF) . Archivado (PDF) del original el 2020-09-29 . Consultado el 2017-02-20 .
  46. ^ IBM. «Documento de información de la página de códigos SBCS - CPGID 00437». Archivado desde el original el 9 de junio de 2016. Consultado el 4 de julio de 2014 .
  47. ^ "Codificación". WHATWG . 2015-01-27. sec. 4.2 Nombres y etiquetas. Archivado desde el original el 2015-02-04 . Consultado el 2015-02-04 .
  48. ^ "Estadísticas de uso de codificaciones de caracteres para sitios web (actualizadas diariamente)". w3techs.com . Consultado el 6 de agosto de 2015 .
  49. ^ "Estadísticas de uso de UTF-8". trends.builtwith.com . Archivado desde el original el 24 de marzo de 2011 . Consultado el 28 de marzo de 2011 .

Enlaces externos