stringtranslate.com

Página de código 866

Página de códigos 866 ( CCSID 866) [2] (CP 866, "DOS Cyrillic Russian") [3] es una página de códigos utilizada bajo DOS y OS/2 [4] en Rusia para escribir el alfabeto cirílico . [5] [6] Se basa en la "página de códigos alternativa" ( en ruso : Альтернативная кодировка ) desarrollada en 1984 en IHNA AS URSS y publicada en 1986 por un grupo de investigación de la Academia de Ciencias de la URSS. [7] La ​​página de códigos fue ampliamente utilizada durante la era DOS porque conserva todos los símbolos pseudográficos de la página de códigos 437 (a diferencia de la « Página de códigos principal » o la página de códigos 855 ) y mantiene el orden alfabético (aunque no de forma contigua) de las letras cirílicas (a diferencia de KOI8-R ). Inicialmente, esta codificación solo estaba disponible en la versión rusa de MS-DOS 4.01 (1990), pero con MS-DOS 6.22 se hizo disponible en cualquier versión de idioma.

El estándar de codificación WHATWG , que especifica las codificaciones de caracteres permitidas en HTML5 que los navegadores compatibles deben soportar, [8] incluye la página de códigos 866. [9] Es la única codificación de un solo byte que aparece en la lista y que no figura como parte de ISO 8859 , codificación específica de Mac OS , codificación específica de Microsoft Windows ( Windows-874 o Windows-125x ) o variante KOI-8 . [9] Se indica a los autores de nuevas páginas y a los diseñadores de nuevos protocolos que utilicen UTF-8 en su lugar. [10]

Dos codificaciones muy similares pero no idénticas están estandarizadas en GOST R 34.303-92 [11] como KOI-8 N1 y KOI-8 N2 (que no debe confundirse con el KOI-8 original ).

Conjunto de caracteres

Cada carácter no ASCII se muestra con su punto de código Unicode equivalente . La primera mitad (puntos de código 0 a 127) de esta tabla es la misma que la de la página de códigos 437 .

  Símbolos y puntuación

Variantes

Existían algunas variantes de la página de códigos, pero las diferencias estaban principalmente en los últimos 16 puntos de código (240–255).

Página de código alternativo

La versión original de la página de códigos de Bryabrin et al. (1986) [7] se denomina "Página de códigos alternativa" ( en ruso : Альтернативная кодировка ), para distinguirla de la "Página de códigos principal" ( en ruso : Основная кодировка ) de los mismos autores. Solo admite ruso y búlgaro . Es prácticamente igual que la página de códigos 866, excepto por los códigos F2 hexadecimales a F7 hexadecimales (que la página de códigos 866 cambia a letras ucranianas y bielorrusas ) y los códigos F8 hexadecimales a FB hexadecimales (donde la página de códigos 866 coincide con la página de códigos 437 ). La fila diferente se muestra a continuación.

  Caracteres modificados posteriormente por la página de códigos 866

Página de código modificada 866

Una variante no oficial con los puntos de código 240-255 idénticos a la página de códigos 437. Sin embargo, la letra Ёё suele colocarse en 240 y 241. [18] Esta versión solo admite ruso y búlgaro . La fila diferente se muestra a continuación.

  Diferente de la página de códigos compatible 866 para que coincida con OEM-US

GOST R 34.303-92

La norma GOST R 34.303-92 define dos variantes, KOI-8 N1 y KOI-8 N2, que no deben confundirse con la codificación KOI-8 , a la que no se adhieren.

Koi-8 N2

KOI-8 N2 es la variante más extensa y coincide con la página de códigos 866 y la página de códigos alternativa excepto por la última fila o barra . [c] Para esta última fila, admite letras para bielorruso y ucraniano además del ruso, pero en un diseño no relacionado con la página de códigos 866 o 1125. Cabe destacar que el ruso Ё / ё (que no cambió entre la página de códigos alternativa y la página de códigos 866) también está en una ubicación diferente. La barra final de KOI-8 N2 se muestra a continuación. [11]

  Diferente de la página de códigos 866 y la página de códigos alternativos

KOI-8 N1

La otra variante, KOI-8 N1, es un subconjunto de KOI-8 N2 que omite las letras cirílicas no rusas y los caracteres de dibujo de caja de línea simple/doble , dejándolos vacíos para una mayor internacionalización (compárese con la página de códigos 850 ). Los códigos afectados se muestran a continuación. [11]

Variantes del idioma lituano

KBL

La página de códigos KBL , conocida extraoficialmente como página de códigos 771, [19] es la codificación de caracteres DOS más antigua para el lituano. [20] En su mayor parte coincide con la página de códigos 866 y la página de códigos alternativa, pero reemplaza la última fila y algunos caracteres de bloque con letras del alfabeto lituano que de otro modo no están presentes en ASCII. El ruso Ё / ё no está soportado, [20] de manera similar a KOI-7 .

También existe una versión modificada, la página de código 773 , que reemplaza las letras cirílicas por letras letonas y estonias . [20]

  Diferente de la página de códigos 866 y la página de códigos alternativos

LST1284

La norma lituana LST 1284:1993, conocida como página de códigos 1119 o extraoficialmente como página de códigos 772, [19] coincide en su mayor parte con la página de códigos 866 "modificada", excepto por la adición de comillas en la última fila y el reemplazo de los caracteres mixtos de dibujo de recuadros simples y dobles por letras lituanas (comparar página de códigos 850 ). A diferencia de KBL, se conserva la Ё / ё rusa.

Acompaña a LST 1283 ( página de códigos 774/1118 ), que codifica las letras lituanas adicionales en las mismas ubicaciones que LST 1284, pero se basa en la página de códigos 437. Posteriormente fue reemplazado por LST 1590-1 ( página de códigos 775 ), [19] que codifica estas letras lituanas en las mismas ubicaciones, pero no incluye letras cirílicas, reemplazándolas con letras letonas y estonias. [20]

  Diferente de la página de códigos "modificada" 866

Variantes ucraniana y bielorrusa

El estándar ucraniano RST 2018-91 es designado por IBM como Página de códigos 1125 (CCSID 1125), [25] abreviado CP1125, y también conocido como CP866U, CP866NAV o RUSCII. [26] Coincide con la página de códigos alternativa original para todos los puntos excepto para F2 hexadecimal hasta F9 hexadecimal inclusive, que se reemplazan con letras ucranianas . [27] La ​​página de códigos/CCSID 1131 [28] [29] coincide con la página de códigos 866 para todos los puntos excepto para F8 hexadecimal , F9 hexadecimal y FC hexadecimal hasta FE hexadecimal inclusive, que se reemplazan con letras ucranianas y bielorrusas que de otro modo faltarían , en el proceso desplazando el carácter de viñeta (∙) de F9 hexadecimal a FE hexadecimal . [30] [31] Las diferentes filas se muestran a continuación.

  La página de códigos 1125 es diferente de la página de códigos alternativa
  La página de códigos 1131 es diferente de la página de códigos 866

Además, la denominada página de códigos CP 866ukr es una versión modificada de CP866 con el reemplazo de Ўў por Іі. A diferencia de CP1125, mantiene la compatibilidad total de las letras ucranianas con CP866, aunque falta Ґґ. No está incluida en las distribuciones estándar de Windows, pero algunos usuarios instalan un parche casero [38] que permite usar esta codificación para trabajar en programas de línea de comandos (como FAR Manager ) con nombres de archivo que contienen el cirílico Іі.

Variantes de la grivna

La página de códigos 30040 de FreeDOS es una variante de la página de códigos 866 que reemplaza el signo de moneda (¤) en el byte 0xFB con el signo grivna (₴, U+20B4).

La página de códigos 30039 de FreeDOS es una variante de la página de códigos 1125 que realiza el mismo reemplazo.

Actualizaciones del símbolo del euro

La página de códigos IBM/CCSID 808 es una variante de la página de códigos/CCSID 866; con el símbolo del euro (€, U+20AC) en la posición FD hexadecimal , reemplazando al símbolo monetario universal (¤). [39] [40] [41]

La página de códigos IBM/CCSID 848 es una variante de la página de códigos/CCSID 1125 con el símbolo del euro en FD hexadecimal , reemplazando ¤. [42] [43] [44]

La página de códigos IBM/CCSID 849 es una variante de la página de códigos/CCSID 1131 con el símbolo del euro en FB hex , reemplazando ¤. [45] [46] [47]

Modificación de Lehner-Checa

Una modificación no oficial utilizada en el software desarrollado por Michael Lehner y Peter R. Czech. Reemplaza tres símbolos matemáticos por guillemets y el signo de sección que se usan comúnmente en el idioma ruso. (Lehner y Czech crearon también una serie de conjuntos de caracteres alternativos para otros idiomas europeos, incluido uno basado en CWI-2 para húngaro , uno basado en Kamenicky para checo y eslovaco , una variante de Mazovia para polaco y una codificación aparentemente única para lituano . La fila modificada se muestra a continuación.

  Diferente de la página de códigos 866

Variante letona

Una variante letona, compatible con las impresoras Star y FreeDOS, es la página de códigos 3012 (anteriormente FreeDOS la llamaba página de códigos 61282 ). Esta codificación se conoce como "RusLat". [48]

  Diferente de la página de códigos 866

FreeDOS

FreeDOS proporciona extensiones no oficiales adicionales de la página de códigos 866 para varios idiomas no eslavos: [49]

Página de código 900

Antes de que Franz Rau de Microsoft registrara en IBM la página de códigos final de Microsoft para el MS-DOS 4.01 ruso como CP866 en enero de 1990, las versiones preliminares de la misma desarrolladas por Yuri Starikov (Юрий Стариков) de Dialogue todavía se llamaban internamente página de códigos 900. Si bien la documentación se corrigió para reflejar el nuevo nombre antes del lanzamiento del producto, en 1990 se publicaron en la prensa rusa bocetos de versiones preliminares anteriores que todavía se llamaban página de códigos 900 y sin las letras ucranianas y bielorrusas, que se habían agregado en otoño de 1989. [50] La página de códigos 900 se coló en la distribución del archivo de información de página de códigos LCD.CPI del MS-DOS 5.0 ruso . [51]

Notas

  1. ^ Incluye las letras Є y Ї , que son claramente ucranianas y rusinas , pero no la І, que es distinta de la I latina , e implementa la ortografía soviética, es decir, omite la Ґ. Estas se agregan en algunas modificaciones.
  2. ^ Incluye únicamente la Ў bielorrusa , pero ninguna І distinta de la I latina (aunque esta se agrega en algunas modificaciones).
  3. ^ ie códigos del 240 al 255, o del hexadecimal F0 al hexadecimal FF

Referencias

  1. ^ Conjuntos de caracteres, Autoridad de Números Asignados en Internet (IANA), 12 de diciembre de 2018
  2. ^ "Documento informativo del CCSID 866". Archivado desde el original el 27 de marzo de 2016.
  3. ^ ab Steele, Shawn (24 de abril de 1996). "CP866.TXT: tabla de cp866_DOSCyrillicRussian a Unicode". Consorcio Unicode .
  4. ^ "OS/2" (en ruso). Archivado desde el original el 13 de agosto de 2016. Consultado el 19 de junio de 2016 .
  5. ^ ab "Documento informativo de la página de códigos 866". Archivado desde el original el 16 de marzo de 2016.
  6. ^ "Páginas de códigos compatibles con Windows: páginas de códigos OEM". Centro de desarrollo global de Go . Microsoft. Archivado desde el original el 2 de noviembre de 2011. Consultado el 11 de octubre de 2011 .
  7. ^ ab (en ruso) Брябрин В. М., Ландау И. Я., Неменман М. Е. О системе кодирования для персональных ЭВМ // Микропроцессорные средства и системы. — 1986. — № 4. — С. 61–64.
  8. ^ "8.2.2.3. Codificaciones de caracteres". HTML 5.1 2.ª edición . W3C . Los agentes de usuario deben admitir las codificaciones definidas en el estándar de codificación WHATWG, incluidas, entre otras, […]
  9. ^ ab van Kesteren, Anne . "Codificaciones heredadas de un solo byte". Estándar de codificación . QUÉ WG .
  10. ^ van Kesteren, Ana . "Nombres y etiquetas". Estándar de codificación . QUÉ WG .
  11. ^ abc (en ruso) ГОСТ Р 34.303-92. Наборы 8 bits кодированных символов. Código de 8 bits para información y comentarios. = juegos de caracteres codificados de 8 bits. Código de 8 bits para intercambio de información.
  12. ^ "OEM 866". Ir al Centro de desarrollo global . Microsoft. Archivado desde el original el 4 de febrero de 2012 . Consultado el 17 de octubre de 2011 .
  13. ^ van Kesteren, Anne (6 de enero de 2018). "Índice índice-ibm866". Estándar de codificación . QUÉ WG .
  14. ^ Página de códigos CPGID 00866 (pdf) (PDF) , IBM
  15. ^ Página de códigos CPGID 00866 (txt), IBM
  16. ^ Componentes internacionales para Unicode (ICU), ibm-866_P100-1995.ucm, 3 de diciembre de 2002
  17. ^ (en ruso) Брябрин В. М., Ландау И. Я., Неменман М. Е. О системе кодирования для персональных ЭВМ // Микропроцессорные средства и системы. — 1986. — № 4. — С. 64.
  18. ^ (en ruso) Фигурнов В. E. IBM PC para el desarrollo. — 2-е изд. — М.: 1992. — С. 279.
  19. ^ abc "Páginas de códigos: lista completa". Aivosto.
  20. ^ abcd "Rašmenų koduotės". Lietuvių kalba informacinėse technologijose (en lituano).
  21. ^ "771 kodų lentelė" (en lituano). Likit.
  22. ^ "771 kodų lentelė". Lietuvių kalba informacinėse technologijose - Rašmenų koduotės (en lituano).
  23. ^ "772 kodų lentelė" (en lituano). Likit.
  24. ^ "772 kodų lentelė". Lietuvių kalba informacinėse technologijose - Rašmenų koduotės (en lituano).
  25. ^ "Documento informativo del CCSID 1125". Archivado desde el original el 2 de diciembre de 2014.
  26. ^ Nechayev, Valentin (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits". Archivado desde el original el 5 de diciembre de 2016.
  27. ^ ab Página de códigos CPGID 01125 (pdf) (PDF) , IBM
  28. ^ "Documento informativo del CCSID 1131". Archivado desde el original el 27 de marzo de 2016.
  29. ^ "Documento informativo de la página de códigos 1131". Archivado desde el original el 17 de marzo de 2016.
  30. ^ IBM. «Identificadores de página de códigos: CP 01131». IBM Globalization . Archivado desde el original el 17 de marzo de 2016.
  31. ^ IBM. «Página de códigos 01131» (PDF) . Archivado (PDF) desde el original el 8 de julio de 2015.
  32. ^ Página de códigos CPGID 01125 (txt), IBM
  33. ^ Componentes internacionales para Unicode (ICU), ibm-1125_P100-1997.ucm, 3 de diciembre de 2002
  34. ^ (en ucraniano) РСТ УРСР 2018-91. Система обробки інформації. Кодування символів української абетки 8-бітними кодами.
  35. ^ Página de códigos CPGID 01131 (pdf) (PDF) , IBM
  36. ^ Página de códigos CPGID 01131 (txt), IBM
  37. ^ Componentes internacionales para Unicode (ICU), ibm-1131_P100-1997.ucm, 3 de diciembre de 2002
  38. ^ "Linux Wine + Far2l ucraniano cp866".
  39. ^ "Documento informativo del CCSID 808". Archivado desde el original el 1 de diciembre de 2014.
  40. ^ Página de códigos CPGID 00808 (pdf) (PDF) , IBM
  41. ^ Página de códigos CPGID 00808 (txt), IBM
  42. ^ "Documento informativo del CCSID 848". Archivado desde el original el 1 de diciembre de 2014.
  43. ^ Página de códigos CPGID 00848 (pdf) (PDF) , IBM
  44. ^ Página de códigos CPGID 00848 (txt), IBM
  45. ^ "Documento informativo del CCSID 849". Archivado desde el original el 26 de marzo de 2016.
  46. ^ Página de códigos CPGID 00849 (pdf) (PDF) , IBM
  47. ^ Página de códigos CPGID 00849 (txt), IBM
  48. ^ "Impresora matricial LC-8021, Manual del usuario" (PDF) . Archivado desde el original (PDF) el 2020-09-29 . Consultado el 2020-05-13 .
  49. ^ "CPIDOS - Paquete de archivos CPX (información de página de códigos) v3.0 - Páginas de códigos DOS". FreeDOS . Archivado desde el original el 2018-05-12 . Consultado el 2018-01-30 .
  50. ^ Starikov, Yuri (11 de abril de 2005). «15-летию Russian MS-DOS 4.01 посвящается» [15 años de MS-DOS 4.01 ruso] (en ruso). Archivado desde el original el 4 de diciembre de 2016. Consultado el 7 de mayo de 2014 .
  51. ^ Paul, Matthias R. (10 de junio de 2001) [1995]. "Descripción general de las páginas de códigos de DOS, OS/2 y Windows" (archivo CODEPAGE.LST) (edición preliminar 1.59). Archivado desde el original el 20 de abril de 2016. Consultado el 20 de agosto de 2016 .

Lectura adicional