stringtranslate.com

ISO/CEI 8859-5

ISO/IEC 8859-5:1999 , Tecnología de la información. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits. Parte 5: Alfabeto latino/cirílico . Forma parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primera edición. publicado en 1988. Se lo conoce informalmente como latín/cirílico .

Fue diseñado para cubrir idiomas que utilizan un alfabeto cirílico como el búlgaro , el bielorruso , el ruso , el serbio y el macedonio , pero nunca se utilizó ampliamente. Las codificaciones de 8 bits KOI8-R y KOI8-U , IBM-866 y también Windows-1251 se utilizan con mayor frecuencia. A diferencia de la relación entre Windows-1252 e ISO 8859-1 , Windows-1251 no está estrechamente relacionado con ISO 8859-5. Sin embargo, el bloque cirílico principal en Unicode utiliza un diseño basado en ISO-8859-5.

ISO 8859-5 también se habría podido utilizar para el ucraniano en la Unión Soviética de 1933 a 1990, pero falta la letra ucraniana ge , ґ, que se requiere en la ortografía ucraniana antes y después, y durante ese período fuera de la Ucrania soviética . Como resultado, IBM creó la página de códigos 1124 .

ISO-8859-5 es el nombre de juego de caracteres preferido de la IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429 . La página de códigos de Windows para ISO-8859-5 es la página de códigos 28595, también conocida como Windows-28595 . [3] IBM asignó la página de códigos 915 a ISO-8859-5 hasta que se amplió esa página de códigos.

Diseño de página de códigos

Las diferencias con ISO 8859-1 se muestran con su punto de código equivalente Unicode .

Historial y páginas de códigos relacionados

El estándar ECMA-113 ha sido equivalente a ISO-8859-5 desde su segunda edición, [4] su primera edición ( ISO-IR-111 ) fue una extensión del anterior KOI-8 (definido por GOST 19768-74). , que presenta las letras rusas de la misma manera que sus equivalentes romanos ASCII siempre que sea posible. El borrador inicial de ISO-8859-5 (DIS-8859-5:1987) siguió a ISO-IR-111, pero fue revisado [4] después de que GOST 19768-74 fuera reemplazado [5] por el nuevo ISO-IR-153 en 1987, que reorganizó las letras rusas en orden alfabético (excepto Ё). [5] [6] ISO-IR-153 contiene las letras rusas, incluida Ё, y el espacio sin separación y el guión suave, mientras que el conjunto cirílico completo de ISO-8859-5 también se denomina ISO-IR-144. [7]

Posiblemente como consecuencia de esta confusión, RFC  1345 enumera erróneamente otra página de códigos como "ISO-IR-111", combinando el orden de letras y mayúsculas y minúsculas de ISO-8859-5 con el orden de filas de ISO-IR-111 (y en consecuencia, no es compatible con ninguno de los dos en la práctica, pero en la práctica es parcialmente compatible [2] con Windows-1251 ). [8] [2]

La página de códigos IBM 915 es una extensión de ISO/IEC 8859-5, que agrega algunos símbolos semigráficos y de otro tipo en el área C1 . La página de códigos IBM 1124 es prácticamente idéntica a ISO-8859-5, pero reemplaza ѓ por ґ para uso en ucraniano .

ISO-IR-200 , "Conjunto cirílico suplementario urálico", [9] fue registrado en 1998 por Everson Gunn Teoranta (del cual Michael Everson era director, antes de la fundación de Evertype en 2001), [10] y cambia varios de las letras no rusas para admitir los idiomas Kildin Sami , Komi y Nenets , no compatibles con el propio ISO-8859-5. Michael Everson también presentó Mac OS Barents Cyrillic para los mismos idiomas en Mac OS clásico. FreeDOS la llama página de códigos 59283 . [11]

ISO-IR-201, "Conjunto cirílico suplementario volgaico", [12] fue introducido de manera similar por Everson Gunn Teoranta para respaldar las lenguas chuvash , komi , mari y udmurt , habladas en las repúblicas titulares de Rusia . FreeDOS la llama página de códigos 58259 . [13]

Referencias

  1. ^ Conjuntos de caracteres, Autoridad de números asignados de Internet (IANA), 12 de diciembre de 2018.
  2. ^ abc Nechayev, Valentín (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits". Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .
  3. ^ "Identificadores de página de códigos". 7 de enero de 2021.
  4. ^ ab "ECMA-113 - Ecma Internacional" (PDF) .
  5. ^ ab Czyborra, Roman (30 de noviembre de 1998) [25 de mayo de 1998]. "La sopa de caracteres cirílicos". Archivado desde el original el 3 de diciembre de 2016 . Consultado el 3 de diciembre de 2016 .
  6. ^ "archivo gost19768-87 TXT.GZ".
  7. ^ Asociación europea de fabricantes de ordenadores (1 de mayo de 1988). Parte cirílica del alfabeto latino/cirílico (PDF) . ITSCJ/ IPSJ . ISO-IR -144.
  8. ^ Sokolov, Michael (5 de abril de 2003). "Dolor ECMA-cirílico alias iso-ir-111". Lista de correo de conjuntos de caracteres del IETF (lista de correo).
  9. ^ ab Autoridad Nacional de Normalización de Irlanda. Conjunto cirílico complementario urálico (PDF) . ITSCJ/ IPSJ . ISO-IR -200.
  10. ^ Gunn, Marion; Everson, Michael (20 de septiembre de 2001). "Everson Gunn Teoranta (EGT) y tipografía Everson". Lista de correo Unicode (lista de correo).
  11. ^ "Cpi/CPIISO/Codepage.TXT en el maestro · FDOS/Cpi". GitHub .
  12. ^ ab Autoridad Nacional de Normalización de Irlanda. Conjunto cirílico suplementario volgaico (PDF) . ITSCJ/ IPSJ . ISO-IR -201.
  13. ^ "Cpi/CPIISO/Codepage.TXT en el maestro · FDOS/Cpi". GitHub .

enlaces externos