ISO/CEI 8859-5

ISO/IEC 8859-5:1999 , Tecnología de la información. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits. Parte 5: Alfabeto latino/cirílico . Forma parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primera edición. publicado en 1988. Se lo conoce informalmente como latín/cirílico .

Fue diseñado para cubrir idiomas que utilizan un alfabeto cirílico como el búlgaro , el bielorruso , el ruso , el serbio y el macedonio , pero nunca se utilizó ampliamente. Las codificaciones de 8 bits KOI8-R y KOI8-U , IBM-866 y también Windows-1251 se utilizan con mayor frecuencia. A diferencia de la relación entre Windows-1252 e ISO 8859-1 , Windows-1251 no está estrechamente relacionado con ISO 8859-5. Sin embargo, el bloque cirílico principal en Unicode utiliza un diseño basado en ISO-8859-5.

ISO 8859-5 también se habría podido utilizar para el ucraniano en la Unión Soviética de 1933 a 1990, pero falta la letra ucraniana ge , ґ, que se requiere en la ortografía ucraniana antes y después, y durante ese período fuera de la Ucrania soviética . Como resultado, IBM creó la página de códigos 1124 .

ISO-8859-5 es el nombre de juego de caracteres preferido de la IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429 . La página de códigos de Windows para ISO-8859-5 es la página de códigos 28595, también conocida como Windows-28595 . ^[3] IBM asignó la página de códigos 915 a ISO-8859-5 hasta que se amplió esa página de códigos.

Diseño de página de códigos

Las diferencias con ISO 8859-1 se muestran con su punto de código equivalente Unicode .

Historial y páginas de códigos relacionados

El estándar ECMA-113 ha sido equivalente a ISO-8859-5 desde su segunda edición, ^[4] su primera edición ( ISO-IR-111 ) fue una extensión del anterior KOI-8 (definido por GOST 19768-74). , que presenta las letras rusas de la misma manera que sus equivalentes romanos ASCII siempre que sea posible. El borrador inicial de ISO-8859-5 (DIS-8859-5:1987) siguió a ISO-IR-111, pero fue revisado ^[4] después de que GOST 19768-74 fuera reemplazado ^[5] por el nuevo ISO-IR-153 en 1987, que reorganizó las letras rusas en orden alfabético (excepto Ё). ^[5]^[6] ISO-IR-153 contiene las letras rusas, incluida Ё, y el espacio sin separación y el guión suave, mientras que el conjunto cirílico completo de ISO-8859-5 también se denomina ISO-IR-144. ^[7]

Posiblemente como consecuencia de esta confusión, RFC 1345 enumera erróneamente otra página de códigos como "ISO-IR-111", combinando el orden de letras y mayúsculas y minúsculas de ISO-8859-5 con el orden de filas de ISO-IR-111 (y en consecuencia, no es compatible con ninguno de los dos en la práctica, pero en la práctica es parcialmente compatible ^[2] con Windows-1251 ). ^[8]^[2]

La página de códigos IBM 915 es una extensión de ISO/IEC 8859-5, que agrega algunos símbolos semigráficos y de otro tipo en el área C1 . La página de códigos IBM 1124 es prácticamente idéntica a ISO-8859-5, pero reemplaza ѓ por ґ para uso en ucraniano .

ISO-IR-200 , "Conjunto cirílico suplementario urálico", ^[9] fue registrado en 1998 por Everson Gunn Teoranta (del cual Michael Everson era director, antes de la fundación de Evertype en 2001), ^[10] y cambia varios de las letras no rusas para admitir los idiomas Kildin Sami , Komi y Nenets , no compatibles con el propio ISO-8859-5. Michael Everson también presentó Mac OS Barents Cyrillic para los mismos idiomas en Mac OS clásico. FreeDOS la llama página de códigos 59283 . ^[11]

ISO-IR-201, "Conjunto cirílico suplementario volgaico", ^[12] fue introducido de manera similar por Everson Gunn Teoranta para respaldar las lenguas chuvash , komi , mari y udmurt , habladas en las repúblicas titulares de Rusia . FreeDOS la llama página de códigos 58259 . ^[13]

Referencias

^ Conjuntos de caracteres, Autoridad de números asignados de Internet (IANA), 12 de diciembre de 2018.
^ abc Nechayev, Valentín (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits". Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .
^ "Identificadores de página de códigos". 7 de enero de 2021.
^ ab "ECMA-113 - Ecma Internacional" (PDF) .
^ ab Czyborra, Roman (30 de noviembre de 1998) [25 de mayo de 1998]. "La sopa de caracteres cirílicos". Archivado desde el original el 3 de diciembre de 2016 . Consultado el 3 de diciembre de 2016 .
^ "archivo gost19768-87 TXT.GZ".
^ Asociación europea de fabricantes de ordenadores (1 de mayo de 1988). Parte cirílica del alfabeto latino/cirílico (PDF) . ITSCJ/ IPSJ . ISO-IR -144.
^ Sokolov, Michael (5 de abril de 2003). "Dolor ECMA-cirílico alias iso-ir-111". Lista de correo de conjuntos de caracteres del IETF (lista de correo).
^ ab Autoridad Nacional de Normalización de Irlanda. Conjunto cirílico complementario urálico (PDF) . ITSCJ/ IPSJ . ISO-IR -200.
^ Gunn, Marion; Everson, Michael (20 de septiembre de 2001). "Everson Gunn Teoranta (EGT) y tipografía Everson". Lista de correo Unicode (lista de correo).
^ "Cpi/CPIISO/Codepage.TXT en el maestro · FDOS/Cpi". GitHub .
^ ab Autoridad Nacional de Normalización de Irlanda. Conjunto cirílico suplementario volgaico (PDF) . ITSCJ/ IPSJ . ISO-IR -201.
^ "Cpi/CPIISO/Codepage.TXT en el maestro · FDOS/Cpi". GitHub .

enlaces externos

ISO-IR 144 Parte cirílica del alfabeto latino/cirílico (1 de mayo de 1988, de ISO 8859-5 2.ª versión)
ISO/CEI 8859-5:1999
Estándar ECMA-113: conjuntos de caracteres gráficos codificados de un solo byte de 8 bits: alfabeto latino/cirílico, tercera edición (diciembre de 1999)