ISO/IEC 8859-5:1999 , Tecnología de la información. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits. Parte 5: Alfabeto latino/cirílico . Forma parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primera edición. publicado en 1988. Se lo conoce informalmente como latín/cirílico .
Fue diseñado para cubrir idiomas que utilizan un alfabeto cirílico como el búlgaro , el bielorruso , el ruso , el serbio y el macedonio , pero nunca se utilizó ampliamente. Las codificaciones de 8 bits KOI8-R y KOI8-U , IBM-866 y también Windows-1251 se utilizan con mayor frecuencia. A diferencia de la relación entre Windows-1252 e ISO 8859-1 , Windows-1251 no está estrechamente relacionado con ISO 8859-5. Sin embargo, el bloque cirílico principal en Unicode utiliza un diseño basado en ISO-8859-5.
ISO 8859-5 también se habría podido utilizar para el ucraniano en la Unión Soviética de 1933 a 1990, pero falta la letra ucraniana ge , ґ, que se requiere en la ortografía ucraniana antes y después, y durante ese período fuera de la Ucrania soviética . Como resultado, IBM creó la página de códigos 1124 .
ISO-8859-5 es el nombre de juego de caracteres preferido de la IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429 . La página de códigos de Windows para ISO-8859-5 es la página de códigos 28595, también conocida como Windows-28595 . [3] IBM asignó la página de códigos 915 a ISO-8859-5 hasta que se amplió esa página de códigos.
Las diferencias con ISO 8859-1 se muestran con su punto de código equivalente Unicode .
El estándar ECMA-113 ha sido equivalente a ISO-8859-5 desde su segunda edición, [4] su primera edición ( ISO-IR-111 ) fue una extensión del anterior KOI-8 (definido por GOST 19768-74). , que presenta las letras rusas de la misma manera que sus equivalentes romanos ASCII siempre que sea posible. El borrador inicial de ISO-8859-5 (DIS-8859-5:1987) siguió a ISO-IR-111, pero fue revisado [4] después de que GOST 19768-74 fuera reemplazado [5] por el nuevo ISO-IR-153 en 1987, que reorganizó las letras rusas en orden alfabético (excepto Ё). [5] [6] ISO-IR-153 contiene las letras rusas, incluida Ё, y el espacio sin separación y el guión suave, mientras que el conjunto cirílico completo de ISO-8859-5 también se denomina ISO-IR-144. [7]
Posiblemente como consecuencia de esta confusión, RFC 1345 enumera erróneamente otra página de códigos como "ISO-IR-111", combinando el orden de letras y mayúsculas y minúsculas de ISO-8859-5 con el orden de filas de ISO-IR-111 (y en consecuencia, no es compatible con ninguno de los dos en la práctica, pero en la práctica es parcialmente compatible [2] con Windows-1251 ). [8] [2]
La página de códigos IBM 915 es una extensión de ISO/IEC 8859-5, que agrega algunos símbolos semigráficos y de otro tipo en el área C1 . La página de códigos IBM 1124 es prácticamente idéntica a ISO-8859-5, pero reemplaza ѓ por ґ para uso en ucraniano .
ISO-IR-200 , "Conjunto cirílico suplementario urálico", [9] fue registrado en 1998 por Everson Gunn Teoranta (del cual Michael Everson era director, antes de la fundación de Evertype en 2001), [10] y cambia varios de las letras no rusas para admitir los idiomas Kildin Sami , Komi y Nenets , no compatibles con el propio ISO-8859-5. Michael Everson también presentó Mac OS Barents Cyrillic para los mismos idiomas en Mac OS clásico. FreeDOS la llama página de códigos 59283 . [11]
ISO-IR-201, "Conjunto cirílico suplementario volgaico", [12] fue introducido de manera similar por Everson Gunn Teoranta para respaldar las lenguas chuvash , komi , mari y udmurt , habladas en las repúblicas titulares de Rusia . FreeDOS la llama página de códigos 58259 . [13]