ISO/IEC 8859-5:1999 , Tecnología de la información — Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits — Parte 5: Alfabeto latino/cirílico , es parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primera edición publicada en 1988. Se le conoce informalmente como latino/cirílico .
Fue diseñado para cubrir idiomas que utilizan un alfabeto cirílico como el búlgaro , bielorruso , ruso , serbio y macedonio , pero nunca se usó ampliamente. Las codificaciones de 8 bits KOI8-R y KOI8-U , IBM-866 y también Windows-1251 son mucho más utilizadas. En contraste con la relación entre Windows-1252 e ISO 8859-1 , Windows-1251 no está estrechamente relacionado con ISO 8859-5. Sin embargo, el bloque cirílico principal en Unicode usa un diseño basado en ISO-8859-5.
La norma ISO 8859-5 también se habría podido utilizar para el ucraniano en la Unión Soviética desde 1933 hasta 1990, pero le falta la letra ucraniana ge , ґ, que se requiere en la ortografía ucraniana antes y después, y durante ese período fuera de la Ucrania soviética . Como resultado, IBM creó la página de códigos 1124 .
ISO-8859-5 es el nombre de conjunto de caracteres preferido por la IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429. La página de códigos de Windows para ISO-8859-5 es la página de códigos 28595 , también conocida como Windows-28595 . [3] IBM asignó la página de códigos 915 a ISO-8859-5 hasta que se amplió esa página de códigos.
Las diferencias con la norma ISO 8859-1 se muestran con su punto de código Unicode equivalente.
La norma ECMA-113 ha sido equivalente a la ISO-8859-5 desde su segunda edición, [4] siendo su primera edición ( ISO-IR-111 ) una extensión de la anterior KOI-8 (definida por GOST 19768-74), que dispone las letras rusas de la misma manera que sus equivalentes romanos ASCII siempre que sea posible. El borrador inicial de la ISO-8859-5 (DIS-8859-5:1987) siguió a la ISO-IR-111, pero fue revisada [4] después de que la GOST 19768-74 fuera reemplazada [5] por la nueva ISO-IR-153 en 1987, que reorganizó las letras rusas en orden alfabético (excepto Ё). [5] [6] La norma ISO-IR-153 contiene las letras rusas, incluida la Ё, y el espacio indivisible y el guión suave, mientras que el conjunto cirílico completo de la norma ISO-8859-5 también se denomina ISO-IR-144. [7]
Posiblemente como consecuencia de esta confusión, RFC 1345 enumera erróneamente otra página de códigos como "ISO-IR-111", que combina el orden de las letras y el orden de las mayúsculas y minúsculas de ISO-8859-5 con el orden de las filas de ISO-IR-111 (y, en consecuencia, no es compatible con ninguno de los dos en la práctica, pero en la práctica es parcialmente compatible [2] con Windows-1251 ). [8] [2]
La página de códigos IBM 915 es una extensión de la norma ISO/IEC 8859-5, que añade algunos símbolos semigráficos y de otro tipo en el área C1 . La página de códigos IBM 1124 es prácticamente idéntica a la ISO-8859-5, pero reemplaza ѓ por ґ para su uso en ucraniano .
La ISO-IR-200 , "Uralic Supplementary Cyrillic Set", [9] fue registrada en 1998 por Everson Gunn Teoranta (de la que Michael Everson era director, antes de la fundación de Evertype en 2001), [10] y cambia varias de las letras no rusas para admitir los idiomas kildin sami , komi y nenets , no admitidos por la propia ISO-8859-5. Michael Everson también introdujo Mac OS Barents Cyrillic para los mismos idiomas en Mac OS clásico. FreeDOS lo llama página de códigos 59283. [ 11]
El ISO-IR-201, "Volgaic Supplementary Cyrillic Set", [12] fue introducido de manera similar por Everson Gunn Teoranta para dar soporte a los idiomas chuvasio , komi , mari y udmurto , hablados en las repúblicas titulares de Rusia . FreeDOS lo llama página de códigos 58259. [ 13]