ISO/IEC 8859-5

ISO/IEC 8859-5:1999 , Tecnología de la información — Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits — Parte 5: Alfabeto latino/cirílico , es parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primera edición publicada en 1988. Se le conoce informalmente como latino/cirílico .

Fue diseñado para cubrir idiomas que utilizan un alfabeto cirílico como el búlgaro , bielorruso , ruso , serbio y macedonio , pero nunca se usó ampliamente. Las codificaciones de 8 bits KOI8-R y KOI8-U , IBM-866 y también Windows-1251 son mucho más utilizadas. En contraste con la relación entre Windows-1252 e ISO 8859-1 , Windows-1251 no está estrechamente relacionado con ISO 8859-5. Sin embargo, el bloque cirílico principal en Unicode usa un diseño basado en ISO-8859-5.

La norma ISO 8859-5 también se habría podido utilizar para el ucraniano en la Unión Soviética desde 1933 hasta 1990, pero le falta la letra ucraniana ge , ґ, que se requiere en la ortografía ucraniana antes y después, y durante ese período fuera de la Ucrania soviética . Como resultado, IBM creó la página de códigos 1124 .

ISO-8859-5 es el nombre de conjunto de caracteres preferido por la IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429. La página de códigos de Windows para ISO-8859-5 es la página de códigos 28595 , también conocida como Windows-28595 . ^[3] IBM asignó la página de códigos 915 a ISO-8859-5 hasta que se amplió esa página de códigos.

Disposición de la página de códigos

Las diferencias con la norma ISO 8859-1 se muestran con su punto de código Unicode equivalente.

Historial y páginas de códigos relacionados

La norma ECMA-113 ha sido equivalente a la ISO-8859-5 desde su segunda edición, ^[4] siendo su primera edición ( ISO-IR-111 ) una extensión de la anterior KOI-8 (definida por GOST 19768-74), que dispone las letras rusas de la misma manera que sus equivalentes romanos ASCII siempre que sea posible. El borrador inicial de la ISO-8859-5 (DIS-8859-5:1987) siguió a la ISO-IR-111, pero fue revisada ^[4] después de que la GOST 19768-74 fuera reemplazada ^[5] por la nueva ISO-IR-153 en 1987, que reorganizó las letras rusas en orden alfabético (excepto Ё). ^[5]^[6] La norma ISO-IR-153 contiene las letras rusas, incluida la Ё, y el espacio indivisible y el guión suave, mientras que el conjunto cirílico completo de la norma ISO-8859-5 también se denomina ISO-IR-144. ^[7]

Posiblemente como consecuencia de esta confusión, RFC 1345 enumera erróneamente otra página de códigos como "ISO-IR-111", que combina el orden de las letras y el orden de las mayúsculas y minúsculas de ISO-8859-5 con el orden de las filas de ISO-IR-111 (y, en consecuencia, no es compatible con ninguno de los dos en la práctica, pero en la práctica es parcialmente compatible ^[2] con Windows-1251 ). ^[8]^[2]

La página de códigos IBM 915 es una extensión de la norma ISO/IEC 8859-5, que añade algunos símbolos semigráficos y de otro tipo en el área C1 . La página de códigos IBM 1124 es prácticamente idéntica a la ISO-8859-5, pero reemplaza ѓ por ґ para su uso en ucraniano .

La ISO-IR-200 , "Uralic Supplementary Cyrillic Set", ^[9] fue registrada en 1998 por Everson Gunn Teoranta (de la que Michael Everson era director, antes de la fundación de Evertype en 2001), ^[10] y cambia varias de las letras no rusas para admitir los idiomas kildin sami , komi y nenets , no admitidos por la propia ISO-8859-5. Michael Everson también introdujo Mac OS Barents Cyrillic para los mismos idiomas en Mac OS clásico. FreeDOS lo llama página de códigos 59283. [ ^11]

El ISO-IR-201, "Volgaic Supplementary Cyrillic Set", ^[12] fue introducido de manera similar por Everson Gunn Teoranta para dar soporte a los idiomas chuvasio , komi , mari y udmurto , hablados en las repúblicas titulares de Rusia . FreeDOS lo llama página de códigos 58259. [ ^13]

Referencias

^ Conjuntos de caracteres, Autoridad de Números Asignados en Internet (IANA), 12 de diciembre de 2018.
^ abc Nechayev, Valentin (2013) [2001]. «Revisión del universo de codificaciones cirílicas de 8 bits». Archivado desde el original el 5 de diciembre de 2016. Consultado el 5 de diciembre de 2016 .
^ "Identificadores de páginas de códigos". 7 de enero de 2021.
^ ab "ECMA-113 - Ecma Internacional" (PDF) .
^ ab Czyborra, Roman (1998-11-30) [1998-05-25]. "La sopa de caracteres cirílicos". Archivado desde el original el 2016-12-03 . Consultado el 2016-12-03 .
^ "archivo gost19768-87 TXT.GZ".
^ Asociación Europea de Fabricantes de Ordenadores (1 de mayo de 1988). Parte cirílica del alfabeto latino/cirílico (PDF) . ITSCJ/ IPSJ . ISO-IR -144.
^ Sokolov, Michael (5 de abril de 2003). "ECMA-cyrillic alias iso-ir-111 sore". Lista de correo de conjuntos de caracteres de la IETF (lista de correo).
^ ab Autoridad Nacional de Normalización de Irlanda. Conjunto cirílico suplementario urálico (PDF) . ITSCJ/ IPSJ . ISO-IR -200.
^ Gunn, Marion; Everson, Michael (20 de septiembre de 2001). "Everson Gunn Teoranta (EGT) y Everson Typography". Lista de correo Unicode (lista de correo).
^ "Cpi/CPIISO/Codepage.TXT en master · FDOS/Cpi". GitHub .
^ ab Autoridad Nacional de Normalización de Irlanda. Conjunto cirílico suplementario volgaico (PDF) . ITSCJ/ IPSJ . ISO-IR -201.
^ "Cpi/CPIISO/Codepage.TXT en master · FDOS/Cpi". GitHub .

Enlaces externos

ISO-IR 144 Parte cirílica del alfabeto latino/cirílico (1 de mayo de 1988, de la segunda versión de ISO 8859-5)
ISO/IEC 8859-5:1999
Norma ECMA-113: Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabeto latino/cirílico, 3.ª edición (diciembre de 1999)