ISO-IR-111 [1] o KOI8-E [2] es un conjunto de caracteres de 8 bits. Es una extensión multinacional de KOI-8 para bielorruso , macedonio , serbio y ucraniano (excepto Ґ ґ, que se añade a KOI8-F ). El nombre "ISO-IR-111" hace referencia a su número de registro en el registro ISO-IR y lo denota como un conjunto utilizable con ISO/IEC 2022 .
Fue definido por la primera edición (1986) de ECMA-113, [3] que es el estándar internacional de Ecma correspondiente a ISO/IEC 8859-5 , y como tal también corresponde a una versión borrador de 1987 de ISO-8859-5. [4] Las ediciones publicadas de ISO/IEC 8859-5 corresponden en cambio a ediciones posteriores de ECMA-113, que define una codificación diferente. [5]
La ISO-IR-111, la edición de 1985 de la ECMA-113 (también denominada "ECMA-Cyrillic" o "KOI8-E"), se basó en la edición de 1974 de GOST 19768 (es decir, KOI-8 ). En 1987, se rediseñó la ECMA-113. [5] Estas ediciones más nuevas de la ECMA-113 son equivalentes a la ISO-8859-5 , [5] [6] y no siguen el diseño de la KOI. Esta confusión ha llevado a una idea errónea común de que la ISO-8859-5 se definió en la GOST 19768-74 o se basó en ella. [6]
Posiblemente como otra consecuencia de esto, RFC 1345 enumera erróneamente una página de códigos diferente bajo los nombres "ISO-IR-111" y "ECMA-Cyrillic", similar a ISO-8859-5 con filas reordenadas y parcialmente compatible con Windows-1251 . [7] [6] Debido a las preocupaciones de que las implementaciones existentes podrían usar la definición RFC 1345 para esas dos etiquetas, se propuso que la IANA también la reconociera KOI8-E
como una etiqueta para el contenido ECMA-113:1985, [7] y la IANA actualmente enumera esa etiqueta como un alias. [2]
La siguiente tabla muestra la codificación ISO-IR-111. Cada carácter se muestra con su punto de código Unicode equivalente .
Una versión modificada denominada KOI8 Unified o KOI8-F se utilizó en el software producido por Fingertip Software, agregando el Ґ en su ubicación KOI8-U (reemplazando el guión suave y desplazando el signo monetario universal ), y agregando algunos caracteres gráficos en el área de códigos de control C1 , principalmente de KOI8-R y Windows-1251 . [4] [6] [8] [9]
RFC 1345 enumera erróneamente una página de códigos diferente bajo el nombre ISO-IR-111, que codifica los mismos caracteres cirílicos pero con un diseño diferente. Se asemeja a una mezcla de Windows-1251 e ISO-8859-5 . [7] En concreto, la línea A_ corresponde a ISO-8859-5, las líneas C_ a F_ corresponden a Windows-1251 [6] (equivalente a las líneas B_ a E_ de ISO-8859-5), y la línea B_ casi corresponde a la línea F_ de ISO-8859-5, con la excepción de que el § se sustituye por un ¤ .
Algunos códigos se parecen a ISO-IR-111 con mayúsculas y minúsculas invertidas, lo que puede haber contribuido a la confusión. La mayoría difieren y se muestran a continuación.