stringtranslate.com

Norma ISO-IR-111

ISO-IR-111 [1] o KOI8-E [2] es un conjunto de caracteres de 8 bits. Es una extensión multinacional de KOI-8 para bielorruso , macedonio , serbio y ucraniano (excepto Ґ ґ, que se añade a KOI8-F ). El nombre "ISO-IR-111" hace referencia a su número de registro en el registro ISO-IR y lo denota como un conjunto utilizable con ISO/IEC 2022 .

Fue definido por la primera edición (1986) de ECMA-113, [3] que es el estándar internacional de Ecma correspondiente a ISO/IEC 8859-5 , y como tal también corresponde a una versión borrador de 1987 de ISO-8859-5. [4] Las ediciones publicadas de ISO/IEC 8859-5 corresponden en cambio a ediciones posteriores de ECMA-113, que define una codificación diferente. [5]

Confusión de nombres

La ISO-IR-111, la edición de 1985 de la ECMA-113 (también denominada "ECMA-Cyrillic" o "KOI8-E"), se basó en la edición de 1974 de GOST 19768 (es decir, KOI-8 ). En 1987, se rediseñó la ECMA-113. [5] Estas ediciones más nuevas de la ECMA-113 son equivalentes a la ISO-8859-5 , [5] [6] y no siguen el diseño de la KOI. Esta confusión ha llevado a una idea errónea común de que la ISO-8859-5 se definió en la GOST 19768-74 o se basó en ella. [6]

Posiblemente como otra consecuencia de esto, RFC  1345 enumera erróneamente una página de códigos diferente bajo los nombres "ISO-IR-111" y "ECMA-Cyrillic", similar a ISO-8859-5 con filas reordenadas y parcialmente compatible con Windows-1251 . [7] [6] Debido a las preocupaciones de que las implementaciones existentes podrían usar la definición RFC 1345 para esas dos etiquetas, se propuso que la IANA también la reconociera KOI8-Ecomo una etiqueta para el contenido ECMA-113:1985, [7] y la IANA actualmente enumera esa etiqueta como un alias. [2]

Conjunto de caracteres

La siguiente tabla muestra la codificación ISO-IR-111. Cada carácter se muestra con su punto de código Unicode equivalente .

Versiones ampliadas y modificadas

Una versión modificada denominada KOI8 Unified o KOI8-F se utilizó en el software producido por Fingertip Software, agregando el Ґ en su ubicación KOI8-U (reemplazando el guión suave y desplazando el signo monetario universal ), y agregando algunos caracteres gráficos en el área de códigos de control C1 , principalmente de KOI8-R y Windows-1251 . [4] [6] [8] [9]

Página de códigos RFC 1345 incorrecta

RFC  1345 enumera erróneamente una página de códigos diferente bajo el nombre ISO-IR-111, que codifica los mismos caracteres cirílicos pero con un diseño diferente. Se asemeja a una mezcla de Windows-1251 e ISO-8859-5 . [7] En concreto, la línea A_ corresponde a ISO-8859-5, las líneas C_ a F_ corresponden a Windows-1251 [6] (equivalente a las líneas B_ a E_ de ISO-8859-5), y la línea B_ casi corresponde a la línea F_ de ISO-8859-5, con la excepción de que el § se sustituye por un ¤ .

Algunos códigos se parecen a ISO-IR-111 con mayúsculas y minúsculas invertidas, lo que puede haber contribuido a la confusión. La mayoría difieren y se muestran a continuación.

  Desviación de la norma ISO-IR-111 (excluidas las desviaciones en el caso únicamente)

Véase también

Referencias

  1. ^ ECMA (1 de agosto de 1985). Parte derecha del alfabeto cirílico (PDF) . ITSCJ/ IPSJ . ISO-IR -111.
  2. ^ ab "Conjuntos de caracteres". IANA.
  3. ^ ECMA-113. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits: alfabeto latino/cirílico (1.ª edición, junio de 1986)
  4. ^ ab Czyborra, Roman (1998-11-30) [1998-05-25]. "La sopa de caracteres cirílicos". Archivado desde el original el 2016-12-03 . Consultado el 2016-12-03 .
  5. ^ abc ECMA-113. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits: alfabeto latino/cirílico (2.ª edición, junio de 1988)
  6. ^ abcde Nechayev, Valentin (2013) [2001]. «Revisión del universo de codificaciones cirílicas de 8 bits». Archivado desde el original el 5 de diciembre de 2016. Consultado el 5 de diciembre de 2016 .
  7. ^ abc Sokolov, Michael (5 de abril de 2003). "ECMA-cyrillic alias iso-ir-111 sore". Lista de correo de conjuntos de caracteres de la IETF .
  8. ^ "KOI8 Unified". Fingertip Software. Archivado desde el original el 9 de enero de 1998. Consultado el 11 de febrero de 2020 .
  9. ^ Leisher, Mark (2008) [1998-03-05]. "Tabla de mapeo de KOI8 Unified Cyrillic a Unicode 2.1". Departamento de Ciencias Matemáticas, Universidad Estatal de Nuevo México . Consultado el 2020-05-02 .