stringtranslate.com

Codificaciones de caracteres KOI

KOI ( КОИ ) es una familia de varias páginas de códigos para la escritura cirílica . El nombre significa K od o bmena i nformatsiey ( ruso : К од о бмена и нформацией ) que significa "Código para el intercambio de información".

Una característica particular de las páginas de códigos KOI es que el texto sigue siendo legible para los humanos cuando se elimina el bit más a la izquierda , en caso de que pase inadvertidamente por un equipo o software que solo puede procesar caracteres de 7 bits de ancho. Esto se debe a que los caracteres se colocan en un orden especial (128 puntos de código aparte de la letra latina a la que suenan más similares), que, sin embargo, no corresponde al orden alfabético en ningún idioma escrito en cirílico y requiere el uso de tablas de búsqueda para realizar la clasificación .

Estas codificaciones se derivan del ASCII sobre la base de cierta correspondencia entre el latín y el cirílico (casi fonético), que ya se utilizaba en el dialecto ruso del código Morse y en el código telegráfico MTK-2 . Los primeros 26 caracteres a partir de А (0xE1) en KOI8-R son А, Б, Ц, Д, Е, Ф, Г, Х, И, Й, К, Л, М, Н, О, П, Я, Р, С, Т, У, Ж, В, Ь, Ы, З.

Koi-7

La codificación KOI original (1967) era una página de códigos de 7 bits denominada KOI-7 ( КОИ-7 ), que no contenía letras minúsculas. En KOI-7, los códigos de las 31 o 32 letras rusas están ordenados según las letras latinas. Los demás puntos de código son los mismos que en ASCII (sin embargo, el signo de dólar $ (punto de código 24 hexadecimal ) puede reemplazarse por el signo monetario universal ¤).

Koi-8

KOI-8 (КОИ-8), estandarizado en 1974 como GOST 19768, es una extensión de 8 bits de ASCII . [1] [2] Originalmente solo incluía 32 letras rusas minúsculas y 31 mayúsculas.

Los derivados posteriores de KOI-8 constituyen la familia de codificaciones conocidas como KOI8 , KOI 8 y KOI-8 .

Los miembros de la familia son:

Además, GOST R 34.303-92 define "KOI-8 V1", que es ISO-IR-153 , y "KOI-8 N1" y "KOI-8 N2" , que son variantes de la página de códigos 866. [16] Estos no siguen el diseño KOI-8.

DKOI

DKOI es una codificación basada en EBCDIC que se utiliza en mainframes ES EVM . Se ha definido en varios estándares: GOST 19768-74 / ST SEV 358–76, ST SEV 358-88 / GOST 19768–93, CSN 36 9103. [17]

Existen dos variantes:

Variantes latinas

Algunas codificaciones se denominan KOI, pero definen alfabetos latinos:

Referencias

  1. ^ ab Czyborra, Roman (1998-11-30) [1998-05-25]. "La sopa de caracteres cirílicos". Archivado desde el original el 2016-12-03 . Consultado el 2016-12-03 .
  2. ^ Flohr, Guido; Chernov, Andrey A. (2016) [2006]. "Locale::RecodeData::KOI_8 - Rutinas de conversión para KOI-8". CPAN libintl-perl . 1.0. Archivado desde el original el 15 de enero de 2017 . Consultado el 15 de enero de 2017 .
  3. ^ ab da Cruz, Frank (2010-04-02). "Kermit and MIME Character-Set Names". The Kermit Project . Universidad de Columbia , Nueva York, EE. UU. Archivado desde el original el 2016-12-03 . Consultado el 2016-12-02 .
  4. ^ Demchenko, Yuri V. (13 de noviembre de 1997). Registro de un conjunto de caracteres cirílicos ucranianos KOI8-RU (como extensión del ruso KOI8-R e ISO-IR-111) (Informe). Grupo de trabajo de ingeniería de Internet.
  5. ^ Flohr, Guido (2016) [2006]. "Locale::RecodeData::KOI8_RU - Rutinas de conversión para KOI8-RU". CPAN libintl-perl . Archivado desde el original el 15 de enero de 2017 . Consultado el 15 de enero de 2017 .
  6. ^ "Información de la página de códigos SBCS - CPGID: 01167 / Nombre: Bielorruso/Ucraniano KOI8-RU". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . IBM . CH 3-3220-050. Archivado desde el original el 2017-02-18 . Consultado el 2017-02-18 .[1] [2]
  7. ^ "Documento de información del CCSID; CCSID 1167; KOI8-RU". IBM . Archivado desde el original el 18 de febrero de 2017 . Consultado el 18 de febrero de 2017 .
  8. ^ Leisher, Mark (2008) [1999-12-20]. "Tabla de correspondencia entre el cirílico bielorruso y ucraniano KOI8-RU y Unicode 2.1". Departamento de Ciencias Matemáticas, Universidad Estatal de Nuevo México. Archivado desde el original el 19 de febrero de 2017. Consultado el 18 de febrero de 2017 .
  9. ^ Flohr, Guido; Davis, Michael (2016) [2006]. "Locale::RecodeData::KOI8_T - Rutinas de conversión para KOI8-T". CPAN libintl-perl . Archivado desde el original el 2017-01-15 . Consultado el 2017-01-15 .
  10. ^ Discusión
  11. ^ "Conjuntos de caracteres IANA".
  12. ^ ECMA-113. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits: alfabeto latino/cirílico (1.ª edición, junio de 1986)
  13. ^ "Codificaciones cirílicas (Charsets). Pequeña descripción".
  14. ^ Leisher, Mark (2008) [5 de marzo de 1998]. "Tabla de mapeo de KOI8 Unified Cyrillic to Unicode 2.1". Departamento de Ciencias Matemáticas, Universidad Estatal de Nuevo México. Archivado desde el original el 19 de febrero de 2017. Consultado el 18 de febrero de 2017 .
  15. ^ Winitzki, Serge (29 de enero de 2002). KOI8-C (Informe). Grupo de trabajo de ingeniería de Internet.
  16. ^ (en ruso) ГОСТ Р 34.303-92. Наборы 8 bits кодированных символов. Código de 8 bits para información y comentarios. = juegos de caracteres codificados de 8 bits. Código de 8 bits para intercambio de información.
  17. ^ abcd Petrlik, Lukas (1996-06-19). "Explicación del lío en la codificación de caracteres checos y eslovacos". cs-encodings-faq . 1.10. Archivado desde el original el 2016-06-21 . Consultado el 2016-06-21 .
  18. ^ "Stanislav Pecha - ASCII". Archivado desde el original el 21 de marzo de 2011. Consultado el 19 de abril de 2011 .
  19. ^ ISO-IR-139

Lectura adicional

Enlaces externos