Familia de varias páginas de códigos para el alfabeto cirílico
KOI ( КОИ ) es una familia de varias páginas de códigos para la escritura cirílica . El nombre significa K od o bmena i nformatsiey ( ruso : К од о бмена и нформацией ) que significa "Código para el intercambio de información".
Una característica particular de las páginas de códigos KOI es que el texto sigue siendo legible para los humanos cuando se elimina el bit más a la izquierda , en caso de que pase inadvertidamente por un equipo o software que solo puede procesar caracteres de 7 bits de ancho. Esto se debe a que los caracteres se colocan en un orden especial (128 puntos de código aparte de la letra latina a la que suenan más similares), que, sin embargo, no corresponde al orden alfabético en ningún idioma escrito en cirílico y requiere el uso de tablas de búsqueda para realizar la clasificación .
Estas codificaciones se derivan del ASCII sobre la base de cierta correspondencia entre el latín y el cirílico (casi fonético), que ya se utilizaba en el dialecto ruso del código Morse y en el código telegráfico MTK-2 . Los primeros 26 caracteres a partir de А (0xE1) en KOI8-R son А, Б, Ц, Д, Е, Ф, Г, Х, И, Й, К, Л, М, Н, О, П, Я, Р, С, Т, У, Ж, В, Ь, Ы, З.
Koi-7
La codificación KOI original (1967) era una página de códigos de 7 bits denominada KOI-7 ( КОИ-7 ), que no contenía letras minúsculas. En KOI-7, los códigos de las 31 o 32 letras rusas están ordenados según las letras latinas. Los demás puntos de código son los mismos que en ASCII (sin embargo, el signo de dólar $ (punto de código 24 hexadecimal ) puede reemplazarse por el signo monetario universal ¤).
Koi-8
KOI-8 (КОИ-8), estandarizado en 1974 como GOST 19768, es una extensión de 8 bits de ASCII . [1] [2] Originalmente solo incluía 32 letras rusas minúsculas y 31 mayúsculas.
Los derivados posteriores de KOI-8 constituyen la familia de codificaciones conocidas como KOI8 , KOI 8 y KOI-8 .
Los miembros de la familia son:
Además, GOST R 34.303-92 define "KOI-8 V1", que es ISO-IR-153 , y "KOI-8 N1" y "KOI-8 N2" , que son variantes de la página de códigos 866. [16] Estos no siguen el diseño KOI-8.
DKOI
DKOI es una codificación basada en EBCDIC que se utiliza en mainframes ES EVM . Se ha definido en varios estándares: GOST 19768-74 / ST SEV 358–76, ST SEV 358-88 / GOST 19768–93, CSN 36 9103. [17]
Existen dos variantes:
- DKOI K1 (ДКОИ К1), a cada letra cirílica se le asigna su propio punto de código.
- DKOI K2 (ДКОИ К2), algunas letras cirílicas (А, В, Е, К, M, Н, О, Р, С, Т, Х, а, е, о, р, с, у, х) se fusionan con letras latinas visualmente idénticas.
Variantes latinas
Algunas codificaciones se denominan KOI, pero definen alfabetos latinos:
- KOI8-CS [18] / KOI8-CS2 [17] para checo y eslovaco (ČSN (norma técnica checa) 369103, ideada por el Comecon . Esta codificaba el latín con diacríticos , como se usa en checo y eslovaco, en lugar del cirílico, pero la idea básica era la misma: el texto debería seguir siendo legible con el octavo bit borrado, así, por ejemplo, Č se convirtió en C, etc.).
- KOI8-L2 "Latin-2" (definido en CSN 36 9103), ISO IR 139 [19] (casi idéntico a ISO 8859-2 (1987), pero tiene el signo de dólar y el signo de moneda intercambiados)
- DKOI CS2 (definido en CSN 36 9103) [17]
- DKOI L2 (definido en CSN 36 9103) [17]
Referencias
- ^ ab Czyborra, Roman (1998-11-30) [1998-05-25]. "La sopa de caracteres cirílicos". Archivado desde el original el 2016-12-03 . Consultado el 2016-12-03 .
- ^ Flohr, Guido; Chernov, Andrey A. (2016) [2006]. "Locale::RecodeData::KOI_8 - Rutinas de conversión para KOI-8". CPAN libintl-perl . 1.0. Archivado desde el original el 15 de enero de 2017 . Consultado el 15 de enero de 2017 .
- ^ ab da Cruz, Frank (2010-04-02). "Kermit and MIME Character-Set Names". The Kermit Project . Universidad de Columbia , Nueva York, EE. UU. Archivado desde el original el 2016-12-03 . Consultado el 2016-12-02 .
- ^ Demchenko, Yuri V. (13 de noviembre de 1997). Registro de un conjunto de caracteres cirílicos ucranianos KOI8-RU (como extensión del ruso KOI8-R e ISO-IR-111) (Informe). Grupo de trabajo de ingeniería de Internet.
- ^ Flohr, Guido (2016) [2006]. "Locale::RecodeData::KOI8_RU - Rutinas de conversión para KOI8-RU". CPAN libintl-perl . Archivado desde el original el 15 de enero de 2017 . Consultado el 15 de enero de 2017 .
- ^ "Información de la página de códigos SBCS - CPGID: 01167 / Nombre: Bielorruso/Ucraniano KOI8-RU". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . IBM . CH 3-3220-050. Archivado desde el original el 2017-02-18 . Consultado el 2017-02-18 .[1] [2]
- ^ "Documento de información del CCSID; CCSID 1167; KOI8-RU". IBM . Archivado desde el original el 18 de febrero de 2017 . Consultado el 18 de febrero de 2017 .
- ^ Leisher, Mark (2008) [1999-12-20]. "Tabla de correspondencia entre el cirílico bielorruso y ucraniano KOI8-RU y Unicode 2.1". Departamento de Ciencias Matemáticas, Universidad Estatal de Nuevo México. Archivado desde el original el 19 de febrero de 2017. Consultado el 18 de febrero de 2017 .
- ^ Flohr, Guido; Davis, Michael (2016) [2006]. "Locale::RecodeData::KOI8_T - Rutinas de conversión para KOI8-T". CPAN libintl-perl . Archivado desde el original el 2017-01-15 . Consultado el 2017-01-15 .
- ^ Discusión
- ^ "Conjuntos de caracteres IANA".
- ^ ECMA-113. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits: alfabeto latino/cirílico (1.ª edición, junio de 1986)
- ^ "Codificaciones cirílicas (Charsets). Pequeña descripción".
- ^ Leisher, Mark (2008) [5 de marzo de 1998]. "Tabla de mapeo de KOI8 Unified Cyrillic to Unicode 2.1". Departamento de Ciencias Matemáticas, Universidad Estatal de Nuevo México. Archivado desde el original el 19 de febrero de 2017. Consultado el 18 de febrero de 2017 .
- ^ Winitzki, Serge (29 de enero de 2002). KOI8-C (Informe). Grupo de trabajo de ingeniería de Internet.
- ^ (en ruso) ГОСТ Р 34.303-92. Наборы 8 bits кодированных символов. Código de 8 bits para información y comentarios. = juegos de caracteres codificados de 8 bits. Código de 8 bits para intercambio de información.
- ^ abcd Petrlik, Lukas (1996-06-19). "Explicación del lío en la codificación de caracteres checos y eslovacos". cs-encodings-faq . 1.10. Archivado desde el original el 2016-06-21 . Consultado el 2016-06-21 .
- ^ "Stanislav Pecha - ASCII". Archivado desde el original el 21 de marzo de 2011. Consultado el 19 de abril de 2011 .
- ^ ISO-IR-139
Lectura adicional
- Kornai, András; Birnbaum, David J.; da Cruz, Frank; Davis, Bur; cazador, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; van Wingen, Johan W. (13 de marzo de 1993). "Preguntas frecuentes sobre codificación cirílica versión 1.3". 1.3 . Consultado el 18 de febrero de 2017 .
- "Kodierungen und Zeichensätze" [Codificaciones y juegos de caracteres]. Robotron Technik (Museo virtual de la informática) (en alemán). 2016-11-29. Código ASCII / Código KOI . Consultado el 21 de febrero de 2017 .
Enlaces externos
- "El hogar del KOI8-R desde 1995". 1995 . Consultado el 5 de diciembre de 2016 .
- Hohlov, Yu. E. "Representación de información cirílica en formato electrónico - Tablas de conjuntos de caracteres (páginas de códigos)". Archivado desde el original el 2016-12-05 . Consultado el 2016-12-05 .
- Nechayev, Valentin (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits". Archivado desde el original el 5 de diciembre de 2016. Consultado el 5 de diciembre de 2016 .