stringtranslate.com

KOI8-R

KOI8-R (RFC 1489) es una codificación de caracteres de 8 bits , derivada de la codificación KOI-8 del programador Andrei Chernov en 1993 y diseñada para cubrir el ruso , que utiliza un alfabeto cirílico . KOI8-R se basó en el código Morse ruso , que se creó a partir de una versión fonética del código Morse latino . Como resultado, las letras cirílicas rusas están en orden pseudorromano en lugar del orden alfabético cirílico normal. Aunque esto puede parecer poco natural, si se elimina el octavo bit, el texto es parcialmente legible en ASCII y puede convertirse a KOI-7 sintácticamente correcto . Por ejemplo, "Код Обмена Информацией" en KOI8-R se convierte en kOD oBMENA iNFORMACIEJ (el significado ruso del acrónimo "KOI").

KOI8 significa Kod Obmena Informatsiey, 8 bit ( en ruso : Код Обмена Информацией, 8 бит ), que significa "Código para el intercambio de información, 8 bits". En Microsoft Windows , a KOI8-R se le asigna el número de página de códigos 20866. En IBM , a KOI8-R se le asigna la página de códigos 878. [1] [2] KOI8-R también cubre el búlgaro , pero no se ha utilizado para ese propósito desde que se aceptó CP1251 . El uso de estas páginas de códigos más antiguas se está reemplazando con Unicode como una forma más común de representar el cirílico junto con otros idiomas.

Unicode es el preferido sobre KOI-8 y sus variantes u otras codificaciones cirílicas en aplicaciones modernas, especialmente en Internet, lo que hace que UTF-8 sea la codificación dominante para páginas web. KOI8-R, la variante más popular, es utilizada por menos del 0,004% de los sitios web, que son principalmente rusos y búlgaros. Sin embargo, ambos grupos prefieren otras codificaciones. [ cita requerida ] Para una discusión más detallada sobre la cobertura completa de Unicode de 436 letras/puntos de código cirílicos, incluido el cirílico antiguo , y cómo las codificaciones de caracteres de un solo byte, como Windows-1251 y las variantes KOI8, no pueden proporcionar esto, consulte Escritura cirílica en Unicode .

Conjunto de caracteres

La siguiente tabla muestra la codificación KOI8-R. Cada carácter se muestra con su punto de código Unicode equivalente .

Véase también

Referencias

  1. ^ "Información de la página de códigos SBCS - CPGID: 00878 / Nombre: Internet ruso koi8-r". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . IBM . CH 3-3220-050. Archivado desde el original el 2017-02-18 . Consultado el 2017-02-18 .
  2. ^ "Documento de información del CCSID; CCSID 878; KOI8-R CIRÍLICO". IBM . Consultado el 18 de febrero de 2017 .
  3. ^ Richter, Helmut (4 de enero de 2016) [18 de agosto de 1999]. «KOI8-R.TXT». 2.0 . Consultado el 9 de diciembre de 2016 .
  4. ^ Página de códigos CPGID 00878 (pdf) (PDF) , IBM
  5. ^ Página de códigos CPGID 00878 (txt), IBM
  6. ^ Componentes internacionales para Unicode (ICU), ibm-878_P100-1996.ucm, 3 de diciembre de 2002

Lectura adicional

Enlaces externos