stringtranslate.com

KOI8-R

KOI8-R (RFC 1489) es una codificación de caracteres de 8 bits , derivada de la codificación KOI-8 realizada por el programador Andrei Chernov en 1993 y diseñada para abarcar el ruso , que utiliza un alfabeto cirílico . KOI8-R se basó en el código Morse ruso , que se creó a partir de una versión fonética del código Morse latino . Como resultado, las letras cirílicas rusas están en orden pseudorromano en lugar del orden alfabético cirílico normal. Aunque esto puede parecer antinatural, si se elimina el octavo bit, el texto es parcialmente legible en ASCII y puede convertirse a KOI-7 sintácticamente correcto . Por ejemplo, "Русский Текст" en KOI8-R se convierte en rUSSKIJ tEKST ("Texto ruso").

KOI8 significa Kod Obmena Informatsiey, 8 bits ( ruso : Код Обмена Информацией, 8 бит ), que significa "Código para intercambio de información, 8 bits". En Microsoft Windows , a KOI8-R se le asigna el número de página de códigos 20866. En IBM , a KOI8-R se le asigna la página de códigos 878. [1] [2] KOI8-R también cubre el búlgaro , pero no se ha utilizado para ese propósito. desde que se aceptó el CP1251 . El uso de estas páginas de códigos más antiguas se está reemplazando por Unicode como una forma más común de representar el cirílico junto con otros idiomas.

Se prefiere Unicode a KOI-8 y sus variantes u otras codificaciones cirílicas en aplicaciones modernas, especialmente en Internet, lo que convierte a UTF-8 en la codificación dominante para páginas web. KOI8-R, la variante más popular, es utilizada por menos del 0,004% de los sitios web, principalmente rusos y búlgaros. Sin embargo, ambos grupos prefieren otras codificaciones. [ cita necesaria ] Para obtener más información sobre la cobertura completa de Unicode de 436 letras/puntos de código cirílicos, incluido el cirílico antiguo , y cómo las codificaciones de caracteres de un solo byte, como las variantes Windows-1251 y KOI8, no pueden proporcionar esto, consulte Escritura cirílica en Unicode. .

Conjunto de caracteres

La siguiente tabla muestra la codificación KOI8-R. Cada carácter se muestra con su punto de código Unicode equivalente.

Ver también

Referencias

  1. ^ "Información de la página de códigos SBCS - CPGID: 00878 / Nombre: Internet ruso koi8-r". Software IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . IBM . CH 3-3220-050. Archivado desde el original el 18 de febrero de 2017 . Consultado el 18 de febrero de 2017 .
  2. ^ "Documento informativo CCSID; CCSID 878; KOI8-R CYRILLIC". IBM . Consultado el 18 de febrero de 2017 .
  3. ^ Richter, Helmut (4 de enero de 2016) [18 de agosto de 1999]. "KOI8-R.TXT". 2.0 . Consultado el 9 de diciembre de 2016 .
  4. ^ Página de códigos CPGID 00878 (pdf) (PDF) , IBM
  5. ^ Página de códigos CPGID 00878 (txt), IBM
  6. ^ Componentes internacionales para Unicode (ICU), ibm-878_P100-1996.ucm, 3 de diciembre de 2002

Otras lecturas

enlaces externos