Codificación de caracteres
KOI8-R (RFC 1489) es una codificación de caracteres de 8 bits , derivada de la codificación KOI-8 del programador Andrei Chernov en 1993 y diseñada para cubrir el ruso , que utiliza un alfabeto cirílico . KOI8-R se basó en el código Morse ruso , que se creó a partir de una versión fonética del código Morse latino . Como resultado, las letras cirílicas rusas están en orden pseudorromano en lugar del orden alfabético cirílico normal. Aunque esto puede parecer poco natural, si se elimina el octavo bit, el texto es parcialmente legible en ASCII y puede convertirse a KOI-7 sintácticamente correcto . Por ejemplo, "Код Обмена Информацией" en KOI8-R se convierte en kOD oBMENA iNFORMACIEJ (el significado ruso del acrónimo "KOI").
KOI8 significa Kod Obmena Informatsiey, 8 bit ( en ruso : Код Обмена Информацией, 8 бит ), que significa "Código para el intercambio de información, 8 bits". En Microsoft Windows , a KOI8-R se le asigna el número de página de códigos 20866. En IBM , a KOI8-R se le asigna la página de códigos 878. [1] [2] KOI8-R también cubre el búlgaro , pero no se ha utilizado para ese propósito desde que se aceptó CP1251 . El uso de estas páginas de códigos más antiguas se está reemplazando con Unicode como una forma más común de representar el cirílico junto con otros idiomas.
Unicode es el preferido sobre KOI-8 y sus variantes u otras codificaciones cirílicas en aplicaciones modernas, especialmente en Internet, lo que hace que UTF-8 sea la codificación dominante para páginas web. KOI8-R, la variante más popular, es utilizada por menos del 0,004% de los sitios web, que son principalmente rusos y búlgaros. Sin embargo, ambos grupos prefieren otras codificaciones. [ cita requerida ] Para una discusión más detallada sobre la cobertura completa de Unicode de 436 letras/puntos de código cirílicos, incluido el cirílico antiguo , y cómo las codificaciones de caracteres de un solo byte, como Windows-1251 y las variantes KOI8, no pueden proporcionar esto, consulte Escritura cirílica en Unicode .
Conjunto de caracteres
La siguiente tabla muestra la codificación KOI8-R. Cada carácter se muestra con su punto de código Unicode equivalente .
Véase también
Referencias
- ^ "Información de la página de códigos SBCS - CPGID: 00878 / Nombre: Internet ruso koi8-r". IBM Software: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . IBM . CH 3-3220-050. Archivado desde el original el 2017-02-18 . Consultado el 2017-02-18 .
- ^ "Documento de información del CCSID; CCSID 878; KOI8-R CIRÍLICO". IBM . Consultado el 18 de febrero de 2017 .
- ^ Richter, Helmut (4 de enero de 2016) [18 de agosto de 1999]. «KOI8-R.TXT». 2.0 . Consultado el 9 de diciembre de 2016 .
- ^ Página de códigos CPGID 00878 (pdf) (PDF) , IBM
- ^ Página de códigos CPGID 00878 (txt), IBM
- ^ Componentes internacionales para Unicode (ICU), ibm-878_P100-1996.ucm, 3 de diciembre de 2002
Lectura adicional
- Flohr, Guido; Beso, Gabor; Chernov, Andrey A. (2016) [2006]. "Locale::RecodeData::KOI8_R - Rutinas de conversión para KOI8-R". CPAN libintl-perl . 1.0. Archivado desde el original el 15 de enero de 2017 . Consultado el 15 de enero de 2017 .
- Kostis, Kosta. «koi8-r (codificación rusa U*IX, también utilizada por RELCOM)». 1.20. Archivado desde el original el 2017-01-16 . Consultado el 2017-01-16 .
- RFC 1489
- "KOI8-R (RFC 1489)". Kermit . Universidad de Columbia . Consultado el 24 de junio de 2020 .
- Kornai, András; Birnbaum, David J.; da Cruz, Frank; Davis, Bur; cazador, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; van Wingen, Johan W. (13 de marzo de 1993). "Preguntas frecuentes sobre codificación cirílica versión 1.3". 1.3 . Consultado el 24 de junio de 2020 .
Enlaces externos
- Descodificador cirílico universal, un programa en línea que puede ayudar a recuperar textos cirílicos con codificaciones de caracteres KOI8-R u otras rotas .
- "El hogar del KOI8-R desde 1995". 1995 . Consultado el 5 de diciembre de 2016 .
- Czyborra, Roman (1998-11-30) [1998-05-25]. "La sopa de caracteres cirílicos". Archivado desde el original el 2016-12-03 . Consultado el 2016-12-03 .
- Hohlov, Yu. E. "Representación de información cirílica en formato electrónico - Tablas de conjuntos de caracteres (páginas de códigos)". Archivado desde el original el 2016-12-05 . Consultado el 2016-12-05 .
- Nechayev, Valentin (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits". Archivado desde el original el 5 de diciembre de 2016. Consultado el 5 de diciembre de 2016 .