Codificación de caracteres
KOI8-R (RFC 1489) es una codificación de caracteres de 8 bits , derivada de la codificación KOI-8 realizada por el programador Andrei Chernov en 1993 y diseñada para abarcar el ruso , que utiliza un alfabeto cirílico . KOI8-R se basó en el código Morse ruso , que se creó a partir de una versión fonética del código Morse latino . Como resultado, las letras cirílicas rusas están en orden pseudorromano en lugar del orden alfabético cirílico normal. Aunque esto puede parecer antinatural, si se elimina el octavo bit, el texto es parcialmente legible en ASCII y puede convertirse a KOI-7 sintácticamente correcto . Por ejemplo, "Русский Текст" en KOI8-R se convierte en rUSSKIJ tEKST ("Texto ruso").
KOI8 significa Kod Obmena Informatsiey, 8 bits ( ruso : Код Обмена Информацией, 8 бит ), que significa "Código para intercambio de información, 8 bits". En Microsoft Windows , a KOI8-R se le asigna el número de página de códigos 20866. En IBM , a KOI8-R se le asigna la página de códigos 878. [1] [2] KOI8-R también cubre el búlgaro , pero no se ha utilizado para ese propósito. desde que se aceptó el CP1251 . El uso de estas páginas de códigos más antiguas se está reemplazando por Unicode como una forma más común de representar el cirílico junto con otros idiomas.
Se prefiere Unicode a KOI-8 y sus variantes u otras codificaciones cirílicas en aplicaciones modernas, especialmente en Internet, lo que convierte a UTF-8 en la codificación dominante para páginas web. KOI8-R, la variante más popular, es utilizada por menos del 0,004% de los sitios web, principalmente rusos y búlgaros. Sin embargo, ambos grupos prefieren otras codificaciones. [ cita necesaria ] Para obtener más información sobre la cobertura completa de Unicode de 436 letras/puntos de código cirílicos, incluido el cirílico antiguo , y cómo las codificaciones de caracteres de un solo byte, como las variantes Windows-1251 y KOI8, no pueden proporcionar esto, consulte Escritura cirílica en Unicode. .
Conjunto de caracteres
La siguiente tabla muestra la codificación KOI8-R. Cada carácter se muestra con su punto de código Unicode equivalente.
Ver también
Referencias
- ^ "Información de la página de códigos SBCS - CPGID: 00878 / Nombre: Internet ruso koi8-r". Software IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . IBM . CH 3-3220-050. Archivado desde el original el 18 de febrero de 2017 . Consultado el 18 de febrero de 2017 .
- ^ "Documento informativo CCSID; CCSID 878; KOI8-R CYRILLIC". IBM . Consultado el 18 de febrero de 2017 .
- ^ Richter, Helmut (4 de enero de 2016) [18 de agosto de 1999]. "KOI8-R.TXT". 2.0 . Consultado el 9 de diciembre de 2016 .
- ^ Página de códigos CPGID 00878 (pdf) (PDF) , IBM
- ^ Página de códigos CPGID 00878 (txt), IBM
- ^ Componentes internacionales para Unicode (ICU), ibm-878_P100-1996.ucm, 3 de diciembre de 2002
Otras lecturas
- Flohr, Guido; Beso, Gabor; Chernov, Andrey A. (2016) [2006]. "Locale::RecodeData::KOI8_R - Rutinas de conversión para KOI8-R". CPAN libintl-perl . 1.0. Archivado desde el original el 15 de enero de 2017 . Consultado el 15 de enero de 2017 .
- Kostis, Kosta. "koi8-r (codificación rusa U*IX, también utilizada por RELCOM)". 1.20. Archivado desde el original el 16 de enero de 2017 . Consultado el 16 de enero de 2017 .
- RFC 1489
- "KOI8-R (RFC 1489)". Kermit . Universidad de Colombia . Consultado el 24 de junio de 2020 .
- Kornai, Andras; Birnbaum, David J.; da Cruz, Frank; Davis, Bur; cazador, George; Paine, Richard B.; Paperno, Slava; Simonsen, Keld J.; Thobe, Glenn E.; Vulis, Dimitri; van Wingen, Johan W. (13 de marzo de 1993). "Preguntas frecuentes sobre codificación cirílica versión 1.3". 1.3 . Consultado el 24 de junio de 2020 .
enlaces externos
- Decodificador cirílico universal, un programa en línea que puede ayudar a recuperar textos cirílicos con KOI8-R roto u otras codificaciones de caracteres .
- "El hogar del KOI8-R desde 1995". 1995 . Consultado el 5 de diciembre de 2016 .
- Czyborra, romano (30 de noviembre de 1998) [25 de mayo de 1998]. "La sopa de caracteres cirílicos". Archivado desde el original el 3 de diciembre de 2016 . Consultado el 3 de diciembre de 2016 .
- Hohlov, Yu. E. "Representación de información cirílica en formato electrónico - Tablas de juegos de caracteres (página de códigos)". Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .
- Nechayev, Valentín (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits". Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .