ISO/IEC 8859-8

ISO/IEC 8859-8 , Tecnología de la información — Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits — Parte 8: Alfabeto latino/hebreo , es parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII . ISO/IEC 8859-8:1999 de 1999 representa su segunda y actual revisión, precedida por la primera edición ISO/IEC 8859-8:1988 en 1988. Se le conoce informalmente como latín/hebreo . ISO/IEC 8859-8 cubre todas las letras hebreas , pero ningún signo vocálico hebreo . IBM le asignó la página de códigos 916 ( CCSID 916 y 5012). ^[2]^[3]^[4] Este conjunto de caracteres también fue adoptado por la norma israelí SI1311:2002, con algunas extensiones.

ISO-8859-8 es el nombre de conjunto de caracteres preferido por la IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429. El texto está (normalmente) en orden lógico, por lo que se requiere procesamiento bidireccional para su visualización. Nominalmente , ISO-8859-8 ( página de códigos 28598 ) es para “orden visual”, e ISO-8859-8- I ( página de códigos 38598 ) es para orden lógico. Pero normalmente en la práctica, y requerido para documentos XML, ^{[ cita requerida ]} ISO-8859-8 también significa texto en orden lógico. El estándar de codificación WHATWG utilizado por HTML5 trata a ISO-8859-8 e ISO-8859-8- I como codificaciones distintas con la misma asignación debido a la influencia en la dirección del diseño, pero señala que esto ya no se aplica a ISO-8859-6 (árabe), solo a ISO-8859-8. ^[5]

También existe la norma ISO-8859-8-E , que supuestamente requiere que la direccionalidad se especifique explícitamente con caracteres de control especiales; esta última variante en la práctica no se utiliza.

La página de códigos de Microsoft Windows para el hebreo, Windows-1255 , es en su mayor parte una extensión de la norma ISO/IEC 8859-8 sin controles C1, excepto por la omisión del doble guión bajo y el reemplazo del signo monetario genérico ( ¤ ) por el signo sheqel (₪). Agrega compatibilidad con puntos vocálicos como caracteres de combinación y algunos signos de puntuación adicionales.

Más de una década después de la publicación de esa norma, se prefiere Unicode , al menos para Internet ^[6] (es decir, UTF-8 , la codificación dominante para páginas web). ISO-8859-8 es utilizado por menos del 0,1% de los sitios web. ^[7]

Diseño de la página de códigos

Diferente tanto del DEC hebreo (8 bits) como del ISO-8859-1 .

FD es una marca de izquierda a derecha (U+200E) y FE es una marca de derecha a izquierda (U+200F), como se especifica en una enmienda más reciente como ISO/IEC 8859-8:1999.

Ampliaciones de la norma israelí de 2002

La norma israelí SI1311:2002 coincide con la ISO/IEC 8859-8:1999, excepto por una serie de asignaciones de caracteres adicionales para el símbolo del euro , el símbolo del nuevo shekel y un formato bidireccional explícito más avanzado . ^[12]

Ausente en ISO/IEC 8859-8:1999, añadido en SI1311:2002.

Véase también

Hebreo DEC de 8 bits (página de códigos DEC similar)
Página de códigos 1255 (similar a la página de códigos de Windows)
SI 960
DEC hebreo de 7 bits

Referencias

^ Conjuntos de caracteres, Autoridad de Números Asignados en Internet (IANA), 12 de diciembre de 2018
^ "Documento informativo de la página de códigos 916". Archivado desde el original el 16 de febrero de 2017.
^ "Documento informativo del CCSID 916". Archivado desde el original el 29 de noviembre de 2014.
^ "Documento informativo del CCSID 5012". Archivado desde el original el 27 de marzo de 2016.
^ van Kesteren, Anne . "9. Codificaciones heredadas de un solo byte". Estándar de codificación . WHATWG . Nota: ISO-8859-8 e ISO-8859-8- I son nombres de codificación distintos, porque ISO-8859-8 tiene influencia en la dirección del diseño. Y aunque históricamente esto podría haber sido el caso también para ISO-8859-6 e "ISO-8859-6- I ", eso ya no es así.
^ John, Nicholas A. (2013). "La construcción de la Internet multilingüe: Unicode, hebreo y globalización". Journal of Computer-Mediated Communication . 18 (3): 321–338. doi : 10.1111/jcc4.12015 . ISSN 1083-6101. Antecedentes: el problema del hebreo e Internet
^ "Estadísticas de uso de la norma ISO-8859-8 para sitios web, enero de 2019". w3techs.com . Consultado el 17 de enero de 2019 .
^ Página de códigos CPGID 00916 (pdf) (PDF) , IBM
^ Página de códigos CPGID 00916 (txt), IBM
^ Componentes internacionales para Unicode (ICU), ibm-916_P100-1995.ucm, 3 de diciembre de 2002
^ Componentes internacionales para Unicode (ICU), ibm-5012_P100-1999.ucm, 3 de diciembre de 2002
^ ab Institución de Normas de Israel . ISO-IR-234: Conjunto de caracteres latinos/hebreos para códigos de 8 bits (PDF) . ITSCJ/ IPSJ .

Enlaces externos

ISO/IEC 8859-8:1999
Estándar ECMA-121: conjuntos de caracteres gráficos codificados de un solo byte de 8 bits: alfabeto latino y hebreo
Norma israelí SI1311:2002 Archivado el 24 de noviembre de 2005 en Wayback Machine (en hebreo)
Registros ISO-IR:
- De ECMA-121:1987 y siguientes ISO/IEC 8859-8:1988: Asociación Europea de Fabricantes de Computadoras (1987-07-31). ISO-IR-138: Alfabeto latino/hebreo (PDF) . ITSCJ/ IPSJ .
- Según ISO/IEC 8859-8:1999 y ECMA-121:2000: Instituto de Normalización de Israel (1998-05-01). ISO-IR-198: Alfabeto latino/hebreo (PDF) . ITSCJ/ IPSJ .
- De SI 1311:2002: Instituto de Normalización de Israel (2004-07-20). ISO-IR-234: Conjunto de caracteres latinos/hebreos para códigos de 8 bits (PDF) . ITSCJ/ IPSJ .