ISO/IEC 8859-8 , Tecnología de la información — Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits — Parte 8: Alfabeto latino/hebreo , es parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII . ISO/IEC 8859-8:1999 de 1999 representa su segunda y actual revisión, precedida por la primera edición ISO/IEC 8859-8:1988 en 1988. Se le conoce informalmente como latín/hebreo . ISO/IEC 8859-8 cubre todas las letras hebreas , pero ningún signo vocálico hebreo . IBM le asignó la página de códigos 916 ( CCSID 916 y 5012). [2] [3] [4] Este conjunto de caracteres también fue adoptado por la norma israelí SI1311:2002, con algunas extensiones.
ISO-8859-8 es el nombre de conjunto de caracteres preferido por la IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429. El texto está (normalmente) en orden lógico, por lo que se requiere procesamiento bidireccional para su visualización. Nominalmente , ISO-8859-8 ( página de códigos 28598 ) es para “orden visual”, e ISO-8859-8- I ( página de códigos 38598 ) es para orden lógico. Pero normalmente en la práctica, y requerido para documentos XML, [ cita requerida ] ISO-8859-8 también significa texto en orden lógico. El estándar de codificación WHATWG utilizado por HTML5 trata a ISO-8859-8 e ISO-8859-8- I como codificaciones distintas con la misma asignación debido a la influencia en la dirección del diseño, pero señala que esto ya no se aplica a ISO-8859-6 (árabe), solo a ISO-8859-8. [5]
También existe la norma ISO-8859-8-E , que supuestamente requiere que la direccionalidad se especifique explícitamente con caracteres de control especiales; esta última variante en la práctica no se utiliza.
La página de códigos de Microsoft Windows para el hebreo, Windows-1255 , es en su mayor parte una extensión de la norma ISO/IEC 8859-8 sin controles C1, excepto por la omisión del doble guión bajo y el reemplazo del signo monetario genérico ( ¤ ) por el signo sheqel (₪). Agrega compatibilidad con puntos vocálicos como caracteres de combinación y algunos signos de puntuación adicionales.
Más de una década después de la publicación de esa norma, se prefiere Unicode , al menos para Internet [6] (es decir, UTF-8 , la codificación dominante para páginas web). ISO-8859-8 es utilizado por menos del 0,1% de los sitios web. [7]
FD es una marca de izquierda a derecha (U+200E) y FE es una marca de derecha a izquierda (U+200F), como se especifica en una enmienda más reciente como ISO/IEC 8859-8:1999.
La norma israelí SI1311:2002 coincide con la ISO/IEC 8859-8:1999, excepto por una serie de asignaciones de caracteres adicionales para el símbolo del euro , el símbolo del nuevo shekel y un formato bidireccional explícito más avanzado . [12]
Nota: ISO-8859-8 e ISO-8859-8-
I
son nombres de codificación distintos, porque ISO-8859-8 tiene influencia en la dirección del diseño. Y aunque históricamente esto podría haber sido el caso también para ISO-8859-6 e "ISO-8859-6-
I
", eso ya no es así.
Antecedentes: el problema del hebreo e Internet