stringtranslate.com

ISO/IEC 8859-8

ISO/IEC 8859-8 , Tecnología de la información — Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits — Parte 8: Alfabeto latino/hebreo , es parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII . ISO/IEC 8859-8:1999 de 1999 representa su segunda y actual revisión, precedida por la primera edición ISO/IEC 8859-8:1988 en 1988. Se le conoce informalmente como latín/hebreo . ISO/IEC 8859-8 cubre todas las letras hebreas , pero ningún signo vocálico hebreo . IBM le asignó la página de códigos 916 ( CCSID 916 y 5012). [2] [3] [4] Este conjunto de caracteres también fue adoptado por la norma israelí SI1311:2002, con algunas extensiones.

ISO-8859-8 es el nombre de conjunto de caracteres preferido por la IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429. El texto está (normalmente) en orden lógico, por lo que se requiere procesamiento bidireccional para su visualización. Nominalmente , ISO-8859-8 ( página de códigos 28598 ) es para “orden visual”, e ISO-8859-8- I ( página de códigos 38598 ) es para orden lógico. Pero normalmente en la práctica, y requerido para documentos XML, [ cita requerida ] ISO-8859-8 también significa texto en orden lógico. El estándar de codificación WHATWG utilizado por HTML5 trata a ISO-8859-8 e ISO-8859-8- I como codificaciones distintas con la misma asignación debido a la influencia en la dirección del diseño, pero señala que esto ya no se aplica a ISO-8859-6 (árabe), solo a ISO-8859-8. [5]

También existe la norma ISO-8859-8-E , que supuestamente requiere que la direccionalidad se especifique explícitamente con caracteres de control especiales; esta última variante en la práctica no se utiliza.

La página de códigos de Microsoft Windows para el hebreo, Windows-1255 , es en su mayor parte una extensión de la norma ISO/IEC 8859-8 sin controles C1, excepto por la omisión del doble guión bajo y el reemplazo del signo monetario genérico ( ¤ ) por el signo sheqel (₪). Agrega compatibilidad con puntos vocálicos como caracteres de combinación y algunos signos de puntuación adicionales.

Más de una década después de la publicación de esa norma, se prefiere Unicode , al menos para Internet [6] (es decir, UTF-8 , la codificación dominante para páginas web). ISO-8859-8 es utilizado por menos del 0,1% de los sitios web. [7]

Diseño de la página de códigos

  Diferente tanto del DEC hebreo (8 bits) como del ISO-8859-1 .

FD es una marca de izquierda a derecha (U+200E) y FE es una marca de derecha a izquierda (U+200F), como se especifica en una enmienda más reciente como ISO/IEC 8859-8:1999.

Ampliaciones de la norma israelí de 2002

La norma israelí SI1311:2002 coincide con la ISO/IEC 8859-8:1999, excepto por una serie de asignaciones de caracteres adicionales para el símbolo del euro , el símbolo del nuevo shekel y un formato bidireccional explícito más avanzado . [12]

  Ausente en ISO/IEC 8859-8:1999, añadido en SI1311:2002.

Véase también

Referencias

  1. ^ Conjuntos de caracteres, Autoridad de Números Asignados en Internet (IANA), 12 de diciembre de 2018
  2. ^ "Documento informativo de la página de códigos 916". Archivado desde el original el 16 de febrero de 2017.
  3. ^ "Documento informativo del CCSID 916". Archivado desde el original el 29 de noviembre de 2014.
  4. ^ "Documento informativo del CCSID 5012". Archivado desde el original el 27 de marzo de 2016.
  5. ^ van Kesteren, Anne . "9. Codificaciones heredadas de un solo byte". Estándar de codificación . WHATWG . Nota: ISO-8859-8 e ISO-8859-8- I son nombres de codificación distintos, porque ISO-8859-8 tiene influencia en la dirección del diseño. Y aunque históricamente esto podría haber sido el caso también para ISO-8859-6 e "ISO-8859-6- I ", eso ya no es así.
  6. ^ John, Nicholas A. (2013). "La construcción de la Internet multilingüe: Unicode, hebreo y globalización". Journal of Computer-Mediated Communication . 18 (3): 321–338. doi : 10.1111/jcc4.12015 . ISSN  1083-6101. Antecedentes: el problema del hebreo e Internet
  7. ^ "Estadísticas de uso de la norma ISO-8859-8 para sitios web, enero de 2019". w3techs.com . Consultado el 17 de enero de 2019 .
  8. ^ Página de códigos CPGID 00916 (pdf) (PDF) , IBM
  9. ^ Página de códigos CPGID 00916 (txt), IBM
  10. ^ Componentes internacionales para Unicode (ICU), ibm-916_P100-1995.ucm, 3 de diciembre de 2002
  11. ^ Componentes internacionales para Unicode (ICU), ibm-5012_P100-1999.ucm, 3 de diciembre de 2002
  12. ^ ab Institución de Normas de Israel . ISO-IR-234: Conjunto de caracteres latinos/hebreos para códigos de 8 bits (PDF) . ITSCJ/ IPSJ .

Enlaces externos