stringtranslate.com

ISO/IEC 8859-6

ISO/IEC 8859-6:1999 , Tecnología de la información — Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits — Parte 6: Alfabeto latino/árabe , es parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primera edición publicada en 1987. Se la conoce informalmente como latín/árabe . Fue diseñada para cubrir el árabe . Solo se codifican letras nominales, no formas preformadas de las letras, por lo que se requiere un procesamiento de modelado para la visualización. No incluye las letras adicionales necesarias para escribir la mayoría de los idiomas de escritura árabe que no sean el propio árabe (como el persa, el urdu, etc.).

ISO-8859-6 es el nombre de conjunto de caracteres preferido por la IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429. El texto está en orden lógico, por lo que se requiere procesamiento BiDi para su visualización. Nominalmente , ISO-8859-6 ( página de códigos 28596 ) es para "orden visual", e ISO-8859-6-I ( página de códigos 38596 ) es para orden lógico. Pero en la práctica, y requerido para documentos HTML y XML, ISO-8859-6 también significa texto en orden lógico. También existe ISO-8859-6-E que supuestamente requiere que la direccionalidad se especifique explícitamente con caracteres de control especiales; esta última variante en la práctica no se usa. IBM ha asignado la página de códigos/ CCSID 1089 a ISO 8859-6. [2] [3] Es una emulación para su sistema operativo AIX .

ISO-8859-6 se utilizó como estándar de referencia para codificar la escritura árabe en Unicode [4] pero ahora está tecnológicamente obsoleto . [5] Unicode es el preferido en aplicaciones modernas, especialmente en Internet; es decir, la codificación UTF-8 dominante para páginas web (consulte también la escritura árabe en Unicode , para una cobertura completa, a diferencia de, por ejemplo, ISO-8859-6 o Windows 1256 que no cubren los extras). Menos del 0,0002% de todas las páginas web utilizan ISO-8859-6, [6] [7] y ni siquiera es la tercera opción de codificación más popular para el árabe en la web.

Historia

La ASMO 708 fue concebida por la ahora extinta Organización Árabe de Normalización y Metrología [8] en 1986 para que fuera el estándar de 8 bits que se utilizaría en los países de habla árabe. El diseño de este conjunto de caracteres se inspiró en el estándar de 7 bits anterior ( ASMO 449 ), pero no se trata simplemente de que el conjunto de caracteres de 7 bits se haya trasladado a la parte superior; existen algunas diferencias.

ASMO 708 es un conjunto de caracteres bidireccional . La parte inferior del conjunto de caracteres difiere de la norma ISO 646 en los dígitos y en algunos signos de puntuación. Según el contexto (si los números están en escritura latina o árabe), los dígitos se representan como dígitos latinos o árabes. Además, según el contexto, los signos de puntuación simétricos se invierten, es decir, siempre que hay un signo de puntuación inicial, la forma se representa de forma diferente según la dirección de la escritura.

La parte superior del conjunto de caracteres tiene solo letras árabes, puntuación árabe que es diferente de la puntuación latina y algunos otros caracteres.

La ASMO 708 fue diseñada en estrecha colaboración [9] con la ECMA , que la adoptó como su propia norma ECMA-114 en 1986. También fue aprobada como norma ISO como ISO 8859-6 . [10] También se registró en el Registro Internacional de Conjuntos de Caracteres Codificados como IR 127 [11] en 1986.

Relación con otros conjuntos de caracteres

Algunos otros conjuntos de caracteres están relacionados con ASMO 708:

Cuadro de códigos

Los valores de código 0xEB–0xF2 se asignan a los caracteres combinados .

Véase también

Referencias

  1. ^ Conjuntos de caracteres, Autoridad de Números Asignados en Internet (IANA), 12 de diciembre de 2018
  2. ^ "Documento informativo de la página de códigos 1089". Archivado desde el original el 17 de marzo de 2016.
  3. ^ "Documento informativo del CCSID 1089". Archivado desde el original el 27 de marzo de 2016.
  4. ^ "El estándar Unicode v15.0 Capítulo 9" (PDF) .
  5. ^ La informática y el Corán: algunas advertencias, 2007, Thomas Milo
  6. ^ "Estadísticas de uso de la norma ISO-8859-6 para sitios web, octubre de 2022". w3techs.com . Consultado el 25 de octubre de 2022 .
  7. ^ "Preguntas frecuentes".
  8. ^ Le codage informatique de l'écriture arabe: d'ASMO 449 à Unicode et ISO/CEI 10646
  9. ^ Norma ECMA-114
  10. ^ "ISO/IEC 8859-6:1999". Organización Internacional de Normalización . Consultado el 21 de septiembre de 2024 .
  11. ^ Asociación Europea de Fabricantes de Computadoras , Organización Árabe de Normalización y Metrología (30 de noviembre de 1986). Parte derecha del alfabeto latino/árabe (PDF) . ITSCJ/ IPSJ . ISO-IR -127.
  12. ^ ab Manual de referencia del programador de emulación ACA de Printronix
  13. ^ Asociación Europea de Fabricantes de Computadoras (12 de julio de 1992). Conjunto árabe/francés/alemán (PDF) . ITSCJ/ IPSJ . ISO-IR -167.
  14. ^ "ISO 8859-6:1999 a Unicode". 27 de julio de 1999.
  15. ^ Página de códigos CPGID 01089 (pdf) (PDF) , IBM
  16. ^ Página de códigos CPGID 01089 (txt), IBM
  17. ^ Componentes internacionales para Unicode (ICU), ibm-1089_P100-1995.ucm, 3 de diciembre de 2002

Enlaces externos