stringtranslate.com

Ventanas-1256

Windows-1256 es una página de códigos utilizada en Microsoft Windows para escribir árabe y otros idiomas que utilizan escritura árabe , como el persa y el urdu .

Esta página de códigos no es compatible con ISO-8859-6 ni con la codificación MacArabic .

Windows-1256 codifica cada letra abstracta del alfabeto árabe básico, no cada forma visual concreta de variantes de forma de letra aislada, inicial, medial, final o ligada (es decir, codifica caracteres, no glifos). Las letras árabes en el rango C0-FF están en orden alfabético árabe, pero algunos caracteres latinos se intercalan entre ellas. Estos son algunos caracteres latinos de Windows-1252 utilizados para el francés , ya que este idioma europeo tiene cierta relevancia histórica en las antiguas colonias francesas en el norte de África, como Marruecos y Argelia . Esto permitió que el texto en francés y árabe se entremezclaran al usar Windows 1256 sin necesidad de cambiar de página de códigos (sin embargo, no se incluyeron letras mayúsculas con diacríticos).

IBM utiliza la página de códigos 1256 ( CCSID 1256, CCSID extendido con el símbolo del euro 5352 y el CCSID extendido adicionalmente 9448) para Windows-1256. [1] [2] [3] [4]

Unicode se prefiere a Windows 1256 en aplicaciones modernas, especialmente en Internet, donde la codificación UTF-8 dominante es la más utilizada para páginas web, incluso para árabe (consulte también la escritura árabe en Unicode , para una cobertura completa, a diferencia de, por ejemplo, Windows 1256 o ISO-8859-6 que no cubren los extras). Menos del 0,03% de todas las páginas web usan Windows-1256 en octubre de 2022, [5] [6] y, si bien esa codificación se usa principalmente para árabe, y es la segunda más popular para ello, solo se usa para el 1,6% del texto árabe en la web.

Conjunto de caracteres

Dado que la página de códigos original dejó 9 valores (bytes) marcados como "NO UTILIZADOS" en la especificación original, [7] estos bytes se usaron más tarde para caracteres adicionales necesarios para la escritura persa-árabe (para los idiomas persa y urdu ), además del símbolo del euro . [8]

La siguiente tabla muestra la versión extendida de Windows-1256. Cada carácter se muestra con su equivalente Unicode y su código decimal.

Aquí se muestra cada letra árabe de forma aislada. Las formas reales de las letras dentro de las palabras árabes se representan mediante una combinación de reglas de software y compatibilidad con fuentes adecuadas.

  Diferencias con Windows-1252

Véase también

Referencias

  1. ^ "Documento informativo de la página de códigos 1256". Archivado desde el original el 3 de marzo de 2016.
  2. ^ "Documento informativo del CCSID 1256". Archivado desde el original el 27 de marzo de 2016.
  3. ^ "Documento informativo del CCSID 5352". Archivado desde el original el 29 de noviembre de 2014.
  4. ^ "Documento informativo del CCSID 9448". Archivado desde el original el 29 de noviembre de 2014.
  5. ^ "Tendencias históricas en el uso de codificaciones de caracteres para sitios web, octubre de 2022". w3techs.com .
  6. ^ "Preguntas frecuentes". w3techs.com .
  7. ^ Documentos archivados. "Página de códigos 1256 de Windows en árabe". docs.microsoft.com .
  8. ^ ab "Tabla de cp1256 a Unicode" (PDF) . www.unicode.org . Consultado el 31 de mayo de 2019 .
  9. ^ Asignaciones Unicode de Windows 1256 con "mejor ajuste"
  10. ^ Página de códigos CPGID 01256 (pdf) (PDF) , IBM
  11. ^ Página de códigos CPGID 01256 (txt), IBM
  12. ^ Componentes internacionales para Unicode (ICU), ibm-1256_P110-1997.ucm, 3 de diciembre de 2002
  13. ^ Componentes internacionales para Unicode (ICU), ibm-5352_P100-1998.ucm, 3 de diciembre de 2002
  14. ^ Componentes internacionales para Unicode (ICU), ibm-9448_X100-2005.ucm, 15 de noviembre de 2005

Enlaces externos