Windows-1256 es una página de códigos utilizada en Microsoft Windows para escribir árabe y otros idiomas que utilizan escritura árabe , como el persa y el urdu .
Esta página de códigos no es compatible con ISO-8859-6 ni con la codificación MacArabic .
Windows-1256 codifica cada letra abstracta del alfabeto árabe básico, no cada forma visual concreta de variantes de forma de letra aislada, inicial, medial, final o ligada (es decir, codifica caracteres, no glifos). Las letras árabes en el rango C0-FF están en orden alfabético árabe, pero algunos caracteres latinos se intercalan entre ellas. Estos son algunos caracteres latinos de Windows-1252 utilizados para el francés , ya que este idioma europeo tiene cierta relevancia histórica en las antiguas colonias francesas en el norte de África, como Marruecos y Argelia . Esto permitió que el texto en francés y árabe se entremezclaran al usar Windows 1256 sin necesidad de cambiar de página de códigos (sin embargo, no se incluyeron letras mayúsculas con diacríticos).
IBM utiliza la página de códigos 1256 ( CCSID 1256, CCSID extendido con el símbolo del euro 5352 y el CCSID extendido adicionalmente 9448) para Windows-1256. [1] [2] [3] [4]
Unicode se prefiere a Windows 1256 en aplicaciones modernas, especialmente en Internet, donde la codificación UTF-8 dominante es la más utilizada para páginas web, incluso para árabe (consulte también la escritura árabe en Unicode , para una cobertura completa, a diferencia de, por ejemplo, Windows 1256 o ISO-8859-6 que no cubren los extras). Menos del 0,03% de todas las páginas web usan Windows-1256 en octubre de 2022, [5] [6] y, si bien esa codificación se usa principalmente para árabe, y es la segunda más popular para ello, solo se usa para el 1,6% del texto árabe en la web.
Dado que la página de códigos original dejó 9 valores (bytes) marcados como "NO UTILIZADOS" en la especificación original, [7] estos bytes se usaron más tarde para caracteres adicionales necesarios para la escritura persa-árabe (para los idiomas persa y urdu ), además del símbolo del euro . [8]
La siguiente tabla muestra la versión extendida de Windows-1256. Cada carácter se muestra con su equivalente Unicode y su código decimal.
Aquí se muestra cada letra árabe de forma aislada. Las formas reales de las letras dentro de las palabras árabes se representan mediante una combinación de reglas de software y compatibilidad con fuentes adecuadas.