Muchas escrituras en Unicode , como el árabe , tienen reglas ortográficas especiales que requieren que ciertas combinaciones de formas de letras se combinen en formas de ligadura especiales . En inglés, el signo común (&) se desarrolló a partir de una ligadura en la que se combinaban las letras latinas manuscritas e y t (ortografía et , latín para y ). [1] Las reglas que rigen la formación de ligaduras en árabe pueden ser bastante complejas y requieren tecnologías especiales de configuración de escritura, como el motor caligráfico árabe de DecoType de Thomas Milo. [2]
A partir de Unicode 15.1, la escritura árabe está contenida en los siguientes bloques : [3]
- Árabe (0600–06FF, 256 caracteres)
- Suplemento árabe (0750–077F, 48 caracteres)
- Árabe extendido B (0870–089F, 41 caracteres)
- Árabe extendido A (08A0–08FF, 96 caracteres)
- Formularios de presentación en árabe-A (FB50–FDFF, 631 caracteres)
- Formularios de presentación en árabe B (FE70–FEFF, 141 caracteres)
- Símbolos numéricos de Rumi (10E60–10E7F, 31 caracteres)
- Árabe extendido-C (10EC0-10EFF, 3 caracteres)
- Números índicos Siyaq (1EC70–1ECBF, 68 caracteres)
- Números siyaq otomanos (1ED00–1ED4F, 61 caracteres)
- Símbolos alfabéticos matemáticos árabes (1EE00–1EEFF, 143 caracteres)
El rango árabe básico codifica las letras y signos diacríticos estándar, pero no codifica las formas contextuales (U+0621–U+0652 se basa directamente en ISO 8859-6 ); y también incluye los signos diacríticos y dígitos árabe-índicos más comunes . La gama del Suplemento árabe codifica variantes de letras que se utilizan principalmente para escribir en idiomas africanos (no árabes). Los rangos Árabe Extendido-B y Árabe Extendido-A codifican anotaciones coránicas adicionales y variantes de letras utilizadas para varios idiomas no árabes. La gama Arab Presentation Forms-A codifica formas contextuales y ligaduras de variantes de letras necesarias para los idiomas persa, urdu, sindhi y de Asia central. La gama Arab Presentation Forms-B codifica formas de espaciado de signos diacríticos árabes y formas de letras más contextuales. Los formularios de presentación están presentes sólo por compatibilidad con estándares más antiguos y actualmente no son necesarios para codificar texto. [4]
El bloque de símbolos alfabéticos matemáticos árabes codifica caracteres utilizados en expresiones matemáticas árabes. El bloque de números índicos Siyaq contiene un subconjunto especializado de escritura árabe que se utilizó para la contabilidad en la India bajo el Imperio mogol desde el siglo XVII hasta mediados del siglo XX. [5] [6]
El bloque de números otomanos Siyaq contiene un subconjunto especializado de escritura árabe, también conocido como números Siyakat , utilizados para la contabilidad en documentos turcos otomanos . [6]
Formas contextuales
Una demostración del alfabeto básico utilizado en árabe estándar moderno :
Puntuación y adornos
Sólo el signo de interrogación árabe ⟨ ؟ ⟩ y la coma árabe ⟨ ، ⟩ se usan en la escritura en escritura árabe normal y la coma a menudo se sustituye por la coma en escritura latina ⟨ , ⟩ que también se usa como separador decimal cuando se usan los números arábigos orientales (por ejemplo, ⟨100.6⟩ en comparación a ⟨ ١٠٠,٦ ⟩).
- U+060C ، COMA ÁRABE
- U+060D ؍ SEPARADOR DE FECHA ÁRABE
- U+060E ؎ SIGNO DE VERSO POÉTICO ÁRABE
- U+060F ؏ SIGNO ÁRABE MISRA
- U+061B ؛ PUNTO Y COMA ÁRABE
- U+061E ؞ MARCO DE PUNTUACIÓN DE TRIPLE PUNTO ÁRABE
- U+061F ؟ SIGNO DE INTERROGACIÓN ÁRABE
- U+066D ٭ ESTRELLA ÁRABE DE CINCO PUNTAS
- U+06D4 ۔ ÁRABE PUNTO COMPLETO
- U+06DD FINAL ÁRABE DE AYAH
- U+06DE ۞ INICIO ÁRABE RUB EL HIZB
- U+06E9 ۩ LUGAR ÁRABE DE SAJDAH
- U+06FD ۽ SIGNO ÁRABE
- U+FD3E ﴾ paréntesis izquierdo adornado árabe
- U+FD3F ﴿ paréntesis derecho árabe adornado
Ligaduras de palabras
Los formularios de presentación en árabe A tienen algunos caracteres definidos como "ligaduras de palabras" para los términos que se utilizan con frecuencia en expresiones formulaicas en árabe. Rara vez se utilizan fuera de la mecanografía litúrgica profesional, además el grafema Rial normalmente se escribe completo, no mediante ligadura.
- U+FDF0 ﷰ LIGATURA ÁRABE ( صلى , estilizada como صلے )
- U+FDF1 ﷱ LIGATURA ÁRABE ( قلى , estilizada como قلے )
- U+FDF2 ﷲ LIGATURA ÁRABE ( اللّٰه )
- U+FDF3 ﷳ LIGATURA ÁRABE ( اكبر ), como en la frase الله اكبر Allāhu akbar
- U+FDF4 ﷴ LIGATURA ÁRABE ( محمد )
- U+FDF5 ﷵ LIGATURA ÁRABE ( صلعم , la abreviatura de صلى الله عليه وسلم "la paz sea con él")
- U+FDF6 ﷶ LIGATURA ÁRABE ( رسول )
- U+FDF7 ﷷ LIGATURA ÁRABE ( عليه )
- U+FDF8 ﷸ LIGATURA ÁRABE ( وسلم )
- U+FDF9 ﷹ LIGATURA ÁRABE ( صلى )
- U+FDFA ﷺ LIGATURA ÁRABE ( صلى الله عليه وسلم "la paz sea con él")
- U+FDFB ﷻ LIGATURA ÁRABE ( جل جلاله )
- U+FDFC ﷼ SIGNO RIAL ( ريال )
- U+FDFD ﷽ LIGATURA ÁRABE ( بسم الله الرحمن الرحيم bism-i llāh-i r-raḥmān-i r-raḥīm )
Bloques de código
Arábica
tabla de caracteres
mesa compacta
Suplemento árabe
Árabe extendido-B
Árabe extendido-A
Formas de presentación árabe A
En su mayoría son ligaduras que se pueden crear a partir de los caracteres de los cuadros anteriores, a excepción de los grafemas en forma de corchetes ﴾ ﴿ y algunos de ellos son ligaduras de frases litúrgicas comunes.
Formularios de presentación árabe B
Todos estos se pueden crear a partir de los caracteres del gráfico básico.
Símbolos numéricos de Rumi
Árabe extendido-C
Números índicos Siyaq
Números otomanos Siyaq
Símbolos alfabéticos matemáticos árabes
Referencias
- ^ "¿Cuál es el origen del signo comercial (&)?"
- ^ unicode.org Biografía: Thomas Milo - DecoType
- ^ "UAX n.° 24: archivo de datos de secuencia de comandos". Base de datos de caracteres Unicode . El Consorcio Unicode.
- ^ "Sección 9.2: Árabe, formularios de presentación en árabe-B" (PDF) . El estándar Unicode . El Consorcio Unicode. Septiembre de 2022.
- ^ Pandey, Anshuman (5 de noviembre de 2015). "L2/15-121R2: Propuesta para codificar números índicos Siyaq" (PDF) .
- ^ ab "Capítulo 22: Símbolos". El estándar Unicode, versión 15.0 (PDF) . Mountain View, CA: Unicode, Inc. Septiembre de 2022. ISBN 978-1-936213-32-0.
- ^ Obsoleto a partir de Unicode versión 6.0 Historial de cambios de UCD "La combinación particular de un alef con esta marca vocal debe escribirse con la secuencia <U+0627 LETRA ÁRABE ALEF, U+065F ÁRABE ONDULADA HAMZA ABAJO>, en lugar de con el carácter U +0673 LETRA ÁRABE ALEF CON HAMZA ONDULADA ABAJO, que ha quedado obsoleta y que no es canónicamente equivalente. "Sección 9.2: Árabe, marcas vocales adicionales" (PDF) . El estándar Unicode . El consorcio Unicode. Septiembre de 2022.
enlaces externos
- Oibane. "Problemas de Unicode". Árabe en Linux . Archivado desde el original el 3 de febrero de 2008.
- árabe. "Arabunic: glifos Unicode <->, convertidor bidireccional". Subprograma de Java que convierte glifos a Unicode (y Unicode a glifos). Tiene en cuenta ligaduras, lam-alif, signos diacríticos, etc.
- Scheherazade o Scheherazade New, una fuente de escritura árabe extendida diseñada por SIL International , distribuida bajo la licencia SIL Open Font License (OFL)
- Harmattan, una fuente de escritura árabe extendida diseñada por SIL International para África occidental, distribuida bajo la licencia de fuente abierta SIL (OFL)