stringtranslate.com

Escritura árabe en Unicode

Muchas escrituras en Unicode , como el árabe , tienen reglas ortográficas especiales que requieren que ciertas combinaciones de formas de letras se combinen en formas de ligadura especiales . En inglés, el signo común (&) se desarrolló a partir de una ligadura en la que se combinaban las letras latinas manuscritas e y t (ortografía et , latín para y ). [1] Las reglas que rigen la formación de ligaduras en árabe pueden ser bastante complejas y requieren tecnologías especiales de configuración de escritura, como el motor caligráfico árabe de DecoType de Thomas Milo. [2]

A partir de Unicode 15.1, la escritura árabe está contenida en los siguientes bloques : [3]

El rango árabe básico codifica las letras y signos diacríticos estándar, pero no codifica las formas contextuales (U+0621–U+0652 se basa directamente en ISO 8859-6 ); y también incluye los signos diacríticos y dígitos árabe-índicos más comunes . La gama del Suplemento árabe codifica variantes de letras que se utilizan principalmente para escribir en idiomas africanos (no árabes). Los rangos Árabe Extendido-B y Árabe Extendido-A codifican anotaciones coránicas adicionales y variantes de letras utilizadas para varios idiomas no árabes. La gama Arab Presentation Forms-A codifica formas contextuales y ligaduras de variantes de letras necesarias para los idiomas persa, urdu, sindhi y de Asia central. La gama Arab Presentation Forms-B codifica formas de espaciado de signos diacríticos árabes y formas de letras más contextuales. Los formularios de presentación están presentes sólo por compatibilidad con estándares más antiguos y actualmente no son necesarios para codificar texto. [4] El bloque de símbolos alfabéticos matemáticos árabes codifica caracteres utilizados en expresiones matemáticas árabes. El bloque de números índicos Siyaq contiene un subconjunto especializado de escritura árabe que se utilizó para la contabilidad en la India bajo el Imperio mogol desde el siglo XVII hasta mediados del siglo XX. [5] [6] El bloque de números otomanos Siyaq contiene un subconjunto especializado de escritura árabe, también conocido como números Siyakat , utilizados para la contabilidad en documentos turcos otomanos . [6]

Formas contextuales

Una demostración del alfabeto básico utilizado en árabe estándar moderno :

Puntuación y adornos

Sólo el signo de interrogación árabe ⟨ ؟ ⟩ y la coma árabe ⟨ ، ⟩ se usan en la escritura en escritura árabe normal y la coma a menudo se sustituye por la coma en escritura latina ⟨ , ⟩ que también se usa como separador decimal cuando se usan los números arábigos orientales (por ejemplo, ⟨100.6⟩ en comparación a ⟨ ١٠٠,٦ ⟩).

Ligaduras de palabras

Los formularios de presentación en árabe A tienen algunos caracteres definidos como "ligaduras de palabras" para los términos que se utilizan con frecuencia en expresiones formulaicas en árabe. Rara vez se utilizan fuera de la mecanografía litúrgica profesional, además el grafema Rial normalmente se escribe completo, no mediante ligadura.

Bloques de código

Arábica

tabla de caracteres

mesa compacta

Suplemento árabe

Árabe extendido-B

Árabe extendido-A

Formas de presentación árabe A

En su mayoría son ligaduras que se pueden crear a partir de los caracteres de los cuadros anteriores, a excepción de los grafemas en forma de corchetes ﴾ ﴿ y algunos de ellos son ligaduras de frases litúrgicas comunes.

Formularios de presentación árabe B

Todos estos se pueden crear a partir de los caracteres del gráfico básico.

Símbolos numéricos de Rumi

Árabe extendido-C

Números índicos Siyaq

Números otomanos Siyaq

Símbolos alfabéticos matemáticos árabes

Referencias

  1. ^ "¿Cuál es el origen del signo comercial (&)?"
  2. ^ unicode.org Biografía: Thomas Milo - DecoType
  3. ^ "UAX n.° 24: archivo de datos de secuencia de comandos". Base de datos de caracteres Unicode . El Consorcio Unicode.
  4. ^ "Sección 9.2: Árabe, formularios de presentación en árabe-B" (PDF) . El estándar Unicode . El Consorcio Unicode. Septiembre de 2022.
  5. ^ Pandey, Anshuman (5 de noviembre de 2015). "L2/15-121R2: Propuesta para codificar números índicos Siyaq" (PDF) .
  6. ^ ab "Capítulo 22: Símbolos". El estándar Unicode, versión 15.0 (PDF) . Mountain View, CA: Unicode, Inc. Septiembre de 2022. ISBN 978-1-936213-32-0.
  7. ^ Obsoleto a partir de Unicode versión 6.0 Historial de cambios de UCD "La combinación particular de un alef con esta marca vocal debe escribirse con la secuencia <U+0627 LETRA ÁRABE ALEF, U+065F ÁRABE ONDULADA HAMZA ABAJO>, en lugar de con el carácter U +0673 LETRA ÁRABE ALEF CON HAMZA ONDULADA ABAJO, que ha quedado obsoleta y que no es canónicamente equivalente. "Sección 9.2: Árabe, marcas vocales adicionales" (PDF) . El estándar Unicode . El consorcio Unicode. Septiembre de 2022.

enlaces externos