stringtranslate.com

Escritura árabe en Unicode

Muchos sistemas de escritura Unicode , como el árabe , tienen reglas ortográficas especiales que requieren que ciertas combinaciones de formas de letras se combinen en formas de ligadura especiales . En inglés, el ampersand común (&) se desarrolló a partir de una ligadura en la que se combinaban las letras latinas manuscritas e y t (ortografía et , latín para y ). [1] Las reglas que rigen la formación de ligaduras en árabe pueden ser bastante complejas y requieren tecnologías especiales de modelado de escritura, como el motor caligráfico árabe de DecoType de Thomas Milo. [2]

A partir de Unicode 16.0, el alfabeto árabe está contenido en los siguientes bloques : [3]

El rango árabe básico codifica las letras y diacríticos estándar, pero no codifica formas contextuales (U+0621–U+0652 se basa directamente en ISO 8859-6 ); y también incluye los diacríticos más comunes y los dígitos árabe-índicos . El rango de Suplemento árabe codifica variantes de letras utilizadas principalmente para escribir idiomas africanos (no árabes). Los rangos Árabe extendido-B y Árabe extendido-A codifican anotaciones coránicas adicionales y variantes de letras utilizadas para varios idiomas no árabes. El rango de Formas de presentación árabe-A codifica formas contextuales y ligaduras de variantes de letras necesarias para persa, urdu, sindhi y idiomas de Asia central. El rango de Formas de presentación árabe-B codifica formas de espaciado de diacríticos árabes y formas de letras más contextuales. Las formas de presentación están presentes solo para compatibilidad con estándares más antiguos y actualmente no son necesarias para codificar texto. [4] El bloque de Símbolos alfabéticos matemáticos árabes codifica caracteres utilizados en expresiones matemáticas árabes. El bloque de números Siyaq índicos contiene un subconjunto especializado de la escritura árabe que se utilizó para la contabilidad en la India bajo el Imperio mogol desde el siglo XVII hasta mediados del siglo XX. [5] [6] El bloque de números Siyaq otomanos contiene un subconjunto especializado de la escritura árabe, también conocido como números Siyakat , utilizado para la contabilidad en los documentos turcos otomanos . [6]

Formas contextuales

A continuación se muestra una demostración del alfabeto básico utilizado en el árabe estándar moderno que ilustra cómo se espera que aparezcan las letras árabes en diferentes contextos. Los puntos de código enumerados como formas contextuales " no deben usarse en el intercambio general" [4] . Unicode tiene otros métodos para codificar la diferencia si es necesario, como el conector de ancho cero .

Puntuación y adornos

En la escritura árabe regular solo se utilizan el signo de interrogación árabe ⟨ ؟ ⟩ y la coma árabe ⟨ ، ⟩, y la coma a menudo se sustituye por la coma del alfabeto latino ⟨ , ⟩, que también se utiliza como separador decimal cuando se utilizan números arábigos orientales (por ejemplo, ⟨100,6⟩ en comparación con ⟨ ١٠٠,٦ ⟩).

Ligaduras de palabras

Las formas de presentación árabes A tienen algunos caracteres definidos como "ligaduras de palabras" para los términos que se usan con frecuencia en expresiones formales en árabe. Rara vez se usan fuera de la mecanografía litúrgica profesional; además, el grafema rial normalmente se escribe completo, no mediante la ligadura.

Bloques de código

árabe

Tabla de caracteres

Mesa compacta

Suplemento árabe

Árabe ampliado-B

Árabe extendido-A

Formularios de presentación en árabe A

Se trata en su mayoría de ligaduras que se pueden crear a partir de los caracteres de los gráficos anteriores, con excepción de los grafemas tipo corchete ﴾ ﴿ y algunas de ellas son ligaduras de frases litúrgicas comunes.

Formularios de presentación en árabe B

Todos ellos se pueden crear a partir de los caracteres del gráfico básico.

Símbolos numéricos de Rumi

Árabe extendido-C

Números de Siyaq índicos

Números del Siyaq otomano

Símbolos alfabéticos matemáticos árabes

Referencias

  1. ^ "¿Cuál es el origen del ampersand (&)?"
  2. ^ unicode.org Biografía: Thomas Milo - DecoType
  3. ^ "UAX #24: Archivo de datos de script". Base de datos de caracteres Unicode . El Consorcio Unicode.
  4. ^ ab "Sección 9.2: Árabe, Formas de presentación árabes-B". El estándar Unicode . El Consorcio Unicode. Septiembre de 2024.
  5. ^ Pandey, Anshuman (5 de noviembre de 2015). "L2/15-121R2: Propuesta para codificar los números índicos siyaq" (PDF) .
  6. ^ ab "Capítulo 22: Símbolos". Unicode, Inc. Septiembre de 2024.
  7. ^ Obsoleto a partir de la versión Unicode 6.0 Historial de cambios de UCD "La combinación particular de una alef con esta marca vocálica debe escribirse con la secuencia <U+0627 LETRA ÁRABE ALEF, U+065F HAMZA ONDULADA ÁRABE ABAJO>, en lugar de con el carácter U+0673 LETRA ÁRABE ALEF CON HAMZA ONDULADA ABAJO, que ha quedado obsoleto y que no es canónicamente equivalente. "Sección 9.2: Árabe, marcas vocálicas adicionales". El estándar Unicode . El Consorcio Unicode. Septiembre de 2024.

Enlaces externos