El alfabeto árabe , [a] o abyad árabe , es la escritura árabe codificada específicamente para escribir la lengua árabe . Se escribe de derecha a izquierda en un estilo cursivo e incluye 28 letras, [b] de las cuales la mayoría tienen formas de letras contextuales. A diferencia del alfabeto latino , la escritura no tiene el concepto de mayúsculas y minúsculas . El alfabeto árabe se considera un abyad , en el que solo se requiere escribir consonantes ; debido a su uso opcional de diacríticos para notar vocales, se considera un abyad impuro . [2]
El alfabeto árabe básico contiene 28 letras . Las formas que utilizan la escritura árabe para escribir otros idiomas agregaron y quitaron letras: por ejemplo, ⟨پ⟩ se usa a menudo para representar /p/ en adaptaciones de la escritura árabe. A diferencia de los alfabetos derivados del griego , el árabe no tiene letras mayúsculas y minúsculas diferenciadas .
Muchas letras parecen similares, pero se distinguen entre sí por puntos ( ʾiʿjām ) encima o debajo de su parte central ( rasm ). Estos puntos son una parte integral de una letra, ya que distinguen entre letras que representan diferentes sonidos. Por ejemplo, las letras árabes ب b , ت t y ث th tienen la misma forma básica, pero con un punto agregado debajo, dos puntos agregados arriba y tres puntos agregados arriba respectivamente. La letra ن n también tiene la misma forma en las formas inicial y medial, con un punto agregado arriba, aunque es algo diferente en sus formas aislada y final. Históricamente, a menudo se omitían, en un estilo de escritura llamado rasm .
Tanto el árabe impreso como el escrito son cursivos , y la mayoría de las letras de una palabra están unidas directamente a las letras adyacentes.
Hay dos secuencias de cotejo principales ('ordenamientos alfabéticos') para el alfabeto árabe: Hija'i y Abjadi .
El orden Hija'i ( هِجَائِيّ Hijāʾiyy /hid͡ʒaːʔijj/ ) es el orden más común y se utiliza para ordenar listas de palabras y nombres, como en guías telefónicas, listas de aulas y diccionarios. El orden agrupa las letras según la similitud gráfica de las formas de los glifos.
El orden abjadí original ( أَبْجَدِيّ ʾabjadiyy /ʔabd͡ʒadijj/ ) deriva del utilizado por el alfabeto fenicio , y por tanto recuerda a los ordenamientos de otros alfabetos, como los del hebreo y el griego . Con este ordenamiento, las letras también se utilizan como números conocidos como numerales abjad , que poseen los mismos códigos numerológicos que en la gematría hebrea y la isopsefia griega .
Los diccionarios modernos y otros libros de referencia no utilizan el orden Abjadi para ordenar alfabéticamente; en su lugar, se utiliza el orden Hija'i, más reciente, en el que las letras se agrupan parcialmente por similitud de forma. El orden Hija'i nunca se utiliza como numeral.
En el Magreb se utilizaba otro orden de hijāʾī pero ahora se considera obsoleto, la secuencia es: [3]
En la enciclopedia de Abu Muhammad al-Hasan al-Hamdani الإكليل من أخبار اليمن وأنساب حمير Kitāb al-Iklīl min akhbār al-Yaman wa-ansāb Ḥimyar , la secuencia de letras es: [4]
El orden Abjadi no es una simple correspondencia con el orden alfabético semítico del norte anterior, ya que tiene una posición correspondiente a la letra aramea samek 𐡎 , que históricamente no tiene una letra cognada en el alfabeto árabe.
La pérdida de samekh fue compensada por:
Las otras seis letras que no corresponden a ninguna letra semítica del norte se colocan al final.
Esto se suele expresar de la siguiente manera:
Otra vocalización es:
Esto se puede expresar así:
El alfabeto árabe siempre es cursivo y las letras varían en forma dependiendo de su posición dentro de una palabra. Las letras pueden exhibir hasta cuatro formas distintas correspondientes a una posición inicial, medial (media), final o aislada ( IMFI ). Mientras que algunas letras muestran variaciones considerables, otras permanecen casi idénticas en las cuatro posiciones. Generalmente, las letras en la misma palabra están unidas entre sí en ambos lados por líneas horizontales cortas, pero seis letras ( و,ز,ر,ذ,د,ا ) solo pueden estar unidas a su letra precedente. Además, algunas combinaciones de letras se escriben como ligaduras (formas especiales), notablemente lām-alif لا , [6] que es la única ligadura obligatoria (la combinación no ligada لا se considera difícil de leer).
Notas
La Hamza / ʔ / (oclusión glotal) se puede escribir sola, como si fuera una letra, o con un portador, cuando se convierte en diacrítico . [7] Para la regla de escritura de cada forma, consulte Hamza .
La hamzat al-waṣl ( هَمْزَةُ ٱلْوَصْلِ , ' hamza de conexión') es una variante de la letra hamza ( ء ) que se asemeja a una parte de la letra ṣād ( ص ) que rara vez se coloca sobre la letra ʾalif al comienzo de la palabra ( ٱ ). Indica que la ʾalif no se pronuncia como una oclusión glotal (escrita como hamza ), sino que la palabra está conectada con la palabra anterior (como liaison en francés ). Fuera de los textos litúrgicos vocalizados , la waṣla no suele escribirse. [8] [9] Por ejemplo, Abdullah عَبْدُ ٱلله se puede escribir con hamzat al-wasl en la primera letra de la palabra ٱلله pero generalmente se escribe sin ella عَبْدُ الله .
Las siguientes no son letras individuales, sino más bien diferentes variantes contextuales de algunas de las letras árabes.
La geminación es la duplicación de una consonante. En lugar de escribir la letra dos veces, el árabe coloca un signo en forma de W llamado shaddah , encima de ella. Tenga en cuenta que si aparece una vocal entre las dos consonantes, la letra simplemente se escribirá dos veces. El diacrítico solo aparece cuando la consonante al final de una sílaba es idéntica a la consonante inicial de la sílaba siguiente. (El término genérico para tales signos diacríticos es ḥarakāt ), p. ej. , درس darasa (con diacríticos completos: دَرَسَ ) es un verbo de Forma I que significa estudiar , mientras que درّس darrasa (con diacríticos completos: دَرَّسَ ) es el verbo de Forma II correspondiente, con la consonante r media duplicada, que significa enseñar .
Nunación ( árabe : تنوين tanwīn ) es la adición de una -n final a un sustantivo o adjetivo . La vocal anterior indica caso gramatical . En árabe escrito, la nunación se indica duplicando el signo diacrítico de la vocal al final de la palabra; por ejemplo, شُكْرًا šukr an [ʃukran] "gracias".
El uso de la ligadura en árabe es común. Hay una ligadura obligatoria, la de lām ل + alif ا, que existe en dos formas. Todas las demás ligaduras, de las que hay muchas, [10] son opcionales.
Para representar la palabra Allāh se utiliza habitualmente una ligadura más compleja que combina hasta siete componentes distintos .
La única ligadura dentro del rango principal de la escritura árabe en Unicode (U+06xx) es lām + alif . Esta es la única obligatoria para fuentes y procesamiento de textos. Los demás rangos son para compatibilidad con estándares más antiguos y contienen otras ligaduras, que son opcionales.
Nota: Unicode también tiene en su rango de Forma de presentación B FExx un código para esta ligadura. Si su navegador y fuente están configurados correctamente para árabe, la ligadura que se muestra arriba debería ser idéntica a esta, U+FEFB
LIGADURA ÁRABE LAM CON FORMA AISLADA DE ALEF:
U+0640
TATWEEL ÁRABE + lām + alifNota: Unicode también tiene en su rango U+FExx de la Forma de presentación B un código para esta ligadura. Si su navegador y fuente están configurados correctamente para árabe, la ligadura que se muestra arriba debería ser idéntica a esta:
U+FEFC
LIGADURAS ÁRABES LAM CON FORMA FINAL ALEFOtra ligadura en el rango U+FB50 a U+FDxx de la Forma de Presentación Unicode es el código especial para el glifo de la ligadura Allāh ("Dios"), U+FDF2
FORMA AISLADA DE LIGADURA ÁRABE ALLAH:
Esta es una solución a las deficiencias de la mayoría de los procesadores de texto, que no son capaces de mostrar las marcas vocálicas correctas para la palabra Allāh en el Corán . Debido a que la escritura árabe se utiliza para escribir otros textos en lugar de solo el Corán, la representación de lām + lām + hā' como la ligadura anterior se considera defectuosa.
Este estilo simplificado suele preferirse por razones de claridad, especialmente en idiomas no árabes, pero puede no considerarse apropiado en situaciones en las que se prefiere un estilo de caligrafía más elaborado. – SIL International [11]
Si una de varias fuentes (Noto Naskh árabe, mry_KacstQurn, KacstOne, Nadeem, DejaVu Sans, Harmattan, Scheherazade, Lateef, iraní Sans, Baghdad, DecoType Naskh) está instalada en una computadora (Iranian Sans es compatible con Wikimedia web- fuentes), la palabra aparecerá sin signos diacríticos.
U+0651
ÁRABE SHADDA +U+0670
SUPERSCRIPTO DE LETRA ÁRABE ALEF + hā'Un intento de mostrarlos en las fuentes defectuosas sin agregar automáticamente la marca de geminación y el superíndice alif, aunque puede que no se muestre como se desea en todos los navegadores, es agregando U+200d
(Zero width joiner) después del primer o segundo lām.
U+200d
UNIÓN DE ANCHO CERO + hā'Los usuarios del árabe suelen escribir las vocales largas pero omiten las cortas, por lo que los lectores deben utilizar su conocimiento del idioma para suplir las vocales faltantes. Sin embargo, en el sistema educativo y, en particular, en las clases de gramática árabe, se utilizan estas vocales porque son cruciales para la gramática. Una frase árabe puede tener un significado completamente diferente mediante un cambio sutil de las vocales. Por eso, en un texto importante como el Corán, son obligatorios los tres signos vocálicos básicos, como los diacríticos árabes y otros tipos de signos, como los signos de cantilación .
En la escritura árabe de uso cotidiano, en las publicaciones generales y en los carteles de las calles, no suelen escribirse vocales cortas. Por otra parte, las copias del Corán no pueden ser aprobadas por los institutos religiosos que las revisan a menos que incluyan los diacríticos. Los libros infantiles, los textos de la escuela primaria y las gramáticas en árabe en general incluyen diacríticos en cierta medida. Estos se conocen como textos " vocalizados ".
Las vocales cortas pueden escribirse con diacríticos colocados encima o debajo de la consonante que las precede en la sílaba, llamados ḥarakāt . Todas las vocales árabes, largas y cortas, siguen a una consonante; en árabe, palabras como "Ali" o "alif", por ejemplo, comienzan con una consonante: 'Aliyy , alif .
En el texto árabe completamente vocalizado que se encuentra en textos como el Corán, una ā larga después de una consonante que no sea una hamzah se escribe con un signo a corto ( fatḥah ) sobre la consonante más un ʾalif después de ella; la ī larga se escribe como un signo para la i corta ( kasrah ) más un yāʾ ; y la ū larga como un signo para la u corta ( ḍammah ) más un wāw . Brevemente, ᵃa = ā ; ⁱy = ī ; y ᵘw = ū . La ā larga después de una hamzah puede estar representada por una maddah ʾalif o por una hamzah libre seguida de un ʾalif ( nunca se permiten dos ʾalif consecutivos en árabe).
La siguiente tabla muestra las vocales que se colocan encima o debajo de un círculo punteado que reemplaza una letra consonante primaria o un signo shaddah . Para mayor claridad en la tabla, las letras primarias de la izquierda que se usan para marcar estas vocales largas se muestran solo en su forma aislada. La mayoría de las consonantes se conectan a la izquierda con ʾalif , wāw y yāʾ escritas con su forma medial o final. Además, la letra yāʾ en la última fila puede conectarse con la letra de su izquierda y luego usará una forma medial o inicial. Use la tabla de letras primarias para ver su glifo real y los tipos de unión.
En un texto no vocalizado (en el que no se marcan las vocales cortas), las vocales largas se representan mediante la vocal en cuestión: ʾalif mamdūdah/maqṣūrah , wāw o yāʾ . Las vocales largas escritas en medio de una palabra de un texto no vocalizado se tratan como consonantes con un sukūn (ver más abajo) en un texto que tiene diacríticos completos. Aquí también, la tabla muestra las letras de vocales largas solo en forma aislada para mayor claridad.
Las combinaciones وا y يا siempre se pronuncian wā y yā respectivamente. La excepción es el sufijo ـوا۟ en las terminaciones verbales donde ʾalif es mudo, lo que resulta en ū o aw . Además, al transliterar nombres y préstamos lingüísticos, los hablantes de lengua árabe escriben la mayoría o todas las vocales como largas ( ā con ا ʾalif , ē e ī con ي yaʾ , y ō y ū con و wāw ), lo que significa que se acerca a un alfabeto verdadero.
Los diptongos حروف اللين ḥurūfu l-līn /aj/ y /aw/ se representan en el texto vocalizado de la siguiente manera:
Generalmente se escribe un yaʾ final al final de las palabras para nisba ( اَلنِّسْبَة nisbah ), que es un sufijo común para formar adjetivos de relación o pertinencia. El sufijo es ـِيّ -iyy para masculino ( ـِيَّة -iyya(t)- para femenino); por ejemplo اِشْتِرَاكِيّ ištirākiyy "socialista", también se usa para una terminación singular que se aplica a seres humanos u otros seres sintientes como en جندي jundiyy "un soldado". Sin embargo, hoy en día, este yaʾ final se pronuncia generalmente con un yaʾ largo ( yāʾ mamdūdah ) -ī como en اِشْتِرَاكِي ištirākī /iʃtiraːkiː/ en lugar de اِشْتِرَاكِيّ ištirākiyy /iʃtiraːkijj/ .
Un error similar ocurre al final de algunos verbos en tercera persona del plural como en جَرَوْا jaraw "corrieron", que hoy en día se pronuncia como جَرُوا jarū /d͡ʒaruː/ .
Una sílaba árabe puede ser abierta (terminando en vocal) o cerrada (terminando en consonante):
Un texto normal se compone únicamente de una serie de consonantes más letras que alargan las vocales; así, la palabra qalb , "corazón", se escribe qlb , y la palabra qalaba , "se dio la vuelta", también se escribe qlb .
Para escribir qalaba sin esta ambigüedad, podríamos indicar que la l es seguida por una a corta escribiendo una fatḥah encima de ella.
Para escribir qalb , indicaríamos en cambio que la l no va seguida de ninguna vocal marcándola con un diacrítico llamado sukūn ( ْ ), de esta manera: قلْب .
Este es un paso por debajo de la vocalización completa, donde la vocal después de la q también se indicaría con una fatḥah : قَلْب .
El Corán se escribe tradicionalmente en vocalización completa.
En algunas ediciones del Corán, el sonido de la i larga se escribe con una kasrah seguida de una y sin diacrítico , y la u larga con una ḍammah seguida de una w simple . En otras, estas y y w llevan un sukūn . Fuera del Corán , esta última convención es extremadamente rara, hasta el punto de que la y con sukūn se leerá inequívocamente como el diptongo /aj/ , y la w con sukūn se leerá /aw/ .
Por ejemplo, las letras myl pueden leerse como meel o mail en español , o (teóricamente) también como mayyal o mayil . Pero si se añade un sukūn a la y , entonces la m no puede tener un sukūn (porque no se pueden sukūn atar dos letras seguidas ), no puede tener un ḍammah (porque nunca hay un sonido uy en árabe a menos que haya otra vocal después de la y ), y no puede tener un kasrah (porque kasrah antes de sukūn atado y nunca se encuentra fuera del Corán ), por lo que debe tener un fatḥah y la única pronunciación posible es /majl/ (que significa milla, o incluso correo electrónico). De la misma manera, myt con un sukūn sobre la y puede ser mayt pero no mayyit o meet , y mwt con un sukūn sobre la w solo puede ser mawt , no moot ( iw es imposible cuando la w cierra la sílaba).
Las marcas vocálicas siempre se escriben como si se pronunciaran las vocales i'rāb , incluso cuando deben omitirse en la pronunciación real. Por lo tanto, al escribir el nombre Aḥmad , es opcional colocar un sukūn sobre la ḥ , pero está prohibido colocar un sukūn sobre la d , porque llevaría una ḍammah si le siguiera cualquier otra palabra, como en Aḥmadu zawjī "Ahmad es mi esposo".
Otro ejemplo: la frase que en árabe literario correcto debe pronunciarse Aḥmadu zawjun shirrīr "Ahmad es un marido malvado", generalmente se pronuncia (debido a la influencia de las variedades del árabe vernáculo) como Aḥmad zawj shirrīr . Sin embargo, para los fines de la gramática y la ortografía árabes, se trata como si no estuviera mal pronunciada y como si otra palabra la siguiera, es decir, si se agregan marcas vocálicas, deben agregarse como si la pronunciación fuera Aḥmadu zawjun sharrīrun con un tanwīn 'un' al final. Por lo tanto, es correcto agregar un signo un tanwīn en la r final , pero pronunciarlo en realidad sería una hipercorrección. Además, nunca es correcto escribir un sukūn en esa r , aunque en la pronunciación real es (y en árabe correcto DEBE ser) sukūn ed.
Por supuesto, si el i'rāb correcto es un sukūn , se puede escribir opcionalmente.
ٰٰ El sukūn también se utiliza para transliterar palabras al alfabeto árabe. El nombre en inglés "Mark" se escribe مارك , por ejemplo, podría escribirse con un sukūn encima de la ر para indicar que no hay sonido vocálico entre esa letra y la ك .
Algunas letras adoptan una forma tradicionalmente diferente en regiones específicas:
Algunas letras modificadas se utilizan para representar sonidos no nativos del árabe estándar moderno. Estas letras se utilizan como una alternativa opcional en nombres transliterados, préstamos lingüísticos y palabras dialectales. El uso de estas letras depende del autor y de su país de origen y su uso no es obligatorio.
El fonema no estándar / ɡ / (considerado una pronunciación estándar de ج solo en Egipto) tiene el mayor número de variaciones al escribir préstamos o nombres propios extranjeros en árabe estándar, y se puede escribir con las letras estándar ج , غ , ق y ك o con las letras no estándar ڨ (usadas solo en Túnez y Argelia), ڭ (usada solo en Marruecos) y گ (usada principalmente en Irak); por ejemplo, " Golf ", pronunciado / ɡoːlf /, se puede escribir جولف , غولف , قولف , كولف , ڨولف , ڭولف o گولف según el escritor y su país de origen. Por otra parte, / ɡ / se considera un fonema nativo en la mayoría de los dialectos árabes, ya sea como un reflejo de ج como en el bajo Egipto, partes de Omán y partes de Yemen (por ejemplo, جمل [gamal] ) o como un reflejo de ق como en la mayor parte de la península Arábiga, Irak, Sudán y partes de Egipto, el Levante y el norte de África (por ejemplo, قال [gaːl] ).
Nota: Los sonidos / p / y / v / no son nativos de la mayoría de los dialectos árabes (excepto el árabe de Anatolia, donde ذِئْب "Lobo" se pronuncia vīp [viːp] [13] en lugar del árabe estándar [ðɪʔb] ), mientras que / g / , / t͡ʃ / y / ʒ / aparecen como fonemas o alófonos nativos en muchos dialectos.
Existen dos tipos principales de numerales que se utilizan junto con el texto árabe: los numerales arábigos occidentales y los numerales arábigos orientales . En la mayor parte del norte de África actual, se utilizan los numerales arábigos occidentales habituales. Al igual que en los numerales arábigos occidentales, en los numerales arábigos orientales, las unidades siempre están más a la derecha y el valor más alto más a la izquierda. Los números arábigos orientales se escriben de izquierda a derecha.
Además, el alfabeto árabe puede utilizarse para representar números ( números Abjad ). Este uso se basa en el orden ʾabjadī del alfabeto. أ ʾalif es 1, ب bāʾ es 2, ج jīm es 3, y así sucesivamente hasta ي yāʾ = 10, ك kāf = 20, ل lām = 30, ..., ر rāʾ = 200, ..., غ ghayn = 1000. Esto se utiliza a veces para producir cronogramas .
El alfabeto árabe se remonta a la escritura nabatea utilizada para escribir el arameo nabateo . Una fase de transición, entre la escritura aramea nabatea y una escritura posterior, reconociblemente árabe, se conoce como árabe nabateo . La fase preislámica de la escritura tal como existía en los siglos V y VI, una vez que se había vuelto reconociblemente similar a la escritura tal como llegó a conocerse en la era islámica, se conoce como paleoárabe . [17]
El primer texto conocido en alfabeto árabe es una inscripción de finales del siglo IV de Jabal Ram, a 50 km al este de 'Aqabah en Jordania , pero la inscripción trilingüe de Zabad es el texto árabe más antiguo datado del año 512 y fue descubierta en Siria . [ cita requerida ] Sin embargo, el registro epigráfico es extremadamente escaso. Más tarde, se añadieron puntos encima y debajo de las letras para diferenciarlas. (El idioma arameo tenía menos fonemas que el árabe, y algunas letras arameas originalmente distintas se habían vuelto indistinguibles en forma, de modo que en los primeros escritos 14 formas de letras distintas tenían que hacer las veces de 28 sonidos; cf. el igualmente ambiguo Libro Pahlavi .)
El primer documento que se conserva en el que se utilizan estos puntos es también el primer papiro árabe que se conserva ( PERF 558 ), fechado en abril de 643, aunque no se convirtieron en obligatorios hasta mucho después. Los textos importantes se memorizaban y se siguen memorizando con frecuencia, especialmente en la memorización del Corán .
Más tarde, se introdujeron las marcas vocálicas y la hamza, a partir de la segunda mitad del siglo VII, antes de la primera invención de las vocalizaciones siríacas y tiberianas . Inicialmente, esto se hacía mediante un sistema de puntos rojos, que se dice que fue encargado en la era omeya por Abu al-Aswad al-Du'ali , un punto arriba = a , un punto abajo = i , un punto sobre la línea = u , y los puntos dobles indicaban nunación . Sin embargo, esto era engorroso y fácilmente confundible con los puntos que distinguen las letras, por lo que unos 100 años después, se adoptó el sistema moderno. El sistema fue finalizado alrededor de 786 por al-Khalil ibn Ahmad al-Farahidi .
Los dialectos árabes se escribían en diferentes alfabetos antes de la difusión del alfabeto árabe que se utiliza actualmente. Los más importantes de estos alfabetos e inscripciones son las inscripciones safaíticas , que suman 30.000 inscripciones descubiertas en el desierto del Levante . [18]
Hay alrededor de 3.700 inscripciones en lengua hismaica en el centro de Jordania y el noroeste de la península arábiga, así como inscripciones nabateas, siendo las más importantes de ellas la inscripción de Umm al-Jimal I y la inscripción de Numara . [19]
La imprenta árabe medieval floreció desde el siglo X hasta el siglo XIV. Se dedicó únicamente a textos muy pequeños, generalmente para su uso en amuletos .
En 1514, tras la invención de la imprenta por parte de Johannes Gutenberg en 1450, Gregorio de Gregorii, un veneciano, publicó un libro de oraciones completo en escritura árabe; se tituló Kitab Salat al-Sawa'i y estaba destinado a las comunidades cristianas orientales. [20] Entre 1580 y 1586, el diseñador tipográfico Robert Granjon diseñó tipos de letra árabes para el cardenal Ferdinando de' Medici , y la Medici Oriental Press publicó muchas oraciones cristianas y textos académicos árabes a finales del siglo XVI. [21]
Los monjes maronitas del monasterio de Maar Quzhay, en el monte Líbano, publicaron los primeros libros árabes escritos con tipos móviles en Oriente Medio. Los monjes transliteraron el idioma árabe utilizando la escritura siríaca .
Aunque Napoleón suele recibir crédito por introducir la imprenta en Egipto durante su invasión del país en 1798, y aunque de hecho trajo imprentas y prensas árabes para imprimir el periódico oficial de la ocupación francesa, Al-Tanbiyyah "El Correo", la impresión en lengua árabe había comenzado varios siglos antes. Un orfebre (como Gutenberg) diseñó e implementó una imprenta de tipos móviles con escritura árabe en Oriente Medio. El monje melquita libanés Abdallah Zakher instaló una imprenta árabe con tipos móviles en el monasterio de San Juan en la ciudad de Dhour El Shuwayr en el Monte Líbano, la primera imprenta casera en Líbano que utilizaba escritura árabe. Él personalmente cortó los moldes de los tipos y realizó la fundición de la tipografía. El primer libro salió de su imprenta en 1734; esta imprenta continuó en uso hasta 1899. [22]
El alfabeto árabe se puede codificar utilizando varios conjuntos de caracteres , incluidos ISO-8859-6 , Windows-1256 y Unicode , este último contiene el "segmento árabe", entradas U+0600 a U+06FF. Sin embargo, ninguno de los conjuntos indica la forma que debe adoptar cada carácter en contexto. Se deja al motor de renderizado la selección del glifo adecuado para mostrar en cada carácter.
Cada letra tiene una codificación independiente de la posición en Unicode, y el software de renderización puede inferir la forma correcta del glifo (inicial, medial, final o aislada) a partir de su contexto de unión. Esa es la recomendación actual. Sin embargo, para la compatibilidad con estándares anteriores, las formas inicial, medial, final y aislada también se pueden codificar por separado.
A partir de Unicode 16.0, el alfabeto árabe está contenido en los siguientes bloques : [23]
El rango árabe básico codifica las letras estándar y los diacríticos, pero no codifica las formas contextuales (U+0621-U+0652 se basan directamente en la norma ISO 8859-6 ). También incluye los diacríticos y dígitos árabe-índicos más comunes . U+06D6 a U+06ED codifican signos de anotación coránica como "final de aleya " ۖ y "comienzo de rub el hizb " ۞. El rango de suplemento árabe codifica variantes de letras utilizadas principalmente para escribir idiomas africanos (no árabes). El rango árabe extendido-A codifica anotaciones coránicas adicionales y variantes de letras utilizadas para varios idiomas no árabes.
La gama de Formas de presentación árabes-A codifica formas contextuales y ligaduras de variantes de letras necesarias para los idiomas persa, urdu , sindhi y de Asia central. La gama de Formas de presentación árabes-B codifica formas de espaciado de diacríticos árabes y formas de letras más contextuales. El bloque de Símbolos alfabéticos matemáticos árabes codifica caracteres utilizados en expresiones matemáticas árabes.
Véanse también las notas de la sección sobre cartas modificadas.
Los teclados diseñados para diferentes países tienen diferentes distribuciones, por lo que el dominio de un estilo de teclado, como el de Irak, no se transfiere al dominio de otro, como el de Arabia Saudita. Las diferencias pueden incluir la ubicación de caracteres no alfabéticos.
Todos los teclados árabes permiten escribir caracteres latinos, por ejemplo, para la URL en un navegador web . Por lo tanto, cada teclado árabe tiene caracteres árabes y latinos marcados en las teclas. Por lo general, los caracteres latinos de un teclado árabe se ajustan a la disposición QWERTY , pero en el norte de África , donde el francés es el idioma más común que se escribe con caracteres latinos, los teclados árabes son AZERTY .
Para codificar una forma escrita particular de un carácter, existen puntos de código adicionales provistos en Unicode que se pueden usar para expresar la forma escrita exacta deseada. Las formas de presentación árabes del rango A (U+FB50 a U+FDFF) contienen ligaduras, mientras que las formas de presentación árabes del rango B (U+FE70 a U+FEFF) contienen las variantes posicionales. Estos efectos se logran mejor en Unicode utilizando el conector de ancho cero y el conector no de ancho cero , ya que estas formas de presentación están obsoletas en Unicode y, por lo general, solo se deben usar dentro de los componentes internos del software de representación de texto; cuando se usa Unicode como una forma intermedia para la conversión entre codificaciones de caracteres; o para compatibilidad con versiones anteriores con implementaciones que dependen de la codificación rígida de formas de glifos.
Por último, la codificación Unicode del árabe se realiza en orden lógico , es decir, los caracteres se introducen y almacenan en la memoria del ordenador en el orden en el que se escriben y se pronuncian sin preocuparse por la dirección en la que se mostrarán en el papel o en la pantalla. De nuevo, se deja al motor de renderizado la tarea de presentar los caracteres en la dirección correcta, utilizando las características de texto bidireccional de Unicode . En este sentido, si las palabras árabes de esta página se escriben de izquierda a derecha, es una indicación de que el motor de renderizado Unicode utilizado para mostrarlas está desactualizado. [24] [25]
Existen herramientas en línea que compiten entre sí, por ejemplo el editor Yamli, que permiten ingresar letras árabes sin tener soporte para árabe instalado en una PC y sin conocer la disposición del teclado árabe. [26]
El primer programa informático de este tipo en el mundo que identifica la escritura árabe en tiempo real fue desarrollado por investigadores de la Universidad Ben-Gurion (BGU).
El prototipo permite al usuario escribir palabras árabes a mano en una pantalla electrónica, que luego analiza el texto y lo traduce a letras árabes impresas en una milésima de segundo. El índice de error es inferior al tres por ciento, según el Dr. Jihad El-Sana, del departamento de informática de la BGU, que desarrolló el sistema junto con el estudiante de maestría Fadi Biadsy. [27]