stringtranslate.com

Diacríticos árabes

El árabe escrito temprano usaba solo rasm (en negro). Más tarde, el árabe añadió signos diacríticos i'jām (ejemplos en rojo) para que letras como estas cinco ـيـ, ـنـ, ـثـ, ـتـ, ـبـ (b, t, th, n, y) pudieran distinguirse. Los signos diacríticos Ḥarakāt (ejemplos en azul), que se usan en el Corán pero no en la mayoría de los árabes escritos, indican vocales cortas, consonantes largas y algunas otras vocalizaciones.

La escritura árabe tiene numerosos signos diacríticos , que incluyen el signo de consonante conocido como iʻjām ( إِعْجَام ) y signos diacríticos suplementarios conocidos como tashkīl ( تَشْكِيل ). Estos últimos incluyen las marcas vocales denominadas ḥarakāt ( حَرَكَات ; singular: حَرَكَة , ḥarakah ).

La escritura árabe es un abjad modificado , donde las consonantes cortas y las vocales largas se representan mediante letras, pero las vocales cortas y la longitud de las consonantes generalmente no se indican por escrito. Tashkīl es opcional para representar las vocales faltantes y la longitud de las consonantes. El árabe moderno siempre se escribe con el i'jām (puntuación de consonantes), pero sólo los textos religiosos, los libros para niños y las obras para estudiantes se escriben con el tashkīl completo (guías de vocales y longitud de consonantes). Sin embargo, no es raro que los autores agreguen signos diacríticos a una palabra o letra cuando el caso gramatical o el significado se consideran ambiguos. Además, las obras clásicas y los documentos históricos presentados al público en general suelen presentarse con el tashkīl completo , para compensar la brecha en la comprensión resultante de los cambios estilísticos a lo largo de los siglos.

Tashkil (marcas utilizadas como guías fonéticas)

El significado literal de تَشْكِيل tashkīl es "formar". Como el texto árabe normal no proporciona suficiente información sobre la pronunciación correcta, el objetivo principal de tashkīl (y ḥarakāt ) es proporcionar una guía fonética o una ayuda fonética; es decir, mostrar la pronunciación correcta para niños que están aprendiendo a leer o estudiantes extranjeros.

La mayor parte de la escritura árabe se escribe sin ḥarakāt (o vocales cortas). Sin embargo, se utilizan comúnmente en textos que exigen un estricto cumplimiento de la pronunciación exacta. Esto es cierto, principalmente, en el caso del Corán ٱلْقُرْآن ( al-Qurʾān ) y la poesía . También es bastante común añadir ḥarakāt a los hadices ٱلْحَدِيث ( al-ḥadīth ; plural: al-ḥādīth ) y a la Biblia . Otro uso es en la literatura infantil. Además, los ḥarakāt se utilizan en textos ordinarios en palabras individuales cuando una ambigüedad de pronunciación no puede resolverse fácilmente a partir del contexto únicamente. Los diccionarios de árabe con marcas vocales brindan información sobre la pronunciación correcta tanto a hablantes de árabe nativos como extranjeros. En arte y caligrafía , ḥarakāt podría usarse simplemente porque su escritura se considera estéticamente agradable.

Un ejemplo de árabe completamente vocalizado ( vocalizado o vocalizado ) del Bismillah :

بِسْمِ ٱللَّٰهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ
bismi -llāhi r-raḥmāni r-raḥīm i
En el nombre de Dios, el Todomisericordioso, el Especialmente Misericordioso.

Algunos libros de texto en árabe para extranjeros ahora utilizan ḥarakāt como guía fonética para facilitar el aprendizaje de la lectura en árabe. El otro método utilizado en los libros de texto es la romanización fonética de textos no vocalizados. Los estudiantes de árabe buscan textos árabes completamente vocalizados (es decir, textos árabes con ḥarakāt /diacríticos). Algunos diccionarios bilingües en línea también proporcionan ḥarakāt como guía fonética de manera similar a los diccionarios de inglés que brindan transcripción.

Harakat (vocales cortas)

Los ḥarakāt حَرَكَات , que literalmente significa "movimientos", son las vocales cortas. Existe cierta ambigüedad en cuanto a qué tashkīl también son ḥarakāt ; los tanwīn , por ejemplo, son marcadores tanto de vocales como de consonantes.

Fatah

ـَ

El fatḥah فَتْحَة es una pequeña línea diagonal colocada encima de una letra y representa una /a/ corta (como el sonido /a/ en la palabra inglesa "cat"). La palabra fatḥah en sí ( فَتْحَة ) significa apertura y se refiere a la apertura de la boca al producir una /a/ . Por ejemplo, con dāl (en adelante, la consonante base en los siguientes ejemplos): دَ /da/ .

Cuando se coloca una fatḥah antes de una letra simple ⟨ ا ( alif ) (es decir, una que no tiene hamza o vocal propia), representa una /aː/ larga (cercana al sonido de "a" en la palabra inglesa "dad ", con una vocal frontal abierta /æː/, no posterior /ɑː/ como en "padre"). Por ejemplo: دَا /daː/ . La fatḥah no suele escribirse en tales casos. Cuando se coloca una fathah antes de la letra ⟨ ⟩ (yā'), crea una /aj/ (como en "l ie "); y cuando se coloca antes de la letra ⟨ و ⟩ (wāw), crea un /aw/ (como en "c ow ").

Aunque combinado con una letra simple crea una vocal frontal abierta (/a/), a menudo realizada como casi abierta (/ æ /), el estándar también permite variaciones, especialmente bajo ciertas condiciones ambientales. Por lo general, para tener una pronunciación más central (/ ä /) o posterior (/ ɑ /), la palabra presenta una consonante posterior cercana, como la enfática, así como qāf o rā' . Otras vocales también experimentan una cualidad "posterior" similar en presencia de tales consonantes, aunque no tan drásticamente como en el caso de fatḥah . [1] [2] [3]

Kasra

ـِ

Una línea diagonal similar debajo de una letra se llama kasrah كَسْرَة y designa una /i/ corta (como en "yo", "ser") y sus alófonos [i, ɪ, e, e̞, ɛ] (como en " Tim", "siéntate"). Por ejemplo: دِ /di/ . [4]

Cuando se coloca una kasrah antes de una letra simple ⟨ ( yā' ), representa una /iː/ larga (como en la palabra inglesa "steed"). Por ejemplo: دِي /diː/ . La kasrah generalmente no se escribe en tales casos, pero si yā' se pronuncia como diptongo /aj/ , fatḥah debe escribirse en la consonante anterior para evitar una mala pronunciación. La palabra kasrah significa "romper". [1]

Ḍammah

ـ

El ḍammah ضَمَّة es un pequeño signo diacrítico con forma de rizo colocado encima de una letra para representar una /u/ corta (como en "duque", más corto "tú") y sus alófonos [u, ʊ, o, o̞, ɔ] ( como en "put" o "bull"). Por ejemplo: دُ /du/ . [4]

Cuando se coloca un ḍammah antes de una letra simple ⟨ و ( wāw ), representa una /uː/ larga (como el sonido 'oo' en la palabra inglesa "swoop"). Por ejemplo: دُو /duː/ . La ḍammah generalmente no se escribe en tales casos, pero si wāw se pronuncia como diptongo /aw/ , fatḥah debe escribirse en la consonante anterior para evitar una mala pronunciación. [1]

La palabra ḍammah (ضَمَّة) en este contexto significa redondeo , ya que es la única vocal redondeada en el inventario vocal del árabe.

Alif Khanjariyah

ــٰ

El superíndice (o daga) alif أَلِف خَنْجَرِيَّة ( alif khanjarīyah ), se escribe como un trazo vertical corto encima de una consonante. Indica un sonido /aː/ largo para el cual normalmente no se escribe alif . Por ejemplo: هَٰذَا ( hādhā ) o رَحْمَٰن ( raḥmān ).

La daga alif aparece en sólo unas pocas palabras, pero incluyen algunas comunes; Sin embargo, rara vez se escribe, ni siquiera en textos totalmente vocalizados. La mayoría de los teclados no tienen daga alif . La palabra Allah الله ( Allāh ) generalmente se produce automáticamente ingresando alif lām lām hāʾ . La palabra consta de alif + ligadura de lām duplicado con un shaddah y una daga alif encima de lām .

Maddah

ـٓ ‎ آ

La maddah مَدَّة es un diacrítico en forma de tilde , que solo puede aparecer encima de un alif (آ) e indica una oclusión glotal /ʔ/ seguida de una /aː/ larga .

En teoría, la misma secuencia /ʔaː/ también podría representarse mediante dos alif s, como en * أَا , donde un hamza encima del primer alif representa el /ʔ/ mientras que el segundo alif representa el /aː/ . Sin embargo, los alif consecutivos nunca se utilizan en la ortografía árabe. En cambio, esta secuencia siempre debe escribirse como un alif único con una maddah encima, la combinación se conoce como alif maddah . Por ejemplo: قُرْآن /qurˈʔaːn/ .

alif waslah

ٱ

El waṣlah وَصْلَة , alif waṣlah أَلِف وَصْلَة o hamzat waṣl هَمْزَة وَصْل parece una letra minúscula ṣād encima de un alif . ⟨ ٱ (también indicado por un alif ا sin hamzah ). Quiere decir que el alif no se pronuncia cuando su palabra no inicia una frase. Por ejemplo: بِٱسْمِ ( bismi ), pero ٱمْشُوا۟ ( imshū no mshū ). Esto se debe a que ninguna palabra árabe puede comenzar con una consonante sin vocales: si la segunda letra del waṣlah tiene kasrah, el alif-waslah produce el sonido /i/. Sin embargo, cuando la segunda letra tiene dammah, produce el sonido /u/.

Ocurre sólo al principio de las palabras, pero puede ocurrir después de las preposiciones y el artículo definido. Se encuentra comúnmente en los verbos imperativos, el aspecto perfectivo de las raíces verbales VII a X y sus sustantivos verbales ( maṣdar ). El alif del artículo definido se considera waṣlah .

Ocurre en frases y oraciones (discurso conectado, no formas aisladas/diccionarias):

Al igual que el superíndice alif, no está escrito en escrituras totalmente vocalizadas, excepto en los textos sagrados, como el Corán y la Biblia arabizada.

Sukūn

ـْـ

El sukūn سُكُونْ es un signo diacrítico en forma de círculo colocado encima de una letra (  ْ ). Indica que la consonante a la que está adjunta no va seguida de vocal, es decir, vocal cero .

Es un símbolo necesario para escribir sílabas consonante-vocal-consonante, muy comunes en árabe. Por ejemplo: دَدْ ( papá ).

El sukūn también se puede utilizar para ayudar a representar un diptongo. Un fatḥah seguido de la letra ( yā' ) con un sukūn encima ( ـَيْ ) indica el diptongo ay ( IPA /aj/ ). Un fatḥah , seguido de la letra ⟨ﻭ⟩ ( wāw ) con un sukūn , ( ـَوْ ) indica / aw/ .

ـۡـ

El sukūn también puede tener una forma alternativa de la pequeña cabeza alta de ḥāʾ ( U+06E1 ۡ ), particularmente en algunos Corán. También pueden existir otras formas (por ejemplo, como una pequeña coma arriba de ⟨ʼ⟩ o como un circunflejo ⟨ˆ⟩ en nastaʿlīq ). [5]

Tanwin (vocales postnasalizadas finales o largas)

ـٌ ‎ ـٍ   ‎ ـً  

Los signos diacríticos de tres vocales se pueden duplicar al final de una palabra para indicar que la vocal va seguida de la consonante n . Pueden considerarse o no ḥarakāt y se les conoce como tanwīn تَنْوِين , o nunación. Los carteles indican, de izquierda a derecha, -un, -in, -an .

Estas terminaciones se utilizan como terminaciones de casos gramaticales indefinidos sin pausa en árabe literario o árabe clásico ( solo triptotes ). En un texto vocalizado se pueden escribir aunque no se pronuncien (ver pausa ). Ver i'rāb para más detalles. En muchos dialectos árabes hablados, las terminaciones están ausentes. Muchos libros de texto árabes introducen el árabe estándar sin estas terminaciones. Es posible que las terminaciones gramaticales no estén escritas en algunos textos árabes vocalizados, ya que el conocimiento de i'rāb varía de un país a otro y existe una tendencia a simplificar la gramática árabe.

El signo ـً se escribe más comúnmente en combinación con ـًا ( alif ), ةً ( tā' marbūṭah ), أً (alif hamzah) o de forma independiente ءً ( hamzah ). Alif siempre debe escribirse (excepto las palabras que terminan en tā' marbūṭah, hamzah o diptotes) incluso si an no lo es. Casos gramaticales y terminaciones tanwīn en formas triptote indefinidas:

Shaddah (marca de geminación consonante)

ـّـ

El shadda o shaddah شَدَّة ( shaddah ), o tashdid تَشْدِيد ( tashdīd ), es un signo diacrítico con forma de pequeña " w " latina escrita.

Se utiliza para indicar geminación (duplicación de consonantes o longitud extra), que es fonémica en árabe. Está escrito encima de la consonante que se va a duplicar. Es el único ḥarakah que se usa comúnmente en la ortografía ordinaria para evitar ambigüedades . Por ejemplo: دّ /dd/ ; madraza مَدْرَسَة ('escuela') vs. mudarrisah مُدَرِّسَة ('maestra', mujer).

I'jām (distinciones fonéticas de consonantes)

Escritura cúfica del siglo VII sin ningún ḥarakāt o i'jām .

Los i'jām إِعْجَام (a veces también llamado nuqaṭ ) [6] son ​​los puntos diacríticos que distinguen varias consonantes que tienen la misma forma ( rasm ), como ـبـ /b/ ب, ـتـ /t/ ت , ـثـ /θ/ ث, ـنـ /n/ ن, y ـيـ /j/ ي. Por lo general, los i'jām no se consideran signos diacríticos sino parte de la letra.

Los primeros manuscritos del Corán no usaban signos diacríticos ni para las vocales ni para distinguir los diferentes valores del rasm . Primero se introdujo la señalización de vocales, como un punto rojo colocado encima, debajo o al lado del rasm , y luego se introdujo la señalización de consonantes, como guiones negros, finos y cortos, únicos o múltiples, colocados encima o debajo del rasm (imagen). Estos i'jām se convirtieron en puntos negros casi al mismo tiempo que los ḥarakāt se convirtieron en pequeñas letras o trazos negros.

Por lo general, los egipcios no usan puntos debajo del yā' final ⟨ ي , que se parece exactamente a alif maqṣūrah ى escrito a mano y impreso. Esta práctica también se utiliza en copias del muṣḥaf ( Corán ) escrito por 'Uthman Ṭāhā . La misma unificación de y alif maqṣūrā ha ocurrido en persa , dando como resultado lo que el estándar Unicode llama " letra árabe farsi Yeh ", que se ve exactamente igual a en las formas inicial y medial, pero exactamente igual a alif maqṣūrah en final y formas aisladas یـ ـیـ ـی .

Kāf aislado con 'alāmātu-l-ihmāl y sin trazo superior junto al kāf inicial con trazo superior.
سۡ سۜ سۣ سٚ ڛ ‎ Varias
formas de escribir /s/ .

En la época en que el i'jām era opcional, las letras sin punta eran ambiguas. Para aclarar que una letra carecería de i'jām en texto puntiagudo (es decir , ح /ħ/ , د /d/ , ر /r/ , س /s/ , ص /sˤ/ , ط /tˤ/ , ع /ʕ/ , ل /l/ , ه /h/ ), la letra podría marcarse con un pequeño signo diacrítico en forma de V o de gaviota arriba, también un semicírculo en superíndice (media luna), un punto de subíndice (excepto en el caso de ح ; se usaron tres puntos con س ), o una miniatura de subíndice de la propia letra. Un trazo en superíndice conocido como jarrah , que se asemeja a una fatħah larga , se usaba para un pecado contraído (asimilado) . Por lo tanto, ڛ سۣ سۡ سٚ se usaron para indicar que la letra en cuestión era verdaderamente س y no ش . [7] Estos signos, conocidos colectivamente como 'alāmātu-l-ihmāl , todavía se utilizan ocasionalmente en la caligrafía árabe moderna , ya sea para su propósito original (es decir, marcar letras sin i'jām ), o a menudo como rellenos de espacio puramente decorativos. La pequeña ک sobre el kāf en sus formas finales y aisladas ك ـك era originalmente un 'alāmatu-l-ihmāl que se convirtió en una parte permanente de la letra. Anteriormente este signo también podía aparecer encima de la forma medial de kāf , cuando esa letra se escribía sin el trazo en su ascendente . Cuando kaf se escribía sin ese trazo, podía confundirse con lam , por lo que kaf se distinguía con un superíndice kaf o un pequeño superíndice hamza ( nabrah ), y lam con un superíndice lam ( lam-alif-mim ). [8]

Hamza (semiconsonante oclusiva glotal)

ئ ؤ إ أ ء

Aunque normalmente un signo diacrítico no se considera una letra del alfabeto, la hamza هَمْزة ( hamzah , oclusiva glotal ), a menudo se presenta como una letra separada en la escritura, se escribe en textos sin punta y no se considera un tashkīl . Puede aparecer como una letra sola o como un signo diacrítico encima o debajo de un alif , wāw o .

La letra que se utilizará para apoyar la hamzah depende de la calidad de las vocales adyacentes;

Considere las siguientes palabras: أَخ /ʔax/ ("hermano"), إسْماعِيل /ʔismaːʕiːl/ ("Ismael"), أُمّ /ʔumm/ ("madre"). Las tres palabras anteriores "comienzan" con una vocal que abre la sílaba y, en cada caso, alif se usa para designar la oclusión glotal inicial (el comienzo real ). Pero si consideramos las sílabas medias que "comienzan" con una vocal: نَشْأة /naʃʔa/ ("origen"), أَفْئِدة /ʔafʔida/ ("corazones"), observe la sílaba /ʔi/ ; singular فُؤاد /fuʔaːd / ), رُؤُوس /ruʔuːs/ ("cabezas", singular رَأْس /raʔs/ ), la situación es diferente, como se señaló anteriormente. Consulte el artículo completo sobre hamzah para obtener más detalles.

Marcadores de tono

Históricamente, la escritura árabe ha sido adoptada y utilizada por muchos idiomas tonales, los ejemplos incluyen Xiao'erjing para el chino mandarín , así como la escritura Ajami adoptada para escribir varios idiomas de África occidental. Sin embargo, una de las deficiencias del árabe, especialmente en comparación con las escrituras derivadas del latín u otros sistemas de escritura indígenas, era que el árabe no tenía una forma de indicar tonos.

Sin embargo, en la adopción de la escritura árabe para el idioma rohingya , conocida como Rohingya Fonna , se desarrollaron y utilizaron 3 marcadores de tono en los manuscritos. Estos marcadores de tono forman parte de la convención ortográfica estandarizada y aceptada de los rohingya. Este es el único caso conocido de marcadores de tono en la escritura árabe . [9] [10]

Los marcadores de tono actúan como "modificadores" de los signos diacríticos de las vocales. En palabras más simples, son "diacríticos para los diacríticos". Se escriben "fuera" de la palabra, lo que significa que se escriben encima del signo diacrítico de la vocal si el signo diacrítico está escrito encima de la palabra, y se escriben debajo del signo diacrítico si el signo diacrítico está escrito debajo de la palabra. Sólo se escriben donde hay vocales diacríticas. Es importante tener en cuenta esto, ya que sin el signo diacrítico presente, no hay forma de distinguir entre marcadores de tono y I'jām , es decir, puntos que se utilizan para distinguir fonéticamente consonantes.

◌࣪ / ◌࣭

El Hārbāy , como se le llama en rohingya, es un solo punto que se coloca encima de Fatḥah y Ḍammah , o Fatḥah rizado y Ḍammah rizado (vocales diacríticas exclusivas de los rohinghya), o sus respectivas versiones de Fatḥatan y Ḍammatan , y se coloca debajo de Kasrah o Kasrah rizado , o su respectiva versión Kasratan . (por ejemplo, دً࣪ / دٌ࣪ / دࣨ࣪ / دٍ࣭ ‎ ) Este marcador de tono indica un tono agudo corto ( /˥/ ). [9] [10]

◌࣫ / ◌࣮

La Ṭelā como se llama en rohingya, son dos puntos que se colocan encima de Fatḥah y Ḍammah , o Fatḥah rizado y Ḍammah rizado , o sus respectivas versiones Fatḥatan y Ḍammatan , y se coloca debajo de Kasrah o Kasrah rizado , o su respectivo Kasratan . versión. (por ejemplo, دَ࣫ / دُ࣫ / دِ࣮ ‎ ) Este marcador de tono indica un tono descendente prolongado ( /˥˩/ ). [9] [10]

◌࣬ / ◌࣯

El Ṭāna como se le llama en Rohingya, es una línea en forma de pez que se coloca encima de Fatḥah y Ḍammah , o Fatḥah rizado y Ḍammah rizado , o sus respectivas versiones Fatḥatan y Ḍammatan , y se coloca debajo de Kasrah o Kasrah rizado , o su respectiva versión de Kasratan . (por ejemplo, دࣤ࣬ / دࣥ࣬ / دࣦ࣯ ‎ ) Este marcador de tono indica un tono ascendente largo ( /˨˦/ ). [9] [10]

Historia

Evolución de la caligrafía árabe temprana (siglos IX-XI). El Basmala fue tomado como ejemplo de los manuscritos cúficos del Corán . (1) Principios del siglo IX, escritura sin puntos ni marcas diacríticas (ver imagen del Basmala Kufic temprano );
(2) y (3) Siglos IX-X bajo la dinastía abasí, el sistema de Abu al-Aswad estableció puntos rojos en los que cada disposición o posición indicaba una vocal corta diferente; más tarde, se utilizó un segundo sistema de puntos negros para diferenciar entre letras como fā' y qāf (ver imagen del cúfico medio );
(4) En el siglo XI, en el sistema de al-Farāhídi (sistema que conocemos hoy), los puntos se cambiaban en formas que se asemejaban a las letras para transcribir las vocales largas correspondientes (ver imagen del cúfico moderno en el Corán ).

Según la tradición, el primero en encargar un sistema de harakat fue Ali , quien nombró a Abu al-Aswad al-Du'ali para la tarea. Abu al-Aswad ideó un sistema de puntos para señalar las tres vocales cortas (junto con sus respectivos alófonos) del árabe. Este sistema de puntos es anterior a los i'jām , puntos utilizados para distinguir entre diferentes consonantes.

El sistema de Abu al-Aswad

El sistema Harakat de Abu al-Aswad era diferente del sistema que conocemos hoy. El sistema utilizaba puntos rojos y cada disposición o posición indicaba una vocal corta diferente.

Un punto encima de una letra indicaba la vocal a , un punto debajo indicaba la vocal i , un punto al lado de una letra representaba la vocal u y dos puntos representaban el tanwīn .

Sin embargo, los primeros manuscritos del Corán no utilizaban los signos vocálicos para cada letra que los requería, sino sólo para las letras en las que eran necesarios para una lectura correcta.

El sistema de Al Farahidi

El precursor del sistema que conocemos hoy es el sistema de Al Farahidi. al-Farāhīdī descubrió que la tarea de escribir usando dos colores diferentes era tediosa y poco práctica. Otra complicación fue que para entonces se habían introducido los i'jām , lo que, si bien eran trazos cortos en lugar de los puntos redondos que se ven hoy en día, significaba que sin una distinción de color los dos podían confundirse.

En consecuencia, reemplazó el ḥarakāt con letras minúsculas en superíndice: alif minúscula, yā' y wāw para las vocales cortas correspondientes a las vocales largas escritas con esas letras, una s(h)īn minúscula para shaddah (geminada), una khā' minúscula. para khafīf (consonante corta; ya no se usa). Su sistema es esencialmente el que conocemos hoy. [11]

Diacritización automática

El proceso de restauración automática de marcas diacríticas se llama diacritización o restauración diacrítica. Es útil para evitar ambigüedades en aplicaciones como la traducción automática del árabe , la conversión de texto a voz y la recuperación de información . Se han desarrollado algoritmos de diacritización automática. [12] [13] Para el árabe estándar moderno , el algoritmo de última generación tiene una tasa de error de palabras (WER) del 4,79%. Los errores más comunes son los nombres propios y las terminaciones de casos . [14] Existen algoritmos similares para otras variedades de árabe . [15]

Ver también

Referencias

  1. ^ abc Karin C. Ryding, "Una gramática de referencia del árabe estándar moderno", Cambridge University Press, 2005, págs. 25-34, específicamente “Capítulo 2, Sección 4: Vocales”
  2. ^ Anatole Lyovin, Brett Kessler, William Ronald Leben, "Una introducción a los idiomas del mundo", "5.6 Bosquejo del árabe estándar moderno", Oxford University Press, 2017, pág. 255, Edición 2, específicamente “5.6.2.2 Vocales”
  3. ^ Amine Bouchentouf, Árabe para principiantes®, John Wiley & Sons, 2018, tercera edición, específicamente la sección "Todo sobre las vocales"
  4. ^ ab "Introducción al árabe escrito". Universidad de Victoria, Canadá .
  5. ^ "Notas de caracteres árabes". r12a .
  6. ^ Ibn Warraq (2002). Ibn Warraq (ed.). Lo que realmente dice el Corán: lenguaje, texto y comentarios. Traducido por Ibn Warraq. Nueva York: Prometeo. pag. 64.ISBN 1-57392-945-X. Archivado desde el original el 11 de abril de 2019 . Consultado el 9 de abril de 2019 .
  7. ^ Gacek, Adam (2009). "Letras sin punta". Manuscritos árabes: un vademécum para lectores . RODABALLO. pag. 286.ISBN 978-90-04-17036-0.
  8. ^ Gacek, Adam (1989). "Prácticas técnicas y recomendaciones registradas por eruditos árabes clásicos y posclásicos sobre la copia y corrección de manuscritos" (PDF) . En Déroche, François (ed.). Les manuscrits du Moyen-Orient: ensayos de codicología y paléografía. Actes du colloque d'Istanbul (Estambul 26-29 de mayo de 1986) . pag. 57 (§ 8. Signos diacríticos y vocalización).
  9. ^ abcd Sacerdote, Lorna A.; Hosken, Martín (10 de agosto de 2010). "Propuesta para agregar caracteres de escritura árabe para idiomas africanos y asiáticos" (PDF) . El Consorcio Unicode . Archivado (PDF) desde el original el 8 de octubre de 2022 . Consultado el 5 de mayo de 2023 .
  10. ^ abcd Pandey, Anshuman (27 de octubre de 2015). "Propuesta para codificar la escritura Hanifi Rohingya en Unicode" (PDF) . El Consorcio Unicode . Archivado (PDF) desde el original el 12 de diciembre de 2019 . Consultado el 5 de mayo de 2023 .
  11. ^ Versteegh, CHM (1997). El idioma árabe. Prensa de la Universidad de Columbia. págs. 56 y siguientes. ISBN 978-0-231-11152-2.
  12. ^ Azmi, Aqil M.; Almajed, Reham S. (10 de octubre de 2013). "Un estudio de las técnicas automáticas de diacritización árabe". Ingeniería del Lenguaje Natural . 21 (3): 477–495. doi :10.1017/S1351324913000284. ISSN  1351-3249. S2CID  31560671.
  13. ^ Almanea, Manar (2021). "Métodos automáticos y redes neuronales en la diacritización de textos árabes: un estudio completo". Acceso IEEE . 9 : 145012–145032. doi : 10.1109/ACCESS.2021.3122977 . ISSN  2169-3536. S2CID  240011970.
  14. ^ Thompson, Brian; Alshehri, Ali (28 de septiembre de 2021). "Mejorar la diacritización del árabe aprendiendo a diacritizar y traducir". arXiv : 2109.14150 [cs.CL].
  15. ^ Masmoudi, Abir; Aloulou, Chafik; Abdellahi, Abdel Ghader Sidi; Belguith, Lamia Hadrich (8 de agosto de 2021). "Diacritización automática de texto en dialecto tunecino utilizando el modelo SMT". Revista internacional de tecnología del habla . 25 : 89-104. doi :10.1007/s10772-021-09864-6. ISSN  1572-8110. S2CID  238782966.