stringtranslate.com

Diacríticos árabes

En los primeros escritos árabes se utilizaba únicamente el rasm (en negro). Más tarde, se añadieron i'jām (en rojo) para que se pudieran distinguir letras como ṣād ( ص ) y ḍād ( ض ). Ḥarakāt (en azul), que se utiliza en el Corán pero no en la mayoría de los escritos árabes, indica vocales cortas, consonantes largas y otras vocalizaciones.

La escritura árabe tiene numerosos signos diacríticos , que incluyen el signo de consonante conocido como iʻjām ( إِعْجَام ) y signos diacríticos suplementarios conocidos como tashkīl ( تَشْكِيل ). Estos últimos incluyen las marcas vocales denominadas ḥarakāt ( حَرَكَات ; sg. حَرَكَة , ḥarakah ).

La escritura árabe es una abjad modificada , donde todas las letras son consonantes, lo que lleva al lector a reemplazar los sonidos vocálicos. Las consonantes cortas y las vocales largas se representan con letras, pero las vocales cortas y la longitud de las consonantes generalmente no se indican por escrito. El tashkīl es opcional para representar las vocales faltantes y la longitud de las consonantes. El árabe moderno siempre se escribe con el i'jām (señalización de consonantes), pero solo los textos religiosos, los libros infantiles y las obras para estudiantes se escriben con el tashkīl completo (guías de vocales y longitud de consonantes). Sin embargo, no es raro que los autores agreguen diacríticos a una palabra o letra cuando el caso gramatical o el significado se consideran ambiguos. Además, las obras clásicas y los documentos históricos presentados al público en general a menudo se presentan con el tashkīl completo , para compensar la brecha en la comprensión resultante de los cambios estilísticos a lo largo de los siglos.

Tashkil

El significado literal de تَشْكِيل tashkīl es 'variación'. Como el texto árabe normal no proporciona suficiente información sobre la pronunciación correcta, el objetivo principal de tashkīl (y ḥarakāt ) es proporcionar una guía fonética o una ayuda fonética; es decir, mostrar la pronunciación correcta para los niños que están aprendiendo a leer o para los estudiantes extranjeros.

La mayor parte de la escritura árabe se escribe sin ḥarakāt (o vocales cortas). Sin embargo, se utilizan comúnmente en textos que exigen un estricto cumplimiento de la pronunciación exacta. Esto es cierto, principalmente, en el Corán ٱلْقُرْآن ( al-Qurʾān ) y la poesía . También es bastante común agregar ḥarakāt a los hadices ٱلْحَدِيث ( al-ḥadīth ; plural: al-ḥādīth ) y la Biblia . Otro uso es en la literatura infantil. Además, ḥarakāt se utiliza en textos ordinarios en palabras individuales cuando una ambigüedad de pronunciación no puede resolverse fácilmente solo a partir del contexto. Los diccionarios árabes con marcas vocálicas proporcionan información sobre la pronunciación correcta tanto a hablantes nativos como extranjeros. En el arte y la caligrafía , se puede utilizar ḥarakāt simplemente porque su escritura se considera estéticamente agradable.

Un ejemplo de un árabe completamente vocalizado ( vocalizado o vocálico ) del Bismillah :

بِسْمِ ٱللَّٰهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ
bismi l-lāhi r-raḥmāni r-raḥīm
En el nombre de Dios, el Todomisericordioso, el Especialmente Misericordioso.

Algunos libros de texto árabes para extranjeros utilizan ahora el ḥarakāt como guía fonética para facilitar el aprendizaje de la lectura árabe. El otro método utilizado en los libros de texto es la romanización fonética de textos no vocalizados. Los estudiantes de árabe buscan textos árabes completamente vocalizados (es decir, textos árabes con ḥarakāt /diacríticos). Algunos diccionarios bilingües en línea también ofrecen el ḥarakāt como guía fonética, de manera similar a los diccionarios de inglés que ofrecen transcripción.

Harakat (marcas vocales cortas)

Las ḥarakāt حَرَكَات , que literalmente significan 'movimientos', son las marcas de vocales cortas. Existe cierta ambigüedad en cuanto a qué tashkīl también son ḥarakāt ; los tanwīn , por ejemplo, son marcadores tanto de vocales como de consonantes.

Fatah

ـَ

La fatḥah فَتْحَة es una pequeña línea diagonal colocada sobre una letra y representa una /a/ corta (como el sonido /a/ en la palabra inglesa "cat"). La palabra fatḥah en sí ( فَتْحَة ) significa apertura y se refiere a la apertura de la boca al producir una /a/ . Por ejemplo, con dāl (de aquí en adelante, la consonante base en los siguientes ejemplos): دَ /da/ .

Cuando se coloca una fatḥah antes de una letra simple ⟨ ا ( alif ) (es decir, una que no tiene hamza o vocal propia), representa una /aː/ larga (cercana al sonido de "a" en la palabra inglesa "dad", con una vocal frontal abierta /æː/, no posterior /ɑː/ como en "father"). Por ejemplo: دَا /daː/ . La fatḥah no suele escribirse en tales casos. Cuando se coloca una fathah antes de la letra ⟨ ⟩ (yā'), crea una /aj/ (como en "l ie "); y cuando se coloca antes de la letra ⟨ و ⟩ (wāw), crea una /aw/ (como en "c ow ").

Aunque emparejada con una letra simple crea una vocal anterior abierta (/a/), que a menudo se realiza como casi abierta (/ æ /), el estándar también permite variaciones, especialmente bajo ciertas condiciones ambientales. Por lo general, para tener la pronunciación más central (/ ä /) o posterior (/ ɑ /), la palabra presenta una consonante posterior cercana, como las enfáticas, así como qāf o rā' . Una cualidad "posterior" similar también la experimentan otras vocales en presencia de tales consonantes, sin embargo no se realiza de manera tan drástica como en el caso de fatḥah . [1] [2] [3]

Las fatḥah se codifican como U+0618 ؘ FATHA ÁRABE PEQUEÑA, U+064E َFATHA ÁRABE, U+FE76FORMA AISLADA DE FATHA ÁRABE, o U+FE77FORMA MEDIA DE FATHA ÁRABE.

Kasrah

ـِ

Una línea diagonal similar debajo de una letra se llama kasrah كَسْرَة ⟩ y designa una /i/ corta (como en "me", "be") y sus alófonos [i, ɪ, e, e̞, ɛ] (como en "Tim", "sit"). Por ejemplo: دِ /di/ . [4]

Cuando se coloca una kasrah antes de una letra simple ⟨ ( yā' ), representa una /iː/ larga (como en la palabra inglesa "steed"). Por ejemplo: دِي /diː/ . La kasrah no suele escribirse en estos casos, pero si yā' se pronuncia como un diptongo /aj/ , se debe escribir fatḥah sobre la letra precedente para evitar una mala pronunciación. La palabra kasrah significa 'romper'. [1]

Las Kasrah se codifican como U+061A ؚKASRA ÁRABE PEQUEÑO, U+0650 ِKASRA ÁRABE, U+FE7AFORMA AISLADA DE KASRA ÁRABEo U+FE7BFORMA MEDIA DE KASRA ÁRABE.

Dammah

ـُ

El ḍammah ضَمَّة es un pequeño diacrítico en forma de rizo que se coloca sobre una letra para representar una /u/ corta (como en "duque", más corta "tú") y sus alófonos [u, ʊ, o, o̞, ɔ] (como en "poner", o "toro"). Por ejemplo: دُ /du/ . [4]

Cuando se coloca una ḍammah antes de una letra simple ⟨ و ( wāw ), representa una /uː/ larga (como el sonido 'oo' en la palabra inglesa "swoop"). Por ejemplo: دُو /duː/ . La ḍammah no suele escribirse en estos casos, pero si wāw se pronuncia como un diptongo /aw/ , se debe escribir fatḥah sobre la consonante precedente para evitar una mala pronunciación. [1]

La palabra ḍammah (ضَمَّة) en este contexto significa redondeo , ya que es la única vocal redondeada en el inventario de vocales del árabe.

Las Ḍammah se codifican como U+0619 ؙDAMMA ÁRABE PEQUEÑA, U+064F ُDAMMA ÁRABE, U+FE78FORMA AISLADA DE DAMMA ÁRABEo U+FE79FORMA MEDIA DE DAMMA ÁRABE.

Alif Khanjariyah

ــٰ

El superíndice (o daga) alif أَلِف خَنْجَرِيَّة ( alif khanjarīyah ), se escribe como un trazo vertical corto encima de una letra. Indica un sonido /aː/ largo para el cual normalmente no se escribe alif . Por ejemplo: هَٰذَا ( hādhā ) o رَحْمَٰن ( raḥmān ).

La daga alif aparece en pocas palabras, pero incluyen algunas comunes; sin embargo, rara vez se escribe, incluso en textos completamente vocalizados. La mayoría de los teclados no tienen daga alif . La palabra Allah الله ( Allāh ) generalmente se produce automáticamente al ingresar alif lām lām hāʾ . La palabra consiste en alif + ligadura de lām doble con una shaddah y una daga alif sobre lām , seguida de ha' .

Maddah

ـٓ
A

La maddah مَدَّة es un diacrítico en forma de tilde , que solo puede aparecer encima de un alif (آ) e indica una oclusión glotal /ʔ/ seguida de una /aː/ larga .

En teoría, la misma secuencia /ʔaː/ también podría representarse con dos alif , como en * أَا , donde una hamza sobre el primer alif representa el /ʔ/ mientras que el segundo alif representa el /aː/ . Sin embargo, en la ortografía árabe nunca se utilizan alif consecutivos . En cambio, esta secuencia siempre debe escribirse como un solo alif con una maddah encima, la combinación conocida como alif maddah . Por ejemplo: قُرْآن /qurˈʔaːn/ .

En los escritos coránicos, se coloca una maddah sobre cualquier otra letra para indicar el nombre de la letra, aunque algunas letras pueden llevar una daga alif . Por ejemplo: لٓمٓصٓ ( lām - mīm - ṣād ) o يـٰسٓ ( yāʼ-sīn )

Alif waslah

ٱ

El waṣlah وَصْلَة , alif waṣlah أَلِف وَصْلَة o hamzat waṣl هَمْزَة وَصْل parece la cabeza de un pequeño ṣād sobre un alif ٱ (también indicado por un alif ا sin hamzah ). Significa que el alif no se pronuncia cuando su palabra no comienza una oración. Por ejemplo: بِٱسْمِ ( bismi ), pero ٱمْشُوا۟ ( imshū no mshū ). Esto se debe a que en árabe, la primera consonante de una palabra siempre debe ir seguida de un sonido vocálico: si la segunda letra de la waṣlah tiene una kasrah, la alif-waslah produce el sonido /i/. Sin embargo, cuando la segunda letra de esta tiene una dammah, produce el sonido /u/.

Aparece solo al principio de las palabras, pero puede aparecer después de las preposiciones y del artículo definido. Se encuentra comúnmente en los verbos imperativos, el aspecto perfectivo de las raíces verbales VII a X y sus sustantivos verbales ( maṣdar ). El alif del artículo definido se considera un waṣlah .

Aparece en frases y oraciones (discurso conectado, no formas aisladas/de diccionario):

Al igual que el superíndice alif, no está escrito en escrituras completamente vocalizadas, a excepción de los textos sagrados, como el Corán y la Biblia arabizada.

Sukun

ـْـ

El sukūn سُكُونْ es un diacrítico en forma de círculo que se coloca encima de una letra (  ْ ). Indica que la letra a la que está unido no está seguida por una vocal, es decir, cero -vocal.

Es un símbolo necesario para escribir sílabas consonante-vocal-consonante, muy comunes en árabe. Por ejemplo: دَدْ ( papá ).

El sukūn también puede usarse para representar un diptongo. Un fatḥah seguido de la letra ( yā' ) con un sukūn encima ( ـَيْ ) indica el diptongo ay ( IPA /aj/ ). Un fatḥah , seguido de la letra ( wāw ) con un sukūn , ( ـَوْ ) indica /aw/ .

Los sukūn se codifican como U+0652 ْSUKUN ÁRABE, U+FE7EFORMA AISLADA SUKUN ÁRABEo U+FE7F ﹿFORMA MEDIA SUKUN ÁRABE.

ـۡـ

El sukūn puede tener también una forma alternativa de la pequeña cabeza alta de ḥāʾ ( U+06E1 ۡ CABEZA ÁRABE PEQUEÑA ALTA SIN PUNTO DE KHAH ), particularmente en algunos Coranes. También pueden existir otras formas (por ejemplo, como una pequeña coma sobre ⟨ʼ⟩ o como un circunflejo ⟨ˆ⟩ en nastaʿlīq ). [5]

Tanwin

ـٌ
ـٍ
ـً

Los tres diacríticos vocálicos pueden duplicarse al final de una palabra para indicar que la vocal va seguida de la consonante n . Pueden considerarse o no ḥarakāt y se conocen como tanwīn تَنْوِين o nunación. Los signos indican, de izquierda a derecha, -an, -in, -un .

Estas terminaciones se utilizan como terminaciones gramaticales indefinidas sin pausa en árabe literario o árabe clásico ( solo triptotes ). En un texto vocalizado, pueden escribirse incluso si no se pronuncian (ver pausa ). Ver i'rāb para más detalles. En muchos dialectos árabes hablados, las terminaciones están ausentes. Muchos libros de texto árabes introducen el árabe estándar sin estas terminaciones. Las terminaciones gramaticales pueden no estar escritas en algunos textos árabes vocalizados, ya que el conocimiento de i'rāb varía de un país a otro y existe una tendencia a simplificar la gramática árabe.

El signo ـً se escribe más comúnmente en combinación con ـًا ( alif ), ةً ( tā' marbūṭah ), أً ( alif hamzah ) o de forma independiente ءً ( hamzah ). Alif siempre debe escribirse (excepto en palabras que terminan en tā' marbūṭah , hamzah o diptotes ) incluso si an no lo está. Casos gramaticales y terminaciones de tanwīn en formas de triptote indefinido:

Shaddah

ـّـ

El shadda o shaddah شَدَّة ( shaddah ), o tashdid تَشْدِيد ( tashdīd ), es un signo diacrítico con forma de pequeña " w " latina escrita.

Se utiliza para indicar geminación (duplicación de consonantes o longitud extra), que es fonémica en árabe. Se escribe encima de la consonante que se va a duplicar. Es la única ḥarakah que se usa comúnmente en la ortografía ordinaria para evitar ambigüedades . Por ejemplo: دّ /dd/ ; madrasah مَدْرَسَة ('escuela') vs. mudarrisah مُدَرِّسَة ('maestra', mujer). Tenga en cuenta que cuando la letra duplicada lleva una vocal, es la shaddah a la que se une la vocal, no a la letra en sí: دَّ /dda/ , دِّ /ddi/ .

Las shaddah están codificadas como U+0651 ّSHADDA ÁRABE, U+FE7CFORMA AISLADA DE SHADDA ÁRABEo U+FE7DFORMA MEDIA DE SHADDA ÁRABE.

Yo soy

Escritura cúfica del siglo VII sin ḥarakāt ni i'jām .

Los i'jām ( إِعْجَام ; a veces también llamados nuqaṭ ) [6] son ​​los puntos diacríticos que distinguen varias consonantes que tienen la misma forma ( rasm ), como ص /sˤ/ , ض /dˤ/ . Normalmente los i'jām no se consideran diacríticos sino parte de la letra.

Los manuscritos antiguos del Corán no utilizaban diacríticos ni para las vocales ni para distinguir los diferentes valores del rasm . Primero se introdujo la señalización vocálica, como un punto rojo colocado encima, debajo o al lado del rasm , y más tarde se introdujo la señalización consonántica, como rayas negras cortas y delgadas, simples o múltiples, colocadas encima o debajo del rasm . Estos i'jām se convirtieron en puntos negros aproximadamente al mismo tiempo que el ḥarakāt se convirtió en pequeñas letras o trazos negros.

Por lo general, los egipcios no usan puntos debajo de la yā' final ( ي ), que se ve exactamente como alif maqṣūrah ( ى ) en la escritura a mano y en la imprenta. Esta práctica también se usa en copias del muṣḥaf ( Corán ) escritas por 'Uthman Ṭāhā . La misma unificación de y alif maqṣūrā ha sucedido en persa , dando como resultado lo que el estándar Unicode llama " letra árabe farsi Yeh ", que se ve exactamente igual que en las formas inicial y media, pero exactamente igual que alif maqṣūrah en las formas final y aislada.

Kāf aislado con 'alāmātu-l-ihmāl y sin trazo superior junto al kāf inicial con trazo superior.
سۡ سۜ سۣ سٚ ڛ

En la época en que el i'jām era opcional, las letras sin punta eran ambiguas. Para aclarar que una letra carecería de i'jām en un texto con punta, la letra podía marcarse con un pequeño diacrítico en forma de v o de gaviota encima, también un semicírculo superíndice (media luna), un punto subíndice (excepto en el caso de ح ; se usaban tres puntos con س ), o una miniatura subíndice de la propia letra. Un trazo superíndice conocido como jarrah , parecido a una fatħah larga , se usaba para un sin contraído (asimilado) . Así, ڛ سۣ سۡ سٚ se usaban para indicar que la letra en cuestión era realmente س y no ش . [7] Estos signos, conocidos colectivamente como 'alāmātu-l-ihmāl , todavía se utilizan ocasionalmente en la caligrafía árabe moderna , ya sea por su propósito original (es decir, marcar letras sin i'jām ), o a menudo como rellenos de espacios puramente decorativos. La pequeña ک sobre el kāf en sus formas finales y aisladas ك ـك era originalmente un 'alāmatu-l-ihmāl que se convirtió en una parte permanente de la letra. Anteriormente, este signo también podía aparecer sobre la forma medial de kāf , cuando esa letra se escribía sin el trazo en su ascendente . Cuando kaf se escribía sin ese trazo, podía confundirse con lam , por lo que kaf se distinguía con un superíndice kaf o un pequeño superíndice hamza ( nabrah ), y lam con un superíndice lam ( lam-alif-mim ). [8]

Hamza

Sí, sí.

Aunque normalmente no se considera a veces una letra del alfabeto, la hamza هَمْزة ( hamzah , oclusión glotal ), a menudo aparece como una letra separada en la escritura, se escribe en textos sin punta y no se considera un tashkīl . Puede aparecer como una letra por sí sola o como un diacrítico sobre o debajo de un alif , un wāw o un .

La letra que se debe utilizar para apoyar la hamzah depende de la calidad de las vocales adyacentes y su ubicación en la palabra;

Consideremos las siguientes palabras: أَخ /ʔax/ ("hermano"), إسْماعِيل /ʔismaːʕiːl/ ("Ismael"), أُمّ /ʔumm/ ("madre"). Las tres palabras anteriores "comienzan" con una vocal que abre la sílaba y, en cada caso, se utiliza alif para designar la oclusión glotal inicial (el comienzo real ). Pero si consideramos las sílabas intermedias que "comienzan" con una vocal: نَشْأة /naʃʔa/ ("origen"), أَفْئِدة /ʔafʔida/ ("corazones"; note la sílaba /ʔi/ ; singular فُؤاد ⟩ / fuʔaːd/ ), رُؤُوس /ruʔuːs/ ("cabezas", singular رَأْس /raʔs/ ), la situación es diferente, como se señaló anteriormente. Vea el artículo completo sobre hamzah para más detalles.

Diacríticos que no se utilizan en el árabe estándar moderno

Los diacríticos que no se utilizan en el árabe estándar moderno, pero sí en otros idiomas que utilizan la escritura árabe, y a veces para escribir dialectos árabes, incluyen (la lista no es exhaustiva):

Marcadores de tono rohingya

Históricamente, la escritura árabe ha sido adoptada y utilizada por muchos idiomas tonales, como por ejemplo el xiao'erjing para el chino mandarín , así como la escritura ajami adoptada para escribir varios idiomas de África occidental. Sin embargo, la escritura árabe nunca tuvo una forma inherente de representar tonos hasta que fue adaptada para el idioma rohingya . El rohingya fonna son tres marcadores de tono que forman parte de la convención ortográfica estandarizada y aceptada del rohingya. Sigue siendo el único ejemplo conocido de marcadores de tono dentro de la escritura árabe . [14] [15]

Los marcadores de tono actúan como "modificadores" de los diacríticos vocálicos. En palabras más sencillas, son "diacríticos para los diacríticos". Se escriben "fuera" de la palabra, lo que significa que se escriben encima del diacrítico vocálico si el diacrítico se escribe encima de la palabra, y se escriben debajo del diacrítico si el diacrítico se escribe debajo de la palabra. Solo se escriben donde hay diacríticos vocálicos. Es importante tener esto en cuenta, ya que sin el diacrítico presente, no hay forma de distinguir entre los marcadores de tono y los I'jām, es decir, los puntos que se utilizan para hacer distinciones fonéticas de consonantes.

Harbay

◌࣪ / ◌࣭

El Hārbāy , como se le llama en rohingya, es un solo punto que se coloca sobre Fatḥah y Ḍammah , o Fatḥah rizado y Ḍammah rizado (diacríticos vocálicos exclusivos de los rohingya), o sus respectivas versiones Fatḥatan y Ḍammatan , y se coloca debajo de Kasrah o Kasrah rizado , o su respectiva versión Kasratan . (p. ej. دً࣪ / دٌ࣪ / دࣨ࣪ / دٍ࣭ ‎) Este marcador de tono indica un tono alto corto ( /˥/ ). [14] [15]

Tala

◌࣫ / ◌࣮

El Ṭelā , como se le llama en rohingya, son dos puntos que se colocan encima de Fatḥah y Ḍammah , o Fatḥah rizada y Ḍammah rizada , o sus respectivas versiones Fatḥatan y Ḍammatan , y se coloca debajo de Kasrah o Kasrah rizada , o sus respectivas versiones Kasratan . (p. ej. دَ࣫ / دُ࣫ / دِ࣮ ‎) Este marcador de tono indica un tono descendente largo ( /˥˩/ ). [14] [15]

Taena

◌࣬ / ◌࣯

La Ṭāna , como se la llama en rohingya, es una línea en forma de pez que se coloca encima de Fatḥah y Ḍammah , o Fatḥah rizada y Ḍammah rizada , o sus respectivas versiones Fatḥatan y Ḍammatan , y se coloca debajo de Kasrah o Kasrah rizada , o su respectiva versión Kasratan . (p. ej. دࣤ࣬ / دࣥ࣬ / دࣦ࣯ ‎) Este marcador de tono indica un tono ascendente largo ( /˨˦/ ). [14] [15]

Historia

Evolución de la caligrafía árabe primitiva (siglos IX-XI). Se tomó como ejemplo la basmala , de los manuscritos cúficos del Corán
. (1) Principios del siglo IX, escritura sin puntos ni signos diacríticos (véase la imagen de la basmala cúfica primitiva );
(2) y (3) Siglos IX-X, bajo la dinastía abasí, el sistema de Abu al-Aswad estableció puntos rojos con cada disposición o posición indicando una vocal corta diferente; más tarde, se utilizó un segundo sistema de puntos negros para diferenciar entre letras como fā' y qāf ;
(4) Siglo XI, en el sistema de al-Farāhídi (sistema que conocemos hoy) los puntos se cambiaron a formas que se asemejaban a las letras para transcribir las vocales largas correspondientes.

Según la tradición, el primero en encargar un sistema de harakat fue Ali , quien designó a Abu al-Aswad al-Du'ali para la tarea. Abu al-Aswad ideó un sistema de puntos para señalar las tres vocales cortas (junto con sus respectivos alófonos) del árabe. Este sistema de puntos es anterior al i'jām , puntos utilizados para distinguir entre diferentes consonantes.

El sistema de Abu al-Aswad

El sistema de Harakat de Abu al-Aswad era diferente del sistema que conocemos hoy. El sistema utilizaba puntos rojos y cada disposición o posición indicaba una vocal corta diferente.

Un punto encima de una letra indicaba la vocal a , un punto debajo indicaba la vocal i , un punto al costado de una letra representaba la vocal u y dos puntos representaban la tanwīn .

Sin embargo, los primeros manuscritos del Corán no utilizaban los signos vocálicos para cada letra que los requería, sino sólo para las letras en las que eran necesarios para una lectura correcta.

El sistema de Al Farahidi

El precursor del sistema que conocemos hoy es el sistema de Al Farahidi. Al-Farāhīdī descubrió que la tarea de escribir con dos colores diferentes era tediosa y poco práctica. Otra complicación fue que para entonces ya se había introducido el i'jām , que, si bien eran trazos cortos en lugar de los puntos redondos que vemos hoy, significaba que sin una distinción de color los dos podían confundirse.

En consecuencia, reemplazó la ḥarakāt con pequeñas letras superíndice: alif, yā' y wāw minúsculas para las vocales cortas correspondientes a las vocales largas escritas con esas letras, una s(h)īn minúscula para shaddah (geminada), una khā' minúscula para khafīf (consonante corta; en desuso). Su sistema es esencialmente el que conocemos hoy. [17]

Diacritización automática

El proceso de restauración automática de las marcas diacríticas se denomina diacritización o restauración diacrítica. Es útil para evitar la ambigüedad en aplicaciones como la traducción automática árabe , la conversión de texto a voz y la recuperación de información . Se han desarrollado algoritmos de diacritización automática. [18] [19] Para el árabe estándar moderno , el algoritmo de última generación tiene una tasa de error de palabras (WER) del 4,79 %. Los errores más comunes son los nombres propios y las terminaciones de mayúsculas y minúsculas . [20] Existen algoritmos similares para otras variedades del árabe . [21]

Véase también

Referencias

  1. ^ abc Karin C. Ryding, "A Reference Grammar of Modern Standard Arabic", Cambridge University Press, 2005, págs. 25-34, específicamente "Capítulo 2, Sección 4: Vocales"
  2. ^ Anatole Lyovin, Brett Kessler, William Ronald Leben, "Introducción a las lenguas del mundo", "5.6 Bosquejo del árabe estándar moderno", Oxford University Press, 2017, pág. 255, Edición 2, específicamente "5.6.2.2 Vocales"
  3. ^ Amine Bouchentouf, Arabic For Dummies®, John Wiley & Sons, 2018, 3.ª edición, específicamente la sección "Todo sobre las vocales"
  4. ^ ab "Introducción al árabe escrito". Universidad de Victoria, Canadá .
  5. ^ "Notas sobre caracteres árabes". r12a .
  6. ^ Ibn Warraq (2002). Ibn Warraq (ed.). Lo que realmente dice el Corán: lenguaje, texto y comentario. Traducido por Ibn Warraq. Nueva York: Prometheus. p. 64. ISBN 1-57392-945-XArchivado desde el original el 11 de abril de 2019 . Consultado el 9 de abril de 2019 .
  7. ^ Gacek, Adam (2009). "Cartas sin punta". Manuscritos árabes: un vademécum para lectores . BRILL. pág. 286. ISBN 978-90-04-17036-0.
  8. ^ Gacek, Adam (1989). "Prácticas técnicas y recomendaciones registradas por eruditos árabes clásicos y posclásicos sobre la copia y corrección de manuscritos" (PDF) . En Déroche, François (ed.). Les manuscrits du Moyen-Orient: ensayos de codicología y paléografía. Actes du colloque d'Istanbul (Estambul 26-29 de mayo de 1986) . pag. 57 (§ 8. Signos diacríticos y vocalización).
  9. ^ Alkalesi, Yasin M. (2001) "Árabe iraquí moderno: un libro de texto". Georgetown University Press. ISBN 978-0878407880 
  10. ^ ab «Rango árabe: 0600–06FF El estándar Unicode, versión 15.1» (PDF) . Unicode . Consultado el 10 de julio de 2024 .
  11. ^ "Vocal 04: ٲ / ä - (aae)". Diccionario de Cachemira . 31 de enero de 2021 . Consultado el 11 de julio de 2024 .
  12. ^ "Vocal07: اٟ / ü (ι)". Diccionario de Cachemira . 6 de febrero de 2021 . Consultado el 11 de julio de 2024 .
  13. ^ Mirza, Umair (2006). بروشسکی اردو لغت [ Diccionario Burushaski-Urdu ] (en urdu y Burushaski). págs. 28 y 29. ISBN 969-404-66-0. Recuperado el 13 de julio de 2024 .{{cite book}}: CS1 maint: ignored ISBN errors (link)
  14. ^ abcde Priest, Lorna A.; Hosken, Martin (10 de agosto de 2010). "Propuesta para añadir caracteres de escritura árabe a los idiomas africanos y asiáticos" (PDF) . El Consorcio Unicode . Archivado (PDF) del original el 8 de octubre de 2022 . Consultado el 5 de mayo de 2023 .
  15. ^ abcde Pandey, Anshuman (27 de octubre de 2015). «Propuesta para codificar la escritura rohinyá hanifi en Unicode» (PDF) . El Consorcio Unicode . Archivado (PDF) del original el 12 de diciembre de 2019. Consultado el 5 de mayo de 2023 .
  16. ^ "Propuesta de inclusión de determinados caracteres en Unicode" (PDF) .
  17. ^ Versteegh, CHM (1997). La lengua árabe. Columbia University Press. pp. 56 y siguientes. ISBN 978-0-231-11152-2.
  18. ^ Azmi, Aqil M.; Almajed, Reham S. (10 de octubre de 2013). "Un estudio de las técnicas de diacritización automática del árabe". Ingeniería del lenguaje natural . 21 (3): 477–495. doi :10.1017/S1351324913000284. ISSN  1351-3249. S2CID  31560671.
  19. ^ Almanea, Manar (2021). "Métodos automáticos y redes neuronales en la diacritización de textos árabes: un estudio exhaustivo". IEEE Access . 9 : 145012–145032. Bibcode :2021IEEEA...9n5012A. doi : 10.1109/ACCESS.2021.3122977 . ISSN  2169-3536. S2CID  240011970.
  20. ^ Thompson, Brian; Alshehri, Ali (28 de septiembre de 2021). "Mejorar la diacritización árabe aprendiendo a diacritizar y traducir". arXiv : 2109.14150 [cs.CL].
  21. ^ Masmoudi, Abir; Aloulou, Chafik; Abdellahi, Abdel Ghader Sidi; Belguith, Lamia Hadrich (8 de agosto de 2021). "Diacritización automática de texto en dialecto tunecino utilizando el modelo SMT". Revista internacional de tecnología del habla . 25 : 89-104. doi :10.1007/s10772-021-09864-6. ISSN  1572-8110. S2CID  238782966.