El alfabeto urdu ( urdu : اردو حروفِ تہجی , romanizado : urdū ḥurūf-i tahajjī ) es el alfabeto de derecha a izquierda utilizado para escribir urdu . Es una modificación del alfabeto persa , que a su vez se deriva de la escritura árabe . Tiene estatus oficial en las repúblicas de Pakistán , India y Sudáfrica . El alfabeto urdu tiene hasta 39 [4] o 40 [5] letras distintas sin mayúsculas y minúsculas distintas y normalmente se escribe en la escritura caligráfica Nastaʿlīq , mientras que el árabe se escribe más comúnmente en el estilo Naskh .
Por lo general, las transliteraciones simples del urdu al alfabeto latino (llamado urdu romano ) omiten muchos elementos fonémicos que no tienen equivalente en inglés u otros idiomas comúnmente escritos en escritura latina .
La escritura urdu estándar es una versión modificada de la escritura persoárabe y tiene sus orígenes en el Irán del siglo XIII . También está relacionado con Shahmukhi , utilizado para las variedades del idioma punjabi en Punjab, Pakistán . Está estrechamente relacionado con el desarrollo del estilo Nastaʻliq de escritura persoárabe.
A pesar de la invención de la máquina de escribir urdu en 1911, los periódicos urdu continuaron publicando copias de guiones escritos a mano por calígrafos conocidos como katibs o khush-navees hasta finales de la década de 1980. El periódico nacional paquistaní Daily Jang fue el primer periódico urdu en utilizar la composición por computadora Nastaʿlīq . Se están realizando esfuerzos para desarrollar un soporte urdu más sofisticado y fácil de usar en computadoras e Internet . Hoy en día, casi todos los periódicos, revistas y publicaciones periódicas en urdu se redactan en computadoras con programas de software en urdu.
Además del subcontinente indio , la escritura urdu también es utilizada por la gran diáspora de Pakistán , incluso en el Reino Unido , los Emiratos Árabes Unidos , los Estados Unidos , Canadá , Arabia Saudita y otros lugares. [5]
El urdu está escrito en estilo Nastaliq ( persa : نستعلیق Nastaʿlīq). El estilo de escritura caligráfica Nastaliq comenzó como una mezcla persa de las escrituras Naskh y Ta'liq . Después de la conquista mogol , Nasta'liq se convirtió en el estilo de escritura preferido del urdu. Es el estilo dominante en Pakistán y muchos escritores urdu en otras partes del mundo lo utilizan. Nastaʿlīq es más cursiva y fluida que su contraparte naskh.
En el alfabeto árabe , y en muchos otros derivados de él, se considera que las letras tienen dos o tres formas generales cada una, según su posición en la palabra (aunque la caligrafía árabe puede añadir una gran complejidad). Pero el estilo Nastaliq en el que se escribe el urdu utiliza más de tres formas generales para muchas letras, incluso en documentos sencillos y no decorativos. [6]
La escritura urdu es una escritura abjad derivada de la escritura persa moderna , que a su vez es un derivado de la escritura árabe . Como abjad, la escritura urdu sólo muestra consonantes y vocales largas; las vocales cortas sólo pueden inferirse por la relación de las consonantes entre sí. Si bien este tipo de escritura es conveniente en lenguas semíticas como el árabe y el hebreo , cuyas raíces consonánticas son la clave de la oración, el urdu es una lengua indoeuropea que requiere más precisión en la pronunciación de los sonidos vocálicos, por lo que requiere más memorización. El número de letras del alfabeto urdu es algo ambiguo y controvertido. [7]
Tāʼ marbūṭah también se considera a veces la letra número 40 del alfabeto urdu, aunque rara vez se usa, excepto en ciertos préstamos del árabe. Tāʼ marbūṭah se considera una forma de tā, la versión árabe del urdu tē, pero no se pronuncia como tal, y cuando se reemplaza con una letra urdu en palabras prestadas naturalizadas, generalmente se reemplaza con Gol hē.
Hamza puede ser difícil de reconocer en la escritura a mano en urdu y en las fuentes diseñadas para replicarla, y se parece mucho a los dos puntos de arriba como se muestra en ت Té y ق Qaf, mientras que en las fuentes árabes y geométricas es más distintivo y se parece mucho a la forma occidental del número 2. (dos).
El urdu tiene más letras agregadas a la base persoárabe para representar sonidos que no están presentes en persa, que ya tiene letras adicionales agregadas a la base árabe para representar sonidos que no están presentes en árabe. Las letras agregadas se muestran en la siguiente tabla:
Existe una letra do-chashmi- he separada , ھ , para denotar una /ʰ/ o una /ʱ/ . Esta letra se utiliza principalmente como parte de la multitud de dígrafos, detallados en la subsección anterior. Además de estas letras, Shahmukhi agrega 2 consonantes encima del alfabeto urdu para escribir punjabi , y Saraiki agrega 4 consonantes más.
El antiguo indostaní usaba cuatro puntos ٿ ڐ ڙ sobre tres letras árabes ت د ر para representar consonantes retroflejas. [16] Al escribir a mano, esos puntos a menudo se escribían como una pequeña línea vertical unida a un pequeño triángulo. Posteriormente, esta forma se volvió idéntica a una letra minúscula ط t̤oʼē . [17] Se supone común y erróneamente que la propia ṭāʾ se usaba para indicar consonantes retroflejas debido a que era una consonante alveolar enfática que los escribas árabes pensaban que se aproximaba a las retroflejas indostánicas. [ cita necesaria ] En urdu moderno [] Error: {{Lang}}: sin texto ( ayuda ) , llamado to'e siempre se pronuncia como dental , no como retroflejo . [ cita necesaria ]
El idioma urdu tiene diez vocales y diez vocales nasalizadas. Cada vocal tiene cuatro formas según su posición: inicial, media, final y aislada. Al igual que en su alfabeto árabe principal, las vocales urdu se representan mediante una combinación de dígrafos y signos diacríticos. Alif , Waw , Ye , He y sus variantes se utilizan para representar las vocales.
El urdu no tiene letras vocales independientes. Las vocales cortas ( a , i , u ) están representadas por signos diacríticos opcionales ( zabar , zer , pesh ) sobre la consonante anterior o una consonante marcador de posición ( alif , ain o hamzah ) si la sílaba comienza con la vocal, y las vocales largas por consonantes. alif , ain , ye y wa'o como matres lectionis, con signos diacríticos desambiguantes, algunos de los cuales son opcionales ( zabar , zer , pesh ), mientras que otros no lo son ( madd , hamzah ). El urdu no tiene vocales cortas al final de las palabras. Esta es una tabla de vocales urdu:
Alif es la primera letra del alfabeto urdu y se utiliza exclusivamente como vocal. Al principio de una palabra, alif se puede utilizar para representar cualquiera de las vocales cortas: اب ab , اسم ism , اردو Urdū . Para una ā larga al comienzo de las palabras alif-mad se usa: آپ āp , pero un alif simple en el medio y al final: بھاگنا bhāgnā .
Wāʾo se usa para representar las vocales "ū", "o", "u" y "au" ([uː], [oː], [ʊ] y [ɔː] respectivamente), y también se usa para representar la palabra labiodental. aproximante , [ʋ]. Sólo cuando está precedido por la consonante k͟hē ( خ ), wāʾo puede representar el sonido "u" ([ʊ]) (como en خود , " k͟hud " - yo mismo ), o no pronunciarse en absoluto (como en خواب , " k͟haab " - sueño ). Esto se conoce como wāʾo silencioso y solo está presente en palabras prestadas del persa. [18]
Ye se divide en dos variantes: choṭī ye ("pequeño ye") y baṛī ye ("grande ye").
Choṭī ye ( ی ) está escrito en todas las formas exactamente como en persa. Se utiliza para la vocal larga "ī" y la consonante "y".
Baṛī ye ( ے ) se usa para representar las vocales "e" y "ai" ( /eː/ y /ɛː/ respectivamente). Baṛī ye se distingue por escrito de choṭī ye sólo cuando aparece al final de una palabra/ligadura. Además, Baṛī ye nunca se usa para comenzar una palabra/ligadura, a diferencia de choṭī ye .
Se divide en dos variantes: gol he ("él redondo") y do-cašmi he ("él de dos ojos").
Gol he ( ہ ) se escribe redondo y en zigzag, y puede impartir el sonido "h" ( /ɦ/ ) en cualquier parte de una palabra. Además, al final de una palabra, se puede utilizar para representar las vocales largas "a" o "e" ( /ɑː/ o /eː/ ), lo que también altera ligeramente su forma (en los sistemas de escritura digitales modernos, esto la forma final se consigue escribiendo dos he's consecutivamente).
Do-cašmi he ( ھ ) se escribe en estilo árabe Naskh (como un bucle), para crear las consonantes aspiradas y escribir palabras en árabe.
Ayn en su posición inicial y final es silencioso en la pronunciación y es reemplazado por el sonido de la vocal anterior o siguiente.
La nasalización de vocales está representada por nun ghunna escrita después de sus versiones no nasalizadas, por ejemplo: ہَے cuando se nasaliza se convertiría en ہَیں . En la forma media, monja ghunna se escribe igual que monja y se diferencia por un signo diacrítico llamado maghnoona o ulta jazm , que es un símbolo V en superíndice encima de ن٘ .
Ejemplos:
El urdu utiliza el mismo subconjunto de signos diacríticos que se utilizan en árabe según las convenciones persas. El urdu también utiliza nombres persas de los signos diacríticos en lugar de nombres árabes. Los signos diacríticos comúnmente utilizados son zabar (árabe fatḥah ), zer (árabe kasrah ), pesh (árabe dammah ), que se utilizan para aclarar la pronunciación de las vocales, como se muestra arriba. Jazam ( ـْـ , árabe sukun ) se usa para indicar un grupo de consonantes y tashdid ( ـّـ , árabe shaddah ) se usa para indicar una geminación , aunque nunca se usa para verbos, que requieren que las consonantes dobles se escriban por separado. Otros signos diacríticos incluyen khari zabar ( daga árabe alif ), do zabar ( fathatan árabe ), que se encuentran en algunas palabras prestadas árabes comunes. A veces también se utilizan otros signos diacríticos árabes, aunque muy raramente en palabras prestadas del árabe. Zer-e-izafat y hamzah-e-izafat se describen en la siguiente sección.
Además de los signos diacríticos comunes, el urdu también tiene signos diacríticos especiales, que a menudo se encuentran sólo en diccionarios para aclarar la pronunciación irregular. Estos signos diacríticos incluyen kasrah-e-majhool , fathah-e-majhool , dammah-e-majhool , maghnoona , ulta jazam , alif-e-wavi y algunos otros signos diacríticos muy raros. Entre estos, sólo maghnoona se usa comúnmente en los diccionarios y tiene una representación Unicode en U+0658. Otros signos diacríticos rara vez se escriben en forma impresa, principalmente en algunos diccionarios avanzados. [19]
Iẓāfat es una construcción sintáctica de dos sustantivos, donde el primer componente es un sustantivo determinado y el segundo es un determinante. Esta construcción fue tomada del persa. Se utiliza una vocal corta "i" para conectar estas dos palabras, y al pronunciar la palabra recién formada, la vocal corta se conecta a la primera palabra. Si la primera palabra termina en consonante o ʿain ( ع ), puede escribirse como zer ( ِ ) al final de la primera palabra, pero normalmente no se escribe en absoluto. Si la primera palabra termina en choṭī he ( ہ ) o ye ( ی o ے ), entonces se usa hamzā ( ء ) encima de la última letra ( ۂ o ئ o ۓ ). Si la primera palabra termina en una vocal larga ( ا o و ), entonces se agrega una variación diferente de baṛī ye ( ے ) con hamzā encima ( ئے , obtenida sumando ے a ئ ) al final de la primera palabra. [20]
En los primeros días de las computadoras, el urdu no estaba representado adecuadamente en ninguna página de códigos . Una de las primeras páginas de códigos que representó el urdu fue la página de códigos IBM 868, que data de 1990. [21] Otras páginas de códigos tempranas que representaron los alfabetos urdu fueron la codificación Windows-1256 y MacArabic , las cuales se remontan a mediados de la década de 1990. En Unicode , el urdu está representado dentro del bloque árabe. Otra página de códigos para el urdu, que se utiliza en la India, es el Código de escritura persoárabe para el intercambio de información . En Pakistán, la página de códigos de 8 bits desarrollada por la Autoridad Nacional del Idioma se llama Urdu Zabta Takhti ( اردو ضابطہ تختی ) (UZT) [22] , que representa el urdu en su forma más completa, incluidos algunos de sus signos diacríticos especializados, aunque UZT es no diseñado para coexistir con el alfabeto latino.
Al igual que otros sistemas de escritura derivados de la escritura árabe, el urdu utiliza el rango Unicode 0600–06FF. [23] Ciertos glifos en este rango parecen visualmente similares (o idénticos cuando se presentan usando fuentes particulares) aunque la codificación subyacente sea diferente. Esto presenta problemas para el almacenamiento y recuperación de información. Por ejemplo, la copia electrónica de la Universidad de Chicago del "Diccionario, hindustani e inglés" de John Shakespear [24] incluye la palabra ' بهارت ' ( bhārat "India"). La búsqueda de la cadena " بھارت " no arroja resultados, mientras que la consulta con la cadena " بهارت " (que parece idéntica en muchas fuentes) devuelve la entrada correcta. [25] Esto se debe a que la forma medial de la letra urdu do chashmi he (U+06BE), utilizada para formar dígrafos aspirados en urdu, es visualmente idéntica en su forma medial a la letra árabe hāʾ (U+0647; valor fonético / h/ ). En urdu, el fonema /h/ está representado por el carácter U+06C1, llamado gol he ( he redondo ), o chhoti he ( he pequeño ).
En 2003, el Centro de Investigación en Procesamiento del Idioma Urdu (CRULP) [26] , una organización de investigación afiliada a la Universidad Nacional de Computación y Ciencias Emergentes de Pakistán , elaboró una propuesta para mapear la codificación UZT de 1 byte de caracteres urdu al formato Unicode. estándar. [27] Esta propuesta sugiere un glifo Unicode preferido para cada carácter del alfabeto urdu.
El Daily Jang fue el primer periódico urdu que se compuso digitalmente en nastaʻliq por computadora. Se están realizando esfuerzos para desarrollar un soporte urdu más sofisticado y fácil de usar en computadoras e Internet. Hoy en día, casi todos los periódicos, revistas y publicaciones periódicas en urdu se redactan en computadoras mediante varios programas de software en urdu, el más extendido de los cuales es el paquete InPage Desktop Publishing. Microsoft ha incluido soporte para el idioma urdu en todas las versiones nuevas de Windows y tanto Windows Vista como Microsoft Office 2007 están disponibles en urdu a través del soporte del Language Interface Pack [28] . La mayoría de las distribuciones de escritorio de Linux también permiten la fácil instalación de soporte y traducciones en urdu. [29] Apple implementó el teclado en idioma urdu en todos los dispositivos móviles en su actualización de iOS 8 en septiembre de 2014. [30]
Existen varios estándares de romanización para escribir urdu con el alfabeto latino, aunque no son muy populares porque la mayoría no representan correctamente el idioma urdu. En lugar de esquemas de romanización estándar, las personas en Internet, teléfonos móviles y medios de comunicación suelen utilizar una forma no estándar de romanización que intenta imitar la ortografía inglesa . El problema de este tipo de romanización es que sólo pueden leerla los hablantes nativos, e incluso ellos con gran dificultad. Entre los esquemas de romanización estandarizados, el más preciso es la romanización ALA-LC , que también cuenta con el respaldo de la Autoridad Nacional del Idioma. Otros esquemas de romanización a menudo se rechazan porque no pueden representar correctamente los sonidos en urdu o porque a menudo no tienen en cuenta la ortografía urdu y favorecen la pronunciación sobre la ortografía. [31]
La Autoridad Nacional del Idioma de Pakistán ha desarrollado una serie de sistemas con notaciones específicas para indicar sonidos distintos del inglés, pero solo alguien que ya esté familiarizado con las cartas de préstamo puede leerlos correctamente. [ cita necesaria ]
El urdu romano también tiene importancia entre los cristianos de Pakistán y el norte de la India . El urdu fue la lengua nativa dominante entre los cristianos de Karachi y Lahore en el actual Pakistán y Madhya Pradesh , Uttar Pradesh Rajasthan en la India, durante la primera parte de los siglos XIX y XX, y todavía lo utilizan los cristianos en estos lugares. Los cristianos paquistaníes e indios utilizaban a menudo la escritura romana para escribir urdu. Así, el urdu romano era una forma común de escribir entre los cristianos paquistaníes e indios en estas zonas hasta la década de 1960. La Sociedad Bíblica de la India publica Biblias en urdū romano que se vendieron hasta finales de la década de 1960 (aunque todavía se publican en la actualidad). Los cancioneros de la iglesia también son comunes en el urdu romano. Sin embargo, el uso del urdu romano está disminuyendo con el uso más amplio del hindi y el inglés en estos estados.