El devanagari es una escritura índica utilizada en muchas lenguas indoarias del norte de la India y Nepal , entre ellas el hindi , el maratí y el nepalí , que era la escritura utilizada para escribir el sánscrito clásico . Existen varios métodos de transliteración del devanagari a la escritura romana (un proceso a veces llamado romanización ), incluida la influyente y sin pérdidas notación IAST . [1] El devanagari romanizado también se llama romanagari . [2]
El Alfabeto Internacional de Transliteración Sánscrita (IAST) es un subconjunto del estándar ISO 15919 , utilizado para la transliteración del sánscrito , prácrito y pāḷi a la escritura romana con diacríticos. IAST es un estándar ampliamente utilizado. Utiliza diacríticos para desambiguar glifos sánscritos fonéticamente similares pero no idénticos. Por ejemplo, las consonantes dentales y retroflejas se desambiguan con un punto debajo: dental द=d y retrofleja ड=ḍ. Una característica importante de IAST es que es reversible sin pérdida, [ cita requerida ] es decir, la transliteración IAST puede convertirse de nuevo al devanāgarī correcto o a otras escrituras del sur de Asia sin ambigüedad. Muchas fuentes Unicode son totalmente compatibles con la visualización e impresión de IAST.
El sistema hunteriano es el "sistema nacional de romanización en la India" y el adoptado oficialmente por el Gobierno de la India . [3] [4] [5]
El sistema hunteriano fue desarrollado en el siglo XIX por William Wilson Hunter , entonces Agrimensor General de la India. [6] Cuando fue propuesto, inmediatamente se encontró con la oposición de los partidarios del anterior "método Sir Roger Dowler" (una corrupción temprana de Siraj ud-Daulah ) de transcripción fonética, que no era sistemático y a menudo distorsionaba, lo que culminó en un dramático enfrentamiento en una reunión del Consejo de la India el 28 de mayo de 1872, donde el nuevo método hunteriano triunfó. El método hunteriano era inherentemente más simple y extensible a varias escrituras índicas porque sistematizaba la transliteración de grafemas , y llegó a prevalecer y ganar aceptación gubernamental y académica. [6] Los oponentes del modelo de transliteración de grafemas continuaron realizando intentos infructuosos de revertir la política gubernamental hasta el cambio de siglo, y un crítico pidió "al Gobierno de la India que abandone todo intento de transliteración científica (es decir, hunteriana) y decida de una vez por todas a favor de un retorno a la antigua ortografía fonética". [7]
Con el tiempo, el método hunteriano se extendió para cubrir varias escrituras índicas, incluidas la birmana y la tibetana . [8] [9] También se hicieron disposiciones para la eliminación de schwa en idiomas indoarios cuando era aplicable, por ejemplo, el hindi कानपुर se translitera como kānpur (y no kānapura ), pero el sánscrito क्रम se translitera como krama (y no kram ). El sistema ha experimentado cierta evolución con el tiempo. Por ejemplo, las vocales largas se marcaban con un acento diacrítico en la versión original, pero esto fue reemplazado más tarde en la actualización del Gobierno de la India de 1954 con un macron . [10] Por lo tanto, जान ( vida ) se romanizó anteriormente como ján, pero comenzó a romanizarse como jān . El sistema hunteriano ha enfrentado críticas a lo largo de los años por no producir resultados fonéticamente precisos y estar "descaradamente orientado a una audiencia receptora de habla inglesa". [10] Específicamente, la falta de diferenciación entre consonantes retroflejas y dentales (por ejemplo, द y ड están representadas por d ) ha sido objeto de repetidas críticas e inspiró varias modificaciones propuestas del hunteriano, incluido el uso de un diacrítico debajo de las retroflejas (por ejemplo, haciendo que द = d y ड = ḍ , que es más legible pero requiere impresión diacrítica) o capitalizándolas (por ejemplo, haciendo que द = d y ड = D , que no requiere impresión diacrítica pero es menos legible porque mezcla letras minúsculas y mayúsculas en las palabras). [11]
La romanización de la Biblioteca Nacional de Calcuta , destinada a la romanización de todas las escrituras índicas , es una extensión de la IAST . Se diferencia de la IAST en el uso de los símbolos ē y ō para ए y ओ (e y o se utilizan para las vocales cortas presentes en muchas lenguas indias), el uso de 'ḷ' para la consonante (en kannada ) ಳ y la ausencia de símbolos para ॠ , ऌ y ॡ .
En la norma ISO 15919 de 2001 se codificó una convención de transliteración estándar no sólo para el devanagari, [12] sino para todos los idiomas del sur de Asia, que proporciona la base para las bibliotecas digitales modernas que cumplen con las normas de la Organización Internacional de Normalización (ISO). La ISO 15919 define la base Unicode común para la transliteración romana de textos del sur de Asia en una amplia variedad de idiomas y escrituras.
Las transliteraciones ISO 15919 son textos independientes de la plataforma, por lo que pueden utilizarse de forma idéntica en todos los sistemas operativos y paquetes de software modernos, siempre que cumplan con las normas ISO. Este es un requisito previo para todas las plataformas modernas, por lo que la ISO 15919 se ha convertido en el nuevo estándar para bibliotecas y archivos digitales para la transliteración de todos los textos del sur de Asia. [ ¿ Investigación original? ]
La norma ISO 15919 [13] utiliza diacríticos para asignar el conjunto mucho más amplio de grafemas brahmicos a la escritura latina. La parte específica del devanagari es casi idéntica a la norma académica IAST : "Alfabeto internacional de transliteración sánscrita", y a ALA-LC , la norma de la Biblioteca del Congreso de los Estados Unidos. [14]
Otra norma, el Sistema de Romanización de Nombres Geográficos de las Naciones Unidas (UNRSGN), fue desarrollada por el Grupo de Expertos de las Naciones Unidas [15] sobre Nombres Geográficos (UNGEGN) [16] y abarca muchas escrituras brahmicas. Existen algunas diferencias [17] entre la ISO 15919 y la UNRSGN.
En comparación con IAST , Harvard-Kyoto parece mucho más simple. No contiene ninguno de los signos diacríticos que contiene IAST. En lugar de diacríticos, Harvard-Kyoto utiliza letras mayúsculas . El uso de letras mayúsculas hace que escribir en Harvard-Kyoto sea mucho más fácil que en IAST, pero produce palabras con letras mayúsculas dentro de ellas.
ITRANS es una extensión de Harvard-Kyoto . El esquema de transliteración ITRANS fue desarrollado para el paquete de software ITRANS , un preprocesador para escrituras índicas . El usuario introduce caracteres latinos y el preprocesador ITRANS convierte los caracteres latinos en devanāgarī (u otras escrituras índicas). La última versión de ITRANS es la 5.30, publicada en julio de 2001. [ cita requerida ]
La desventaja de los esquemas ASCII anteriores es la distinción entre mayúsculas y minúsculas, lo que implica que los nombres transliterados pueden no estar en mayúsculas. Esta dificultad se evita con el sistema desarrollado en 1996 por Frans Velthuis para TeX , basado libremente en IAST, en el que las mayúsculas y minúsculas son irrelevantes.
La notación WX es un esquema de transliteración para representar idiomas indios en ASCII. Este esquema se originó en el IIT Kanpur para el procesamiento computacional de idiomas indios, y es ampliamente utilizado entre la comunidad de procesamiento de lenguaje natural (NLP) en India. La notación (aunque no identificada) se utiliza, por ejemplo, en un libro de texto sobre NLP del IIT Kanpur.[1] Las características sobresalientes de este esquema de transliteración son: Cada consonante y cada vocal tiene una única asignación al alfabeto latino. Por lo tanto, es un código de prefijo,[2] ventajoso desde un punto de vista computacional. Por lo general, las letras minúsculas se utilizan para consonantes no aspiradas y vocales cortas, mientras que las letras mayúsculas se utilizan para consonantes aspiradas y vocales largas. Mientras que las consonantes sordas y sonoras retroflexionadas se asignan a 't, T, d y D', las dentales se asignan a 'w, W, x y X'. De ahí el nombre del esquema "WX", que hace referencia a la asignación idiosincrásica. Ubuntu Linux proporciona soporte de teclado para la notación WX.
SLP1 (Sanskrit Library Phonetic) es un esquema sensible a mayúsculas y minúsculas utilizado inicialmente por Sanskrit Library [18] y desarrollado por Peter Scharf y (el difunto) Malcolm Hyman, quienes lo describieron por primera vez en el apéndice B de su libro Linguistic Issues in Encoding Sanskrit. [19] La ventaja de SLP1 sobre otras codificaciones es que se utiliza un solo carácter ASCII para cada letra devanagari, una peculiaridad que facilita la transliteración inversa. [20]
El hinglish se refiere al hindi romanizado no estandarizado que se utiliza en línea, especialmente en las redes sociales. En la India, el hindi romanizado es la forma de expresión dominante en línea. En un análisis de los comentarios de YouTube , Palakodety et al. identificaron que el 52 % de los comentarios estaban en hindi romanizado, el 46 % en inglés y el 1 % en hindi devanagari . [21]
Otros esquemas ASCII menos populares incluyen la notación WX , Vedatype y el ISO 15919 de 7 bits. La notación WX es un esquema de transliteración para representar idiomas indios en ASCII. Se originó en IIT Kanpur para el procesamiento computacional de idiomas indios y se usa ampliamente entre la comunidad de procesamiento de lenguaje natural (NLP) en India. Este esquema se describe en NLP Panini Archivado el 26 de noviembre de 2013 en Wayback Machine (Apéndice B). Es similar a, pero no tan versátil como, SLP1, en lo que respecta a la cobertura del sánscrito védico. La comparación de WX con otros esquemas se encuentra en Huet (2009), App A.. Vedatype es otro esquema utilizado para codificar textos védicos en Maharishi University of Management . Una utilidad de transcodificación en línea para todos estos esquemas se proporciona en la Biblioteca Sánscrita. La norma ISO 15919 incluye una opción denominada "conjunto de caracteres limitado" para sustituir los diacríticos por prefijos, de modo que sea compatible con ASCII. Anthony Stone ofrece una explicación gráfica aquí.
Lo que sigue es una comparación [22] de los principales métodos de transliteración [23] utilizados para Devanāgarī.
Las letras consonánticas independientes del devanāgarī van seguidas de una shwa implícita (/Ə/). En todos los sistemas de transliteración, esa /Ə/ debe representarse explícitamente mediante una 'a' o cualquier equivalente de shwa .
La siguiente tabla muestra solo las diferencias entre ISO 15919 e IAST para la transliteración devanagari .
Las consonantes del devanāgarī incluyen un sonido "a" inherente, llamado schwa , que debe representarse explícitamente con un carácter "a" en la transliteración. Muchas palabras y nombres transliterados del devanāgarī terminan con "a", para indicar la pronunciación en el sánscrito original . Esta schwa se elimina obligatoriamente en varias lenguas indoarias modernas , como el hindi , el panyabí , el maratí y otras. Esto da como resultado diferentes transliteraciones para el sánscrito y los idiomas que eliminan la schwa, que conservan o eliminan la schwa según corresponda:
Algunas palabras pueden conservar la a final, generalmente porque serían difíciles de pronunciar sin ella:
Por este motivo, algunas palabras que terminan en grupos consonánticos se modifican en varios idiomas índicos modernos, como por ejemplo: Mantra=mantar. Shabda=shabad. Sushumna=sushumana.
La mayoría de las lenguas indias distinguen entre las formas retroflejas y dentales de las consonantes dentales. En los esquemas de transliteración formal, se utilizan las letras romanas estándar para indicar la forma dental, y la forma retrofleja se indica mediante marcas especiales o el uso de otras letras. Por ejemplo, en la transliteración IAST , las formas retroflejas son ṇ, ṭ, ḍ y ṣ.
En la mayoría de las transcripciones informales no se indica la distinción entre consonantes retroflejas y dentales. Sin embargo, muchas personas escriben con mayúscula las consonantes retroflejas en el teclado QWERTY en los mensajes informales, lo que generalmente evita la necesidad de transliteración.
Cuando la letra "h" aparece después de una consonante oclusiva en la transliteración devanāgarī, siempre indica aspiración . Así, "ph" se pronuncia como la p de "pit" (con una pequeña bocanada de aire liberada mientras se dice), nunca como la ph de "photo" ( IPA /f/). (Por otro lado, "p" se pronuncia como la p de "spit" sin liberación de aire.) De manera similar, "th" es una "t" aspirada, ni la th de "this" (sonora, IPA /ð/) ni la th de "thin" (sorda, IPA /θ/).
La aspiración generalmente se indica tanto en los sistemas de transliteración formales como informales.
Como el inglés es un idioma muy utilizado en la enseñanza superior y profesional en la India, la disponibilidad de teclados en devanagari es insignificante en comparación con los teclados en inglés. De manera similar, el software y las interfaces de usuario que se lanzan y promocionan en la India están en inglés, al igual que gran parte de la educación informática disponible allí. Debido al escaso conocimiento de las distribuciones de teclado en devanagari, muchos usuarios indios escriben en hindi en alfabeto latino.
Antes de que se añadiera el devanagari a Unicode , se utilizaban muchas soluciones alternativas para mostrarlo en Internet, y muchos sitios y servicios han seguido utilizándolos a pesar de la amplia disponibilidad de fuentes Unicode que lo admiten. Aunque existen varias convenciones de transliteración para la transliteración del hindi al roman, la mayoría de ellas se basan en diacríticos. Como la mayoría de los indios están familiarizados con la escritura romanizada a través del idioma inglés (que tradicionalmente no utiliza diacríticos), estos sistemas de transliteración son mucho menos conocidos. La mayoría de estos "romanagari" se transliteran arbitrariamente para imitar la ortografía inglesa, lo que da lugar a numerosas inconsistencias.
También es perjudicial para los motores de búsqueda, que no clasifican el texto en hindi escrito en alfabeto latino como hindi. Es posible que el mismo texto tampoco se clasifique como inglés.
Independientemente de la distribución del teclado físico, es posible instalar distribuciones de teclado hindi basadas en Unicode en la mayoría de los sistemas operativos modernos. Hay muchos servicios en línea disponibles que transliteran texto escrito en roman a devanagari con precisión, utilizando diccionarios de hindi como referencia, como Google Transliteration o Microsoft Indic Language Input Tool . Esta solución es similar a los editores de métodos de entrada , que se utilizan tradicionalmente para ingresar texto en idiomas que usan caracteres complejos, sobre todo aquellos que usan logografías.
Los primeros textos sánscritos se transmitían originalmente mediante memorización y repetición. La India post-Harappa no tenía un sistema para escribir lenguas índicas hasta la creación (en los siglos IV-III a.C.) de las escrituras Kharoshti y Brahmi . Estos sistemas de escritura, aunque adecuados para las lenguas índicas medias , no estaban bien adaptados a la escritura sánscrita. Sin embargo, los descendientes posteriores de Brahmi fueron modificados para que pudieran registrar el sánscrito con un detalle fonético exacto. El texto físico más antiguo en sánscrito es una inscripción en roca del gobernante Kshatrapa occidental Rudradaman , escrita alrededor del año 150 d.C. en Junagadh , Gujarat . Debido a la notable proliferación de diferentes variedades de Brahmi en la Edad Media, hoy en día no hay una única escritura utilizada para escribir sánscrito; más bien, los eruditos del sánscrito pueden escribir el idioma en una forma de cualquier escritura que se use para escribir su idioma local. Sin embargo, desde finales de la Edad Media, ha habido una tendencia a utilizar el devanagari para escribir textos sánscritos para un amplio público de lectores.
Los eruditos occidentales del siglo XIX adoptaron el devanagari para las ediciones impresas de textos sánscritos. La editio princeps del Rigveda de Max Müller estaba en devanagari. Los tipógrafos londinenses de Müller competían con sus colegas de Petersburgo que trabajaban en el diccionario de Böhtlingk y Roth a la hora de cortar todos los tipos de ligadura necesarios.
Desde sus inicios, la filología sánscrita occidental también sintió la necesidad de una ortografía romanizada de la lengua. [ cita requerida ] Franz Bopp en 1816 utilizó un esquema de romanización, junto con el devanagari, que se diferenciaba del IAST en que expresaba la longitud vocálica mediante un circunflejo (â, î, û), y la aspiración mediante un spiritus asper (por ejemplo, bʽ para IAST bh). Las sibilantes IAST ṣ y ś las expresó con spiritus asper y lenis, respectivamente (sʽ, sʼ). Monier-Williams en su diccionario de 1899 utilizó ć, ṡ y sh para IAST c, ś y ṣ, respectivamente.
Desde finales del siglo XIX, el interés occidental en la composición tipográfica del devanagari disminuyó. [ cita requerida ] Theodor Aufrecht publicó su edición de 1877 del Rigveda en sánscrito romanizado, y la gramática védica de Arthur Macdonell de 1910 (y la gramática védica para estudiantes de 1916 ) también prescinden del devanagari (mientras que su gramática sánscrita introductoria para estudiantes conserva el devanagari junto con el sánscrito romanizado). Las ediciones occidentales contemporáneas de textos sánscritos aparecen principalmente en IAST.
... Con el paso del tiempo, ha surgido un sistema prácticamente uniforme de transliteración del devanagari y alfabetos afines. Sin embargo, todavía no se ha desarrollado ningún sistema único de romanización...
... ISO 15919 ... No hay evidencia del uso del sistema ni en la India ni en productos cartográficos internacionales... El sistema hunteriano es el sistema nacional de romanización realmente utilizado en la India...
... En la India se utiliza el sistema hunteriano, mediante el cual cada sonido del idioma local se representa uniformemente mediante una determinada letra del alfabeto romano...
... El sistema hunteriano de transliteración, que tiene aceptación internacional, se ha utilizado ...
... fonético o 'método de Sir Roger Dowler' ... El Secretario de Estado y la gran mayoría de sus consejeros dieron un apoyo incondicional al sistema hunteriano...
... al Gobierno de la India a abandonar todo intento de transliteración científica (es decir, hunteriana) y decidir de una vez por todas a favor de un retorno a la antigua ortografía fonética...
... Existe un sistema para transcribir palabras birmanas en letras romanas, que se llama el método "gubernamental" o "hunteriano"...
... El sistema hunteriano tiene reglas para la transliteración al inglés de nombres de origen hindi, urdu, árabe, birmano, chino y tibetano. Estas reglas se describen en el Capítulo VI, Survey of India, Handbook of Topographical Mapping...
... En las fuentes de finales del siglo XIX, el sistema marca las vocales largas con un acento agudo y convierte las letras k y q en k. Sin embargo, cuando el sistema se publicó de nuevo en 1954, se habían realizado modificaciones. Las vocales largas ahora se marcaban con un macrón4 y se mantenía la distinción qk ...
... Sugerido por . Sr. GS Oberoi, Director, Survey of India, en lugar de la tabla existente 'Sistema Hunteriano de Transliteración' que no distingue entre
द
y
ड
,
र
y
ड़
,
त
y
ट
...
... ISO 15919 ... No hay evidencia del uso del sistema ni en la India ni en productos cartográficos internacionales... El sistema hunteriano es el sistema nacional de romanización realmente utilizado en la India...