Existen muchos sistemas de romanización uniformes o estandarizados que pueden clasificarse según sus características. Las características de un sistema en particular pueden hacerlo más adecuado para diversas aplicaciones, a veces contradictorias, como la recuperación de documentos, el análisis lingüístico, la legibilidad sencilla y la representación fiel de la pronunciación.
Lengua de origen o lengua donante: un sistema puede estar diseñado para romanizar textos de una lengua en particular, de una serie de lenguas o de cualquier lengua en un sistema de escritura en particular. Un sistema específico para una lengua generalmente conserva características lingüísticas como la pronunciación, mientras que el sistema general puede ser mejor para catalogar textos internacionales.
Lengua de destino o lengua receptora: la mayoría de los sistemas están pensados para un público que habla o lee una lengua determinada. (Los denominados sistemas de romanización internacional para textos cirílicos se basan en alfabetos centroeuropeos como el checo y el croata ).
Simplicidad: dado que el alfabeto latino básico tiene una cantidad menor de letras que muchos otros sistemas de escritura, se deben utilizar dígrafos , diacríticos o caracteres especiales para representarlos a todos en la escritura latina. Esto afecta la facilidad de creación, almacenamiento y transmisión digital, reproducción y lectura del texto romanizado.
Reversibilidad: si el original puede restaurarse o no a partir del texto convertido. Algunos sistemas reversibles permiten una versión simplificada irreversible.
Transcripción
Si la romanización intenta transliterar la escritura original, el principio rector es una correspondencia uno a uno de los caracteres del idioma de origen con la escritura de destino, con menos énfasis en cómo suena el resultado cuando se pronuncia según el idioma del lector. Por ejemplo, la romanización Nihon-shiki del japonés permite al lector informado reconstruir las sílabas kana japonesas originales con un 100% de precisión, pero requiere conocimientos adicionales para una pronunciación correcta.
Transcripción
Fonémica
La mayoría de las romanizaciones tienen como objetivo permitir que el lector ocasional que no esté familiarizado con la escritura original pronuncie el idioma de origen con razonable precisión. Dichas romanizaciones siguen el principio de transcripción fonémica e intentan reproducir los sonidos significativos ( fonemas ) del original con la mayor fidelidad posible en el idioma de destino. La popular romanización Hepburn del japonés es un ejemplo de romanización transcripcional diseñada para hablantes de inglés.
Fonético
La conversión fonética va un paso más allá e intenta representar todos los fonemas del idioma de origen, sacrificando la legibilidad si es necesario, utilizando caracteres o convenciones que no se encuentran en la escritura de destino. En la práctica, este tipo de representación casi nunca intenta representar todos los alófonos posibles (especialmente aquellos que aparecen de forma natural debido a efectos de coarticulación ) y, en cambio, se limita a las distinciones alofónicas más significativas. El Alfabeto Fonético Internacional es el sistema más común de transcripción fonética.
Comercio
En la mayoría de los pares de idiomas, la creación de una romanización utilizable implica un equilibrio entre los dos extremos. Las transcripciones puras no suelen ser posibles, ya que el idioma de origen suele contener sonidos y distinciones que no se encuentran en el idioma de destino, pero que deben mostrarse para que la forma romanizada sea comprensible. Además, debido a la variación diacrónica y sincrónica, ninguna lengua escrita representa ninguna lengua hablada con perfecta precisión y la interpretación vocal de una escritura puede variar en gran medida entre idiomas. En los tiempos modernos, la cadena de transcripción suele ser lengua extranjera hablada, lengua extranjera escrita, lengua materna escrita, lengua materna hablada (leída). La reducción del número de esos procesos, es decir, la eliminación de uno o ambos pasos de la escritura, suele dar lugar a articulaciones orales más precisas. En general, fuera de un público limitado de académicos, las romanizaciones tienden a inclinarse más hacia la transcripción. Como ejemplo, consideremos el arte marcial japonés 柔術: la romanización Nihon-shiki zyûzyutu puede permitir a alguien que sabe japonés reconstruir las sílabas kanaじゅうじゅつ, pero a la mayoría de los hablantes nativos de inglés, o más bien lectores, les resultaría más fácil adivinar la pronunciación a partir de la versión de Hepburn, jūjutsu .
Romanización de sistemas de escritura específicos
árabe
El alfabeto árabe se utiliza para escribir árabe , persa , urdu , pastún y sindhi , así como otros numerosos idiomas del mundo musulmán, en particular idiomas africanos y asiáticos que no tienen alfabeto propio. Los estándares de romanización incluyen los siguientes:
^ abc Hamza y ayn no se transliteran al comienzo de las palabras.
^ abcd El punto que aparece a continuación se puede utilizar en lugar de cedilla.
^ Al comienzo de las palabras, la combinación ⟨ خو ⟩ se pronunciaba /xw/ o /xʷ/ en persa clásico. En las variedades modernas se ha perdido la pronunciación glide /ʷ/ , aunque la ortografía no ha cambiado. Todavía se puede escuchar en dari como una pronunciación relicta. La combinación /xʷa/ se cambió a /xo/ (ver más abajo).
^ abcdefghi En dari.
^ abc No se translitera al final de las palabras.
^ ab En la combinación ⟨ یة ⟩ al final de las palabras.
^ Cuando se usa en lugar de ⟨ ت ⟩ al final de las palabras.
^ Los signos diacríticos ( harakat ) rara vez se escriben.
^ Después de ⟨ خ ⟩ de la anterior /xʷa/ . A menudo se translitera como xwa o xva . Por ejemplo, خور /xor/ "sol" era /xʷar/ en persa clásico.
^ ab Después de vocales.
armenio
georgiano
Notas :
^ abcde Letras arcaicas.
^ abcdefgh Estos están influenciados por el diseño mencionado anteriormente, y se prefieren para evitar ambigüedad, ya que las expresiones: t, j, g, ch pueden significar dos letras.
^ Inicialmente, el uso de la letra y para ყ se debe probablemente a su parecido entre sí.
La familia brahmática de abugidas se utiliza para las lenguas del subcontinente indio y el sudeste asiático. Existe una larga tradición en Occidente de estudiar el sánscrito y otros textos índicos en transliteración latina. Se han utilizado diversas convenciones de transliteración para las escrituras índicas desde la época de Sir William Jones. [13]
ISO 15919 (2001): Se codificó una convención de transliteración estándar en la norma ISO 15919. Utiliza diacríticos para asignar el conjunto mucho más grande de consonantes y vocales brahmicas a la escritura latina. La parte específica del devanagari es muy similar a la norma académica, IAST : "Alfabeto internacional de transliteración sánscrita", y a la norma de la Biblioteca del Congreso de los Estados Unidos, ALA-LC , [14] aunque hay algunas diferencias
En Pakistán: el urdu estándar (saaf o khaalis) es la variedad "alta", mientras que el indostánico es la variedad "baja" utilizada por las masas (llamada urdu, escrita en escritura nastaʿlīq ).
En la India, tanto el hindi estándar (shuddh) como el urdu estándar (saaf o khaalis) son las variedades "H" (escritas en devanagari y nastaʿlīq respectivamente), mientras que el indostánico es la variedad "L" utilizada por las masas y escrita en devanagari o nastaʿlīq (y llamada "hindi" o "urdu" respectivamente).
La digrafía hace que cualquier obra en cualquiera de las dos escrituras sea en gran medida inaccesible para los usuarios de la otra escritura, aunque por lo demás el indostánico es una lengua perfectamente inteligible entre sí, lo que significa esencialmente que cualquier tipo de colaboración de código abierto basada en texto es imposible entre los lectores devanagari y nastaʿlīq.
La Iniciativa Hamari Boli [15] , iniciada en 2011, es una iniciativa de planificación lingüística de código abierto a gran escala destinada a la reforma y modernización de la escritura, el estilo, el estatus y el léxico del indostánico. Uno de los principales objetivos declarados de Hamari Boli es liberar al indostánico de la paralizante digrafía devanagari-nastaʿlīq mediante la romanización. [16]
Chino
La romanización de las lenguas siníticas , en particular del mandarín , ha resultado ser un problema muy difícil, aunque la cuestión se complica aún más por consideraciones políticas. Debido a esto, muchas tablas de romanización contienen caracteres chinos más una o más romanizaciones o Zhuyin .
mandarín
ALA-LC : solía ser similar a Wade–Giles, [17] pero se convirtió a Hanyu Pinyin en 2000 [18]
Hanyu Pinyin (1958): En China continental , el Hanyu Pinyin se ha utilizado oficialmente para romanizar el mandarín durante décadas, principalmente como una herramienta lingüística para enseñar el idioma estandarizado. El sistema también se utiliza en otras áreas de habla china, como Singapur y partes de Taiwán , y ha sido adoptado por gran parte de la comunidad internacional como estándar para escribir palabras y nombres chinos en el alfabeto latino. El valor del Hanyu Pinyin en la educación en China radica en el hecho de que China, como cualquier otra área poblada con un área y una población comparables, tiene numerosos dialectos distintos , aunque solo hay un idioma escrito común y una forma hablada estandarizada común. (Estos comentarios se aplican a la romanización en general)
Pe̍h-ōe-jī (POJ), que en su día fue la escritura oficial de facto de la Iglesia Presbiteriana de Taiwán (desde finales del siglo XIX). Técnicamente, se trataba de un sistema de transcripción fundamentalmente fonémico, ya que el Min Nan no se escribía habitualmente en chino.
Wāpuro : transliteración ("romanización de procesador de textos"). No es estrictamente un sistema, sino un conjunto de prácticas comunes que permiten la introducción de textos en japonés.
coreano
Si bien la romanización ha adoptado formas diversas y a veces aparentemente desestructuradas, existen algunos conjuntos de reglas:
McCune–Reischauer (MR; 1937?), la primera transcripción que ganó cierta aceptación. Una versión ligeramente modificada de MR fue el sistema oficial para el coreano en Corea del Sur desde 1984 hasta 2000, y sin embargo una modificación diferente sigue siendo el sistema oficial en Corea del Norte . Utiliza breves , apóstrofos y diéresis , los dos últimos indican límites ortográficos de sílabas en casos que de otra manera serían ambiguos. Lo que se llama MR puede en muchos casos ser cualquiera de una serie de sistemas que difieren entre sí y del MR original principalmente en si las terminaciones de las palabras están separadas de la raíz por un espacio, un guion o, según el sistema de McCune y Reischauer, no en absoluto; y si se usa un guion o un espacio, si el cambio de sonido se refleja en la última letra consonante de una raíz y la primera de una terminación (por ejemplo, pur-i frente a pul-i ). Aunque en su mayoría son irrelevantes a la hora de transcribir palabras no flexivas, estas aberraciones están tan extendidas que cualquier mención a la "romanización McCune-Reischauer" puede no referirse necesariamente al sistema original publicado en la década de 1930.
Existe, por ejemplo, el sistema ALA-LC /US Library of Congress, basado en MR pero con algunas desviaciones. La división de palabras se aborda en detalle, con un uso generoso de espacios para separar las terminaciones de las palabras de las raíces que no se ve en MR. Las sílabas de los nombres de pila siempre se separan con un guion, lo que expresamente no se hace nunca en MR. Los cambios de sonido se ignoran con más frecuencia que en MR. Distingue entre ' y ' . [24]
Varios problemas con la RM llevaron al desarrollo de sistemas más nuevos:
Yale (1942): Este sistema se ha convertido en el estándar establecido para la romanización del coreano entre los lingüistas . La longitud de las vocales en la pronunciación antigua o dialectal se indica con un macrón . En los casos que de otro modo serían ambiguos, los límites ortográficos de las sílabas se indican con un punto. Este sistema también indica las consonantes que han desaparecido de la ortografía y la pronunciación estándar de una palabra en Corea del Sur .
Romanización revisada del coreano (RR; 2000): incluye reglas tanto para la transcripción como para la transliteración. Corea del Sur ahora usa oficialmente este sistema que fue aprobado en 2000. Se exigió que las señales de tránsito y los libros de texto siguieran estas reglas lo antes posible, a un costo estimado por el gobierno en al menos US$20 millones. Se han cambiado todas las señales de tránsito, los nombres de las estaciones de tren y metro en los mapas de líneas y las señales, etc. El cambio ha sido ignorado o se ha mantenido en algunos casos, en particular la romanización de nombres y empresas existentes. RR es generalmente similar a MR, pero no usa diacríticos ni apóstrofos, y usa letras distintas para ㅌ/ㄷ (t/d), ㅋ/ㄱ (k/g), ㅊ/ㅈ (ch/j) y ㅍ/ㅂ (p/b). En casos de ambigüedad, se pretendía que los límites ortográficos de las sílabas se indicaran con un guion , pero esto se aplica de manera inconsistente en la práctica.
ISO/TR 11941 (1996): En realidad, se trata de dos normas diferentes bajo un mismo nombre: una para Corea del Norte (RPDC) y otra para Corea del Sur (ROK). La propuesta inicial a la ISO se basó en gran medida en Yale y fue un esfuerzo conjunto entre ambos estados, pero no pudieron ponerse de acuerdo sobre el borrador final. [25]
Romanización de Lukoff , desarrollada entre 1945 y 1947 para sus libros de texto de coreano hablado [26]
El idioma Nuosu , hablado en el sur de China, se escribe con su propia escritura, la escritura Yi . El único sistema de romanización existente es YYPY (Yi Yu Pin Yin), que representa el tono con letras añadidas al final de las sílabas, ya que el Nuosu prohíbe las codas. No utiliza diacríticos y, como tal, debido al gran inventario fonémico del Nuosu, requiere el uso frecuente de dígrafos, incluso para las vocales monoftongas.
Desde los años 70, Bulgaria ha considerado oficial un sistema basado en la transliteración científica y en la norma ISO/R 9:1968 . Desde finales de los años 90, las autoridades búlgaras han adoptado el denominado Sistema simplificado, que evita el uso de diacríticos y está optimizado para que sea compatible con el inglés. Este sistema se volvió obligatorio para el uso público gracias a una ley aprobada en 2009. [29] Mientras que el antiguo sistema utilizaba <č,š,ž,št,c,j,ă>, el nuevo sistema utiliza <ch,sh,zh,sht,ts,y,a>.
El nuevo sistema búlgaro fue aprobado para uso oficial también por la ONU en 2012, [30] y por BGN y PCGN en 2013. [31]
Kirguistán
macedónio
ruso
No existe un único sistema universalmente aceptado para escribir el ruso utilizando el alfabeto latino; de hecho, hay una gran cantidad de sistemas de este tipo: algunos están adaptados a un idioma de destino en particular (por ejemplo, alemán o francés), algunos están diseñados como transliteración de bibliotecarios, algunos se prescriben para los pasaportes de los viajeros rusos; la transcripción de algunos nombres es puramente tradicional. Todo esto ha dado lugar a una gran reduplicación de nombres. Por ejemplo, el nombre del compositor ruso Chaikovski también puede escribirse como Tchaykovsky , Tchajkovskij , Tchaikowski , Tschaikowski , Czajkowski , Čajkovskij , Čajkovski , Chajkovskij , Çaykovski , Chaykovsky , Chaykovskiy , Chaikovski , Tshaikovski , Tšaikovski , Tsjajkovskij , etc. Los sistemas incluyen:
BGN/PCGN (1947): Sistema de transliteración (Junta de Nombres Geográficos de los Estados Unidos y Comité Permanente de Nombres Geográficos para Uso Oficial Británico). [32]
GOST 16876-71 (1971): norma de transliteración soviética actualmente obsoleta. Reemplazada por GOST 7.79, que es equivalente a ISO 9 .
Codificación "Volapuk" (década de 1990): término del argot (en realidad no es Volapük ) para un método de escritura que no es realmente una transliteración, pero que se utiliza para objetivos similares (ver artículo).
La transliteración convencional al inglés se basa en BGN/PCGN, pero no sigue ningún estándar en particular. Se describe en detalle en Romanización del ruso .
Sistema simplificado [34] [35] [36] [37] [38] para la romanización del ruso.
Transliteración comparativa del ruso [39] en diferentes idiomas (Europa occidental, árabe, georgiano, Braille, Morse)
Siríaco
La escritura latina para siríaco se desarrolló en la década de 1930, siguiendo la política estatal para las lenguas minoritarias de la Unión Soviética , con algo de material publicado. [40]
ucranio
El sistema nacional ucraniano de 2010 fue adoptado por la UNGEGN en 2012 y por la BGN/PCGN en 2020. También es muy similar al sistema ALA-LC modificado (simplificado), que se ha mantenido sin cambios desde 1941.
Sistemas nacionales ucranianos y BGN/PCGN, en el Grupo de Trabajo de las Naciones Unidas sobre Sistemas de Romanización [43]
Comparación de cinco sistemas de Thomas T. Pedersen [44]
Visión general y resumen
El cuadro siguiente muestra la romanización de la transcripción fonémica más común utilizada para varios alfabetos diferentes. Si bien es suficiente para muchos usuarios ocasionales, existen múltiples alternativas utilizadas para cada alfabeto y muchas excepciones. Para obtener más detalles, consulte cada una de las secciones de idiomas anteriores. (Los caracteres hangul se dividen en componentes jamo ).
^ "Deutsche Morgenländische Gesellschaft". Dmg-web.de . Consultado el 2 de julio de 2015 .
^ "Estándares, capacitación, pruebas, evaluación y certificación". BSI-Global.com . BSI Group . Consultado el 25 de abril de 2013 .
^ "Árabe" (PDF) . Eki.ee . Consultado el 2 de julio de 2015 .
^ "Qalam: una convención para la transliteración morfológica árabe-latín-árabe". EServer.org . Archivado desde el original (TXT) el 8 de febrero de 2009. Consultado el 2 de julio de 2015 .
^ "Transliteración árabe de Buckwalter". Qamus.org . Consultado el 25 de abril de 2013 .
^ Beesley, Ken (22 de noviembre de 2010). "La transliteración de Buckwalter". Xerox Research Centre Europe . Archivado desde el original el 24 de abril de 2002. Consultado el 25 de abril de 2013 .
^ "The TLG® Beta Code Manual 2004" (PDF) . Thesaurus Linguae Graecae . Universidad de California, Irvine . 23 de junio de 2004. Archivado desde el original (PDF) el 29 de enero de 2006.
^ Lefort, Francois; Roubelakis-Angelakis, Kalliopi A. "Esquema de transliteración ISO 843". biology.uoc.gr . Universidad de Creta . Archivado desde el original el 10 de diciembre de 2004.
^ "Hebreo" (PDF) . Eki.ee . Consultado el 2 de julio de 2015 .
↑ Gabriel Pradīpaka. «Sánscrito 3: comparación de sistemas de transliteración». Sanskrit-Sanscrito.com.ar . Archivado desde el original el 2004-03-15 . Consultado el 2013-04-25 .
^ "¿Qué es HamariBoli?". HamariBoli . 15 de junio de 2011. Archivado desde el original el 1 de junio de 2013. Consultado el 25 de abril de 2013 .
^ The News International - 29 de diciembre de 2011 Archivado el 16 de junio de 2013 en Wayback Machine – "Hamari Boli (nuestra lengua) es quizás uno de los primeros emprendimientos serios para explorar, desarrollar y fomentar el crecimiento de la escritura romana en el uso de la lengua urdu/hindi".
^ "Nuevas directrices de romanización china". Biblioteca del Congreso . 1998-11-03 . Consultado el 25 de abril de 2013 .
^ "Tongyong Pinyin, el nuevo sistema de romanización". Taipei Times . 11 de julio de 2002.
^ "Autoridad de Taiwán aprueba el proyecto Tongyong Pinyin". People's Daily Online . 12 de julio de 2002.
^ "El Hanyu Pinyin será el sistema estándar en 2009". Taipei Times . 18 de septiembre de 2008.
^ "El Gobierno mejorará el ambiente favorable para los ingleses". The China Post . 18 de septiembre de 2008. Archivado desde el original el 19 de septiembre de 2008.
^ Boletín Oficial del Estado nº 19, Sofía, 13 de marzo de 2009. (en búlgaro)
^ "Romanización de la ONU del búlgaro para nombres geográficos (1977)". Eki.ee . Consultado el 27 de junio de 2015 .
^ "Sistema de romanización del búlgaro, sistema BGN/PCGN 1952" (PDF) . earth-info.nga.mil . Agencia Nacional de Inteligencia Geoespacial . Archivado desde el original (PDF) el 19 de diciembre de 2007.
^ "Traducciones cirílicas". DSpace.Dial.Pipex.com . Archivado desde el original el 16 de julio de 2012. Consultado el 25 de abril de 2013 .
^ "Додаток до рішення № 9". hostmaster.net.ua . Archivado desde el original el 7 de marzo de 2005.
^ "Ucraniano" (PDF) . Eki.ee . Consultado el 2 de julio de 2015 .
^ "Ucraniano" (PDF) . Transliteración.Eki.ee . Consultado el 2 de julio de 2015 .
Enlaces externos
Wikimedia Commons alberga una categoría multimedia sobre Romanización .
Sobre la romanización
AFI para urdu y urdu romanizado para usuarios de Internet y móviles (Descargar) Archivado el 23 de diciembre de 2008 en Wayback Machine
Utilidad de transliteración de Microsoft: una herramienta para crear, depurar y utilizar módulos de transliteración de cualquier script a cualquier otro script.
Randall Barry (ed.) ALA-LC Romanization Tables US Library of Congress, 1997, ISBN 0-8444-0940-5 . (Uno de los pocos libros impresos con listas de romanizaciones)
Tablas de romanización de la Biblioteca del Congreso de los Estados Unidos en formato PDF
Grupo de trabajo de la UNGEGN sobre sistemas de romanización
Pautas de transliteración Unicode Archivado el 28 de marzo de 2009 en Wayback Machine
Romanización en línea
Herramienta de conversión fonética china: convierte entre pinyin y otros formatos
Transliteración y transcripción cirílica ONLINE (cirílico -> latín)
eiktub Archivado el 25 de octubre de 2019 en Wayback Machine – Un bloc de transliteración árabe
Lingua::Translit: módulo de Perl que cubre una variedad de sistemas de escritura, como el cirílico o el griego. Proporciona una gran cantidad de estándares, así como esquemas de transliteración comunes.
Arabeasy – Transliteración árabe (existe una extensión gratuita de Chrome que también funciona con persa y urdu)
Russianeasy Archivado el 8 de marzo de 2016 en Wayback Machine – Transliteración rusa (existe una extensión gratuita para Chrome)