Transliteración o transcripción a caracteres latinos
En lingüística , romanización o romanización es la conversión de un texto de un sistema de escritura diferente a la escritura romana (latina) , o un sistema para hacerlo. Los métodos de romanización incluyen la transliteración , para representar texto escrito, y la transcripción , para representar la palabra hablada, y combinaciones de ambas. Los métodos de transcripción se pueden subdividir en transcripción fonémica , que registra los fonemas o unidades de significado semántico del habla, y transcripción fonética más estricta , que registra los sonidos del habla con precisión.
Métodos
Existen muchos sistemas de romanización consistentes o estandarizados . Se pueden clasificar por sus características. Las características de un sistema particular pueden hacerlo más adecuado para diversas aplicaciones, a veces contradictorias, incluida la recuperación de documentos, el análisis lingüístico, la fácil lectura y la representación fiel de la pronunciación.
Idioma fuente o donante: un sistema puede adaptarse para romanizar texto de un idioma en particular, o de una serie de idiomas, o para cualquier idioma en un sistema de escritura en particular. Un sistema específico de un idioma normalmente conserva características del idioma como la pronunciación, mientras que el general puede ser mejor para catalogar textos internacionales.
Idioma de destino o receptor: la mayoría de los sistemas están destinados a una audiencia que habla o lee un idioma en particular. (Los llamados sistemas internacionales de romanización del texto cirílico se basan en alfabetos centroeuropeos como el checo y el croata ).
Reversibilidad: si el original se puede restaurar o no a partir del texto convertido. Algunos sistemas reversibles permiten una versión simplificada irreversible.
Transcripción
Si la romanización intenta transliterar la escritura original, el principio rector es un mapeo uno a uno de los caracteres del idioma de origen en la escritura de destino, con menos énfasis en cómo suena el resultado cuando se pronuncia de acuerdo con el idioma del lector. Por ejemplo, la romanización Nihon-shiki del japonés permite al lector informado reconstruir las sílabas kana japonesas originales con un 100% de precisión, pero requiere conocimientos adicionales para una pronunciación correcta.
Transcripción
Fonémico
La mayoría de las romanizaciones tienen como objetivo permitir al lector ocasional que no está familiarizado con la escritura original pronunciar el idioma de origen con razonable precisión. Estas romanizaciones siguen el principio de transcripción fonémica e intentan reproducir los sonidos significativos ( fonemas ) del original de la forma más fiel posible en la lengua de destino. La popular romanización del japonés por parte de Hepburn es un ejemplo de romanización transcripcional diseñada para angloparlantes.
Fonético
Una conversión fonética va un paso más allá e intenta representar todos los teléfonos en el idioma de origen, sacrificando la legibilidad si es necesario mediante el uso de caracteres o convenciones que no se encuentran en la escritura de destino. En la práctica, tal representación casi nunca intenta representar todos los alófonos posibles (especialmente aquellos que ocurren naturalmente debido a efectos de coarticulación ) y en cambio se limita a las distinciones alofónicas más significativas. El Alfabeto Fonético Internacional es el sistema más común de transcripción fonética.
Comercio
Para la mayoría de los pares de lenguas, construir una romanización utilizable implica el comercio entre los dos extremos. Las transcripciones puras generalmente no son posibles, ya que el idioma de origen generalmente contiene sonidos y distinciones que no se encuentran en el idioma de destino, pero que deben mostrarse para que la forma romanizada sea comprensible. Además, debido a la variación diacrónica y sincrónica, ningún idioma escrito representa ningún idioma hablado con perfecta precisión y la interpretación vocal de una escritura puede variar en gran medida entre idiomas. En los tiempos modernos, la cadena de transcripción suele ser lengua extranjera hablada, lengua extranjera escrita, lengua nativa escrita, lengua nativa hablada (leída). Reducir el número de esos procesos, es decir, eliminar uno o ambos pasos de la escritura, normalmente conduce a articulaciones orales más precisas. En general, fuera de una audiencia limitada de académicos, las romanizaciones tienden a inclinarse más hacia la transcripción. Como ejemplo, consideremos el arte marcial japonés 柔術: la romanización Nihon-shiki zyûzyutu puede permitir que alguien que sepa japonés reconstruya las sílabas kanaじゅうじゅつ, pero a la mayoría de los hablantes nativos de inglés, o más bien a los lectores, les resultaría más fácil adivinar la pronunciación. De la versión de Hepburn, jūjutsu .
Romanización de sistemas de escritura específicos.
Arábica
El alfabeto árabe se utiliza para escribir árabe , persa , urdu , pastún y sindhi , así como para muchas otras lenguas del mundo musulmán, en particular lenguas africanas y asiáticas sin alfabetos propios. Los estándares de romanización incluyen lo siguiente:
^ abc Hamza y ayn no se transliteran al comienzo de las palabras.
^ abcd Se puede utilizar el punto siguiente en lugar de cedilla.
^ Al comienzo de las palabras, la combinación ⟨ خو ⟩ se pronunciaba /xw/ o /xʷ/ en persa clásico. En las variedades modernas se ha perdido el deslizamiento /ʷ/ , aunque no se ha cambiado la ortografía. Es posible que todavía se escuche en dari como una pronunciación relicta. La combinación /xʷa/ se cambió a /xo/ (ver más abajo).
^ abcdefghi en dari.
^ abc No transliterado al final de las palabras.
^ ab En la combinación ⟨ یة ⟩ al final de las palabras.
^ Cuando se usa en lugar de ⟨ ت ⟩ al final de las palabras.
^ Rara vez se escriben signos diacríticos ( harakat ).
^ Después de ⟨ خ ⟩ del anterior /xʷa/ . A menudo transliterado como xwa o xva . Por ejemplo, خور /xor/ "sol" era /xʷar/ en persa clásico.
^ ab Después de las vocales.
armenio
georgiano
Notas :
^ abcde Letras arcaicas.
^ abcdefgh Están influenciados por el diseño antes mencionado y se prefieren para evitar ambigüedades, ya que las expresiones: t, j, g, ch pueden significar dos letras.
^ Inicialmente, el uso de la letra y para ყ probablemente se deba a su parecido entre sí.
La familia brahmica de abugidas se utiliza para las lenguas del subcontinente indio y el sudeste asiático. Existe una larga tradición en Occidente de estudiar el sánscrito y otros textos índicos en transliteración latina. Se han utilizado varias convenciones de transliteración para las escrituras índicas desde la época de Sir William Jones. [13]
ISO 15919 (2001): una convención de transliteración estándar fue codificada en la norma ISO 15919. Utiliza signos diacríticos para asignar el conjunto mucho más amplio de consonantes y vocales bráhmicas a la escritura latina. La porción específica de Devanagari es muy similar al estándar académico, IAST : "Alfabeto internacional de transliteración sánscrita", y al estándar de la Biblioteca del Congreso de los Estados Unidos, ALA-LC , [14] aunque existen algunas diferencias.
Harvard-Kyoto : utiliza mayúsculas y minúsculas y duplicación de letras, para evitar el uso de signos diacríticos y restringir el rango a ASCII de 7 bits.
ITRANS : un esquema de transliteración a ASCII de 7 bits creado por Avinash Chopde que solía prevalecer en Usenet .
En Pakistán: el urdu estándar (Saaf o Khaalis) es la variedad "alta", mientras que el indostaní es la variedad "baja" utilizada por las masas (llamada urdu, escrita en escritura nastaʿlīq ).
En la India, tanto el hindi estándar (Shuddh) como el urdu estándar (Saaf o Khaalis) son las variedades "H" (escritas en devanagari y nastaʿlīq respectivamente), mientras que el indostaní es la variedad "L" utilizada por las masas y escrita en devanagari o nastaʿlīq (y llamado 'hindi' o 'urdu' respectivamente).
La digraphia hace que cualquier trabajo en cualquiera de las escrituras sea en gran medida inaccesible para los usuarios de la otra escritura, aunque por lo demás el indostaní es un idioma perfectamente mutuamente inteligible, lo que esencialmente significa que cualquier tipo de colaboración de código abierto basada en texto es imposible entre lectores devanagari y nastaʿlīq.
Iniciada en 2011, la Iniciativa Hamari Boli [15] es una iniciativa de planificación lingüística de código abierto a gran escala destinada a la reforma y modernización de la escritura, el estilo, el estatus y el léxico del indostaní. Uno de los principales objetivos declarados de Hamari Boli es aliviar al indostaní de la paralizante digraphia devanagari-nastaʿlīq mediante la romanización. [dieciséis]
Chino
La romanización de las lenguas siníticas , particularmente el mandarín , ha demostrado ser un problema muy difícil, aunque la cuestión se complica aún más por consideraciones políticas. Debido a esto, muchas tablas de romanización contienen caracteres chinos más una o más romanizaciones o Zhuyin .
mandarín
ALA-LC : Solía ser similar a Wade-Giles, [17] pero convertido a Hanyu Pinyin en 2000 [18]
Hanyu Pinyin (1958): En China continental , el Hanyu Pinyin se ha utilizado oficialmente para romanizar el mandarín durante décadas, principalmente como herramienta lingüística para enseñar el idioma estandarizado. El sistema también se utiliza en otras áreas de habla china, como Singapur y partes de Taiwán , y ha sido adoptado por gran parte de la comunidad internacional como estándar para escribir palabras y nombres chinos en escritura latina. El valor del Hanyu Pinyin en la educación en China radica en el hecho de que China, como cualquier otra zona poblada con superficie y población comparables, tiene numerosos dialectos distintos , aunque sólo hay una lengua escrita común y una forma hablada estandarizada común. (Estos comentarios se aplican a la romanización en general)
Pe̍h-ōe-jī (POJ), que alguna vez fue la escritura oficial de facto de la Iglesia Presbiteriana en Taiwán (desde finales del siglo XIX). Técnicamente, esto representaba un sistema de transcripción en gran medida fonémico, ya que Min Nan no se escribía comúnmente en chino.
Wāpuro : transliteración ("romanización del procesador de textos"). No es estrictamente un sistema, sino una colección de prácticas comunes que permiten la entrada de texto en japonés.
coreano
Si bien la romanización ha adoptado formas diversas y, en ocasiones, aparentemente desestructuradas, existen algunos conjuntos de reglas:
McCune-Reischauer (MR; ¿1937?), la primera transcripción que obtuvo cierta aceptación. Una versión ligeramente modificada de MR fue el sistema oficial para el coreano en Corea del Sur de 1984 a 2000 y, sin embargo, una modificación diferente sigue siendo el sistema oficial en Corea del Norte . Utiliza breves , apóstrofes y diéreses , los dos últimos indican límites ortográficos de sílabas en casos que de otro modo serían ambiguos. Lo que se llama MR puede en muchos casos ser cualquiera de una serie de sistemas que se diferencian entre sí y del MR original principalmente en si las terminaciones de las palabras están separadas de la raíz por un espacio, un guión o, según el sistema de McCune y Reischauer, de nada; y si se utiliza un guión o un espacio, si el cambio de sonido se refleja en la última letra consonante de la raíz y en la primera consonante de la terminación (p. ej., pur-i frente a pul-i ). Aunque en su mayoría son irrelevantes al transcribir palabras sin flexiones, estas aberraciones están tan extendidas que cualquier mención de la "romanización McCune-Reischauer" no necesariamente se refiere al sistema original publicado en la década de 1930.
Existe, por ejemplo, el sistema ALA-LC /Biblioteca del Congreso de EE. UU., basado en MR pero con algunas desviaciones. La división de palabras se aborda en detalle, con un uso generoso de espacios para separar las terminaciones de las palabras de las raíces que no se ve en MR. Las sílabas de los nombres de pila siempre están separadas por un guión, lo que MR nunca hace expresamente. Los cambios de sonido se ignoran con más frecuencia que en la RM. Distingue entre ' y ' . [24]
Varios problemas con la RM llevaron al desarrollo de sistemas más nuevos:
Yale (1942): Este sistema se ha convertido en el estándar establecido de romanización del coreano entre los lingüistas . La longitud de las vocales en la pronunciación antigua o dialectal se indica mediante un macron . En casos que de otro modo serían ambiguos, los límites ortográficos de las sílabas se indican con un punto. Este sistema también indica consonantes que han desaparecido de la ortografía y pronunciación estándar de una palabra en Corea del Sur .
Romanización revisada del coreano (RR; 2000): incluye reglas tanto para la transcripción como para la transliteración. Corea del Sur ahora utiliza oficialmente este sistema que fue aprobado en 2000. Se exigió que las señales de tránsito y los libros de texto siguieran estas reglas lo antes posible, a un costo estimado por el gobierno en al menos 20 millones de dólares. Se han modificado todas las señales de tráfico, los nombres de las estaciones de tren y de metro en los mapas de líneas, las señales, etc. El cambio ha sido ignorado o excluido en algunos casos, en particular la romanización de nombres y empresas existentes. RR es generalmente similar a MR, pero no usa signos diacríticos ni apóstrofes, y usa letras distintas para ㅌ/ㄷ (t/d), ㅋ/ㄱ (k/g), ㅊ/ㅈ (ch/j) y ㅍ/ㅂ ( p/b). En casos de ambigüedad, se pretendía indicar los límites ortográficos de las sílabas con un guión , pero esto se aplica de manera inconsistente en la práctica.
ISO/TR 11941 (1996): En realidad, se trata de dos estándares diferentes bajo un mismo nombre: uno para Corea del Norte (RPDC) y el otro para Corea del Sur (ROK). La presentación inicial a la ISO se basó en gran medida en Yale y fue un esfuerzo conjunto entre ambos estados, pero no pudieron ponerse de acuerdo sobre el borrador final. [25]
Romanización de Lukoff , desarrollada entre 1945 y 1947 para sus libros de texto sobre coreano hablado [26]
La lengua nuosu , hablada en el sur de China, se escribe con su propia escritura, la escritura Yi . El único sistema de romanización existente es YYPY (Yi Yu Pin Yin), que representa el tono con letras adjuntas al final de las sílabas, ya que Nuosu prohíbe las codas. No utiliza signos diacríticos y, como tal, debido al gran inventario fonémico de Nuosu, requiere el uso frecuente de dígrafos, incluso para vocales monoftongas.
Desde los años 1970 se considera oficial en Bulgaria un sistema basado en la transliteración científica y en la norma ISO/R 9:1968 . Desde finales de la década de 1990, las autoridades búlgaras han adoptado el llamado sistema simplificado, que evita el uso de signos diacríticos y lo ha optimizado para que sea compatible con el inglés. Este sistema se volvió obligatorio para uso público con una ley aprobada en 2009. [29] Donde el sistema antiguo usa <č,š,ž,št,c,j,ă>, el nuevo sistema usa <ch,sh,zh,sht ,ts,y,a>.
El nuevo sistema búlgaro fue aprobado para uso oficial también por la ONU en 2012, [30] y por BGN y PCGN en 2013. [31]
Kirguistán
macedónio
ruso
No existe un único sistema universalmente aceptado para escribir ruso usando la escritura latina; de hecho, existe una gran cantidad de sistemas de este tipo: algunos están ajustados a un idioma de destino en particular (por ejemplo, alemán o francés), otros están diseñados como transliteración de un bibliotecario, otros se prescriben para los pasaportes de viajeros rusos; la transcripción de algunos nombres es puramente tradicional. Todo esto ha resultado en una gran duplicación de nombres. Por ejemplo, el nombre del compositor ruso Tchaikovsky también puede escribirse como Tchaykovsky , Tchajkovskij , Tchaikowski , Tschaikowski , Czajkowski , Čajkovskij , Čajkovski , Chajkovskij , Çaykovski , Chaykovsky , Chaykovskiy , Chaikovski , Tshaikovski , Tšaikovski , Tsjajkovskij etc. Los sistemas incluyen:
BGN/PCGN (1947): Sistema de transliteración (Junta de Nombres Geográficos de los Estados Unidos y Comité Permanente de Nombres Geográficos para uso oficial británico). [32]
GOST 16876-71 (1971): un estándar de transliteración soviético ahora desaparecido. Reemplazado por GOST 7.79, que es un equivalente a ISO 9 .
Codificación "Volapuk" (década de 1990): término de jerga (en realidad no es Volapük ) para un método de escritura que no es realmente una transliteración, pero que se utiliza para objetivos similares (ver artículo).
La transliteración en inglés convencional se basa en BGN/PCGN, pero no sigue un estándar particular. Descrito en detalle en Romanización del ruso .
Sistema simplificado [34] [35] [36] [37] [38] para la romanización del ruso.
Transliteración comparada del ruso [39] en diferentes idiomas (europeo occidental, árabe, georgiano, braille, morse)
siríaco
La escritura latina para el siríaco se desarrolló en la década de 1930, siguiendo la política estatal para las lenguas minoritarias de la Unión Soviética , y se publicó parte del material. [40]
ucranio
El sistema nacional ucraniano de 2010 fue adoptado por el UNGEGN en 2012 y por el BGN/PCGN en 2020. También está muy cerca del sistema ALA-LC modificado (simplificado), que no ha cambiado desde 1941.
Sistemas nacional ucraniano y BGN/PCGN, en el Grupo de trabajo de la ONU sobre sistemas de romanización [43]
Comparación de cinco sistemas de Thomas T. Pedersen [44]
Descripción general y resumen
El siguiente cuadro muestra la romanización de transcripción fonémica más común utilizada para varios alfabetos diferentes. Si bien es suficiente para muchos usuarios ocasionales, se utilizan múltiples alternativas para cada alfabeto y muchas excepciones. Para obtener más información, consulte cada una de las secciones de idiomas anteriores. (Los caracteres Hangul se dividen en componentes jamo ).
^ "Deutsche Morgenländische Gesellschaft". Dmg-web.de . Consultado el 2 de julio de 2015 .
^ "Estándares, formación, pruebas, evaluación y certificación". BSI-Global.com . Grupo BSI . Consultado el 25 de abril de 2013 .
^ "Árabe" (PDF) . Eki.ee. _ Consultado el 2 de julio de 2015 .
^ "Qalam: una convención para la transliteración morfológica árabe-latina-árabe". EServer.org . Archivado desde el original (TXT) el 8 de febrero de 2009 . Consultado el 2 de julio de 2015 .
^ "Transliteración árabe de Buckwalter". Qamus.org . Consultado el 25 de abril de 2013 .
^ Beesley, Ken (22 de noviembre de 2010). "La transliteración de Buckwalter". Centro de investigación Xerox Europa . Archivado desde el original el 24 de abril de 2002 . Consultado el 25 de abril de 2013 .
^ "Manual de códigos Beta TLG® 2004" (PDF) . Tesauro Linguae Graecae . Universidad de California, Irvine . 23 de junio de 2004. Archivado desde el original (PDF) el 29 de enero de 2006.
^ Lefort, Francois; Roubelakis-Angelakis, Kalliopi A. "Esquema de transliteración ISO 843". biología.uoc.gr . Universidad de Creta . Archivado desde el original el 10 de diciembre de 2004.
^ "hebreo" (PDF) . Eki.ee. _ Consultado el 2 de julio de 2015 .
^ Gabriel Pradīpaka. "Sánscrito 3: comparación de sistemas de transliteración". Sanskrit-Sanscrito.com.ar . Archivado desde el original el 15 de marzo de 2004 . Consultado el 25 de abril de 2013 .
^ "¿Qué es HamariBoli?". HamariBoli . 2011-06-15. Archivado desde el original el 1 de junio de 2013 . Consultado el 25 de abril de 2013 .
^ The News International - 29 de diciembre de 2011 Archivado el 16 de junio de 2013 en Wayback Machine - "Hamari Boli (nuestro idioma) es quizás una de las primeras empresas serias para explorar, desarrollar y fomentar el crecimiento de la escritura romana en el uso del idioma urdu/hindi."
^ Boletín Oficial n.º 19, Sofía, 13 de marzo de 2009 (en búlgaro)
^ "Romanización del búlgaro para nombres geográficos por parte de la ONU (1977)". Eki.ee. _ Consultado el 27 de junio de 2015 .
^ "Sistema de romanización del búlgaro, sistema BGN/PCGN 1952" (PDF) . Earth-info.nga.mil . Agencia Nacional de Inteligencia Geoespacial . Archivado desde el original (PDF) el 19 de diciembre de 2007.
^ "Traducciones cirílicas". DSpace.Dial.Pipex.com . Archivado desde el original el 16 de julio de 2012 . Consultado el 25 de abril de 2013 .
^ "Додаток до рішення № 9". hostmaster.net.ua . Archivado desde el original el 7 de marzo de 2005.
^ "ucraniano" (PDF) . Eki.ee. _ Consultado el 2 de julio de 2015 .
^ "ucraniano" (PDF) . Transliteración.Eki.ee . Consultado el 2 de julio de 2015 .
enlaces externos
Wikimedia Commons tiene medios relacionados con la romanización .
Sobre la romanización
IPA para urdu y urdu romano para usuarios de Internet y dispositivos móviles (descargar) Archivado el 23 de diciembre de 2008 en Wayback Machine.
Utilidad de transliteración de Microsoft: una herramienta para crear, depurar y utilizar módulos de transliteración de cualquier script a cualquier otro script.
Randall Barry (ed.) Tablas de romanización ALA-LC Biblioteca del Congreso de EE. UU., 1997, ISBN 0-8444-0940-5 . (Uno de los pocos libros impresos con listas de romanizaciones)
Tablas de romanización de la Biblioteca del Congreso de EE. UU. en formato PDF
Grupo de Trabajo del UNGEGN sobre Sistemas de Romanización
Pautas de transliteración Unicode
Romanización en línea
Herramienta de conversión fonética china: convierte entre Pinyin y otros formatos
Transliteración y transcripción cirílica ONLINE (cirílico -> latín)
eiktub: un bloc de transliteración árabe
Lingua::Translit: módulo Perl que cubre una variedad de sistemas de escritura, por ejemplo, cirílico o griego. Proporciona muchos estándares y esquemas de transliteración comunes.
Arabeasy: transliteración árabe (existe una extensión gratuita de Chrome, también funciona para persa y urdu)
Russianeasy Archivado el 8 de marzo de 2016 en Wayback Machine - Transliteración rusa (existe una extensión gratuita de Chrome)