El alfabeto rumano es una variante del alfabeto latino que se utiliza para escribir el idioma rumano . Es una modificación del alfabeto latino clásico y consta de 31 letras, [1] [2] cinco de las cuales (Ă, Â, Î, Ș y Ț) han sido modificadas a partir de sus originales en latín para cumplir con los requisitos fonéticos del idioma.
Las letras Q ( chiu ), W ( dublu v ) e Y ( igrec o i grec, que significa "i griega") se introdujeron formalmente en el alfabeto rumano en 1982, aunque ya se habían utilizado antes. Aparecen solo en palabras extranjeras y sus derivados rumanos, como quasar , watt y yacht . La letra K , aunque relativamente más antigua, también se usa raramente y aparece solo en nombres propios y neologismos internacionales como kilogramo , broker y karate . [3] Estas cuatro letras todavía se perciben como extranjeras, lo que explica su uso con fines estilísticos en palabras como nomenklatură (normalmente nomenclatură , que significa "nomenclatura", pero a veces se escribe con k en lugar de c si se refiere a miembros de la dirección comunista en la Unión Soviética y los países del Bloque del Este, como se usa nomenklatura en inglés). [4]
La mayoría de las <qu> e <y> en las palabras latinas cultas (o en las palabras griegas a través del latín) se reemplazan por <cv> e <i> respectivamente (por ejemplo, acvariu "acuario", oxigen "oxígeno"). Sin embargo, la <y> se mantiene en ytriu ("itrio") e yterbiu ("iterbio"), probablemente debido a los símbolos de los elementos Y e Yb.
En los casos en que la palabra es un préstamo directo que tiene signos diacríticos que no están presentes en el alfabeto mencionado anteriormente, la ortografía oficial tiende a favorecer su uso ( München , Angoulême , etc., en contraposición al uso de Istanbul en lugar de İstanbul ).
[5]
La ortografía rumana es mayoritariamente fonémica, sin letras mudas (véase i ). La tabla siguiente muestra la correspondencia entre letras y sonidos. Algunas de las letras tienen varias lecturas posibles, incluso si no se tienen en cuenta los alófonos . Cuando las vocales /i/ , /u/ , /e/ y /o/ se cambian por sus correspondientes semivocales , esto no se marca en la escritura. Las letras K, Q, W e Y aparecen solo en préstamos extranjeros; la pronunciación de W e Y y de la combinación QU depende del origen de la palabra en la que aparecen.
* Ver coma a continuación (ș y ț) versus cedilla (ş y ţ).
La ortografía rumana no utiliza acentos ni diacríticos , que son símbolos secundarios que se añaden a las letras (es decir, glifos básicos ) para modificar su pronunciación o distinguir entre palabras. Sin embargo, hay cinco letras especiales en el alfabeto rumano (asociadas a cuatro sonidos diferentes) que se forman modificando otras letras latinas; en sentido estricto, estas letras funcionan como glifos básicos por derecho propio en lugar de letras con marcas diacríticas, pero a menudo se las denomina así.
La letra â se utiliza exclusivamente en medio de palabras; su versión mayúscula aparece sólo en inscripciones escritas en mayúsculas.
La Academia Rumana considera incorrecto escribir las letras ș y ț con cedilla en lugar de coma. Los escritos rumanos, incluidos los libros creados para enseñar a los niños a escribir, tratan la coma y la cedilla como una variación de la fuente. Consulte Unicode y HTML a continuación.
Las letras î y â son idénticas fonética y funcionalmente . El motivo de utilizar ambas es histórico y denota el origen latino de la lengua.
Durante algunas décadas, hasta una reforma ortográfica en 1904, se habían utilizado hasta cuatro o cinco letras para el mismo fonema ( â , ê , î , û y , ocasionalmente , ô , ver Letras eliminadas), según una regla etimológica. [8] Todas se usaban para representar la vocal /ɨ/ , hacia la que habían convergido las vocales latinas originales escritas con circunflejos. La reforma de 1904 vio que solo quedaban dos letras, â e î , cuya elección siguió reglas que cambiaron varias veces durante el siglo XX.
Durante la primera mitad del siglo, la regla era utilizar î en posición inicial y final de palabra, y â en el resto de posiciones. Había excepciones, que imponían el uso de î en posiciones internas cuando las palabras se combinaban o derivaban con prefijos o sufijos. Por ejemplo, el adjetivo urît "feo" se escribía con î porque deriva del verbo a urî "odiar".
En 1953, durante la era comunista , la Academia Rumana eliminó la letra â , reemplazándola por î en todas partes, incluido el nombre del país, que debía escribirse Romînia . La primera estipulación coincidió con la designación oficial del país como República Popular , lo que significaba que su título completo era Republica Populară Romînă . Una pequeña reforma ortográfica en 1964 recuperó la letra â , pero solo en la ortografía de român "rumano" y todos sus derivados, incluido el nombre del país. Como tal, la República Socialista proclamada en 1965 se asocia con la ortografía Republica Socialistă România .
Poco después de la caída del gobierno de Ceaușescu , la Academia Rumana decidió reintroducir la â a partir de 1993, cancelando los efectos de la reforma ortográfica de 1953 y volviendo esencialmente a las reglas de 1904 (con algunas diferencias). La medida se justificó públicamente como la rectificación de un ataque comunista a la tradición, o de una influencia soviética en la cultura rumana, y como un retorno a una ortografía tradicional que lleva la marca del origen latino de la lengua. [9] [10] [11] Sin embargo, el contexto político en ese momento era que la Academia Rumana era considerada en gran medida como una institución comunista y corrupta: Nicolae Ceaușescu y su esposa Elena habían sido sus miembros honorarios, y la membresía había sido controlada por el Partido Comunista. [12] Como tal, la reforma ortográfica de 1993 fue vista como un intento de la Academia de romper con su pasado comunista. [13] [14] La Academia invitó a la comunidad nacional de lingüistas, así como a lingüistas extranjeros especializados en rumano, a discutir el problema; [15] cuando estos se opusieron abrumadoramente a la reforma ortográfica en términos vehementes, su posición fue rechazada explícitamente por ser demasiado científica. [16] [17]
Según la reforma de 1993, la elección entre î y â vuelve a basarse en una regla que no es estrictamente etimológica ni fonológica, sino posicional y morfológica. El sonido se escribe siempre como â , excepto al principio y al final de las palabras, en cuyo caso se utiliza î . Las excepciones incluyen los nombres propios en los que se congela el uso de las letras, cualquiera que sea, y las palabras compuestas, cuyos componentes están sujetos cada uno por separado a la regla (por ejemplo, ne- + î ndemânatic → ne î ndemânatic "torpe", no * ne â ndemânatic ). Sin embargo, la excepción ya no se aplica a las palabras derivadas con sufijos, en contraste con la norma de 1904; por ejemplo, lo que se escribía urît después de 1904 se convirtió en urât después de 1993.
Aunque la reforma se promovió como un medio para mostrar el origen latino del rumano, estadísticamente solo unas pocas de las palabras escritas con â según la reforma de 1993 derivan en realidad de palabras latinas que tienen una a en la posición correspondiente. [18] De hecho, esto incluye una gran cantidad de palabras que contenían una i en el latín original y que se escriben de manera similar con i en sus contrapartes italianas o españolas. Los ejemplos incluyen rîu "río", del latín rivus (compárese con el español río ), ahora escrito râu ; junto con rîde < ridere , sîn < sinus , strînge < stringere , lumînare < luminaria , etc.
Aunque la norma ortográfica de 1993 es obligatoria en la educación y las publicaciones oficiales rumanas , y gradualmente la mayoría de las demás publicaciones comenzaron a utilizarla, todavía hay personas, publicaciones y editoriales que prefieren la norma ortográfica anterior o un sistema híbrido mixto propio; entre ellos se encuentran la revista cultural semanal Dilema Veche y el diario Gazeta Sporturilor . Algunas publicaciones permiten a los autores elegir cualquiera de las normas ortográficas; estas incluyen România literară , la revista de la Unión de Escritores de Rumanía , y editoriales como Polirom . También se han publicado diccionarios, gramáticas y otras obras lingüísticas utilizando î y sînt mucho después de la reforma de 1993. [19]
En definitiva, el conflicto resulta de dos razonamientos lingüísticos diferentes sobre cómo escribir /ɨ/ . La elección de â se deriva de que a es la vocal más media o central de las cinco (la romanización oficial búlgara utiliza la misma lógica, eligiendo a por ъ, lo que da como resultado que el nombre del país se escriba Balgariya ; y también la vocal portuguesa europea /ɐ/ por a mencionada anteriormente), mientras que î es un intento de elegir la letra latina que escribe de forma más intuitiva el sonido /ɨ/ (de manera similar a cómo los polacos usan la letra y ).
Aunque el estándar de la Academia Rumana exige las variantes con coma debajo para los sonidos /ʃ/ y /ts/ , las variantes con cedilla todavía se usan ampliamente. Muchos textos impresos y en línea todavía usan incorrectamente " s con cedilla " y " t con cedilla ". Esta situación se debe a una falta inicial de estandarización de los glifos, agravada por la falta de compatibilidad de fuentes informáticas para las variantes con coma debajo (consulte la sección Unicode para obtener más detalles).
La falta de compatibilidad con las comas diacríticas se ha corregido en las versiones actuales de los principales sistemas operativos: Windows Vista o posterior, distribuciones de Linux posteriores a 2005 y versiones de macOS compatibles actualmente. Tal como lo exigió la Unión Europea, Microsoft lanzó una actualización de fuentes para corregir esta deficiencia en Windows XP (también aplicable a 2000/Server 2003) a principios de 2007, poco después de que Rumania se uniera a la Unión Europea.
Antes de la reforma ortográfica de 1904, existían varias letras adicionales con signos diacríticos.
Además, el acento agudo ( á , í ) se utilizaba en los infinitivos verbales y en las formas del imperfecto de tercera persona acentuadas en la última sílaba: lăudá ("alabar"), aud̦í ("oír"), lăudá (imperfecto de tercera persona) , aud̦iá . El acento grave ( à , ì , ù ) se utilizaba en las formas del perfecto de tercera persona acentuadas en la última sílaba: lăudà , aud̦ì . [26]
El uso de estas letras no fue adoptado plenamente incluso antes de 1904, ya que algunas publicaciones (por ejemplo, Timpul y Universul ) optaron por utilizar un enfoque simplificado que se parecía a la escritura en rumano actual. [ cita requerida ]
Al igual que en otros idiomas, el acento agudo se utiliza a veces en textos rumanos para indicar la vocal acentuada en algunas palabras. Este uso es habitual en los lemas de los diccionarios, pero también se encuentra ocasionalmente en textos cuidadosamente editados para desambiguar entre homógrafos que no son también homófonos , como para diferenciar entre cópii ("copias") y copíi ("niños"), éra ("la era") y erá ("era"), ácele ("las agujas") y acéle ("esas"), etc. El acento también distingue entre formas verbales homográficas, como încúie e încuié ("él encierra" y "él ha encerrado"). [27]
En algunos préstamos se conservan los diacríticos: bourrée , pietà . Los nombres extranjeros también suelen escribirse con sus diacríticos originales: Bâle , Molière , incluso cuando un acento agudo podría interpretarse erróneamente como un acento, como en István o Gérard . Sin embargo, los nombres extranjeros de uso frecuente, como los nombres de ciudades o países, a menudo se escriben sin diacríticos: Bogotá , Panamá , Perú . [28]
El estándar de codificación de caracteres ISO 8859 definió inicialmente una única página de códigos para toda Europa central y oriental: ISO 8859-2 . Esta página de códigos incluye solo "s" y "t" con cedillas. El estándar ISO 8859-16 para Europa sudoriental incluye "s" y "t" con una coma debajo en los mismos lugares donde estaban "s" y "t" con cedillas en el estándar ISO 8859-2. Sin embargo, la página de códigos ISO 8859-16 se convirtió en estándar después de que Unicode se generalizara, por lo que los proveedores de software la ignoraron en gran medida.
Las letras rumanas acentuadas circunfleja y breve fueron parte del estándar Unicode desde su inicio, así como las variantes de cedilla de s y t. Ș y ț (variantes con coma debajo) se agregaron a la versión 3.0 de Unicode. [29] [30] Desde la versión 3.0 de Unicode hasta la versión 5.1, el estándar Unicode especificó que los caracteres que usan cedilla se "usen tanto en datos turcos como rumanos" y que "se prefiere una variante de glifo con coma debajo para rumano"; sobre los caracteres que usan coma recientemente codificados, dijo que deberían usarse "cuando se requiere una forma distinta de coma debajo". [31] [32] Unicode 5.2 establece explícitamente que "la forma con cedilla se prefiere en turco, y la forma con coma debajo se prefiere en rumano", al tiempo que menciona (posiblemente por razones históricas) que "en turco y rumano, una cedilla y una coma debajo a veces se reemplazan entre sí". [33]
La adopción generalizada se vio obstaculizada durante algunos años por la falta de fuentes que proporcionaran los nuevos glifos. En mayo de 2007, cuatro meses después de que Rumania (y Bulgaria) se unieran a la UE , Microsoft lanzó fuentes actualizadas que incluyen todos los glifos oficiales del alfabeto rumano (y búlgaro ). [34] Esta actualización de fuentes estaba destinada a Windows 2000, XP y Server 2003. El subconjunto de Unicode más ampliamente compatible en los sistemas Microsoft Windows, Windows Glyph List 4 , todavía no incluye las variantes de S y T con coma debajo.
Las vocales con diacríticos se codifican de la siguiente manera:
Adobe Systems decidió [35] que los glifos Unicode "t con cedilla" U+0162/3 no se utilizan en ningún idioma. (De hecho, se utilizan, pero en muy pocos idiomas. La T con cedilla existe como parte del Alfabeto general de las lenguas de Camerún , en algunas ortografías gagauzas, en el dialecto cabilio de la lengua bereber y posiblemente en otros lugares). Por lo tanto, Adobe ha sustituido los glifos con "t con coma debajo" (U+021A/B) en todas las fuentes que distribuye. La desafortunada consecuencia de esta decisión es que los documentos rumanos que utilizan los puntos Unicode (no oficiales) U+015E/F y U+0162/3 (para ş y ţ) se representan en las fuentes Adobe de una manera visualmente inconsistente utilizando "s con cedilla", pero "t con coma" (ver figura). Las fuentes Linotype que admiten glifos rumanos en su mayoría siguen esta convención. [36]
Las fuentes utilizadas por Microsoft antes de Windows Vista también implementan este estándar de facto de Adobe. Pocas fuentes de Microsoft ofrecen un aspecto uniforme cuando se utilizan variantes de cedilla; las más destacadas son Tahoma , Verdana , Trebuchet MS , Microsoft Sans Serif y Segoe UI .
Las fuentes gratuitas DejaVu y Linux Libertine ofrecen glifos adecuados y consistentes en ambas variantes. Las fuentes Liberation de Red Hat solo admiten las variantes con coma debajo a partir de la versión 1.04, cuya inclusión está prevista en Fedora 10.
ROM/locl
Función OpenTypeAlgunas fuentes OpenType de Adobe y todas las fuentes de la serie C de Vista implementan la función opcional OpenType GSUB/latn/ROM/locl
. [37] Esta función obliga a que "s con cedilla" se represente utilizando el mismo glifo que "s con coma debajo". Cuando se lleva a cabo esta segunda reasignación (pero opcional), el texto Unicode rumano se representa con glifos con coma debajo, independientemente de las variantes de puntos de código.
Desafortunadamente, la mayoría de las fuentes OpenType de Microsoft anteriores a Vista ( Arial , etc.) no implementan la ROM/locl
característica, incluso después de la Actualización de fuentes de expansión de la Unión Europea, [34] por lo que los documentos antiguos se verán inconsistentes como en el lado izquierdo de la figura anterior. Unas pocas fuentes seleccionadas, por ejemplo, Verdana y Trebuchet MS , no solo tienen una apariencia consistente para las variantes de cedilla (después de la actualización de la UE), sino que también hacen una reasignación simultánea de cedilla s y t a variantes con coma debajo cuando ROM/locl
se activa. Las fuentes gratuitas DejaVu y Linux Libertine aún no ofrecen esta característica en sus versiones actuales, pero las versiones de desarrollo sí.
Pango admite la locl
etiqueta desde la versión 1.17. XeTeX la admite locl
desde la versión 0.995. A julio de 2008, muy pocas aplicaciones de Windows admiten la locl
etiqueta feature. De la suite Adobe CS3 , solo InDesign la admite. [38]
El estado del soporte rumano en las fuentes gratuitas que se envían con Fedora se mantiene en Fedoraproject.org.
Unicode también permite que los signos diacríticos se representen como signos diacríticos de combinación separados . Los acentos de combinación relevantes son U+0326 COMBINING COMMA BELOW y U+0327 COMBINING CEDILLA. Es posible que en el pasado las fuentes comerciales no admitieran con éxito la aplicación de un signo diacrítico de combinación Comma Below a las letras S y T, pero casi todas las fuentes modernas pueden manejar con éxito tanto los signos Cedilla como Comma Below para S y T. Al igual que con todas las fuentes, la calidad tipográfica puede variar, por lo que es preferible utilizar los puntos de código individuales en su lugar. Siempre que se utilice un signo diacrítico de combinación en un documento, se debe probar la fuente en uso para confirmar que se reproduce de manera aceptable.
LaTeX permite la composición tipográfica en rumano utilizando la cedilla Ş y Ţ utilizando la codificación Cork . Las variantes con coma debajo no son totalmente compatibles con las codificaciones de fuentes estándar de 8 bits de TeX. La falta de un LICR (LaTeX Internal Character Representations) estándar para las comas debajo de Ș y Ț es parte del problema. El latin10
método de entrada intenta solucionar el problema definiendo el acento LICR \textcommabelow. Lamentablemente, el método de entrada no lo admite utf8
.
El problema se puede solucionar parcialmente en un documento LaTeX utilizando estas configuraciones, que permitirían el uso de ș, ț o sus variantes cedilla directamente en la fuente LaTeX:
\usepackage[latin10,utf8]{entrada}% translitera caracteres utf8 con çedila en su representación con coma debajo\DeclareUnicodeCharacter{015F}{\textcommabelow s} % ş\DeclareUnicodeCharacter{015E}{\textcommabelow S} % Ş\DeclareUnicodeCharacter{0163}{\textcommabelow t} % ţ\DeclareUnicodeCharacter{0162}{\textcommabelow T} % Ţ% translitera caracteres utf8 de coma debajo a la representación de coma debajo\DeclareUnicodeCharacter{0219}{\textcommabelow s} % ș\DeclareUnicodeCharacter{0218}{\textcommabelow S} % Ș\DeclareUnicodeCharacter{021B}{\textcommabelow t} % ț\DeclareUnicodeCharacter{021A}{\textcommabelow T} % Ț
El latin10
paquete compone los glifos con coma debajo superponiendo una coma y las letras S y T. Este método es adecuado solo para imprimir. En los documentos PDF producidos de esta manera, la búsqueda o copia de texto no funciona correctamente. La codificación polaca QX tiene cierto soporte para los glifos con coma debajo, que se asignan incorrectamente a los LICR de cedilla, pero también carece de A breve (Ă), que siempre debe ser compuesta, por lo que no se puede buscar.
En las fuentes Latin Modern Type 1, la T con coma debajo se encuentra bajo el nombre AGL /Tcommaaccent. Esto está en contradicción con la decisión de Adobe discutida anteriormente, que coloca una T con coma debajo en /Tcedilla. En consecuencia, no puede funcionar ninguna asignación fija en todas las fuentes Type 1; cada fuente debe venir con su propia asignación. Desafortunadamente, los controladores de salida de TeX, como dvips , dvipdfm o el controlador PDF interno de pdfTeX , acceden a los glifos por el nombre AGL . Dado que todos los controladores de salida mencionados desconocen esta peculiaridad, el problema es esencialmente intratable en todas las fuentes. En consecuencia, es necesario utilizar fuentes que incluyan una asignación que TeX no omita. Este es el caso del motor TeX más nuevo XeTeX , que puede usar fuentes Unicode OpenType y no omite el mapa Unicode de la fuente.
Los sistemas operativos de computadoras modernos se pueden configurar para implementar un diseño de teclado rumano estándar, para permitir escribir en cualquier teclado como si fuera un teclado rumano.
En sistemas como Linux que emplean el sistema XCompose, las letras rumanas se pueden escribir desde un teclado que no sea rumano utilizando una tecla de composición . La disposición del teclado del sistema debe estar configurada para utilizar una tecla de composición. (La forma exacta de lograr esto depende de la distribución). Por ejemplo, la tecla "Alt izquierda" se utiliza a menudo como tecla de composición.
Para escribir una letra con un signo diacrítico, se mantiene presionada la tecla de composición mientras se presiona otra tecla para indicar el signo que se va a aplicar y luego se escribe la letra base. Por ejemplo, al usar un teclado con diseño inglés (EE. UU.), para producir ț, mantenga presionada la tecla de composición mientras escribe el punto y coma ';', luego suelte la tecla de composición y escriba 't'. Se pueden aplicar otros signos de forma similar de la siguiente manera:
Existe un equivalente rumano a los alfabetos de ortografía del idioma inglés . La mayoría de las palabras clave son los nombres de pila de las personas, con la excepción de K, J, Q, W e Y. Las letras con diacríticos (Ă, Â, Î, Ș, Ț) generalmente se transmiten sin diacríticos (A, A, I, S, T).