stringtranslate.com

ISO 11940

ISO 11940 es un estándar ISO para la transliteración de caracteres tailandeses , publicado en 1998 y actualizado en septiembre de 2003 y confirmado en 2008. Una extensión de este estándar denominada ISO 11940-2 define una transcripción simplificada basada en él.

Consonantes

La transliteración de las consonantes puras se deriva de su pronunciación habitual como consonante inicial. Una h sin marcar se utiliza para formar dígrafos que denotan consonantes aspiradas . Los pares de consonantes altas y bajas se diferencian sistemáticamente aplicando un macron a la consonante de clase alta. Se obtiene una mayor diferenciación de consonantes con función fonética idéntica dejando las más frecuentes sin marcar, marcando la segunda más común con un punto debajo, marcando la tercera más común con un cuerno y marcando la cuarta más común subrayando. El uso de un punto debajo tiene un efecto similar a la práctica indológica de distinguir las consonantes retroflejas mediante un punto debajo, pero hay diferencias sutiles: son las transliteraciones de ธtho thong y ศso sala las que están punteadas debajo, no las de la consonantes retroflejas correspondientes . Las transliteraciones de consonantes deben ingresarse en el orden letra base, macron si la hay, y luego punto debajo, cuerno o "macron debajo". Sólo tres consonantes tienen el cuerno en su transliteración, ฅkho khon , ฒtho phuthao y ษso ruesi , y sólo una consonante tiene un subrayado, ฑtho nang Montho .

vocales

La letra å es el único carácter precompuesto especificado en el resultado de la transliteración.

Lakkhangyao (ๅ) se ha mostrado sólo en combinación con las letras vocales ฤ y ฦ. El estándar simplemente enumera ฤ y ฦ con las consonantes y lakkhangyao con las vocales. Un lakkhangyao aislado también se transliteraría con una letra minúscula "i" con trazo ( ɨ ), pero esto no debería ocurrir en tailandés, pali o sánscrito.

Las transliteraciones de วwo waen y อo ang se han incluido aquí debido a su uso como símbolos vocálicos completos, pero su transliteración no depende de cómo se usan y el estándar simplemente los enumera junto con las consonantes.

Los símbolos de las vocales compuestas se transliteran de acuerdo con sus constituyentes.

Otras marcas combinadas

Tenga en cuenta que yamakkan (–๎) está representado por una tilde espaciadora, no por una tilde en superíndice.

Puntuación y dígitos

La norma ISO 11940:1998 distingue el símbolo de abreviatura paiyannoi (ฯ) del terminador de oración angkhandiao (ฯ), aunque ni el estándar nacional de caracteres TIS 620-2533 ni Unicode versión 5.0 los distinguen. Paiyannoi se transcribe como ǂ y angkhandiao se transcribe como ǀ . Tenga en cuenta que paiyannoi , angkhandiao y angkhankhu (๚) se transliteran mediante las letras utilizadas para las consonantes clic , no mediante doble daga, barras verticales o dandas .

Secuenciación de personajes

En general, los caracteres se transliteran de izquierda a derecha y, cuando los caracteres tienen la misma posición horizontal, de arriba a abajo. De hecho, la secuencia vertical se especifica simplemente como marcas tonales y thanthakhat (–์) precediendo a cualquier otra marca por encima o por debajo de la consonante. La norma niega al final de la Sección 4.2 que la combinación de sara u (◌ุ, ◌ู) y nikkhahit (◌ํ) pueda ocurrir y luego da un ejemplo de ello al especificar la transliteración de nikkhahit , pero no muestra la transliteración. de la combinación. El efecto de estas reglas es que, excepto nikkhahit , todas las marcas no vocales adjuntas a una consonante en tailandés se adjuntan a la consonante en la transliteración romana.

La norma reconoce que intentar transponer vocales y consonantes prepuestas puede resultar reconfortante para quienes están acostumbrados al alfabeto romano , pero recomienda que no se transpongan las vocales prepuestas.

Por ejemplo, ภาษาไทย ( RTGS :  Phasa Thai ) debe transliterarse a p̣hās̛̄āịthy y เชียงใหม่ ( RTGS :  Chiang Mai ) a echīyngıh̄m̀ .

Variaciones

Causas

El estándar especifica el orden en el que se deben escribir los acentos, pero no todos los sistemas de entrada registrarán los acentos en el orden en que se escriben. Unicode especifica dos formas normalizadas para letras con múltiples acentos, y es muy probable que el texto transliterado se almacene en una de estas formas. Esto complica la retrotransliteración automática. Como los procesos compatibles con Unicode deben manejar dichas variaciones correctamente, las transliteraciones en esta página se han elegido para facilitar su visualización; los sistemas de representación actuales pueden mostrar formas equivalentes de manera diferente.

Muchas fuentes muestran mal las nuevas combinaciones de consonantes y acentos. Por ejemplo, el Instituto de la Lengua Estonia publica en la web una explicación de la aplicación del estándar al tailandés y, con una excepción, esto parece ser un cumplimiento del estándar. La excepción es que, a excepción del macron, los acentos sobre las consonantes en realidad están desplazados hacia la derecha, dando la impresión de que se han ingresado como los caracteres correspondientes que no se combinan. El estándar especifica las transliteraciones en puntos de código, pero alguien que trabaje a partir de esta explicación gratuita podría deducir fácilmente que se deben utilizar las formas de espaciado de los acentos tonales.

UCI (CLDR 1.4.1)

La implementación de ICU , registrada en la versión 1.4.1 del Common Locale Data Repository patrocinado por Unicode , [1] utiliza un número primo en lugar de un cuerno en la transliteración de consonantes. Esto afecta la transliteración de ฅkho khon , ฒtho phuthao y ษso bo ruesi . ฏto patak también se translitera de manera diferente, como en lugar de .

Esta implementación translitera ำ como  en lugar de å para evitar ambigüedades con la hipotética secuencia de escritura tailandesa ะํ ( sara a , nikkhahit ). La implementación de ICU translitera ฺphinthu como ˌ en lugar de para evitar problemas con la normalización de Unicode . Esto tiene el efecto secundario de mejorar la legibilidad cuando se aplica a una consonante sin puntos.

La implementación de la UCI translitera ฯpaiyannoi como (doble daga) y angkhankhu como || (dos barras verticales ASCII). Como la implementación de ICU utiliza Unicode, no puede distinguir de manera confiable angkhandiao de paiyannoi sin un análisis semántico, y no hace tal intento.

La secuencia de caracteres de la implementación de la UCI es diferente. Transpone vocales prepuestas con la siguiente consonante y procesa las marcas de una consonante en el orden en que están almacenadas en la memoria. (La mayoría de los métodos de entrada tailandeses garantizan que las marcas se almacenen en orden de abajo hacia arriba). No transpone vocales prepuestas con grupos de consonantes completos; Los grupos de consonantes no se pueden identificar con total precisión, y la transposición de vocales con grupos requeriría un símbolo adicional para permitir una conversión confiable a la escritura tailandesa.

Por ejemplo, bajo esta implementación ภาษาไทย se translitera a p̣hās̄ʹāthịy y เชียงใหม่ a cheīyngh̄ım̀ .

Finalmente, esta implementación genera transliteraciones en Unicode Normalization Form C (NFC).

Ver también

Referencias

  1. ^ http://unicode.org/Public/cldr/1.4.1/core.zip archivos transforms/ThaiLogical-Latin.xml y transforms/Thai-ThaiLogical.xml (utilizados por los transliteradores de ICU "Thai-Latin" y "Latin- Tailandés")

enlaces externos