stringtranslate.com

Tai Tham (bloque Unicode)

Tai Tham es un bloque Unicode que contiene caracteres de la escritura Lanna utilizada para escribir los idiomas tailandés del norte (Kam Mu'ang), Tai Lü y Khün.

Historia

De los 127 puntos de código inicialmente codificados, 123 fueron propuestos en L2/07-007R, [3] dos más (U+1A5C y U+1A7C) en L2/08-037R2 [4] y un par final (U+1A5D y U+1A5E) en L2/08-073. [5] El último de estos tres documentos modificó las definiciones de U+1A37 y U+1A38 dadas en el primero de los tres.

Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definición de caracteres específicos en el bloque Tai Tham:

Codificación de consonantes subíndices

Las consonantes base y subíndice tienen codificaciones diferentes porque palabras como ᨲᩥ᩠ᨠ y ᨲᩥᨠ son diferentes tanto en apariencia como en sonido. Las consonantes subíndice se codifican como una secuencia de 2 caracteres. El segundo es el carácter base y el primero es el carácter especial U+1A60 TAI THAM SIGN SAKOT. [3] : Sección 2 

Si una consonante tiene dos formas de subíndice y la elección afecta el significado, la forma que se usa normalmente para las consonantes finales de sílaba se codificará con SAKOT, y la otra forma tendrá su propio punto de código. Hay 7 consonantes que tienen diferentes formas de subíndice de esta manera, a saber: RA, LA, BA, ALTA SA, MA, ALTA RATA y BAJA PA.

ᨣᩕᩪ ( pronunciación del norte de Tailandia: [k ʰ uː] ) está codificado como <U+1A23 LOW KA, U+1A55 MEDIAL RA , U+1A6A SIGN UU> pero ᨠᩣ᩠ᩁ ( IPA: [kaː n ] ) está codificado como <U+ 1A20 ALTA KA, U+1A63 SIGN AA, U+1A60 SAKOT, U+1A41 RA > [3] : Sección 4 

ᩆᩦ᩠ᩃ ( IPA: [siː n ] ) se codifica como <U+1A46 HIGH SHA, U+1A66 SIGN II, U+1A60 SAKOT, U+1A43 LA > [3] : Sección 14.5  pero ᨸᩖᩦ ( IPA: [piː] ) se codifica como <U+1A38 HIGH PA, U+1A56 MEDIAL LA , U+1A66 SIGN II>. [3] : Sección 4  (Para el uso de LA como letra final de sílaba, compare ᩁᨭᩛᨷᩣ᩠ᩃ [3] : Sección 4  ( pronunciación del norte de Tailandia: [lat tha baːn] ).

U+1A57 SIGN LA TANG LAI se parece a <U+1A60 SAKOT, U+1A43 LA> pero en origen es una ligadura del mismo con <U+1A60 SAKOT, U+1A26 NGA>. Tai Lue lo usa para escribir la palabra ᨴᩢ᩵ᩗᩣ ( IPA: [taŋ laːi] ). [6]

ᨣᩝᩴ ( IPA: [kɔː b ɔː] ) está codificado como <U+1A23 LOW KA, U+1A5D SIGN BA , U+1A74 MAI KANG>, pero ᨠᩢ᩠ᨷ ( IPA: [ka p ] ) está codificado como <U+1A20 HIGH KA, U+1A62 MAI SAT, U+1A60 SAKOT, U+1A37 BA > y ᨠᩢᨷ᩠ᨷ᩺ ( IPA: [kap] ) está codificado como <U+1A20 HIGH KA, U+1A62 MAI SAT, U+1A37 BA, U +1A60 SAKOT, U+1A37 BA , U+1A7A RA HAAM>

En la propuesta final, [3] : 1  en la que el Consorcio Unicode aceptó que lo que ahora es SIGN BA (como en ᨣᩝᩴ ) se codificaría como <SAKOT, BA> y lo que ahora es <SAKOT, BA> (como en ᨠᩢ᩠ᨷ ) debería codificarse como <SAKOT, HIGH PA>, pero durante el proceso ISO el significado de <SAKOT, BA> cambió [5] y se agregó SIGN BA. Sin embargo, el significado original de <SAKOT, HIGH PA> permanece para las palabras del tailandés que tienen ป como consonante final de sílaba. (Esta propuesta llama erróneamente a <SAKOT, HIGH PA> <SAKOT, HIGH PHA>.)

En Laos y el noreste de Tailandia, el pali utiliza HIGH PA en lugar de BA. Por lo tanto, es posible que en pali se encuentre <SAKOT, BA> codificado como <U+1A60 SAKOT, U+1A38 HIGH PA>.

Tai Khuen tiene dos formas de escribir el subíndice HIGH SA. No son intercambiables. En Tai Khuen, escribir ᩃᩮᩞ es correcto y escribir ᩃᩮ᩠ᩈ es incorrecto, [5] pero escribir ᩈᨶ᩠ᨶᩥᩅᩤ᩠ᩈ es correcto mientras que escribir ᩈᨶ᩠ᨶᩥᩅᩤᩞ es incorrecto. ᩃᩮᩞ se codifica como <U+1A43 LA, U+1A6E SIGN E, U+1A5E SIGN SA > mientras que el ᩃᩮ᩠ᩈ incorrecto se codifica como <U+1A43 LA, U+1A6E SIGN E, U+1A60 SAKOT, U+1A48 HIGH SA >.

Tai Khuen tiene una forma adicional de escribir el subíndice MA. Hay un punto de código especial para este método adicional [4] : ​​Elemento 9  La palabra que el tailandés del norte escribe como ᨵᨾ᩠ᨾ᩺ se escribe en Tai Khuen tanto como ᨵᨾ᩠ᨾ᩼ codificado como <U+1A35 LOW THA, U+1A3E MA, U+1A60 SAKOT, U+1A3E MA , U+1A7C KARAN> y como ᨵᨾᩜ᩼ codificado como <U+1A35 LOW THA, U+1A3E MA, U+1A5C SIGN MA , U+1A7C KARAN>.

Hay dos formas de escribir el subíndice tanto para HIGH RATHA como para LOW PA. ᨶᩥᨣᨱᩛ [7] : 368  se codifica como <U+1A36 NA, U+1A65 SIGNO I, U+1A23 LOW KA, U+1A31 RANA, U+1A5B SIGNO HIGH RATHA O LOW PA >: ᩁᩣᨩᨽᩢ᩠ᨮ [3] : 3  se codifica como <U+1A41 RA, U+1A63 SIGNO AA, U+1A29 LOW CA, U+1A3D LOW PHA, U+1A62 MAI SAT, U+1A60 SAKOT, U+1A2E HIGH RATHA >. ᨶᩥᨻᩛᩣᨶ se codifica como <U+1A36 NA, U+1A65 SIGN I, U+1A3B LOW PA, U+1A5B SIGN HIGH RATHA OR LOW PA , U+1A63 SIGN AA, U+1A36 NA>: ᨴᩮ᩠ᨻ se codifica como <U+1A34 LOW TA, U+1A6E SIGN E, U+1A60 SAKOT, U+1A3B LOW PA >. La última palabra también se escribe como ᨴᩮ᩠ᨷ . La consonante conjunta de estilo lao ᨲ᩠ᨳ (codificada como <U+1A32 HIGH TA, U+1A60 SAKOT, U+1A33 HIGH THA>) parece estar codificada como ᨲᩛ como <U+1A32 HIGH TA, U+1A5B SIGN HIGH RATHA OR LOW PA>. La forma de U+1A5B depende de la consonante a la que está subíndice.

La vocal dependiente de palabras como ᨯᩬᨠ 'flor' está codificada por la vocal especial <U+1A6C SIGN OA BELOW>; no se debe usar la secuencia <U+1A60 SAKOT, U+1A4B LETTER A> También hay una vocal dependiente codificada para palabras como Tai Khuen, Tai Lue y palabras lao como ᨶ᩶ᩭ , a saber, U+1A6D SIGN OY. Esta vocal no está codificada como <U+1A6C SIGN OA BELOW, U+1A60 SAKOT, U+1A3F LOW YA> (que es lo que usa el tailandés del norte para las palabras correspondientes; ni es la secuencia <U+1A60 SAKOT, U+1A40 HIGH YA> [3]: Sección 5 

Consonantes superíndices

Las consonantes superíndices se codifican independientemente de las consonantes base. Algunos caracteres cumplen tanto funciones de consonantes superíndices como de otras funciones, por lo que se tratan en más detalle en esta sección.

Niggahita y se codifica como U+1A74 MAI KANG. El superíndice WA no se codifica por separado. Se codifica como MAI KANG. Por ejemplo, Tai Khuen ᨯ᩠ᨿᩴ ( IPA: [deu] ) se codifica como <U+1A2, DA, U+1A60 SAKOT, U+1A3F LOW YA, U+1A74 MAI KANG>. A los efectos de la secuenciación de caracteres, generalmente se trata como una vocal.

El NGA inicial en superíndice se codifica como U+1A58 MAI KANG LAI. Tenga en cuenta que el lao generalmente utiliza el mismo glifo para MAI KANG LAI y U+1A59 SIGN FINAL NGA.

U+1A62 MAI SAT cumple tres funciones: es una vocal, una consonante final y un acortador de vocales.

La elección de la codificación de la forma superíndice de RA y de los eliminadores de vocales fue difícil. En la década de 1940, los Tai Khuen escribían la consonante y el eliminador de vocales de la misma manera. Los proponentes de la codificación hicieron averiguaciones y se les dijo que los glifos seguían siendo los mismos y, por lo tanto, los codificaron como U+1A7A RA HAAM. Luego se supo que los Tai Khuen habían cambiado los glifos del eliminador de vocales y se agregó un nuevo carácter U+1A7C KARAN para el estilo Tai Khuen del eliminador de vocales. Algunos escritores del norte de Tailandia prefieren usar U+1A7C como eliminador de vocales y, de hecho, el uso de su glifo no es desconocido en la escritura del norte de Tailandia.

Consonantes especiales

Las formas especiales y están codificadas por los puntos de código U+1A53 y U+1A55 respectivamente.

Si los glifos de U+1A36 NA y U+1A63 SIGN AA estuvieran uno al lado del otro, se escriben como la ligadura ᨶᩣ en lugar de como dos glifos separados ᨶ‌ᩣ . Se escriben como una ligadura incluso si el NA tiene una consonante subíndice o una marca no siguiente adjunta. Ejemplos: ᨾᨶ᩠ᨲᩣ ( AFI: [man taː] , codificación <U+1A3E MA, U+1A36 NA, U+1A60 SAKOT, U+1A32 HIGH TA, U+1A63 SIGN AA>) y ᨶᩮᩢᩣ ( AFI: [nau] , codificación <U+1A36 NA, 1A6E SIGN E, U+1A62 MAI SAT, U+1A63 SIGN AA>). El subíndice NA y SIGN AA no se ligan de manera similar, por ejemplo, ᩉ᩠ᨶᩣ (( IPA: [naː] ), codificado <U+1A49 HIGH HA, U+1A60 SAKOT, 1A36 NA, U+1A63 SIGN AA>)

La consonante geminada se codifica por separado porque la palabra ᩅᩥᩈᩮ᩠ᩈ ( pronunciación del norte de Tailandia: [wiseːt] , que codifica <U+1A45 WA, U+1A65 SIGN I, U+1A48 HIGH SA, U+1A6E SIGN E, U+1A60 SAKOT, U+1A48 HIGH SA>) tiene una apariencia muy diferente de ᩅᩥᩔᩮ , pero uno puede tener ocasión de doblar la sílaba final a <HIGH SA, SAKOT, HIGH SA, SIGN E>. De hecho, en 2019 a 2020 hubo una campaña para establecer esta última como su ortografía estándar.

Por el contrario, la consonante geminada ᨬ᩠ᨬ está codificada como el conjunto <U+1A2C NYA, U+1A60 SAKOT, U+1A2C NYA>, aunque algunos de sus glifos pueden parecerse al hipotético conjunto ᨱ᩠ᨬ <U+1A31 RANA, U+1A60 SAKOT, U+1A2C NYA>.

Vocales independientes

La vocal independiente y la consonante son el mismo carácter, U+1A4B.

La vocal independiente ᩋᩣ y la secuencia de la consonante y la vocal dependiente tienen la misma apariencia ᩋᩣ y, por lo tanto, ambas están codificadas <U+1A20 LETRA A, U+1A63 SIGNO AA>.

El tailandés del norte utiliza cinco vocales independientes con sus propios puntos de código, a saber, , , , y . [3] : Sección 3 

En el norte de Tailandia, la octava vocal independiente no es diferente de la secuencia de la consonante y la vocal dependiente , es decir, ᩋᩰ , y por lo tanto, ambas se codifican como <U+1A4B LETRA A, U+1A70 SIGNO OO>. Otros idiomas usan un carácter distinto U+1A52 LETRA OO para la vocal independiente.

Orden de caracteres dentro del texto

La propuesta de codificación [3] definió el orden de los caracteres Unicode.

Al igual que la forma de escribir en birmano, jemer e idiomas indios, los caracteres Unicode se ordenan según el orden de los sonidos, excepto en casos especiales [9] o si dos sonidos se combinan en un solo sonido y entonces se utiliza el orden antiguo. Este orden suele ser como en siamés. Si el sonido no tiene un orden, se utiliza el orden visual o un orden alternativo especial.

Existen reglas especiales para:

(a) El orden de las vocales
(b) La escritura del mai kia en todas sus variantes
(c) La escritura de Mai Kua en todas sus variantes
(d) La escritura de mai kam
(e) La escritura de marcas tonales

El orden de los caracteres Unicode para consonantes y vocales es: letras iniciales, marcas vocálicas verdaderas, consonantes de coda, letras iniciales, marcas vocálicas verdaderas, consonantes de coda. [3] : Sección 14  Por conveniencia, se considera que los símbolos que matan vocales son vocales.

Las 'letras iniciales' son consonantes, vocales independientes o símbolos especiales. Las consonantes de un grupo se ordenan según el orden en el que suenan o solían sonar.

Ejemplo: ᨻᩩᨴ᩠ᨵ ( Pronunciación del norte de Tailandia: [put thaʔ] )

Letra inicial:
vocal pura:
'consonante' final:
Letra inicial:
vocal pura: sin símbolo
consonante final: ninguna

La codificación es <U+1A3B LOW PA, U+1A69 SIGN U, U+1A34 LOW TA, U+1A60 SAKOT, U+1A35 LOW THA>

Ejemplo: ᨻᩕ tiene un solo sonido consonántico Pronunciación del norte de Tailandia: [pʰ] , pero anteriormente tenía dos sonidos, a saber, y como en el centro de Tailandia. Esta palabra está codificada como <PA BAJA, RA MEDIA>.

Aparte de la RA MEDIAL, el orden de los glifos consonánticos es el mismo que el orden de los sonidos. En la mayoría de los casos, la RA MEDIAL es la última consonante, pero la WA de /ua/ y la YA BAJA de /ia/ siguen a la RA MEDIAL.

Ejemplos:

ᩆᩣᩈ᩠ᨲᩕ᩺ está codificado <U+1A46 HIGH SHA, U+1A63 SIGN AA, U+1A48 HIGH SA, U+1A60 SAKOT, U+1A32 HIGH TA, U+1A55 MEDIAL RA, U+1A7A RA HAAM>.
ᨠᩕᩈᩢ᩠ᨲ está codificado <U+1A20 HIGH KA, U+1A55 MEDIAL RA, U+1A48 HIGH SA, U+1A62 MAI SAT, U+1A60 SAKOT, U+1A32 HIGH TA>.
ᩈᩕ᩠ᩅᨾ está codificado <U+1A48 HIGH SA, U+1A55 MEDIAL RA, U+1A60 SAKOT, U+1A45 WA, U+1A3E MA>.
Pero ᨲᩕ᩠ᨶᩬᨾ ( pronunciación del norte de Tailandia: [tʰa nɔːm] ) [7] : 269  está codificado <U+1A32 ALTA TA, U+1A55 MEDIAL RA, U+1A60 SAKOT, U+1A36 NA, U+1A6C SIGNO OA ABAJO, U +1A3E MA>

Para palabras como ᨧᩮᩢ᩶ᩣ existe la regla de que los símbolos para vocales y tonos tienen el orden: [3] : Sección 5 primera parte, 5.3 y 13 

(1) vocales principales
(2) vocales a continuación (de arriba a abajo)
(3) vocales arriba (de abajo hacia arriba)
(4) marcas de tono (de izquierda a derecha)
(5) vocales finales (de izquierda a derecha)

En la aplicación de estas reglas, MAI KANG se considera una vocal aunque funcione como niggahita o como consonante. El carácter Unicode MAI SAT se considera una vocal aunque funcione como consonante, es decir, como mai kak, es decir, como consonante final o como acortador de vocales como en ᨸᩮᩢ᩠ᨯ .

El orden relativo de las marcas arriba y abajo debe seguir el tailandés y el laosiano como en เจ้า เกี่ว ชุํ y ບິ່ .

Ejemplos:

ᨧᩮᩢ᩶ᩣ se codifica como <U+1A27 HIGH CA, U+1A6E SIGN E, U+1A62 MAI SAT, U+1A76 TONE-2, U+1A63 SIGN AA> [3] : Sección 5 n.º 29 
ᨾᩢᩣ ( IPA: [maːk] ) se codifica como <U+1A3E MA, U+1A62 MAI SAT, U+1A63 SIGN AA>
ᩃᩪᩢ ( IPA: [luːk] ) está codificado como <U+1A43 LA, U+1A6A SIGN UU, U+1A62 MAI SAT>
ᨶᩮᩢᩣ se codifica como <U+1A36 NA, U+1A6E SIGN E, U+1A62 MAI SAT, U+1A63 SIGN AA>
ᩋᩫᨶ᩠ᨲᩕᩣ᩠ᨿ ( Pronunciación del norte de Tailandia: [on thaʔ laːi] ) está codificado como <U+1A4B LETRA A, U+1A6B SIGNO O, U+1A36 NA, U+1A60 SAKOT, U+1A32 ALTA TA, U+1A55 MEDIAL RA, U+1A63 SIGNO AA, U+1A60 SAKOT, U+1A3F BAJA YA>

Para /ia/ y /ua/ en todas sus formas, los subíndices LOW YA y WA se consideran consonantes iniciales. [3] : Sección 14.3 

Ejemplos:

ᩈ᩠ᨿᩮ en realidad está codificado <U+1A48 HIGH SA, U+1A60 SAKOT, U+1A3F LOW YA, U+1A6E SIGN E> [3] : Sección 5 No. 33 
ᨸ᩠ᩃ᩠ᨿ᩵ᩁ en realidad está codificado <U+1A38 HIGH PA, U+1A60 SAKOT, U+1A43 LA, U+1A60 SAKOT, U+1A3F LOW YA, U+1A75 TONE-1, U+1A41 RA> [3] : Sección 14.9 
ᨲ᩠ᩅᩫ en realidad está codificado <U+1A32 HIGH TA, U+1A60 SAKOT, U+1A45 WA, U+1A6B SIGN O> [3] : Sección 14.3 
ᩈ᩠ᩅ᩵ᩁ en realidad está codificado <U+1A48 HIGH SA, U+1A60 SAKOT, U+1A45 WA, U+1A75 TONE-1, U+1A41 RA>
ᨠᩖ᩠ᩅ᩠᩶ᨿ en realidad está codificado como <U+1A20 KA, U+1A56 MEDIAL LA, U+1A60 SAKOT, U+1A45 WA, U+1A76 TONE-2, U+1A60 SAKOT, U+1A3F LOW YA>
(<U+1A60, U+1A76> es canónicamente equivalente a <U+1A76, U+1A60>)

Fuera del norte de Tailandia, el MAI KANG en el símbolo de /am/ se escribe en el componente SIGN AA. En el norte de Tailandia, se coloca de diversas formas: en la consonante, en el SIGN AA y entre ellos. El Consorcio Unicode rechazó un carácter especial para la combinación. La palabra ᨷᩴ᩠᩵ᨾᩣ ( pronunciación del norte de Tailandia: [bɔːmaː] ) no debería aparecer con la misma vocal que ᨲ᩵ᩣᩴ ( AFI: [tam] ). Por lo tanto, la combinación de /am/ se codifica como <U+1A63 SIGN AA, U+1A74 MAI KANG>. La palabra ᨷᩴ᩠᩵ᨾᩣ está codificada como <U+1A37 BA, U+1A74 MAI KANG, U+1A75 TONE-1, U+1A60 SAKOT, U+1A3E MA, U+1A63 SIGN AA>. La palabra ᨲ᩵ᩣᩴ está codificada como <U+1A32 HIGH TA, U+1A75 TONE-1, U+1A63 SIGN AA, U+1A74 MAI KANG>. La combinación de /am/ con SIGN TALL AA está codificada como <U+1A64 SIGN TALL AA, U+1A74 MAI KANG>.

U+1A5A SIGN LOW PA es un caso especial; la palabra tai lue ᨣᨽᩚ ( IPA: [kap phaʔ] ) está codificada como <U+1A23 LOW KA, U+1A3D LOW PHA, U+1A5A SIGN LOW PA>. [3] : Sección 4 

Ejemplos que muestran mai kang lai y la tang lai:

La palabra pali ᩈᩘᨥᩮᩣ (saṅgho) está codificada <U+1A48 SA, U+1A58 MAI KANG LAI, U+1A25 LOW KHA, U+1A6E SIGN E, U+1A63 SIGN AA>.
La palabra del norte de Tailandia ᨴᩘ᩠ᩃᩣ᩠ᨿ ( pronunciación del norte de Tailandia: [taŋ laːi] ) está codificada <U+1A34 LOW TA, U+1A58 MAI KANG LAI, U+1A60 SAKOT, U+1A43 LA, U+1A63 SIGN AA, U+1A60 SAKOT , U+1A3F BAJO YA>.
La palabra Tai Lue ᨴᩢᩗᩣ ( pronunciación de Tai Lue: [taŋ laːi] ) está codificada <U+1A34 LOW TA, U+1A62 MAI SAT, U+1A57 LA TANG LAI, U+1A63 SIGN AA>.

Enlaces externos

Referencias

  1. ^ "Base de datos de caracteres Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  2. ^ "Versiones enumeradas del estándar Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
  3. ^ abcdefghijklmnopqrst Everson, Michael ; Hosken, Martin; Constable, Peter (21 de marzo de 2007). "Propuesta revisada para codificar la escritura Lanna en el BMP del UCS" (PDF) . Unicode .
  4. ^ ab "Informe de la reunión ad hoc de Tai Tham (WG2 N3379)" (PDF) . Unicode . 22 de enero de 2008.
  5. ^ abc Hosken, Martin (28 de enero de 2008). "Variantes subjuntadas de Tai Tham" (PDF) . Unicode .
  6. ^ Khotsimeuang, Veomany. "Tai Lue: reglas ortográficas complejas: combinaciones gráficas (I)". SEAsite . Consultado el 10 de junio de 2018 .
  7. ^ ab Rungruengsi, Udom (enero de 2004). Diccionario Lanna-tailandés: Edición Maefahluang พจนานุกรมล้านนา ~ ไทย: ฉบับแม่ฟ้าหลวง(en tailandés). Chiang Mai: Universidad de Chiang Mai. ISBN 974-685-175-6.
  8. ^ Leer como COENG, es decir, U+17D2 SIGNO KHMER COENG
  9. ^ "El modelo de codificación para el lanna es similar al de Myanmar y el jemer, utilizando un carácter similar al de CEONG [8] más algunos caracteres consonánticos mediales combinados". [3] : Sección 14