stringtranslate.com

Norma industrial tailandesa 620-2533

La Norma Industrial Tailandesa 620-2533 , comúnmente conocida como TIS-620 , es el conjunto de caracteres y la codificación de caracteres más comunes para el idioma tailandés . [ cita requerida ] La norma es publicada por el Instituto de Normas Industriales Tailandeses (TISI), un órgano del Ministerio de Industria bajo el Gobierno Real de Tailandia, y es la única norma oficial para la codificación del tailandés en Tailandia .

El nombre descriptivo del estándar es "Estándar para códigos de caracteres tailandeses para computadoras" (tailandés: ิวเตอร์). "2533" se refiere al año 2533 de la Era Budista (1990), año en que se publicó la versión actual de la norma; una revisión anterior, TIS 620-2529 (1986), ya está obsoleta. El diseño de la página de códigos es el mismo entre las dos ediciones. [1]

TIS-620 es el nombre de conjunto de caracteres preferido por la IANA para TIS-620, y ese nombre de conjunto de caracteres también se utiliza para ISO/IEC 8859-11 (que agrega un carácter de espacio sin interrupción en 0xA0, que no está asignado en TIS-620). Cuando se utiliza el nombre de la IANA, los códigos se complementan con los códigos de control C0 y C1 de ISO/IEC 6429 .

Estructura

TIS-620 es un conjunto de caracteres nacionales ASCII extendidos estructurado convencionalmente que conserva la compatibilidad total con ASCII de 7 bits y utiliza el rango de 8 bits hexadecimal A1 a FB para codificar el alfabeto tailandés . Debido a la naturaleza compleja de combinación de las vocales y diacríticos tailandeses, TIS-620 está destinado únicamente al intercambio de información y se requiere un motor de visualización adicional para componer los caracteres correctamente.

Variantes

En 2001 se adoptó una versión casi idéntica de TIS-620, con la denominación ISO/IEC 8859-11 , con la única diferencia de que la norma ISO/IEC 8859-11 define el hexadecimal A0 como un espacio indivisible , mientras que la norma TIS-620 lo deja sin definir, pero lo reserva. (En la práctica, esta pequeña distinción suele ignorarse).

El conjunto ISO/IEC 8859-11 también ha sido registrado como ISO-IR-166 por Ecma International , pero esta variación agrega códigos de escape explícitos para señalar el comienzo y el final de las secuencias de caracteres tailandeses.

El orden de caracteres TIS-620 se ha utilizado básicamente tal como está en Unicode ( ISO/IEC 10646 ). El bloque tailandés de Unicode es U+0E01 a U+0E7F, y los caracteres tailandeses TIS-620 se pueden convertir a UTF-16 simplemente anteponiendo cada byte con 0E y restando el valor hexadecimal A0.

Conjunto de caracteres

En la tabla anterior, 20 es el carácter ESPACIO habitual. Los valores de código 00-1F, 7F, 80-9F, A0, DB-DE y FC-FF no están asignados a caracteres por TIS-620.

Los valores de código D1, D4-DA, E7-EE son caracteres combinados .

Lectura adicional

Referencias

  1. ^ Meru, Ibrahim (3 de diciembre de 1996). "Re: Estándares de codificación tailandeses". Archivo de listas de correo Unicode .
  2. ^ Leisher, Mark (6 de marzo de 1998), TCCII 2533 1009 / TIS 620 tailandés, TIS620.TXT

Enlaces externos