stringtranslate.com

Norma industrial tailandesa 620-2533

El estándar industrial tailandés 620-2533 , comúnmente conocido como TIS-620 , es el conjunto de caracteres y la codificación de caracteres más común para el idioma tailandés . [ cita necesaria ] El estándar es publicado por el Instituto Tailandés de Estándares Industriales (TISI), un órgano del Ministerio de Industria dependiente del Gobierno Real de Tailandia, y es el único estándar oficial para codificar tailandés en Tailandia .

El nombre descriptivo del estándar es "Estándar para códigos de caracteres tailandeses para computadoras" (tailandés: ิวเตอร์). "2533" se refiere al año 2533 de la Era Budista (1990), año en que se publicó la versión actual de la norma; una revisión anterior, TIS 620-2529 (1986), ya está obsoleta. El diseño de la página de códigos es el mismo entre las dos ediciones. [1]

TIS-620 es el nombre de juego de caracteres preferido de la IANA para TIS-620, y ese nombre de juego de caracteres también se usa para ISO/IEC 8859-11 (que agrega un carácter de espacio sin interrupciones en 0xA0, que no está asignado en TIS-620). Cuando se utiliza el nombre de IANA, los códigos se complementan con los códigos de control C0 y C1 de ISO/IEC 6429 .

Estructura

TIS-620 es un conjunto de caracteres nacionales ASCII extendido estructurado convencionalmente que conserva total compatibilidad con ASCII de 7 bits y utiliza el rango hexadecimal de 8 bits A1 a FB para codificar el alfabeto tailandés . Debido a la compleja naturaleza de combinación de las vocales y los signos diacríticos tailandeses, TIS-620 está diseñado para el intercambio de información únicamente y se requiere un motor de visualización adicional para componer los caracteres correctamente.

Variantes

Se adoptó una versión casi idéntica de TIS-620 como ISO/IEC 8859-11 en 2001, con la única diferencia de que ISO/IEC 8859-11 define el hexadecimal A0 como un espacio sin ruptura , mientras que TIS-620 lo deja sin definir pero reservado. (En la práctica, esta pequeña distinción suele ignorarse).

El conjunto ISO/IEC 8859-11 también ha sido registrado como ISO-IR-166 por Ecma International , pero esta variación agrega códigos de escape explícitos para señalar el principio y el final de secuencias de caracteres tailandeses.

El orden del juego de caracteres TIS-620 también se ha utilizado esencialmente tal como está dentro de Unicode ( ISO/IEC 10646 ). El bloque tailandés de Unicode es U+0E01 a U+0E7F, y los caracteres tailandeses TIS-620 se pueden convertir a UTF-16 simplemente anteponiendo cada byte con 0E y restando el hexadecimal A0 del valor.

conjunto de caracteres

En la tabla anterior, 20 es el carácter ESPACIO normal. Los valores de código 00-1F, 7F, 80-9F, A0, DB-DE y FC-FF no están asignados a caracteres por TIS-620.

Los valores de código D1, D4-DA, E7-EE son caracteres combinados .

Lectura adicional

Referencias

  1. ^ Meru, Ibrahim (3 de diciembre de 1996). "Re: estándares de codificación tailandeses". Archivo de lista de correo Unicode .
  2. ^ Leisher, Mark (6 de marzo de 1998), TCCII 2533 1009 / TIS 620 tailandés, TIS620.TXT

Enlaces externos