Bloque de caracteres Unicode
El tibetano es un bloque Unicode que contiene caracteres del tibetano, dzongkha y otros idiomas de China, Bután, Nepal, Mongolia, norte de la India, este de Pakistán y Rusia.
Bloquear
Antiguo bloque tibetano
Bloque de caracteres Unicode
El bloque Unicode tibetano es único por haber sido asignado en la versión 1.0.0 con una codificación basada en virama que no podía distinguir correctamente la srog med visible y la consonante conjunta . [nota 1] Esta codificación fue eliminada del Estándar Unicode en la versión 1.0.1 en el proceso de unificación con ISO 10646 para la versión 1.1, [3] luego reintroducida como una codificación raíz/subunión explícita, con un tamaño de bloque más grande, en la versión 2.0. La Política de estabilidad de Unicode ha prohibido mover o eliminar caracteres existentes para todas las versiones posteriores a Unicode 2.0, por lo que los caracteres tibetanos codificados en Unicode 2.0 y todas las versiones posteriores son inmutables.
El bloque tibetano de Unicode 1.0.0 ha estado ocupado por el bloque birmano desde Unicode 3.0. En Microsoft Windows , los datos de intercalación que hacen referencia al antiguo bloque tibetano se mantuvieron hasta Windows XP y se eliminaron en Windows 2003. [ 4]
Historia
Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definición de caracteres específicos en el bloque tibetano:
Notas al pie
- ^ En la mayoría de las codificaciones índicas Unicode, aunque se puede forzar al sistema a mostrar una halanta visible mediante el uso del no conector de ancho cero (ZWNJ) o forzar el uso de una forma de unión no conjunta mediante el conector de ancho cero (ZWJ), no existe ningún método para forzar la representación de una consonante conjunta, lo cual es crucial al escribir en tibetano. Existen algunas excepciones: por ejemplo, el cingalés utiliza ZWJ para forzar una consonante conjunta.
Referencias
- ^ "Base de datos de caracteres Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
- ^ "Versiones enumeradas del estándar Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
- ^ abc "Unicode 1.0.1 Addendum" (PDF) . El estándar Unicode . 1992-11-03 . Consultado el 2016-07-09 .
- ^ Kaplan, Michael (28 de agosto de 2007). "Cada personaje tiene una historia #29: U+1000^H^H^H^H0f40, (LETRA KA TIBETANA o BIRMANA, según cuándo preguntes)". Poniéndolo todo en orden .
- Una inquietud china enviada al Consorcio Unicode que cita el carácter conjunto "སྐྤྵྴྍྐ" (EWTS s+k+p+Sh+sh+x+ka; IAST skpṣśxka), lo que muestra la complejidad de la codificación. (La codificación Devanagari nunca permitió que "ᳵ" se conjugara, es decir, "स्क्प्ष्श्ᳵ्क" no existe).