stringtranslate.com

Forma variante (Unicode)

Una forma variante es un glifo diferente para un carácter, codificado en Unicode mediante el mecanismo de secuencias de variación : secuencias en Unicode que constan de un carácter base seguido de un carácter selector de variación .

Una forma variante suele tener una apariencia y un significado muy similares a los de su forma base. El mecanismo está destinado a formas variantes donde, generalmente, si la forma variante no está disponible, mostrar el carácter base no cambia el significado del texto y es posible que muchos lectores ni siquiera lo noten.

Unicode define dos tipos de secuencias de variación:

Los caracteres del selector de variación residen en varios bloques Unicode:

Los selectores de variación no son necesarios para los caracteres cursivos árabes y latinos, donde la sustitución de glifos puede ocurrir según el contexto: los glifos pueden conectarse entre sí dependiendo de si el carácter es el carácter inicial de una palabra, el carácter final, un carácter medial o un carácter aislado. personaje. Estos tipos de sustitución de glifos se manejan fácilmente mediante el contexto del carácter sin ninguna otra entrada de autor involucrada. Los autores también pueden utilizar caracteres de propósito especial, como los que se unen y los que no se unen, para forzar una forma alternativa de glifo donde de otro modo no aparecería. Las ligaduras son casos similares en los que los glifos se pueden sustituir simplemente activando o desactivando las ligaduras como atributo de texto enriquecido .

Para otras sustituciones de glifos, es posible que sea necesario codificar la intención del autor con el texto y no se puede determinar contextualmente. Este es el caso de los caracteres/glifos denominados gaiji , donde se utilizan diferentes glifos para el mismo carácter, ya sea históricamente o como ideogramas de apellidos. Ésta es una de las áreas grises a la hora de distinguir entre un glifo y un carácter: si un apellido difiere ligeramente del carácter ideográfico del que deriva, ¿es entonces una variante simple de un glifo o una variante de carácter?

Las sustituciones de caracteres también pueden ocurrir fuera de Unicode, por ejemplo con etiquetas de diseño OpenType . [4]

Bloques con secuencias de variación estandarizadas.

A partir de la versión 15.1 de Unicode, las secuencias de variación estandarizadas específicamente para la presentación de emoji/texto se definen para caracteres base en veinte bloques: [1]

Otras secuencias de variación estandarizadas se forman con caracteres básicos en los siguientes catorce bloques: [1]

Bloques con secuencias de variación ideográfica

A partir del 13 de septiembre de 2022 , las secuencias de variación ideográfica están definidas para los personajes base en nueve bloques: [2] [3]

Ver también

Referencias

  1. ^ abc "UCD: secuencias de variación estandarizadas". Consorcio Unicode.
  2. ^ ab "Base de datos de variaciones ideográficas". Consorcio Unicode.
  3. ^ ab "UTS #37, base de datos de variaciones ideográficas Unicode". Consorcio Unicode.
  4. ^ "Etiquetas del sistema de idiomas". Microsoft. 30 de septiembre de 2022.