stringtranslate.com

Forma variante (Unicode)

Una forma variante es un glifo alternativo para un carácter, codificado en Unicode a través del mecanismo de secuencias de variación : secuencias en Unicode que constan de un carácter base seguido de un carácter selector de variación .

Una forma variante suele tener una apariencia y un significado muy similares a su forma básica. El mecanismo está pensado para formas variantes en las que, por lo general, si la forma variante no está disponible, mostrar el carácter básico no cambia el significado del texto y puede que ni siquiera sea perceptible para muchos lectores.

Unicode define dos tipos de secuencias de variación:

Los caracteres del selector de variación residen en varios bloques Unicode:

Los selectores de variación no son necesarios para los caracteres cursivos árabes y latinos, donde la sustitución de glifos puede ocurrir según el contexto: los glifos pueden estar conectados entre sí dependiendo de si el carácter es el carácter inicial de una palabra, el carácter final, un carácter intermedio o un carácter aislado. Estos tipos de sustitución de glifos se manejan fácilmente mediante el contexto del carácter sin ninguna otra entrada de autor involucrada. Los autores también pueden usar caracteres de propósito especial, como caracteres de unión y no unión, para forzar una forma alternativa de glifo donde de otra manera no aparecería. Las ligaduras son casos similares en los que los glifos pueden sustituirse simplemente activando o desactivando las ligaduras como un atributo de texto enriquecido .

En el caso de otras sustituciones de glifos, es posible que la intención del autor deba codificarse con el texto y no pueda determinarse contextualmente. Este es el caso de los caracteres o glifos denominados gaiji , en los que se utilizan distintos glifos para el mismo carácter, ya sea históricamente o para ideogramas de apellidos. Esta es una de las áreas grises a la hora de distinguir entre un glifo y un carácter: si un apellido difiere ligeramente del carácter ideográfico del que deriva, ¿se trata entonces de una simple variante de glifo o de una variante de carácter?

Las sustituciones de caracteres también pueden ocurrir fuera de Unicode, por ejemplo con etiquetas de diseño OpenType . [4]

Bloques con secuencias de variación estandarizadas

A partir de la versión 16.0 de Unicode, se definen secuencias de variación estandarizadas específicamente para la presentación de emojis/texto para caracteres base en veinte bloques: [1]

Otras secuencias de variación estandarizadas se forman con caracteres base en los siguientes catorce bloques: [1]

Bloques con secuencias de variación ideográfica

A partir del 13 de septiembre de 2022 , se definen secuencias de variación ideográfica para caracteres base en nueve bloques: [2] [3]

Véase también

Referencias

  1. ^ abc "UCD: secuencias de variación estandarizadas". Consorcio Unicode.
  2. ^ ab "Base de datos de variación ideográfica". Consorcio Unicode.
  3. ^ ab "UTS #37, Base de datos de variación ideográfica Unicode". Consorcio Unicode.
  4. ^ "Etiquetas del sistema de lenguaje". Microsoft. 30 de septiembre de 2022.