stringtranslate.com

Variante Z

En Unicode , se dice que dos glifos son variantes Z (a menudo escritos zVariants ) si comparten la misma etimología pero tienen apariencias ligeramente diferentes y diferentes puntos de código Unicode . Por ejemplo, los caracteres Unicode U+8AAA說 y U+8AAC説 son variantes Z. La noción de variación Z solo se aplica a los " códigos de escritura CJKV " (chino, japonés, coreano y vietnamita) y es un subtema de la unificación Han .

Diferencias en el eje Z

La filosofía Unicode de asignación de puntos de código para los idiomas CJK se organiza a lo largo de tres " ejes ". El eje X representa las diferencias en semántica; por ejemplo, la A mayúscula latina ( U+0041 A) y la alfa mayúscula griega ( U+0391 Α) están representadas por dos puntos de código distintos en Unicode, y podrían denominarse "variantes X" (aunque este término no es común). El eje Y representa diferencias significativas en apariencia, aunque no en semántica; por ejemplo, el carácter chino tradicional māo "gato" ( U+8C93貓) y el carácter chino simplificado ( U+732B猫) son variantes Y. [1]

El eje Z representa diferencias tipográficas menores. Por ejemplo, los caracteres chinos ( U+838A莊) y ( U+8358荘) son variantes Z, al igual que ( U+8AAA說) y ( U+8AAC説). El glosario de Unicode.org define "variante Z" como "Dos ideogramas unificados del CJK con semántica idéntica y formas unificables", [1] donde "unificable" se toma en el sentido de unificación Han.

Por lo tanto, si la unificación Han hubiera tenido un éxito perfecto, las variantes Z no existirían. Existen en Unicode porque se consideró útil poder realizar un "viaje de ida y vuelta" de documentos entre Unicode y otras codificaciones CJK como Big5 y CCCII . Por ejemplo, el carácter 莊 tiene una codificación CCCII de 21552D, mientras que su variante Z 荘 tiene una codificación CCCII de 2D552D. Por lo tanto, a estas dos variantes se les asignaron puntos de código Unicode distintos, de modo que la conversión de un documento CCCII a Unicode y viceversa fuera una operación sin pérdidas .

Confusión

Existe cierta confusión sobre la definición exacta de "variante Z". Por ejemplo, en un borrador de Internet (de RFC  3743) fechado en 2002, [2] se encuentran "no" ( U+4E0D不) y ( U+F967不︀) descritos como "variantes de fuente", estando el término "variante Z" aparentemente reservado para pares interlingüísticos como el chino mandarín "conejo" ( U+5154兔) y el japonés to "conejo" ( U+514E兎). Sin embargo, la base de datos Unihan del Consorcio Unicode [3] [ verificación fallidaver discusión ] trata ambos pares como variantes Z.

Véase también

Referencias

  1. ^ ab "Glosario". www.unicode.org .
  2. ^ Huang, K.; Ko, Y.; Konishi, K.; Qian, H. (abril de 2004). "Directrices del Equipo de Ingeniería Conjunta (JET) para el registro y la administración de nombres de dominio internacionalizados (IDN) para chino, japonés y coreano". tools.ietf.org .
  3. ^ "Búsqueda en la base de datos Unihan". www.unicode.org .