El conector de grafemas combinatorios (CGJ), U+034F ͏ COMBINING GRAPHEME JOINER es un carácter Unicode que no tiene glifo visible y que las aplicaciones pueden ignorar de forma predeterminada. Su nombre es inapropiado y no describe su función: el carácter no une grafemas . [1] Su propósito es separar semánticamente caracteres que no deberían considerarse dígrafos , así como bloquear la reordenación canónica de las marcas de combinación durante la normalización .
Por ejemplo, en un contexto de lengua húngara , las letras adyacentes c y s normalmente se considerarían equivalentes al dígrafo cs . Si están separadas por el CGJ, se considerarán como dos grafemas separados. Sin embargo, a diferencia del conector de ancho cero y caracteres similares, el CGJ no afecta si las dos letras se representan por separado o como una ligadura o unidas en cursiva; el comportamiento predeterminado para esto está determinado por la fuente. [2]
El CGJ también es necesario para escrituras complejas . Por ejemplo, en la mayoría de los casos, el acento de cantilación hebreo meteg debe aparecer a la izquierda del punto vocálico y, por defecto, la mayoría de los sistemas de visualización lo reproducirán así incluso si se escribe antes de la vocal. Pero en algunas palabras del hebreo bíblico, el meteg aparece a la derecha de la vocal y, para indicarle al motor de visualización que lo reproduzca correctamente a la derecha, se debe escribir CGJ entre el meteg y la vocal. Comparar:
En el caso de varios diacríticos combinatorios consecutivos , una CGJ intermedia indica que no deben estar sujetos a reordenamiento canónico. [2]
Por el contrario, el " no-joiner de ancho cero " (a U+200C en el rango de puntuación general ) evita que dos caracteres adyacentes se transformen en una ligadura.