Los ideogramas de compatibilidad CJK son un bloque Unicode creado para contener principalmente caracteres Han que se codificaron en varias ubicaciones en otras codificaciones de caracteres establecidas, además de sus asignaciones de ideogramas unificados CJK , con el fin de mantener la compatibilidad de ida y vuelta entre Unicode y esas codificaciones. Sin embargo, también contiene 12 ideogramas unificados provenientes de conjuntos de caracteres japoneses de IBM .
El bloque tiene docenas de secuencias de variaciones ideográficas registradas en la base de datos de variaciones ideográficas Unicode (IVD). [4] [5] Estas secuencias especifican la variante de glifo deseada para un carácter Unicode determinado.
Las fuentes de la colección original de ideogramas de compatibilidad CJK incluyen:
En versiones posteriores del estándar, se han agregado más caracteres al bloque:
El EBCDIC japonés de doble byte de IBM incluye varios kanji que no existen en JIS X 0208 o que no tienen un enlace de ida y vuelta desde esta norma . Estos se incluyeron como gaiji en las extensiones de Shift JIS y EUC-JP de IBM (por ejemplo, la página de códigos 942 ), NEC , la Open Software Foundation y Microsoft (por ejemplo, la página de códigos de Windows 932 ). Sin embargo, no se utilizaron como fuente para el Repertorio y ordenación unificados (URO) originales. En su lugar, 32 de los kanji de extensión de IBM, aquellos que no se habían incluido en el URO de otras fuentes, se incluyeron en el bloque de ideogramas de compatibilidad CJK en el rango U+FA0E–U+FA2D.
De estos 32 personajes:
Unified_Ideograph
propiedad y que no cambian con la normalización). A pesar de su inclusión en el bloque de ideogramas de compatibilidad CJK y de que sus nombres de caracteres generados algorítmicamente comienzan con " CJK COMPATIBILITY IDEOGRAPH
", no son duplicados de caracteres del bloque de ideogramas unificados CJK original en ningún sentido; [6] [7] 11 de estos 12 son completamente no duplicados, mientras que U+FA23﨣CJK COMPATIBILITY IDEOGRAPH-FA23 se duplicó posteriormente de forma involuntaria en la extensión B de ideogramas unificados CJK como U+27EAF 𧺯 CJK UNIFIED IDEOGRAPH-27EAF . Son los siguientes: Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definición de caracteres específicos en el bloque de ideogramas de compatibilidad CJK:
Estos 12 caracteres son ideogramas CJK unificados, no ideogramas de compatibilidad, a pesar de sus nombres.