stringtranslate.com

Extensión I de los ideogramas unificados del CJK

La Extensión I de Ideogramas Unificados CJK es un bloque Unicode que comprende los ideogramas unificados CJK incluidos en los borradores de una enmienda al estándar GB 18030 de China circulados en 2022 y 2023, que se incorporaron rápidamente a Unicode en 2023.

Fondo

A diferencia de la mayoría de los demás conjuntos de ideogramas unificados del CJK, la Extensión I no fue preparada ni presentada por el Grupo de Investigación Ideográfica (GRI). [3]

GB 18030 es un estándar nacional obligatorio de la República Popular China (RPC). Define un formato de transformación Unicode que conserva la compatibilidad con los datos existentes en las codificaciones de caracteres GBK y EUC-CN anteriores , y especifica caracteres Unicode particulares que los dispositivos vendidos en China deben admitir. [4] Su edición de 2022, GB 18030-2022 , modificó una serie de caracteres obligatorios para asignarlos a puntos de código Unicode estándar , en lugar de a puntos de código de área de uso privado .

A finales de 2022, la República Popular de China puso a disposición del público un borrador de una nueva enmienda que se introduciría en la norma GB 18030. Este borrador habría colocado 897 nuevos caracteres sinográficos en el plano 10 ( hexadecimal : 0A), un plano Unicode astral aún sin título . [5] Esto estuvo motivado por una "fuerte necesidad de certificación del nombre real de los ciudadanos en China". [6] Dado que afectaría a la norma ISO/IEC 10646 (el conjunto de caracteres codificados universales, la norma ISO sincronizada con Unicode), el borrador se distribuyó en ISO/IEC JTC 1/SC 2 , el subcomité ISO responsable de la norma ISO 10646. El organismo nacional chino sostuvo que "la norma ISO/IEC 10646 no especifica el propósito del plano 0A", que la norma ISO 10646 denota como "reservado para una futura normalización", y que, por lo tanto, este uso "no era inapropiado". [5]

Sin embargo, dado que la intención de la norma ISO 10646 era que el Plano 10 se reservara para una asignación futura por parte de la ISO 10646 y Unicode a través de su proceso de votación habitual, no que lo asignaran unilateralmente los organismos nacionales de normalización, esta medida propuesta fue criticada por expertos y otros organismos nacionales como una que "desestabilizaría la sincronización" entre GB 18030 e ISO/IEC 10646 (y, por lo tanto, Unicode), y que haría imposible cumplir con ambos con una única implementación, [5] bifurcando efectivamente Unicode. En su reunión de marzo de 2023, el IRG enfatizó la importancia de proporcionar cualquier borrador de enmienda posterior a GB 18030 a los expertos del IRG de manera oportuna, y de no "utilizar la norma ISO/IEC 10646 de manera inapropiada". [7]

Como alternativa, el repertorio (finalmente reducido a 622 caracteres después de una revisión de expertos) fue incorporado rápidamente a la versión Unicode 15.1 en septiembre de 2023, como el bloque CJK Unified Ideographs Extension I. [5] Los caracteres constituyen la fuente Unihan "GIDC23" , [8] definida como obtenida del "Sistema de identificación del Ministerio de Seguridad Pública de China, 2023". [9] El bloque CJK Unified Ideographs Extension D fue citado como precedente, ya que comprendía un repertorio de caracteres urgentemente necesarios (UNC) de los organismos miembros del IRG, mientras que el conjunto de trabajo del IRG inicialmente programado para convertirse en Extension D se convertiría en Extension E. [ 10] Para compacidad, el bloque se asignó al espacio disponible en el Plano ideográfico suplementario después de CJK Unified Ideographs Extension F , en lugar de en el Plano ideográfico terciario después de CJK Unified Ideographs Extension H ; Esto significa que los bloques de extensión CJK ya no están en orden alfabético por letra de extensión. [11] Después de esto, el borrador de la enmienda GB 18030 se modificó para utilizar los puntos de código de Extensión I. [6]

En su próxima reunión en octubre de 2023, el IRG expresó su preocupación por eludir al IRG para grandes colecciones de caracteres CJK, y señaló que dos de los caracteres de la Extensión I, para los fines de las fuentes de caracteres de otras regiones, se habían unificado previamente con caracteres existentes bajo las reglas de unificación del IRG: [3] [12]

En respuesta, el IRG recomendó que, en el futuro, quienes propongan caracteres CJK proporcionen información sobre el impacto que tendrían en otras fuentes de caracteres CJK las desunificaciones propuestas en sus propuestas, y que se le dé tiempo al IRG para revisar todas las propuestas de gran tamaño de caracteres CJK. El IRG alentó al organismo chino a proponer soluciones a los problemas causados ​​por la adición de estos dos caracteres en la próxima reunión del IRG. [3]

Bloquear

Historia

Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definición de caracteres específicos en el bloque I de extensión de ideogramas unificados de CJK:

Referencias

  1. ^ "Base de datos de caracteres Unicode". El estándar Unicode . Consultado el 12 de septiembre de 2023 .
  2. ^ "Versiones enumeradas del estándar Unicode". El estándar Unicode . Consultado el 12 de septiembre de 2023 .
  3. ^ abc Ideographic Research Group (2023-10-20). "Recomendación IRG M61.12: Emisión de la Extensión I a otros caracteres fuente CJK (IRGN2635 y comentarios, IRGN2622)" (PDF) . Recomendaciones y acciones de la reunión n.° 61 del IRG . ISO/IEC JTC1/SC2 N4885, WG2 N5243, IRG N2620; UTC L2/23-250.
  4. ^ Kaplan, Michael S (28 de marzo de 2013). "Usted lo llama GB18030, yo lo llamo UTF-GBK..." Poniéndolo todo en orden .
  5. ^ abcd Organismo nacional de los Estados Unidos (1 de mayo de 2023). "Comentarios del USNB sobre el borrador 2 de la enmienda 1 de GB 18030-2022 y recomendaciones para la enmienda 2 de ISO/IEC 10646:2020" (PDF) . ISO/IEC JTC1/SC2 N4852, WG2 N5222; UTC L2/23-115.
  6. ^ ab Organismo Nacional de China (13 de octubre de 2023). "Informe de actividad del IRG n.° 61" (PDF) . ISO/IEC JTC1/SC2 /WG2/ IRG N2623; UTC L2/23-240.
  7. ^ Ideographic Research Group (24 de marzo de 2023). "Recomendación IRG M60.7: Comentarios sobre la enmienda del borrador GB18030-2022 (IRGN2591, IRGN2605)" (PDF) . Recomendaciones y acciones de la reunión n.° 60 del IRG . ISO/IEC JTC1/SC2 N4840, WG2 N5205, IRG N2600; UTC L2/23-087.
  8. ^ "CJK Unified Ideographs Extension I" (PDF) . El estándar Unicode, versión 15.1 . Consorcio Unicode . 2023.
  9. ^ Lunde, Ken ; Cook, Richard, eds. (1 de septiembre de 2023). "kIRG_GSource". Base de datos Unicode Han (Unihan) . Unicode 15.1.0. UAX #38.
  10. ^ Lunde, Ken (22 de abril de 2023). "03) L2/23-100: GB 18030-2022 Enmienda, Borrador 2 + Disposición de comentarios, Borrador 1" (PDF) . Recomendaciones del CJK y el Grupo Unihan para la reunión UTC n.° 175 . UTC L2/23-082.
  11. ^ "Cambios en CJK/Unihan". Unicode 15.1.0. Consorcio Unicode . 12 de septiembre de 2023. Para mantener los rangos de bloques CJK lo más compactos posible, se agregó la Extensión I al Plano 2, en lugar de directamente después de la Extensión H en el Plano 3. Los implementadores también deben verificar que su código no asuma que todas las extensiones CJK aparecen en orden alfabético por la letra de la extensión.
  12. ^ abc Sim, Cheon-hyeong (17 de mayo de 2023). "2. Caracteres semiduplicados recién introducidos" (PDF) . Solicitud de extensiones horizontales de múltiples fuentes en CJK-ExtI . págs. 3–5. ISO/IEC JTC1/SC2 /WG2/ IRG N2635.(Nota: el documento referenciado se refiere a un borrador anterior de la Extensión I con puntos de código que difieren de los de la versión final aceptada en Unicode. U+2ED90 en el documento referenciado corresponde a U+2ED9D 𮶝 <reserved-2ED9D> en la versión final, mientras que U+2EDD1 en el documento referenciado corresponde a U+2EDE0 𮷠 <reserved-2EDE0> en la versión final).
  13. ^ "Ideogramas unificados del CJK" (PDF) . El estándar Unicode, versión 15.0 . Consorcio Unicode . pág. 823.
  14. ^ Organismo Nacional de Japón (24 de abril de 2023). "Archivo de datos WG2 n5221: Propuesta de extensión horizontal" (PDF) . Solicitud de extensión horizontal en la columna J de ISO/IEC 10646 (PDF) . pág. 414. ISO/IEC JTC1/SC2 /WG2 N5221; UTC L2/23-144.
  15. ^ Organismo Nacional de Japón (24 de abril de 2023). "Archivo de datos WG2 n5221: Propuesta de extensión horizontal" (PDF) . Solicitud de extensión horizontal en la columna J de ISO/IEC 10646 (PDF) . pág. 458. ISO/IEC JTC1/SC2 /WG2 N5221; UTC L2/23-144.
  16. ^ Suignard, Michel, ed. (3 de enero de 2024). "Disposición de los comentarios sobre CDAM2.3 a la sexta edición de ISO/IEC 10646" (PDF) . ISO/IEC JTC1/SC2 /WG2 N5245, UTC L2/24-016.

Lectura adicional