bloque de caracteres Unicode
Hangul Syllables es un bloque Unicode que contiene bloques de sílabas Hangul precompuestos para el coreano moderno. Las sílabas se pueden asignar directamente mediante un algoritmo a secuencias de dos o tres caracteres en el bloque Hangul Jamo Unicode:
- uno de U+1100–U+1112: las 19 consonantes principales del Hangul moderno jamos;
- uno de U+1161–U+1175: los 21 jamos vocales Hangul modernos;
- ninguno, o uno de U+11A8–U+11C2: los 27 jamos consonantes finales Hangul modernos.
Este bloque está codificado de acuerdo con el orden canónicamente equivalente de estos (dos o tres) jamos (uno en cada subrango de jamos anterior) que componen cada sílaba.
Tenga en cuenta que una sílaba Hangul completa puede incluir uno de estos caracteres, pero puede estar precedida por una o más consonantes iniciales jamos y seguida por uno o más jamos finales (posiblemente precedidos por una o más vocales jamos si la sílaba codificada está compuesta por dos jamos). no incluye ninguna consonante final jamos). Además, es posible que algunas sílabas Hangul no incluyan ninguno de estos caracteres precompuestos. Pero tal extensión de la escritura Hangul (que permite crear sílabas más complejas compuestas en el mismo cuadrado) no es muy común en el coreano moderno.
Bloquear
Historia
La codificación de sílabas hangul en Unicode se complicó por una reorganización de los puntos del código:
- La versión 1.0.0 de Unicode codificó 2350 sílabas hangul coreanas modernas de KS C 5601-1987 en U+3400–U+3D2D. Este rango ahora es parte de la Extensión A de Ideógrafos Unificados de CJK .
- La versión 1.1 agregó 1.930 sílabas modernas adicionales de KS C 5657-1991 en U+3D2E–U+44B7, seis sílabas modernas de GB 12052 -89 en U+44B8–U+44BD, y las primeras 2.370 sílabas que no están en las antes mencionadas. tres sets en U+44BE – U+4DFF. Estos cubren colectivamente el resto de lo que ahora es la Extensión A de Ideógrafos Unificados CJK y todo lo que ahora es Símbolos de Hexagrama Yijing .
- Además, hubo tres errores en Unicode 1.1: [3]
- U+384E: 삤 en la base de datos de caracteres Unicode, pero 삣 en las tablas de códigos Unicode 1.0 e ISO/IEC 10646-1:1993 y según las asignaciones estándar de origen
- U+40BC: 삣 en la base de datos de caracteres Unicode, pero 삤 en las tablas de códigos ISO/IEC 10646-1:1993 y según las asignaciones estándar de origen
- U+436C: 콫 en la base de datos de caracteres Unicode, pero 콪 en las tablas de códigos ISO/IEC 10646-1:1993 y según las asignaciones estándar de origen
- La versión 2.0 agregó las 4516 sílabas posibles restantes de KS C 5601-1992 y reorganizó [4] [5] todas las sílabas codificadas en el rango actual U+AC00–U+D7AF que permite la descomposición algorítmica en jamo individual.
RFC 2279 explica que este importante cambio incompatible se realizó asumiendo que no existían datos o software que usaran Unicode para coreano:
"La justificación oficial para permitir un cambio tan incompatible fue que no existían implementaciones ni datos que contuvieran Hangul, una afirmación que probablemente sea cierta pero que sigue siendo imposible de demostrar. El incidente ha sido apodado el "desastre coreano", y los comités pertinentes se han comprometido Nunca jamás volver a hacer un cambio tan incompatible". — RFC 2279
Posteriormente, Unicode adoptó una política de estabilidad de codificación que establece que "una vez codificado un carácter, no se moverá ni eliminará". [6]
Los siguientes documentos relacionados con Unicode registran el propósito y el proceso de definir caracteres específicos en el bloque de sílabas Hangul:
Referencias
- ^ "Base de datos de caracteres Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
- ^ "Versiones enumeradas del estándar Unicode". El estándar Unicode . Consultado el 26 de julio de 2023 .
- ^ Chung, Jaemin (29 de marzo de 2017). "Documento informativo sobre tres sílabas hangul modernas anteriores a Unicode-2.0" (PDF) .
- ^ Chang, KD; Choi, In Sook; Kim, Jung Ho (4 de octubre de 1995). "Tabla de conversión de codificación Hangul coreano".
- ^ "Notas y correcciones para HANGUL.TXT". 2005-10-13.
- ^ "Políticas de estabilidad de codificación de caracteres Unicode". Consorcio Unicode. 2016-11-14.
Ver también