El método de entrada Cangjie ( método de entrada Tsang-chieh , a veces llamado Changjie , Cang Jie , Changjei [1] o Chongkit ) es un sistema para introducir caracteres chinos en una computadora utilizando un teclado de computadora estándar . En los nombres de archivo y en otros lugares, el nombre Cangjie a veces se abrevia como cj.
El método de entrada fue inventado en 1976 por Chu Bong-Foo , y recibió el nombre de Cangjie (Tsang-chieh), el inventor mitológico del sistema de escritura chino, por sugerencia de Chiang Wei-kuo , el ex Ministro de Defensa de Taiwán . Chu Bong-Foo publicó la patente de Cangjie en 1982, ya que pensó que el método debería pertenecer al patrimonio cultural chino . [2] Por lo tanto, Cangjie se ha convertido en software de código abierto y está en todos los sistemas informáticos que admiten caracteres chinos tradicionales , y se ha ampliado para que Cangjie sea compatible con el conjunto de caracteres chinos simplificados .
Cangjie es el primer método de entrada chino que utiliza el teclado QWERTY . Chu vio que el teclado QWERTY se había convertido en un estándar internacional y, por lo tanto, creyó que la entrada en idioma chino tenía que basarse en él. [3] Otros métodos anteriores utilizan teclados grandes con 40 a 2400 teclas, excepto el método de las cuatro esquinas , que utiliza solo teclas numéricas.
A diferencia del método de entrada Pinyin , Cangjie se basa en el aspecto grafológico de los caracteres: cada unidad gráfica, llamada " radical " (que no debe confundirse con los radicales Kangxi ), está re-emparentada por un componente de carácter básico, 24 en total, cada uno asignado a una tecla de letra particular en un teclado QWERTY estándar . Una función adicional de "carácter difícil" está asignada a la tecla X. Las teclas se clasifican en cuatro grupos, para facilitar el aprendizaje y la memorización. La asignación de códigos a los caracteres chinos se realiza separando los "radicales" constituyentes de los caracteres.
Los componentes básicos de los caracteres del cangjie se denominan "radicales" (字根) o "letras" (字母). Hay 24 radicales pero 26 claves; los 24 radicales (las formas básicas 基本字形) están asociados con aproximadamente 76 formas auxiliares (輔助字形), que en muchos casos son versiones rotadas o transpuestas de componentes de las formas básicas. Por ejemplo, la letra A (日) puede representarse a sí misma, a la ligeramente más ancha曰, o a una rotación de 90° de sí misma. (Para una descripción más completa de las 76 transposiciones y rotaciones que las que se enumeran a continuación, consulte el artículo sobre la entrada del cangjie en Wikilibros en chino).
Las 24 teclas están distribuidas en cuatro grupos:
Las formas auxiliares de cada radical de Cangjie han cambiado ligeramente en las distintas versiones del método Cangjie. Por lo tanto, esta es una de las razones por las que las distintas versiones del método Cangjie no son completamente compatibles.
Chu Bong-Foo ha proporcionado nombres alternativos para algunas letras según sus características. Por ejemplo, la H (竹) también se llama斜, que significa inclinada. Los nombres forman una rima para ayudar a los estudiantes a memorizar las letras, y cada grupo se encuentra en una línea (los sonidos de los caracteres finales se dan entre paréntesis):
El mecanógrafo debe estar familiarizado con varias reglas de descomposición (拆字規則) que definen cómo analizar un carácter para llegar a un código Cangjie.
Las reglas están sujetas a varios principios:
Algunas formas se descomponen siempre de la misma manera, independientemente de que las reglas indiquen que deben descomponerse de esta manera o no. El número de tales excepciones es pequeño:
Algunas formas no se pueden descomponer. Se representan con una X, que es la tecla難en un teclado Cangjie. [4]
Inicialmente, el método de entrada Cangjie no estaba pensado para producir un carácter en ningún conjunto de caracteres . En cambio, era parte de un sistema integrado que constaba de las reglas de entrada Cangjie y una placa controladora Cangjie . Esta placa controladora contiene un firmware generador de caracteres , que genera dinámicamente caracteres chinos a partir de códigos Cangjie cuando se emiten caracteres , utilizando el modo de gráficos de alta resolución del Apple II . En el prefacio del manual del usuario de Cangjie, Chu Bong-Foo escribió en 1982:
[en traducción]
En términos de resultados: Los resultados y los insumos, de hecho, [forman] un todo integrado; no hay razón para que [deban estar] dogmáticamente separados en dos instalaciones diferentes.… Esto es, de hecho, necesario.…
En este sistema primitivo, cuando el usuario escribe "yk", por ejemplo, para obtener el carácter chino文, los códigos Cangjie no se convierten a ninguna codificación de caracteres y se almacena la cadena real "yk". El código Cangjie para cada carácter (una cadena de 1 a 5 letras minúsculas más un espacio) era la codificación de ese carácter en particular.
Una "característica" particular de este sistema primitivo es que, si se le envían palabras en minúscula al azar, el generador de caracteres intentará construir caracteres chinos según las reglas de descomposición de Cangjie, lo que a veces provoca la aparición de caracteres extraños y desconocidos. Esta característica no deseada, la "generación automática de caracteres", se describe en el manual y es responsable de la producción de más de 10.000 de los 15.000 caracteres que el sistema puede manejar. El nombre Cangjie, que evoca la creación de nuevos caracteres, era realmente adecuado para esta versión primitiva de Cangjie.
La presencia del generador de caracteres integrado también explica la necesidad histórica de la existencia de la tecla "X", que se utiliza para la desambiguación de las colisiones de descomposición: como los caracteres se "eligen" cuando se "emiten" los códigos, cada carácter que se pueda mostrar debe tener de hecho una descomposición Cangjie única. No tendría sentido (ni sería práctico) que el sistema ofreciera una selección de caracteres candidatos cuando se muestra un archivo de texto aleatorio, ya que el usuario no sabría cuál de los candidatos es el correcto.
Cangjie fue diseñado para ser un sistema fácil de usar que ayudara a promover el uso de la informática china. Sin embargo, muchos usuarios consideran que Cangjie es difícil de aprender y usar, y que muchas de las dificultades se deben a una instrucción deficiente. [ cita requerida ]
Con suficiente práctica, los usuarios pueden superar los problemas mencionados anteriormente. Los mecanógrafos habituales pueden escribir en chino a una velocidad de 25 caracteres por minuto (cpm), o incluso mejor, utilizando Cangjie, a pesar de tener dificultades para recordar la lista de formas auxiliares o las reglas de descomposición. Se dice que los mecanógrafos experimentados en Cangjie pueden alcanzar una velocidad de mecanografía de 60 cpm a más de 200 cpm. [ cita requerida ]
Según Chen Minzheng, su experiencia docente en la Escuela Primaria Longtian en Taitung en 1990, la velocidad promedio de mecanografía de los niños era de 90 palabras por minuto, y algunos niños incluso alcanzaban más de 130 palabras por minuto. [5] [ se necesita una mejor fuente ]
La descomposición de un carácter depende de un conjunto predefinido de "formas estándar" (標準字形). Sin embargo, como existen muchas variaciones de Cangjie en diferentes países, la forma estándar de un determinado carácter en Cangjie no siempre es la que el usuario ha aprendido antes. Aprender Cangjie implica, por tanto, aprender no sólo el propio Cangjie, sino también formas estándar desconocidas para algunos caracteres. El editor de métodos de entrada (IME) de Cangjie no gestiona los errores en la descomposición, salvo informando al usuario (normalmente mediante un pitido) de que hay un error. Sin embargo, Cangjie está diseñado originalmente para asignar diferentes códigos a diferentes variantes de un carácter. Por ejemplo, en el Cangjie proporcionado en Windows, el código para產es YHHQM, que no corresponde a la forma de este carácter, sino a otra variante,産. Este es un problema resultante de la implementación de Cangjie en Windows. En el Cangjie original,產debería ser YKMHM (la primera parte es文) mientras que産es YHHQM (la primera parte es产).
Los signos de puntuación no se descomponen geométricamente, sino que se les asignan códigos predefinidos que comienzan con ZX seguido de una cadena de tres letras relacionadas con el orden de los caracteres en el código Big5 . (Este conjunto de códigos se agregó a Cangjie en la versión china tradicional de Windows 95. En Windows 3.1, Cangjie no tenía un conjunto de códigos para los signos de puntuación). Por lo tanto, escribir signos de puntuación en Cangjie se convierte en un ejercicio frustrante que implica memorización o selección. Sin embargo, esto se soluciona en los sistemas modernos mediante el acceso a un teclado virtual en pantalla (en Windows, esto se activa presionando Ctrl + Alt + tecla de coma).
Entre los errores más comunes se encuentran los códigos que no se consideran alternativos. Por ejemplo, si uno no descompone方de arriba a abajo en YHS, sino que escribe YSH según el orden de los trazos, Cangjie no devuelve el carácter方como una opción.
Dado que Cangjie requiere las 26 teclas del teclado QWERTY , no se puede utilizar para ingresar caracteres chinos en teléfonos con funciones básicas, que solo tienen un teclado de 12 teclas . En su lugar, se utilizan métodos de ingreso alternativos, como Zhuyin , 5 trazos (o 9 trazos en el caso de Motorola ) y el método de ingreso Q9 .
Se dice comúnmente que el método de entrada Cangjie ha pasado por cinco generaciones (comúnmente denominadas "versiones" en inglés), cada una de las cuales es ligeramente incompatible con las demás. Actualmente, la versión 3 (第三代倉頡) es la más común y soportada de forma nativa por Microsoft Windows . La versión 5 (第五代倉頡), soportada por Free Cangjie IME y anteriormente la única Cangjie soportada por SCIM , representa un método minoritario significativo y es soportada por iOS .
El primer sistema Cangjie compatible con la tarjeta Zero One en Apple II fue la versión 2; la versión 1 nunca se lanzó.
El método de entrada Cangjie compatible con el sistema operativo Mac clásico se parece tanto a la versión 3 como a la versión 5.
La versión 5, al igual que el método de entrada Cangjie original, fue creada directamente por Chu. Él esperaba que el lanzamiento de la versión 5, originalmente prevista como versión 6, pusiera fin a las "más de diez versiones del método de entrada Cangjie" (versiones ligeramente incompatibles creadas por diferentes proveedores).
La versión 6 aún no se ha lanzado al público, pero se está utilizando para crear una base de datos que pueda almacenar con precisión todos los textos históricos chinos.
La mayoría de las implementaciones modernas de los editores de métodos de entrada (IME) de Cangjie brindan varias funciones convenientes:
Además de la tecla comodín, muchas de estas funciones son convenientes para usuarios ocasionales pero no son adecuadas para quienes mecanografían sin mirar el teclado porque hacen que el IME de Cangjie sea impredecible.
También ha habido varios intentos de "simplificar" Cangjie de una forma u otra:
Muchos investigadores han analizado formas de descomponer los caracteres chinos en sus componentes principales y han intentado crear aplicaciones basadas en el sistema de descomposición. La idea puede denominarse el estudio de los genes de los caracteres chinos La Academia Sinica en Taiwán [6] y la Universidad Jiaotong en Shanghái [7] también tienen proyectos similares.
. Los códigos Cangjie ofrecen una base para tal esfuerzo.Una aplicación directa del uso de caracteres descompuestos es la posibilidad de calcular las similitudes entre diferentes caracteres chinos. [8] El método de entrada Cangjie ofrece un buen punto de partida para este tipo de aplicación. Al relajar el límite de cinco códigos para cada carácter chino y adoptar códigos Cangjie más detallados, se pueden encontrar caracteres visualmente similares mediante cálculo. La integración de esto con la información de pronunciación permite el aprendizaje asistido por computadora de caracteres chinos. [9]
[Traducción]
Esto no es un problema, también existen formas auxiliares para complementar las deficiencias de los radicales. Las formas auxiliares son variaciones de la forma de los radicales, [y por lo tanto] fáciles de recordar.
[Traducción]
El diccionario adjunto [a este libro] se basa en los 4800 caracteres estándar de uso común establecidos por el Ministerio de Educación. Si a esto le sumamos los caracteres generados automáticamente, el número de caracteres es de aproximadamente 15 000 (tomando como base el diccionario Kangxi).