stringtranslate.com

método wubi

La distribución del teclado del Wubi 98
La distribución del teclado Wubi 86 (más común)
Un teclado QWERTY con componentes Wubi 86

El método de entrada Wubizixing ( chino simplificado :五笔字型输入法; chino tradicional :五筆字型輸入法; pinyin : wǔbǐ zìxíng shūrùfǎ ; literalmente, 'método de entrada del modelo de caracteres de cinco trazos'), a menudo abreviado simplemente como Wubi o Wubi Xing. , [1] es un método de entrada de caracteres chinos principalmente para ingresar texto en chino simplificado y chino tradicional en una computadora. Wubi no debe confundirse con el método Wubihua (五笔画) , que es un método de entrada diferente que comparte la categorización en cinco tipos de trazos.

El método también se conoce como Wang Ma ( chino simplificado :王码; chino tradicional :王碼; pinyin : Wáng mǎ ; literalmente, 'código Wang'), que lleva el nombre del inventor Wang Yongmin (王永民). Hay cuatro versiones de Wubi que se consideran estándar: Wubi 86, Wubi 98, Wubi 18030 y Wubi New-century (la versión de tercera generación). Los tres últimos también se pueden utilizar para introducir texto en chino tradicional , aunque de forma más limitada. Wubi 86 es el método de entrada basado en formas más conocido y utilizado para teclados de letras completas en China continental . Si también es necesario ingresar caracteres chinos tradicionales con frecuencia, otros métodos de entrada como Cangjie o Zhengma pueden ser más adecuados para la tarea, y también es mucho más probable encontrarlos en la computadora que se necesita usar.

El método Wubi se basa en la estructura de los caracteres más que en su pronunciación, lo que permite introducir caracteres incluso cuando el usuario no conoce la pronunciación, además de no estar demasiado vinculado a ninguna variedad hablada de chino en particular . También es extremadamente eficiente: casi todos los caracteres se pueden escribir con un máximo de 4 pulsaciones de teclas. En la práctica, la mayoría de los caracteres se pueden escribir con menos. Hay informes de mecanógrafos experimentados que alcanzan los 160 caracteres por minuto con Wubi. [2] Lo que esto significa en el contexto del chino no es exactamente lo mismo que en inglés, pero es cierto que Wubi es extremadamente rápido cuando lo usa un mecanógrafo experimentado. La razón principal de esto es que, a diferencia de los métodos tradicionales de entrada fonética, no es necesario perder tiempo seleccionando el carácter deseado de una lista de posibilidades homofónicas: prácticamente todos los caracteres tienen una representación única.

Como sugiere su nombre, el teclado está dividido en cinco regiones. El carácter chino 笔 (bǐ), cuando se usa en el contexto de la escritura de caracteres chinos, se refiere a las pinceladas utilizadas en la caligrafía china. A cada región se le asigna un determinado tipo de trazo.

Una desventaja importante de aprender Wubi es su curva de aprendizaje más pronunciada, ya que, al ser un sistema más complejo, lleva más tiempo adquirirlo como habilidad. La memorización y la práctica son factores clave para un uso competente.

Para usar Wubi, hay varios métodos de entrada disponibles, incluidas las herramientas de entrada de Google (utilizadas por Google Translate) y las opciones de teclado en dispositivos Mac. Se pueden buscar secuencias de Wubi para caracteres específicos utilizando diccionarios en línea.

En este artículo, se utilizará la siguiente convención: carácter siempre significará carácter chino, mientras que letra , tecla y pulsación de tecla siempre se referirán a las teclas del teclado.

Cómo funciona

Básicamente, un carácter se divide en componentes, que normalmente (pero no siempre) son los mismos que los radicales . Estos se escriben en el orden en que se escribirían a mano . Para garantizar que los caracteres extremadamente complejos no requieran una cantidad excesiva de pulsaciones de teclas, cualquier carácter que contenga más de 4 componentes se ingresa escribiendo los primeros 3 componentes escritos, seguidos del último. De esta forma, se pueden introducir los datos de cada carácter con no más de 4 pulsaciones.

Wubi distribuye sus caracteres de manera muy uniforme y, como tal, la gran mayoría de los caracteres se definen únicamente mediante las 4 pulsaciones de teclas mencionadas anteriormente. Luego se escribe un espacio para mover el carácter del búfer de entrada a la pantalla. En el caso de que la representación de 4 letras del carácter no sea única, se escribiría un dígito para seleccionar el carácter relevante (por ejemplo, si dos caracteres tienen la misma representación, escribir 1 seleccionaría el primero y 2 el segundo). En la mayoría de las implementaciones, siempre se puede escribir un espacio y simplemente significa 1 en una configuración ambigua. El software inteligente intentará asegurarse de que el carácter en la posición predeterminada sea el deseado.

Muchos personajes tienen más de una representación. Esto a veces es para facilitar su uso, en caso de que haya más de una forma obvia de dividir un personaje. Sin embargo, lo más frecuente es que ciertos caracteres tengan una representación corta de menos de 4 letras, así como una representación "completa".

Para caracteres con menos de 4 componentes que no tienen una representación de formato corto, se escribe cada componente y luego se "rellena" la representación (es decir, se escriben suficientes pulsaciones de teclas adicionales para que la representación tenga 4 pulsaciones de teclas) escribiendo manualmente las pulsaciones del último componente, en el orden en que se escribirían. Si hay demasiados trazos, se deben escribir tantos como sea posible, pero colocar el último trazo al final (esto refleja la regla de componentes para caracteres con más de 4 componentes descrita anteriormente).

Una vez que se comprende el algoritmo, se puede escribir casi cualquier carácter con un poco de práctica, incluso si no lo ha escrito antes. La memoria muscular garantiza que los mecanógrafos frecuentes que utilizan este método no tengan que pensar en cómo se construyen realmente los caracteres, del mismo modo que la gran mayoría de los mecanógrafos ingleses no piensan mucho en la ortografía de las palabras cuando escriben.

Implementación de detalles específicos.

Muchas implementaciones emplean optimizaciones adicionales de varias palabras. Por lo general, un dígrafo de uso común (palabra de dos caracteres) en el que ambos caracteres tienen representaciones cortas de dos pulsaciones de teclas se puede combinar en una única representación de cuatro pulsaciones de teclas que genera dos caracteres en lugar de uno. También hay algunos atajos de 3 caracteres , e incluso uno bastante más largo y políticamente motivado. [ se necesita aclaración ] Algunos ejemplos de estos se proporcionan en la sección de ejemplos a continuación.

Otra característica común es el uso de la tecla 'z' como comodín. En realidad, el método Wubi se diseñó teniendo en cuenta esta característica; es por eso que no se asignan componentes a la tecla z. Básicamente, uno puede escribir az cuando no está seguro de cuál debería ser el componente, y el método de entrada ayudará a completarlo. Si uno sabía, por ejemplo, que el carácter debería comenzar con "kt", pero no estaba seguro de cuál debería ser el siguiente componente, escribir "ktz" produciría una lista de todos los caracteres que comienzan con "kt". Sin embargo, en la práctica, muchos motores de métodos de entrada utilizan un método de búsqueda tabular para todos los sistemas de entrada basados ​​en tablas, incluido Wubi. Esto significa que simplemente tienen una gran tabla en la memoria, asociando diferentes personajes a sus respectivas representaciones. El método de entrada simplemente se convierte en una búsqueda en una tabla. En tal implementación, la tecla z rompe el paradigma y, como tal, no se encuentra en mucho software generalizado (aunque el método de entrada Wubi que se encuentra comúnmente en Windows chino implementa la característica). Por esta misma razón, la optimización de múltiples caracteres descrita en el párrafo anterior también es relativamente rara.

Algunos métodos de entrada, como xcin (que se encuentra en muchos sistemas tipo UNIX), proporcionan una funcionalidad de comodín genérica que se puede utilizar en todos los sistemas de entrada basados ​​en tablas, incluido pinyin y prácticamente cualquier otra cosa. Xcin usa '*' para autocompletar y '?' por solo una letra, siguiendo las convenciones iniciadas en la globalización de archivos UNIX. Otras implementaciones tienen sus propias convenciones.

Subdivisión del teclado

El teclado Wubi asume un diseño similar al QWERTY , por lo que los usuarios de teclados que implementan un diseño nacionalizado o alternativo (como el Dvorak o el AZERTY francés ) probablemente tendrán que hacer algunas reasignaciones para que el sistema sea cuerdo. Wubi no coloca sus componentes de forma arbitraria: hay demasiados y sólo con la introducción de una metodología lógica el sistema se vuelve fácil de aprender.

Básicamente, el teclado está dividido en 5 zonas, cada una de las cuales representa un trazo. Esos cinco trazos son caída hacia la izquierda, caída hacia la derecha, horizontal, vertical y gancho, y las zonas que los representan son QWERT, YUIOP, ASDFG, HJKLM y XCVBN, respectivamente. Todas estas zonas están dispuestas horizontalmente, a excepción de la M, que no está en línea con el resto de letras de su zona.

De manera general, se puede pensar que el teclado está dividido por el centro, entre T e Y, G y H, y N y M. Las teclas de cada zona están numeradas alejándose de esta línea divisoria: por lo que en realidad deberíamos decir que en zona QWERT, T es la primera letra, R es la segunda y E la tercera; en la zona YUIOP, Y es el primero, U es el segundo, I el tercero, etc. Para XCVBN, N es el primero, y así sucesivamente. En HJKLM, considere que M es el último de la serie, aunque no se encuentre en la línea.

Esto es importante porque los componentes de la primera posición tendrán una repetición del trazo en cuestión (el trazo asignado a la zona a la que pertenecen), los de la segunda, dos, los de la tercera, tres. Aquellos componentes que no sean fácilmente clasificables según este paradigma se colocarán en la última letra.

Por lo tanto, uno esperaría que 一 estuviera ubicado en G, y 二 en F, y 三 en D, y de hecho, este es el caso. De manera similar, uno esperaría que 丨 estuviera ubicado en H, 刂 en J y 川 en K. Este patrón es válido para todas las zonas. Además, se extiende a la mayoría de los radicales que parecen estar formados por tres de esos trazos, aunque en realidad no lo estén en absoluto. Un ejemplo de esto es 中 en K: si bien no tiene tres trazos hacia abajo (solo dos), parece tener tres. Además, se escribe a mano escribiendo primero un radical de boca, 口, y luego dividiéndolo en dos con un trazo vertical hacia abajo. El radical de la boca se encuentra en 'K', por lo que la asignación es doblemente lógica. Y la romanización pinyin de 口, kou3, comienza con k, otra ayuda para la memoria codificada en el teclado Wubi.

Además, cada letra de cada zona tiene asociado un componente, su "componente principal". Suelen ser un personaje completo (con la excepción de X) por derecho propio. Siempre se puede escribir este componente principal escribiendo cuatro veces la letra en la que se encuentra. Así, por ejemplo, el componente principal de H es 目, por lo que se escribiría escribiendo "hhhh".

Cada letra también tiene un carácter de acceso directo asociado. En algunos casos, este carácter es el mismo que el componente asociado a la clave en cuestión y, en otras, no. Este carácter abreviado es el carácter que se produce cuando se escribe solo la letra y nada más; Todos estos son caracteres extremadamente comunes que se utilizan al escribir en chino.

Es muy posible que haya una serie de componentes que no se enumeran a continuación, ya sea por descuido, porque rara vez se utilizan o porque no existe una representación Unicode simple para el componente.

Zona QWERT (hacia la izquierda)

El componente principal de la tecla Q es 金 y su carácter abreviado es 我. Está asociado con los siguientes componentes: 金, 钅, 勹, 儿, 夕, así como con el gancho en la parte superior de 饣 y 角, el radical 犭sin el trazo inferior que cae a la izquierda (por lo que los caracteres con ese radical comienzan con " qt", no solo "q"), la cruz (como en el centro de 区), la parte superior de 鱼 (es decir, sin el trazo horizontal en la parte inferior) y los tres "pies" (casi verticales) en la esquina inferior derecha de 流.

El componente principal y el carácter abreviado de la tecla W son 人. Está asociado con los siguientes componentes: 人, 亻, 八 y la parte superior de 癸. Si bien 人 significa persona, Wubi lo usa a menudo para construir un radical de techo, como en 会, "wfc". 入 no se rige por W, a pesar de verse similar, y aunque 餐 tiene una parte superior que se parece vagamente a la parte superior de 癸, los dos no son iguales (de hecho, para escribir 餐, uno debe escribir físicamente cada componente en la parte superior) .

El componente principal de la tecla E es 月 y su carácter abreviado es 有. Está asociado con los siguientes componentes: 月, 用, 彡, 乃, la parte inferior de 衣 (es decir, sin 亠), la parte superior de 孚 (es decir, sin 子), 豕 (cerdo), la parte inferior de 良 (es decir, sin el 白), y la parte inferior de 舟 (es decir, sin el puntito en la parte superior). En este caso, el carácter abreviado de E ni siquiera comienza con un trazo que cae hacia la izquierda, sino que simplemente representa de manera destacada un componente que pertenece a E. 彡 aparece en este carácter, ya que es el tercer carácter en la zona (contando desde T, ver arriba). Una distorsión particular que surge con frecuencia es el uso de E en 且 y en los caracteres que la contienen: Wubi piensa en este componente como 月 + 一.

El componente principal de la tecla R es 白 y su carácter abreviado es 的. Está asociado con los siguientes componentes: 白, 手, 扌, 斤 (con y sin T), 牛 ( sin el trazo vertical hacia abajo) y, por supuesto, los dos trazos que caen hacia la izquierda 𰀪 que uno esperaría del segundo. clave en la zona (ver arriba para una explicación). Tenga cuidado con las variedades de 手 donde el gancho central hacia abajo se reemplaza por un trazo que cae hacia la izquierda, como en 看.

El componente principal de la tecla T es 禾 y su carácter abreviado es 和. Está asociado con los siguientes componentes: 禾, 竹, 夂, 攵, 彳 y la parte superior de 乞 (es decir, sin 乙). 竹 también se puede encontrar en su forma más pequeña (⺮). 丿 también se encuentra en esta clave, porque T es la primera clave en la zona (ver arriba). Esto significa que si uno está escribiendo un componente o carácter trazo a trazo, (generalmente) usará T para representar un trazo que cae hacia la izquierda. Consulte la sección sobre trazos de desambiguación para obtener más información sobre las excepciones a esta regla.

Zona YUIOP (cayendo a la derecha)

Esta zona también podría denominarse zona de puntos, porque su patrón de Y: 讠 U: 冫 I: 氵 y O: 灬 no está necesariamente formado por trazos rectos que caen. De hecho, se podría argumentar que el primer trazo de 灬 en realidad cae hacia la izquierda . Se llama zona descendente hacia la derecha porque las teclas en esta zona, cuando se usan para construir un carácter por trazo (en lugar de componente), representan trazos descendentes hacia la derecha para alguna configuración de carácter (consulte la sección sobre trazos de desambiguación para obtener más información).

El componente principal de la tecla Y es 言 y su carácter abreviado es 主. Está asociado con los siguientes componentes: 言, 讠, 亠, 亠 con un 口 debajo, 广, 文, 方 y 丶. Todos estos componentes comienzan con un golpe de caída hacia la derecha. Generalmente, los puntos en los caracteres chinos en realidad son trazos que caen , por lo que la mayoría de las veces, el uso de T es más apropiado que Y. Por supuesto, si uno puede escribir caracteres chinos a mano, debería poder saber cuál elegir. recordando cómo está escrito.

El componente principal de la tecla U es 立 y su carácter abreviado es 产. Está asociado con los siguientes componentes: 立, 六, 辛, 门, 疒, 丬, 冫, las "antenas" en la parte superior de 单 (solo dos trazos: 丷) y las antenas más un trazo horizontal, como se encuentra en la parte superior de 兹. La mayoría de ellos presentan dos trazos diagonales cortos (siendo 门 la excepción obvia). Esto es consistente con el lugar de la U como segunda letra en la zona (ver arriba para una explicación).

El componente principal de la tecla I es 水 y su carácter abreviado es 不. Está asociado con los siguientes componentes: 水, 氵, 小, los tres trazos en la parte superior de 学 y los tres trazos en la parte superior de 当. Además, un componente que podría describirse como dos 冫, espalda con espalda, está asociado con este carácter.

El componente principal de la tecla O es 火 y su carácter abreviado es 为. Está asociado con los siguientes componentes: 火, 米, 灬 y 业sin el trazo horizontal inferior; esto permite la construcción de caracteres como 严. Esta es la cuarta clave en la zona derecha descendente: de ahí la inclusión de 灬.

El componente principal de la tecla P es 之 y su carácter abreviado es 这. Está asociado con los siguientes componentes: 之, 辶, 廴, 冖, 宀 y 礻. Como los componentes de Wubi se escriben en el orden en que deberían escribirse si se escribieran a mano, los componentes 辶 y 廴 generalmente se escriben al final .

Zona ASDFG (horizontal)

Zona HJKLM (vertical)

Zona XCVBN (gancho)

Trazos de desambiguación

Los trazos del teclado se dividen en 5 zonas.

Ejemplos

Personajes con 4 componentes o menos (pero sin necesidad de trazos)

Ejemplo 1: 请 Consta de tres componentes: y (讠, radical #10), g (王*, radical 89), e (月, radical 118) → 请

Personajes con más de cuatro componentes.

Ejemplo 2: 遗

Consta de cinco componentes: k (口), h (丨), g (一), m (贝), p (辶) → khgp → 遗 (no es necesario escribir m)

Personajes con menos de 4 componentes (que necesitan trazos)

Ejemplo 3a: 文: Primero escribe la clave con el símbolo, que resulta ser 'Y'. Luego escribe el primer componente, que también es 'Y' para el trazo 点, luego una 'G' para el trazo 横, y como ahora ya tiene tres trazos, escribe el último trazo, que también es un 捺. , llegando al código clave 'YYGY' para el carácter completo.

Ejemplo 3b: 一: El código para este carácter es 'GGLL'. Como antes, primero escribe la clave del carácter, que es 'G', luego el primer trazo de ese carácter, que también es una 'G'. Debido a que esta es toda la información necesaria, la L se usa como relleno hasta llegar a 4 letras. [2] Tenga en cuenta que '一' también es el carácter abreviado de 'G' (lo que lo convierte en un solo trazo en la práctica).

Ejemplo 3c: 广: El código para este carácter es 'YYGT'. Al principio, escribe la clave donde se encuentra este carácter, que es una 'Y'. Luego, escribe un trazo 点, que también está en 'Y'. El siguiente será el trazo 横 en 'G', y el último será el 捺, en 'T'.

Personajes que requieren trazos de desambiguación.

Ejemplo 4:

Consta de tres componentes: t (竹), f (土), f (寸),

Trazos de desambiguación: El último trazo es 丶 y el carácter tiene una estructura de arriba a abajo (42,u) → 等

Poema

Se hizo un poema como mnemónico para el teclado Wubi, asociando algunos caracteres con cada tecla. El primer carácter es el componente principal clave correspondiente, mientras que los siguientes son componentes o caracteres asociados.

versión 1986

G11 王旁青头戋五一
F12土士二干十寸雨
D13大犬三羊古石厂
S14木丁西
A15工戈草头右框七
H21目具上止卜虎皮
J22日早两竖与虫依
K23口与川,字根稀
L24田甲方框四车力
M25山由贝,下框几
T31禾竹一撇双人立,反文条头共三一
R32白手看头三二斤
E33月彡(衫)乃用家衣底
W34人和八,登祭头
Q35金勺缺点无尾鱼,犬旁留义儿一点夕,氏无七
Y41言文方广在四一,高头一捺谁人去
U42立辛两点六门疒(病)
I43水旁兴头小倒立
O44火业头,四点米
P45之宝盖,摘示衣
N51已半巳满不出己,左框折尸心和羽
B52子耳了也框向上
V53女刀九臼山朝西
C54又巴马,丢矢矣
X55慈母无心弓和匕,幼无力

versión 1998

G11 王旁青头五夫一
F12 土干十寸未甘雨,不要忘了革字底
D13 大犬戊其古石厂
S14 木丁西甫一四里
A 15 工戈草头右框七
H21 目上卜止虎具头
J22 日早两竖与虫依
K23 口流川,码元稀
L24 田甲方框四车里
M25 山由贝骨下框集
T31 禾竹反文双人立
R32 白斤气丘叉手提
E33 月用力豸毛衣臼
W34 人八登头单人几
Q35 金夕鸟儿犭边鱼
Y41 言文方点谁人去
U42 立辛六羊病门里
I43头小
O44 火业广鹿四点米
P45 之N51
N51
V53
V53
C54
X55幺母贯头弓和匕

Versión del nuevo siglo (tercera generación)

G11 王旁青头五一提 
F12 土士二干十寸雨
D13 大三肆头古石厂
S14 木丁西边要无女
A15 工戈草头右框七
H21 目止具头卜虎皮
J22 日曰两竖与虫依
K23 口中两川三个竖
L24 田框四车甲单底
M25 山由贝骨下框里
T31 禾竹牛旁卧人立
R32气头叉手提
E33 月舟衣力豕豸臼
W34 人八登祭风头几
Q35 金夕犭儿包头鱼
Y41 言文方点在四一
U42 立带两点病门里
I43 水边一族三点小
O44 火变三态广二米
P45 之字宝盖补示衣
N51 已类左框心尸羽
B52 子耳了也乃齿底
V53 女刀九巡录无水
C54 又巴甬矣马失蹄
X55丝弓三匕

En el medio

En 2020, la historia de Wubi apareció en un episodio de Radiolab titulado "El efecto Wubi". [3]

notas y referencias

  1. ^ Este es el nombre utilizado en Mac OS X
  2. ^ ab Wicentowski, Joe (1996), Wubizixing for Speakers of English, archivado desde el original el 10 de julio de 2015
  3. ^ Adler, Simón. "El efecto Wubi: Radiolab". Estudios WNYC, 14 de agosto de 2020.

enlaces externos