El orden alfabético de trazos YES (一二三漢字筆順排檢法), también llamado orden de trazos YES , o para abreviar orden YES u ordenamiento YES , es un método de ordenamiento de caracteres chinos basado en un alfabeto de trazos y órdenes de trazos. Es un método de ordenamiento simplificado basado en trazos que no cuenta ni agrupa. [1] [2] [3]
"YES" en el nombre en inglés es el acrónimo de "Yi Er San", la expresión pinyin del nombre chino. El nombre chino "Yi Er San" (一二三; literalmente "uno, dos, tres") está formado a su vez por los tres primeros de todos los caracteres chinos en orden SÍ (porque el trazo "一" se encuentra en la parte superior del alfabeto). [4]
Se ha aplicado el orden YES a la indexación del Diccionario de caracteres Xinhua y del Diccionario de palabras Xiandai Hanyu . En este índice conjunto, el usuario puede buscar un carácter chino alfabéticamente para encontrar su pinyin y Unicode, además de los números de página en los dos diccionarios populares. [5]
En el Oxford Advanced Learner's Dictionary , la palabra alfabeto se define como "un conjunto de letras o símbolos en un orden fijo que se utiliza para escribir un idioma". [6] El "alfabeto" de YES es una lista de trazos de caracteres chinos en el orden de
㇐ ㇕ ㇅ ㇎ ㇡ ㇋ ㇊ ㇍ ㇈ 乙 ㇆ ㇇ ㇌㇀ ㇑ ㇗ ㇞ ㇉ ㄣ ㇙ ㇄ ㇟ ㇚ ㇓ ㇜ ㇛ ㇢ ㇔ ㇏ ㇂ [7]
para escribir y clasificar chino. Este alfabeto de trazos está construido sobre la base de Trazos Unicode CJK [8] y el estándar de trazos de flexión de caracteres chinos del conjunto de caracteres GB13000.1 . [9] Hay un total de 30 trazos, ordenados según el orden básico estándar de “ heng (橫, 横, 一), ti (提, ㇀), shu (豎, 竖, 丨), pie (撇, 丿), dian (點, 点, 丶), na (捺, ㇏)” y el orden de los puntos de flexión de “ zhe (折), wan (彎, 弯) y gou (鉤, 钩)”. [10]
El nombre en inglés está formado por las letras pinyin iniciales de cada carácter del nombre chino, similar a la denominación de los trazos CJK en Unicode, [8] es decir, H: heng , T: ti/tiao , S: shu , P: pie , D: dian , N: na ; z: zhe , w: wan y g: gou .
Los trazos son las unidades de escritura más básicas del chino. [12] Los caracteres chinos se escriben trazo a trazo en un orden determinado. El orden de trazos estándar de Taiwán y China continental es bastante similar. [13] [14] [15] Por ejemplo, el orden de los trazos de los diferentes caracteres en "一二三笔顺排检法 一二三筆順排檢法" son:
Yo (Yo)Yo (Yo)三 (一一一)笔 (㇓㇐㇔㇓㇐㇔㇓㇐㇐㇟)顺 (㇓㇑㇑㇐㇓㇑㇕㇓㇔)排 (㇐㇚㇀㇑㇐㇐㇐㇑㇐㇐㇐)检 (㇐㇑㇓㇔㇓㇏㇐㇔㇔㇓㇐)法 (㇔㇔㇀㇐㇑㇐㇜㇔)筆 (㇓㇐㇔㇓㇐㇔㇕㇐㇐㇐㇐㇑)順 (㇓㇑㇑㇐㇓㇑㇕㇐㇐㇐㇓㇔)檢 (㇐㇑㇓㇔㇓㇏㇐㇑㇕㇐㇑㇕㇐㇓㇔㇓㇔),
donde el orden de los trazos de cada carácter es una cadena de trazos entre corchetes. En los casos excepcionales en los que existe más de un glifo o orden de trazos para un carácter chino, YES sigue las fuentes y el orden de trazos del Estándar GB13000.1 Conjunto de caracteres Orden de caracteres chinos (Orden basado en trazos) [16] en sus implementaciones actuales, porque este estándar cubre los 20.902 caracteres CJK Unicode y tiene una población de usuarios mayor. En teoría, cualquier estándar de orden de trazos se puede utilizar en YES. [3]
Con el conocimiento del alfabeto de trazos y el orden de los trazos, el usuario ahora está listo para ordenar (o buscar) caracteres y palabras chinas alfabéticamente.
Para ordenar dos caracteres chinos en orden SÍ, el usuario sigue las mismas reglas del orden alfabético latino. [3] Primero, compare los primeros trazos del orden de trazos de los dos caracteres. Si son diferentes, ordene los caracteres según el orden de los trazos en el alfabeto, por ejemplo, "土 (㇐㇑㇐)" viene antes de "日 (㇑㇕㇐㇐)", porque el trazo inicial "㇐" está antes del trazo inicial "㇑" en el alfabeto. Si los primeros trazos son iguales, compare los segundos trazos de ambos lados, y así sucesivamente, hasta que se encuentre un par de trazos que no sean iguales y los caracteres chinos se ordenen en consecuencia, por ejemplo, "土 (㇐㇑㇐)" viene antes de "木 (㇐㇑㇓㇏)" porque el tercer trazo "㇐" precede a "㇓". Si se compara el último trazo de uno de los caracteres y los trazos de ambos lados vuelven a ser iguales, entonces la cadena de orden de trazos más corta viene primero, por ejemplo, "二 (一 一)" viene antes de "三 (一 一 一)".
El orden SÍ de los diferentes caracteres en "一二三笔顺排检法 一二三筆順排檢法" es:
Yo (Yo)Yo (Yo)三 (一一一)檢 (㇐㇑㇓㇔㇓㇏㇐㇑㇕㇐㇑㇕㇐㇓㇔㇓㇔)检 (㇐㇑㇓㇔㇓㇏㇐㇔㇔㇓㇐)排 (㇐㇚㇀㇑㇐㇐㇐㇑㇐㇐㇐)筆 (㇓㇐㇔㇓㇐㇔㇕㇐㇐㇐㇐㇑)笔 (㇓㇐㇔㇓㇐㇔㇓㇐㇐㇟)順 (㇓㇑㇑㇐㇓㇑㇕㇐㇐㇐㇓㇔)顺 (㇓㇑㇑㇐㇓㇑㇕㇓㇔)法 (㇔㇔㇀㇐㇑㇐㇜㇔).
Las palabras de varios caracteres se ordenan por sus primeros caracteres en orden SÍ. Si los primeros caracteres son iguales, se comprueban los segundos caracteres, y así sucesivamente. Los caracteres que no son chinos aparecen después de los caracteres chinos en orden alfabético/Unicode. [17] Por ejemplo,
覺覺醒觉觉醒觉悟B超T恤.
La orden YES se ha aplicado a la compilación de varios libros y listas, entre ellos:
En comparación con la clasificación tradicional basada en trazos, las ventajas de YES incluyen: (a) No se necesita contar ni agrupar los trazos (por ejemplo, en los grupos heng-shu-pie-dian-zhe 5). (b) Se emplea el orden alfabético de los trazos. (c) No requiere etiquetado. [22] [23]
Según los resultados experimentales, la clasificación por orden de trazos de un solo nivel de YES es más precisa que la clasificación tradicional de dos niveles por número de trazos y orden de trazos. Por ejemplo, en el método tradicional, los 9 caracteres de "夕夊夂久么勺凡丸及" no se pueden clasificar, porque todos tienen 3 trazos y comparten el mismo código de orden de trazos de 354 (pie-zhe-dian, 撇-折-点, ㇓㇕㇔). [16] El método YES puede clasificarlos en 6 grupos "及/凡丸/勺/夕/夊夂久/么". La tasa de duplicación de código (重码率) del método tradicional en el conjunto de 20.902 caracteres CJK es del 10,31%. Y en orden SÍ, se reduce al 2,75%. El número máximo de caracteres que comparten un código se reduce a 4, como 甲 曱 叶 申. (Los caracteres de código duplicado, es decir, caracteres que comparten un código de orden de trazos, se ordenan por las posiciones de los puntos de inicio y fin de los trazos correspondientes en el orden de mayor a menor y de izquierda a derecha). [24]
{{cite book}}
: CS1 maint: varios nombres: lista de autores ( enlace ){{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace )