stringtranslate.com

Caracteres chinos completos

Un carácter chino completo , o carácter chino completo (Pinyin: hànzì zhěngzì; Chino tradicional: 漢字整字; Chino simplificado: 汉字整字), es un carácter chino completo. Se encuentra en el nivel final de la composición de caracteres chinos de trazo-componente-carácter. [1]

Según su estructura, los caracteres chinos se pueden dividir en caracteres indescomponibles (独体字) y caracteres descomponibles (合体字). Un carácter indescomponible está formado por un componente primitivo y también se denomina carácter de un solo componente, mientras que un carácter descomponible se puede descomponer en dos o más componentes y también se denomina carácter de varios componentes. [2] [3]

Caracteres indescomponibles

Definición

Un carácter indescomponible está formado directamente por trazos, no se puede descomponer en componentes más pequeños, aunque puede ser un componente de un carácter descomponible. [2] Por ejemplo, 人 es un carácter indescomponible formado por los trazos ㇓ y ㇏, y se utiliza para formar el carácter 丛.

Listas de caracteres no descomponibles

A continuación se muestran algunas listas de personajes indescomponibles creados por diferentes autores.

El "Diccionario de información de caracteres chinos" (漢字信息字典) [4] contiene un total de 7.785 caracteres estandarizados en China continental. Según las estadísticas estáticas, hay 323 caracteres indescomponibles, lo que representa el 4,149 % del corpus. Según las estadísticas dinámicas, los caracteres indescomponibles representan el 25,910 % del corpus. Esto se debe a que muchos caracteres de un solo componente son caracteres de uso frecuente. La lista de caracteres indescomponibles es la siguiente (en orden pinyin ):

凹八巴白百办半贝本匕币必卞丙秉卜不步才册叉产长厂车臣辰成丞承尺彳斥赤虫丑川巛串垂匆寸大歹丹刀氐电刁丁丢东斗厾不(重)儿而耳发乏凡方飞非丰夫弗甫钆玍丐干甘戈革个艮更工弓瓜广龟果亥禾乎户互幻奂火丌乩及几己夹甲戋兼柬见孑巾斤今堇井九久韭旧臼巨孓开孔口来乐耒礼里力吏隶良两了〇令龙甪乱马买毛矛么门米芈丏免面灭民皿末母木目乃内年廿乜牛农女丬乓皮匹片氕乒平七妻气千羌且丘求虬曲犬冉人壬刃日乳入卅伞丧山上勺少申身甚升生尸失虱十石史豕士氏世事手书术戍束甩水厶司巳肃太天头凸土兔彖屯乇瓦丸万亡王韦为囗卫未我乌无毋五兀勿戊夕西习系下乡象小心戌血丫牙轧亚严央羊么夭也业页曳一夷乙已以乂义弋亦尹引永用尤尢由酉又于予臾禺雨禹[a ]

Su [5] segmentó 7000 caracteres de uso común y obtuvo 233 caracteres no descomponibles, lo que representa el 3,4 %. La lista de caracteres no descomponibles es la siguiente (en orden de trazos ):

一乙二十丁厂七卜八人入乂儿九匕几刁了乃刀力又乜三干亍于亏士土工才下寸丈大兀万弋上小口山巾千川彳个么久丸夕凡及广亡门丫义之尸已巳弓己卫孑子孓也女飞刃习叉乡么丰王井开夫天无韦专丐廿木五卅不太犬歹尤车牙屯戈互瓦止少曰日中内水手牛毛气壬升夭长片币爪乏月氏勿丹火为户心尹尺夬丑爿巴书毋玉未末戋正甘世本术丙龙戊平灭东凸业目且甲申电田由央史冉皿凹四生失矢禾丘白斥瓜乎用甩氐乐册主半必永弗出母耒耳亚臣吏再西夹夷曳虫曲朱丢乒乓臼自血甪舟米州聿严甫更束两酉来里串我身系事雨果垂秉臾柬韭禺重禹

En la "Especificación de los caracteres indescomponibles de uso común en el chino moderno" (现代常用独体字规范), se han identificado 256 caracteres indescomponibles de uso común modernos dentro del ámbito de los caracteres chinos modernos, formando la "Lista de caracteres indescomponibles de uso común modernos". [6] La lista de caracteres indescomponibles es la siguiente (en orden basado en trazos ):

一乙二十丁厂七卜八人入儿匕几九刁了刀力乃又三干于工土士才下寸大丈与万上小口山巾千川个歹久么凡丸及广亡门丫义之尸己已巳弓子卫也女刃飞习叉马乡丰王开井天夫无云专丐木五不犬太歹尤车巨牙屯戈互瓦止少曰日中贝内水见午牛手气毛壬升夭长片斤爪父月氏勿丹鸟六文方火为斗户心尺丑巴办予书玉未末击正甘世本术丙石戊龙平东卡凸业木且甲申电田由史央冉皿凹四生矢失乍禾丘白斥瓜乎用甩乐匆册鸟主立半头必永民弗出矛母耳亚臣吏再西百而页夹夷虫曲肉年朱臼自血卤舟亦衣产亥羊米州农严求甫更束两酉来卤里串我身囱言羌弟事雨果垂秉肃隶承革柬面重鬼禹首兼象鼠

La "Lista de componentes de caracteres de uso común" de la "Especificación de componentes de caracteres chinos modernos comunes y nombres de componentes (现代常用字部件及部件名称规范)" incluye un total de 311 componentes de caracteres de uso común, es decir, caracteres no descomponibles. [7] La ​​lista de caracteres no descomponibles es la siguiente (en orden pinyin ):

凹八巴白百办半卑贝本匕必丙秉卜不才册叉产长厂车臣辰承尺斥赤虫丑出川串垂匆囱寸大歹丹单刀弟电刁丁鼎东兜斗豆儿而耳二发凡方飞非丰凤夫弗甫父丐干甘高戈革个更工弓谷瓜广龟鬼果亥禾黑后乎互户黄火击及几己夹甲兼柬见角巾斤今金京井九久韭臼巨具卡开口来老乐里力立吏丽隶两了六龙卤鹿卵仑马毛矛卯么门米免面民皿末母木目乃南内年鸟牛农女乓皮片乒平七妻其气千欠且丘求曲去犬冉人壬刃日肉入三伞色山上勺少舌申身升生尸失十石食史矢士氏示世事手首书鼠术束甩永司丝巳四肃太天田头凸土屯瓦丸万亡王卫为未文我乌无五午勿戊夕西习下乡向象小心辛戌穴血熏丫牙亚严言央羊夭也业页一衣夷乙已义亦庸永用尤由酉又于鱼与予雨禹玉曰月云再乍丈爪兆争正之直止至中重舟州朱竹主专子自

Con base en los resultados experimentales anteriores, se estima que el número de caracteres no descomponibles en los caracteres chinos modernos representa aproximadamente el 4%. [8]

Dado que cada familia que realiza experimentos tiene una comprensión ligeramente diferente de los componentes y, a menudo, utiliza conjuntos de caracteres diferentes, existen diferencias en la cantidad de caracteres no descomponibles obtenidos. Pero, en general, los resultados son bastante similares y oscilan entre más de 200 y más de 300.

Caracteres descomponibles

Definición

Un carácter descomponible se puede descomponer en más de un componente. Por ejemplo, "字" (carácter) está formado por dos componentes (宀+子).

Hay dos modos de combinación de componentes que se utilizan con frecuencia en el estudio de las estructuras de caracteres chinos: la combinación de componentes de primer nivel y la combinación de componentes primitivos . [9]

Combinación de componentes de primer nivel

El modo o patrón de combinación de componentes de primer nivel es lo que la gente suele llamar las estructuras de los caracteres chinos. Según este análisis, las estructuras de los caracteres descomponibles se pueden dividir en 4 categorías principales y 13 subcategorías: [10] [11]

Estructura de izquierda a derecha

Estructura de arriba a abajo

Estructura circundante

Envolvente completo:

Rodeado por tres lados

Rodeado por dos lados

Estructura superpuesta

Distribución de caracteres chinos según estructuras

Los siguientes datos son extractos del "Diccionario de información de caracteres chinos", con 7.785 caracteres chinos estándar continentales. [4]

Lista de caracteres en estructura anidada

Según las estadísticas del "Diccionario de información de caracteres chinos" [12] , hay un total de 49 caracteres de estructura superpuesta (o anidada, incluida la completamente rodeada) entre los 7.785 caracteres estándar continentales del diccionario:

哀褒乘囱囤固国裹回困圃囚圈衰爽四田图团围巫因幽园圆衷噩囟胤兖袤亵裒囝囡囵囫囹囿圄圊圉圜豳囮囷奭圐㘥

Si los caracteres completamente rodeados se mueven a la categoría circundante , los caracteres superpuestos serán aún menores.

Combinación de componentes primitivos

Según el análisis planar por componentes primitivos, las estructuras de los caracteres chinos incluyen los siguientes modos o patrones: [13]

El nivel en el que se deben dividir los componentes de los caracteres chinos debe determinarse en función de las necesidades específicas. Por ejemplo, la enseñanza de los caracteres chinos suele utilizar un nivel de análisis más burdo para ser concisa, mientras que los métodos de introducción de caracteres chinos mediante codificación de componentes suelen utilizar un análisis relativamente detallado para reducir los elementos de codificación. [14]

Distribución de caracteres chinos según el número de componentes

Los siguientes datos son extractos del "Diccionario de información de caracteres chinos". Los componentes que aparecen aquí se refieren a componentes primitivos. [15]

La distribución estática se concentra principalmente en el número de componentes 2, 3 y 4; la distribución dinámica se concentra principalmente en el número de componentes 1, 2 y 3. En las estadísticas de distribución dinámica y estática, más del 99 % de los caracteres tienen menos de 5 componentes primitivos. Tenga en cuenta que los recuentos de componentes estáticos para los componentes números 1 y 5 son los mismos, pero sus recuentos de componentes dinámicos son muy diferentes.

Fuentes de caracteres chinos

Fuentes

Los primeros cuatro caracteres de Thousand Character Classic en diferentes tipos y estilos de escritura . De derecha a izquierda: escritura de sello , escritura clerical , escritura regular , Ming y sans-serif .

Las fuentes populares de caracteres chinos modernos incluyen Song o Ming (宋體, 明體), FangSong (仿宋體), Kai (normal, 楷體), Li (clerical, 隸體), Hei (negro, sans-serif, 黑體) y Wei (魏體). [16]

Las fuentes estándar oficiales incluyen

Tamaños de fuente

En el ámbito internacional, el tamaño de las fuentes se mide generalmente en "puntos". En China, además del sistema de medida de "puntos", también se utiliza un sistema "numérico" exclusivo para los caracteres chinos. Por ejemplo, la versión en chino simplificado de MS Word permite configurar el tamaño de las fuentes en puntos o en números. [20]

El sistema de puntos

Después de casi trescientos años de desarrollo y mejora, los estándares de escritura más influyentes del mundo incluyen ahora el sistema de puntos Didot en Europa continental (un punto equivale aproximadamente a 0,3759 mm) y el sistema de puntos angloamericano (un punto equivale aproximadamente a 0,3515 mm). China utiliza este último sistema de puntos. Los valores de puntos disponibles en MS Word son todos los números entre 1 punto y 1638 puntos que son divisibles por 0,5, es decir, el conjunto {1, 1,5, 2, 2,5, ..., 1637, 1637,5, 1638}. Estas normas se pueden verificar directamente en la computadora. [20]

El sistema numérico

Las opciones de tamaño de fuente proporcionadas por la versión en chino simplificado de Windows y Word están organizadas en orden ascendente de tamaños de fuente:

No. 8 (八号), No. 7 (七号), Pequeño No. 6 (小六号), No. 6 (六号), Pequeño No. 5 (小五号), No. 5 (五号) ), Pequeño N° 4 (小四号), N° 4 (四号), Pequeño N° 3 (小三号), N° 3 (三号), Pequeño N° 2 (小二号), N° 2 (二号), número 1 pequeño (小一号), número 1 (一号), número inicial pequeño (小初号), número inicial (初号).

"No. 8" (o tamaño 8) es el más pequeño, equivalente a 5 puntos (sistema británico y americano), y la altura de fuente es de aproximadamente 1,757 mm; "Número inicial" (o tamaño A) es el más grande, equivalente a 42 puntos, y la altura de fuente es de aproximadamente 14,761 mm.

Correspondencia número-punto

La siguiente es una tabla correspondiente al tamaño de fuente de caracteres chinos "punto-número" creada por el Dr. Zhang. [20]

Véase también

Referencias

  1. ^ Su 2014, pág. 74.
  2. ^ ab Comisión Nacional de la Lengua 2009a, pág. 1.
  3. ^ Universidad de Pekín 2004, pág. 148.
  4. ^Ab Li 1988, pág. 1071.
  5. ^ Su 2014, págs. 95–96.
  6. ^ Comisión Nacional de la Lengua 2009a, p. 2-3.
  7. ^ Comisión Nacional del Idioma 2009b.
  8. ^ Su 2014, pág. 96.
  9. ^ Su 2014, pág. 98.
  10. ^ Su 2014, págs. 98–99.
  11. ^ https://www.unicode.org/charts/PDF/U2FF0.pdf
  12. ^ Li 1988, pág. 1072.
  13. ^ Fu 1999, págs. 39–41.
  14. ^ Su 2014, pág. 89.
  15. ^ Li 1988, pág. 1010.
  16. ^ Li 2013, pág. 62.
  17. ^ 国务院关于公布《通用规范汉字表》的通知. Gov.cn (en chino). Consejo de Estado de la República Popular China . 5 de junio de 2013.
  18. ^ http://www.edbchinese.hk/lexlist_ch/
  19. ^ https://www.unicode.org/charts/PDF/U4E00.pdf
  20. ^ abc Zhang 2006.

Obras citadas

Notas

  1. ^ Aquí se estipula que un componente de un carácter multicomponente tiene más de un trazo.
  2. ^ Unicode 2FF0, IDC (Carácter de descripción ideográfica) DE IZQUIERDA A DERECHA
  3. ^ en un corpus de 21.656.578 caracteres

Enlaces externos