Mojikyō (en japonés:文字鏡), también conocido por su nombre completo Konjaku Mojikyō (今昔文字鏡, lit. ' (el) espejo de caracteres pasados y presentes ' ) , es unde codificación de caracterescreado para proporcionar un índice completo de caracteres utilizados en lossistemas de escrituralogográficoschinos históricoschino,el japonés,el coreano,el vietnamita Chữ Nôm(文字鏡研究会, Mojikyō Kenkyūkai ) , que publicó el conjunto de caracteres, también publicósoftware de computadorafuentesTrueTypepara acompañarlo. El Instituto Mojikyō, presidido por Tadahisa Ishikawa(石川忠久),[1]originalmente tenía su conjunto de caracteres y software y datos relacionados redistribuidos enCD-ROMvendidos enKinokuniya.[2]
Conceptualizado en 1996, [3] la primera versión del CD-ROM fue lanzada en julio de 1997. [4] Durante un tiempo, el Instituto Mojikyō también ofreció una suscripción web, denominada " Mojikyō WEB" (文字鏡WEB ), que tenía caracteres más actualizados. [5]
En septiembre de 2006 [actualizar], Mojikyō codificaba 174.975 caracteres. [6] Entre ellos, 150.366 caracteres (≈86%) pertenecían a la familia extendida chino-japonés-coreano-vietnamita (CJKV) [nota 2] . [5] Muchos de los caracteres de Mojikyō se consideran obsoletos u oscuros, y no están codificados por ningún otro conjunto de caracteres, incluido el estándar de codificación de texto internacional más utilizado, Unicode .
Originalmente un producto de software propietario de pago, a partir de 2015, el Instituto Mojikyō comenzó a subir sus últimos lanzamientos a Internet Archive como freeware , [7] como un homenaje a uno de sus desarrolladores, Tokio Furuya (古家時雄) , quien murió ese año. [3] El 15 de diciembre de 2018, se lanzó la versión 4.0. Al día siguiente, Ishikawa anunció que sin Furuya este sería el lanzamiento final de Mojikyō . [3]
La codificación Mojikyō se creó para proporcionar un índice completo de caracteres utilizados en los sistemas de escritura chino , japonés , coreano y vietnamita Chữ Nôm . También codifica una gran cantidad de caracteres en escrituras antiguas, como la escritura de hueso de oráculo , la escritura de sello y el sánscrito ( Siddhaṃ ). Para muchos caracteres, es la única codificación de caracteres que los codifica, y sus datos se utilizan a menudo como punto de partida para las propuestas Unicode . [8] [9] Sin embargo, Mojikyō tiene estándares mucho más laxos que Unicode para la codificación, lo que lleva a Mojikyō a tener muchos glifos codificados de origen dudoso, o incluso involuntariamente ficticio. [10] [11] Como tal, si bien muchos caracteres Mojikyō que no son Unicode son adecuados para su incorporación a Unicode, no todos pueden convertirse en caracteres Unicode, debido a los diferentes estándares de evidencia requeridos por cada uno.
Las fuentes Mojikyō (文字鏡フォント) son fuentes TrueType que vienen en un archivo ZIP y pesan entre 2 y 5 megabytes ; las diferentes fuentes contienen diferentes cantidades de caracteres. [nota 3] También se incluye un ejecutable de Windows que implementa un mapa de caracteres gráfico , el " Mapa de caracteres Mojikyō " (文字鏡MAP ), MOCHRMAP .EXE . [nota 4] [nota 5] MOCHRMAP.EXE permite a los usuarios explorar las fuentes Mojikyō y copiar y pegar caracteres en lugar de escribirlos en el teclado. A diferencia del mapa de caracteres normal de Windows, o de KCharSelect , que admiten fuentes TrueType, MOCHRMAP.EXE muestra la ranura de codificación Mojikyō numerada del carácter solicitado. [12] [nota 6] Para que MOCHRMAP.EXE funcione, se deben instalar todas las fuentes Mojikyō . [nota 7]
Cuando se hace referencia a un carácter codificado en Mojikyō , se suele utilizar el formato MJXXXXXX, similar al formato U+XXXX utilizado para Unicode. Por ejemplo, hentaigana U+1B008 𛀈 HENTAIGANA LETTER I-3 tiene la codificación Mojikyō MJ090007 y la codificación Unicode U+1B008. [13] Sin embargo, una diferencia es que las codificaciones Mojikyō que se muestran de esta manera son decimales , mientras que la codificación U+ de Unicode es hexadecimal .
Desde los primeros días de Unicode, Mojikyō ha influido en el estándar y ha sido influenciado por él. Los glifos originados en Mojikyō aparecen por primera vez en una propuesta al Grupo de Relatores Ideográficos (IRG), [nota 8] que es responsable de mantener todos los bloques CJK en Unicode, [14] [15] el 18 de abril de 2002. [16] En mayo de 2007, Mojikyō jugó un papel menor en una serie de propuestas que finalmente tuvieron éxito para codificar la escritura Tangut en Unicode; [17] [nota 9] Mojikyō ya tenía dentro de su codificación 6000 caracteres Tangut en octubre de 2002. [6]
La base de datos Unihan del estándar Unicode se refiere a Mojikyō como la " Colección KOKUJI japonesa" (日本国字集), [18] abreviada como "JK". [19] [20] Por ejemplo, U+2B679 𫙹 CJK UNIFIED IDEOGRAPH-2B679 , [nota 10] un ideograma que se lee en japonés como burizādo (ブリザード, lit. ' ventisca ' ) , tiene una J-Source [nota 11] igual a JK-66038. Todos los caracteres Unicode con una J-Source prefijada con JK se originan en Mojikyō . [21] [nota 12] Según Ken Lunde , un experto en la materia de codificaciones de caracteres e idiomas del este asiático , a partir de Unicode 13.0, 782 ideogramas en Unicode se originan de Mojikyō , divididos de manera más o menos uniforme entre dos bloques : CJK Unified Ideographs Extension C , con 367, y CJK Unified Ideographs Extension E , con 415. [20] [22] No todos los caracteres Unicode con orígenes Mojikyō (J-Sources con prefijo JK) tienen el mismo glifo representativo en la tabla de códigos que en la fuente Mojikyō ; [nota 13] algunos caracteres tuvieron sus formas cambiadas antes de la codificación final, ya que la investigación mostró que las formas asignadas por el Instituto Mojikyō eran incorrectas. [11] [nota 14]
En septiembre de 2006, [actualizar]el sistema codificaba 174.975 caracteres. [6] De ellos, 150.366 pertenecían a la familia extendida CJKV [nota 2] . [5] Muchos de los caracteres codificados se consideran obsoletos o desconocidos, y no están codificados por ningún otro conjunto de caracteres, incluido el estándar internacional Unicode. Cada carácter Mojikyō tiene un número único y los caracteres están organizados en bloques.
Mojikyō coloca los caracteres CJKV en diferentes bloques según su radical Kangxi tradicional . Los radicales comunes que contienen una cantidad especialmente alta de caracteres, como los radicales 9 (人) y 162 ( ⻌ ), se dividen aún más según el orden de los trazos. [nota 15]
A diferencia de Unicode, Mojikyō evita deliberadamente la unificación Han ; no se intenta compacidad en la codificación ni se intenta mantener todos los caracteres comunes por debajo de U+FFFF como ocurre en Unicode.
Unicode, por otro lado, clasifica su CJK en bloques según su grado de comunidad: los más comunes generalmente se colocan en el Plano Multilingüe Básico [nota 14] , mientras que aquellos que son raros u oscuros se colocan en los Planos Suplementarios .
Por ejemplo, Radical 9 tiene dos caracteres donde Unicode tiene uno: MJ054435 (令) y MJ059031 (令), ambos representados en Unicode como U+4EE4令CJK IDEOGRAFO UNIFICADO-4EE4 .
Mojikyō es un software propietario con una licencia restrictiva. Originalmente, el Instituto Mojikyō intentó evitar que se utilizaran sus datos de caracteres y amenazó a quienes publicaran tablas de conversión hacia y desde su conjunto de caracteres. En julio de 2010, el Instituto Mojikyō abandonó sus esfuerzos legales para impedir que al menos un usuario japonés publicara tablas de conversión o convirtiera caracteres codificados en Mojikyō a Unicode u otros conjuntos de caracteres. [23] Los datos simples, que a veces incluyen las formas de las letras, se consideran en muchas jurisdicciones propiedad común , ya que no cumplen con el umbral de originalidad . [nota 16]
Sin embargo, debido a este legado, GlyphWiki de Mojikyō a partir de 2020. [24]
rechazó los datos文字鏡研究会の関係者にヒアリングしたところ、オランダから提案されたWG2
N36980ついても疑問があるとのことであった。[Según una entrevista con un representante de Mojikyō Institute, se utiliza una fuente
Mojikyō
en WG2 N36981 propuesta por los Países Bajos, pero el Instituto Mojikyō en sí no participa en la propuesta; Además, tiene dudas sobre parte del contenido de dicha propuesta.]
しかし、拡張Cの標準化作業が8年の長期にわたり、また事後的に用例が必須とされたため、正.式に公布された拡張C漢字の典拠は当初の典拠とはかなり異なるものとなっている。たとえば日本では当初は文字鏡研究会によって選定.された1000文字程度の漢字を申請していた[。] [...] 典拠用例確認は文字鏡とは独立に行なわれたため、字形が文字鏡漢字から変更されたもの.も多い。[Como el esfuerzo de estandarización de
CJK Unified Ideographs Extension C
ha durado ocho largos años en el Aunque se han solicitado ejemplos de kanji después de su codificación, el estándar de kanji de la Extensión C promulgado oficialmente es bastante diferente del estándar original. Por ejemplo, nosotros, el Gobierno de Japón, solicitamos inicialmente unos 1.000 kanji seleccionados por el Instituto Mojikyō[.] [...] Dado que la verificación de los kanji se realizó independientemente del Instituto Mojikyō, las formas de los caracteres a menudo se cambiaban de La versión de Mojikyō de ese mismo punto de código.]
N895-Japón_C1
文字鏡番号(独自部分)および文字鏡のフォントに収録されているグリフそのもの、およびそれを参照、利用して作成していると判断できる情報は、グリフウィキに登録する際の典拠とすることはできませんので、ご協力ををいたします. [
Konjaku Mojikyō
y los productos relacionados y los datos asociados tienen una licencia que los hace incompatibles con nuestra licencia GlyphWiki mencionada anteriormente. Ni el número de la ranura de codificación
de Mojikyō
, ni la apariencia del glifo en sí en las fuentes
de
Mojikyō
, ni ninguna otra información Todo lo que pueda considerarse recopilado a partir de un producto
de Mojikyō
se puede utilizar al introducir datos en GlyphWiki. No podemos aceptar en ningún caso datos
de Mojikyō
. Por favor, colabore con nosotros.]
kIRG_JSource
. Durante la unificación Han , existen nueve fuentes de este tipo. Consulte el §3.1 de UAX#38 para obtener una lista completa y más información.