El Proyecto de Texto Chino (CTP; chino :中國哲學書電子化計劃) es un proyecto de biblioteca digital que reúne colecciones de textos chinos antiguos . El nombre del proyecto en chino significa literalmente "Proyecto de digitalización de libros filosóficos chinos", lo que muestra su enfoque en libros relacionados con la filosofía china . Su objetivo es proporcionar versiones accesibles y precisas de una amplia gama de textos, [1] en particular los relacionados con la filosofía china, y al sitio se le atribuye el mérito de proporcionar una de las colecciones más completas y precisas de textos chinos clásicos en Internet, [2] [3] además de ser una de las bases de datos textuales más útiles para los académicos de textos chinos antiguos. [4] [5]
Los textos se dividen en textos pre-Qin y Han, y textos post-Han, con los primeros categorizados por escuela de pensamiento y los segundos por dinastía . La sección antigua (pre-Qin y Han) de la base de datos contiene más de 5 millones de caracteres chinos, la base de datos post-Han más de 20 millones de caracteres y la sección wiki editable públicamente más de 5 mil millones de caracteres. [6] Muchos textos también tienen traducciones al inglés y al chino, que se emparejan con el texto original párrafo por párrafo, así como frase por frase para facilitar la comparación; esto hace posible que el sistema se use como una herramienta de investigación académica útil incluso para estudiantes con poco o ningún conocimiento de chino. [7]
Además de proporcionar una funcionalidad de búsqueda personalizada adecuada para textos chinos, [8] [9] el sitio también intenta hacer uso del formato único de la web para ofrecer una gama de características relevantes para los sinólogos , incluyendo un diccionario integrado, listas de palabras, información de pasajes paralelos, [10] textos fuente escaneados, datos de concordancia e índice, [11] un sistema de metadatos, visualización de comentarios en chino, [12] una base de datos de recursos publicados y un foro de discusión en el que los hilos se pueden vincular a datos específicos en el sitio. [13] [14] La sección "Biblioteca" del sitio también incluye copias escaneadas de más de 25 millones de páginas de textos chinos antiguos, [15] [6] vinculadas línea por línea a transcripciones en la base de datos de texto completo, muchas creadas usando reconocimiento óptico de caracteres, [16] y editadas y mantenidas usando un sistema wiki de colaboración colectiva en línea. [17] [18] Los datos textuales y metadatos también se pueden exportar utilizando una interfaz de programación de aplicaciones , lo que permite la integración con otras herramientas en línea, así como su uso en proyectos de minería de texto y humanidades digitales . [17] [19]