El Proyecto de Texto Chino (CTP; chino :中國哲學書電子化計劃) es un proyecto de biblioteca digital que reúne colecciones de los primeros textos chinos . El nombre del proyecto en chino significa literalmente "Proyecto de digitalización de libros filosóficos chinos", lo que muestra su enfoque en libros relacionados con la filosofía china . Su objetivo es proporcionar versiones accesibles y precisas de una amplia gama de textos, [1] particularmente aquellos relacionados con la filosofía china, y al sitio se le atribuye haber proporcionado una de las colecciones más completas y precisas de textos clásicos chinos en Internet, [2 ] [3] además de ser una de las bases de datos textuales más útiles para los estudiosos de los primeros textos chinos. [4] [5]
Los textos se dividen en textos anteriores a Qin y Han, y textos posteriores a Han, clasificándose los primeros por escuela de pensamiento y los segundos por dinastía . La sección antigua (pre-Qin y Han) de la base de datos contiene más de 5 millones de caracteres chinos, la base de datos posterior a Han más de 20 millones de caracteres y la sección wiki editable públicamente más de 5 mil millones de caracteres. [6] Muchos textos también tienen traducciones al inglés y al chino, que se combinan con el texto original párrafo por párrafo, así como frase por frase para facilitar la comparación; esto hace posible que el sistema sea utilizado como una útil herramienta de investigación académica incluso por estudiantes con poco o ningún conocimiento de chino. [7]
Además de proporcionar una funcionalidad de búsqueda personalizada adaptada a los textos chinos, [8] [9] el sitio también intenta hacer uso del formato único de la web para ofrecer una gama de características relevantes para los sinólogos , incluido un diccionario integrado, listas de palabras, información de pasajes paralelos, [10] textos fuente escaneados, datos de concordancia e índice, [11] un sistema de metadatos, visualización de comentarios en chino, [12] una base de datos de recursos publicados y un foro de discusión en el que se pueden vincular hilos a datos específicos sobre el tema. sitio. [13] [14] La sección "Biblioteca" del sitio también incluye copias escaneadas de más de 25 millones de páginas de los primeros textos chinos, [15] [6] vinculadas línea por línea a transcripciones en la base de datos de texto completo, muchas de ellas creadas usando Reconocimiento óptico de caracteres, [16] y editado y mantenido mediante un sistema wiki de crowdsourcing en línea. [17] [18] Los datos textuales y los metadatos también se pueden exportar utilizando una interfaz de programación de aplicaciones , lo que permite la integración con otras herramientas en línea, así como su uso en proyectos de minería de textos y humanidades digitales . [17] [19]