Proyecto de texto en chino

El Proyecto de Texto Chino (CTP; chino :中國哲學書電子化計劃) es un proyecto de biblioteca digital que reúne colecciones de textos chinos antiguos . El nombre del proyecto en chino significa literalmente "Proyecto de digitalización de libros filosóficos chinos", lo que muestra su enfoque en libros relacionados con la filosofía china . Su objetivo es proporcionar versiones accesibles y precisas de una amplia gama de textos, ^[1] en particular los relacionados con la filosofía china, y al sitio se le atribuye el mérito de proporcionar una de las colecciones más completas y precisas de textos chinos clásicos en Internet, ^[2]^[3] además de ser una de las bases de datos textuales más útiles para los académicos de textos chinos antiguos. ^[4]^[5]

Contenido del sitio

Los textos se dividen en textos pre-Qin y Han, y textos post-Han, con los primeros categorizados por escuela de pensamiento y los segundos por dinastía . La sección antigua (pre-Qin y Han) de la base de datos contiene más de 5 millones de caracteres chinos, la base de datos post-Han más de 20 millones de caracteres y la sección wiki editable públicamente más de 5 mil millones de caracteres. ^[6] Muchos textos también tienen traducciones al inglés y al chino, que se emparejan con el texto original párrafo por párrafo, así como frase por frase para facilitar la comparación; esto hace posible que el sistema se use como una herramienta de investigación académica útil incluso para estudiantes con poco o ningún conocimiento de chino. ^[7]

Además de proporcionar una funcionalidad de búsqueda personalizada adecuada para textos chinos, ^[8]^[9] el sitio también intenta hacer uso del formato único de la web para ofrecer una gama de características relevantes para los sinólogos , incluyendo un diccionario integrado, listas de palabras, información de pasajes paralelos, ^[10] textos fuente escaneados, datos de concordancia e índice, ^[11] un sistema de metadatos, visualización de comentarios en chino, ^[12] una base de datos de recursos publicados y un foro de discusión en el que los hilos se pueden vincular a datos específicos en el sitio. ^[13]^[14] La sección "Biblioteca" del sitio también incluye copias escaneadas de más de 25 millones de páginas de textos chinos antiguos, ^[15]^[6] vinculadas línea por línea a transcripciones en la base de datos de texto completo, muchas creadas usando reconocimiento óptico de caracteres, ^[16] y editadas y mantenidas usando un sistema wiki de colaboración colectiva en línea. ^[17]^[18] Los datos textuales y metadatos también se pueden exportar utilizando una interfaz de programación de aplicaciones , lo que permite la integración con otras herramientas en línea, así como su uso en proyectos de minería de texto y humanidades digitales . ^[17]^[19]

Referencias

^ Elman, Benjamin A. "Historiografía clásica para la historia china: bases de datos y textos electrónicos". Universidad de Princeton. Archivado desde el original el 5 de agosto de 2016. Consultado el 3 de junio de 2016 .
^ "Asociación de Filósofos Chinos en América del Norte (北美中国哲学学者协会)". Archivado desde el original el 25 de diciembre de 2010 . Consultado el 25 de septiembre de 2010 .
^ "Enlaces". Chris Fraser dijo . Consultado el 13 de junio de 2024 .
^ "¡Apoya el proyecto de texto chino! – Urdimbre, trama y camino". 30 de abril de 2013.
^ "PROYECTO DE TEXTO EN CHINO. : languagehat.com". languagehat.com . Consultado el 13 de junio de 2024 .
^ ab "Estadísticas del sistema - Proyecto de texto chino".
^ Connolly, Tim (2012). "Aprender filosofía china con comentarios". Teaching Philosophy . 35 (1). Philosophy Documentation Center: 1–18. doi :10.5840/teachphil20123511.
^ "Instrucciones: Búsqueda avanzada - Proyecto de texto chino". ctext.org .
^ "Preguntas frecuentes: Normalización - Proyecto de texto chino".
^ Sturgeon, Donald (2017). "Identificación no supervisada de la reutilización de textos en la literatura china temprana". Digital Scholarship in the Humanities . Oxford University Press . Consultado el 21 de noviembre de 2017 .
^ Xu, Jiajin (2015). "Estudios chinos basados en corpus: una revisión histórica desde la década de 1920 hasta la actualidad". Lengua y discurso chino . 6 (2). John Benjamins Publishing Company: 218–244. doi : 10.1075/cld.6.2.06xu .
^ Adkins, Martha A. (2016). "Web Review: Recursos en línea para el estudio de la religión y la filosofía chinas". Bibliotecología teológica . 9 (2). Asociación Americana de Bibliotecas Teológicas: 5–8. doi : 10.31046/tl.v9i2.435 .
^ "Archivos y activismo en La Española – dr". dissertationreviews.org . Consultado el 13 de junio de 2024 .
^ "Introducción - Proyecto de texto chino".
^ "Biblioteca - Proyecto de texto chino". ctext.org .
^ Sturgeon, Donald (2017). Extracción no supervisada de datos de entrenamiento para el OCR chino premoderno. Trigésima Conferencia Internacional Flairs. AAAI . Consultado el 21 de noviembre de 2017 .
^ ab "Crowdsourcing, APIs, and a Digital Library of Chinese – China Policy Institute: Analysis". cpianalysis.org . 2016-06-08. Archivado desde el original el 2017-03-20 . Consultado el 2024-06-13 .
^ "Instrucciones: OCR - Proyecto de texto chino". ctext.org .
^ "Herramientas: API - Proyecto de texto chino".

Enlaces externos

Proyecto de texto en chino
中國哲學書電子化計劃(en chino)
Proyecto de texto chino en Douban (en chino)