stringtranslate.com

Proyecto de texto chino

El Proyecto de Texto Chino (CTP; chino :中國哲學書電子化計劃) es un proyecto de biblioteca digital que reúne colecciones de los primeros textos chinos . El nombre del proyecto en chino significa literalmente "Proyecto de digitalización de libros filosóficos chinos", lo que muestra su enfoque en libros relacionados con la filosofía china . Su objetivo es proporcionar versiones accesibles y precisas de una amplia gama de textos, [1] particularmente aquellos relacionados con la filosofía china, y al sitio se le atribuye haber proporcionado una de las colecciones más completas y precisas de textos clásicos chinos en Internet, [2 ] [3] además de ser una de las bases de datos textuales más útiles para los estudiosos de los primeros textos chinos. [4] [5]

Contenido del sitio

Los textos se dividen en textos anteriores a Qin y Han, y textos posteriores a Han, clasificándose los primeros por escuela de pensamiento y los segundos por dinastía . La sección antigua (pre-Qin y Han) de la base de datos contiene más de 5 millones de caracteres chinos, la base de datos posterior a Han más de 20 millones de caracteres y la sección wiki editable públicamente más de 5 mil millones de caracteres. [6] Muchos textos también tienen traducciones al inglés y al chino, que se combinan con el texto original párrafo por párrafo, así como frase por frase para facilitar la comparación; esto hace posible que el sistema sea utilizado como una útil herramienta de investigación académica incluso por estudiantes con poco o ningún conocimiento de chino. [7]

Además de proporcionar una funcionalidad de búsqueda personalizada adaptada a los textos chinos, [8] [9] el sitio también intenta hacer uso del formato único de la web para ofrecer una gama de características relevantes para los sinólogos , incluido un diccionario integrado, listas de palabras, información de pasajes paralelos, [10] textos fuente escaneados, datos de concordancia e índice, [11] un sistema de metadatos, visualización de comentarios en chino, [12] una base de datos de recursos publicados y un foro de discusión en el que se pueden vincular hilos a datos específicos sobre el tema. sitio. [13] [14] La sección "Biblioteca" del sitio también incluye copias escaneadas de más de 25 millones de páginas de los primeros textos chinos, [15] [6] vinculadas línea por línea a transcripciones en la base de datos de texto completo, muchas de ellas creadas usando Reconocimiento óptico de caracteres, [16] y editado y mantenido mediante un sistema wiki de crowdsourcing en línea. [17] [18] Los datos textuales y los metadatos también se pueden exportar utilizando una interfaz de programación de aplicaciones , lo que permite la integración con otras herramientas en línea, así como su uso en proyectos de minería de textos y humanidades digitales . [17] [19]

Referencias

  1. ^ Elman, Benjamin A. "Historiografía clásica de la historia china: bases de datos y textos electrónicos". Universidad de Princeton. Archivado desde el original el 5 de agosto de 2016 . Consultado el 3 de junio de 2016 .
  2. ^ "Asociación de Filósofos Chinos en América del Norte (北美中国哲学学者协会)". Archivado desde el original el 25 de diciembre de 2010 . Consultado el 25 de septiembre de 2010 .
  3. ^ Chris Fraser, Departamento de Filosofía, Universidad de Hong Kong
  4. ^ "¡Apoye el proyecto de texto chino! - Deformación, trama y forma". 30 de abril de 2013.
  5. ^ http://languagehat.com/chinese-text-project/
  6. ^ ab "Estadísticas del sistema: proyecto de texto chino".
  7. ^ Connolly, Tim (2012). "Aprender filosofía china con comentarios". Enseñar Filosofía . 35 (1). Centro de documentación de filosofía: 1–18. doi : 10.5840/teachphil20123511.
  8. ^ "Instrucciones: Búsqueda avanzada - Proyecto de texto chino".
  9. ^ "Preguntas frecuentes: normalización - Proyecto de texto chino".
  10. ^ Esturión, Donald (2017). "Identificación no supervisada de la reutilización de textos en la literatura china temprana". Beca Digital en Humanidades . Prensa de la Universidad de Oxford . Consultado el 21 de noviembre de 2017 .
  11. ^ Xu, Jiajin (2015). "Estudios chinos basados ​​en corpus: una revisión histórica desde la década de 1920 hasta la actualidad". Lengua y discurso chinos . 6 (2). Compañía editorial John Benjamins: 218–244. doi : 10.1075/cld.6.2.06xu .
  12. ^ Adkins, Marta A. (2016). "Revisión web: recursos en línea para el estudio de la religión y la filosofía chinas". Bibliotecología Teológica . 9 (2). Asociación Estadounidense de Bibliotecas Teológicas: 5–8. doi : 10.31046/tl.v9i2.435 .
  13. ^ Holger Schneider y Jeff Tharsen, http://dissertationreviews.org/archives/9213
  14. ^ "Introducción - Proyecto de texto chino".
  15. ^ "Biblioteca - Proyecto de texto chino".
  16. ^ Esturión, Donald (2017). Extracción no supervisada de datos de entrenamiento para OCR chino premoderno. La trigésima Conferencia Internacional Flairs. AAAI . Consultado el 21 de noviembre de 2017 .
  17. ^ ab https://cpianalysis.org/2016/06/08/crowdsourcing-apis-and-a-digital-library-of-chinese/ Archivado el 20 de marzo de 2017 en Wayback Machine , Instituto de Política de China, Universidad de Nottingham
  18. ^ "Instrucciones: OCR - Proyecto de texto chino".
  19. ^ "Herramientas: API - Proyecto de texto chino".

enlaces externos