stringtranslate.com

Iniciativa de codificación de texto

La Text Encoding Initiative ( TEI ) es una comunidad de práctica centrada en el texto en el campo académico de las humanidades digitales , que opera de forma continua desde la década de 1980. La comunidad actualmente administra una lista de correo, reuniones y series de conferencias, y mantiene el estándar técnico TEI , una revista , [1] una wiki , un repositorio de GitHub y una cadena de herramientas .

Directrices del TEI

Las Directrices TEI definen colectivamente un tipo de formato XML y son el resultado definitorio de la comunidad de práctica. El formato difiere de otros formatos abiertos conocidos para texto (como HTML y OpenDocument ) en que es principalmente semántico en lugar de presentacional: se especifican la semántica y la interpretación de cada etiqueta y atributo. Hay alrededor de 500 componentes y conceptos textuales diferentes: palabra , [2] oración , [3] carácter , [4] glifo , [5] persona , [6] etc. Cada uno se basa en una o más disciplinas académicas y se dan ejemplos.

Detalles técnicos

El estándar se divide en dos partes: una descripción textual discursiva con ejemplos y debates ampliados y un conjunto de definiciones etiqueta por etiqueta. Los esquemas de la mayoría de los formatos modernos ( DTD , RELAX NG y XML Schema (W3C) ) se generan automáticamente a partir de las definiciones etiqueta por etiqueta. Varias herramientas respaldan la producción de las pautas y la aplicación de las pautas a proyectos específicos.

Se utilizan varias etiquetas especiales para eludir las restricciones impuestas por el Unicode subyacente : glyph para permitir la representación de caracteres que no califican para la inclusión en Unicode [2] y choice para permitir superar la estricta linealidad requerida. [7]

La mayoría de los usuarios del formato no utilizan la gama completa de etiquetas, sino que producen una personalización utilizando un subconjunto específico del proyecto de las etiquetas y atributos definidos por las Directrices. La TEI define un mecanismo de personalización sofisticado conocido como ODD para este propósito. Además de documentar y describir cada etiqueta TEI, una especificación ODD especifica su modelo de contenido y otras restricciones de uso, que pueden expresarse utilizando schematron .

TEI Lite es un ejemplo de este tipo de personalización. Define un formato de archivo basado en XML para intercambiar textos. Se trata de una selección manejable del amplio conjunto de elementos disponibles en las Directrices TEI completas.

Como formato basado en XML, TEI no puede manejar directamente el marcado superpuesto y las estructuras no jerárquicas. Las directrices sugieren una variedad de opciones para representar este tipo de datos. [8]

Ejemplos

El texto de las directrices TEI es rico en ejemplos. También hay una página de ejemplos en la wiki TEI [9] que ofrece ejemplos de proyectos del mundo real que exponen su TEI subyacente.

Etiquetas de prosa

TEI permite marcar textos sintácticamente en cualquier nivel de granularidad o combinación de granularidades. Por ejemplo, este párrafo (p) ha sido marcado en oraciones (s) y cláusulas (cl). [10]

 <s> <cl> Fue a principios de septiembre de 1664 , <cl> cuando yo, entre el resto de mis vecinos, oí en el habla corriente <cl> que la plaga había regresado de nuevo a Holanda; </cl> </cl> </cl> <cl> pues había sido muy violenta allí, y particularmente en Amsterdam y Rotterdam, en el año 1663, </cl> <cl> adonde, <cl> dicen , </cl> fue traída, <cl> algunos dijeron </cl> de Italia , otros del Levante , entre algunos bienes <cl> que fueron traídos a casa por su flota turca ; </cl> </cl> <cl> otros dijeron que fue traída de Candia; otros de Chipre . </cl> </s> <s> <cl> No importaba <cl> de dónde viniera ; </cl> </cl> <cl> pero todos coincidieron en que había llegado a Holanda nuevamente . </cl> </cl> </s>                                                                                                           

Versículo

TEI tiene etiquetas para marcar los versos. Este ejemplo (tomado de la traducción francesa de las Directrices TEI) muestra un soneto. [11]

<div type= "sonnet" > <lg type= "quatrain" > <l> Les amoureux fervents et les savants austères </l> <l> Aiment également, dans leur mûre saison, </l> <l> Les chats puissants et doux, orgueil de la maison, </l> <l> Qui comme eux sont frileux et comme eux sédentaires. </l> </lg> <lg type= "quatrain" > <l> Amigos de la ciencia y de la volupté </l> <l> Ils cherchent le Silence et l'horreur des ténèbres ; </l> <l> L'Érèbe les eût pris pour ses coursiers funèbres, </l> <l> S'ils pouvaient au servage incliner leur fierté. </l> </lg> <lg type= "tercet" > <l> Ils prennent en songeant les nobles actitudes </l> <l> Des grands sphinx allongés au fond des solitudes, </l> <l> Qui semblent s'endomir dans un rêve sans fin ; </l> </lg> <lg type= "tercet" > <l> Leurs reins féconds sont pleins d'étincelles magices, </l> <l> Et des parcelales d'or, ainsi qu'un sable fin, </l> <l> Étoilent vaguement leurs prunelles mystiques.</l> </lg> </div>                                                                                                                               

Etiqueta de elección

La etiqueta choice se utiliza para representar secciones de texto que pueden codificarse o etiquetarse de más de una forma posible. En el siguiente ejemplo, basado en uno del estándar, choice se utiliza dos veces, una para indicar un número original y uno corregido, y otra para indicar una ortografía original y una regularizada. [12]

<p xml:id= "p23" > Por último, que, bajo su solemne juramento de observar todo lo anterior,           artículos, dicho  hombre - montaña tendrá  una ración diaria de       carne  y  bebida  suficientes  para  el  sustento  de <choice> <sic> 1724 </sic> <corr> 1728 </corr> </choice> de nuestros súbditos,       con  libre  acceso  a  nuestra persona  real , y otras marcas de nuestro <choice> <orig> favor </orig> <reg> favor </reg> </choice> .         

EXTRAÑO

One Document Does it all ("ODD") es un lenguaje de programación alfabetizado para esquemas XML . [13] [14] [15] [16]

En el estilo de programación alfabetizada, los documentos ODD combinan documentación legible por humanos y modelos legibles por máquinas utilizando el módulo Documentation Elements de la Text Encoding Initiative. Las herramientas generan salidas legibles por humanos en formato HTML , ePub o PDF localizados e internacionalizados y salidas legibles por máquinas en formato DTD , esquema XML del W3C , sintaxis compacta Relax NG o sintaxis XML Relax NG.

La aplicación web Roma [17] está construida alrededor del formato ODD y puede usarlo para generar esquemas en formatos DTD , W3C XML Schema , Relax NG Compact Syntax o Relax NG XML Syntax, como los que utilizan muchas herramientas y servicios de validación XML.

ODD es el formato utilizado internamente por la Text Encoding Initiative para el estándar técnico TEI . [18] Aunque los archivos ODD generalmente describen la diferencia entre un formato XML personalizado y el modelo TEI completo, ODD también se puede utilizar para describir formatos XML que son completamente independientes del TEI. Un ejemplo de esto es el Internationalization Tag Set del W3C que utiliza el formato ODD para generar esquemas y documentar su vocabulario. [19] [20]

Personalizaciones de TEI

Las personalizaciones de TEI son especializaciones de la especificación XML de TEI para su uso en campos particulares o por comunidades específicas.

La personalización en el TEI se realiza a través del mecanismo ODD mencionado anteriormente. En realidad, desde su versión P5, todos los usos denominados "conformes con el TEI" de las Directrices del TEI se basan en una personalización del TEI documentada en un archivo ODD del TEI. Incluso cuando los usuarios eligen uno de los esquemas pregenerados disponibles comercialmente para validar, estos se han creado a partir de archivos de personalización disponibles gratuitamente.

Proyectos

El formato se utiliza en muchos proyectos en todo el mundo. Prácticamente todos los proyectos están asociados a una o más universidades. Algunos proyectos conocidos que codifican textos utilizando TEI incluyen:

Historia

Antes de la creación de TEI, los académicos de humanidades no tenían estándares comunes para codificar textos electrónicos de una manera que sirviera a sus objetivos académicos ( Hockey 1993, p. 41). En 1987, un grupo de académicos que representaban campos de humanidades, lingüística e informática se reunieron en Vassar College para proponer un conjunto de pautas conocidas como los “Principios de Poughkeepsie”. Estas pautas dirigieron el desarrollo del primer estándar TEI, “P1”. [23] [24]

Referencias

  1. ^ "Revista de la Iniciativa de Codificación de Texto". Revistas de Edición Abierta . Consultado el 29 de junio de 2022 .
  2. ^ ab "Elemento TEI w (palabra)". tei-c.org .
  3. ^ "Elemento TEI s (unidad s)". tei-c.org .
  4. ^ "Elemento TEI c (carácter)". tei-c.org .
  5. ^ "Elemento TEI g (carácter o glifo)". tei-c.org .
  6. ^ "Elemento TEI persona (persona)". tei-c.org .
  7. ^ "Elección de elementos". www.tei-c.org .
  8. ^ "20 estructuras no jerárquicas - TEI P5: — Directrices para la codificación y el intercambio de texto electrónico". tei-c.org . 2019 . Consultado el 19 de marzo de 2019 .
  9. ^ "Muestras de textos del TEI". wiki.tei-c.org . 2011 . Consultado el 17 de abril de 2012 .
  10. ^ "17 mecanismos analíticos simples - TEI P5: — Directrices para la codificación y el intercambio de texto electrónico". tei-c.org . 2012 . Consultado el 15 de abril de 2012 .
  11. ^ "TEI element lg (groupe de vers)". tei-c.org . 2012. Archivado desde el original el 6 de junio de 2012 . Consultado el 15 de abril de 2012 .
  12. ^ "Elección de elementos TEI". tei-c.org . 2012 . Consultado el 15 de abril de 2012 .
  13. ^ Bauman, Syd; Flanders, Julia (2004). Personalizaciones de ODD. Extreme Markup Languages ​​2004. Archivado desde el original el 29 de marzo de 2012. Consultado el 15 de abril de 2012 .
  14. ^ Burnard, Lou; Rahtz, Sebastian (2004). RelaxNG con Son of ODD. Extreme Markup Languages ​​2004. Archivado desde el original el 29 de marzo de 2012. Consultado el 15 de abril de 2012 .
  15. ^ Reiss, Kevin M. (2007). Literate Documentation for XML (PDF) (Documentación literaria para XML) (PDF) . Digital Humanities 2007. Urbana-Champaign, Illinois. Archivado desde el original (PDF) el 3 de marzo de 2016 . Consultado el 15 de abril de 2012 .
  16. ^ Burnard, Lou; Rahtz, Sebastian (junio de 2013). "Un lenguaje de definición de esquema completo para la Iniciativa de codificación de texto". XML London 2013 : 152–161. doi : 10.14337/XMLLondon13.Rahtz01 (inactivo desde el 25 de septiembre de 2024). ISBN 978-0-9926471-0-0.{{cite journal}}: CS1 maint: DOI inactivo a partir de septiembre de 2024 ( enlace )
  17. ^ Aplicación web de Roma
  18. ^ Burnard, Lou; Bauman, Syd, eds. (2007). "TEI P5: Pautas para la codificación y el intercambio de texto electrónico". Charlottesville, Virginia, EE. UU.: TEI Consortium.
  19. ^ Archivo ODD de W3C ITS y TEI Archivado el 15 de julio de 2017 en Wayback Machine.
  20. ^ Savourel, Yves; Kosek, Jirka; Ishida, Richard, eds. (2008). "Mejores prácticas para la internacionalización de XML". Grupo de trabajo del W3C. 5.2 ITS y TEI.
  21. ^ "Iniciativa de codificación de cartas - Ludwig-Maximilians-Universität München". www.cei.lmu.de.
  22. ^ "Archivo de textos nórdicos medievales (Menota)". www.menota.org .
  23. ^ Ahronheim, JR (1998). "Metadatos descriptivos: estándares emergentes". Revista de bibliotecología académica . 24 (5): 395–403. doi :10.1016/S0099-1333(98)90079-9.
  24. ^ Cantara, L. (2005). "La iniciativa de codificación de texto: Parte 1". OCLC Systems & Services . 21 (1): 36–39. doi :10.1108/10650750510578136.
  25. ^ "La Asociación de Computación y Humanidades |". ach.org .
  26. ^ "Antecedentes históricos", sección iv.2 de TEI P5: Directrices para la codificación e intercambio electrónico de textos.
  27. ^ "Declaración de clausura de la Conferencia de Planificación de Vassar". tei-c.org . 2009 . Consultado el 15 de abril de 2012 .
  28. ^ "Directrices TEI" . Consultado el 18 de junio de 2010 .
  29. ^ "2". Conceptos básicos de XML . Consultado el 9 de julio de 2011 .
  30. ^ "Lenguaje de marcado extensible (XML) 1.0 (quinta edición)". w3.org .
  31. ^ "Notas de la versión 2.0.1 de P5". tei-c.org . 2012 . Consultado el 15 de abril de 2012 .
  32. ^ "TEI: Iniciativa de codificación de texto".

Enlaces externos