Lenguaje de marcado

Varios programas pueden deducir la estructura del texto basándose en esta clase de datos, aunque el resultado suele ser bastante imperfecto.Por ejemplo, para formatear un título, debe haber una serie de directivas inmediatamente antes del texto en cuestión, indicándole al software instrucciones tales como centrar, aumentar el tamaño de la fuente, o cambiar a negrita.Inmediatamente después del título deberá haber etiquetas inversas que reviertan estos efectos.En sistemas más avanzados se utilizan macros o pilas que facilitan el trabajo.El software puede emplear este dato de múltiples maneras, incluyendo algunas no previstas por los diseñadores del estándar.Sin embargo, los buscadores los emplean para localizar nuevas páginas con información relacionada, o para evaluar la popularidad de determinado sitio web.Por ejemplo, un fragmento indicado como cursiva (texto), puede emplearse para marcar énfasis o bien para señalar palabras en otro idioma.Esta ambigüedad, presente en el marcado presentacional y en el procedimental, no puede soslayarse más que con una tediosa revisión a mano.Nótese que los lenguajes de ámbito general pueden usarse para aplicaciones más específicas (pero no al revés).Tunnicliffe, que prefería referirse a este concepto como codificación genérica (generic coding), dirigiría más tarde el desarrollo de un estándar al que bautizaría como GenCode, destinado a la industria editorial.El primer lenguaje que diferenció claramente la estructura de la presentación fue ciertamente el Scribe, desarrollado por Brian Reid y descrito en 1980 en su tesis doctoral.Su funcionalidad era limitada porque obligaba a trabajar mediante ensayo y error, hasta que las marcas insertadas en el texto ofrecieran el resultado deseado.Estos lenguajes no llegaron a cuajar en entornos profesionales, siendo utilizados por usuarios ocasionales.El marcado, por tanto, se centra en definir la estructura del texto y no su presentación visual.Sharon Adler, Anders Berglund y James D. Mason fueron también miembros de dicho comité.[4] El SGML especifica la sintaxis para la inclusión de marcas en los textos, así como la sintaxis del documento que especifica qué etiquetas están permitidas y dónde: el Document Type Definition o schema.Así, el SGML es, estrictamente hablando, un metalenguaje, del que se derivan varios lenguajes especializados.Desde finales de los 80 han aparecido nuevos lenguajes basados en SGML, como por ejemplo el TEI o el DocBook.Por ejemplo, ciertas etiquetas podían tener solo principio, o solo final, o incluso ser obviadas, pensando en que los textos serían redactados a mano y que así se ahorrarían pulsaciones de teclas.En 1991, parecía que los editores WYSIWYG (que almacenan los documentos en formatos binarios propietarios) abarcarían casi la totalidad del procesamiento de textos, relegando al SGML a usos profesionales o industriales muy específicos.La respuesta a los problemas surgidos en torno al HTML vino de la mano del XML (eXtensible Markup Language).El XML fue desarrollado por el World Wide Web Consortium,[6] mediante un comité creado y dirigido por Jon Bosak.El nuevo lenguaje se extendió con rapidez, ya que todo documento XML es a su vez SGML.El acierto fundamental de este lenguaje es que logra un equilibrio entre simplicidad y flexibilidad.Uno de los ejemplos más claros es el XHTML, la redefinición del HTML en clave XML, con las ventajas que ello supone.Sin embargo pronto se observó que sus virtudes podían ser útiles en campos bien distintos.El responsable de aquella decisión fue Jon Bosak, que más tarde fundaría el comité del XML.