stringtranslate.com

Texto formateado

En informática , texto formateado , texto con estilo o texto enriquecido , a diferencia del texto sin formato , es texto digital que tiene información de estilo más allá del mínimo de elementos semánticos: colores, estilos ( negrita , cursiva ), tamaños y características especiales en HTML ( como hipervínculos ).

Terminología

El texto formateado no puede identificarse correctamente con archivos binarios ni distinguirse del texto ASCII. Esto se debe a que el texto formateado no es necesariamente binario; puede ser solo texto, como HTML , RTF o archivos de texto enriquecido , y puede ser solo ASCII. Por el contrario, un archivo de texto sin formato puede no ser ASCII (en una codificación como Unicode UTF-8 ). [ se necesita más explicación ] El texto formateado de solo texto se logra mediante marcado que también es textual, mientras que algunos editores de texto formateado como Microsoft Word guardan en formato binario.

Comienzos del texto formateado

El texto formateado tiene su génesis en el uso anterior a la computadora del subrayado para realzar pasajes en manuscritos mecanografiados . En los primeros sistemas interactivos de la tecnología informática temprana, el subrayado no era posible y los usuarios compensaban esta falta (y la falta de formato en ASCII) utilizando ciertos símbolos como sustitutos. El énfasis, por ejemplo, podría lograrse en ASCII de varias maneras: [1] [2]

Los guiones bajos también se utilizaron para los títulos de libros: búsquelo en _The_C_Programming_Language_.

Lenguajes de marcado

El formato se puede marcar mediante etiquetas que se distinguen del texto del cuerpo mediante caracteres especiales, como los corchetes angulares en HTML . Por ejemplo, este texto:

El perro está clasificado como Canis familiaris en taxonomía.

está marcado en HTML así:

< p > El perro está clasificado como < i > Canis familiaris </ i > en taxonomía. </p> _ _

El texto en cursiva está rodeado por una etiqueta de cursiva de apertura y cierre. En LaTeX , el texto estaría marcado así:

El perro se clasifica como \textit { Canis familiaris } en taxonomía.

La mayoría de los lenguajes de marcado se pueden editar con cualquier editor de texto , sin necesidad de software especial . Muchos lenguajes de marcado también se pueden editar con software especializado diseñado para automatizar algunas funciones o presentar el resultado como WYSIWYG .

Archivos de documentos formateados

Desde la invención de MacWrite , el primer procesador de texto WYSIWYG , en el que el mecanógrafo codifica el formato visualmente en lugar de insertar marcas textuales, los procesadores de texto han tendido a guardar en archivos binarios . Al abrir dichos archivos con un editor de texto, se muestran incrustados con varios caracteres binarios, ya sea alrededor del texto formateado (por ejemplo, en WordPerfect ) o separados de él, al principio o al final del archivo (por ejemplo, en Microsoft Word ).

Los documentos de texto formateados en archivos binarios tienen, sin embargo, las desventajas de su alcance y confidencialidad. Mientras que el alcance del formateo está marcado con precisión en los lenguajes de marcado, el formateo WYSIWYG se basa en la memoria, es decir, manteniendo presionado, por ejemplo, el botón en negrita hasta que se cancele. Esto puede provocar errores de formato y problemas de mantenimiento. En cuanto al secreto, los formatos de archivos de documentos de texto formateados tienden a ser propietarios y no estar documentados, lo que genera dificultades en la compatibilidad de codificación por parte de terceros y también actualizaciones innecesarias debido a cambios de versión.

WordStar era un popular procesador de textos que no utilizaba archivos binarios con caracteres ocultos.

OpenOffice.org Writer guarda archivos en formato XML . Sin embargo, el archivo resultante es binario ya que está comprimido (un equivalente tarball ).

PDF es otro formato de archivo de texto formateado que suele ser binario (utiliza compresión para el texto y almacena gráficos y fuentes en binario). Generalmente es un formato de usuario final, escrito desde una aplicación como Microsoft Word u OpenOffice.org Writer, y el usuario no lo puede editar una vez hecho.

Ver también

Referencias

  1. ^ Hambridge, Sally (octubre de 1995). "RFC1855: Directrices de netiqueta". IETF Datatracker, Grupo de Trabajo de Ingeniería de Internet . Consultado el 4 de febrero de 2024 .
  2. ^ Mullen, Ed (26 de julio de 2015). "Texto estructurado". edmullen.net . Consultado el 4 de febrero de 2024 .