stringtranslate.com

Texto formateado

En informática , el texto formateado , texto con estilo o texto enriquecido , a diferencia del texto simple , es texto digital que tiene información de estilo más allá del mínimo de elementos semánticos: colores, estilos ( negrita , cursiva ), tamaños y características especiales en HTML (como hipervínculos ).

Terminología

El texto formateado no se puede identificar correctamente con archivos binarios ni diferenciarse del texto ASCII. Esto se debe a que el texto formateado no es necesariamente binario, puede ser solo texto, como HTML , RTF o archivos de texto enriquecido , y puede ser solo ASCII. Por el contrario, un archivo de texto sin formato puede no ser ASCII (en una codificación como Unicode UTF-8 ). [ se necesita más explicación ] El texto formateado solo con texto se logra mediante un marcado que también es textual, mientras que algunos editores de texto formateado como Microsoft Word guardan en formato binario.

Comienzos de texto formateado

El texto formateado tiene su origen en el uso del subrayado para poner en negrita los pasajes en manuscritos escritos a máquina antes de la aparición de las computadoras . En los primeros sistemas interactivos de la tecnología informática, el subrayado no era posible y los usuarios compensaban esta carencia (y la falta de formato en ASCII) utilizando ciertos símbolos como sustitutos. El énfasis, por ejemplo, se podía lograr en ASCII de varias maneras: [1] [2]

Los guiones bajos también se usaban para los títulos de libros: búsquelo en _El_lenguaje_de_programación_C_.

Lenguajes de marcado

El formato se puede marcar con etiquetas que se distinguen del texto principal mediante caracteres especiales, como los corchetes angulares en HTML . Por ejemplo, este texto:

El perro está clasificado como Canis familiaris en taxonomía.

Está marcado en HTML de esta manera:

< p > El perro está clasificado como < i > Canis familiaris </ i > en taxonomía. </ p >

El texto en cursiva está encerrado por una etiqueta de cursiva de apertura y otra de cierre. En LaTeX , el texto se marcaría de la siguiente manera:

El perro está clasificado como \textit { Canis familiaris } en taxonomía.

La mayoría de los lenguajes de marcado se pueden editar con cualquier editor de texto , sin necesidad de software especial . Muchos lenguajes de marcado también se pueden editar con software especializado diseñado para automatizar algunas funciones o presentar el resultado como WYSIWYG .

Archivos de documentos formateados

Desde la invención de MacWrite , el primer procesador de textos WYSIWYG , en el que el mecanógrafo codifica el formato visualmente en lugar de insertar marcas de texto, los procesadores de texto han tendido a guardar en archivos binarios . Al abrir dichos archivos con un editor de texto , se revelan incrustados con varios caracteres binarios, ya sea alrededor del texto formateado (por ejemplo, en WordPerfect ) o separados de él, al principio o al final del archivo (por ejemplo, en Microsoft Word ).

Sin embargo, los documentos de texto formateados en archivos binarios tienen las desventajas del alcance del formato y la confidencialidad. Mientras que en los lenguajes de marcado el alcance del formato está marcado con precisión, el formato WYSIWYG se basa en la memoria, es decir, mantiene, por ejemplo, la pulsación del botón de negrita hasta que se cancele. Esto puede dar lugar a errores de formato y problemas de mantenimiento. En cuanto a la confidencialidad, los formatos de archivo de documentos de texto formateados tienden a ser propietarios y no están documentados, lo que genera dificultades en la compatibilidad de codificación por parte de terceros y también actualizaciones innecesarias debido a cambios de versión.

WordStar era un procesador de textos popular que no utilizaba archivos binarios con caracteres ocultos.

OpenOffice.org Writer guarda los archivos en formato XML . Sin embargo, el archivo resultante es binario, ya que está comprimido (un equivalente a un archivo tarball ).

PDF es otro formato de archivo de texto formateado que suele ser binario (utiliza compresión para el texto y almacena gráficos y fuentes en binario). Generalmente es un formato para el usuario final, escrito desde una aplicación como Microsoft Word u OpenOffice.org Writer, y el usuario no puede editarlo una vez finalizado.

Véase también

Referencias

  1. ^ Hambridge, Sally (octubre de 1995). «RFC1855: Netiquette Guidelines». IETF Datatracker, Grupo de trabajo de ingeniería de Internet . Consultado el 4 de febrero de 2024 .
  2. ^ Mullen, Ed (26 de julio de 2015). "Texto estructurado". edmullen.net . Consultado el 4 de febrero de 2024 .