stringtranslate.com

Procesamiento de texto

En informática, el término procesamiento de texto se refiere a la teoría y práctica de automatizar la creación o manipulación de texto electrónico. El término texto se refiere generalmente a todos los caracteres alfanuméricos especificados en el teclado de la persona que realiza la práctica, pero en general, el término texto se refiere a la capa de abstracción inmediatamente superior a la codificación de caracteres estándar del texto de destino. El término procesamiento se refiere al procesamiento automatizado (o mecanizado), en contraposición a la misma manipulación realizada manualmente.

El procesamiento de texto implica comandos de computadora que invocan contenido, cambios de contenido y movimiento del cursor, por ejemplo para

El procesamiento de texto de una expresión regular es una máquina de edición virtual, que tiene un lenguaje de programación primitivo que tiene registros con nombre (identificadores) y posiciones con nombre en la secuencia de caracteres que componen el texto. Al utilizarlos, el "procesador de texto" puede, por ejemplo, marcar una región de texto y luego moverla. El procesamiento de texto de una utilidad es un programa de filtro o filter . Estos dos mecanismos comprenden el procesamiento de texto.

Definición

Dado que los códigos de escape ANSI generalmente son invisibles para el editor, comprenden un conjunto de propiedades transitorias que a veces se vuelven indistinguibles del procesamiento de textos . Pero las distinciones definitivas del procesamiento de textos son que el procesamiento de texto propiamente dicho:

De esta manera, el marcado como fuente y color no son realmente un factor distintivo, porque las secuencias de caracteres que afectan a la fuente y al color son simplemente caracteres estándar insertados automáticamente por un modo de procesamiento de texto en segundo plano , que los editores de texto compatibles hacen funcionar de forma transparente, pero que se vuelven visibles como comandos de procesamiento de texto cuando ese modo no está en efecto. Por lo tanto, el procesamiento de texto se define básicamente (pero no completamente) en torno a los caracteres visuales (o grafemas ) en lugar de los caracteres estándar, aunque invisibles.

Historia

El desarrollo del procesamiento de textos por computadora comenzó en serio con la formalización de Kleene de lo que es un lenguaje regular . Dichas expresiones regulares podrían luego convertirse en un miniprograma, completo con un proceso de compilación, disponible para realizar cualquier edición, una vez que se ampliara ese lenguaje. De manera similar, los filtros se amplían mediante la evolución de opciones particulares .

Conceptos básicos

Un editor básicamente invoca un flujo de entrada y lo dirige al entorno de procesamiento de texto, que puede ser un intérprete de comandos o un editor de texto . La salida resultante es aplicable a un procesamiento de texto posterior, cuyo resultado final es comparable a una única aplicación de un algoritmo aplicado una vez por un programa informático más sofisticado y estructurado.

El procesamiento de texto es, a diferencia de un algoritmo, una secuencia administrada manualmente de macros más simples que son las expresiones de acción de patrones y los mecanismos de filtrado. En ambos casos, la intención del programador se imprime indirectamente en un conjunto dado de caracteres textuales en el acto de procesamiento de texto. Los resultados de un paso de procesamiento de texto a veces son sólo esperanzadores, y el mecanismo intentado a menudo está sujeto a múltiples borradores mediante retroalimentación visual, hasta que se dominen por completo los detalles de la expresión regular o del lenguaje de marcado, o hasta que se dominen por completo las opciones de utilidad.

El procesamiento de texto se ocupa principalmente de la producción de caracteres textuales al más alto nivel de computación, donde sus actividades están justo debajo de los usos prácticos de la computación: la transmisión manual de información.

En última instancia, toda la informática es procesamiento de texto, desde los caracteres textuales autocompilados de un ensamblador, pasando por el lenguaje de programación automatizado generado para manejar una gran cantidad de datos gráficos, hasta los metacaracteres de expresiones regulares que preparan los documentos de texto existentes.

El procesamiento de texto es su propia automatización.

Personajes

Los caracteres textuales se presentan en conjuntos de caracteres estandarizados que también contienen caracteres de control, como caracteres de nueva línea, que organizan el texto. Otros tipos de caracteres de control organizan la transmisión, definen los conjuntos de caracteres y realizan otras tareas de mantenimiento.

Véase también

Enlaces externos