stringtranslate.com

Procesamiento de texto

En informática, el término procesamiento de texto se refiere a la teoría y práctica de automatizar la creación o manipulación de texto electrónico. El texto generalmente se refiere a todos los caracteres alfanuméricos especificados en el teclado de la persona que realiza la práctica, pero en general texto significa la capa de abstracción inmediatamente encima de la codificación de caracteres estándar del texto de destino. El término procesamiento se refiere al procesamiento automatizado (o mecanizado), a diferencia de la misma manipulación realizada manualmente.

El procesamiento de texto implica comandos informáticos que invocan contenido, cambios de contenido y movimiento del cursor, por ejemplo para

El procesamiento de texto de una expresión regular es una máquina de edición virtual, que tiene un lenguaje de programación primitivo que tiene registros con nombre (identificadores) y posiciones con nombre en la secuencia de caracteres que componen el texto. Con ellos, el "procesador de textos" puede, por ejemplo, marcar una región de texto y luego moverla. El procesamiento de texto de una utilidad es un programa de filtrado , o filtro . Estos dos mecanismos comprenden el procesamiento de textos.

Definición

Dado que el marcado estandarizado, como los códigos de escape ANSI, generalmente son invisibles para el editor, comprenden un conjunto de propiedades transitorias que a veces se vuelven indistinguibles del procesamiento de textos . Pero la diferencia definitiva con el procesamiento de textos es que el procesamiento de textos propiamente dicho:

De esta manera, las marcas como la fuente y el color no son realmente un factor distintivo, porque las secuencias de caracteres que afectan la fuente y el color son simplemente caracteres estándar insertados automáticamente mediante un modo de procesamiento de texto en segundo plano , hechos para funcionar de forma transparente mediante editores de texto compatibles, pero convirtiéndose en lo contrario. visibles como comandos de procesamiento de texto cuando ese modo no está vigente. Por lo tanto, el procesamiento de texto se define básicamente (pero no completamente) en torno a los caracteres visuales (o grafemas ) en lugar de los caracteres estándar, aunque invisibles.

Historia

El desarrollo del procesamiento de textos por computadora comenzó en serio cuando Kleene formalizó lo que es un lenguaje regular . Estas expresiones regulares podrían luego convertirse en un miniprograma, completo con un proceso de compilación, disponible para realizar cualquier edición, una vez que ese lenguaje se haya extendido. De manera similar, los filtros se amplían mediante la evolución de opciones particulares .

Conceptos básicos

Básicamente, un editor invoca un flujo de entrada y lo dirige al entorno de procesamiento de texto, que puede ser un shell de comandos o un editor de texto . El resultado resultante se puede aplicar a un procesamiento posterior de texto, cuyo resultado final es comparable a una sola aplicación de un algoritmo aplicado una vez por un programa informático más sofisticado y estructurado.

El procesamiento de texto es, a diferencia de un algoritmo, una secuencia administrada manualmente de macros más simples que son expresiones de patrón-acción y mecanismos de filtrado. En cualquier caso, la intención del programador queda impresa indirectamente en un conjunto dado de caracteres textuales en el acto de procesar el texto. Los resultados de un paso de procesamiento de texto a veces son sólo esperanzadores, y el mecanismo intentado a menudo está sujeto a múltiples borradores a través de retroalimentación visual, hasta que se dominan por completo los detalles de la expresión regular o del lenguaje de marcado, o hasta que se dominan por completo las opciones de utilidad.

El procesamiento de texto se ocupa principalmente de producir caracteres textuales en el nivel más alto de la informática, donde sus actividades están justo por debajo de los usos prácticos de la informática: la transmisión manual de información.

En última instancia, toda la informática es procesamiento de texto, desde los caracteres textuales autocompilados de un ensamblador, pasando por el lenguaje de programación automatizado generado para manejar una masa de datos gráficos y, finalmente, hasta los metacaracteres de expresiones regulares que preparan los documentos de texto existentes.

El procesamiento de textos es su propia automatización.

Caracteres

Los caracteres textuales vienen en conjuntos de caracteres estandarizados que también contienen caracteres de control, como caracteres de nueva línea, que organizan el texto. Otros tipos de caracteres de control organizan la transmisión, definen los conjuntos de caracteres y realizan otras tareas domésticas.

Ver también

enlaces externos