Software de comparación de texto
Las herramientas de revisión asistida por computadora ( CAR ) son piezas de software basadas en algoritmos de análisis y comparación de texto . [1] Estas herramientas se centran en las diferencias entre dos documentos, teniendo en cuenta la tipografía de cada documento a través de un análisis inteligente.
Detectando diferencias
El análisis inteligente que utilizan las herramientas CAR detecta que las diferencias no tienen el mismo valor según su tipo y/o el campo/tema del documento. Por ejemplo, una diferencia en un número no es la misma si este número es una fecha, un precio, un número de página, un número de figura, una parte de una dirección, una nota al pie, un número de elemento de una lista, un número de título, etc.
- Una diferencia en el número de título o en el número de elemento de una lista puede no tener interés si estos números se volverán a calcular después, antes de imprimir o publicar mediante una herramienta de procesamiento de texto.
- Una pequeña diferencia numérica como "1" a "uno" o "1" a "1º" suele tener un interés secundario, según el tema y el campo del documento.
- Mientras que otras diferencias numéricas pueden ser muy perjudiciales para el documento.
Estas herramientas son interesantes en varios tipos de aplicaciones:
- Comparación entre un documento y una versión actualizada o modificada del mismo. El objetivo principal es entonces poner de relieve las modificaciones realizadas por una tercera persona o un software de procesamiento de textos.
- Comparación entre un documento editado en dos formatos de archivo: Word , TXT, PDF , HTML , XML . El objetivo principal es destacar las diferencias que implica la modificación del formato o el software de conversión/reformateo. A menudo, los problemas de conversión de codificación de caracteres simples pueden causar desastres.
Para traducción
Las herramientas de revisión asistida por ordenador para traducción (CART) son herramientas CAR capaces de gestionar comparaciones multilingües. Esto implica poder hacer coincidir cada parte del texto de un documento con el otro, teniendo en cuenta la especificidad de cada idioma: formatos de fecha/número, puntuación (por ejemplo, comillas en francés / inglés ), etc. Las mejores herramientas CART son capaces de encontrar coincidencias entre sustantivos o grupos verbales, lo que implica encontrar elementos terminológicos y sintácticos utilizando analizadores lingüísticos.
Ejemplos de aplicación
- Un autor de un libro que actualiza su documento (a menudo en formato Word) mientras recibe pruebas de imprenta (a menudo en PDF) o traducciones en otro idioma.
- Un administrador de contenidos de un sitio web que debe garantizar la actualización y la coherencia de las versiones de sus páginas HTML en diferentes idiomas.
- Un impresor que debe garantizar la consistencia y la calidad de su proceso, posiblemente utilizando formatos propietarios XML/SGML, algunos tratamientos automáticos, posibles intervenciones manuales, realizadas por él mismo o por un subcontratista.
- Un editor por el que transitan documentos de todos los actores
- El "historial" de MediaWiki en cada página es una herramienta CAR
Véase también
Referencias
- ^ Dong, Jielin; Zhu, Aarón; Zong, Lin (2007). Diccionario de red . Tecnologías Javvin. pag. 116.ISBN 9781602670006.
Enlaces externos
- CoquiWeb (herramienta CAR y CART todavía experimental).