La coincidencia difusa es una técnica utilizada en la traducción asistida por computadora como un caso especial de vinculación de registros . Funciona con coincidencias que pueden ser menos del 100% perfectas al buscar correspondencias entre segmentos de un texto y entradas en una base de datos de traducciones anteriores. Por lo general, opera en segmentos a nivel de oración , pero algunas tecnologías de traducción permiten la coincidencia a nivel de frase . Se utiliza cuando el traductor está trabajando con una memoria de traducción (TM). Utiliza la coincidencia aproximada de cadenas .
Cuando no se puede encontrar una coincidencia exacta en la base de datos de la memoria de traducción para el texto que se está traduciendo, existe una opción para buscar una coincidencia que no sea exacta; el traductor establece el umbral de la coincidencia aproximada en un valor porcentual inferior al 100% y la base de datos devolverá las coincidencias en su memoria que correspondan a ese porcentaje. Su función principal es ayudar al traductor acelerando el proceso de traducción; la coincidencia aproximada no está diseñada para reemplazar al traductor humano.
Debido a la naturaleza polimorfa y dinámica de los idiomas , en particular del inglés (que representa el 90 % de todos los textos fuente que se traducen en la industria de la localización [ cita requerida ] ), siempre se buscan métodos para que el proceso de traducción sea más fácil y rápido. Desde finales de la década de 1980, se han desarrollado herramientas de memoria de traducción para aumentar la productividad y hacer que todo el proceso de traducción sea más rápido para el traductor.
En la década de 1990, la comparación difusa comenzó a despegar como una característica destacada de las herramientas de memoria de traducción y, a pesar de algunos problemas relacionados con el trabajo adicional que implica editar una "propuesta" de comparación difusa, sigue siendo un subconjunto popular de la memoria de traducción. Actualmente, es una característica de las herramientas de memoria de traducción más populares.
La herramienta de memoria de traducción busca en la base de datos segmentos que coincidan aproximadamente con un segmento del nuevo texto fuente que se va a traducir. La memoria de traducción, en efecto, "propone" la coincidencia al traductor; a continuación, el traductor debe aceptar esta propuesta o editarla para que coincida más plenamente con el nuevo texto fuente que se está traduciendo. De esta manera, la coincidencia aproximada puede acelerar el proceso de traducción y aumentar la productividad.
Esto plantea interrogantes sobre la calidad de las traducciones resultantes. En ocasiones, un traductor se ve presionado a entregar a tiempo y, por lo tanto, se ve obligado a aceptar una propuesta de comparación parcial sin comprobar su idoneidad y contexto. Las bases de datos de las MT se construyen con la información de numerosos traductores diferentes que trabajan en una variedad de textos diferentes, con el peligro de que las oraciones extraídas de este "tapiz" de palabras sean una mezcolanza de estilos cosida y la antítesis de la consistencia buscada, lo que algunos críticos han denominado "ensalada de oraciones". La cuestión de la confianza en las propuestas de la MT puede ser un problema cuando se intenta lograr un equilibrio entre un proceso de traducción más rápido y la calidad de esa traducción. Sin embargo, la comparación parcial sigue siendo una parte importante del conjunto de herramientas del traductor.