WER (del inglés Word Error Rate) es una medida comúnmente utilizada en la evaluación de sistemas de reconocimiento del habla o de traducción automática.
Calcula el número mínimo de inserciones, borrados y sustituciones de una palabra por otra, necesarios para transformar una frase en otra.
Esta medida se basa en la distancia de edición o distancia de Levenshtein, con la salvedad de que esta última se calcula a nivel de letra y WER lo hace a nivel de palabra.
En tareas tanto de traducción automática como de reconocimiento del habla, se calcula WER entre la frase generada por el sistema y una frase de referencia correcta.
donde Para hallar el valor mínimo de WER entre dos frases se utiliza un algoritmo de programación dinámica.
Si consideramos que
son las primeras
palabras de la frase generada y
primeras de la frase de referencia:
( i , j ) = min
{\displaystyle WER(i,j)=\min {\begin{cases}WER(i-1,j)+1\\WER(i,j-1)+1\\WER(i-1,j-1)+\Delta (i,j)\end{cases}}}
son diferentes y 0 si son iguales.