Word Error Rate

WER (del inglés Word Error Rate) es una medida comúnmente utilizada en la evaluación de sistemas de reconocimiento del habla o de traducción automática.

Calcula el número mínimo de inserciones, borrados y sustituciones de una palabra por otra, necesarios para transformar una frase en otra.

Esta medida se basa en la distancia de edición o distancia de Levenshtein, con la salvedad de que esta última se calcula a nivel de letra y WER lo hace a nivel de palabra.

En tareas tanto de traducción automática como de reconocimiento del habla, se calcula WER entre la frase generada por el sistema y una frase de referencia correcta.

donde Para hallar el valor mínimo de WER entre dos frases se utiliza un algoritmo de programación dinámica.

Si consideramos que

son las primeras

palabras de la frase generada y

primeras de la frase de referencia:

( i , j ) = min

{\displaystyle WER(i,j)=\min {\begin{cases}WER(i-1,j)+1\\WER(i,j-1)+1\\WER(i-1,j-1)+\Delta (i,j)\end{cases}}}

son diferentes y 0 si son iguales.