NIST es un método para evaluar la calidad de un texto que ha sido traducido mediante traducción automática . Su nombre proviene del Instituto Nacional de Estándares y Tecnología de Estados Unidos .
Se basa en la métrica BLEU , pero con algunas modificaciones. Mientras que BLEU simplemente calcula la precisión de los n-gramas sumando el mismo peso a cada uno, NIST también calcula qué tan informativo es un n-grama en particular . Es decir, cuando se encuentra un n-grama correcto , cuanto más raro sea, más peso se le dará. [1]
Por ejemplo, si el bigrama "en el" coincide correctamente, recibirá un peso menor que la coincidencia correcta del bigrama "cálculos interesantes", ya que es menos probable que esto ocurra.
El NIST también se diferencia de BLEU en su cálculo de la penalización por brevedad en la medida en que pequeñas variaciones en la longitud de la traducción no afectan tanto la puntuación general.
Resultados oficiales de la evaluación de traducción automática del NIST 2005