La ley de Twyman establece que «cualquier cifra que parezca interesante o diferente suele ser errónea», [1] siguiendo el principio de que «cuanto más inusuales o interesantes sean los datos, más probable es que hayan sido el resultado de un error de un tipo u otro». Lleva el nombre del investigador de medios y mercados Tony Twyman y ha sido descrita como una de las leyes más importantes del análisis de datos . [2] [3] [4]
La ley se basa en el hecho de que los errores en la medición y el análisis de datos pueden dar lugar a cantidades observadas que son muy diferentes de los valores típicos. Estos errores suelen ser más comunes que los cambios reales de magnitud similar en el proceso subyacente que se está midiendo. Por ejemplo, si un analista de una empresa de software advierte que el número de usuarios se ha duplicado de la noche a la mañana, la explicación más probable es un error en el registro , en lugar de un aumento real de usuarios. [3]
La ley también puede extenderse a situaciones en las que los datos subyacentes están influenciados por factores inesperados que difieren de lo que se pretendía medir. Por ejemplo, cuando las escuelas muestran mejoras inusualmente grandes en los puntajes de las pruebas , las investigaciones posteriores suelen revelar que esos puntajes fueron impulsados por fraude . [5] [6]