La repetibilidad o confiabilidad test-retest [1] es la proximidad de la concordancia entre los resultados de mediciones sucesivas de la misma medida, cuando se llevan a cabo bajo las mismas condiciones de medición. [2] En otras palabras, las mediciones son tomadas por una sola persona o instrumento sobre el mismo elemento, bajo las mismas condiciones y en un corto período de tiempo. Una confiabilidad test-retest menos que perfecta causa variabilidad test-retest . Dicha variabilidad puede ser causada, por ejemplo, por variabilidad intraindividual y variabilidad interobservador . Se puede decir que una medición es repetible cuando esta variación es menor que un criterio de aceptación predeterminado.
La variabilidad test-retest se utiliza en la práctica, por ejemplo, en el seguimiento médico de enfermedades. En estas situaciones, suele haber una "diferencia crítica" predeterminada y, en el caso de diferencias en los valores controlados que sean menores que esta diferencia crítica, puede considerarse la posibilidad de que la variabilidad sea la única causa de la diferencia, además de, por ejemplo, cambios en las enfermedades o los tratamientos. [3]
Para establecer la repetibilidad se deben cumplir las siguientes condiciones: [2] [4]
Los métodos de repetibilidad fueron desarrollados por Bland y Altman (1986). [5]
Si la correlación entre administraciones separadas de la prueba es alta (por ejemplo, 0,7 o más alta como en esta tabla de consistencia interna alfa de Cronbach [6] ), entonces tiene una buena confiabilidad test-retest.
El coeficiente de repetibilidad es una medida de precisión que representa el valor por debajo del cual se puede esperar que la diferencia absoluta entre dos resultados de pruebas repetidas se encuentre con una probabilidad del 95%. [ cita requerida ]
La desviación estándar en condiciones de repetibilidad es parte de la precisión y exactitud . [ cita requerida ]
Un análisis de acuerdo de atributos está diseñado para evaluar simultáneamente el impacto de la repetibilidad y la reproducibilidad en la precisión. Permite al analista examinar las respuestas de varios revisores mientras analizan varios escenarios varias veces. Produce estadísticas que evalúan la capacidad de los evaluadores para estar de acuerdo consigo mismos (repetibilidad), entre ellos ( reproducibilidad ) y con un valor maestro o correcto conocido (precisión general) para cada característica, una y otra vez. [7]
Como la misma prueba se administra dos veces y cada prueba es paralela a sí misma, las diferencias entre las puntuaciones de la prueba y las puntuaciones de la segunda prueba deberían deberse únicamente a un error de medición. Este tipo de argumento es muy probablemente cierto para muchas mediciones físicas. Sin embargo, este argumento es a menudo inadecuado para la medición psicológica, porque a menudo es imposible considerar la segunda administración de una prueba como una medida paralela a la primera. [8]
La segunda administración de una prueba psicológica podría producir puntuaciones sistemáticamente diferentes a las de la primera administración debido a las siguientes razones: [8]
{{cite book}}
: CS1 maint: varios nombres: lista de autores ( enlace )