En estadística e investigación , la consistencia interna es típicamente una medida basada en las correlaciones entre diferentes ítems de la misma prueba (o la misma subescala de una prueba más grande). Mide si varios ítems que se proponen medir el mismo constructo general producen puntajes similares. Por ejemplo, si un encuestado expresó su acuerdo con las afirmaciones "Me gusta andar en bicicleta" y "He disfrutado andar en bicicleta en el pasado", y su desacuerdo con la afirmación "Odio las bicicletas", esto sería indicativo de una buena consistencia interna de la prueba.
La consistencia interna se mide habitualmente con el coeficiente alfa de Cronbach, un estadístico calculado a partir de las correlaciones por pares entre los ítems. La consistencia interna varía entre el infinito negativo y uno. El coeficiente alfa será negativo siempre que haya mayor variabilidad dentro de los sujetos que variabilidad entre sujetos. [1]
Una regla general comúnmente aceptada para describir la consistencia interna es la siguiente: [2]
No es necesariamente deseable tener una fiabilidad muy alta (0,95 o superior), ya que esto indica que los ítems pueden ser redundantes. [3] El objetivo de diseñar un instrumento fiable es que las puntuaciones de ítems similares estén relacionadas (que sean coherentes internamente), pero que cada una de ellas aporte también información única. Cabe señalar además que el alfa de Cronbach es necesariamente más alto para las pruebas que miden constructos más estrechos, y más bajo cuando se miden constructos más genéricos y amplios. Este fenómeno, junto con otras razones, es un argumento en contra del uso de valores de corte objetivos para las medidas de coherencia interna. [4] El alfa también es una función del número de ítems, por lo que las escalas más cortas a menudo tendrán estimaciones de fiabilidad más bajas, pero aun así serán preferibles en muchas situaciones porque suponen una carga menor.
Una forma alternativa de pensar en la consistencia interna es que es el grado en el que todos los ítems de una prueba miden la misma variable latente . La ventaja de esta perspectiva sobre la noción de una alta correlación promedio entre los ítems de una prueba –la perspectiva que subyace al alfa de Cronbach– es que la correlación promedio de los ítems se ve afectada por la asimetría (en la distribución de las correlaciones de los ítems) al igual que cualquier otro promedio. Por lo tanto, mientras que la correlación modal de los ítems es cero cuando los ítems de una prueba miden varias variables latentes no relacionadas, la correlación promedio de los ítems en tales casos será mayor que cero. Por lo tanto, mientras que el ideal de la medición es que todos los ítems de una prueba midan la misma variable latente, se ha demostrado muchas veces que el alfa alcanza valores bastante altos incluso cuando el conjunto de ítems mide varias variables latentes no relacionadas. [5] [6] [7] [8] [9] [10] [11] El "coeficiente omega" jerárquico puede ser un índice más apropiado del grado en el que todos los ítems de una prueba miden la misma variable latente. [12] [13] Revelle y Zinbarg (2009) analizan varias medidas diferentes de consistencia interna. [14] [15]