Teoría de la generalización

La teoría de la generalización , o teoría G , es un marco estadístico para conceptualizar, investigar y diseñar observaciones confiables . Se utiliza para determinar la confiabilidad (es decir, la reproducibilidad) de mediciones en condiciones específicas. Es particularmente útil para evaluar la confiabilidad de las evaluaciones de desempeño. Fue introducido originalmente en Cronbach, LJ , Rajaratnam, N. y Gleser, GC (1963).

Descripción general

En la teoría G, las fuentes de variación se denominan facetas . Las facetas son similares a los "factores" utilizados en el análisis de varianza y pueden incluir personas, evaluadores, elementos/formas, tiempo y entornos, entre otras posibilidades. Estas facetas son fuentes potenciales de error y el propósito de la teoría de la generalización es cuantificar la cantidad de error causado por cada faceta y la interacción de las facetas. La utilidad de los datos obtenidos de un estudio G depende crucialmente del diseño del estudio. Por lo tanto, el investigador debe considerar cuidadosamente las formas en que espera generalizar cualquier resultado específico. ¿Es importante generalizar de un entorno a un número mayor de entornos? ¿De un evaluador a un mayor número de evaluadores? ¿De un conjunto de elementos a un conjunto de elementos más grande? Las respuestas a estas preguntas variarán de un investigador a otro e impulsarán el diseño de un estudio G de diferentes maneras.

Además de decidir qué facetas el investigador generalmente desea examinar, es necesario determinar qué faceta servirá como objeto de medición (por ejemplo, la fuente sistemática de varianza) para los fines del análisis. Las restantes facetas de interés se consideran entonces fuentes de error de medición. En la mayoría de los casos, el objeto de medición será la persona a la que se le asigna un número/puntuación. En otros casos, puede ser un grupo o artistas, como un equipo o un salón de clases. Idealmente, casi toda la varianza medida se atribuirá al objeto de medición (por ejemplo, diferencias individuales), y sólo una cantidad insignificante de varianza se atribuirá a las facetas restantes (por ejemplo, evaluador, tiempo, entorno).

Los resultados de un estudio G también se pueden utilizar para informar una decisión, o estudio D. En un estudio D, podemos plantearnos la pregunta hipotética de "¿qué pasaría si se alteraran diferentes aspectos de este estudio?" Por ejemplo, una empresa de refrescos podría estar interesada en evaluar la calidad de un nuevo producto mediante el uso de una escala de calificación del consumidor. Al emplear un estudio D, sería posible estimar cómo cambiaría la consistencia de las calificaciones de calidad si a los consumidores se les hicieran 10 preguntas en lugar de 2, o si 1.000 consumidores calificaran el refresco en lugar de 100. Al emplear estudios D simulados, es Por lo tanto, es posible examinar cómo los coeficientes de generalización (similares a los coeficientes de confiabilidad en la teoría de pruebas clásica ) cambiarían bajo diferentes circunstancias y, en consecuencia, determinar las condiciones ideales bajo las cuales nuestras mediciones serían las más confiables.

Comparación con la teoría clásica de las pruebas.

El objetivo de la teoría clásica de las pruebas (CTT) es determinar el error de medición. Quizás el modelo más famoso de CTT sea la ecuación , donde X es la puntuación observada, T es la puntuación real y e es el error involucrado en la medición. Aunque e podría representar muchos tipos diferentes de error, como el error del evaluador o del instrumento, CTT solo nos permite estimar un tipo de error a la vez. Básicamente, agrupa todas las fuentes de error en un solo término de error. Esto puede ser adecuado en el contexto de condiciones de laboratorio altamente controladas, pero la variación es parte de la vida cotidiana. En la investigación de campo, por ejemplo, no es realista esperar que las condiciones de medición permanezcan constantes. La teoría de la generalización reconoce y permite la variabilidad en las condiciones de evaluación que pueden afectar las mediciones. La ventaja de la teoría G radica en el hecho de que los investigadores pueden estimar qué proporción de la varianza total en los resultados se debe a factores individuales que a menudo varían en la evaluación, como el entorno, el tiempo, los ítems y los evaluadores. $X=T+E$

Otra diferencia importante entre la teoría CTT y la teoría G es que el último enfoque tiene en cuenta cómo puede cambiar la consistencia de los resultados si se utiliza una medida para tomar decisiones absolutas versus relativas. Un ejemplo de una decisión absoluta o basada en criterios sería cuando la puntuación de una prueba de un individuo se compara con una puntuación de corte para determinar la elegibilidad o el diagnóstico (es decir, la puntuación de un niño en una prueba de rendimiento se utiliza para determinar la elegibilidad para un programa para superdotados). ). Por el contrario, un ejemplo de decisión relativa, o basada en normas, sería cuando la puntuación de la prueba del individuo se utiliza para (a) determinar la posición relativa en comparación con sus compañeros (es decir, se utiliza la puntuación de un niño en una subprueba de lectura para determinar en qué grupo de lectura está ubicado), o (b) hacer comparaciones intraindividuales (es decir, comparar el desempeño anterior versus el actual dentro del mismo individuo). El tipo de decisión que le interesa al investigador determinará qué fórmula se debe utilizar para calcular el coeficiente de generalización (similar al coeficiente de confiabilidad en CTT).

Ver también

Teoría de la respuesta al ítem

Referencias

Brennan, RL (2001). Teoría de la generalización . Nueva York: Springer-Verlag.
Chiu, CWC (2001). Calificar evaluaciones de desempeño basadas en juicios: teoría de la generalización . Nueva York: Kluwer.
Crocker, L. y Algina, J. (1986). Introducción a la teoría de tests clásica y moderna . Nueva York: Harcourt Brace.
Cronbach, LJ, Gleser, GC, Nanda, H. y Rajaratnam, N. (1972). La confiabilidad de las mediciones de comportamiento: teoría de la generalización de puntuaciones y perfiles . Nueva York: John Wiley.
Cronbach, LJ, Nageswari, R. y Gleser, GC (1963). Teoría de la generalización: una liberalización de la teoría de la confiabilidad. La Revista Británica de Psicología Estadística, 16 , 137-163.
Shrout, PE y Fleiss, JL (1979). Correlaciones intraclase: usos para evaluar la confiabilidad del evaluador. Boletín psicológico, 86(2), 420–428. doi: 10.1037/0033-2909.86.2.420
Shavelson, RJ y Webb, Nuevo México (1991). Teoría de la generalización: introducción . Thousand Oaks, CA: Sage.

enlaces externos

Georg E. Matt, Teoría de la generalización
Teoría de la generalización basada en Rasch
Ralph Bloch, software G_String