stringtranslate.com

Teoría de la generalización

La teoría de la generalización , o teoría G , es un marco estadístico para conceptualizar, investigar y diseñar observaciones confiables . Se utiliza para determinar la confiabilidad (es decir, la reproducibilidad) de las mediciones en condiciones específicas. Es particularmente útil para evaluar la confiabilidad de las evaluaciones de desempeño. Fue introducida originalmente por Lee Cronbach , N. Rajaratnam y Goldine Gleser en 1963.

Descripción general

En la teoría G, las fuentes de variación se denominan facetas . Las facetas son similares a los "factores" utilizados en el análisis de varianza y pueden incluir personas, evaluadores, elementos/formularios, tiempo y entornos, entre otras posibilidades. Estas facetas son fuentes potenciales de error y el propósito de la teoría de generalización es cuantificar la cantidad de error causado por cada faceta y la interacción de facetas. La utilidad de los datos obtenidos de un estudio G depende crucialmente del diseño del estudio. Por lo tanto, el investigador debe considerar cuidadosamente las formas en que espera generalizar cualquier resultado específico. ¿Es importante generalizar de un entorno a un mayor número de entornos? ¿De un evaluador a un mayor número de evaluadores? ¿De un conjunto de elementos a un conjunto mayor de elementos? Las respuestas a estas preguntas variarán de un investigador a otro y conducirán el diseño de un estudio G de diferentes maneras.

Además de decidir qué facetas desea examinar el investigador en general, es necesario determinar qué faceta servirá como objeto de medición (por ejemplo, la fuente sistemática de varianza) para el propósito del análisis. Las facetas restantes de interés se consideran entonces fuentes de error de medición. En la mayoría de los casos, el objeto de medición será la persona a la que se le asigna un número/puntaje. En otros casos puede ser un grupo o intérpretes como un equipo o un aula. Idealmente, casi toda la varianza medida se atribuirá al objeto de medición (por ejemplo, diferencias individuales), con solo una cantidad insignificante de varianza atribuida a las facetas restantes (por ejemplo, evaluador, tiempo, entorno).

Los resultados de un estudio G también se pueden utilizar para fundamentar un estudio de decisión o D. En un estudio D, podemos plantear la pregunta hipotética de "¿qué pasaría si se modificaran diferentes aspectos de este estudio?". Por ejemplo, una empresa de refrescos podría estar interesada en evaluar la calidad de un nuevo producto mediante el uso de una escala de calificación de los consumidores. Al emplear un estudio D, sería posible estimar cómo cambiaría la consistencia de las calificaciones de calidad si se les hicieran a los consumidores 10 preguntas en lugar de 2, o si 1.000 consumidores calificaran el refresco en lugar de 100. Al emplear estudios D simulados, es posible, por tanto, examinar cómo cambiarían los coeficientes de generalización (similares a los coeficientes de fiabilidad en la teoría clásica de los tests ) en diferentes circunstancias y, en consecuencia, determinar las condiciones ideales en las que nuestras mediciones serían las más fiables.

Comparación con la teoría clásica de pruebas

El enfoque de la teoría clásica de pruebas (CTT) se centra en determinar el error de la medición. Quizás el modelo más famoso de CTT es la ecuación , donde X es la puntuación observada, T es la puntuación real y e es el error involucrado en la medición. Aunque e podría representar muchos tipos diferentes de error, como el error del evaluador o del instrumento, CTT solo nos permite estimar un tipo de error a la vez. Esencialmente, arroja todas las fuentes de error en un solo término de error. Esto puede ser adecuado en el contexto de condiciones de laboratorio altamente controladas, pero la varianza es parte de la vida cotidiana. En la investigación de campo, por ejemplo, no es realista esperar que las condiciones de medición permanezcan constantes. La teoría de la generalización reconoce y permite la variabilidad en las condiciones de evaluación que pueden afectar las mediciones. La ventaja de la teoría G radica en el hecho de que los investigadores pueden estimar qué proporción de la varianza total en los resultados se debe a los factores individuales que a menudo varían en la evaluación, como el entorno, el tiempo, los elementos y los evaluadores.

Otra diferencia importante entre la teoría CTT y la teoría G es que esta última tiene en cuenta cómo puede cambiar la consistencia de los resultados si se utiliza una medida para tomar decisiones absolutas o relativas. Un ejemplo de una decisión absoluta, o basada en criterios, sería cuando la puntuación de una prueba de un individuo se compara con una puntuación de corte para determinar la elegibilidad o el diagnóstico (es decir, la puntuación de un niño en una prueba de rendimiento se utiliza para determinar la elegibilidad para un programa para superdotados). Por el contrario, un ejemplo de una decisión relativa, o basada en normas, sería cuando la puntuación de la prueba del individuo se utiliza para (a) determinar la posición relativa en comparación con sus compañeros (es decir, la puntuación de un niño en una subprueba de lectura se utiliza para determinar en qué grupo de lectura se coloca), o (b) hacer comparaciones intraindividuales (es decir, comparar el rendimiento anterior con el actual dentro del mismo individuo). El tipo de decisión que le interese al investigador determinará qué fórmula se debe utilizar para calcular el coeficiente de generalización (similar a un coeficiente de fiabilidad en la CTT).

Véase también

Referencias

Enlaces externos