La equiparación de pruebas se refiere tradicionalmente al proceso estadístico de determinar puntuaciones comparables en diferentes formas de un examen . [1] Se puede lograr utilizando la teoría clásica de pruebas o la teoría de respuesta al ítem .
En la teoría de respuesta al ítem, la equiparación [2] es el proceso de colocar las puntuaciones de dos o más formularios de prueba paralelos en una escala de puntuación común. El resultado es que las puntuaciones de dos formularios de prueba diferentes se pueden comparar directamente o tratar como si vinieran del mismo formulario de prueba. Cuando las pruebas no son paralelas, el proceso general se llama vinculación. Es el proceso de equiparar las unidades y los orígenes de dos escalas en las que se han estimado las habilidades de los estudiantes a partir de los resultados de diferentes pruebas. El proceso es análogo a equiparar grados Fahrenheit con grados Celsius convirtiendo las mediciones de una escala a la otra. La determinación de puntuaciones comparables es un subproducto de la equiparación que resulta de equiparar las escalas obtenidas a partir de los resultados de las pruebas.
Supongamos que Dick y Jane se presentan a un examen para obtener la licencia para ejercer una determinada profesión. Como el alto riesgo (se puede ejercer la profesión si se aprueba el examen) puede crear la tentación de hacer trampa, la organización que supervisa el examen crea dos formularios. Si sabemos que Dick obtuvo un 60 % en el formulario A y Jane un 70 % en el formulario B, ¿sabemos con certeza cuál de los dos tiene un mejor dominio del material? ¿Y si el formulario A está compuesto de ítems muy difíciles, mientras que el formulario B es relativamente fácil? Se realizan análisis de equiparación para abordar esta misma cuestión, de modo que las puntuaciones sean lo más justas posible.
En la teoría de respuesta al ítem , las "ubicaciones" de las personas (medidas de alguna calidad que se evalúan mediante una prueba) se estiman en una escala de intervalo ; es decir, las ubicaciones se estiman en relación con una unidad y un origen. Es común en la evaluación educativa emplear pruebas para evaluar diferentes grupos de estudiantes con la intención de establecer una escala común equiparando los orígenes y, cuando sea apropiado, también las unidades de las escalas obtenidas a partir de los datos de respuesta de las diferentes pruebas. El proceso se conoce como equiparación o equiparación de pruebas.
En la teoría de respuesta al ítem, existen dos tipos diferentes de equiparación: la equiparación horizontal y la equiparación vertical. [3] La equiparación vertical se refiere al proceso de equiparar pruebas administradas a grupos de estudiantes con diferentes habilidades, como estudiantes en diferentes grados (años de escolaridad). [4] La equiparación horizontal se refiere a la equiparación de pruebas administradas a grupos con habilidades similares; por ejemplo, dos pruebas administradas a estudiantes en el mismo grado en dos años calendario consecutivos. Se utilizan diferentes pruebas para evitar efectos de práctica.
En términos de la teoría de respuesta a los ítems, la equiparación es solo un caso especial del proceso más general de escalamiento , aplicable cuando se utiliza más de una prueba. Sin embargo, en la práctica, el escalamiento a menudo se implementa por separado para diferentes pruebas y luego se equiparan las escalas.
A menudo se hace una distinción entre dos métodos de equiparación: la equiparación de personas comunes y la equiparación de ítems comunes . La equiparación de personas comunes implica la administración de dos pruebas a un grupo común de personas. La media y la desviación estándar de las posiciones de escala de los grupos en las dos pruebas se equiparan utilizando una transformación lineal. La equiparación de ítems comunes implica el uso de un conjunto de ítems comunes denominados prueba de anclaje integrados en dos pruebas diferentes. Se equipara la posición media de los ítems comunes.
En la teoría clásica de los tests, la igualación de medias simplemente ajusta la distribución de las puntuaciones de modo que la media de una forma sea comparable con la media de la otra. Si bien la igualación de medias es atractiva debido a su simplicidad, carece de flexibilidad, es decir, no tiene en cuenta la posibilidad de que las desviaciones estándar de las formas difieran. [1]
La igualación lineal se ajusta de modo que las dos formas tengan una media y una desviación estándar comparables . Existen varios tipos de igualación lineal que difieren en los supuestos y las matemáticas utilizadas para estimar los parámetros. Los métodos de puntuación observada de Tucker y Levine estiman la relación entre las puntuaciones observadas en las dos formas, mientras que el método de puntuación real de Levine estima la relación entre las puntuaciones reales en las dos formas. [1]
La equiparación de percentiles determina la relación de equiparación como aquella en la que una puntuación podría tener un percentil equivalente en cualquiera de las formas. Esta relación puede ser no lineal.
A diferencia de la teoría de respuesta a los ítems, la equiparación basada en la teoría clásica de las pruebas es algo distinta de la escala. La equiparación es una transformación de bruto a bruto en el sentido de que estima una puntuación bruta en el Formulario B que es equivalente a cada puntuación bruta en el Formulario A base. Cualquier transformación de escala utilizada se aplica luego sobre la equiparación o con ella.