stringtranslate.com

Modelo de Rasch politómico

El modelo politómico de Rasch es una generalización del modelo dicotómico de Rasch . Es un modelo de medición que tiene potencial aplicación en cualquier contexto en el que el objetivo sea medir un rasgo o habilidad mediante un proceso en el que las respuestas a ítems se puntúan con números enteros sucesivos . Por ejemplo, el modelo es aplicable al uso de escalas Likert , escalas de calificación y a ítems de evaluación educativa para los cuales puntuaciones enteras sucesivamente más altas pretenden indicar niveles crecientes de competencia o logro.

Antecedentes y descripción general

El modelo politómico de Rasch fue derivado por Andrich (1978), posterior a las derivaciones de Rasch (1961) y Andersen (1977), mediante la resolución de términos relevantes de una forma general del modelo de Rasch en parámetros de umbral y discriminación . Cuando se derivó el modelo, Andrich se centró en el uso de escalas Likert en psicometría , tanto con fines ilustrativos como para ayudar en la interpretación del modelo.

A veces se hace referencia al modelo como modelo de escala de calificación cuando (i) los elementos tienen el mismo número de umbrales y (ii) a su vez, la diferencia entre cualquier ubicación de umbral determinada y la media de las ubicaciones de los umbrales es igual o uniforme en todos los elementos. Sin embargo, este es un nombre potencialmente engañoso para el modelo porque su aplicación es mucho más general que las llamadas escalas de calificación. El modelo también se conoce a veces como Modelo de Crédito Parcial , particularmente cuando se aplica en contextos educativos. El modelo de crédito parcial (Masters, 1982) tiene una forma algebraica idéntica, pero se derivó de un punto de partida diferente en un momento posterior y se interpreta de una manera algo diferente. El Modelo de Crédito Parcial también permite diferentes umbrales para diferentes artículos. Aunque este nombre para el modelo se utiliza con frecuencia, Andrich (2005) proporciona un análisis detallado de los problemas asociados con elementos del enfoque de Masters, que se relacionan específicamente con el tipo de proceso de respuesta que es compatible con el modelo y con situaciones empíricas en las que Las estimaciones de las ubicaciones de los umbrales están desordenadas. Estas cuestiones se analizan en la elaboración del modelo que sigue.

El modelo es un modelo de medición probabilístico general que proporciona una base teórica para el uso de puntuaciones enteras secuenciales, de una manera que preserva la propiedad distintiva que define los modelos de Rasch: específicamente, las puntuaciones brutas totales son estadísticas suficientes para los parámetros de los modelos. Consulte el artículo principal sobre el modelo de Rasch para conocer más detalles sobre esta propiedad. Además de preservar esta propiedad, el modelo permite una prueba empírica estricta de la hipótesis de que las categorías de respuesta representan niveles crecientes de un atributo o rasgo latente y, por lo tanto, están ordenadas. La razón por la que el modelo proporciona una base para probar esta hipótesis es que es empíricamente posible que los umbrales no muestren el orden previsto.

En esta forma más general del modelo de Rasch para datos dicotómicos, la puntuación de un ítem particular se define como el recuento del número de ubicaciones de umbral del rasgo latente superadas por el individuo. Esto no significa que un proceso de medición implique realizar dichos conteos en un sentido literal; más bien, las ubicaciones de los umbrales en un continuo latente generalmente se infieren a partir de una matriz de datos de respuesta a través de un proceso de estimación como la estimación de máxima verosimilitud condicional . En general, la característica central del proceso de medición es que los individuos se clasifican en un conjunto de categorías ordenadas contiguas o contiguas. Un formato de respuesta empleado en un contexto experimental determinado puede lograr esto de varias maneras. Por ejemplo, los encuestados pueden elegir una categoría que consideren que refleja mejor su nivel de aprobación de una afirmación (como "muy de acuerdo"), los jueces pueden clasificar a las personas en categorías basándose en criterios bien definidos, o una persona puede categorizar un estímulo físico basándose en sobre la similitud percibida con un conjunto de estímulos de referencia.

El modelo politómico de Rasch se especializa en el modelo de datos dicotómicos cuando las respuestas se pueden clasificar en sólo dos categorías. En este caso especial, la dificultad del ítem y el umbral (único) son idénticos. El concepto de umbral se desarrolla en la siguiente sección.

El modelo politómico de Rasch

Primero, deja

Sea una variable aleatoria entera donde sea la puntuación máxima para el ítem i . Es decir, la variable es una variable aleatoria que puede tomar valores enteros entre 0 y un máximo de .

En el modelo politómico de Rasch (Andrich, 1978), la probabilidad del resultado es

donde es la k -ésima ubicación umbral del ítem i en un continuo latente, es la ubicación de la persona n en el mismo continuo y es la puntuación máxima para el ítem i . Estas ecuaciones son las mismas que

donde el valor de se elige por conveniencia computacional, es decir: .

El modelo de escala de calificación

De manera similar, el modelo de "Escala de calificación" de Rasch (Andrich, 1978) es

donde es la dificultad del ítem i y es la k -ésima ubicación del umbral de la escala de calificación que es común a todos los ítems. m es la puntuación máxima y es idéntica para todos los ítems. se elige por conveniencia computacional.

Solicitud

Aplicado en un contexto empírico determinado, el modelo puede considerarse una hipótesis matemática de que la probabilidad de un resultado determinado es una función probabilística de estos parámetros de persona y elemento. El gráfico que muestra la relación entre la probabilidad de una categoría determinada en función de la ubicación de la persona se denomina curva de probabilidad de categoría (CPC). En la Figura 1 se muestra un ejemplo de los CPC para un ítem con cinco categorías, puntuados de 0 a 4.

Figura 1: Curvas de probabilidad de categoría de Rasch para un ítem con cinco categorías ordenadas

Un umbral dado divide el continuo en regiones por encima y por debajo de su ubicación. El umbral corresponde a la ubicación en un continuo latente en el que es igualmente probable que una persona sea clasificada en categorías adyacentes y, por tanto, obtenga una de dos puntuaciones sucesivas. El primer umbral del ítem i , es la ubicación en el continuo en la que una persona tiene la misma probabilidad de obtener una puntuación de 0 o 1, el segundo umbral es la ubicación en la que una persona tiene la misma probabilidad de obtener una puntuación de 1 y 2, y así sucesivamente. En el ejemplo que se muestra en la Figura 1, las ubicaciones de los umbrales son −1,5, −0,5, 0,5 y 1,5 respectivamente.

Los encuestados pueden obtener puntuaciones de muchas maneras diferentes. Por ejemplo, cuando se emplean formatos de respuesta Likert, se puede asignar 0 a Totalmente en desacuerdo , 1 en desacuerdo , 2 de acuerdo y 3 de acuerdo . En el contexto de la evaluación en psicología educativa , se pueden otorgar puntuaciones enteras sucesivamente más altas de acuerdo con criterios explícitos. Criterios o descripciones que caracterizan niveles crecientes de logro en un dominio específico, como la comprensión lectora. La característica común y central es que algún proceso debe dar como resultado la clasificación de cada individuo en una de un conjunto de categorías ordenadas que colectivamente comprenden un ítem de evaluación.

Elaboración del modelo.

Al profundizar en las características del modelo, Andrich (2005) aclara que su estructura implica un proceso de clasificación simultáneo , que resulta en una única respuesta manifiesta , e involucra una serie de respuestas latentes dicotómicas. Además, las respuestas dicotómicas latentes operan dentro de una estructura de Guttman y un espacio de respuesta asociado, como se caracteriza a continuación.

Dejar

ser un conjunto de variables aleatorias dicotómicas independientes. Andrich (1978, 2005) muestra que el modelo politómico de Rasch requiere que estas respuestas dicotómicas se ajusten a un subespacio de respuesta de Guttman latente:

en el que x unos van seguidos de mx ceros. Por ejemplo, en el caso de dos umbrales, los patrones permitidos en este subespacio de respuesta son:

donde la puntuación entera x implícita en cada patrón (y viceversa) es como se muestra. La razón por la que este subespacio está implícito en el modelo es la siguiente. Dejar

Sea la probabilidad de que y sea . Esta función tiene la estructura del modelo de Rasch para datos dicotómicos. A continuación, considere la siguiente probabilidad condicional en el caso de dos umbrales:

Se puede demostrar que esta probabilidad condicional es igual a

que, a su vez, es la probabilidad dada por el modelo politómico de Rasch. Del denominador de estas ecuaciones se puede ver que la probabilidad en este ejemplo está condicionada a los patrones de respuesta de o . Por tanto, es evidente que, en general, el subespacio de respuesta , como se definió anteriormente, es intrínseco a la estructura del modelo politómico de Rasch. Esta restricción en el subespacio es necesaria para justificar la puntuación entera de las respuestas: es decir, de modo que la puntuación sea simplemente el recuento de umbrales ordenados superados. Andrich (1978) demostró que para esta justificación también es necesaria una discriminación igual en cada uno de los umbrales.

En el modelo politómico de Rasch, una puntuación de x en un ítem dado implica que un individuo ha superado simultáneamente x umbrales por debajo de una determinada región del continuo y no ha logrado superar los m  −  x umbrales restantes por encima de esa región. Para que esto sea posible, los umbrales deben estar en su orden natural, como se muestra en el ejemplo de la Figura 1. Las estimaciones de umbrales desordenadas indican una falla en la construcción de un contexto de evaluación en el que las clasificaciones representadas por puntuaciones sucesivas reflejen niveles crecientes de la capacidad latente. rasgo. Por ejemplo, consideremos una situación en la que hay dos umbrales y en la que la estimación del segundo umbral es inferior en el continuo que la estimación del primer umbral. Si las ubicaciones se toman literalmente, la clasificación de una persona en la categoría 1 implica que la ubicación de la persona supera simultáneamente el segundo umbral pero no supera el primero. A su vez, esto implica un patrón de respuesta {0,1}, un patrón que no pertenece al subespacio de patrones que es intrínseco a la estructura del modelo, como se describió anteriormente.

Cuando las estimaciones de los umbrales están desordenadas, no pueden tomarse literalmente; más bien, el desorden, en sí mismo, indica inherentemente que las clasificaciones no satisfacen criterios que lógicamente deben satisfacerse para justificar el uso de puntuaciones enteras sucesivas como base para la medición. Para enfatizar este punto, Andrich (2005) utiliza un ejemplo en el que se otorgan calificaciones de reprobado, aprobado, crédito y distinción. Estas calificaciones, o clasificaciones, generalmente pretenden representar niveles crecientes de logro. Consideremos una persona A, cuya ubicación en el continuo latente se encuentra en el umbral entre las regiones del continuo en las que es más probable que se conceda un pase y un crédito. Consideremos también otra persona B, cuya ubicación se encuentra en el umbral entre las regiones en las que es más probable que se conceda un crédito y una distinción. En el ejemplo considerado por Andrich (2005, p. 25), los umbrales desordenados, si se toman literalmente, implicarían que la ubicación de la persona A (en el umbral de aprobación/crédito) es mayor que la de la persona B (en el umbral de crédito/distinción). límite). Es decir, tomado literalmente, las ubicaciones desordenadas de los umbrales implicarían que una persona necesitaría demostrar un mayor nivel de logro para estar en el umbral de aprobación/crédito que el que sería necesario para estar en el umbral de crédito/distinción. Claramente, esto no está de acuerdo con la intención de tal sistema de calificación. Por lo tanto, el desorden de los umbrales indicaría que la manera en que se otorgan las calificaciones no está de acuerdo con la intención del sistema de calificación. Es decir, el desorden indicaría que la hipótesis implícita en el sistema de calificaciones (que las calificaciones representan clasificaciones ordenadas de desempeño creciente) no está sustentada por la estructura de los datos empíricos.

Referencias

enlaces externos