stringtranslate.com

Invariancia de la medición

La invariancia de la medición o equivalencia de la medición es una propiedad estadística de la medición que indica que se está midiendo el mismo constructo en algunos grupos específicos. [1] Por ejemplo, la invariancia de la medición se puede utilizar para estudiar si una medida dada es interpretada de manera conceptualmente similar por encuestados que representan diferentes géneros o antecedentes culturales. Las violaciones de la invariancia de la medición pueden impedir una interpretación significativa de los datos de medición. Las pruebas de invariancia de la medición se utilizan cada vez más en campos como la psicología para complementar la evaluación de la calidad de la medición basada en la teoría clásica de las pruebas . [1]

La invariancia de la medición se prueba a menudo en el marco del análisis factorial confirmatorio de múltiples grupos (CFA). [2] En el contexto de los modelos de ecuaciones estructurales , incluido el CFA, la invariancia de la medición a menudo se denomina invariancia factorial . [3]

Definición

En el modelo de factor común , la invariancia de la medición puede definirse como la siguiente igualdad:

donde es una función de distribución, es una puntuación observada, es una puntuación factorial y s denota la pertenencia a un grupo (p. ej., caucásico=0, afroamericano=1). Por lo tanto, la invariancia de la medición implica que, dada la puntuación factorial de un sujeto, su puntuación observada no depende de su pertenencia a un grupo. [4]

Tipos de invariancia

Se pueden distinguir varios tipos diferentes de invariancia de medición en el modelo de factor común para resultados continuos: [5]

1) Forma igual : el número de factores y el patrón de relaciones factor-indicador son idénticos en todos los grupos.
2) Cargas iguales : Las cargas factoriales son iguales en todos los grupos.
3) Intersecciones iguales : cuando las puntuaciones observadas se regresionan en cada factor, las intersecciones son iguales en todos los grupos.
4) Varianzas residuales iguales : Las varianzas residuales de las puntuaciones observadas no explicadas por los factores son iguales entre los grupos.

La misma tipología se puede generalizar al caso de resultados discretos:

1) Forma igual : el número de factores y el patrón de relaciones factor-indicador son idénticos en todos los grupos.
2) Cargas iguales : Las cargas factoriales son iguales en todos los grupos.
3) Umbrales iguales : cuando se hace una regresión de las puntuaciones observadas en cada factor, los umbrales son iguales en todos los grupos.
4) Varianzas residuales iguales : Las varianzas residuales de las puntuaciones observadas no explicadas por los factores son iguales entre los grupos.

Cada una de estas condiciones corresponde a un modelo factorial confirmatorio de grupos múltiples con restricciones específicas. La viabilidad de cada modelo se puede probar estadísticamente mediante una prueba de razón de verosimilitud u otros índices de ajuste . Las comparaciones significativas entre grupos generalmente requieren que se cumplan las cuatro condiciones, lo que se conoce como invariancia de medición estricta . Sin embargo, la invariancia de medición estricta rara vez se cumple en un contexto aplicado. [6] Por lo general, esto se prueba introduciendo secuencialmente restricciones adicionales comenzando por la condición de forma igual y eventualmente procediendo a la condición de residuos iguales si el ajuste del modelo no se deteriora mientras tanto.

Pruebas de invariancia

Aunque se necesita más investigación sobre la aplicación de varias pruebas de invariancia y sus respectivos criterios en diversas condiciones de prueba, dos enfoques son comunes entre los investigadores aplicados. Para cada modelo que se compara (por ejemplo, forma igual, intersecciones iguales), se estima iterativamente una estadística de ajuste χ 2 a partir de la minimización de la diferencia entre las matrices de media y covarianza implícitas del modelo y las matrices de media y covarianza observadas. [7] Siempre que los modelos bajo comparación estén anidados, la diferencia entre los valores χ 2 y sus respectivos grados de libertad de dos modelos CFA cualesquiera con distintos niveles de invariancia sigue una distribución χ 2 (diff χ 2 ) y, como tal, se puede inspeccionar para determinar su significancia como una indicación de si los modelos cada vez más restrictivos producen cambios apreciables en el ajuste modelo-datos. [7] Sin embargo, hay alguna evidencia de que la diff χ 2 es sensible a factores no relacionados con los cambios en las restricciones de invariancia objetivo (por ejemplo, tamaño de la muestra). [8] Por consiguiente, se recomienda que los investigadores también utilicen la diferencia entre el índice de ajuste comparativo (ΔCFI) de dos modelos especificados para investigar la invariancia de la medición. Cuando la diferencia entre los CFI de dos modelos con distintos niveles de invariancia de la medición (por ejemplo, formas iguales frente a cargas iguales) es inferior a −0,01 (es decir, cae en más de 0,01), entonces es probable que la invariancia sea insostenible. [8] Se espera que los valores de CFI que se restan provengan de modelos anidados como en el caso de la prueba diff χ 2 ; [9] sin embargo, parece que los investigadores aplicados rara vez tienen esto en cuenta al aplicar la prueba de CFI. [10]

Niveles de equivalencia

La equivalencia también se puede categorizar según tres niveles jerárquicos de equivalencia de medición. [11] [12]

  1. Equivalencia configural: La estructura factorial es la misma en todos los grupos en un análisis factorial confirmatorio multigrupo.
  2. Equivalencia métrica: las cargas factoriales son similares entre los grupos. [11]
  3. Equivalencia escalar: los valores/medias también son equivalentes entre grupos. [11]

Implementación

Las pruebas de invariancia de medición están disponibles en el lenguaje de programación R. [ 13] [14]

Crítica

El conocido politólogo Christian Welzel y sus colegas critican la excesiva dependencia de las pruebas de invariancia como criterio de validez de los constructos culturales y psicológicos en las estadísticas transculturales . Han demostrado que los criterios de invariancia favorecen a los constructos con baja varianza entre grupos , mientras que los constructos con alta varianza entre grupos no superan estas pruebas. Una alta varianza entre grupos es de hecho necesaria para que un constructo sea útil en las comparaciones transculturales. La varianza entre grupos es máxima si algunas medias de grupo están cerca de los extremos de las escalas cerradas, donde la varianza intragrupo es necesariamente baja. Una baja varianza intragrupo produce correlaciones bajas y cargas factoriales bajas que los académicos interpretan rutinariamente como una indicación de inconsistencia. Welzel y sus colegas recomiendan, en cambio, confiar en los criterios nomológicos de validez de constructo basados ​​en si el constructo se correlaciona de las formas esperadas con otras medidas de diferencias entre grupos. Ofrecen varios ejemplos de constructos culturales que tienen un alto poder explicativo y poder predictivo en las comparaciones transculturales, pero no superan las pruebas de invariancia. [15] [16] Quienes defienden las pruebas de invariancia argumentan en contra que la confianza en el vínculo nomológico ignora que dicha validación externa depende del supuesto de comparabilidad. [17]

Véase también

Referencias

  1. ^ ab Vandenberg, Robert J.; Lance, Charles E. (2000). "Una revisión y síntesis de la literatura sobre invariancia de la medición: sugerencias, prácticas y recomendaciones para la investigación organizacional". Métodos de investigación organizacional . 3 : 4–70. doi :10.1177/109442810031002. S2CID  145605476.
  2. ^ Chen, Fang Fang; Sousa, Karen H.; West, Stephen G. (2005). "Prueba de invariancia de medición de modelos factoriales de segundo orden". Modelado de ecuaciones estructurales . 12 (3): 471–492. doi :10.1207/s15328007sem1203_7. S2CID  120893307.
  3. ^ Widaman, KF; Ferrer, E.; Conger, RD (2010). "Invariancia factorial dentro de modelos de ecuaciones estructurales longitudinales: medición del mismo constructo a lo largo del tiempo". Child Development Perspectives . 4 (1): 10–18. doi :10.1111/j.1750-8606.2009.00110.x. PMC 2848495 . PMID  20369028. 
  4. ^ Lubke, GH; et al. (2003). "Sobre la relación entre las fuentes de diferencias dentro y entre grupos y la invariancia de la medición en el modelo de factor común". Intelligence . 31 (6): 543–566. doi :10.1016/s0160-2896(03)00051-5.
  5. ^ Brown, T. (2015). Análisis factorial confirmatorio para la investigación aplicada, segunda edición. The Guilford Press.
  6. ^ Van De Schoot, Rens; Schmidt, Pedro; De Beuckelaer, Alain; Lek, Kimberley; Zondervan-Zwijnenburg, Marielle (1 de enero de 2015). "Editorial: Invariancia de medición". Fronteras en Psicología . 6 : 1064. doi : 10.3389/fpsyg.2015.01064 . PMC 4516821 . PMID  26283995. 
  7. ^ ab Loehlin, John (2004). Modelos de variables latentes: una introducción al análisis de factores, trayectorias y ecuaciones estructurales . Taylor & Francis. ISBN 9780805849103.
  8. ^ ab Cheung, GW; Rensvold, RB (2002). "Evaluación de índices de bondad de ajuste para probar la invariancia de la medición". Modelado de ecuaciones estructurales . 9 (2): 233–255. doi :10.1207/s15328007sem0902_5. S2CID  32598448.
  9. ^ Widaman, Keith F.; Thompson, Jane S. (1 de marzo de 2003). "Sobre la especificación del modelo nulo para índices de ajuste incremental en el modelado de ecuaciones estructurales". Métodos psicológicos . 8 (1): 16–37. CiteSeerX 10.1.1.133.489 . doi :10.1037/1082-989x.8.1.16. ISSN  1082-989X. PMID  12741671. 
  10. ^ Kline, Rex (2011). Principios y práctica del modelado de ecuaciones estructurales . Guilford Press.
  11. ^ abc Steenkamp, ​​Jan-Benedict EM; Baumgartner, Hans (1 de junio de 1998). "Evaluación de la invariancia de la medición en la investigación transnacional sobre consumo". Revista de investigación sobre consumo . 25 (1): 78–90. doi :10.1086/209528. ISSN  0093-5301. JSTOR  10.1086/209528.
  12. ^ Ariely, Gal; Davidov, Eldad (1 de septiembre de 2012). "Evaluación de la equivalencia de medición con encuestas transnacionales y longitudinales en ciencia política". European Political Science . 11 (3): 363–377. doi : 10.1057/eps.2011.11 . ISSN  1680-4333.
  13. ^ Hirschfeld, Gerrit; von Brachel, Ruth (2014). "Mejora del análisis factorial confirmatorio de grupos múltiples en R: un tutorial sobre invariancia de medición con indicadores continuos y ordinales". Evaluación práctica, investigación y evaluación . 19 . doi :10.7275/qazy-2946.
  14. ^ Kim, JY; Newman, DA; Harms, PD; Wood, D. (2023). "Percepción de rareza: un estudio multirasgo y multifuente de evaluaciones de normalidad propias y ajenas". Personality Science . 4 . doi : 10.5964/ps.7399 .
  15. ^ Welzel, Christian; Brunkert, Lennart; Kruse, Stefan; Inglehart, Ronald F. (2021). "¿No invariancia? Un problema exagerado con causas mal concebidas". Métodos sociológicos e investigación . 1 (33): 1368–1400. doi : 10.1177/0049124121995521 .
  16. ^ Welzel, Christian; Kruse, Stefan; Brunkert, Lennart (2022). "Contra la corriente dominante: sobre las limitaciones de los diagnósticos de no invariancia: respuesta a Fischer et al. y Meuleman et al". Métodos sociológicos e investigación . 52 (3): 00491241221091754. doi : 10.1177/00491241221091754 .
  17. ^ Meuleman, Bart; Żółtak, Tomasz (2022). "Por qué la invariancia de la medición es importante en la investigación comparativa. Una respuesta a Welzel et al. (2021)" (PDF) . Métodos sociológicos e investigación . 52 (3): 00491241221091755. doi :10.1177/00491241221091755.