Análisis compuesto confirmatorio

En estadística , el análisis compuesto confirmatorio ( CCA ) es un subtipo del modelado de ecuaciones estructurales (SEM). ^[1]^[2]^[3] Aunque, históricamente, el CCA surgió de una reorientación y reinicio del modelado de trayectorias de mínimos cuadrados parciales (PLS-PM), ^[4]^[5]^[6]^[7] se ha convertido en un enfoque independiente y los dos no deben confundirse. En muchos sentidos es similar, pero también bastante distinto, del análisis factorial confirmatorio (CFA). Comparte con el CFA el proceso de especificación del modelo, identificación del modelo, estimación del modelo y evaluación del modelo. Sin embargo, a diferencia del CFA que siempre supone la existencia de variables latentes , en el CCA todas las variables pueden ser observables, con sus interrelaciones expresadas en términos de compuestos, es decir, compuestos lineales de subconjuntos de las variables. Los compuestos se tratan como objetos fundamentales y se pueden utilizar diagramas de trayectoria para ilustrar sus relaciones. Esto hace que el CCA sea particularmente útil para las disciplinas que examinan conceptos teóricos que están diseñados para alcanzar ciertos objetivos, los llamados artefactos, ^[8] y su interacción con los conceptos teóricos de las ciencias del comportamiento. ^[9]

Desarrollo

La idea inicial de CCA fue esbozada por Theo K. Dijkstra y Jörg Henseler en 2014. ^[4] El proceso de publicación académica tomó su tiempo hasta que Florian Schuberth, Jörg Henseler y Theo K. Dijkstra publicaron la primera descripción completa de CCA en 2018. ^[2] Como es común para los desarrollos estadísticos, los desarrollos provisionales de CCA se compartieron con la comunidad científica en forma escrita. ^[10]^[9] Además, CCA se presentó en varias conferencias, incluida la 5.ª Conferencia de Métodos de Modelado Moderno, el 2.º Simposio Internacional sobre Modelado de Rutas de Mínimos Cuadrados Parciales, el 5.º Taller de la Comunidad CIM y la Reunión del Grupo de Trabajo SEM en 2018.

Modelo estadístico

Un compuesto es típicamente una combinación lineal de variables aleatorias observables. ^[11] Sin embargo, también son concebibles los llamados compuestos de segundo orden como combinaciones lineales de variables latentes y compuestos, respectivamente. ^[9]^[12]^[3]^[13]

Para un vector de columna aleatorio de variables observables que se divide en subvectores , los compuestos se pueden definir como combinaciones lineales ponderadas. Por lo tanto, el i -ésimo compuesto es igual a: $\mathbf {x}$ $\mathbf {x}_{i}$ $Estilo de visualización c_{i}}$

c_{i}=\mathbf {w}_{i}'\mathbf {x}_{i}

donde los pesos de cada compuesto están apropiadamente normalizados (ver Análisis compuesto confirmatorio#Identificación del modelo). A continuación, se supone que los pesos están escalados de tal manera que cada compuesto tiene una varianza de uno, es decir, . Además, se supone que las variables aleatorias observables están estandarizadas y tienen una media de cero y una varianza unitaria. Generalmente, las matrices de varianza-covarianza de los subvectores no están restringidas más allá de ser definidas positivas. De manera similar a las variables latentes de un modelo factorial, los compuestos explican las covarianzas entre los subvectores, lo que conduce a la siguiente matriz de covarianza entre bloques: $\mathbf {w} _{i}'\mathbf {\Sigma } _{ii}\mathbf {w} _{i}$ $\mathbf {\Sigma } _{ii}$

\mathbf {\Sigma } _{ij}=\rho _{ij}\mathbf {\Sigma } _{ii}\mathbf {w} _{i}(\mathbf {\Sigma } _{jj} \mathbf {w} _ {j})'

donde es la correlación entre los compuestos y . El modelo compuesto impone restricciones de rango uno en las matrices de covarianza entre bloques , es decir, . Generalmente, la matriz de varianza-covarianza de es definida positiva si y solo si la matriz de correlación de los compuestos y las matrices de varianza-covarianza de son ambas definidas positivas. ^[7] $\rho_{ij}$ $Estilo de visualización c_ {j}}$ $Estilo de visualización c_{i}}$ $\mathbf {\Sigma } _{ij}$ ${\text{rango}}(\mathbf {\Sigma } _{ij})=1$ $\mathbf {x}$ $\mathbf {R} :=(\rho _ {ij})$ $\mathbf {\Sigma } _{jj}$

Además, los compuestos se pueden relacionar a través de un modelo estructural que restringe la matriz de correlación indirectamente mediante un conjunto de ecuaciones simultáneas : ^[7] $\mathbf {R}$

\mathbf {B} \mathbf {c} _{\text{endógena}}=\mathbf {C} \mathbf {c} _{\text{exógena}}+\mathbf {z}

donde el vector se divide en una parte exógena y otra endógena, y las matrices y contienen los denominados coeficientes de trayectoria (y de retroalimentación). Además, el vector contiene los términos de error estructural que tienen una media cero y no están correlacionados con . Como el modelo no necesita ser recursivo, la matriz no es necesariamente triangular y los elementos de pueden estar correlacionados. $\mathbf {c}$ $\mathbf {B}$ $\mathbf {C}$ $\mathbf {z}$ $\mathbf {c} _{\text{exógeno}}$ $\mathbf {B}$ $\mathbf {z}$

Identificación del modelo

Para garantizar la identificación del modelo compuesto, cada compuesto debe estar correlacionado con al menos una variable que no forme el compuesto. Además de esta condición de no aislamiento, cada compuesto debe normalizarse, por ejemplo, fijando un peso por compuesto, la longitud de cada vector de peso o la varianza del compuesto en un valor determinado. ^[2] Si los compuestos están integrados en un modelo estructural, también es necesario identificar el modelo estructural. ^[7] Finalmente, dado que los signos de peso aún no están determinados, se recomienda seleccionar un indicador dominante por bloque de indicadores que dicte la orientación del compuesto. ^[3]

Los grados de libertad del modelo compuesto básico, es decir, sin restricciones impuestas a la matriz de correlación de los compuestos , se calculan de la siguiente manera: ^[2] $\mathbf {R}$

Estimación del modelo

Para estimar los parámetros de un modelo compuesto, se pueden utilizar varios métodos que crean compuestos ^[6], como enfoques de correlación canónica generalizada , análisis de componentes principales y análisis discriminante lineal . Además, se puede emplear un estimador de máxima verosimilitud ^[14]^[15]^[16] y métodos basados en compuestos para SEM, como el modelado de trayectorias de mínimos cuadrados parciales y el análisis de componentes estructurados generalizados ^[17] para estimar los pesos y las correlaciones entre los compuestos.

Evaluación del ajuste del modelo

En el CCA, el ajuste del modelo, es decir, la discrepancia entre la matriz de varianza-covarianza implícita del modelo estimada y su contraparte de muestra , se puede evaluar de dos maneras no excluyentes. Por un lado, se pueden emplear medidas de ajuste; por otro lado, se puede utilizar una prueba de ajuste general del modelo. Mientras que la primera se basa en reglas heurísticas, la segunda se basa en inferencias estadísticas. ${\hat {\mathbf {\Sigma } }}$ $\mathbf {S}$

Las medidas de ajuste para modelos compuestos incluyen estadísticas como el residuo cuadrático medio estandarizado (SRMR), ^[18]^[4] y el error cuadrático medio de los residuos externos (RMS ) ^[19]. A diferencia de las medidas de ajuste para modelos de factores comunes, las medidas de ajuste para modelos compuestos son relativamente inexploradas y aún se necesitan determinar umbrales confiables. Para evaluar el ajuste general del modelo por medio de pruebas estadísticas, se puede utilizar la prueba bootstrap para el ajuste general del modelo, ^[20] también conocida como prueba bootstrap de Bollen-Stine, ^[21] para investigar si un modelo compuesto se ajusta a los datos. ^[4]^[2] $_ {\theta}$

Puntos de vista alternativos sobre el CCA

Además del CCA propuesto originalmente, los pasos de evaluación conocidos del modelado de ecuaciones estructurales de mínimos cuadrados parciales ^[22] (PLS-SEM) se denominan CCA. ^[23]^[24] Se enfatiza que los pasos de evaluación de PLS-SEM, en lo sucesivo denominados PLS-CCA, difieren del CCA en muchos aspectos: ^[25] (i) Mientras que PLS-CCA tiene como objetivo conformar modelos de medición reflexivos y formativos, CCA tiene como objetivo evaluar modelos compuestos; (ii) PLS-CCA omite la evaluación general del ajuste del modelo, que es un paso crucial en CCA así como en SEM; (iii) PLS-CCA está fuertemente vinculado a PLS-PM, mientras que para CCA PLS-PM puede emplearse como un estimador, pero esto no es de ninguna manera obligatorio. Por lo tanto, los investigadores que lo emplean deben saber a qué técnica se están refiriendo.

Referencias

^ Henseler, Jörg; Schuberth, Florian (2020). "Uso del análisis compuesto confirmatorio para evaluar variables emergentes en la investigación empresarial". Revista de investigación empresarial . 120 : 147–156. doi : 10.1016/j.jbusres.2020.07.026 . hdl : 10362/103667 .
^ abcde Schuberth, Florian; Henseler, Jörg; Dijkstra, Theo K. (2018). "Análisis compuesto confirmatorio". Frontiers in Psychology . 9 : 2541. doi : 10.3389/fpsyg.2018.02541 . PMC 6300521 . PMID 30618962.
^ abc Henseler, Jörg; Hubona, Geoffrey; Ray, Pauline Ash (2016). "Uso del modelado de rutas PLS en la investigación de nuevas tecnologías: directrices actualizadas". Gestión industrial y sistemas de datos . 116 (1): 2–20. doi : 10.1108/IMDS-09-2015-0382 .
^ abcd Henseler, Jörg; Dijkstra, Theo K.; Sarstedt, Marko; Ringle, Christian M.; Diamantopoulos, Adamantios; Straub, Detmar W.; Ketchen, David J.; Hair, Joseph F.; Hult, G. Tomas M.; Calantone, Roger J. (2014). "Creencias comunes y realidad sobre PLS". Métodos de investigación organizacional . 17 (2): 182–209. doi : 10.1177/1094428114526928 . hdl : 10362/117915 .
^ Dijkstra, Theo K. (2010). "Variables latentes e índices: diseño básico de Herman Wold y mínimos cuadrados parciales". En Esposito Vinzi, Vincenzo; Chin, Wynne W.; Henseler, Jörg; Wang, Huiwen (eds.). Handbook of Partial Least Squares . Berlín, Heidelberg: Springer Handbooks of Computational Statistics. págs. 23–46. CiteSeerX 10.1.1.579.8461 . doi :10.1007/978-3-540-32827-8_2. ISBN 978-3-540-32825-4.
^ ab Dijkstra, Theo K.; Henseler, Jörg (2011). "Índices lineales en modelos de ecuaciones estructurales no lineales: índices adecuados de mejor ajuste y otros compuestos". Calidad y cantidad . 45 (6): 1505–1518. doi :10.1007/s11135-010-9359-z. S2CID 120868602.
^ abcd Dijkstra, Theo K. (2017). "Una correspondencia perfecta entre un modelo y un modo". En Latan, Hengky; Noonan, Richard (eds.). Modelado de trayectorias por mínimos cuadrados parciales: conceptos básicos, cuestiones metodológicas y aplicaciones . Cham: Springer International Publishing. págs. 55–80. doi :10.1007/978-3-319-64069-3_4. ISBN 978-3-319-64068-6.
^ Simon, Herbert A. (1969). Las ciencias de lo artificial (3.ª ed.). Cambridge, MA: MIT Press.
^ abc Henseler, Jörg (2017). "Uniendo el diseño y la investigación conductual con modelos de ecuaciones estructurales basados en varianza" (PDF) . Revista de publicidad . 46 (1): 178–192. doi : 10.1080/00913367.2017.1281780 .
^ Henseler, Jörg (2015). ¿El todo es más que la suma de sus partes? Sobre la interacción entre la investigación en marketing y diseño. Enschede: Universidad de Twente.
^ Bollen, Kenneth A.; Bauldry, Shawn (2011). "Las tres C en los modelos de medición: indicadores causales, indicadores compuestos y covariables". Psychological Methods . 16 (3): 265–284. doi :10.1037/a0024448. PMC 3889475 . PMID 21767021.
^ van Riel, Allard CR; Henseler, Jörg; Kemény, Ildikó; Sasovova, Zuzana (2017). "Estimación de construcciones jerárquicas utilizando mínimos cuadrados parciales consistentes: el caso de compuestos de segundo orden de factores comunes". Gestión industrial y sistemas de datos . 117 (3): 459–477. doi : 10.1108/IMDS-07-2016-0286 .
^ Schuberth, Florian; Rademaker, Manuel E; Henseler, Jörg (2020). "Estimación y evaluación de constructos de segundo orden utilizando PLS-PM: el caso de compuestos de compuestos". Gestión industrial y sistemas de datos . 120 (12): 2211–2241. doi :10.1108/IMDS-12-2019-0642. hdl : 10362/104253 . S2CID 225288321.
^ Henseler, Jörg y Schuberth, Florian (2021). "Capítulo 8: Análisis compuesto confirmatorio". En Henseler, Jörg (ed.). Modelado de ecuaciones estructurales basado en compuestos: análisis de variables latentes y emergentes . The Guilford Press. págs. 179–201. ISBN 9781462545605.
^ Schuberth, Florian (2023). "La especificación de Henseler-Ogasawara de compuestos en el modelado de ecuaciones estructurales: un tutorial". Métodos psicológicos . 28 (4): 843–859. doi :10.1037/met0000432. PMID 34914475. S2CID 237984577.
^ Yu, Xi; Schuberth, Florian; Henseler, Jörg (2023). "Especificación de compuestos en el modelado de ecuaciones estructurales: un refinamiento de la especificación de Henseler-Ogasawara". Análisis estadístico y minería de datos . 16 (4): 348–357. doi : 10.1002/sam.11608 . hdl : 10362/148024 .
^ Hwang, Heungsun; Takane, Yoshio (2004). "Análisis de componentes estructurados generalizados". Psychometrika . 69 (1): 81–99. doi :10.1007/BF02295841. S2CID 120403741.
^ Hu, Li-tze; Bentler, Peter M. (1998). "Índices de ajuste en el modelado de la estructura de covarianza: Sensibilidad a la especificación incorrecta del modelo con parámetros insuficientes". Psychological Methods . 3 (4): 424–453. doi :10.1037/1082-989X.3.4.424.
^ Lohmöller, Jan-Bernd (1989). Modelado de trayectorias de variables latentes con mínimos cuadrados parciales. Physica-Verlag Heidelberg. ISBN 9783642525148.
^ Beran, Rudolf; Srivastava, Muni S. (1985). "Pruebas bootstrap y regiones de confianza para funciones de una matriz de covarianza". Anales de estadística . 13 (1): 95–115. doi : 10.1214/aos/1176346579 .
^ Bollen, Kenneth A.; Stine, Robert A. (1992). "Bootstrapping de medidas de bondad de ajuste en modelos de ecuaciones estructurales". Métodos sociológicos e investigación . 21 (2): 205–229. doi :10.1177/0049124192021002004. S2CID 121228129.
^ Hair, Joe F.; Hult, G Tomas M.; Ringle, Christian M.; Sarstedt, Marko (2014). Introducción al modelado de ecuaciones estructurales por mínimos cuadrados parciales (PLS-SEM) . Thousand Oaks: Sage.
^ Hair, Joseph F.; Anderson, Drexel; Babin, Barry; Black, William (2018). Análisis de datos multivariados (8.ª ed.). Cengage Learning EMEA. ISBN 978-1473756540.
^ Hair, Joe F.; Howard, Matt C.; Nitzl, Christian (marzo de 2020). "Evaluación de la calidad del modelo de medición en PLS-SEM mediante análisis compuesto confirmatorio". Revista de investigación empresarial . 109 : 101–110. doi :10.1016/j.jbusres.2019.11.069. S2CID 214571652.
^ Schuberth, Florian (2021). "Análisis compuesto confirmatorio mediante mínimos cuadrados parciales: aclarando las cosas". Review of Managerial Science . En versión impresa. 15 (5): 1311–1345. doi : 10.1007/s11846-020-00405-0 .