En estadística , un modelo de mediación busca identificar y explicar el mecanismo o proceso que subyace a una relación observada entre una variable independiente y una variable dependiente mediante la inclusión de una tercera variable hipotética, conocida como variable mediadora (también variable mediadora , variable intermediaria). , o variable intermedia ). [1] En lugar de una relación causal directa entre la variable independiente y la variable dependiente, que a menudo es falsa , un modelo de mediación propone que la variable independiente influye en la variable mediadora, que a su vez influye en la variable dependiente. Por tanto, la variable mediadora sirve para aclarar la naturaleza de la relación entre las variables independientes y dependientes. [2] [3]
Los análisis de mediación se emplean para comprender una relación conocida explorando el mecanismo o proceso subyacente mediante el cual una variable influye en otra variable a través de una variable mediadora. [4] En particular, el análisis de mediación puede contribuir a comprender mejor la relación entre una variable independiente y una variable dependiente cuando estas variables no tienen una conexión directa obvia.
Baron y Kenny (1986) establecieron varios requisitos que deben cumplirse para formar una verdadera relación de mediación. [5] Se describen a continuación utilizando un ejemplo del mundo real. Consulte el diagrama anterior para obtener una representación visual de la relación mediadora general que se explicará. Los pasos originales son los siguientes.
El siguiente ejemplo, extraído de Howell (2009), [6] explica cada paso de los requisitos de Baron y Kenny para comprender mejor cómo se caracteriza un efecto de mediación. Los pasos 1 y 2 utilizan un análisis de regresión simple, mientras que el paso 3 utiliza un análisis de regresión múltiple .
Tales hallazgos llevarían a la conclusión de que sus sentimientos de competencia y autoestima median la relación entre cómo fue criado y qué tan seguro se siente al criar a sus propios hijos.
Si el paso 1 no produce un resultado significativo, aún se pueden tener motivos para pasar al paso 2. A veces, en realidad, existe una relación significativa entre las variables independientes y dependientes, pero debido al tamaño pequeño de las muestras u otros factores extraños, no podría haber suficientes resultados. poder de predecir el efecto que realmente existe. [7]
En el diagrama que se muestra arriba, el efecto indirecto es el producto de los coeficientes de trayectoria "A" y "B". El efecto directo es el coeficiente "C'". El efecto directo mide el grado en que la variable dependiente cambia cuando la variable independiente aumenta en una unidad y la variable mediadora permanece inalterada. Por el contrario, el efecto indirecto mide el grado en que la variable dependiente cambia cuando la variable independiente se mantiene constante y la variable mediadora cambia en la cantidad que habría cambiado si la variable independiente hubiera aumentado en una unidad. [8] [9]
En sistemas lineales, el efecto total es igual a la suma de los directos e indirectos ( C' + AB en el modelo anterior). En los modelos no lineales, el efecto total generalmente no es igual a la suma de los efectos directos e indirectos, sino a una combinación modificada de los dos. [9]
Una variable mediadora puede explicar toda o parte de la relación observada entre dos variables.
La evidencia máxima para la mediación, también llamada mediación completa, ocurriría si la inclusión de la variable de mediación redujera la relación entre la variable independiente y la variable dependiente (consulte la vía c ′ en el diagrama anterior) a cero.
La mediación parcial sostiene que la variable mediadora explica parte, pero no toda, de la relación entre la variable independiente y la variable dependiente. La mediación parcial implica que no sólo existe una relación significativa entre el mediador y la variable dependiente, sino también alguna relación directa entre la variable independiente y la dependiente.
Para que se establezca una mediación total o parcial, la reducción de la varianza explicada por la variable independiente debe ser significativa según lo determinado por una de varias pruebas, como la prueba de Sobel . [10] El efecto de una variable independiente sobre la variable dependiente puede volverse no significativo cuando se introduce el mediador simplemente porque se explica una cantidad trivial de varianza (es decir, no es una verdadera mediación). Por lo tanto, es imperativo mostrar una reducción significativa en la varianza explicada por la variable independiente antes de afirmar una mediación total o parcial. Es posible tener efectos indirectos estadísticamente significativos en ausencia de un efecto total. [11] Esto puede explicarse por la presencia de varios caminos mediadores que se anulan entre sí y se vuelven perceptibles cuando se controla uno de los mediadores canceladores. Esto implica que los términos mediación "parcial" y "total" siempre deben interpretarse en relación con el conjunto de variables que están presentes en el modelo. En todos los casos, la operación de "fijar una variable" debe distinguirse de la de "controlar por una variable", que se ha utilizado inapropiadamente en la literatura. [8] [12] El primero significa arreglar físicamente, mientras que el segundo significa condicionar, ajustar o agregar al modelo de regresión. Las dos nociones coinciden sólo cuando todos los términos de error (que no se muestran en el diagrama) no están estadísticamente correlacionados. Cuando los errores están correlacionados, se deben hacer ajustes para neutralizar esas correlaciones antes de embarcarse en el análisis de mediación (ver red bayesiana ).
La prueba de Sobel [10] se realiza para determinar si la relación entre la variable independiente y la variable dependiente se ha reducido significativamente después de la inclusión de la variable mediadora. En otras palabras, esta prueba evalúa si un efecto de mediación es significativo. Examina la relación entre la variable independiente y la variable dependiente en comparación con la relación entre la variable independiente y la variable dependiente, incluido el factor de mediación.
La prueba de Sobel es más precisa que los pasos de Baron y Kenny explicados anteriormente; sin embargo, tiene un poder estadístico bajo. Como tal, se requieren tamaños de muestra grandes para tener poder suficiente para detectar efectos significativos. Esto se debe a que el supuesto clave de la prueba de Sobel es el supuesto de normalidad. Debido a que la prueba de Sobel evalúa una muestra determinada según la distribución normal, los tamaños de muestra pequeños y la asimetría de la distribución muestral pueden ser problemáticos (consulte Distribución normal para obtener más detalles). Por lo tanto, la regla general sugerida por MacKinnon et al. (2002) [13] es que se requiere un tamaño de muestra de 1000 para detectar un efecto pequeño, un tamaño de muestra de 100 es suficiente para detectar un efecto medio y un tamaño de muestra de 100 es suficiente para detectar un efecto medio. Se requiere un tamaño de muestra de 50 para detectar un efecto grande.
La ecuación de Sobel es: [14]
El método bootstrapping proporciona algunas ventajas a la prueba de Sobel, principalmente un aumento de potencia. El método de arranque de Preacher y Hayes es una prueba no paramétrica y no impone el supuesto de normalidad. Por lo tanto, si los datos sin procesar están disponibles, se recomienda el método de arranque. [14] Bootstrapping implica realizar muestreos aleatorios repetidos de observaciones con reemplazo del conjunto de datos para calcular la estadística deseada en cada remuestreo. Calcular cientos o miles de remuestreos de arranque proporciona una aproximación de la distribución muestral de la estadística de interés. El método Preacher-Hayes proporciona estimaciones puntuales e intervalos de confianza mediante los cuales se puede evaluar la importancia o no importancia de un efecto de mediación. Las estimaciones puntuales revelan la media sobre el número de muestras de arranque y si cero no se encuentra entre los intervalos de confianza resultantes del método de arranque, se puede concluir con seguridad que existe un efecto de mediación significativo que informar.
Como se describió anteriormente, existen algunas opciones diferentes entre las que se puede elegir para evaluar un modelo de mediación.
Bootstrapping [15] [16] se está convirtiendo en el método más popular para probar la mediación porque no requiere que se cumpla el supuesto de normalidad y porque puede utilizarse de manera efectiva con tamaños de muestra más pequeños ( N <25). Sin embargo, la mediación sigue siendo determinada con mayor frecuencia mediante la lógica de Baron y Kenny [17] o el test de Sobel . Cada vez es más difícil publicar pruebas de mediación basadas exclusivamente en el método de Baron y Kenny o pruebas que parten de supuestos distributivos como la prueba de Sobel. Por lo tanto, es importante considerar sus opciones al elegir qué prueba realizar. [11]
Si bien el concepto de mediación tal como se define en psicología es teóricamente atractivo, los métodos utilizados para estudiar la mediación empíricamente han sido cuestionados por estadísticos y epidemiólogos [8] [12] [18] e interpretados formalmente. [9]
Hayes (2009) criticó el enfoque de pasos de mediación de Baron y Kenny, [11] y, a partir de 2019, David A. Kenny declaró en su sitio web que la mediación puede existir en ausencia de un efecto total "significativo" (a veces denominado "mediación inconsistente"). ") y, por lo tanto, es posible que no sea necesario el paso 1 del enfoque original de 1986. Publicaciones posteriores de Hayes cuestionaron los conceptos de mediación total y mediación parcial, y abogaron por el abandono de estos términos y de los pasos de la mediación clásica (1986).
Los enfoques experimentales de la mediación deben llevarse a cabo con precaución. Primero, es importante contar con un fuerte apoyo teórico para la investigación exploratoria de una posible variable mediadora. Una crítica al enfoque de mediación se basa en la capacidad de manipular y medir una variable mediadora. Por lo tanto, uno debe poder manipular al mediador propuesto de una manera aceptable y ética. Como tal, uno debe poder medir el proceso intermedio sin interferir con el resultado. El mediador también debe poder establecer la validez de constructo de la manipulación. Una de las críticas más comunes al enfoque de medición de la mediación es que, en última instancia, se trata de un diseño correlacional. En consecuencia, es posible que alguna otra tercera variable, independiente del mediador propuesto, pueda ser responsable del efecto propuesto. Sin embargo, los investigadores han trabajado duro para proporcionar pruebas que contradigan este menosprecio. En concreto, se han presentado los siguientes contraargumentos: [4]
La mediación puede ser una prueba estadística extremadamente útil y poderosa; sin embargo, debe usarse correctamente. Es importante que las medidas utilizadas para evaluar al mediador y la variable dependiente sean teóricamente distintas y que la variable independiente y el mediador no puedan interactuar. Si hubiera una interacción entre la variable independiente y el mediador, habría motivos para investigar la moderación .
Otro modelo que se prueba con frecuencia es aquel en el que las variables que compiten en el modelo son mediadores potenciales alternativos o una causa no medida de la variable dependiente. Una variable adicional en un modelo causal puede oscurecer o confundir la relación entre las variables independientes y dependientes. Los posibles factores de confusión son variables que pueden tener un impacto causal tanto en la variable independiente como en la variable dependiente. Incluyen fuentes comunes de error de medición (como se analizó anteriormente), así como otras influencias compartidas tanto por las variables independientes como por las dependientes.
En los estudios experimentales, existe una preocupación especial por aspectos de la manipulación o el entorno experimental que pueden explicar los efectos del estudio, más que el factor teórico motivador. Cualquiera de estos problemas puede producir relaciones espurias entre las variables independientes y dependientes medidas. Ignorar una variable de confusión puede sesgar las estimaciones empíricas del efecto causal de la variable independiente.
Una variable supresora aumenta la validez predictiva de otra variable cuando se incluye en una ecuación de regresión. La supresión puede ocurrir cuando una sola variable causal se relaciona con una variable de resultado a través de dos variables mediadoras separadas, y cuando uno de esos efectos mediados es positivo y el otro es negativo. En tal caso, cada variable mediadora suprime u oculta el efecto que se transmite a través de la otra variable mediadora. Por ejemplo, puntuaciones de inteligencia más altas (una variable causal, A ) pueden provocar un aumento en la detección de errores (una variable mediadora, B ), lo que a su vez puede provocar una disminución de los errores cometidos en el trabajo en una línea de montaje (una variable de resultado, X ). ; al mismo tiempo, la inteligencia también podría provocar un aumento del aburrimiento ( C ), lo que a su vez puede provocar un aumento de los errores ( X ). Así, en un camino causal la inteligencia disminuye los errores y en el otro los aumenta. Cuando ninguno de los mediadores se incluye en el análisis, la inteligencia parece no tener ningún efecto o tener un efecto débil sobre los errores. Sin embargo, cuando se controla el aburrimiento, la inteligencia parecerá disminuir los errores, y cuando se controla la detección de errores, la inteligencia parecerá aumentar los errores. Si se pudiera aumentar la inteligencia manteniendo constante sólo el aburrimiento, los errores disminuirían; Si se pudiera aumentar la inteligencia manteniendo constante sólo la detección de errores, los errores aumentarían.
En general, la omisión de supresores o factores de confusión conducirá a una subestimación o una sobreestimación del efecto de A sobre X , reduciendo o inflando artificialmente la magnitud de una relación entre dos variables.
Otras terceras variables importantes son los moderadores . Los moderadores son variables que pueden fortalecer o debilitar la relación entre dos variables. Estas variables caracterizan aún más las interacciones en la regresión al afectar la dirección y/o la fuerza de la relación entre X e Y. Una relación moderadora puede considerarse como una interacción . Ocurre cuando la relación entre las variables A y B depende del nivel de C. Consulte moderación para obtener más información.
La mediación y la moderación pueden coexistir en los modelos estadísticos. Es posible mediar con moderación y moderar la mediación.
La mediación moderada es cuando el efecto del tratamiento A sobre el mediador y/o el efecto parcial B sobre la variable dependiente dependen a su vez de los niveles de otra variable (moderadora). Esencialmente, en la mediación moderada, primero se establece la mediación y luego se investiga si el efecto de mediación que describe la relación entre la variable independiente y la variable dependiente está moderado por diferentes niveles de otra variable (es decir, un moderador). Esta definición ha sido esbozada por Muller, Judd e Yzerbyt (2005) [20] y Preacher, Rucker y Hayes (2007). [21]
Hay cinco modelos posibles de mediación moderada, como se ilustra en los diagramas siguientes. [20]
Además de los modelos mencionados anteriormente, también puede existir una nueva variable que modere la relación entre la variable independiente y el mediador (la ruta A) y al mismo tiempo la nueva variable modere la relación entre la variable independiente y la variable dependiente (la ruta A). Ruta C). [1]
La moderación mediada es una variante tanto de moderación como de mediación. Aquí es donde inicialmente hay moderación general y está mediado el efecto directo de la variable moderadora sobre el resultado. La principal diferencia entre moderación mediada y mediación moderada es que para la primera hay moderación inicial (general) y este efecto es mediado y para la segunda no hay moderación pero el efecto de cualquiera de los tratamientos sobre el mediador (camino A) es moderado. o se modera el efecto del mediador sobre el resultado (camino B ). [20]
Para establecer la moderación mediada, primero se debe establecer la moderación , lo que significa que la dirección y/o la fuerza de la relación entre las variables independiente y dependiente (ruta C ) difiere dependiendo del nivel de una tercera variable (la variable moderadora). Luego, los investigadores buscan la presencia de moderación mediada cuando tienen una razón teórica para creer que hay una cuarta variable que actúa como el mecanismo o proceso que causa la relación entre la variable independiente y el moderador (camino A) o entre el moderador y la variable dependiente (ruta C ).
El siguiente es un ejemplo publicado de moderación mediada en la investigación psicológica. [22] A los participantes se les presentó un estímulo inicial (un estímulo) que les hizo pensar en la moralidad o en el poder. Luego participaron en el Juego del Dilema del Prisionero (PDG), en el que los participantes pretenden que ellos y su cómplice han sido arrestados, y deben decidir si permanecer leales a su socio o competir con su socio y cooperar con las autoridades. Los investigadores encontraron que los individuos prosociales se veían afectados por la moralidad y los primos de poder, mientras que los individuos prosociales no. Así, la orientación al valor social (proyo vs. prosocial) moderó la relación entre el principal (variable independiente: moralidad vs. poder) y el comportamiento elegido en el PDG (variable dependiente: competitivo vs. cooperativo).
A continuación, los investigadores buscaron la presencia de un efecto de moderación mediado. Los análisis de regresión revelaron que el tipo de prima (moralidad versus poder) medió la relación moderadora de la orientación de valores sociales de los participantes sobre el comportamiento PDG. Los participantes prosociales que experimentaron la moralidad primordial esperaban que su pareja cooperara con ellos, por lo que optaron por cooperar ellos mismos. Los participantes prosociales que experimentaron el poder esperaban que su pareja compitiera con ellos, lo que los hacía más propensos a competir con su pareja y cooperar con las autoridades. Por el contrario, los participantes con una orientación de valores sociales pro-yo siempre actuaron de manera competitiva.
Muller, Judd e Yzerbyt (2005) [20] describen tres modelos fundamentales que subyacen tanto a la mediación moderada como a la moderación mediada. Mo representa las variables moderadoras, Me representa las variables mediadoras y ε i representa el error de medición de cada ecuación de regresión.
Moderación de la relación entre la variable independiente (X) y la variable dependiente (Y), también llamada efecto general del tratamiento (ruta C en el diagrama).
Moderación de la relación entre la variable independiente y el mediador (camino A ).
Moderación tanto de la relación entre las variables independientes y dependientes (ruta A ) como de la relación entre el mediador y la variable dependiente (ruta B ).
El análisis de mediación cuantifica el grado en que una variable participa en la transmisión del cambio de una causa a su efecto. Es inherentemente una noción causal, por lo que no puede definirse en términos estadísticos. Tradicionalmente, sin embargo, la mayor parte del análisis de la mediación se ha realizado dentro de los límites de la regresión lineal, con la terminología estadística enmascarando el carácter causal de las relaciones involucradas. Esto condujo a dificultades, sesgos y limitaciones que han sido aliviados por métodos modernos de análisis causal, basados en diagramas causales y lógica contrafactual.
La fuente de estas dificultades radica en definir la mediación en términos de cambios inducidos al agregar una tercera variable a una ecuación de regresión. Estos cambios estadísticos son epifenómenos que a veces acompañan a la mediación pero, en general, no logran capturar las relaciones causales que el análisis de la mediación pretende cuantificar.
La premisa básica del enfoque causal es que no siempre es apropiado "controlar" el mediador M cuando buscamos estimar el efecto directo de X sobre Y (ver la Figura anterior). El fundamento clásico para "controlar" M " es que, si logramos evitar que M cambie, entonces cualquier cambio que midamos en Y será atribuible únicamente a variaciones en X y entonces estamos justificados para proclamar el efecto observado como "efecto directo". de X sobre Y ". Desafortunadamente, "controlar por M " no impide físicamente que M cambie; simplemente limita la atención del analista a casos de valores iguales de M. Además, el lenguaje de la teoría de la probabilidad no posee la notación para expresar la idea de "evitar que M cambie" o "mantener físicamente constante a M ". El único operador que proporciona la probabilidad es "Condicionamiento", que es lo que hacemos cuando "controlamos" para M , o agregamos M como un regresor en la ecuación para Y. El resultado es que, en lugar de mantener físicamente constante M" (digamos en M = m ) y comparar Y para unidades bajo X = 1' con aquellas bajo X = 0, permitimos que M varíe pero ignoramos todas las unidades excepto aquellas en las que M alcanza el valor M = m . Estas dos operaciones son fundamentalmente diferentes y producen resultados diferentes, [23] [24] excepto en el caso de que no se omitan variables. Los efectos mediados por un condicionamiento inadecuado pueden ser un tipo de mal control .
Para ilustrar, supongamos que los términos de error de M e Y están correlacionados. En tales condiciones, el coeficiente estructural B y A (entre M e Y y entre Y y X ) ya no puede estimarse haciendo una regresión de Y sobre X y M. De hecho, las pendientes de regresión pueden ser distintas de cero incluso cuando C es cero. [25] Esto tiene dos consecuencias. Primero, se deben idear nuevas estrategias para estimar los coeficientes estructurales A, B y C. En segundo lugar, las definiciones básicas de efectos directos e indirectos deben ir más allá del análisis de regresión y deben invocar una operación que imite "fijar M ", en lugar de "condicionar M ".
Dicho operador, denotado do ( M = m ), fue definido en Pearl (1994) [24] y opera eliminando la ecuación de M y reemplazándola por una constante m . Por ejemplo, si el modelo de mediación básico consta de las ecuaciones:
luego, después de aplicar el operador do ( M = m ), el modelo se convierte en:
y después de aplicar el operador do( X = x ) el modelo queda:
donde las funciones f y g , así como las distribuciones de los términos de error ε 1 y ε 3 permanecen inalteradas. Si cambiamos el nombre de las variables M e Y resultantes de do( X = x ) como M ( x ) e Y ( x ), respectivamente, obtenemos lo que se conoció como "resultados potenciales" [26] o "contrafactuales estructurales". . [27] Estas nuevas variables proporcionan una notación conveniente para definir los efectos directos e indirectos. En particular, se han definido cuatro tipos de efectos para la transición de X = 0 a X = 1:
(a) Efecto total –
(b) Efecto directo controlado -
(c) Efecto directo natural -
(d) Efecto indirecto natural
Donde E [ ] representa la expectativa tomada sobre los términos de error.
Estos efectos tienen las siguientes interpretaciones:
No existe una versión controlada del efecto indirecto porque no hay forma de desactivar el efecto directo fijando una variable a una constante.
Según estas definiciones, el efecto total se puede descomponer como una suma
donde NIE r representa la transición inversa, de X = 1 a X = 0; se vuelve aditivo en sistemas lineales, donde la inversión de transiciones implica la inversión de signos.
El poder de estas definiciones reside en su generalidad; son aplicables a modelos con interacciones no lineales arbitrarias, dependencias arbitrarias entre las perturbaciones y variables tanto continuas como categóricas.
En el análisis lineal, todos los efectos están determinados por sumas de productos de coeficientes estructurales, dando
Por lo tanto, todos los efectos son estimables siempre que se identifique el modelo. En sistemas no lineales, se necesitan condiciones más estrictas para estimar los efectos directos e indirectos. [9] [28] [29] Por ejemplo, si no existe ningún factor de confusión (es decir, ε 1 , ε 2 y ε 3 son mutuamente independientes) se pueden derivar las siguientes fórmulas: [9]
Las dos últimas ecuaciones se denominan Fórmulas de Mediación [30] [31] [32] y se han convertido en el objetivo de estimación en muchos estudios de mediación. [28] [29] [31] [32] Dan expresiones sin distribución para efectos directos e indirectos y demuestran que, a pesar de la naturaleza arbitraria de las distribuciones de error y las funciones f , g y h , los efectos mediados pueden, no obstante, ser estimado a partir de datos mediante regresión. Los análisis de la mediación moderada y de los moderadores mediadores caen como casos especiales del análisis de la mediación causal, y las fórmulas de mediación identifican cómo diversos coeficientes de interacción contribuyen a los componentes necesarios y suficientes de la mediación. [29] [30]
Supongamos que el modelo toma la forma
donde el parámetro cuantifica el grado en que M modifica el efecto de X sobre Y. Incluso cuando todos los parámetros se estiman a partir de datos, todavía no es obvio qué combinaciones de parámetros miden el efecto directo e indirecto de X sobre Y , o, más prácticamente, cómo evaluar la fracción del efecto total que se explica por la mediación y la mediación. Una fracción de eso se debe a la mediación. En el análisis lineal, la primera fracción es capturada por el producto , la segunda por la diferencia y las dos cantidades coinciden. Sin embargo, en presencia de interacción, cada fracción exige un análisis por separado, según lo dicta la Fórmula de Mediación, que arroja:
Por lo tanto, la fracción de la respuesta de salida para la cual la mediación sería suficiente es
mientras que la fracción para la cual sería necesaria la mediación es
Estas fracciones implican combinaciones no obvias de los parámetros del modelo y se pueden construir mecánicamente con la ayuda de la Fórmula de Mediación. Es significativo que, debido a la interacción, se puede sostener un efecto directo incluso cuando el parámetro desaparece y, más aún, se puede sostener un efecto total incluso cuando desaparecen tanto los efectos directos como los indirectos. Esto ilustra que la estimación de parámetros de forma aislada nos dice poco sobre el efecto de la mediación y, en términos más generales, la mediación y la moderación están entrelazadas y no pueden evaluarse por separado.
Al 19 de junio de 2014, este artículo se deriva total o parcialmente de Análisis causal en teoría y práctica . El titular de los derechos de autor ha otorgado la licencia del contenido de una manera que permite su reutilización según CC BY-SA 3.0 y GFDL . Se deben seguir todos los términos relevantes. [ enlace muerto ]