En estadística , la prueba de Sobel es un método para probar la significancia de un efecto de mediación . La prueba se basa en el trabajo de Michael E. Sobel , [1] [2] y es una aplicación del método delta . En mediación, se plantea la hipótesis de que la relación entre la variable independiente y la variable dependiente es un efecto indirecto que existe debido a la influencia de una tercera variable (el mediador). Como resultado, cuando el mediador se incluye en un modelo de análisis de regresión con la variable independiente, el efecto de la variable independiente se reduce y el efecto del mediador sigue siendo significativo. La prueba de Sobel es básicamente una prueba t especializada que proporciona un método para determinar si la reducción en el efecto de la variable independiente, después de incluir el mediador en el modelo, es una reducción significativa y, por lo tanto, si el efecto de mediación es estadísticamente significativo.
Al evaluar un efecto de mediación se examinan tres modelos de regresión diferentes: [3]
Modelo 1: Y O = γ 1 + τX I + ε 1
Modelo 2: X M = γ 2 + αX I + ε 2
Modelo 3: Y O = γ 3 + τ ' X I + βX M + ε 3
En estos modelos Y O es la variable dependiente, X I es la variable independiente y X M es el mediador. Los parámetros γ 1 , γ 2 y γ 3 representan las intersecciones para cada modelo, mientras que ε 1 , ε 2 y ε 3 representan el término de error para cada ecuación. τ denota la relación entre la variable independiente y la variable dependiente en el modelo 1, mientras que τ ' denota esa misma relación en el modelo 3 después de controlar el efecto del mediador. Los términos αX I y βX M representan la relación entre la variable independiente y el mediador, y el mediador y la variable dependiente después de controlar la variable independiente, respectivamente.
A partir de estos modelos, el efecto de mediación se calcula como ( τ – τ ' ). [4] Esto representa el cambio en la magnitud del efecto que la variable independiente tiene sobre la variable dependiente después de controlar el mediador. Del examen de estas ecuaciones se puede determinar que ( αβ ) = ( τ – τ ' ). El término α representa la magnitud de la relación entre la variable independiente y el mediador. El término β representa la magnitud de la relación entre el mediador y la variable dependiente después de controlar el efecto de la variable independiente. Por lo tanto, ( αβ ) representa el producto de estos dos términos. En esencia, esta es la cantidad de varianza en la variable dependiente que se explica por la variable independiente a través del mecanismo del mediador. Este es el efecto indirecto, y el término ( αβ ) se ha denominado el producto de los coeficientes . [5]
Otra forma de pensar en el producto de coeficientes es examinar la figura siguiente. [ cita requerida ] Cada círculo representa la varianza de cada una de las variables. Donde los círculos se superponen representa la varianza que los círculos tienen en común y, por lo tanto, el efecto de una variable en la segunda variable. Por ejemplo, las secciones c + d representan el efecto de la variable independiente en la variable dependiente, si ignoramos el mediador, y corresponden a τ . Esta cantidad total de varianza en la variable dependiente que se explica por la variable independiente se puede desglosar en áreas c y d. El área c es la varianza que la variable independiente y la variable dependiente tienen en común con el mediador, y este es el efecto indirecto. [ cita requerida ] [ aclaración necesaria ] El área c corresponde al producto de coeficientes ( αβ ) y a ( τ − τ ' ). La prueba de Sobel prueba qué tan grande es el área c . Si el área c es suficientemente grande, entonces la prueba de Sobel es significativa y está ocurriendo una mediación significativa.
Para determinar la significancia estadística del efecto indirecto, se debe comparar una estadística basada en el efecto indirecto con su distribución de muestreo nula. La prueba de Sobel utiliza la magnitud del efecto indirecto en comparación con su error estándar de medición estimado para derivar una estadística [1]
Donde SE es el término de error estándar agrupado y SE = √ α 2 σ 2 β + β 2 σ 2 α y σ 2 β es la varianza de β y σ 2 α es la varianza de α . [1]
Esta estadística t puede luego compararse con la distribución normal para determinar su significancia. Se han propuesto métodos alternativos para calcular la prueba de Sobel que utilizan las distribuciones z o t para determinar la significancia, y cada una estima el error estándar de manera diferente. [6]
La distribución del término producto αβ solo es normal en muestras de gran tamaño [5] [6], lo que significa que en muestras de menor tamaño el valor p que se deriva de la fórmula no será una estimación precisa del valor p verdadero. Esto ocurre porque se supone que tanto α como β tienen una distribución normal, y la distribución del producto de dos variables con distribución normal está sesgada, a menos que las medias sean mucho mayores que las desviaciones estándar. [5] [7] [8] Si la muestra es lo suficientemente grande, esto no será un problema; sin embargo, determinar cuándo una muestra es lo suficientemente grande es algo subjetivo. [1] [2]
En algunas situaciones es posible que ( τ – τ ' ) ≠ ( αβ ). [9] Esto ocurre cuando el tamaño de la muestra es diferente en los modelos utilizados para estimar los efectos mediados. Supongamos que la variable independiente y el mediador están disponibles a partir de 200 casos, mientras que la variable dependiente solo está disponible a partir de 150 casos. Esto significa que el parámetro α se basa en un modelo de regresión con 200 casos y el parámetro β se basa en un modelo de regresión con solo 150 casos. Tanto τ como τ ' se basan en modelos de regresión con 150 casos. Diferentes tamaños de muestra y diferentes participantes significan que ( τ – τ ' ) ≠ ( αβ ). La única vez que ( τ – τ ' ) = ( αβ ) es cuando se utilizan exactamente los mismos participantes en cada uno de los modelos que prueban la regresión.
Una estrategia para superar la no normalidad de la distribución del producto de coeficientes es comparar la estadística de prueba de Sobel con la distribución del producto en lugar de con la distribución normal. [6] [8] Este enfoque basa la inferencia en una derivación matemática del producto de dos variables distribuidas normalmente que reconoce la asimetría de la distribución en lugar de imponer la normalidad. [5]
Otro enfoque que se está volviendo más popular en la literatura es el bootstrapping . [5] [8] [10] El bootstrapping es un procedimiento de remuestreo no paramétrico que puede construir una aproximación empírica de la distribución de muestreo de αβ al muestrear repetidamente el conjunto de datos. El bootstrapping no se basa en el supuesto de normalidad.