En estadística , la prueba de Sobel es un método para probar la importancia de un efecto de mediación . La prueba se basa en el trabajo de Michael E. Sobel , [1] [2] y es una aplicación del método delta . En la mediación, se plantea la hipótesis de que la relación entre la variable independiente y la variable dependiente es un efecto indirecto que existe debido a la influencia de una tercera variable (el mediador). Como resultado, cuando el mediador se incluye en un modelo de análisis de regresión con la variable independiente, el efecto de la variable independiente se reduce y el efecto del mediador sigue siendo significativo. La prueba de Sobel es básicamente una prueba t especializada que proporciona un método para determinar si la reducción en el efecto de la variable independiente, después de incluir al mediador en el modelo, es una reducción significativa y, por tanto, si el efecto de mediación es estadísticamente significativo.
Al evaluar un efecto de mediación se examinan tres modelos de regresión diferentes: [3]
Modelo 1: Y O = γ 1 + τX I + ε 1
Modelo 2: X M = γ 2 + αX I + ε 2
Modelo 3: Y O = γ 3 + τ ' X I + βX M + ε 3
En estos modelos Y O es la variable dependiente, X I es la variable independiente y X M es el mediador. Los parámetros γ 1 , γ 2 y γ 3 representan las intersecciones para cada modelo, mientras que ε 1 , ε 2 y ε 3 representan el término de error para cada ecuación. τ denota la relación entre la variable independiente y la variable dependiente en el modelo 1, mientras que τ ' denota esa misma relación en el modelo 3 después de controlar por el efecto del mediador. Los términos αX I y βX M representan la relación entre la variable independiente y el mediador, y el mediador y la variable dependiente después de controlar por la variable independiente, respectivamente.
A partir de estos modelos, el efecto de mediación se calcula como ( τ – τ ' ). [4] Esto representa el cambio en la magnitud del efecto que la variable independiente tiene sobre la variable dependiente después de controlar por el mediador. Del examen de estas ecuaciones se puede determinar que ( αβ ) = ( τ – τ ' ). El término α representa la magnitud de la relación entre la variable independiente y el mediador. El término β representa la magnitud de la relación entre el mediador y la variable dependiente después de controlar el efecto de la variable independiente. Por tanto ( αβ ) representa el producto de estos dos términos. En esencia, esta es la cantidad de varianza en la variable dependiente que es contabilizada por la variable independiente a través del mecanismo del mediador. Este es el efecto indirecto, y el término ( αβ ) se ha denominado producto de coeficientes . [5]
Otra forma de pensar en el producto de coeficientes es examinar la siguiente figura. [ cita necesaria ] Cada círculo representa la varianza de cada una de las variables. Cuando los círculos se superponen representa la varianza que los círculos tienen en común y, por lo tanto, el efecto de una variable sobre la segunda variable. Por ejemplo las secciones c + d representan el efecto de la variable independiente sobre la variable dependiente, si ignoramos el mediador, y corresponde a τ . Esta cantidad total de varianza en la variable dependiente que se explica por la variable independiente se puede dividir en áreas c y d. El área c es la varianza que la variable independiente y la variable dependiente tienen en común con el mediador, y este es el efecto indirecto. [ cita necesaria ] [ aclaración necesaria ] El área c corresponde al producto de los coeficientes ( αβ ) y ( τ − τ ' ). La prueba de Sobel prueba qué tan grande es el área c . Si el área c es suficientemente grande, entonces la prueba de Sobel es significativa y se está produciendo una mediación significativa.
Para determinar la significancia estadística del efecto indirecto, se debe comparar una estadística basada en el efecto indirecto con su distribución muestral nula. La prueba de Sobel utiliza la magnitud del efecto indirecto en comparación con su error estándar de medición estimado para derivar la estadística [1]
Donde SE es el término de error estándar agrupado y SE = √ α 2 σ 2 β + β 2 σ 2 α y σ 2 β es la varianza de β y σ 2 α es la varianza de α . [1]
Luego, este estadístico t se puede comparar con la distribución normal para determinar su importancia. Se han propuesto métodos alternativos para calcular la prueba de Sobel que utilizan las distribuciones z o t para determinar la significancia, y cada uno estima el error estándar de manera diferente. [6]
La distribución del término del producto αβ solo es normal en tamaños de muestra grandes [5] [6], lo que significa que en tamaños de muestra más pequeños el valor p que se deriva de la fórmula no será una estimación precisa del valor p verdadero. Esto ocurre porque se supone que tanto α como β están distribuidos normalmente y la distribución del producto de dos variables distribuidas normalmente está sesgada, a menos que las medias sean mucho mayores que las desviaciones estándar. [5] [7] [8] Si la muestra es lo suficientemente grande, esto no será un problema; sin embargo, determinar cuándo una muestra es lo suficientemente grande es algo subjetivo. [1] [2]
En algunas situaciones es posible que ( τ – τ ' ) ≠ ( αβ ). [9] Esto ocurre cuando el tamaño de la muestra es diferente en los modelos utilizados para estimar los efectos mediados. Supongamos que la variable independiente y el mediador están disponibles en 200 casos, mientras que la variable dependiente solo está disponible en 150 casos. Esto significa que el parámetro α se basa en un modelo de regresión con 200 casos y el parámetro β se basa en un modelo de regresión con sólo 150 casos. Tanto τ como τ ' se basan en modelos de regresión con 150 casos. Diferentes tamaños de muestra y diferentes participantes significan que ( τ – τ ' ) ≠ ( αβ ). El único momento ( τ – τ ' ) = ( αβ ) es cuando se utilizan exactamente los mismos participantes en cada uno de los modelos que prueban la regresión.
Una estrategia para superar la no normalidad del producto de la distribución de coeficientes es comparar el estadístico de la prueba de Sobel con la distribución del producto en lugar de con la distribución normal. [6] [8] Este enfoque basa la inferencia en una derivación matemática del producto de dos variables normalmente distribuidas que reconoce la asimetría de la distribución en lugar de imponer la normalidad. [5]
Otro enfoque que se está volviendo más popular en la literatura es el bootstrapping . [5] [8] [10] Bootstrapping es un procedimiento de remuestreo no paramétrico que puede construir una aproximación empírica de la distribución muestral de αβ muestreando repetidamente el conjunto de datos. Bootstrapping no se basa en el supuesto de normalidad.