stringtranslate.com

Prueba de Siegel-Tukey

La prueba de Siegel-Tukey, llamada así por Sidney Siegel y John Tukey , es una prueba no paramétrica que se puede aplicar a datos medidos al menos en una escala ordinal . Prueba las diferencias de escala entre dos grupos.

La prueba se utiliza para determinar si uno de los dos grupos de datos tiende a tener valores más dispersos que el otro. En otras palabras, la prueba determina si uno de los dos grupos tiende a moverse, a veces hacia la derecha, a veces hacia la izquierda, pero alejándose del centro (de la escala ordinal).

La prueba fue publicada en 1960 por Sidney Siegel y John Wilder Tukey en el Journal of the American Statistical Association , en el artículo "Un procedimiento no paramétrico de suma de rangos para dispersión relativa en muestras no pareadas".

Principio

El principio se basa en la siguiente idea:

Supongamos que hay dos grupos A y B con n observaciones para el primer grupo y m observaciones para el segundo (por lo que hay Nn  +  m observaciones totales). Si todas las N observaciones se organizan en orden ascendente, se puede esperar que los valores de los dos grupos se mezclen o se ordenen aleatoriamente, si no hay diferencias entre los dos grupos (siguiendo la hipótesis nula H 0 ). Esto significaría que entre los rangos de puntuaciones extremas (altas y bajas), habría valores similares del Grupo A y del Grupo B.

Si, por ejemplo, el Grupo A estuviera más inclinado a valores extremos (la hipótesis alternativa H 1 ), entonces habrá una mayor proporción de observaciones del grupo A con valores bajos o altos, y una proporción reducida de valores en el centro.

  • Hipótesis H 0 : σ 2 A = σ 2 B y Me A = Me B (donde σ 2 y Me son la varianza y la mediana, respectivamente)
  • Hipótesis H 1 : σ 2 A > σ 2 B

Método

Dos grupos, A y B, producen los siguientes valores (ya ordenados en orden ascendente):

A: 33 62 84 85 88 93 97 B: 4 16 48 51 66 98

Combinando los grupos se obtiene un grupo de 13 entradas. La clasificación se realiza por extremos alternos (el rango 1 es el más bajo, 2 y 3 son los dos más altos, 4 y 5 son los dos siguientes más bajos, etc.).

La suma de los rangos dentro de cada grupo W:

W A = 5 + 12 + 11 + 10 + 7 + 6 + 3 = 54
B B = 1 + 4 + 8 + 9 + 13 + 2 = 37

Si la hipótesis nula es verdadera, se espera que los rangos promedio de los dos grupos sean similares.

Si uno de los dos grupos está más disperso, sus rangos serán más bajos, ya que los valores extremos reciben rangos más bajos, mientras que el otro grupo recibirá más de los puntajes altos asignados al centro. Para probar la diferencia entre los grupos en cuanto a significancia, se utiliza una prueba de suma de rangos de Wilcoxon , que también justifica la notación W A y W B en el cálculo de las sumas de rangos.

A partir de las sumas de rangos, las estadísticas U se calculan restando la puntuación mínima posible, n ( n  + 1)/2 para cada grupo: [1]

U A = 54 − 7(8)/2 = 26
U B = 37 − 6(7)/2 = 16

De acuerdo con el mínimo de estos dos valores se distribuye según una distribución de suma de rangos de Wilcoxon con parámetros dados por los dos tamaños de grupo:

Lo que permite el cálculo de un valor p para esta prueba de acuerdo a la siguiente fórmula:

Se puede utilizar una tabla de la distribución de suma de rangos de Wilcoxon para encontrar la significancia estadística de los resultados (ver Mann–Whitney_U_test para más explicaciones sobre estas tablas).

Para los datos de ejemplo, con grupos de tamaños m=6 y n=7 el valor p es:

lo que indica poca o ninguna razón para rechazar la hipótesis nula de que la dispersión de los dos grupos es la misma.

Véase también

Referencias

  1. ^ Lehmann, Erich L., No paramétricos: métodos estadísticos basados ​​en rangos , Springer, 2006, págs. 9, 11–12.

Enlaces externos