Prueba de Van der Waerden

La prueba de Van der Waerden, que debe su nombre al matemático holandés Bartel Leendert van der Waerden , es una prueba estadística que determina si k funciones de distribución de la población son iguales. La prueba de Van der Waerden convierte los rangos de una prueba estándar de Kruskal-Wallis en cuantiles de la distribución normal estándar (los detalles se dan a continuación). Estos se denominan puntuaciones normales y la prueba se calcula a partir de ellas.

La versión de población k de la prueba es una extensión de la prueba para dos poblaciones publicada por Van der Waerden (1952,1953).

Fondo

El análisis de varianza (ANOVA) es una técnica de análisis de datos para examinar la significancia de los factores ( variables independientes ) en un modelo multifactorial. El modelo de un factor puede considerarse como una generalización de la prueba t de dos muestras . Es decir, la prueba t de dos muestras es una prueba de la hipótesis de que dos medias poblacionales son iguales. El ANOVA de un factor prueba la hipótesis de que k medias poblacionales son iguales. El ANOVA estándar supone que los errores (es decir, los residuos) se distribuyen normalmente . Si este supuesto de normalidad no es válido, una alternativa es utilizar una prueba no paramétrica .

Definición de prueba

Sea n _j ( j = 1, 2, ..., k ) el tamaño de la muestra para cada uno de los k grupos (es decir, muestras) en los datos. Sea N el tamaño de la muestra para todos los grupos. Sea X _ij el i ^-ésimo valor en el j ^-ésimo grupo. Las puntuaciones normales se calculan como

A_{ij}=\Phi ^{-1}\left({\frac {R(X_{ij})}{N+1}}\right)

donde R ( X _ij ) denota el rango de la observación X _ij y donde Φ ⁻¹ denota la función cuantil normal . El promedio de las puntuaciones normales para cada muestra se puede calcular como

{\bar {A}}_{j}={\frac {1}{n_{j}}}\sum _{i=1}^{n_{j}}A_{ij}\quad j=1,2,\ldots ,k

La varianza de las puntuaciones normales se puede calcular como

s^{2}={\frac {1}{N-1}}\suma _{j=1}^{k}\suma _{i=1}^{n_{j}}A_{ij}^{2}

La prueba de Van der Waerden puede definirse de la siguiente manera:

H ₀ : Todas las funciones de distribución de población k tienden a producir la misma observación

H _a : Al menos una de las poblaciones tiende a producir observaciones más grandes que al menos una de las otras poblaciones

La estadística de prueba es

T_{1}={\frac {1}{s^{2}}}\sum _{j=1}^{k}n_{j}{\bar {A}}_{j}^{2}

Para el nivel de significancia α, la región crítica es

T_{1}>\chi _{\alpha ,k-1}^{2}

donde Χ _{α,k − 1}² es el α- cuantil de la distribución chi-cuadrado con k − 1 grados de libertad. La hipótesis nula se rechaza si el estadístico de prueba está en la región crítica. Si se rechaza la hipótesis de distribuciones idénticas, se puede realizar un procedimiento de comparaciones múltiples para determinar qué pares de poblaciones tienden a diferir. Las poblaciones j ₁ y j ₂ parecen ser diferentes si se cumple la siguiente desigualdad:

\left\vert {\bar {A}}_{j_{1}}-{\bar {A}}_{j_{2}}\right\vert >s\,t_{1-\alpha /2}{\sqrt {\frac {N-1-T_{1}}{Nk}}}{\sqrt {{\frac {1}{n_{j_{1}}}}+{\frac {1}{n_{j_{2}}}}}}

con t _{1 − α/2} el (1 − α/2)- cuantil de la distribución t .

Comparación con la prueba de Kruskal-Wallis

La prueba no paramétrica más común para el modelo de un factor es la prueba de Kruskal-Wallis . La prueba de Kruskal-Wallis se basa en los rangos de los datos. La ventaja de la prueba de Van Der Waerden es que proporciona la alta eficiencia del análisis ANOVA estándar cuando se cumplen los supuestos de normalidad, pero también proporciona la robustez de la prueba de Kruskal-Wallis cuando no se cumplen los supuestos de normalidad.

Referencias

Conover, WJ (1999). Practical Nonparameteric Statistics (Tercera edición). Wiley. Págs. 396–406.

van der Waerden, BL (1952). "Pruebas de orden para el problema de dos muestras y su potencia", Indagationes Mathematicae , 14, 453–458.
van der Waerden, BL (1953). "Solicitar pruebas para el problema de dos muestras. II, III", Actas de la Koninklijke Nederlandse Akademie van Wetenschappen, Serie A , 564, 303–310, 311–316.

Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.