La prueba de Van der Waerden, que debe su nombre al matemático holandés Bartel Leendert van der Waerden , es una prueba estadística que determina si k funciones de distribución de la población son iguales. La prueba de Van der Waerden convierte los rangos de una prueba estándar de Kruskal-Wallis en cuantiles de la distribución normal estándar (los detalles se dan a continuación). Estos se denominan puntuaciones normales y la prueba se calcula a partir de ellas.
La versión de población k de la prueba es una extensión de la prueba para dos poblaciones publicada por Van der Waerden (1952,1953).
El análisis de varianza (ANOVA) es una técnica de análisis de datos para examinar la significancia de los factores ( variables independientes ) en un modelo multifactorial. El modelo de un factor puede considerarse como una generalización de la prueba t de dos muestras . Es decir, la prueba t de dos muestras es una prueba de la hipótesis de que dos medias poblacionales son iguales. El ANOVA de un factor prueba la hipótesis de que k medias poblacionales son iguales. El ANOVA estándar supone que los errores (es decir, los residuos) se distribuyen normalmente . Si este supuesto de normalidad no es válido, una alternativa es utilizar una prueba no paramétrica .
Sea n j ( j = 1, 2, ..., k ) el tamaño de la muestra para cada uno de los k grupos (es decir, muestras) en los datos. Sea N el tamaño de la muestra para todos los grupos. Sea X ij el i -ésimo valor en el j -ésimo grupo. Las puntuaciones normales se calculan como
donde R ( X ij ) denota el rango de la observación X ij y donde Φ −1 denota la función cuantil normal . El promedio de las puntuaciones normales para cada muestra se puede calcular como
La varianza de las puntuaciones normales se puede calcular como
La prueba de Van der Waerden puede definirse de la siguiente manera:
La estadística de prueba es
Para el nivel de significancia α, la región crítica es
donde Χ α,k − 1 2 es el α- cuantil de la distribución chi-cuadrado con k − 1 grados de libertad. La hipótesis nula se rechaza si el estadístico de prueba está en la región crítica. Si se rechaza la hipótesis de distribuciones idénticas, se puede realizar un procedimiento de comparaciones múltiples para determinar qué pares de poblaciones tienden a diferir. Las poblaciones j 1 y j 2 parecen ser diferentes si se cumple la siguiente desigualdad:
con t 1 − α/2 el (1 − α/2)- cuantil de la distribución t .
La prueba no paramétrica más común para el modelo de un factor es la prueba de Kruskal-Wallis . La prueba de Kruskal-Wallis se basa en los rangos de los datos. La ventaja de la prueba de Van Der Waerden es que proporciona la alta eficiencia del análisis ANOVA estándar cuando se cumplen los supuestos de normalidad, pero también proporciona la robustez de la prueba de Kruskal-Wallis cuando no se cumplen los supuestos de normalidad.
Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.