La W de Kendall (también conocida como coeficiente de concordancia de Kendall ) es una estadística no paramétrica para la correlación de rangos . Es una normalización de la estadística de la prueba de Friedman y se puede utilizar para evaluar el acuerdo entre evaluadores y, en particular, la confiabilidad entre evaluadores . La W de Kendall varía de 0 (ningún acuerdo) a 1 (acuerdo completo).
Supongamos, por ejemplo, que se ha pedido a un número de personas que clasifiquen una lista de preocupaciones políticas, desde la más importante hasta la menos importante. La W de Kendall se puede calcular a partir de estos datos. Si la estadística de prueba W es 1, entonces todos los encuestados han sido unánimes y cada encuestado ha asignado el mismo orden a la lista de preocupaciones. Si W es 0, entonces no hay una tendencia general de acuerdo entre los encuestados y sus respuestas pueden considerarse esencialmente aleatorias. Los valores intermedios de W indican un mayor o menor grado de unanimidad entre las diversas respuestas.
Mientras que las pruebas que utilizan el coeficiente de correlación de Pearson estándar suponen valores distribuidos normalmente y comparan dos secuencias de resultados simultáneamente, la W de Kendall no hace suposiciones respecto de la naturaleza de la distribución de probabilidad y puede manejar cualquier número de resultados distintos.
Supongamos que el juez número j le asigna al objeto i el rango r i,j , donde hay en total n objetos y m jueces. Entonces, el rango total asignado al objeto i es
y el valor medio de estos rangos totales es
La suma de las desviaciones al cuadrado, S , se define como
y luego la W de Kendall se define como [1]
Si el estadístico de prueba W es 1, entonces todos los jueces o encuestados han sido unánimes y cada juez o encuestado ha asignado el mismo orden a la lista de objetos o preocupaciones. Si W es 0, entonces no hay una tendencia general de acuerdo entre los encuestados y sus respuestas pueden considerarse esencialmente aleatorias. Los valores intermedios de W indican un mayor o menor grado de unanimidad entre los diversos jueces o encuestados.
Kendall y Gibbons (1990) también muestran que W está relacionado linealmente con el valor medio de los coeficientes de correlación de rango de Spearman entre todos los pares posibles de clasificaciones entre jueces.
Cuando los jueces evalúan solo un subconjunto de los n objetos, y cuando el diseño de bloque correspondiente es un diseño (n, m, r, p, λ) (nótese la notación diferente) . En otras palabras, cuando
Entonces la W de Kendall se define como [2]
Si y de tal manera que cada juez clasifica los n objetos, la fórmula anterior es equivalente a la original.
Cuando se dan valores empatados, a cada uno de ellos se le asigna el promedio de las clasificaciones que se habrían otorgado si no hubiera habido empates. Por ejemplo, el conjunto de datos {80,76,34,80,73,80} tiene valores de 80 empatados en el 4.º, 5.º y 6.º lugar; dado que la media de {4,5,6} = 5, se asignarían clasificaciones a los valores de los datos sin procesar de la siguiente manera: {5,3,1,5,2,5}.
El efecto de los empates es reducir el valor de W ; sin embargo, este efecto es pequeño a menos que haya una gran cantidad de empates. Para corregir los empates, asigne rangos a los valores empatados como se indicó anteriormente y calcule los factores de corrección.
donde t i es el número de rangos empatados en el i ésimo grupo de rangos empatados (donde un grupo es un conjunto de valores que tienen un rango constante (empatado)) y g j es el número de grupos de empates en el conjunto de rangos (que van de 1 a n ) para el juez j . Por lo tanto, T j es el factor de corrección requerido para el conjunto de rangos para el juez j , es decir, el j ésimo conjunto de rangos. Nótese que si no hay rangos empatados para el juez j , T j es igual a 0.
Con la corrección de los empates, la fórmula para W queda así:
donde R i es la suma de los rangos para el objeto i , y es la suma de los valores de T j sobre todos los m conjuntos de rangos. [3]
En algunos casos, la importancia de los evaluadores (expertos) puede no ser la misma entre sí. En este caso, se debe utilizar la W ponderada de Kendall . [4] Supongamos que al objeto se le asigna el rango según el número de juez , donde hay en total objetos y jueces. Además, el peso del juez se muestra mediante (en una situación del mundo real, la importancia de cada evaluador puede ser diferente). De hecho, el peso de los jueces es . Entonces, el rango total otorgado al objeto es
y el valor medio de estos rangos totales es,
La suma de las desviaciones al cuadrado, , se define como,
y luego la W de Kendall ponderada se define como,
La fórmula anterior es adecuada cuando no tenemos ningún rango de empate.
En caso de empate, debemos tenerlo en cuenta en la fórmula anterior. Para corregir los empates, debemos calcular los factores de corrección,
donde representa el número de rangos de empate en el juez para el objeto . muestra el número total de empates en el juez . Con la corrección de los empates, la fórmula para la W ponderada de Kendall se convierte en,
Si los pesos de los evaluadores son iguales (la distribución de los pesos es uniforme), el valor de la W de Kendall ponderada y la W de Kendall son iguales. [4]
En el caso de rangos completos, Kendall y Gibbons (1990) [5] ofrecen una prueba de significancia comúnmente utilizada para W contra una hipótesis nula de no acuerdo (es decir, clasificaciones aleatorias).
Donde la estadística de prueba toma una distribución de chi-cuadrado con grados de libertad.
En el caso de clasificaciones incompletas (ver arriba), esto se convierte en
Donde nuevamente hay grados de libertad.
Legendre [6] comparó mediante simulación el poder de los métodos de prueba de chi-cuadrado y permutación para determinar la significancia de la W de Kendall . Los resultados indicaron que el método de chi-cuadrado era demasiado conservador en comparación con una prueba de permutación cuando . Marozzi [7] amplió esto al considerar también la prueba F , como se propuso en la publicación original que introdujo la estadística W de Kendall y Babington Smith (1939):
Donde la estadística de prueba sigue una distribución F con y grados de libertad. Marozzi descubrió que la prueba F funciona aproximadamente tan bien como el método de prueba de permutación y puede ser preferible cuando es pequeño, ya que es computacionalmente más simple.
La W de Kendall y la W de Kendall ponderada se implementan en MATLAB , [8] SPSS , R , [9] y otros paquetes de software estadístico.
{{cite book}}
: CS1 maint: multiple names: authors list (link) CS1 maint: numeric names: authors list (link)