stringtranslate.com

La W de Kendall

La W de Kendall (también conocida como coeficiente de concordancia de Kendall ) es una estadística no paramétrica para la correlación de rangos . Es una normalización de la estadística de la prueba de Friedman y puede usarse para evaluar el acuerdo entre evaluadores y, en particular, la confiabilidad entre evaluadores . La W de Kendall varía de 0 (sin acuerdo) a 1 (totalmente de acuerdo).

Supongamos, por ejemplo, que se ha pedido a varias personas que clasifiquen una lista de preocupaciones políticas, de las más importantes a las menos importantes. La W de Kendall se puede calcular a partir de estos datos. Si el estadístico de prueba W es 1, entonces todos los encuestados han sido unánimes y cada encuestado ha asignado el mismo orden a la lista de preocupaciones. Si W es 0, entonces no hay una tendencia general de acuerdo entre los encuestados y sus respuestas pueden considerarse esencialmente aleatorias. Los valores intermedios de W indican un mayor o menor grado de unanimidad entre las distintas respuestas.

Mientras que las pruebas que utilizan el coeficiente de correlación estándar de Pearson suponen valores distribuidos normalmente y comparan dos secuencias de resultados simultáneamente, la W de Kendall no hace suposiciones sobre la naturaleza de la distribución de probabilidad y puede manejar cualquier número de resultados distintos.

Pasos de la W de Kendall

Supongamos que el objeto i recibe el rango r i,j por el juez número j , donde hay en total n objetos y m jueces. Entonces el rango total dado al objeto i es

y el valor medio de estos rangos totales es

La suma de las desviaciones al cuadrado, S , se define como

y luego la W de Kendall se define como [1]

Si el estadístico de prueba W es 1, entonces todos los jueces o encuestados han sido unánimes, y cada juez o encuestado ha asignado el mismo orden a la lista de objetos o preocupaciones. Si W es 0, entonces no hay una tendencia general de acuerdo entre los encuestados y sus respuestas pueden considerarse esencialmente aleatorias. Los valores intermedios de W indican un mayor o menor grado de unanimidad entre los distintos jueces o encuestados.

Kendall y Gibbons (1990) también muestran que W está linealmente relacionado con el valor medio de los coeficientes de correlación de rangos de Spearman entre todos los pares posibles de rankings entre jueces.

Bloques incompletos

Cuando los jueces evalúan solo algún subconjunto de los n objetos, y cuando el diseño de bloque correspondiente es un diseño (n, m, r, p, λ) (tenga en cuenta la notación diferente) . En otras palabras, cuando

  1. cada juez clasifica el mismo número p de objetos para algunos ,
  2. cada objeto se clasifica exactamente el mismo número total r de veces,
  3. y cada par de objetos se presenta junto a algún juez un total de exactamente λ veces, una constante para todos los pares.

Entonces la W de Kendall se define como [2]

Si cada juez clasifica los n objetos , la fórmula anterior es equivalente a la original.

Corrección de empates

Cuando se producen valores empatados, a cada uno se le da el promedio de los rangos que se habrían dado si no se hubieran producido empates. Por ejemplo, el conjunto de datos {80,76,34,80,73,80} tiene valores de 80 empatados en el cuarto, quinto y sexto lugar; dado que la media de {4,5,6} = 5, las clasificaciones se asignarían a los valores de datos sin procesar de la siguiente manera: {5,3,1,5,2,5}.

El efecto de los vínculos es reducir el valor de W ; sin embargo, este efecto es pequeño a menos que exista una gran cantidad de vínculos. Para corregir los empates, asigne rangos a los valores empatados como se indica arriba y calcule los factores de corrección.

donde ti es el número de rangos empatados en el i- ésimo grupo de rangos empatados (donde un grupo es un conjunto de valores que tienen un rango constante (empatado)) y g j es el número de grupos de empates en el conjunto de rangos (que van de 1 a n ) para el juez j . Por tanto, Tj es el factor de corrección requerido para el conjunto de rangos del juez j , es decir , el jésimo conjunto de rangos. Tenga en cuenta que si no hay rangos empatados para el juez j , Tj es igual a 0.

Con la corrección por empates, la fórmula para W queda

donde R i es la suma de los rangos del objeto i y es la suma de los valores de T j en todos los m conjuntos de rangos. [3]

Pasos de la W de Kendall ponderada

En algunos casos, la importancia de los evaluadores (expertos) puede no ser la misma entre sí. En este caso, se debe utilizar la W ponderada de Kendall . [4] Supongamos que a ese objeto se le asigna el rango por número de juez , donde hay en total objetos y jueces. Además, el peso del juez se muestra por (en una situación del mundo real, la importancia de cada evaluador puede ser diferente). De hecho, el peso de los jueces es . Entonces, el rango total otorgado al objeto es

y el valor medio de estos rangos totales es,

La suma de las desviaciones al cuadrado, se define como,

y luego la W ponderada de Kendall se define como,

La fórmula anterior es adecuada cuando no tenemos ningún rango empatado.

Corrección de empates

En caso de empate, debemos considerarlo en la fórmula anterior. Para corregir los empates, debemos calcular los factores de corrección,

donde representa el número de rangos empatados en el juez del objeto . Muestra el número total de empates en el juez . Con la corrección por empates, la fórmula para la W ponderada de Kendall se convierte en:

Si las ponderaciones de los evaluadores son iguales (la distribución de las ponderaciones es uniforme), el valor de W de Kendall ponderado y W de Kendall son iguales. [4]

Pruebas de significancia

En el caso de rangos completos, Kendall y Gibbons (1990) [5] ofrecen una prueba de significación comúnmente utilizada para W frente a una hipótesis nula de no acuerdo (es decir, rankings aleatorios).

Donde el estadístico de prueba toma una distribución chi-cuadrado con grados de libertad.

En el caso de clasificaciones incompletas (ver arriba), esto se convierte en

Donde nuevamente, hay grados de libertad.

Legendre [6] comparó mediante simulación el poder de los enfoques de prueba de permutación y chi-cuadrado para determinar la importancia de la W de Kendall . Los resultados indicaron que el método chi-cuadrado era demasiado conservador en comparación con una prueba de permutación cuando . Marozzi [7] amplió esto considerando también la prueba F , como se propuso en la publicación original que presentaba el estadístico W de Kendall y Babington Smith (1939):

Donde el estadístico de prueba sigue una distribución F con y grados de libertad. Marozzi descubrió que la prueba F funciona aproximadamente tan bien como el método de prueba de permutación y puede preferirse a cuando es pequeña, ya que es computacionalmente más simple.

Software

La W de Kendall y la W de Kendall ponderada se implementan en MATLAB , [8] SPSS , R , [9] y otros paquetes de software estadístico.

Ver también

Notas

  1. ^ Dodge (2003): ver "concordancia, coeficiente de"
  2. ^ Gibones y Chakraborti (2003)
  3. ^ Siegel y Castellán (1988, p.266)
  4. ^ ab Mahmoudi, Amin; Abbasi, Mehdi; Yuan, Jingfeng; Li, Lingzhi (2022). "Toma de decisiones en grupo a gran escala (LSGDM) para la medición del desempeño de proyectos de construcción de atención médica: enfoque de prioridad ordinal". Inteligencia Aplicada . 52 (12): 13781–13802. doi :10.1007/s10489-022-04094-y. ISSN  1573-7497. PMC  9449288 . PMID  36091930.
  5. ^ Kendall, Maurice G. (Maurice George), 1907-1983. (1990). Métodos de correlación de rangos . Gibbons, Jean Dickinson, 1938- (5ª ed.). Londres: E. Arnold. ISBN 0-19-520837-4. OCLC  21195423.{{cite book}}: CS1 maint: multiple names: authors list (link) CS1 maint: numeric names: authors list (link)
  6. ^ Leyenda (2005)
  7. ^ Marozzi, Marco (2014). "Pruebas de concordancia entre varios criterios". Revista de simulación y computación estadística . 84 (9): 1843–1850. doi :10.1080/00949655.2013.766189. S2CID  119577430.
  8. ^ "W ponderada de Kendall". www.mathworks.com . Consultado el 6 de octubre de 2022 .
  9. ^ "Coeficiente de concordancia de Kendall W: generalizado para conjuntos de datos aleatoriamente incompletos". El Proyecto R para Computación Estadística .

Referencias