En estadística , la gamma de Goodman y Kruskal es una medida de correlación de rango , es decir, la similitud de los ordenamientos de los datos cuando se clasifican por cada una de las cantidades. Mide la fuerza de asociación de los datos tabulados de forma cruzada cuando ambas variables se miden en el nivel ordinal . No realiza ningún ajuste ni por el tamaño de la tabla ni por los empates. Los valores varían de −1 (asociación negativa del 100 % o inversión perfecta) a +1 (asociación positiva del 100 % o concordancia perfecta). Un valor de cero indica la ausencia de asociación.
Esta estadística (que es distinta de la lambda de Goodman y Kruskal ) recibe su nombre de Leo Goodman y William Kruskal , quienes la propusieron en una serie de artículos entre 1954 y 1972. [1] [2] [3] [4]
La estimación de gamma, G , depende de dos cantidades:
donde se descartan los "empates" (casos en los que cualquiera de las dos variables del par son iguales).
Esta estadística puede considerarse como el estimador de máxima verosimilitud para la cantidad teórica , donde
y donde P s y P d son las probabilidades de que un par de observaciones seleccionadas aleatoriamente se ubiquen en el mismo orden o en orden opuesto respectivamente, cuando se clasifican por ambas variables.
Los valores críticos para la estadística gamma a veces se encuentran utilizando una aproximación, mediante la cual un valor transformado, t de la estadística, se denomina distribución t de Student , donde [ cita requerida ]
y donde n es el número de observaciones (no el número de pares):
Un caso especial de la gamma de Goodman y Kruskal es el coeficiente Q de Yule , también conocido como coeficiente de asociación de Yule , [5] que es específico de las matrices 2×2. Considere la siguiente tabla de contingencia de eventos, donde cada valor es un recuento de la frecuencia de un evento:
La Q de Yule viene dada por:
Aunque se calcula de la misma manera que la gamma de Goodman y Kruskal, tiene una interpretación ligeramente más amplia porque la distinción entre escalas nominales y ordinales se convierte en una cuestión de etiquetado arbitrario para distinciones dicotómicas. Por lo tanto, que Q sea positivo o negativo depende simplemente de qué emparejamientos el analista considere concordantes, pero por lo demás es simétrico.
Q varía de −1 a +1. −1 refleja una asociación negativa total, +1 refleja una asociación positiva perfecta y 0 refleja que no hay asociación en absoluto. El signo depende de qué emparejamientos el analista consideró inicialmente como concordantes, pero esta elección no afecta la magnitud.
En términos de la razón de probabilidades OR, la Q de Yule está dada por
y entonces la Q de Yule y la Y de Yule están relacionadas por