stringtranslate.com

Gamma de Goodman y Kruskal

En estadística , la gamma de Goodman y Kruskal es una medida de correlación de rango , es decir, la similitud de los ordenamientos de los datos cuando se clasifican por cada una de las cantidades. Mide la fuerza de asociación de los datos tabulados de forma cruzada cuando ambas variables se miden en el nivel ordinal . No realiza ningún ajuste ni por el tamaño de la tabla ni por los empates. Los valores varían de −1 (asociación negativa del 100 % o inversión perfecta) a +1 (asociación positiva del 100 % o concordancia perfecta). Un valor de cero indica la ausencia de asociación.

Esta estadística (que es distinta de la lambda de Goodman y Kruskal ) recibe su nombre de Leo Goodman y William Kruskal , quienes la propusieron en una serie de artículos entre 1954 y 1972. [1] [2] [3] [4]

Definición

La estimación de gamma, G , depende de dos cantidades:

  • N s , el número de pares de casos clasificados en el mismo orden en ambas variables (número de pares concordantes ),
  • N d , el número de pares de casos clasificados en orden inverso en ambas variables (número de pares invertidos),

donde se descartan los "empates" (casos en los que cualquiera de las dos variables del par son iguales).

Esta estadística puede considerarse como el estimador de máxima verosimilitud para la cantidad teórica , donde

y donde P s y P d son las probabilidades de que un par de observaciones seleccionadas aleatoriamente se ubiquen en el mismo orden o en orden opuesto respectivamente, cuando se clasifican por ambas variables.

Los valores críticos para la estadística gamma a veces se encuentran utilizando una aproximación, mediante la cual un valor transformado, t de la estadística, se denomina distribución t de Student , donde [ cita requerida ]

y donde n es el número de observaciones (no el número de pares):

La Q de Yule

Un caso especial de la gamma de Goodman y Kruskal es el coeficiente Q de Yule , también conocido como coeficiente de asociación de Yule , [5] que es específico de las matrices 2×2. Considere la siguiente tabla de contingencia de eventos, donde cada valor es un recuento de la frecuencia de un evento:

La Q de Yule viene dada por:

Aunque se calcula de la misma manera que la gamma de Goodman y Kruskal, tiene una interpretación ligeramente más amplia porque la distinción entre escalas nominales y ordinales se convierte en una cuestión de etiquetado arbitrario para distinciones dicotómicas. Por lo tanto, que Q sea positivo o negativo depende simplemente de qué emparejamientos el analista considere concordantes, pero por lo demás es simétrico.

Q varía de −1 a +1. −1 refleja una asociación negativa total, +1 refleja una asociación positiva perfecta y 0 refleja que no hay asociación en absoluto. El signo depende de qué emparejamientos el analista consideró inicialmente como concordantes, pero esta elección no afecta la magnitud.

En términos de la razón de probabilidades OR, la Q de Yule está dada por

y entonces la Q de Yule y la Y de Yule están relacionadas por

Véase también

Referencias

  1. ^ Goodman, Leo A.; Kruskal, William H. (1954). "Medidas de asociación para clasificaciones cruzadas". Revista de la Asociación Estadounidense de Estadística . 49 (268): 732–764. doi :10.2307/2281536. JSTOR  2281536.
  2. ^ Goodman, Leo A.; Kruskal, William H. (1959). "Medidas de asociación para clasificaciones cruzadas. II: discusión adicional y referencias". Revista de la Asociación Estadounidense de Estadística . 54 (285): 123–163. doi :10.1080/01621459.1959.10501503. JSTOR  2282143.
  3. ^ Goodman, Leo A.; Kruskal, William H. (1963). "Medidas de asociación para clasificaciones cruzadas III: teoría de muestreo aproximado". Revista de la Asociación Estadounidense de Estadística . 58 (302): 310–364. doi :10.1080/01621459.1963.10500850. JSTOR  2283271.
  4. ^ Goodman, Leo A.; Kruskal, William H. (1972). "Medidas de asociación para clasificaciones cruzadas, IV: simplificación de varianzas asintóticas". Revista de la Asociación Estadounidense de Estadística . 67 (338): 415–421. doi :10.1080/01621459.1972.10482401. JSTOR  2284396.
  5. ^ Yule, G U. (1912). "Sobre los métodos de medición de la asociación entre dos atributos". Journal of the Royal Statistical Society . 49 (6): 579–652. doi :10.2307/2340126. JSTOR  2340126.

Lectura adicional