El coeficiente de contingencia de Pearson expresa la intensidad de la relación entre dos (o más) variables cualitativas ordinales o nominales.
Se basa en la comparación de las frecuencias efectivamente calculadas de dos características con las frecuencias que se hubiesen esperado con independencia de estas características.
(también llamado contingencia cuadrática),[1] sobre el que se basa el coeficiente de contingencia, es una medida de la "intensidad" de la relación entre las características observadas : El valor informativo del coeficiente
No está dada entonces la factibilidad de la comparación de valores del coeficiente
sobre diferentes tablas de contingencia y tamaños muestrales.
(véase Prueba de Chi cuadrado).
Sea la siguiente una tabla de contingencia proveniente de una encuesta: Cálculo del coeficiente
Otra medida para especificar la intensidad de la dependencia de las características en una tabla de contingencia es la contingencia cuadrática media, que en lo esencial representa una ampliación del coeficiente
: Cuanto mayor es esta medida, tanto más intensa es la relación entre las dos características analizadas.
Si ambas características (variables) son independientes, entonces cada uno de los sumandos se hace 0, a consecuencia de que se hace 0 el numerador de la fracción y con ello la medida misma también.
puede asumir valores en principio muy grandes y no está limitado al intervalo
el coeficiente de contingencia C (también denominado CC o K) de Karl Pearson: Este puede asumir valores en el intervalo [0,1).
Resulta problemático que el límite superior del coeficiente de contingencia C sea dependiente del número de las dimensiones observadas:[4] Aquí rige
cercano a 0 indica características independientes.
Para el ejemplo propuesto, resulta un coeficiente de contingencia corregido
El Cramérs V (en inglés también: Cramér's V) es un coeficiente de contingencia, más precisamente, una medida de relación estadística basada en
Se denomina así en honor del matemático y estadístico sueco Harald Cramér.
El Cramérs V es una valor de medida independiente del tamaño de la muestra.
Cramérs V es una medida simétrica para la intensidad de la relación entre dos o más variables de la escala nominal, cuando (por lo menos) una de las dos variables tiene por lo menos dos formas (valores posibles).
En una tabla de 2x2 el Cramérs V corresponde al Coeficiente phi.
Un Cramérs V que es mayor que 0,3 es considerado en ciencias sociales como una correlación significativa.
Rango de valores [0 hasta 1]: Dado que Cramérs V es un número siempre positivo, no se pueden hacer afirmaciones acerca de la dirección de la relación.
) es una medida para la intensidad de la relación entre variables dicotómicas.
para estimar la correlación de cuatro campos entre dos características dicotómicas A y B, se construye primeramente una tabla de contingencia que contiene la distribución de frecuencia conjunta de las variables.
Con los datos de la tabla se puede calcular
a ⋅ d − b ⋅ c
( a + b ) ⋅ ( c + d ) ⋅ ( a + c ) ⋅ ( b + d )
designa al número de observaciones.
es la raíz cuadrada (sin que importe el signo) de la contingencia media cuadrática (ver más arriba).
tiene una distribución Chi Cuadrado con un grado de libertad.