Un coeficiente de correlación es una medida numérica de algún tipo de correlación lineal , es decir, una relación estadística entre dos variables . [a] Las variables pueden ser dos columnas de un conjunto de datos de observaciones dado , a menudo llamado muestra , o dos componentes de una variable aleatoria multivariada con una distribución conocida . [ cita requerida ]
Existen varios tipos de coeficientes de correlación, cada uno con su propia definición y su propio rango de utilidad y características. Todos asumen valores en el rango de −1 a +1, donde ±1 indica la correlación más fuerte posible y 0 indica que no hay correlación. [2] Como herramientas de análisis, los coeficientes de correlación presentan ciertos problemas, incluida la propensión de algunos tipos a ser distorsionados por valores atípicos y la posibilidad de ser utilizados incorrectamente para inferir una relación causal entre las variables (para más información, consulte Correlación no implica causalidad ). [3]
Existen varias medidas diferentes para el grado de correlación de los datos, dependiendo del tipo de datos: principalmente si los datos son una medición, ordinales o categóricos .
El coeficiente de correlación producto-momento de Pearson , también conocido como r , R o r de Pearson , es una medida de la fuerza y la dirección de la relación lineal entre dos variables que se define como la covarianza de las variables dividida por el producto de sus desviaciones estándar. [4] Este es el tipo de coeficiente de correlación más conocido y más utilizado. Cuando se utiliza el término "coeficiente de correlación" sin más calificación, generalmente se refiere al coeficiente de correlación producto-momento de Pearson.
La correlación intraclase (CCI) es una estadística descriptiva que se puede utilizar cuando se realizan mediciones cuantitativas en unidades que están organizadas en grupos; describe qué tan fuertemente se parecen entre sí las unidades del mismo grupo.
La correlación de rango es una medida de la relación entre las clasificaciones de dos variables, o dos clasificaciones de la misma variable:
El coeficiente de correlación policórica mide la asociación entre dos variables categóricas ordenadas. Se define técnicamente como la estimación del coeficiente de correlación de Pearson que se obtendría si:
Cuando ambas variables son dicotómicas en lugar de categóricas ordenadas, el coeficiente de correlación policórico se denomina coeficiente de correlación tetracórico.