Coeficiente de correlación de Pearson

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas y continuas.

El coeficiente de correlación de Pearson cuando se aplica a una población típicamente se representa por la letra griega

(rho) y se refiere a ella coeficiente de correlación poblacional o el coeficiente de correlación poblacional de Pearson.

Dado un par de variables aleatorias

) se define como donde El coeficiente de correlación de Pearson cuando es aplicado a una muestra, se suele denotar por

y se refiere a este como el coeficiente de correlación muestral o el coeficiente de correlación muestral de Pearson.

, se define el coeficiente de correlación muestral de Pearson como donde El coeficiente de correlación muestral también puede ser escrito como El valor del índice de correlación varía en el intervalo

, indicando el signo el sentido de la relación:

Ejemplos de diagramas de dispersión con diferentes valores del coeficiente de correlación
Varios grupos de puntos , con el coeficiente de correlación para cada grupo. Nótese que la correlación refleja la no linealidad y la dirección de la relación lineal. En la figura del centro, la varianza de y es nula, por lo que la correlación es indeterminada.