Consideremos la nube de puntos formadas por las n parejas
de datos (xi,yi). El centro de gravedad de esta
nube de puntos es
,
o bien podemos escribir
simplemente
si los datos no están ordenados
en una tabla de doble entrada. Trasladamos los ejes XY al
nuevo centro de coordenadas
.
Queda así
dividida la nube de puntos en cuatro cuadrantes como
se observa en la figura 3.3. Los puntos que se encuentran
en el primer y tercer cuadrante contribuyen positivamente
al valor de
,
y los que se encuentran en el
segundo y el cuarto lo hacen negativamente.
De este modo:
|
De este modo podemos utilizar la covarianza para medir la variación conjunta (covariación) de las variables X e Y. Esta medida no debe ser utilizada de modo exclusivo para medir la relación entre las dos variables, ya que es sensible al cambio de unidad de medida, como se observa en el siguiente resultado:
Para simplificar las notaciones, vamos a considerar que los datos no están agrupados en una tabla estadística: Entonces

Así pues, es necesario definir una medida de la relación entre dos variables, y que no esté afectada por los cambios de unidad de medida. Una forma posible de conseguir este objetivo es dividir la covarianza por el producto de las desviaciones típicas de cada variable, ya que así se obtiene un coeficiente adimensional, r, que se denomina coeficiente de correlación lineal de Pearson
El coeficiente de correlación lineal posee las siguientes propiedades:
Estas propiedades sobre el coeficiente de correlación lineal son explicadas en la siguiente sección.