Si los datos son observaciones que no están ordenadas en una tabla bidimensional, tendremos parejas de valores para cada sujeto o elemento
la fórmula de la covarianza, en este caso, es
Podemos a escribir las observaciones en forma de vectores de la siguiente manera:

Si denotamos
al producto escalar de los
vectores
y
,
es inmediato comprobar que en realidad
las definiciones de varianza y covarianza tienen una idea geométrica
muy simple: son productos escalares en los que intervienen
los vectores
e

Con esta descripción geométrica de las varianzas y covarianzas, podemos poner de manifiesto la existencia de paralelismo entre las desviaciones de las variables X e Y, con respecto a sus centros de gravedad ya que
donde
es el ángulo entre los vectores
e
(véase la
figura 3.5). Despejando:
|
Si los vectores
e
son totalmente paralelos entonces
.
En este caso
existirá una constante de proporcionalidad m tal que:
Esta es la ecuación de una recta (véase la figura 3.6). Es decir:
|
La magnitud que expresa el coseno del ángulo que forman
los vectores
e
tiene un papel muy destacado como veremos más adelante en regresión
lineal. La hemos denominado anteriormente como coeficiente de correlación
lineal de Pearson y
se representa mediante la letra r:
Son evidentes entonces las siguientes propiedades de r
entonces los vectores
e
son paralelos y por tanto
.
En este caso
se puede decir de modo exacto que conocido X lo es también Y,
(y recíprocamente), gracias a la relación (3.8).
Otra propiedad interesante de r es la siguiente:
Por tanto ambas variables XZ y XY tienen el mismo coeficiente de correlación.