up
next previous
Nodo Raíz: 3.10 Covarianza y coeficiente de correlación
Siguiente: 3.12 Regresión
Previo: 3.10.2 Una interpretación geométrica de la

Subsecciones

3.10.4 Interpretación geométrica de r

Si los datos son observaciones que no están ordenadas en una tabla bidimensional, tendremos parejas de valores para cada sujeto o elemento


\begin{displaymath}(x_i,y_i),\qquad i=1,\dots,n
\end{displaymath}

la fórmula de la covarianza, en este caso, es


\begin{displaymath}{{\cal S}_{XY}}=
\sum_{i=1}^n (x_i - \overline{x}) \cdot
(y_i - \overline{y})
\end{displaymath}

Podemos a escribir las observaciones en forma de vectores de la siguiente manera:

\begin{eqnarray}\html{eqn12}\vec{X} &=& (x_1,x_2,\dots, x_n)\in I\!\!R^n
\nonumb...
...erline{y},\overline{y},\dots,\overline{y})\in I\!\!R^n
\nonumber
\end{eqnarray}


Si denotamos $\vec{v}\cdot\vec{w}$ al producto escalar de los vectores $\vec{v}$ y $\vec{w}$, es inmediato comprobar que en realidad las definiciones de varianza y covarianza tienen una idea geométrica muy simple: son productos escalares en los que intervienen los vectores $\vec{X}-\vec{\overline{x}}$ e $\vec{Y}-\vec{\overline{y}}$

\begin{eqnarray}\html{eqn12}{{\cal S}_{XY}}&=&\frac{1}{n} (\vec{X}-\vec{\overlin...
... \mid \vec{Y}-\vec{\overline{y}} \mid^2
= {\cal S}_{YY}
\nonumber \end{eqnarray}


Con esta descripción geométrica de las varianzas y covarianzas, podemos poner de manifiesto la existencia de paralelismo entre las desviaciones de las variables X e Y, con respecto a sus centros de gravedad ya que


\begin{displaymath}(\vec{X}-\vec{\overline{x}}) \cdot (\vec{Y}-\vec{\overline{y}...
... \cdot \mid \vec{Y}-\vec{\overline{y}} \mid
\cdot \cos \theta,
\end{displaymath}

donde $\theta $ es el ángulo entre los vectores $\vec{X}-\vec{\overline{x}}$ e $\vec{Y}-\vec{\overline{y}}$ (véase la figura 3.5). Despejando:


\begin{displaymath}\cos \theta = \frac{
(\vec{X}-\vec{\overline{x}}) \cdot (\vec...
...}} \mid}
= \frac{{{\cal S}_{XY}}}{{\cal S}_X \cdot {\cal S}_Y}
\end{displaymath}


  
Figura: Interpretación geométrica de r como el coseno del ángulo que forman los vectores de las desviaciones con respecto a sus respectivas medias de X y de Y.
\includegraphics[angle=-90, width=0.9\textwidth]{fig03-05.epsi}

Si los vectores $\vec{X}-\vec{\overline{x}}$ e $\vec{Y}-\vec{\overline{y}}$son totalmente paralelos entonces $\cos \theta = \pm 1$. En este caso existirá una constante de proporcionalidad m tal que:


\begin{displaymath}(\vec{Y}-\vec{\overline{y}})
=
m\cdot\vec{X}-\vec{\overline{x}}
\end{displaymath}

Esta es la ecuación de una recta (véase la figura 3.6). Es decir:


\begin{displaymath}\begin{array}{c}
r=\pm 1
\\
\Updownarrow
\\
\mbox{las desvi...
...ox{Las observaciones están perfectamente alineadas}
\end{array}\end{displaymath}


  
Figura: $r=\pm 1$ es lo mismo que decir que las observaciones de ambas variables están perfectamente alineadas. El signo de r, es el mismo que el de ${{\cal S}_{XY}}$, por tanto nos indica el crecimiento o decrecimiento de la recta.
\includegraphics[angle=0, width=1\textwidth]{fig03-06.eps}

La magnitud que expresa el coseno del ángulo que forman los vectores $\vec{X}-\vec{\overline{x}}$ e $\vec{Y}-\vec{\overline{y}}$ tiene un papel muy destacado como veremos más adelante en regresión lineal. La hemos denominado anteriormente como coeficiente de correlación lineal de Pearson y se representa mediante la letra r:


\begin{displaymath}r=\cos \theta = \frac{{{\cal S}_{XY}}}{{\cal S}_X \cdot {\cal S}_Y}
\end{displaymath}

Son evidentes entonces las siguientes propiedades de r

Otra propiedad interesante de r es la siguiente:

3.10.4.1 Proposición

El coeficiente de correlación entre dos variables no se ve afectada por los cambios de unidades.

Demostración
Consideramos la variable bidimensional (X,Y) y sometemos a Y a un cambio de unidad $Z=a+b\,Y$. Entonces


\begin{displaymath}\frac{{\cal S}_{XZ}}{{\cal S}_X \cdot {\cal S}_Z} =
\frac{b...
...cal S}_Y}=
\frac{{{\cal S}_{XY}}}{{\cal S}_X \cdot {\cal S}_Y}
\end{displaymath}

Por tanto ambas variables XZ y XY tienen el mismo coeficiente de correlación.


next up previous
Nodo Raíz: 3.10 Covarianza y coeficiente de correlación
Siguiente: 3.12 Regresión
Previo: 3.10.2 Una interpretación geométrica de la

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo