up
next previous
Nodo Raíz: 3.10 Covarianza y coeficiente de correlación
Siguiente: 3.10.4 Interpretación geométrica de r
Previo: 3.10 Covarianza y coeficiente de correlación

Subsecciones

3.10.2 Una interpretación geométrica de la covarianza

Consideremos la nube de puntos formadas por las n parejas de datos (xi,yi). El centro de gravedad de esta nube de puntos es $(\overline{\overline{x}},\overline{\overline{y}})$, o bien podemos escribir simplemente $(\overline{x},\overline{y})$ si los datos no están ordenados en una tabla de doble entrada. Trasladamos los ejes XY al nuevo centro de coordenadas $(\overline{x},\overline{y})$. Queda así dividida la nube de puntos en cuatro cuadrantes como se observa en la figura 3.3. Los puntos que se encuentran en el primer y tercer cuadrante contribuyen positivamente al valor de ${{\cal S}_{XY}}$, y los que se encuentran en el segundo y el cuarto lo hacen negativamente.


  
Figura: Interpretación geométrica de ${{\cal S}_{XY}}$
\includegraphics[angle=0, width=1\textwidth]{fig03-03.eps}

De este modo:


  
Figura: Cuando los puntos se reparte de modo más o menos homogéneo entre los cuadrantes primero y tercero, y segundo y cuarto, se tiene que ${{\cal S}_{XY}}\approx 0$. Eso no quiere decir de ningún modo que no pueda existir ninguna relación entre las dos variables, ya que ésta puede existir como se aprecia en la figura de la derecha.
\includegraphics[angle=0, width=1\textwidth]{fig03-04.eps}




LA COVARIANZA

$\bullet$ Si ${\cal S}_{XY}>0$ las dos variables crecen o decrecen a la vez (nube de puntos creciente).

$\bullet$ Si ${\cal S}_{XY}<0$ cuando una variable crece, la otra tiene tendencia a decrecer (nube de puntos decreciente).

$\bullet$ Si los puntos se reparten con igual intensidad alrededor de $(\overline{x},\overline{y})$, ${{\cal S}_{XY}}=0$ (no hay relación lineal).



De este modo podemos utilizar la covarianza para medir la variación conjunta (covariación) de las variables X e Y. Esta medida no debe ser utilizada de modo exclusivo para medir la relación entre las dos variables, ya que es sensible al cambio de unidad de medida, como se observa en el siguiente resultado:

3.10.2.1 Proposición


\begin{displaymath}{\cal S}_{X,a+b\,Y} = b\,{{\cal S}_{XY}}
\end{displaymath}

Demostración

Para simplificar las notaciones, vamos a considerar que los datos no están agrupados en una tabla estadística: Entonces

\begin{eqnarray}\html{eqn10}{\cal S}_{X,a+b\,Y} &=&
\frac{1}{n} \sum_{i=1}^n (...
...y_i-\overline{y})
\nonumber \\
&=& b\,{{\cal S}_{XY}}
\nonumber
\end{eqnarray}


Así pues, es necesario definir una medida de la relación entre dos variables, y que no esté afectada por los cambios de unidad de medida. Una forma posible de conseguir este objetivo es dividir la covarianza por el producto de las desviaciones típicas de cada variable, ya que así se obtiene un coeficiente adimensional, r, que se denomina coeficiente de correlación lineal de Pearson

\begin{displaymath}{
\mbox{\fbox{$\displaystyle
r= \frac{{\cal S}_{XY}}{{\cal S}_X \,{\cal S}_Y}
$ } }
}
\end{displaymath}

El coeficiente de correlación lineal posee las siguientes propiedades:

\fbox{
\begin{minipage}{\textwidth}
\ \newline
{\sc El Coeficiente de Correlació...
... que no existe relación
lineal entre ambas variables.
\newline \
\end{minipage}}

Estas propiedades sobre el coeficiente de correlación lineal son explicadas en la siguiente sección.


next up previous
Nodo Raíz: 3.10 Covarianza y coeficiente de correlación
Siguiente: 3.10.4 Interpretación geométrica de r
Previo: 3.10 Covarianza y coeficiente de correlación

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo