up
next previous
Nodo Raíz: 3.12 Regresión
Siguiente: 3.12.4 Regresión lineal
Previo: 3.12 Regresión

3.12.2 Bondad de un ajuste

Consideremos un conjunto de observaciones sobre n individuos de una población, en los que se miden ciertas variables X e Y:

\begin{eqnarray}\html{eqn16}X&{\leadsto}&x_1,x_2,\dots,x_n
\nonumber \\
Y&{\leadsto}&y_1,y_2,\dots,y_n
\nonumber
\end{eqnarray}


Estamos interesamos en hacer regresión para determinar, de modo aproximado, los valores de Y conocidos los de X, debemos definir cierta variable $\hat{Y}=f(X)$, que debe tomar los valores


\begin{displaymath}\hat{Y} {\leadsto}\hat{y}_1=f(x_1),\hat{y}_2=f(x_2),\dots,\hat{y}_n=f(x_n)
\end{displaymath}

de modo que:


\begin{displaymath}Y-\hat{Y} {\leadsto}y_1-\hat{y}_1\approx 0,
y_2-\hat{y}_2\approx 0,\dots,y_n-\hat{y}_n\approx 0
\end{displaymath}

Ello se puede expresar definiendo una nueva variable E que mida las diferencias entre los auténticos valores de Y y los teóricos suministrados por la regresión,


\begin{displaymath}E=Y-\hat{Y} {\leadsto}e_1=y_1-\hat{y}_1,
e_2=y_2-\hat{y}_2,\dots,e_n=y_n-\hat{y}_n
\end{displaymath}

y calculando $\hat{Y}$ de modo que E tome valores cercanos a 0. Dicho de otro modo, E debe ser una variable cuya media debe ser 0 , y cuya varianza ${\cal S}_E^2$ debe ser pequeña (en comparación con la de Y). Por ello se define el coeficiente de determinación de la regresión de Y sobre X, $R_{Y_{\mid X}}^2$, como

 \begin{displaymath}R_{Y_{\mid X}}^2=1-\frac{{\cal S}_E^2}{{\cal S}_Y^2}
\end{displaymath}

Si el ajuste de Y mediante la curva de regresión $\hat{Y}=f(X)$ es bueno, cabe esperar que la cantidad $R_{Y_{\mid X}}^2$ tome un valor próximo a 1.

Análogamente si nos interesa encontrar una curva de regresión para X como función de Y, definiríamos

\begin{eqnarray}\html{eqn18}\hat{X}&=&f(Y)
\nonumber \\
E&=&X-\hat{X}
\nonumber...
...R_{X_{\mid Y}}^2&=&1-\frac{{\cal S}_E^2}{{\cal S}_X^2}
\nonumber
\end{eqnarray}


y si el ajuste es bueno se debe tener que $R_{X_{\mid Y}}^2\approx 1$.

Las cantidades $R_{X_{\mid Y}}^2$ y $R_{Y_{\mid X}}^2$ sirven entonces para medir de qué modo las diferencias entre los verdaderos valores de una variable y los de su aproximación mediante una curva de regresión son pequeños en relación con los de la variabilidad de la variable que intentamos aproximar. Por esta razón estas cantidades miden el grado de bondad del ajuste.


next up previous
Nodo Raíz: 3.12 Regresión
Siguiente: 3.12.4 Regresión lineal
Previo: 3.12 Regresión

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo