up
next previous
Nodo Raíz: 3. Variables bidimensionales
Siguiente: 3.12.2 Bondad de un ajuste
Previo: 3.10.4 Interpretación geométrica de r

3.12 Regresión

Las técnicas de regresión permiten hacer predicciones sobre los valores de cierta variable Y (dependiente), a partir de los de otra X (independiente), entre las que intuimos que existe una relación. Para ilustrarlo retomemos los ejemplos mencionados al principio del capítulo. Si sobre un grupo de personas observamos los valores que toman las variables

\begin{eqnarray}\html{eqn14}X & \equiv & \mbox{ altura medida en centímetros,}
\\
Y & \equiv & \mbox{ altura medida en metros,}
\end{eqnarray}


no es necesario hacer grandes esfuerzos para intuir que la relación que hay entre ambas es:


\begin{displaymath}Y= \frac{X}{100}.
\end{displaymath}

Obtener esta relación es menos evidente cuando lo que medimos sobre el mismo grupo de personas es

\begin{eqnarray}\html{eqn16}X & \equiv & \mbox{ altura medida en centímetros,}
\nonumber \\
Y & \equiv & \mbox{ peso en kilogramos.}
\nonumber
\end{eqnarray}


La razón es que no es cierto que conocida la altura xi de un individuo, podamos determinar de modo exacto su peso yi (v.g. dos personas que miden 1,70 m pueden tener pesos de 60 y 65 kilos). Sin embargo, alguna relación entre ellas debe existir, pues parece mucho más probable que un individuo de 2 m pese más que otro que mida 1,20 m. Es más, nos puede parecer más o menos aproximada una relación entre ambas variables como la siguiente


\begin{displaymath}Y = X - 110 \pm \mbox{ \bf error.}
\end{displaymath}

A la deducción, a partir de una serie de datos, de este tipo de relaciones entre variables, es lo que denominamos regresión.


  
Figura: Mediante las técnicas de regresión de una variable Y sobre una variable X, buscamos una función que sea una buena aproximación de una nube de puntos (xi,yi), mediante una curva del tipo $\hat{Y}=f(X)$. Para ello hemos de asegurarnos de que la diferencia entre los valores yi e $\hat{y}_i$ sea tan pequeña como sea posible.
\includegraphics[angle=0, width=0.8\textwidth]{fig03-07.eps}

Mediante las técnicas de regresión inventamos una variable $\hat{Y}$ como función de otra variable X (o viceversa),


\begin{displaymath}\hat{Y} = f(X).
\end{displaymath}

Esto es lo que denominamos relación funcional. El criterio para construir $\hat{Y}$, tal como citamos anteriormente, es que la diferencia entre Y e $\hat{Y}$ sea pequeña.

\begin{displaymath}\hat{Y} = f(X),\qquad Y-\hat{Y}=\mbox{ \bf error},
\end{displaymath}

El término que hemos denominado error debe ser tan pequeño como sea posible (figura 3.7). El objetivo será buscar la función (también denominada modelo de regresión) $\hat{Y}=f(X)$ que lo minimice. Véase la figura 3.8.


  
Figura: Diferentes nubes de puntos y modelos de regresión para ellas.
\includegraphics[angle=0, width=1\textwidth]{fig03-08.eps}



 
next up previous
Nodo Raíz: 3. Variables bidimensionales
Siguiente: 3.12.2 Bondad de un ajuste
Previo: 3.10.4 Interpretación geométrica de r

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo