Consideremos un conjunto de observaciones sobre n individuos de una población, en los que se miden ciertas variables X e Y:

Estamos interesamos en hacer regresión para determinar,
de modo aproximado,
los valores de Y conocidos los de X, debemos definir cierta
variable
,
que debe tomar los valores
de modo que:
Ello se puede expresar definiendo una nueva variable E que mida las diferencias entre los auténticos valores de Y y los teóricos suministrados por la regresión,
y calculando
de modo que E tome valores cercanos a 0.
Dicho de otro modo,
E debe ser una variable cuya media debe ser 0 , y cuya varianza
debe ser pequeña (en comparación con la de Y).
Por ello se define el coeficiente de determinación de la regresión
de Y sobre X,
,
como
Si el ajuste de Y mediante la curva de regresión
es bueno, cabe esperar que la cantidad
tome
un valor próximo a 1.
Análogamente si nos interesa encontrar una curva de regresión para X como función de Y, definiríamos

y si el ajuste es bueno se debe tener que
.
Las cantidades
y
sirven entonces
para medir de qué modo las diferencias entre los verdaderos valores de
una variable y los
de su aproximación mediante una curva de regresión son pequeños
en relación con los de la variabilidad de la variable que intentamos
aproximar. Por esta razón estas
cantidades miden el grado de bondad del ajuste.