up
next previous
Nodo Raíz: 2.3 Estadísticos de tendencia central
Siguiente: 2.3.4 La mediana
Previo: 2.3 Estadísticos de tendencia central

Subsecciones

     
2.3.2 La media

La media aritmética de una variable estadística es la suma de todos sus posibles valores, ponderada por las frecuencias de los mismos. Es decir, si la tabla de valores de una variable X es

X ni fi
x1 n1 f1
... ... ...
xk nk fk

la media es el valor que podemos escribir de las siguientes formas equivalentes:

\begin{eqnarray}\html{eqn0}\overline{x} & = & x_1 \, f_1 + \dots + x_k \, f_k \n...
...mber \\
& = & \frac{1}{n} \, \sum_{i=1}^k x_i \, n_i
\nonumber
\end{eqnarray}


Si los datos no están ordenados en una tabla, entonces

\begin{displaymath}{
\mbox{\fbox{$\displaystyle
\overline{x}= \frac{x_1 + \dots + x_n}{n}
$ } }
}
\end{displaymath}

2.3.2.1 Observación

Hemos supuesto implícitamente en la definición de media que tratábamos con una variable X discreta. Si la variable es continua tendremos que cambiar los valores de xi por las marcas de clase correspondientes. En general, la media aritmética obtenida a partir de las marcas de clase ci, diferirá de la media obtenida con los valores reales, xi. Es decir, habrá una perdida de precisión que será tanto mayor cuanto mayor sea la diferencia entre los valores reales y las marcas de clase, o sea, cuanto mayores sean las longitudes ai, de los intervalos.

  
2.3.2.2 Proposición

La suma de las diferencias de la variable con respecto a la media es nula, es decir,


\begin{displaymath}\sum_{i=1}^n (x_i-\overline{x}) =0
\end{displaymath}

Demostración
Basta desarrollar el sumatorio para obtener

\begin{displaymath}\sum_{i=1}^n (x_i-\overline{x}) = (x_1-\overline{x}) + \dots ...
...s +x_n) - n\,\overline{x}= n\,\overline{x}- n\,\overline{x}= 0
\end{displaymath}

Este resultado nos indica que el error cometido al aproximar un valor cualquiera de la variable, por ejemplo x1, mediante el valor central $\overline {x}$, es compensado por los demás errores:


\begin{displaymath}\mbox{Error aprox. de $x_1$ } \qquad \equiv \qquad
x_1-\overline{x}= \sum_{i=2}^n (x_i-\overline{x})
\end{displaymath}

Si los errores se consideran con signo positivo, en este caso no pueden compensarse. Esto ocurre si tomamos como medida de error alguna de las siguientes:


\begin{displaymath}\sum_{i=1}^n (x_i-\overline{x})^2 \geq 0 \qquad \mbox{Error cuadrático}
\end{displaymath}


\begin{displaymath}\qquad \sum_{i=1}^n \mid x_i-\overline{x}\mid \geq 0
\qquad \mbox{Error absoluto}
\end{displaymath}


\begin{displaymath}\max_{i=1,\dots, n} \mid x_i - \overline{x}\mid \geq 0
\qquad \mbox{Error máximo}
\end{displaymath}

que son cantidades estrictamente positivas si algún $x_i \neq \overline{x}$.

2.3.2.3 Ejemplo

Obtener las desviaciones con respecto a la media en la siguiente distribución y comprobar que su suma es cero.

li-1 - li ni
0 - 10 1
10 - 20 2
20 - 30 4
30 - 40 3

Solución:

li-1 - li ni xi xi ni $x_i-\overline{x}$ $(x_i-\overline{x})n_i$
0 - 10 1 5 5 -19 -19
10 - 20 2 15 30 -9 -18
20 - 30 4 25 100 +1 +4
30 - 40 3 35 105 +11 +33
  n=10   $\sum x_i n_i=240$   $\sum=0$

La media aritmética es:


\begin{displaymath}\overline{x}=\frac{1}{n}\sum x_in_i = \frac{240}{10}=24
\end{displaymath}

Como se puede comprobar sumando los elementos de la última columna,

\begin{displaymath}\sum (x_i-\overline{x})\cdot n_i = 0
\end{displaymath}

     
2.3.2.4 Proposición (König)

Para cualquier posible valor kque consideremos como candidato a medida central, $\overline {x}$ lo mejora en el sentido de los mínimos cuadrados, es decir


\begin{displaymath}\sum_{i=1}^n (x_i-\overline{x})^2 < \sum_{i=1}^n (x_i-k)^2
\qquad \mbox{ si } k \neq \overline{x}
\end{displaymath}

Demostración

Sea $k\neq \overline{x}$. Veamos que el error cuadrático cometido por kes mayor que el de $\overline {x}$.

\begin{eqnarray}\html{eqn2}\sum_{i=1}^n (x_i-k)^2 & = & \sum_{i=1}^n [x_i-(k-\ov...
...\nonumber \\
& > & \sum_{i=1}^n (x_i-\overline{x})^2
\nonumber
\end{eqnarray}


   
2.3.2.5 Proposición (Linealidad de la media)


\begin{displaymath}Y = a + b\, X \Longrightarrow \overline{y}= a+ b \, \overline{x}
\end{displaymath}

    
2.3.2.6 Proposición

Dados r grupos con n1, n2, ..., nrobservaciones y siendo $\overline{x}_1$, $\overline{x}_2$, ..., $\overline{x}_r$ las respectivas medias de cada uno de ellos. Entonces la media de las $n=n_1+\cdots+n_r$ observaciones es

\begin{displaymath}\overline{x}= \frac{n_1\, \overline{x}_1 + \dots +
n_r \, \overline{x}_r}{n_1 + \dots + n_r}
\end{displaymath}

Demostración

Vamos a llamar xij a la j-ésima observación del grupo i; Entonces tenemos

\begin{displaymath}\left.
\begin{array}{ccccc}
\mbox{$1^{er}$\space grupo} & \lo...
...e{x}_r = \left(\sum_{j=1}^{n_r} x_{ij}\right) / n_r
\end{array}\end{displaymath}

Así, agrupando convenientemente las observaciones se llega a que

\begin{eqnarray}\html{eqn2}\overline{x}&=& \frac{ (x_{11}+\dots+x_{1n_1}) +
(x...
...1\, \overline{x}_1 + \dots +
n_r \, \overline{x}_r}{n}
\nonumber
\end{eqnarray}


2.3.2.7 Observación

A pesar de las buenas propiedades que ofrece la media, ésta posee algunos inconvenientes:

2.3.2.8 Cálculo abreviado

Se puede utilizar la linealidad de la media para simplificar las operaciones necesarias para su cálculo mediante un cambio de origen y de unidad de medida. El método consiste en lo siguiente:

1.
Tomamos a un número que exprese aproximadamente el tipo de unidad con la que se trabaja. Por ejemplo, si las unidades que usamos son millones, tomamos a=1.000.000.

2.
Seleccionamos un punto cualquiera de la zona central de la tabla, x0. Este punto jugará el papel de origen de referencia.
3.
Cambiamos a la variable

 \begin{eqnarray}\html{eqn2}Z = \frac{X-x_0}{a} \qquad & \Longrightarrow &
\over...
...\Longrightarrow & \overline{x}= a\, \overline{z} + x_0
\nonumber
\end{eqnarray}


4.
Construimos de este modo la tabla de la variable Z, para la que es más fácil calcular $\overline{z}$ directamente, y después se calcula $\overline {x}$ mediante la relación (2.2).

2.3.2.9 Medias generalizadas

En función del tipo de problema varias generalizaciones de la media pueden ser consideradas. He aquí algunas de ellas aplicadas a unas observaciones x1, ..., xn:

La media geométrica
$\overline{x}_g$, es la media de los logaritmos de los valores de la variable:


\begin{displaymath}\log \overline{x}_g = \frac{ \log x_1 + \dots + \log x_n}{n}
\end{displaymath}

Luego


\begin{displaymath}\overline{x}_g = \sqrt[n]{x_1 \, x_2 \, \dots \, x_n}
\end{displaymath}

Si los datos están agrupados en una tabla, entonces se tiene:


\begin{displaymath}\overline{x}_g = \sqrt[n]{x_1^{n_1} \, x_2^{n_2} \, \dots \, x_k^{n_k}}
\end{displaymath}

La media armónica
$\overline{x}_a$, se define como el recíproco de la media aritmética de los recíprocos, es decir,


\begin{displaymath}\frac{1}{\overline{x}_a} = \frac{\frac{1}{x_1} + \dots + \frac{1}{x_n}}{n}
\end{displaymath}

Por tanto,


\begin{displaymath}\overline{x}_a = \frac{n}{\frac{1}{x_1} + \dots + \frac{1}{x_n}}
\end{displaymath}

La media cuadrática
$\overline{x}_c$, es la raíz cuadrada de la media aritmética de los cuadrados:


\begin{displaymath}\overline{x}_c = \sqrt{\frac{x_1^2 + \dots + x_n^2}{n}}
\end{displaymath}


next up previous
Nodo Raíz: 2.3 Estadísticos de tendencia central
Siguiente: 2.3.4 La mediana
Previo: 2.3 Estadísticos de tendencia central

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo