up
next previous
Nodo Raíz: 2.3 Estadísticos de tendencia central
Siguiente: 2.3.6 La moda
Previo: 2.3.2 La media

Subsecciones

    
2.3.4 La mediana

Consideramos una variable discreta X cuyas observaciones en una tabla estadística han sido ordenadas de menor a mayor. Llamaremos mediana, Medal primer valor de la variable que deja por debajo de sí al $50\%$ de las observaciones. Por tanto, si n es el número de observaciones, la mediana corresponderá a la observación [n/2]+1, donde representamos por $[\,\cdot\,]$ la parte entera de un número.


  
Figura: Cálculo geométrico de la mediana
\includegraphics[angle=0, width=0.9\textwidth]{fig02-02.eps}

En el caso de variables continuas, las clases vienen dadas por intervalos, y aquí la fórmula de la mediana se complica un poco más (pero no demasiado): Sea (li-1,li] el intervalo donde hemos encontrado que por debajo están el $50\%$ de las observaciones. Entonces se obtiene la mediana a partir de las frecuencias absolutas acumuladas, mediante interpolación lineal (teorema de Thales) como sigue (figura 2.2):

 \begin{eqnarray}\html{eqn2}\nonumber
\frac{CC'}{AC}=\frac{BB'}{AB}&\Longrightarr...
...frac{ \displaystyle \frac{n}{2} - N_{i-1}}{n_i}
\cdot a_i$ } }
}
\end{eqnarray}


2.3.4.1 Observación

La relación (2.2) corresponde a definir para cada posible observación, $x \in (l_{j-1},l_j]$, su frecuencia relativa acumulada, F(x), por interpolación lineal entre los valores F(lj-1) = Fj-1 y F(lj) = Fj de forma que


\begin{displaymath}F(x) = F(l_{j-1}) +
\frac{ F(l_j) - F(l_{j-1})}{a_j} \,
\left(x-l_{j-1}\right)
\end{displaymath}

De este modo, Med es el punto donde $F({M_{ed}})=\frac{1}{2}$. Esto equivale a decir que la mediana divide al histograma en dos partes de áreas iguales a $\frac{1}{2}$.

2.3.4.2 Observación

Entre las propiedades de la mediana, vamos a destacar las siguientes:

2.3.4.3 Ejemplo

Sea X una variable discreta que ha presentado sobre una muestra las modalidades

\begin{displaymath}X \leadsto 2,5,7,9,12 \Longrightarrow \overline{x}=7, \qquad {M_{ed}}= 7
\end{displaymath}

Si cambiamos la última observación por otra anormalmente grande, esto no afecta a la mediana, pero si a la media:

\begin{displaymath}X \leadsto 2,5,7,9,125 \Longrightarrow \overline{x}= 29,6; \qquad {M_{ed}}= 7
\end{displaymath}

En este caso la media no es un posible valor de la variable (discreta), y se ha visto muy afectada por la observación extrema. Este no ha sido el caso para la mediana.

2.3.4.4 Ejemplo

Obtener la media aritmética y la mediana en la distribución adjunta. Determinar gráficamente cuál de los dos promedios es más significativo.

li-1 - li ni
0 - 10 60
10 - 20 80
20 - 30 30
30 - 100 20
100 - 500 10

Solución:

li-1 - li ni ai xi xi ni Ni $n_i{\mbox{$'$ }}$
0 - 10 60 10 5 300 60 60
10 - 20 80 10 15 1.200 140 80
20 - 30 30 10 25 750 170 30
30 - 100 20 70 65 1.300 190 2,9
100 - 500 10 400 300 3.000 200 0,25
  n=200     $\sum x_i n_i=6.550$    

La media aritmética es:


\begin{displaymath}\overline{x}=\frac{1}{n}\sum x_i = \frac{6.550}{200}=32,75
\end{displaymath}

La primera frecuencia absoluta acumulada que supera el valor n/2=100 es Ni=140. Por ello el intervalo mediano es [10;20). Así:


\begin{displaymath}{M_{ed}}=l_{i-1}+\frac{n/2-N_{i-1}}{n_i}\cdot a_i =
10 +\frac{100-60}{80}\times 10 = 15
\end{displaymath}

Para ver la representatividad de ambos promedios, realizamos el histograma de la figura 2.3, y observamos que dada la forma de la distribución, la mediana es más representativa que la media.


  
Figura: Para esta distribución de frecuencias es más representativo usar como estadístico de tendencia central la mediana que la media.
\includegraphics[angle=-90, width=0.8\textwidth]{fig02-03.eps}


next up previous
Nodo Raíz: 2.3 Estadísticos de tendencia central
Siguiente: 2.3.6 La moda
Previo: 2.3.2 La media

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo