up
next previous
Nodo Raíz: 2. Medidas descriptivas
Siguiente: 2.7 Medidas de variabilidad o dispersión
Previo: 2.3.8 Relación entre media, mediana y

2.5 Estadísticos de posición

Para una variable discreta, se define el percentil de orden k, como la observación, Pk, que deja por debajo de si el $k\%$ de la población. Esta definición nos recuerda a la mediana, pues como consecuencia de la definición es evidente que


Med= P50

En el caso de una variable continua, el intervalo donde se encuentra $P_k\in (l_{i-1},l_i]$, se calcula buscando el que deja debajo de si al $k\%$ de las observaciones. Dentro de él, Pk se obtiene según la relación:

 \begin{displaymath}{
\mbox{\fbox{$\displaystyle
P_k = l_{i-1} + \frac{ \displaystyle n\, \frac{k}{100} - N_{i-1}}{n_i}
\cdot a_i
$ } }
}
\end{displaymath}

Por su propia naturaleza, el percentil puede estar situado en cualquier lugar de la distribución, por lo que no puede considerarsele como una medida de tendencia central.

Los cuartiles, Ql, son un caso particular de los percentiles. Hay 3, y se definen como:

\begin{eqnarray}\html{eqn7}Q_1 &=& P_{25}
\\
Q_2 &=& P_{50} \qquad = {M_{ed}}
\\
Q_{3} &=& P_{75}
\end{eqnarray}


De forma análoga se definen los deciles como los valores de la variable que dividen a las observaciones en 10 grupos de igual tamaño. Más precisamente, definimos D1,D2, ..., D9 como:


\begin{displaymath}D_i = P_{10\,i} \qquad i=1,\, \dots, \, 9
\end{displaymath}

Los percentiles (que incluyen a la mediana, cuartiles y deciles) también son denominados estadísticos de posición.

2.5.0.1 Ejemplo

Dada la siguiente distribución en el número de hijos de cien familias, calcular sus cuartiles.

xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
  n=100  

Solución:

1.
Primer cuartil:


\begin{displaymath}\displaystyle \frac{n}{4} =25; \mbox{ Primera }N_i>n/4 = 39; \mbox{ luego }
{\cal Q}_1=2.
\end{displaymath}

2.
Segundo cuartil:


\begin{displaymath}\displaystyle \frac{2\, n}{4} =50; \mbox{ Primera }N_i>2\,n/4 = 65
; \mbox { luego } {\cal Q}_2=3.
\end{displaymath}

3.
Tercer cuartil:


\begin{displaymath}\displaystyle \frac{3\, n}{4} =75;
\mbox{ Primera }N_i>3\,n/4 = 85; \mbox{ luego }{\cal Q}_3=4.
\end{displaymath}

2.5.0.2 Ejemplo

Calcular los cuartiles en la siguiente distribución de una variable continua:

li-1 - li ni Ni
0 - 1 10 10
1 - 2 12 22
2 - 3 12 34
3 - 4 10 44
4 - 5 7 51
  n=51  

Solución:

1.
Primer cuartil


\begin{displaymath}\frac{N}{4}=12,75; \mbox{ Primera }N_i>n/4=22; \mbox{ La línea $i$\space es la del intervalo }[1;2)
\end{displaymath}


\begin{displaymath}{\cal Q}_1=l_{i-1}+ \frac{\displaystyle \frac{n}{4} - N_{i-1}}{n_i}\,a_i =
1+\frac{12,75-10}{12}\times 1 = 1,23
\end{displaymath}

2.
Segundo cuartil:

\begin{displaymath}\frac{2\, n}{4}=25,5; \mbox{ Primera }N_i>2\,n/4=34;
\mbox{ La línea $i$\space es la del intervalo }[2;3)
\end{displaymath}


\begin{displaymath}{\cal Q}_2=l_{i-1}+ \frac{\displaystyle \frac{2\,n}{4} - N_{i-1}}{n_i}\,a_i =
2+\frac{25,5-22}{12}\times 1 = 2,29
\end{displaymath}

3.
Tercer cuartil

\begin{displaymath}\frac{3\,n}{4}=38,25; \mbox{ Primera }N_i>3\,n/4=44;
\mbox{ La línea $i$\space es la del intervalo }[3;4)
\end{displaymath}


\begin{displaymath}{\cal Q}_3=l_{i-1}+ \frac{\displaystyle \frac{3\,n}{4} - N_{i-1}}{n_i}\,a_i =
3+\frac{38,25-34}{10}\times 1 = 3,445
\end{displaymath}

2.5.0.3 Ejemplo

Han sido ordenados los pesos de 21 personas en la siguiente tabla:

Intervalos f.a.
li-1 -- li ni
38 -- 45 3
45 -- 52 2
52 -- 59 7
59 -- 66 3
66 -- 73 6
  21

Encontrar aquellos valores que dividen a los datos en 4 partes con el mismo número de observaciones.

Solución: Las cantidades que buscamos son los tres cuartiles: ${\cal Q}_1$, ${\cal Q}_2$ y ${\cal Q}_3$. Para calcularlos, le añadimos a la tabla las columnas con las frecuencias acumuladas, para localizar qué intervalos son los que contienen a los cuartiles buscados:

li-1 -- li ni Ni  
38 -- 45 3 3  
45 -- 52 2 5  
52 -- 59 7 12 $\!\!\ni {\cal Q}_1,\, {\cal Q}_2$
59 -- 66 3 15  
66 -- 73 6 21 $\ni {\cal Q}_3$
  21    
${\cal Q}_1$ y ${\cal Q}_2$ se encuentran en el intervalo 52--59, ya que N3=12 es la primera f.a.a. que supera a $21\cdot 1/4$ y $21\cdot 2/4$.
${\cal Q}_3$ está en 66--73, pues N5=21 es el primer Ni mayor que $21\cdot 3/4$.

Así se tiene que:

\begin{eqnarray}\html{eqn10}\frac{1}{4} \cdot 21 = 5,25 \Rightarrow \:i=3 \Right...
...mber
\\
&=& 66 + \frac{15,75 - 15}{6}\cdot 7 = 66,875 \nonumber
\end{eqnarray}


Obsérvese que ${\cal Q}_2={M_{ed}}$. Esto es lógico, ya que la mediana divide a la distribución en dos partes con el mismo número de observaciones, y ${\cal Q}_2$, hace lo mismo, pues es deja a dos cuartos de los datos por arriba y otros dos cuartos por abajo.

2.5.0.4 Ejemplo

La distribución de una variable tiene por polígono acumulativo de frecuencias el de la figura 2.6. Si el número total de observaciones es 50:
1.
Elaborar una tabla estadística con los siguientes elementos: intervalos, marcas de clase, frecuencia absoluta, frecuencia absoluta acumulada, frecuencias relativa y frecuencias relativa acumulada.
2.
Cuántas observaciones tuvieron un valor inferior a 10, cuántas inferior a 8 y cuántas fueron superior a 11.
3.
Calcule las modas.
4.
Determine los cuartiles.


  
Figura: Diagrama acumulado de frecuencias relativas.
\includegraphics[angle=0, width=0.7\textwidth]{fig02-06.eps}

Solución:

1.
En la siguiente tabla se proporciona la información pedida y algunos cálculos auxiliares que nos permitirán responder a otras cuestiones.

Intervalos ni Ni fi Fi xi ai $n_i{\mbox{$'$ }}$
0 - 5 10 10 0,2 0,3 2,5 5 2
5 - 7 25 35 0,5 0,7 6 2 12,5
7 - 12 5 40 0,1 0,8 9,5 5 1
12 - 15 10 50 0,2 1 13,5 7 3,33

2.
Calculemos el número de observaciones pedido:


\begin{displaymath}\begin{array}{ccc}
7 \mbox { a } 12 & {\rule{1cm}{1pt}}& 5
\\...
...& x
\end{array}\quad
\Rightarrow
\quad x=\frac{3\times 5}{5}=3
\end{displaymath}

10 + 25+3 = 38 observaciones tomaron un valor inferior a 10


\begin{displaymath}\begin{array}{ccc}
7\mbox{ a }12 & {\rule{1cm}{1pt}}& 5
\\
7...
...& x
\end{array}\quad
\Rightarrow
\quad x=\frac{1\times 5}{5}=1
\end{displaymath}

10 + 25+1 = 36 observaciones tomaron un valor inferior a 8


\begin{displaymath}\begin{array}{ccc}
7\mbox{ a }12 & {\rule{1cm}{1pt}}& 5
\\
7...
...& x
\end{array}\quad
\Rightarrow
\quad x=\frac{4\times 5}{5}=4
\end{displaymath}

50 -(10 + 25+4) = 50-39=11 observaciones tomaron un valor superior a 11

3.
Hay dos modas. Calculemos la más representativa:


\begin{displaymath}{M_{oda}}= l_{i-1}+ \frac{n_{i+1}{\mbox{$'$ }}}{n_{i-1}{\mbox...
...n_{i+1}{\mbox{$'$ }}}\cdot a_i =
5+\frac{1}{2+1}\cdot 2 = 5,66
\end{displaymath}

4.
Cuartiles:


\begin{displaymath}{\cal Q}_1= l_{i-1}+ \frac{n/4-N_{i-1}}{n_i}\cdot a_i
= 5+\frac{12,5-10}{25}\cdot 2=5,2
\end{displaymath}


\begin{displaymath}{\cal Q}_2= l_{i-1}+ \frac{2\,n/4-N_{i-1}}{n_i}\cdot a_i = 5+\frac{25-10}{25}\cdot 2=6,2
\end{displaymath}


\begin{displaymath}{\cal Q}_3= l_{i-1}+ \frac{3\,n/4-N_{i-1}}{n_i}\cdot a_i = 7+\frac{37,5-35}{5}\cdot 5=9,5
\end{displaymath}



 
next up previous
Nodo Raíz: 2. Medidas descriptivas
Siguiente: 2.7 Medidas de variabilidad o dispersión
Previo: 2.3.8 Relación entre media, mediana y

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo