up
next previous
Nodo Raíz: 2.9 Asimetría y apuntamiento
Siguiente: 2.9.4 Estadísticos de apuntamiento
Previo: 2.9 Asimetría y apuntamiento

Subsecciones

2.9.2 Estadísticos de asimetría

Para saber si una distribución de frecuencias es simétrica, hay que precisar con respecto a qué. Un buen candidato es la mediana, ya que para variables continuas, divide al histograma de frecuencias en dos partes de igual área. Podemos basarnos en ella para, de forma natural, decir que una distribución de frecuencias es simétrica si el lado derecho de la gráfica (a partir de la mediana) es la imagen por un espejo del lado izquierdo(figura 2.7).


  
Figura: Distribuciones de frecuencias simétricas y asimétricas
\includegraphics[angle=0, width=0.8\textwidth]{fig02-07.eps}

Cuando la variable es discreta, decimos que es simétrica, si lo es con respecto a la media.

2.9.2.1 Observación

Dentro de los tipos de asimetría posible, vamos a destacar los dos fundamentales (figura 2.8):

Asimetría positiva:
Si las frecuencias más altas se encuentran en el lado izquierdo de la media, mientras que en derecho hay frecuencias más pequeñas (cola).
Asimetría negativa:
Cuando la cola está en el lado izquierdo.


  
Figura: Asimetría positiva y asimetría negativa
\includegraphics[angle=0, width=0.8\textwidth]{fig02-08.eps}

Cuando realizamos un estudio descriptivo es altamente improbable que la distribución de frecuencias sea totalmente simétrica. En la práctica diremos que la distribución de frecuencias es simétrica si lo es de un modo aproximado. Por otro lado, aún observando cuidadosamente la gráfica, podemos no ver claro de qué lado están las frecuencias más altas. Conviene definir entonces unos estadísticos que ayuden a interpretar la asimetría, a los que llamaremos índices de asimetría, y que denotaremos mediante ${{\cal A}_s}$. Vamos a definir a continuación algunos de los índices de asimetría más usuales como son el índice basado en los tres cuartiles, el momento de tercer orden y la distancia entre la moda y la media o la media y la mediana.

2.9.2.2 Índice basado en los tres cuartiles (Yule-Bowley)

Si una distribución es simétrica, es claro que deben haber tantas observaciones entre la que deja por debajo de sí las tres cuartas partes de la distribución y la mediana, como entre la mediana y la que deja por debajo de sí un quarto de todas las observaciones. De forma abreviada esto es,


\begin{displaymath}{\cal Q}_3 -{\cal Q}_2 = {\cal Q}_2 - {\cal Q}_1
\end{displaymath}

Una pista para saber si una distribución de frecuencias es asimétrica positiva la descubrimos observando la figura 2.9):


\begin{displaymath}{\cal Q}_3-{\cal Q}_2 > {\cal Q}_2 - {\cal Q}_1
\end{displaymath}

Por analogía, si es asimétrica negativa, se tendrá


\begin{displaymath}{\cal Q}_3-{\cal Q}_2 < {\cal Q}_2 - {\cal Q}_1
\end{displaymath}

Para quitar dimensionalidad al problema, utilizamos como índice de asimetría la cantidad:

 \begin{displaymath}{{\cal A}_s}= \frac{({\cal Q}_3-{\cal Q}_2) -({\cal Q}_2 - {\cal Q}_1)}{{\cal Q}_3 - {\cal Q}_1}
\end{displaymath}
Es claro que \begin{displaymath}-1 \leq {{\cal A}_s}=\frac{({\cal Q}_3-{\cal Q}_2) -({\cal Q}...
...}
{({\cal Q}_3-{\cal Q}_2) + ({\cal Q}_2 - {\cal Q}_1)} \leq 1
\end{displaymath}
El número obtenido, ${{\cal A}_s}$, es invariante ante cambios de origen de referencia y de escala.


  
Figura: Uso de los cuartiles para medir la asimetría
\includegraphics[angle=0, width=0.8\textwidth]{fig02-09.eps}

2.9.2.3 Índice basado en el momento central de tercer orden

Sea X una variable cuantitativa y $p \in I\!\!N$. Llamamos momento de orden p a:

\begin{displaymath}\mu_p = \frac{1}{n} \sum_{i=1}^n x_i^p
\end{displaymath}

Se denomina momento central de orden p a la cantidad

\begin{displaymath}m_p = \frac{1}{n} \sum_{i=1}^n (x_i-\overline{x})^p
\end{displaymath}

Si los datos están agrupados en una tabla, mp admite otra expresión equivalente:


\begin{displaymath}m_p = \frac{1}{n} \sum_{i=1}^k n_i \, (x_i-\overline{x})^p
\end{displaymath}

2.9.2.4 Ejemplo

Por la proposición 2.1 (página [*]) se tiene que


m1 = 0.

El momento de orden 2 es la varianza muestral:


\begin{displaymath}m_2={{\cal S}^{2}}.
\end{displaymath}

Es sencillo comprobar que los momentos de orden p impar, son siempre nulos en el caso de variables simétricas, ya que para cada i que esté a un lado de la media, con $(x_i-\overline{x}) <0$, le corresponde una observación j del otro lado de la media tal que $(x_j-\overline{x}) = -(x_i -\overline{x})$. Elevando cada una de esas cantidades a p impar, y sumando se tiene que


\begin{displaymath}m_p = 0 \qquad \mbox{si la distribución es simétrica.}
\end{displaymath}

Si la distribución fuese asimétrica positiva, las cantidades $(x_i-\overline{x})^p$, con $p\geq 3$ impar positivas estarían muy aumentadas al elevarse a p. Esta propiedad nos indica que un índice de asimetría posible consiste en tomar p=3y definir

 \begin{displaymath}{{\cal A}_s}= a_3 = \frac{m_3}{m_2 \, \sqrt{m_2}} =
\frac{ \frac{1}{n} \sum_{i=1}^n (x_i-\overline{x})^3}{{\cal S}^3}
\end{displaymath}
que para datos organizados en una tabla sería


\begin{displaymath}a_3 = \frac{ \frac{1}{n} \sum_{i=1}^k n_i \, (x_i-\overline{x})^3}{{\cal S}^3}
\end{displaymath}

Apoyandonos en este índice, diremos que hay asimetría positiva si a3>0, y que la asimetría es negativa si a3<0.

2.9.2.5 Observación

Hemos dividido m3 por el cubo de ${\cal S}$ para que a3sea un número abstracto sin dimensiones, independiente de la variabilidad de la variable. Por otro lado, la cantidad ${{\cal A}_s}$ definida por la relación (2.17) no es la misma que la definida en (2.21). Simplemente las notamos ${{\cal A}_s}$ para simbolizar que es un índice de asimetría.

2.9.2.6 Otros índices de asimetría

Basándonos en que si una distribución de frecuencias es simétrica y unimodal, entonces la media, la mediana y la moda coinciden, podemos definir otras medidas de asimetría, como son:

 \begin{displaymath}{
\mbox{\fbox{$\displaystyle
{{\cal A}_s}= \frac{\overline{x}- {M_{oda}}}{{\cal S}}
$ } }
}
\end{displaymath}

o bien,

 \begin{displaymath}{{\cal A}_s}= \frac{3(\overline{x}- {M_{ed}})}{{\cal S}}
\end{displaymath}

Diremos que hay asimetría positiva si ${{\cal A}_s}>0$ y negativa si ${{\cal A}_s}<0$(véase la figura 2.10).


  
Figura: Diferencias importantes entre la media y la moda o la media y la mediana indican asimetría.
\includegraphics[angle=-90, width=0.8\textwidth]{fig02-10.epsi}

2.9.2.7 Ejemplo

Las edades de un grupo de personas se reflejan en la tabla siguiente:

Intervalos ni
7 -- 9 4
9 -- 11 18
11 -- 12 14
12 -- 13 27
13 -- 14 42
14 -- 15 31
15 -- 17 20
17 -- 19 1

Determinar la variabilidad de la edad mediante los estadísticos varianza, desviación típica, coeficiente de variación y rango intercuartílico. Estudie la simetría de la variable.

Solución:

En primer lugar realizamos los cálculos necesarios a partir de la tabla de frecuencias:

Intervalos ni xi Ni xi ni xi2 ni
7 -- 9 4 8 4 32 256
9 -- 11 18 10 22 180 1.800
11 -- 12 14 11,5 36 161 1.851,5
12 -- 13 27 12,5 63 337,5 4.218,75
13 -- 14 42 13,5 105 567 7.654,5
14 -- 15 31 14,5 136 449,5 6.517,75
15 -- 17 20 16 156 320 5.120
17 -- 19 1 18 157 18 324
  157     2.065 27.742,25

La media es $\overline{x}=2.065/157=13,15$ años. La varianza la calculamos a partir de la columna de la xi2 ni como sigue:

\begin{displaymath}{\cal S}^2=27.742,25/157 - 13,15^2= 3,78 \mbox{ años}^2 \quad\Rightarrow\quad
{\cal S}= \sqrt{3,78}=1,94 \mbox{ años}
\end{displaymath}

El coeficiente de variación no posee unidades y es:


\begin{displaymath}{{\cal CV}}= \frac{1,94}{13,15}=0,15=15\% \mbox{ de variabilidad.}
\end{displaymath}

En lo que concierne a la simetría podemos utilizar el coeficiente de asimetría de Yule-Bowley, para el cual es preciso el cálculo de los cuartiles:


\begin{displaymath}{\cal Q}_1= 12 + \frac{39,25 - 36}{27}\times 1 = 12,12
\end{displaymath}


\begin{displaymath}{M_{ed}}={\cal Q}_2=13 + \frac{78,5-63}{42}\times 1 = 13,37
\end{displaymath}


\begin{displaymath}{\cal Q}_3 = 14 + \frac{117,75 - 105}{31}\times 1 = 14,41
\end{displaymath}

Lo que nos dice que aproximadamente en un rango de ${\cal Q}_3-{\cal Q}_1=2,29$ años se encuentra el $50\%$ central del total de observaciones2.1 Además:


\begin{displaymath}\displaystyle=
{{\cal A}_s}= \frac{({\cal Q}_3-{\cal Q}_2) -(...
...}_1}
= \frac{(14,41-13,37) -(13,37 -12,12)}{14,41-12,12}=-0,09
\end{displaymath}

Este resultado nos indica que existe una ligera asimetría a la izquierda (negativa). Un resultado similar se obtiene si observamos (Figura 2.11) que la distribución de frecuencias es unimodal, siendo la moda:


\begin{displaymath}{M_{oda}}=
= 13 + \frac{42-27}{
(42-27)+(42-31)}\times 1 = 13,57
\end{displaymath}


  
Figura: La distribución de frecuencias de la edad presenta una ligera asimetría negativa.
\includegraphics[angle=-90, width=0.9\textwidth]{fig02-11.eps}

en cuyo caso podemos usar como medida del sesgo:


\begin{displaymath}{{\cal A}_s}= \frac{\overline{x}- {M_{oda}}}{{\cal S}} = \frac{13,15-13,57}{1,94}
=-0,21
\end{displaymath}


next up previous
Nodo Raíz: 2.9 Asimetría y apuntamiento
Siguiente: 2.9.4 Estadísticos de apuntamiento
Previo: 2.9 Asimetría y apuntamiento

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo